(特价书)个人数据管理
基本信息

内容简介
作译者
孟小峰 中国人民大学信息学院教授,博士生导师。现为中国计算机学会会士、中国保密协会隐私保护专业委员会副主任、《Journal of Computer Science and Technology》、《Frontiers of Computer Science》、《软件学报》、《计算机研究与发展》等编委。先后获中国计算机学会“王选奖”一等奖(2009),北京市科学技术奖二等奖(2011)等奖励,入选“第三届北京市高校名师奖”(2005)。近期主要研究领域为网络与移动大数据管理,包括Web数据管理、云数据管理、面向新型存储器的数据库系统、大数据隐私管理、社会计算等。
目录
前言
作者简介
第1章 绪论
1.1 引言
1.2 个人数据管理的发展
1.3 个人数据特征
1.4 个人数据空间的提出
1.5 个人数据管理系统框架
参考文献
第2章 个人数据空间模型
2.1 引言
2.2 概念模型
2.2.1 从数据到模式
2.2.2 基于图的数据空间模型
2.3 逻辑模型
2.3.1 iDM数据模型
2.3.2 RDF模型
2.3.3 基于四元组的模型
2.4 面向主体的数据模型
前言
目前大数据管理技术日益引起相关领域学者的关注。大数据管理的最终目的是提高人们的生活质量与工作效率,这是大数据管理的价值体现。个人数据管理问题本质上是分散、大规模、异构、复杂数据的管理问题在个人数据管理领域的反映,涉及数据存储、索引、查询、安全与隐私保护等诸多问题,这也都是大数据管理所要解决的基本问题。本书旨在基于近年来作者在这一领域的研究工作,对个人数据管理相关技术进行整理,以期对该领域的研究人员、技术人员或普通用户有所帮助。
本书与同类图书的比较
本书作者自2006年开始进行个人数据管理方面的研究。本书基于作者及合作者多年在个人数据管理方面的研究积累,对个人数据管理相关技术进行了总结,内容涵盖个人数据管理技术的发展、数据模型、数据集成、数据融合、数据存储、数据查询、系统实现、个人数据管理新技术发展几个部分。
目前并未看到一本系统介绍个人数据管理相关理论、技术与系统实现方面的著作,本书作者参与编写的《Web数据管理:概念与技术》一书中介绍了数据空间的相关理论与技术,但是并未特别针对个人数据信息管理技术进行系统的阐述。
本书的内容和组织结构
本书分为8章。
第1章是本书的总述,主要讨论个人数据管理技术的发展、个人数据特征以及个人数据管理系统框架。
第2章介绍个人数据空间模型,包括概念模型、逻辑模型以及面向主体的任务空间和核心数据空间模型。
第3章重点介绍个人数据集成技术,主要包括个人数据集成的概念、个人初始数据空间的建立策略以及个人操作行为的识别技术。
第4章重点介绍个人数据集成中的数据融合问题,主要包括个人数据空间的同义词概念识别、个人数据的版本管理、基于时序关系的实体引用关系识别。
第5章主要介绍个人数据存储技术,包括分布式数据存储模式、支持数据空间演化的索引策略。
第6章重点讨论个人数据查询问题,主要包括查询接口、基于同义词的个人信息查询、基于任务的个人数据查询。
第7章重点讨论个人数据空间系统的实现技术、系统框架及相关功能。
第8章关注的是个人数据管理领域新的技术成果和研究动向。
本书主要面向各类研究人员和开发人员,既可以作为本研究方向的教科书,也可以作为本领域研究人员的技术参考书。
致谢
首先感谢我的导师孟小峰教授,我从2006年起即在孟老师的指导下开始从事个人数据管理的研究工作,记得当时读的第一篇文献是第一届国际个人信息管理技术研讨会(PIM Workshop 2005)发布的会议报告,这个报告首次提出了个人信息空间的概念,并对个人信息管理的一些基本概念和研究问题进行了阐述。后来孟老师又给我推荐了M.Franklin、A. Halevy和D. Maier的论文《From Databases to Dataspaces: A New Abstraction for Information Management》,这篇论文提出了数据空间的概念,并提及了其在个人信息管理领域的应用,以及来自不同领域的学者对于个人数据管理这一问题的深入思考,这使我对这一研究领域产生了浓厚的兴趣。其后,在孟老师的指导下,我与WAMDM实验室的硕士研究生张相於、寇玉波一起对个人数据空间模型、个人数据集成、索引、任务挖掘及查询问题进行了系统化的研究工作,其间纽约州立大学宾汉姆顿分校孟卫一教授多次到访WAMDM实验室,我有幸与其就任务空间等问题进行了交流,孟卫一教授给出了非常好的建议。通过四年的努力我最终完成了博士论文“个人数据空间模型与查询方法研究”。现在回想起来,WAMDM实验室以及Web研究组的例会对于我的研究工作影响很大,那种开放、探究的氛围使人难忘,一个想法的诞生往往源于大家充满激情的讨论。博士研究生毕业后我来到天津理工大学计算机与通信工程学院工作,继续从事个人数据管理方面的研究,先后指导硕士研究生赵喜燕、任标、雷鹏飞等围绕个人数据融合、数据关系识别、个人数据安全等做了一些研究,本书即是作者及合作者在多年研究成果的基础上总结和整理而成的。本书参阅了WAMDM实验室潘晓、王仲远、艾静、杜志娟等在位置隐私、互联网隐私保护、大数据融合方面的研究工作,我指导的研究生廖欢、苏慧丽对本书进行了编辑和校对,此外本书也引用了国内外一些学者的研究工作,在此一并表示感谢。
我的与个人数据空间相关的研究课题得到了国家自然科学基金(项目号:61170027)和天津市自然科学基金(项目号:15JCYBJC46500)项目的资助,由此得以在该领域继续深入开展自己的研究工作。此外,该工作始于作者在孟小峰教授的WAMDM实验室攻读博士学位期间的研究工作,其得到了国家863计划“海量数据空间模型、查询与索引技术研究”项目的支持。在此一并表示衷心感谢。
本书的形成源于孟小峰老师的一个心愿。2015年10月我在成都参加中国数据库年会(NDBC 2015)期间,遇到了孟老师和机械工业出版社华章公司的姚蕾老师,他们针对目前“大数据研究热度很高而普通人又感觉大数据遥不可及”的问题,拟出版一套关于大数据相关技术的丛书。孟老师提出大数据本身就是与人相关的数据,个人数据具备大数据的基本特征,同时又是重要的研究领域且有重要的应用价值,未来精准医疗、精准营销、个性化教育等大数据应用都离不开个人数据管理。于是作者产生了出版本书的想法,在此向孟老师和姚蕾老师表示感谢。
序言
为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。我们肩负着大数据时代知识更新的使命,每一位学者都有责任和义务去为此“增砖添瓦”。
在此背景下,我们策划和组织了这套大数据管理丛书,希望能够培养数据思维的理念,对原有数据管理知识体系进行完善和补充,面向新的技术热点,提出新的知识体系/知识点,拉近教材体系与大数据应用的距离,为受教者应对现代技术带来的大数据领域的新问题和挑战,扫除障碍。我们相信,假以时日,这些著作汇溪成河,必将对未来大数据人才培养起到“基石”的作用。
丛书定位:面向新形势下的大数据技术发展对人才培养提出的挑战,旨在为学术研究和人才培养提供可供参考的“基石”。虽然是一些不起眼的“砖头瓦块”,但可以为大数据人才培养积累可用的新模块(新素材),弥补原有知识体系与应用问题之前的鸿沟,力图为现有的数据管理知识查漏补缺,聚少成多,最终形成适应大数据技术发展和人才培养的知识体系和教材基础。
丛书特点:丛书借鉴Morgan & Claypool Publishers出版的Synthesis Lectures on Data Management,特色在于选题新颖,短小精湛。选题新颖即面向技术热点,弥补现有知识体系的漏洞和不足(或延伸或补充),内容涵盖大数据管理的理论、方法、技术等诸多方面。短小精湛则不求系统性和完备性,但每本书要自成知识体系,重在阐述基本问题和方法,并辅以例题说明,便于施教。
丛书组织:丛书采用国际学术出版通行的主编负责制,为此特邀中国人民大学孟小峰教授(email:xfmeng@ruc.edu.cn)担任丛书主编,负责丛书的整体规划和选题。责任编辑为机械工业出版社华章分社姚蕾编辑(email:yaolei@hzbook.com)。
当今数据洪流席卷全球,而中国正在努力从数据大国走向数据强国,大数据时代的知识更新和人才培养刻不容缓,虽然我们的力量有限,但聚少成多,积小致巨。因此,我们在设计本套丛书封面的时候,特意选择了清代苏州籍宫廷画家徐扬描绘苏州风物的巨幅长卷画作《姑苏繁华图》(原名《盛世滋生图》)作为底图以表达我们的美好愿景,每本书选取这幅巨卷的一部分,一步步见证和记录数据管理领域的学者在学术研究和工程应用中的探索和实践,最终形成适应大数据技术发展和人才培养的知识图谱,共同谱写出我们这个大数据时代的盛世华章。
在此期望有志于大数据人才培养并具有丰富理论和实践经验的学者和专业人员能够加入到这套书的编写工作中来,共同为中国大数据研究和人才培养贡献自己的智慧和力量,共筑属于我们自己的“时代记忆”。欢迎读者对我们的出版工作提出宝贵意见和建议。
大数据管理丛书
主编:孟小峰
大数据管理概论
孟小峰编著
2017年5月
异构信息网络挖掘:原理和方法
[美]孙艺洲(Yizhou Sun)韩家炜(Jiawei Han)著
段磊朱敏唐常杰译
2017年5月
大规模元搜索引擎技术
[美]孟卫一(Weiyi Meng)於德(Clement T.Yu)著
朱亮译