基本信息
- 原书名:Mining Heterogeneous Information Networks: Principles and Methodologies

内容简介
作译者
作者简介:
孙艺洲(Yizhou Sun) 2012年在伊利诺伊大学香槟分校获得计算机科学博士学位,目前是美国加州大学洛杉矶分校计算机科学系助理教授,主要研究兴趣集中在大规模信息和社交网络挖掘,曾荣获ACM SIGKDD 2013博士论文奖,2015年美国科学基金会职业成就奖(NSF CAREER Award)。
韩家炜(Jiawei Han)伊利诺伊大学香槟分校的Abel Bliss教授,ACM和IEEE Fellow。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席,创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文600余篇,曾获得2004年度ACM SIGKDD创新奖,2015年度IEEE计算机学会技术成就奖,2009年度IEEE计算机学会Wallace McDowell奖。
目录
译者序
摘要和关键词
第1章引言
1.1异构信息网络是什么
1.2为什么异构网络挖掘是一项新的挑战
1.3本书的内容组织
第一部分基于排名的聚类和分类
第2章基于排名的聚类
2.1概述
2.2RankClus算法
2.2.1排名函数
2.2.2从条件排名分布到新的聚类度量
2.2.3聚类中心和距离测量
2.2.4RankClus算法总结
2.2.5实验结果
2.3NetClus算法
2.3.1排名函数
2.3.2NetClus算法框架
2.3.3网络聚类中目标对象生成模型
前言
当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活方方面面,原有的数据管理理论体系与大数据产业应用之前的差距日益加大,而工业界对于大数据人才的需求却极剧增加。大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任。因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程。近来越来越多的院校急切地开设大数据方面的人才培养计划,以求占得“先机”。但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的“冷拼盘”,顶多是加点“调料”,原材料没有新鲜感。现阶段无论多么新多么好的人才培养计划,都只能在六七十年代编写的计算机知识体系上施教,无法把当下的大数据带给我们的新思维方式和知识体系传导给学生。
为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。每一位学者都有责任和义务去为此“增砖添瓦”。
在此背景下,我们策划和组织了这套大数据管理丛书,希望能够培养数据思维的理念,对原有数据管理知识体系进行完善和补充,面向新的技术热点,提出新的知识体系/知识点,拉近教材体系与大数据应用的距离,为受教者应对现代技术带来的大数据领域的新问题和挑战,扫除障碍。现时要求学者编写大部头著作费时费力,不太现实。这使我们想到二十世纪八九十年代风靡一时的“五角丛书”,它短小精湛,题材丰富,选题新颖,恰到好处地迎合了那个时代人们对新知识的渴望,因此成为了那个时代的共同记忆。所以我们受此启发,选择了这种更容易实现的“五角丛书”的形式,促使学者们力所能及地把各自工作中的积累呈现给大家,为大数据人才培养的“大厦”增砖添瓦。我们相信,假以时日,这些小部头的著作汇溪成河,必将对未来大数据人才培养起到“基石”的作用。
丛书定位:面向新形势下的大数据技术发展对人才培养提出的挑战,旨在为学术研究和人才培养提供可供参考的“基石”。虽然是一些不起眼的“砖头瓦块”,但可以为大数据人才培养积累可用的新模块(新素材),弥补原有知识体系与应用问题之前的鸿沟,力图为现有的数据管理知识查漏补缺,聚少成多,最终形成适应大数据技术发展和人才培养的知识体系和教材基础。
丛书特点:丛书借鉴Morgan & Claypool Publishers出版的Synthesis Lectures on Data Management,特色在于选题新颖,短小精湛。选题新颖即面向技术热点,弥补现有知识体系的漏洞和不足(或延伸或补充),内容涵盖大数据管理的理论、方法、技术等诸多方面。短小精湛则不求系统性和完备性,但每本书要自成知识体系,重在阐述基本问题和方法,并辅以例题说明,便于施教。
丛书组织:丛书采用国际学术出版通行的主编负责制,为此特邀中国人民大学孟小峰教授(email: xfmeng@ruceducn)担任丛书主编,负责丛书的整体规划和选题。责任编辑为机械工业出版社华章分社姚蕾编辑(email:yaolei@hzbookcom)。
在此期望有志于大数据人才培养并具有丰富理论和实践经验的学者和专业人员能够加入到这套书的编写工作中来,共同为中国大数据研究和人才培养贡献自己的智慧和力量,共筑属于我们自己的“时代记忆”。欢迎读者对我们的出版工作提出宝贵意见和建议。
丛书即将出版书目
大数据管理概论
孟小峰 主编
2017年2月出版
异构信息网络挖掘:原理和方法
[美]孙艺洲(Yizhou Sun)韩家炜(Jiawei Han)著;段磊朱敏唐常杰译
2017年1月出版
大规模元搜索引擎技术
[美]孟卫一(Weiyi Meng)於德(Clement TYu)著;朱亮译
2017年1月
大数据集成
[美]董欣(Xin Luna Dong)戴夫士·斯里瓦斯塔瓦(Divesh Srivastava)著;
序言
作为大数据时代铺路石的数据采集技术,近年来的发展突飞猛进。它带来两个巨大变革:一方面,现实生活中各项事物间的联系愈发紧密,以社交网络为例,一个成熟的社交网络不仅包含着人与人之间的各种联系,还包含着人与时间、空间、机构等其他相关因素的联系;另一方面,我们也更关注于发掘多源数据所蕴含的丰富、复杂、有趣的未知知识。如何将这些现实世界中多源且异构的关系处理为计算机可表达并可计算的形式?异构信息网络理论及其技术成为解决这一问题的利器。
本书是一本极具学术价值的介绍异构信息网络相关概念及分析方法的专著,在介绍异构信息网络基本概念的基础上,结合实例讲述了异构信息网络中的聚类与分类、基于元路径的相似性搜索和关系预测、关系强度感知挖掘等重要内容。本书循序渐进、用例丰富,容易为读者理解,且内容新颖全面,涉及异构信息网络的基本概念、与其他类型网络的差别、异构信息网络分析及应用等。本书适合数据挖掘方向的高年级本科生、硕士生和博士生阅读,也适合相关研究和应用技术人员参考。
本书的作者孙艺洲博士致力于异构信息网络挖掘研究,曾荣获ACM SIGKDD 2013博士论文奖,是一位冉冉升起的数据挖掘研究者新星。本书的另一位作者韩家炜教授在数据挖掘领域发表了很多具有广泛影响力的高水平著作和论文。本书就是两位作者关于异构信息网络挖掘研究和应用的总结。
本书翻译工作主要由段磊、朱敏、唐常杰完成。四川大学研究生杨皓、刘璐、晏力、秦攀、高超、王文韬等对本书的翻译提供了不少帮助,译者谨在此对他们表示感谢,并向在翻译过程中给予我们大力支持的华章公司的姚蕾、朱劼、和静三位老师表示衷心的感谢。
译者在翻译过程中力求忠于原著,新的专业术语尽量符合原著语义。但由于水平和时间有限,译文难免有错误和不妥之处,恳请读者批评指正。
段磊
2016年5月于四川大学