基本信息
- 原书名:The Top Ten Algorithms in Data Mining (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series)
- 原出版社: Chapman and Hall/CRC
- 作者: Xindong Wu Vipin Kumar
- 译者: 李文波 吴素研
- 丛书名: 世界著名计算机教材精选
- 出版社:清华大学出版社
- ISBN:9787302310617
- 上架时间:2013-5-29
- 出版日期:2013 年5月
- 开本:16开
- 页码:153
- 版次:1-1
- 所属分类:计算机 > 数据库 > 数据库存储与管理
教材 > 计算机教材 > 本科/研究生 > 计算机专业教材 > 计算机专业课程 > 数据库
内容简介
作译者
吴博士是IEEE Transactions on Knowledge and Data Engineering (TKDE,由IEEE Computer Society主办)的主编,IEEE International Conference on Data Mining (ICDM)的创始人和指导委员会主席,Knowledge and Information Systems (KAIS, 由Springer发行)的创办人和荣誉主编, IEEE Computer Society Technical Committee on Intelligent Informatics (TCII)的创始主席(2002—2006),Springer Advanced Information and Knowledge Processing (AI&KP)系列著作的编辑。 他还是ICDM03 (the 2003 IEEE International Conference on Data Mining)程序委员会主席和KDD-07 (the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)程序委员会联合主席。他获得了2004 ACM SIGKDD服务奖、2006 IEEE ICDM杰出服务奖,是2005年合肥科技大学“长江学者奖励计划”讲座教授。他还是很多学术会议的特邀专家/专题报告人,如NSF-NGDM07、PAKDD-07、IEEE EDOC06、IEEE ICTAI04、IEEE/WIC/ACM WI04/IAT04、SEKE 2002和PADD-97等。
Vipin Kumar教授明尼苏达大学计算机科学与工程系William Norris讲席教授、系主任。 他于1977年获得印度鲁尔基理工学院(正式名称是鲁尔基大学)的电子和通信工程学士学位,1979年获得荷兰埃因霍温飞利浦国际学院的电子工程硕士学位,1982年获得马里兰大学帕克分校的计算机科学博士学位。Kumar教授的研究兴趣主要集中在数据挖掘、生物信息学和高性能计算领域。他提出了评估并行算法可扩展性的恒等效率度量指标,并研发了多款稀疏矩阵分解(PSPASES)和图剖分(METIS, ParMetis, hMetis)的高效并行算法及软件。他发表了200多篇研究论文,合编合著了9本学术专著,包括被广泛使用的教科书Introduction to Parallel Computing和Introduction to Data Mining,都由Addison-Wesley出版。Kumar是众数据挖掘和多并行计算领域的学术会议、专题研讨会的主席或共同主席,如IEEE International Conference on Data Mining (2002)、International Parallel and Distributed Processing Symposium (2001)和SIAM International Conference on Data Mining (2001)。Kumar是SIAM International Conference on Data Mining指导委员会共同主席,IEEE International Conference on Data Mining和IEEE International Conference on Bioinformatics and Biomedicine指导委员会委员。Kumar是Journal of Statistical Analysis and Data Mining的创始主编之一,IEEE Intelligent Informatics Bulletin主编和Data Mining and Knowledge Discovery系列图书(由CRC Press/Chapman Hall出版)的编辑。Kumar还担任很多其他学术刊物的编辑,如Data Mining and Knowledge Discovery、Knowledge and Information Systems、IEEE Computational Intelligence Bulletin、Annual Review of Intelligent Informatics、Parallel Computing、Journal of Parallel and Distributed Computing、IEEE Transactions of Data and Knowledge Engineering (1993—1997)、IEEE Concurrency (1997—2000)和IEEE Parallel and Distributed Technology (1995—1997)等。他是ACM会士、IEEE会士、AAAS会士和SIAM会员。Kumar由于在并行算法设计、图剖分和数据挖掘领域的杰出贡献,获得了2005 IEEE Computer Society的技术成就奖。
目录
第1章C4.5 1
1.1引言2
1.2算法描述3
1.3算法特性6
1.3.1决策树剪枝6
1.3.2连续型属性8
1.3.3缺失值处理8
1.3.4规则集诱导9
1.4软件实现10
1.5示例10
1.5.1 Golf数据集10
1.5.2 Soybean数据集11
1.6高级主题11
1.6.1二级存储12
1.6.2斜决策树12
1.6.3特征选择12
1.6.4集成方法12
1.6.5分类规则13
1.6.6模型重述13