基本信息
- 原书名:Web Data Mining
- 原出版社: Springer
- 作者: (美)Bing Liu
- 译者: 俞勇 薛贵荣 韩定一
- 丛书名: 世界著名计算机教材精选
- 出版社:清华大学出版社
- ISBN:9787302193388
- 上架时间:2009-4-3
- 出版日期:2009 年4月
- 开本:16开
- 页码:375
- 版次:1-1
- 所属分类:计算机 > 计算机网络 > Web Server > 综合
内容简介
计算机书籍
过去几十年里,Web的迅速发展使其成为世界上规模最大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。.
本书旨在阐述Web数据挖掘的概念及其核心算法,使读者获得相对完整的关于Web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:第一部分包括第2章到第5章,介绍数据挖掘的基础;第二部分包括第6章到第12章,介绍Web相关的挖掘任务。..
本书不仅可作为本科生的教科书,也是在Web数据挖掘和相关领域研读博士学位的研究生的重要参考用书,同时对Web挖掘研究人员和实践人员获取知识、信息,甚至足创新想法也很有帮助。...
作译者
有关刘兵教授的更多信息,可访问他的个人主页http://www.cs.uic.edu/~liub。...
目录
第1章 概述3
1.1 什么是万维网3
1.2 万维网和互联网的历史简述4
1.3 Web数据挖掘5
1.3.1 什么是数据挖掘6
1.3.2 什么是Web数据挖掘7
1.4 各章概要8
1.5 如何阅读本书10
文献评注10
第2章 关联规则和序列模式12
2.1 关联规则的基本概念12
2.2 Apriori算法14
2.2.1 频繁项目集生成14
2.2.2 关联规则生成17
2.3 关联规则挖掘的数据格式19
2.4 多最小支持度的关联规则挖掘20
2.4.1 扩展模型21
2.4.2 挖掘算法22
2.4.3 规则生成26