基于数据仓库的数据挖掘技术
基本信息
- 作者: 康晓东
- 丛书名: 高等院校计算机科学与技术“十五”规划教材
- 出版社:机械工业出版社*
- ISBN:7111132009
- 上架时间:2003-11-25
- 出版日期:2004 年1月
- 开本:16开
- 页码:322
- 版次:1-1
- 所属分类:
计算机 > 数据库 > 数据库存储与管理
教材 > 征订教材 > 高等理工
教材 > 研究生/本科/专科教材 > 工学 > 计算机
教材 > 计算机教材 > 本科/研究生 > 计算机专业教材 > 计算机专业课程 > 数据库
教材 > 教材汇编分册 > 高等理工
本版教材征订号:0044090815-0
内容简介回到顶部↑
新技术产生、发展和不断完善的推动力,来自于现实生活需要。在人们发出“网络到底是存储信息的金矿还是埋葬信息的沼泽地”的困惑时,基于数据仓库的数据挖掘技术无疑为人们带来了新的希望。
本书从数据库、数据库管理系统与数据仓库比较开始,介绍了数据仓库原理、数据仓库设计、联机分析处理、数据挖掘算法、统计类数据挖掘和知识类数据挖掘、其他数据挖掘技术和工具及数据仓库的应用和管理,
辅以大量具有启发性的解决方案,从应用的角度分析了数据仓库的建设过程和联机分析、数据挖掘技术的选择。
本书除可作为高等院校相关专业高年级本科生或研究生教材外,也可供各企、事业单位从事信息系统开发的工程技术人员参考。
本书从数据库、数据库管理系统与数据仓库比较开始,介绍了数据仓库原理、数据仓库设计、联机分析处理、数据挖掘算法、统计类数据挖掘和知识类数据挖掘、其他数据挖掘技术和工具及数据仓库的应用和管理,
辅以大量具有启发性的解决方案,从应用的角度分析了数据仓库的建设过程和联机分析、数据挖掘技术的选择。
本书除可作为高等院校相关专业高年级本科生或研究生教材外,也可供各企、事业单位从事信息系统开发的工程技术人员参考。
目录回到顶部↑
第1章 数据库、数据库管理系统与数据仓库
1.1 数据库与数据库技术
1.1.1 数据、数据库与数据库系统
1.1.2 数据库系统的特点
1.1.3 数据库技术新发展
1. 2 数据仓库
1.2.1 从传统数据库到数据仓库
1.2.2 数据仓库的基本特性
1.3 数据仓库及其数据分析工具
1.3.1 联机分析与数据挖掘
1.3.2 数据仓库与数据挖掘
1.3.3 数据仓库未来发展方向
第2章 数据仓库原理
2.1 数据仓库的结构与技术要求
2.1.1 数据仓库的总体结构
2.i.2 数据集市
2.1.3 数据仓库的技术要求
2.2 数据仓库中的数据
2.2.1 数据仓库的数据组织
2.2.2 数据模型
1.1 数据库与数据库技术
1.1.1 数据、数据库与数据库系统
1.1.2 数据库系统的特点
1.1.3 数据库技术新发展
1. 2 数据仓库
1.2.1 从传统数据库到数据仓库
1.2.2 数据仓库的基本特性
1.3 数据仓库及其数据分析工具
1.3.1 联机分析与数据挖掘
1.3.2 数据仓库与数据挖掘
1.3.3 数据仓库未来发展方向
第2章 数据仓库原理
2.1 数据仓库的结构与技术要求
2.1.1 数据仓库的总体结构
2.i.2 数据集市
2.1.3 数据仓库的技术要求
2.2 数据仓库中的数据
2.2.1 数据仓库的数据组织
2.2.2 数据模型
前言回到顶部↑
信息系统是由信息科学、计算机科学、管理科学、决策科学、系统科学等学科相互渗透相互交叉而发展起来的,经过多年的研究目前已经形成了比较完整的独具特色的体系;各高校也从不同的角度创办了不同类型的信息化专业,培养以掌握信息技术为目标的专业人才。
信息技术的迅速发展已从简单的批处理、联机事务处理的信息处理时代,进入了联机分析处理、数据仓库和数据挖掘的信息分析时代。
从应用角度来看,数据仓库是一种解决问题的方案,而不仅仅是技术和产品。数据仓库的建立是一个决策分析系统实施的过程,不仅需要各种建设工具,而且还需相应的数据支持。数据仓库的建设必须基于比较完善的信息化构架,只有在一定的信息化基础上,才能进行数据仓库的建设。数据仓库的建设还是企业经营管理决策与信息化结合的过程,只有根据企业管理决策的实际情况,才能建设一个支持企业管理决策的数据仓库。
从技术角度来看,数据仓库以数据库技术作为存储数据和资源管理的手段,以联机分析处理技术和方法作为提取信息的有效手段:以数据挖掘、人工智能中的模型、算法作为发现知识和规律的途径。数据仓库的建设还是各种先进的信息处理技术与企业管理决策结合的过程,只有将OLAP技术、数据挖掘技术与数据仓库中的庞大数据相结合,与企业先进的管理决策方法相结合,才能使数据仓库在企业的经营管理决策中发挥巨大的作用。
数据仓库是诸多学科相互交叉、综合应用的技术。数据仓库建设的成功不仅取决于技术人员对数据仓库开发方法与开发工具的熟练应用,更取决于数据仓库能否得到熟练应用。换句话说,数据仓库的成功关键在于用户的应用情况,而不是数据仓库开发技术的熟练应用。所以本书在介绍了数据仓库的组织与数据挖掘方法之后,还用相当的篇幅介绍了数据仓库的管理与应用。
本书内容包括数据库、数据库管理系统与数据仓库;数据仓库原理:数据仓库设计;联机分析处理;数据挖掘算法;统计类数据挖掘和知识类数据挖掘:其他数据挖掘技术和工具和数据仓库的应用和管理。本书还通过分析典型数据库与应用案例,使读者了解如何利用数据仓库来降低企业的运营成本、建立更好的客户关系管理、提高产品的质量。
本书的主要特点:
(1)因为创建数据库一方面需要根据企业自身的管理特征具体分析,有针对性地建立符合自身要求的数据仓库应用系统;另一方面需要有数据支持。故本书的安排严格遵循数据仓库组织与数据挖掘技术(工具)这条主线。
(2)为提高本书对相关系统的建设与应用方面的指导性,书中提供了大量有启发性的案例(如目录中加框线部分的内容)。
(3)书中尽量体现了最先进的数据仓库组织和数据挖掘技术。
目前有关数据挖掘的书籍主要有三类,分别是:面向商业应用的,描述特定的方法和算法(如决策树分类),而一般性的基本原理(如参数估计和计算复杂性)则在底层经常的被忽略掉了:从数据库角度解释数据挖掘的具体技术:从机器学习的角度演绎数据挖掘的可行性。实际上,数据挖掘技术在相当大的程序上依赖于统计模型和方法(计算机只是作为工具之一):数据挖掘所处理的数据对象是为其他某些目的已经收集好的,而不一定是为了数据分析本身去收集的;数据挖掘的目标根本不在于数据采集策略。这也是数据挖掘区别于大多数统计任务的一个特征,在统计中则经常是利用高效率的策略来采集数据以回答特定的问题。
本书面对的是已经熟悉基本的算法、数据结构和数据库的概念,并且已经有过一些基本的网络体验的读者,即本书的目标读者是具有以下专业背景的大学生:计算机科学、工程学、数学、自然科学以及像经济学、生物学等面向具体应用的专业的学生。
本书的作者分工如下:章海涛撰写第1章和第5.2节的部分内容:张建平撰写了第2章和第6.3节的部分内容;黎小沛撰写了第3章和第4章的大部分内容:丛光撰写了第5.3节和第7.1—7.3节;饶友玲撰写了第4.3.4、5.1、6.2节和第8章:其余部分由康晓东撰写。全书由康晓东统稿。
作者感谢本专业领域前辈们的工作,是他们开创性工作的成果充实了本书的内容(见书后的参考文献);感谢IT业界的同事和朋友们,特别是邹文波为本书提供了大量的外版参考资料。还要感谢南开大学博士生导师逄锦聚教授和西安交通大学博士生导师蒋大宗教授,他们对本书的编写给予了指导和支持。
由于作者水平有限,书中错误和不妥之处在所难免,诚请读者专家提出宝贵意见。
信息技术的迅速发展已从简单的批处理、联机事务处理的信息处理时代,进入了联机分析处理、数据仓库和数据挖掘的信息分析时代。
从应用角度来看,数据仓库是一种解决问题的方案,而不仅仅是技术和产品。数据仓库的建立是一个决策分析系统实施的过程,不仅需要各种建设工具,而且还需相应的数据支持。数据仓库的建设必须基于比较完善的信息化构架,只有在一定的信息化基础上,才能进行数据仓库的建设。数据仓库的建设还是企业经营管理决策与信息化结合的过程,只有根据企业管理决策的实际情况,才能建设一个支持企业管理决策的数据仓库。
从技术角度来看,数据仓库以数据库技术作为存储数据和资源管理的手段,以联机分析处理技术和方法作为提取信息的有效手段:以数据挖掘、人工智能中的模型、算法作为发现知识和规律的途径。数据仓库的建设还是各种先进的信息处理技术与企业管理决策结合的过程,只有将OLAP技术、数据挖掘技术与数据仓库中的庞大数据相结合,与企业先进的管理决策方法相结合,才能使数据仓库在企业的经营管理决策中发挥巨大的作用。
数据仓库是诸多学科相互交叉、综合应用的技术。数据仓库建设的成功不仅取决于技术人员对数据仓库开发方法与开发工具的熟练应用,更取决于数据仓库能否得到熟练应用。换句话说,数据仓库的成功关键在于用户的应用情况,而不是数据仓库开发技术的熟练应用。所以本书在介绍了数据仓库的组织与数据挖掘方法之后,还用相当的篇幅介绍了数据仓库的管理与应用。
本书内容包括数据库、数据库管理系统与数据仓库;数据仓库原理:数据仓库设计;联机分析处理;数据挖掘算法;统计类数据挖掘和知识类数据挖掘:其他数据挖掘技术和工具和数据仓库的应用和管理。本书还通过分析典型数据库与应用案例,使读者了解如何利用数据仓库来降低企业的运营成本、建立更好的客户关系管理、提高产品的质量。
本书的主要特点:
(1)因为创建数据库一方面需要根据企业自身的管理特征具体分析,有针对性地建立符合自身要求的数据仓库应用系统;另一方面需要有数据支持。故本书的安排严格遵循数据仓库组织与数据挖掘技术(工具)这条主线。
(2)为提高本书对相关系统的建设与应用方面的指导性,书中提供了大量有启发性的案例(如目录中加框线部分的内容)。
(3)书中尽量体现了最先进的数据仓库组织和数据挖掘技术。
目前有关数据挖掘的书籍主要有三类,分别是:面向商业应用的,描述特定的方法和算法(如决策树分类),而一般性的基本原理(如参数估计和计算复杂性)则在底层经常的被忽略掉了:从数据库角度解释数据挖掘的具体技术:从机器学习的角度演绎数据挖掘的可行性。实际上,数据挖掘技术在相当大的程序上依赖于统计模型和方法(计算机只是作为工具之一):数据挖掘所处理的数据对象是为其他某些目的已经收集好的,而不一定是为了数据分析本身去收集的;数据挖掘的目标根本不在于数据采集策略。这也是数据挖掘区别于大多数统计任务的一个特征,在统计中则经常是利用高效率的策略来采集数据以回答特定的问题。
本书面对的是已经熟悉基本的算法、数据结构和数据库的概念,并且已经有过一些基本的网络体验的读者,即本书的目标读者是具有以下专业背景的大学生:计算机科学、工程学、数学、自然科学以及像经济学、生物学等面向具体应用的专业的学生。
本书的作者分工如下:章海涛撰写第1章和第5.2节的部分内容:张建平撰写了第2章和第6.3节的部分内容;黎小沛撰写了第3章和第4章的大部分内容:丛光撰写了第5.3节和第7.1—7.3节;饶友玲撰写了第4.3.4、5.1、6.2节和第8章:其余部分由康晓东撰写。全书由康晓东统稿。
作者感谢本专业领域前辈们的工作,是他们开创性工作的成果充实了本书的内容(见书后的参考文献);感谢IT业界的同事和朋友们,特别是邹文波为本书提供了大量的外版参考资料。还要感谢南开大学博士生导师逄锦聚教授和西安交通大学博士生导师蒋大宗教授,他们对本书的编写给予了指导和支持。
由于作者水平有限,书中错误和不妥之处在所难免,诚请读者专家提出宝贵意见。







点击看大图

加载中...

