基本信息
内容简介
计算机书籍
数据仓库(DW)与数据挖掘(DM)是20世纪90年代中期兴起的新技术。数据仓库用于决策分析,数据挖掘用于从数据库中发现知识。数据仓库和数据挖掘的结合为决策支持系统(DSS)开辟了新方向,它们也是商业智能(BI)的主要技术。
本书主要介绍数据仓库系统、数据仓库的数据获取与管理、数据仓库的设计和开发、联机分析处理(OLAP)、数据挖掘与文本挖掘、决策树方法、粗糙集方法与关联规则挖掘、公式发现、神经网络与遗传算法、基于案例推理、决策支持系统与商业智能等内容。本书包含了作者多年来在数据仓库与数据挖掘中的研究成果。
本书可作大学计算机专业、管理科学与工程专业、系统工程专业等高年级本科生与研究生课程的教材,也可以作有关学科科技人员的参考书。
目录
1.1 数据仓库概念
1.1.1 数据仓库妁兴起
1.1.2 数据仓库的特点
1.1.3 数据集市
1.2 知识发现和数据挖掘概念
1.2.1 知识发现和数据挖掘的定义
1.2.2 数据挖掘任务
1.2.3 数据挖掘分类
1.2.4 数据挖掘对象
1.2.5 数据挖掘的知识表示
1.3 数据挖掘方法和技术
1.3.1 归纳学习方法
1.3.2 仿生物技术
1.3.3 公式发现
1.3.4 统计分析方法
1.3.5 模糊数学方法
1.3.6 可视化技术
1.4 数据仓库和数据挖掘的发展
1.4.1 数据仓库和数据挖掘的结合
前言
数据仓库和数据挖掘是两项不同的技术。数据仓库是区别于数据库的一种新的数据存储形式,它将数据库中的数据按决策需求(主题)进行重新组织,以多维空间结构形式存储数据。数据仓库的数据量很大,具有GB级到TB级的数据量。而一般的数据库是以二维平面结构形式存储数据,数据量一般为MB级别。
数据挖掘是从数据库中发现知识(Knowledge Discovery in Database,KDD)的核心技术,它是从人工智能的机器学习(Machine Learning,ML)中发展起来的。机器学习是让计算机通过模拟人的学习方法获取知识。机器学习中的大量学习方法已经引入到数据挖掘中。
虽然数据仓库和数据挖掘是两项不同的技术,但是它们又有共同之处,两者都是在数据库的基础上发展起来的,它们都是决策支持新技术。数据仓库利用综合数据得到宏观信息,利用历史数据进行预测;而数据挖掘是从数据库中挖掘知识,也用于决策分析。虽然数据仓库和数据挖掘支持决策分析的方式不同,但是它们完全可以结合起来,提高决策分析的能力。大量的数据仓库已经把数据挖掘技术作为它的前端分析工具,以提高数据仓库的决策分析能力。
数据仓库、数据挖掘和联机分析处理(On Line Analytical Processing,OLAP)结合起来被认为是新决策支持系统,这是以数据驱动的决策支持系统。而传统决策支持系统(DecisionSupport System,DSS)是以模型驱动的决策支持系统,它是由模型库系统、知识库系统、数据库系统和人机交互系统组成的。新决策支持系统并不能代替传统的决策支持系统,他们是相互补充的。新决策支持系统与传统决策支持系统结合起来形成的综合决策支持系统,将是决策支持系统发展的新方向。
数据仓库、数据挖掘、联机分析处理等结合起来也被称为商业智能(Business Intelligence,BI)。商业智能是一种新的智能技术,它区别于人工智能(Artificial Intelligence,AI)和计算智能(Computational Intelligence,CI)。人工智能采用的技术是符号推理,符号推理过程形成了概念的推理链;计算智能采用的技术是计算推理,它模拟人和生物的模糊推理、神经网络计算和遗传进化过程;商业智能是从数据仓库和数据挖掘中获取信息和知识,对变化的商业环境提供决策支持。商业智能是目前企业界正在大力推广的知识管理(Knowledge Manage,KM)的基础。
本书在数据仓库方面介绍数据仓库概念,数据仓库系统,数据仓库的数据获取与管理,数据仓库设计、开发与应用,联机分析处理;在数据挖掘方面介绍数据挖掘概念,文本数据挖掘与Web挖掘,决策树方法,粗糙集方法与关联规则挖掘,公式发现,神经网络与遗传算法,基于案例推理。最后介绍决策支持系统与商业智能。
我们在数据仓库与数据挖掘方面的研究得到了国家自然科学基金项目的资助。
欢迎读者提出宝贵的意见,进行切磋,共同推动我国在数据仓库和数据挖掘方面的发展。
编 者