基本信息
- 原书名:Data Virtualization for Business Intelligence Systems:Revolutionizing Data Integration for Data Warehouses
- 作者: (荷)里克 F. 范德兰斯
- 译者: 王志海
- 丛书名: 数据科学与工程技术丛书
- 出版社:机械工业出版社
- ISBN:9787111576129
- 上架时间:2018-1-23
- 出版日期:2017 年8月
- 开本:16开
- 版次:1-1
- 所属分类:计算机 > 数据库 > 综合

内容简介
作译者
Rick van der Lans先生是一名国际知名的演讲家。他有着在欧洲、中东、美国、南美和澳大利亚等多个国家和地区20多年的专业演讲经验。他经常应主流软件供应商之邀发表主题演讲。
他是诸多计算机相关书籍的作者,其中包括《Myths on Computing》。他的一些著作被译成多种语言,例如畅销书《Introduction to SQL》和《SQL for MySQL Developers》有英语、荷兰语、意大利语、汉语和德语版本,并在全球销售。
作为BeyeNetwork.com网站和白皮书的作者、欧洲数据仓库和商务智能年会的主席以及IT杂志专栏作家,Rick与许多供应商保持着密切联系。
你可以通过以下方式与Rick联系:
Email:rick@r20.nl
Twitter:http://twitter.com/Rick_vanderlans
LinkedIn:http://www.linkedin.com/pub/rick-van-der-lans/9/207/223
目录
前言
作者简介
第1章 数据虚拟化导论1
1.1 引言1
1.2 商务智能世界正在改变1
1.3 虚拟化简介3
1.4 什么是数据虚拟化3
1.5 数据虚拟化与相关概念4
1.5.1 数据虚拟化与封装和信息隐藏4
1.5.2 数据虚拟化与抽象5
1.5.3 数据虚拟化与数据联合5
1.5.4 数据虚拟化与数据集成6
1.5.5 数据虚拟化与企业信息集成7
1.6 数据虚拟化的定义8
1.7 数据虚拟化的技术优势8
1.8 数据虚拟化的不同实现11
1.9 数据虚拟化服务器概述12
1.10 开放式与封闭式数据虚拟化服务器12
1.11 数据集成的其他方式13
前言
数据虚拟化是一种转化异构数据库集合和文件的技术,这种技术使得这些数据看起来像一种集成的数据。在用于商务智能系统时,它可以使数据架构更简单、更便宜,最重要的是更敏捷。新的报告和分析需求可以更快实施,现有系统可以更容易改变。这就需要增加敏捷性:一方面,商务用户需要其系统提供更多的敏捷性,因为他们的世界已经开始改变;另一方面,商务智能的新形式,如运营报告、大数据分析、360氨ǜ妗⒆灾癖ǜ婧吞剿餍苑治觯际堑鼻暗男枨蟆1臼橹铝τ谑菪槟饣际跻约叭绾斡行У卦谏涛裰悄芟低持欣酶眉际酢R虼巳梦颐谴悠鸬憧迹有槟饣肌?
在IT行业,我们已经进入了虚拟化时代。似乎这一行业中的任何东西都可以虚拟化,包括内存、外存、网络和数据中心。虚拟化技术很热门,比如云技术的普及也可以归类为虚拟化技术。虚拟化技术就是热点,并且在一段时间内都将是技术的焦点。
所有虚拟化技术和概念的共同点是它们封装了某个资源。任何虚拟化解决方案都隐藏了可用资源的数量、资源的位置以及获取资源所需的API等。但不要将虚拟化与一些电脑游戏所提供的虚拟世界混淆。这些游戏提供了一些虚拟的东西,但它们并没有封装特定的资源。
本书将解释一种特定形式的虚拟化:数据虚拟化。简而言之,数据虚拟化意味着将数据以集成的方式提供给应用程序,而不管所有数据是否分布在多个数据库中,是否以不同格式存储,是否可通过不同的数据库语言进行访问。数据虚拟化技术将这些不同的数据存储作为一个逻辑数据库呈现给应用程序。虽然数据虚拟化产品和技术已经存在了一段时间,但是大约在2009年,它才逐步得到了应有的关注。因为它对解决方案的影响—增加的敏捷性,所以越来越多的组织正在采用虚拟化技术,似乎可以认为21世纪的第二个十年将成为数据虚拟化的十年。
数据虚拟化可以部署在需要检索和操作数据的所有类型的信息系统中,例如经典数据输入系统、基于因特网的系统、面向服务的系统、主数据管理系统和商务智能系统。本书的重点是商务智能系统。数据虚拟化可用于整合来自各种数据源的数据,包括数据仓库、数据集市和生产型数据库。它有潜力改变我们开发商务智能系统的方式。数据虚拟化将成为大多数这类系统的心脏。
简而言之,数据虚拟化允许我们使用更简单和更灵活的架构构建商务智能系统。如果你想知道怎么做和为什么,本书就是为你而写的!本书将详细描述数据虚拟化产品的工作原理、技术应用、应该做什么和不做什么,以及在商务智能系统中应用它的好处。
谁应该阅读这本书?
本书适合以下人群:
负责开发和管理数据仓库和商务智能环境的商务智能专家,以及那些想知道如何通过应用数据虚拟化技术来简化系统或实现更灵活的商务智能系统的人。
信息管理专家,想知道数据虚拟化对其职业的影响,以及数据虚拟化将如何影响信息管理、数据管理、数据库设计、数据清洗和数据分析等活动。
主数据管理专家,负责创建主数据管理系统,并希望了解如何从部署数据虚拟化中受益。
数据架构师,负责设计数据的整体系统架构,用来向特定组织的任何机构提供所需要的数据。
数据库管理员,必须了解数据虚拟化服务器的特性和限制,用于确定如何以及在何处可以有效且高效地应用此技术。
设计师、分析师和顾问,必须直接或间接处理数据虚拟化,以及想知道数据虚拟化所能做的和不能做的。
学生,想要学习数据虚拟化技术,以及理解数据虚拟化技术与其他数据处理相关技术的区别。
预备知识
关于数据仓库、商务智能和数据库技术的一般性知识是必需的。
术语和定义
遗憾的是,数据虚拟化和数据仓库领域中使用的所有术语并非都是明确定义的,这一点在本书中讲得很清楚。为了避免混淆,我们试图清晰地定义大多数术语。但是,我们不能保证本书中的定义与你的定义一致。
序言
之后,由于提取-转换-装载(ETL)工具的技术创新,从而能够以可靠的、可重复的方式来自动完成原本手动进行的数据集成任务。ETL工具大大提高了创建数据仓库的整个过程的效率,其中包括数据质量技术,以进一步提高用于决策制定的集成数据的价值。到目前为止,ETL工具仍然是商务智能系统中用于创建历史数据的物理存储的主要机制。
最近,操作型商务智能和大数据分析的出现使得商务智能架构师需要重新思考ETL和数据管理基础结构。首先对操作型商务智能来说,大多数商务智能化环境开始审视生成历史报告和分析的过程中发生了什么。历史数据也可以用于预测将会发生什么,但它并不能完全支持实时决策或者操作型商务智能。
随着企业开始逐渐需要某种能够基于当前或低延迟数据进行快速决策的能力,我们通过改变数据捕获技术、数据载入技术和操作型数据的微批量处理技术等来加速整个ETL过程。这些方法可以将数据仓库中数据的延迟从数天和数小时的级别降低到分钟,但它们仍然不足以实现真正的实时决策。商务智能实现者意识到经典的ETL处理已经达到极限,现在需要一种新的数据集成形式。
大数据及其相关的分析也面临着同样的问题。大数据包括社交和文本分析数据、传感器数据,以及事件或运动中的数据。许多大数据是非结构化的,或者更精确地说它有着多种格式。在典型的操作型系统中尚没有传统的、可预测的结构。相对于以前的标准,它的数据量极大。对于许多数据仓库实施者来说,他们面临着大数据整合的巨大挑战。
事实上,许多大数据并不需要永久存储在结构化的数据仓库中。通常,大数据需要经过实验性和调查性的分析。即使如此,也需要将一些数据与数据仓库中的数据进行组合。我们如何有效满足运营商务智能和大数据的需求,并扩展商务智能架构,而不会中断现有的ETL流程呢?答案就是数据虚拟化。
我认识本书作者Rick F. van der Lans多年。我经常学习他的文章和研究论文,因为他写的内容总是能对传统思维给出有趣的新思路并进行创造性的革新。Rick的著作总是促使我重新评估现有的认知,而本书是他的最新著作。
数据虚拟化已成为当今商务智能实施者必备的技术。与其他新技术一样,它也面临着许多问题。例如如何实施它,什么时候使用它,以及要避免什么陷阱。Rick在这本实用的指南中详细介绍和解答了这些问题。之后几年我将会多次翻开这本书,我知道你也会。
Claudia Imhoff
Intelligent Solutions公司总裁
Boulder BI Brain Trust(BBBT)公司创始人