物理数据库设计—索引、视图和存储技术
基本信息
- 原书名: Physical Database Design: the database professional's guide to exploiting indexes, views, storage, and more
- 原出版社: Morgan Kaufmann
- 作者: Sam Lightstone Toby Teorey Tom Nadeau [作译者介绍]
- 译者: 吴骅 王学昌 韩潼瑜
- 出版社:清华大学出版社
- ISBN:9787302239314
- 上架时间:2010-12-3
- 出版日期:2010 年12月
- 开本:16开
- 页码:283
- 版次:1-1
- 所属分类:
物理 > 总论 > 综合
编辑推荐
本书全面讲述数据库物理设计方案,是一部物理数据库设计方面的优秀著作。
内容简介回到顶部↑
本书全面讲述数据库物理设计方案,主要包括物理数据库设计概况,基本索引方法,查询优化和方案选择,选择索引,物化视图选择,无共享分区,范围分区,多维群集,相互依赖的问题,物理设计探索中的计数和数据抽样,查询执行计划和物理设计,自动化物理数据库设计,服务器资源和拓扑,决策支持、数据仓库和olap系统中的物理设计,逆规范化以及分布式数据分配等内容。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
作译者回到顶部↑
本书提供作译者介绍
Sam Lightstone是IBM的DB2产品开发团队研发经理及高级技术人员,他的工作涉及自主计算和关系数据库管理系统的许多方面。Sam Lightstone是DB2自主计算研发工作的领导者和创始人之一,是自治数据库系统方面IEEE数据工程组的主席,是自治和自主计算方面IEEE计算机协会任务组的成员。2003年,他当选为IBM技术研究院加拿大子公司的杰出技术委员会委员。Sam Lightstone是IBM的发明大师,拥有超过25项专利和未决专利,他所发表的成果涉及许多关于关系数据库系统自主计算的内容,从1991年开始一直就职于I.. << 查看详细
目录回到顶部↑
第1章 物理数据库设计概况 1
1.1 动机——数据增长和与日俱增的物理数据库设计 1
1.2 数据库生命周期 4
1.3 物理设计的元素:索引、分区和群集 5
1.3.1 索引 6
1.3.2 物化视图 7
1.3.3 分区和多维群集 7
1.3.4 物理数据库设计的其他方法 7
1.4 物理设计为什么这么困难 8
1.5 文献综述 9
第2章 基本索引方法 10
2.1 b+树索引 10
2.2 复杂的索引检索 14
2.2.1 复杂索引方法 16
2.2.2 表扫描 16
2.3 位图索引 17
2.4 记录标识符 18
2.5 小结 18
2.6 文献综述 19
第3章 查询优化和方案选择 20
1.1 动机——数据增长和与日俱增的物理数据库设计 1
1.2 数据库生命周期 4
1.3 物理设计的元素:索引、分区和群集 5
1.3.1 索引 6
1.3.2 物化视图 7
1.3.3 分区和多维群集 7
1.3.4 物理数据库设计的其他方法 7
1.4 物理设计为什么这么困难 8
1.5 文献综述 9
第2章 基本索引方法 10
2.1 b+树索引 10
2.2 复杂的索引检索 14
2.2.1 复杂索引方法 16
2.2.2 表扫描 16
2.3 位图索引 17
2.4 记录标识符 18
2.5 小结 18
2.6 文献综述 19
第3章 查询优化和方案选择 20
译者序回到顶部↑
《物理数据库设计——索引、视图和存储技术》一书讨论数据库的物理结构如何影响性能,包括具体的例子、向导、各种DBMS和配置的最好和最差的应用实例:一些简单的内容,如提高表的索引设计对性能有深远的影响;不同形式的数据库,如联机事务处理(OLTP)、企业资源管理(ERP)、数据挖掘(DM)和管理资源计划(MRP)等,这些数据库都可以使用这本书中提供的方法改善性能。
这是第一本全面讲述数据库物理设计的书籍。关系数据库中所包含信息的迅速增加,使得数据库、性能和可维护性变得不再简单,DBA比以往任何时候都要在更大压力下去优化数据库结构的系统性能和管理。
作为《数据库建模与设计:逻辑设计》一书的姊妹篇,本书侧重于使用B+树索引开发、群集索引、多维群集(MDC)、范围分区和自动化设计工具等技术进行数据库的物理设计。本书面向对于数据库设计有着更进一步要求的中高级用户,如DBA、数据库开发人员等。
全书从内容上来看可以分为以下6个部分以及两个附录。第1部分主要是物理数据库设计的概述,介绍了业界目前用得较多的索引方法,从数据库专家的角度了解数据库设计的背景知识:第2部分详细介绍了物理数据库设计所需要的个别重要的设计决策;第3部分讨论范围与群集技术;第4部分主要介绍了物理设计决策的整合问题;第5部分对自动化物理设计决策的重要性进行了探讨,提出数据库设计人员需要了解的一些系统问题,包括多处理器服务器、磁盘系统、网络拓扑、灾难恢复技术和内存管理等;第6部分描述了物理设计如何支持数据仓库、使用OLAP技术进行有效的信息检索以及分布式数据之间分配策略的基础知识;附录给出了一个简单的运算性能模型以及两个商业化灾难恢复技术的比较(IBM HADR与Oracle Data Guard)。
本书的翻译由吴骅组织完成,参与本书翻译的还有王学昌、韩潼瑜、周娟、刘红军、王玲、郑正正、冯伟强、陶日然和李泽榆。全书由吴骅负责统一定稿。
虽然译者多年从事DB2数据库的管理工作,但是本书对于译者来说也是一个全新的挑战,它介绍了大量的技术和特性,因此其中一些术语尚无固定的名称。
由于水平有限,译文中的不当之处在所难免,恳请同行及各位读者朋友不吝赐教。
译者
这是第一本全面讲述数据库物理设计的书籍。关系数据库中所包含信息的迅速增加,使得数据库、性能和可维护性变得不再简单,DBA比以往任何时候都要在更大压力下去优化数据库结构的系统性能和管理。
作为《数据库建模与设计:逻辑设计》一书的姊妹篇,本书侧重于使用B+树索引开发、群集索引、多维群集(MDC)、范围分区和自动化设计工具等技术进行数据库的物理设计。本书面向对于数据库设计有着更进一步要求的中高级用户,如DBA、数据库开发人员等。
全书从内容上来看可以分为以下6个部分以及两个附录。第1部分主要是物理数据库设计的概述,介绍了业界目前用得较多的索引方法,从数据库专家的角度了解数据库设计的背景知识:第2部分详细介绍了物理数据库设计所需要的个别重要的设计决策;第3部分讨论范围与群集技术;第4部分主要介绍了物理设计决策的整合问题;第5部分对自动化物理设计决策的重要性进行了探讨,提出数据库设计人员需要了解的一些系统问题,包括多处理器服务器、磁盘系统、网络拓扑、灾难恢复技术和内存管理等;第6部分描述了物理设计如何支持数据仓库、使用OLAP技术进行有效的信息检索以及分布式数据之间分配策略的基础知识;附录给出了一个简单的运算性能模型以及两个商业化灾难恢复技术的比较(IBM HADR与Oracle Data Guard)。
本书的翻译由吴骅组织完成,参与本书翻译的还有王学昌、韩潼瑜、周娟、刘红军、王玲、郑正正、冯伟强、陶日然和李泽榆。全书由吴骅负责统一定稿。
虽然译者多年从事DB2数据库的管理工作,但是本书对于译者来说也是一个全新的挑战,它介绍了大量的技术和特性,因此其中一些术语尚无固定的名称。
由于水平有限,译文中的不当之处在所难免,恳请同行及各位读者朋友不吝赐教。
译者
前言回到顶部↑
IBM工程师E.F.Codd在1970年提出关系模型后,关系数据库成为管理和查询结构化数据的事实标准。在过去的15年中,随着Internet的兴起,联机事务处理、在线银行业务、与不同系统连接的能力使数据量有大幅度的增长。容量在TB级以上的数据已经很普遍。这一数据增长的同时,遵守摩尔定律的CPU性能急剧增长,磁盘技术的进步使磁盘存储密度进一步提升。现代数据库经常需要支持成千上万的用户同时访问。数据库系统的性能和可维护性大大取决于其物理设计。
主要的数据库厂商开发了一系列很好的物理特性和功能设计技术。当今的数据库可以在内存和磁盘上进行切片、切块、正移,还可以以各种方式旋转等。但是到目前为止,并没有多少文章涉及“物理数据库设计”。当然,也有过白皮书、一些个人观点和一些产品的文章涉及这个问题,但并没有把它作为一个整体来对待。数据库设计人员在实际工作中遇到的困难也很少提及,“蠕变特性”的复杂性给行业带来了不小的麻烦。因为这些原因,我们迫切需要关于物理数据库设计的资料。
我们编写的这本新书面向广大的用户,包括数据库系统的学生和数据库领域的专业人士。在书中,我们引入物理数据库设计的主要概念,包括索引(B+、哈希、位图)、物化视图(延迟和实时)、范围分区、散列(哈希)分区、无共享设计、多维群集、服务器拓扑、数据分布和基础物理子系统(NUMA、SMP、MPP、SAN、NAS、RAID设备)等。为符合编写这本书的目标人群——学生和数据库专业人员,我们把重点放在实际的问题和解决方案上。
在每一个细分市场和使用关系数据库系统的各个方面,有关物理数据库设计的关键问题似乎无处不在,如联机事务处理(OLTP)、数据挖掘(DM)、多维联机分析处理(MOLAP)、企业资源规划(ERP)、管理资源计划(MRP)、数据库管理员(DBA)团队设计和管理的所有内部企业系统以及开发过程中的独立软件提供商的应用程序(ISVA)。我们希望对物理数据库设计、使用范例、产品的特定语法和最优方法的关注,能使本书成为数据库资料的一个很好的补充。
文章结构
第1章是物理数据库设计的概述以及如何适应数据库的生命周期。第2章介绍了业界目前用得较多的索引方法和B+树索引的基本原理,并介绍了简单索引和复合索引的变化,还对不同方法的性能测试加以比较。第3章主要从数据库专家的角度介绍了查询优化的基础和查询执行计划选择等需要了解的数据库设计背景知识。
第4~8章讨论物理数据库设计所需要的个别重要的设计决策。第4章介绍了如何完成索引选择的具体内容,以及在选择和连接操作中索引策略的替代方案。第5章介绍了如何为独立关系数据库选择物化视图,以及如何在数据仓库中的数据库集合设置星型模型,用了几个例子说明物化视图选择中所涉及的折中方案。第6章介绍了如何执行无共享分区来分步解决庞大而且需要复杂计算的数据库问题,并说明了无共享分区、物化视图复制以及索引之间的关系。
第7章专门讨论范围分区,将大表分成多个较小的表来保存一定范围内的数据和索引,方便寻址。第8章讨论了群集数据的优点,以及在扩展到多维数据时这种技术是多么的有效。这样可以使系统在同一时间内群集多维数据,而不用复制数据。
第9章讨论物理设计决策的整合问题。物理设计决策由每个决策如何影响其他决策来决定,并指导设计人员使用这些组件来优化设计。第10章的重点是计数和抽样数据,以协助改善独立查询设计的方法、物化视图的选择、群集和分区等。第11章通过对一些比较有用的工具的描述来讲述查询执行计划,这些工具允许用户了解查询执行计划,以及设计数据库时选择的方法,如索引选择和物化视图等。
第12章详细说明了自动化物理设计决策的重要性,主要的关系数据库如DB2、SQL Server和Oracle提供的自动化设计支持,讨论了如何使用这些工具更快速地设计高效率的数据库。第13章提出数据库设计人员需要了解的一些系统问题,如多处理器服务器、磁盘系统、网络拓扑、灾难恢复技术和内存管理等。
第14章讨论了物理设计如何支持数据仓库和使用OLAP技术进行有效的信息检索。第15章定义了什么是逆规范化,并且说明规范化程度和数据库性能之间的权衡。第16章是分布式数据之间分配策略的基础知识,包括由于数据复制影响的快速查询响应时间和多个数据副本更新时间成本的权衡。
附录A简要介绍了一个简单的运算性能模型,用来评估和比较单一数据库的不同物理设计的策略。该模型阐明了几个章节中所讲述的物理设计方法——权衡分析和设计决策。附录B包含了两个商业化灾难恢复技术的比较,分别为IBM的高可用性灾难恢复和Oracle的Data Guard。
每一章都有数据库设计人员的提示和独特见解,对读者了解每一章的设计方法很有帮助。接下来是参考书目汇总,使读者能够选择相应的物理设计主题进行进一步的了解。
使用范例
逻辑设计和物理设计之间的主要区别之一,是物理设计的基本特点和数据库服务器的物理属性(软件和硬件)的关系越来越紧密。虽然逻辑设计可以抽象地进行,有些产品和组件相对独立,可以用来实现所做的设计,但也不能说是物理设计。因此,在本书中,我们仔细选择了一些例子,包括关于物理数据库设计的数据库服务器产品中的部分主要产品,如DB2 for zOS V8.1、DB2 9(Linux、UNIX和Windows)、Oracle 10g、SQL Server 2005、Informix Dataserver和NCR Teradata的产品。我们认为,这包括了行业内流行的大部分数据库。一些比较流行的数据库如MySQL和Sybase则没有加以介绍,只是为了更简单地说明问题。
文献综述和书目
与之前的逻辑数据库设计书籍《数据库建模与设计:逻辑设计》(《Database Modeling and Design: Logical Design, 4th》)一样,本书在每章的最后都有文献综述。章节当中所涉及的材料有论文和相关参考,具体有两种形式:
与本章讨论的物理数据库设计概念有关、原创的具有突破性想法、对数据库设计发展有重大影响的论文。
关于最新研究和突破性想法的主要论文。
除每一章后面的文献综述外,本书的最后有个更全面的参考书目表。
主要的数据库厂商开发了一系列很好的物理特性和功能设计技术。当今的数据库可以在内存和磁盘上进行切片、切块、正移,还可以以各种方式旋转等。但是到目前为止,并没有多少文章涉及“物理数据库设计”。当然,也有过白皮书、一些个人观点和一些产品的文章涉及这个问题,但并没有把它作为一个整体来对待。数据库设计人员在实际工作中遇到的困难也很少提及,“蠕变特性”的复杂性给行业带来了不小的麻烦。因为这些原因,我们迫切需要关于物理数据库设计的资料。
我们编写的这本新书面向广大的用户,包括数据库系统的学生和数据库领域的专业人士。在书中,我们引入物理数据库设计的主要概念,包括索引(B+、哈希、位图)、物化视图(延迟和实时)、范围分区、散列(哈希)分区、无共享设计、多维群集、服务器拓扑、数据分布和基础物理子系统(NUMA、SMP、MPP、SAN、NAS、RAID设备)等。为符合编写这本书的目标人群——学生和数据库专业人员,我们把重点放在实际的问题和解决方案上。
在每一个细分市场和使用关系数据库系统的各个方面,有关物理数据库设计的关键问题似乎无处不在,如联机事务处理(OLTP)、数据挖掘(DM)、多维联机分析处理(MOLAP)、企业资源规划(ERP)、管理资源计划(MRP)、数据库管理员(DBA)团队设计和管理的所有内部企业系统以及开发过程中的独立软件提供商的应用程序(ISVA)。我们希望对物理数据库设计、使用范例、产品的特定语法和最优方法的关注,能使本书成为数据库资料的一个很好的补充。
文章结构
第1章是物理数据库设计的概述以及如何适应数据库的生命周期。第2章介绍了业界目前用得较多的索引方法和B+树索引的基本原理,并介绍了简单索引和复合索引的变化,还对不同方法的性能测试加以比较。第3章主要从数据库专家的角度介绍了查询优化的基础和查询执行计划选择等需要了解的数据库设计背景知识。
第4~8章讨论物理数据库设计所需要的个别重要的设计决策。第4章介绍了如何完成索引选择的具体内容,以及在选择和连接操作中索引策略的替代方案。第5章介绍了如何为独立关系数据库选择物化视图,以及如何在数据仓库中的数据库集合设置星型模型,用了几个例子说明物化视图选择中所涉及的折中方案。第6章介绍了如何执行无共享分区来分步解决庞大而且需要复杂计算的数据库问题,并说明了无共享分区、物化视图复制以及索引之间的关系。
第7章专门讨论范围分区,将大表分成多个较小的表来保存一定范围内的数据和索引,方便寻址。第8章讨论了群集数据的优点,以及在扩展到多维数据时这种技术是多么的有效。这样可以使系统在同一时间内群集多维数据,而不用复制数据。
第9章讨论物理设计决策的整合问题。物理设计决策由每个决策如何影响其他决策来决定,并指导设计人员使用这些组件来优化设计。第10章的重点是计数和抽样数据,以协助改善独立查询设计的方法、物化视图的选择、群集和分区等。第11章通过对一些比较有用的工具的描述来讲述查询执行计划,这些工具允许用户了解查询执行计划,以及设计数据库时选择的方法,如索引选择和物化视图等。
第12章详细说明了自动化物理设计决策的重要性,主要的关系数据库如DB2、SQL Server和Oracle提供的自动化设计支持,讨论了如何使用这些工具更快速地设计高效率的数据库。第13章提出数据库设计人员需要了解的一些系统问题,如多处理器服务器、磁盘系统、网络拓扑、灾难恢复技术和内存管理等。
第14章讨论了物理设计如何支持数据仓库和使用OLAP技术进行有效的信息检索。第15章定义了什么是逆规范化,并且说明规范化程度和数据库性能之间的权衡。第16章是分布式数据之间分配策略的基础知识,包括由于数据复制影响的快速查询响应时间和多个数据副本更新时间成本的权衡。
附录A简要介绍了一个简单的运算性能模型,用来评估和比较单一数据库的不同物理设计的策略。该模型阐明了几个章节中所讲述的物理设计方法——权衡分析和设计决策。附录B包含了两个商业化灾难恢复技术的比较,分别为IBM的高可用性灾难恢复和Oracle的Data Guard。
每一章都有数据库设计人员的提示和独特见解,对读者了解每一章的设计方法很有帮助。接下来是参考书目汇总,使读者能够选择相应的物理设计主题进行进一步的了解。
使用范例
逻辑设计和物理设计之间的主要区别之一,是物理设计的基本特点和数据库服务器的物理属性(软件和硬件)的关系越来越紧密。虽然逻辑设计可以抽象地进行,有些产品和组件相对独立,可以用来实现所做的设计,但也不能说是物理设计。因此,在本书中,我们仔细选择了一些例子,包括关于物理数据库设计的数据库服务器产品中的部分主要产品,如DB2 for zOS V8.1、DB2 9(Linux、UNIX和Windows)、Oracle 10g、SQL Server 2005、Informix Dataserver和NCR Teradata的产品。我们认为,这包括了行业内流行的大部分数据库。一些比较流行的数据库如MySQL和Sybase则没有加以介绍,只是为了更简单地说明问题。
文献综述和书目
与之前的逻辑数据库设计书籍《数据库建模与设计:逻辑设计》(《Database Modeling and Design: Logical Design, 4th》)一样,本书在每章的最后都有文献综述。章节当中所涉及的材料有论文和相关参考,具体有两种形式:
与本章讨论的物理数据库设计概念有关、原创的具有突破性想法、对数据库设计发展有重大影响的论文。
关于最新研究和突破性想法的主要论文。
除每一章后面的文献综述外,本书的最后有个更全面的参考书目表。
媒体评论回到顶部↑
我强烈推荐由Lightstone、Teorey以及Nadeau所撰写的《物理数据库设计》一书。本书涵盖了诸多有关良好物理设计的内容:如在使用索引、物化视图的权衡以及物理数据布局等不同方法时的效果。与其他类似书籍所不同的是,本书并不是局限在某种特定的产品之上,而是那些被产品表面所遮蔽的更深层次的内容。本书还涉及到交易密集型应用程序(OLTP)以及数据仓库(OLAP)方面的内容。总之,本书十分值得期待。
—Michael Blaha, OMT Associates, Inc.
这是一部物理数据库设计方面的优秀著作,她给予读者务实的模型以及建议,为广大的从业者以及学习者提供了丰富的信息,并通过DB2、Oracle以及SQL Server中的实例介绍相关分析模型以及实用的提示信息。
—Jim Gray, Microsoft Research
—Michael Blaha, OMT Associates, Inc.
这是一部物理数据库设计方面的优秀著作,她给予读者务实的模型以及建议,为广大的从业者以及学习者提供了丰富的信息,并通过DB2、Oracle以及SQL Server中的实例介绍相关分析模型以及实用的提示信息。
—Jim Gray, Microsoft Research







点击看大图
加载中...
