基本信息
- 作者: 何震瀛 王鹏 李春静王宏志
- 丛书名: 数据科学与工程技术丛书
- 出版社:机械工业出版社
- ISBN:9781912181640
- 上架时间:2019-12-18
- 出版日期:2019 年11月
- 开本:16开
- 页码:342
- 版次:1-1
- 所属分类:计算机 > 数据库 > 数据库存储与管理

编辑推荐
---------------------------大数据管理系统原理与技术---------------------------
大数据管理系统
原理与技术
王宏志 何震瀛 王鹏 李春静编著
Database Management Systems for Big Data
内容简介
计算机书籍
---------------------------大数据管理系统原理与技术---------------------------
本书系统介绍了常用的面向大数据的数据库管理系统的原理和技术,包括关系数据库、非关系型数据库、HIVE、Hbase、Redies等,使读者在了解大数据的数据库管理系统基本原理的基础上,能根据实际的问题和应用场景选择、搭建适合的数据库管理系统。
---------------------------大数据分析原理与实践---------------------------
本书介绍大数据分析的多种模型、所涉及的算法和技术、实现大数据分析系统所需的工具以及大数据分析的具体应用。
本书共16章。第1章为绪论,阐释大数据、大数据分析等概念,并对本书内容进行概述;第2~7章介绍大数据分析模型的建立方法以及关联分析模型、分类分析模型、聚类分析模型、结构分析模型和文本分析模型;第8~11章介绍大数据分析所涉及的技术,包括数据预处理、降维、数据仓库、各种算法等;第12~14章介绍三种用于实现大数据分析算法的平台,即大数据计算平台、流式计算平台和大图计算平台;第15章和第16章介绍两类大数据分析的具体应用,分别讲述社交网络和推荐系统中的大数据分析。
本书可作为高等院校大数据分析相关课程的教材,也可以作为从事大数据相关工作的工程技术人员的参考用书。
目录
---------------------------大数据管理系统原理与技术---------------------------
本书编委会
前言
第1章 绪论 1
1.1 大数据的基本概念 1
1.2 数据库管理系统 5
1.2.1 数据库管理系统的基本概念 5
1.2.2 数据库管理系统的发展历史 6
1.2.3 数据库管理系统的要素 10
1.3 大数据对数据库管理系统的需求和挑战 13
1.4 本书结构 14
第2章 关系型数据库管理系统 15
2.1 关系数据库概述 15
2.1.1 关系模型 15
2.1.2 关系数据的存储 17
前言
---------------------------大数据管理系统原理与技术---------------------------
大数据计算的重要支撑是有效管理数据,研发以数据为核心的应用系统的重要任务之一就是选择数据库管理系统,对其进行配置、编程和调优。由于大数据的多样性,单一的数据库管理系统难以满足所有类型数据管理的需要,因而除传统的成熟关系数据库产品之外,还出现了面向不同数据和应用特点的数据库管理系统,这使得数据库管理系统的选择和使用更加具有挑战性。因而,掌握多种数据库管理系统对于大数据领域从业者来说非常重要。针对这一需求,本书试图介绍面向大数据的数据库管理系统知识。
本书系统介绍了面向大数据的数据库管理系统的基本原理和应用,以及关系数据库、数据仓库、多种NoSQL数据库管理系统等。考虑到读者的多样性,本书针对不同种类的数据库介绍了基本原理、使用方法和案例。
本书兼顾深度和广度,选取典型数据库系统进行了介绍。对于关系数据库,介绍了其相关的基本概念以及典型关系数据库系统MySQL。对于数据仓库,介绍了其基本概念和基于Hadoop的数据仓库系统Hive。本书还重点介绍了NoSQL数据库系统,并选取比较典型的键值数据库、列族数据库、文档数据库和图数据库分别介绍了其原理与应用。
本书适用于本科生和研究生的数据库管理系统、大数据管理等相关课程,也可以作为大数据系统开发、分布式系统、数据库系统等课程的补充教材或课外读物。本书也可作为大数据技术方面的职业培训教材,同时,还可供大数据领域的从业人员参考使用。
针对不同层次的教学要求,教师可以从本书中选择不同的内容。如果教学偏重讲授原理,可以着重讲授本书的概念和原理部分,而将后面的具体系统作为实例。如果教学偏重讲授技术和应用,可以着重讲授本书中系统的使用和开发,而对各类数据库管理系统只介绍基本概念,原理部分的深度视学时数而定。需要注意的是,数据库系统原理及使用是相辅相成的:只有深入了解了原理,才能对数据库管理系统进行高效应用,对于大数据管理系统来说尤其如此;反之,只有真正应用了数据库管理系统,才能对相关的原理有深入的认知。
本书可以独立学习,但是建议读者有一些离散数学、计算机系统和数据库管理系统的先修知识。尽管本书对数据库知识进行了简单介绍,但是其深度和广度难以与专门的数据库管理系统教材相比,建议读者在学习第2章和第3章时与数据库管理系统教材相互参考。具有一些分布式系统的知识对本书第4~8章的学习会有所帮助,建议读者在学习这几章时与分布式系统教材相互参考。
随着数据量和数据形态的不断变化,面向大数据的数据管理系统一直处于不断变化之中,尽管本书尽可能兼顾深度和广度,但是,限于笔者的水平,在内容安排、表述等方面的不当之处在所难免,敬请读者在阅读过程中不吝提出宝贵建议,以期改进本书。读者的任何意见和建议请发至邮箱wangzh@hit.edu.cn,与本书相关的信息也会在微信公众号“大数据与数据科学家”(big_data_scientist)发布。
感谢哈尔滨工业大学的李建中教授、高宏教授以及海量数据计算研究中心诸位同事的指导,以及在专业上对我的帮助。
在本书撰写过程中,哈尔滨工业大学的张梦、陈翔等同学在资料翻译、搜集和整理以及文本校对、作图等多个方面提供了帮助和支持,在此表示感谢。
感谢Neo4j中国总代理松鼠山科技有限公司对图数据库部分的技术支持,其专业的知识使得这一部分的质量得到了提升。
感谢北京华育兴业科技有限公司的企业专家对本书编写提出了很多建议,并通过“教育部-华育兴业产学合作协同育人”项目在课程和教学资源建设方面提供了大力支持。
非常感谢我的爱人黎玲利副教授一直以来对我的支持,以及在大数据管理领域和我的探讨。在本书写作期间,感谢我的母亲和岳母帮忙料理家务,照顾我的宝宝“壮壮”,使我有时间从事本书的写作。
最后,关于大数据管理方面的研究和本书的写作还得到了国家自然科学基金项目(编号:U1509216,U1866602)和微软亚洲研究院的资助,在此一并表示感谢。
王宏志
序言
---------------------------大数据分析原理与实践---------------------------
当前,一场科技革命浪潮正席卷全球,这一次,IT技术是主角之一。云计算、大数据、人工智能、物联网,这些新技术正加速走向应用。很快,它们将渗透至我们生产、生活中的每个角落,并将深刻改变我们的世界。
在这些新技术当中,云计算作为基础设施,将全面支撑各类新技术、新应用。我认为:云计算,特别是公共云,将成为这场科技革命的承载平台,全面支撑各类技术创新、应用创新和模式创新。
作为一种普惠的公共计算资源与服务,云计算与传统IT计算资源相比有以下几个方面的优势:一是硬件的集约化;二是人才的集约化;三是安全的集约化;四是服务的普惠化。
公共云计算的快速发展将带动云计算产业进入一个新的阶段,我们可以称之为“云计算2.0时代”,云计算对行业演进发展的支撑作用将更加凸显。
云计算是“数据在线”的主要承载。“在线”是我们这个时代最重要的本能,它让互联网变成了最具渗透力的基础设施,数据变成了最具共享性的生产资料,计算变成了随时随地的公共服务。云计算不仅承载数据本身,同时也承载数据应用所需的计算资源。
云计算是“智能”与“智慧”的重要支撑。智慧有两大支撑,即网络与大数据。包括互联网、移动互联网、物联网在内的各种网络,负责搜集和共享数据;大数据作为“原材料”,是各类智慧应用的基础。云计算是支撑网络和大数据的平台,所以,几乎所有智慧应用都离不开云计算。
云计算是企业享受平等IT应用与创新环境的有力保障。当前,企业创新,特别是小微企业和创业企业的创新面临IT技术和IT成本方面的壁垒。云计算的出现打破了这一壁垒,IT成为唾手可得的基础性资源,企业无须把重点放在IT支撑与实现上,可以更加聚焦于擅长的领域进行创新,这对提升全行业的信息化水平以及激发创新创业热情将起到至关重要的作用。
除了发挥基础设施平台的支撑作用外,2.0时代的云计算,特别是公共云计算对产业的影响将从量变到质变。我认为,公共云将全面重塑整个ICT生态,向下定义数据中心、IT设备,甚至是CPU等核心器件,向上定义软件与应用,横向承载数据与安全,纵向支撑人工智能的技术演进与应用创新。
对我国来说,发展云计算产业的战略意义重大。我认为,云计算已不仅仅是“IT基础设施”,它将像电网、移动通信网、互联网、交通网络一样,成为“国家基础设施”,全面服务国家多项重大战略的实施与落地。
云计算是网络强国建设的重要基石。发展云计算产业,有利于我国实现IT全产业链的自主可控,提高信息安全保障水平,并推动大数据、人工智能的发展。
云计算是提升国家治理能力的重要工具。随着大数据、人工智能、物联网等技术应用到智慧城市、智慧政务建设中,国家及各城市的治理水平和服务能力大幅提升,这背后,云计算平台功不可没。
云计算将全面推动国家产业转型升级。云计算将支撑“中国制造2025”“互联网+”战略,全面推动“两化”深度融合。同时,云计算也为创新创业提供了优质土壤,在“双创”领域,云计算已真正成为基础设施。
在DT时代,我认为计算及计算的能力是衡量一个国家科技实力和创新能力的重要标准。只有掌握计算能力,才具备全面支撑创新的基础,才有能力挖掘数据的价值,才能在重塑ICT生态过程中掌握主导权。
接下来的几年,云计算将成为全球科技和产业竞争的焦点。目前,我国的云计算产业具备和发达国家抗衡的能力,而我们对数据的认知、驾驭能力及对资源的利用开发和人力也是与发达国家等同的。因此,我们正处在一个“黄金窗口期”。
媒体评论
---------------------------大数据管理系统原理与技术---------------------------
要进行有效的大数据处理和计算,选择适当的数据库管理系统并对其进行配置、编程和调优是非常关键的环节。在大数据场景下,单一的数据库管理系统无法满足所有类型数据管理的需要,因此大数据相关专业的学生和从业者需要了解不同类型的数据库管理系统,以解决不同场景下的实际问题。本书基于作者多年的教学和工程经验编写而成,旨在帮助读者掌握面向大数据的数据库管理系统的原理和应用方法。
本书特点:
内容上,本书重点介绍面向大数据的数据库管理系统的基本原理、使用方法和案例,涵盖关系数据库、数据仓库、多种NoSQL数据库管理系统等,可以满足不同方向的读者的学习需求。
写作上,本书兼顾深度和广度。针对各类数据库管理系统,在介绍其基本原理的基础上,选取典型和常用的系统作为案例加以介绍。例如,对于关系数据库,除介绍其基本原理,还选取了典型的关系数据库系统MySQL进行介绍;对于数据仓库,选取了基于Hadoop的数据仓库系统Hive进行介绍。此外,还选取了典型的键值数据库、列族数据库、文档数据库和图数据库进行介绍。
数据库管理系统是实践性非常强的课程,本书中提供了大量的实践案例,帮助读者理解各类数据库管理系统的原理,能根据不同的场景应用相关的数据库管理系统解决实际问题。