基本信息

编辑推荐
这是一本深入介绍HBase系统的书籍,由HBasePMC成员与网易资深工程师倾力打造,多位技术专家联袂推荐。本书不仅用大量图片详细解剖HBase内核,还用案例展示了HBase的开发运维技巧,是一本不可能多得的高质量图书,值得每一位大数据开发运维人员放在案头深读。
内容简介
作译者
范欣欣现就职于网易杭州研究院数据科学中心,负责HBase以及分布式时序数据库的内核开发运维工作,对HBase的底层工作原理进行了长时间的探索和深入研究,撰写了大量有关HBase和时序数据库相关的技术文章,深受读者好评。此外,对大数据生态以及数据仓库也有深刻而独到的理解。
目录
第1章HBase概述
1.1HBase 前生今世
1.2HBase数据模型
1.2.1逻辑视图
1.2.2多维稀疏排序Map
1.2.3物理视图
1.2.4行式存储、列式存储、列簇式存储
1.3HBase体系结构
1.4 HBase系统特性
第2章基础数据结构与算法
2.1 跳跃表
2.2 LSM树
2.3 布隆过滤器
2.4 设计KV存储引擎Minibase
2.5拓展阅读
第3章HBase依赖服务
3.1ZooKeeper简介
3.2HDFS简介
3.4拓展阅读
前言
Apache HBase是基于Apache Hadoop构建的一个高可用、高性能、多版本的分布式NoSQL数据库,是Google BigTable的开源实现,通过在廉价服务器上搭建起大规模结构化存储集群,提供海量数据高性能的随机读写能力。
HBase项目自2006年提交第一行代码以来,直到如今,经历了13年的蓬勃发展。现在已经有大量企业采用HBase来存储和分析自身飞速增长的业务数据。从全球范围来看,国内HBase的关注度更是高居榜首,这得益于国内互联网、移动互联网、物联网等方向庞大的数据体量。诸多国内大型科技公司,如阿里巴巴、小米、腾讯、网易、华为、滴滴、快手、中国移动等等都已经把HBase作为极重要的基础依赖,很多公司对HBase社区也有长期的投入。截止到目前为止,HBase全球社区已经拥有了74位HBase Committer,而国内就有20位左右的Committer,占了近1/3的比例。近一两年,HBase在国内更是得到了长足的发展,2018年中国HBase技术社区成立,一年时间里社区在多个城市相继组织了9次线下技术沙龙活动,为HBase更好地在国内各公司茁壮成长做出了卓越的贡献。
然而,和社区用户多次交流后发现,他们都希望我们能推荐一本HBase的书。当前市面上有关HBase的书籍大部分都集中于如何使用HBase,例如HBase集群部署、客户端API以及协处理器等。诚然,这对快速掌握和使用HBase非常有好处,但是许多HBase使用者并不满足于此,他们更希望能了解和掌握其内部运行原理。因此,当机械工业出版社的编辑吴怡老师,联系到我们是否有想法为HBase写一本书时,我们毫不犹豫地就答应了。
本书会从设计的角度对HBase的整个体系架构和各核心组件进行系统的分析和讲解。与此同时,还会介绍常用的性能调优策略以及问题诊断的方法和技巧,帮助读者更好的在实际生产环境实践。另外,本书最后章节会集中介绍HBase 2.x版本的核心特性,例如Procedure v2、In Memory Compactions以及MOB等。
读者对象
本书不是一本教你如何部署HBase集群、使用HBase客户端API进行读写操作的书,本书面向那些使用HBase作为数据库后端存储的应用程序开发者、有一定经验的运维人员和对HBase内核设计感兴趣的技术极客。
如果你想深入了解HBase的每个组件是如何工作的,如果你想更好地运维或者调优你的HBase集群,如果你想了解HBase 2.x版本的核心特性,就请阅读本书。想要更好的学习本书,需要具备如下条件:
了解HBase的基本操作
了解C、Java等高级语言
对一些基本算法有所了解,因为本书会从源代码层面分析HBase的工作机制,如果你能了解这些算法,会对你的理解非常有帮助
如何阅读本书
本书有16个章节,分为6个主要部分:
第一部分:HBase基础部分,包含1、2章节。其中第1章主要介绍HBase系统的发展历史、数据模型以及体系结构,第1章节主要介绍HBase系统中常用的数据结构以及基础算法。
媒体评论
----张铎HBase项目主席,HBase PMC成员,小米存储团队负责人
HBase作为Google BigTable的*开源实现,已经有十多年的历史了,目前依然在国内众多互联网公司和传统公司内应用广泛,颇有种“老当益壮”的风范。但长期以来,深入解析HBase的技术书籍比较匮乏,相信很多人都是靠着多年前的《HBase权威指南》和本书作者范欣欣的博客来入门HBase的,本书算是终于填补了这块空白,不仅有对HBase经典基础知识的详细讲解,也有对HBase 2.0版本新功能的介绍,十分全面,值得所有HBase相关从业者和爱好者入手学习。
----张洸豪HBase PMC成员,小米HBase团队负责人对于之前中文图书界的各种源码和系统解析类图书,我一直都不是很推荐。因为开源项目迭代的速度非常快,等书真正出版,里面的很多内容已经过时了。而本书避开了单纯解读源码,从原理出发对HBase进行讲解,可以做到常看常新,不会轻易过时,自然对于HBase相关从业者和爱好者是不可多得的好书。同时,本书不仅介绍分布式存储系统各种设计原理,而且还介绍在关键设计上如何取舍,对于所有对分布式存储感兴趣的读者,本书也是不可多得的优秀书籍。
----张铎HBase项目主席,HBase PMC成员,小米存储团队负责人
HBase作为Google BigTable的*开源实现,已经有十多年的历史了,目前依然在国内众多互联网公司和传统公司内应用广泛,颇有种“老当益壮”的风范。但长期以来,深入解析HBase的技术书籍比较匮乏,相信很多人都是靠着多年前的《HBase权威指南》和本书作者范欣欣的博客来入门HBase的,本书算是终于填补了这块空白,不仅有对HBase经典基础知识的详细讲解,也有对HBase 2.0版本新功能的介绍,十分全面,值得所有HBase相关从业者和爱好者入手学习。
----张洸豪HBase PMC成员,小米HBase团队负责人
HBase系统涉及分布式理论、存储、大数据处理等技术,铺开来写都可单独成书,所以深入掌握HBase难度极大。两位作者同为HBase知名专家,解决过大量疑难杂症,为社区贡献过大量代码,剖析HBase原理能做到深入浅出,更难得的是将相关原理融汇贯通,以运维调优*实践的方式呈现给我们。本书理论性和实操性俱佳,必须入手一读。
----余利华网易数据科学中心部门总监
目前在开源社区,能被市场广泛接受的分布式持久化KV存储系统不多,HBase就是其中一款优秀产品。Apache社区开放的生态环境,也使HBase得到了健康的发展,全球各数据库大会和大数据会议上,可以频繁地见到HBase的身影。从HBase整个生态链上来看,我们也可以发现像Phoenix、Omid等各种不同框架都可以建立在HBase之上,用来实现业务在SQL和事务上的不同需求。在网易内部,HBase从*初支持单一的日志存储,发展成为同时支撑各业务部门的上百个不同业务。基于HBase SSD的存储系统,在实时推荐、实时风控等场景下都得到了很好的应用,对于一般化的场景则更多,例如日志存储、订单存储、用户画像等等。希望本书能帮助读者更深入、系统地了解HBase。
----蒋鸿翔网易大数据和数据库内核团队负责人