基本信息
编辑推荐
《大数据处理之道》分析比较了当下流行的大数据处理技术的优劣及适用场景,让读者可以根据自己的需求来选择合适的工具和方案,值得一读。
内容简介
目录
0.1大数据时代 1
0.2数据就是"金库" 3
0.3让大数据"活"起来 4
第1篇Hadoop军营
1 Hadoop一石激起千层浪 7
1.1Hadoop诞生--不仅仅是玩具 7
1.2Hadoop发展--各路英雄集结 8
1.3Hadoop和它的小伙伴们 10
1.4Hadoop应用场景 12
1.5小结 13
2 MapReduce奠定基石 14
2.1MapReduce设计思想 14
2.2MapReduce运行机制 19
2.2.1MapReduce的组成 19
2.2.2MapReduce作业运行流程 20
2.2.3JobTracker解剖 26
2.2.4TaskTracker解剖 34
2.2.5失败场景分析 42
2.3MapReduce实例分析 43
前言
那么,如何把"死"的数据变成真正有效的"资源",成为近年来IT界人士共同思考的问题。一时间,各种大数据处理技术如井喷一般涌现。Hadoop、 Spark、Storm、Dremel、Drill等大数据解决方案争先恐后地展现出来。需要说明的是,这里所有的方案并不是一种技术,而是数种甚至数十种技术的组合。就拿Hadoop来说,Hadoop只是"领头羊",关键成员还有MapReduce、HDFS、Hive、HBase、Pig、ZooKeeper等,大有"八仙过海,各显神通"的气势和场面。
本书首先横向总结性地阐述了各种大数据处理技术,重点从缘起缘落、设计思想、架构原理等角度剖析了各种技术,分析了各种技术的优缺点和适用场景。本书并不涉及软件的安装等,因为如何安装和使用,在网络上搜索即可,着实没有必要浪费读者的时间和金钱。在这一部分,第1篇为Hadoop军营;第2篇为Spark星火燎原;第3篇讲述了其他大数据处理技术,如Storm、Dremel、Drill等。
其次阐述了大数据下的日志分析技术。在大数据时代,日志分析方案呈现出遍地开花的景象。如果将大数据处理系统比作一个可能得病的人,那么日志分析就是负责看病的医生,要想让大数据处理系统健康、平稳地运行,日志分析和监控非常重要。这一部分重点阐述了日志分析技术中如日中天的方案ELK。
最后展望了大数据处理技术的发展趋势。大数据处理技术发展迅猛,数据量越来越大,技术的革新在所难免。
作为大数据研发人员,只有时刻学习新技术,方能立于技术前沿。
由于时间仓促,书中难免出现不足之处,恳请读者指正。本书编写过程中得到了团队其他成员的支持,贡献力量的有张帅、王占伟、李峰、欧立奇等,在此衷心感谢朋友和家人的鼎力支持。
闲言少叙,直接上干货吧!亲爱的读者朋友,请吧……
媒体评论
- IBM产品经理 张帅
目前大数据处理领域比较火爆的技术有Hadoop、Spark、Storm等,到底哪个技术较强?谁会替代谁?此书对这些技术进行了横向对比,分析了各个技术的应用场景,对大数据处理初学者和大数据行业应用人员有很好的指导作用。
- YeahMobi产品架构师 朱杰
大数据处理技术日新月异,从最初的Hadoop到目前广为流行的Spark。在此同时,为了满足不同应用场景的需求,各大IT公司陆续推出不同的大数据处理方案,目前已有数十种大数据处理方案涌现。为此,我们只有不断学习新技术,才能跟上时代的步伐。本书对深入了解大数据处理技术有着很好的参考意义。
- 华为大数据技术构架师 尹青
十年前,有人曾说过,"1世纪什么最贵?"-"人才",深以为然。十年后的今天,大数据的价值越来越明显,堪比石油和黄金。为了应对海量数据处理带来的巨大挑战,全球的计算机精英开发出众多有针对性的先进技术。本书全面介绍了目前大数据处理领域的热门技术的精髓和应用场景,实用性很强。
- 中兴高达产品经理,技术总监 尹尚国
本书内容丰富、结构严谨、语言诙谐,为读者呈现了大数据处理领域各大热门技术的设计思想、应用场景和实例,可帮助大数据初学者快速上手,也可帮助大数据研发人员扩展知识,是大数据处理行业不可多得的书籍。
- 知名IT领军人物 欧立奇