ODPS权威指南 阿里大数据平台应用开发实践
基本信息
编辑推荐
2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录!
交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。
成功创下这项纪录背后,有ODPS很大的功劳!
阿里巴巴集团副总裁刘振飞表示,云计算在今年双11 起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS 完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。
内容简介
计算机书籍
ODPS(Open Data Processing Service)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场。
《ODPS权威指南 阿里大数据平台应用开发实践》是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。全书共13章,主要内容包括:ODPS入门、整体架构、数据通道、MapReduce编程、SQL查询分析、安全,以及基于真实数据的各种场景分析实战。本书基于很多范例解析,通过在各种应用场景下的示例来说明如何通过ODPS完成各种需求,以期引导读者从零开始轻松掌握和使用ODPS。同时,本书不局限于示例分析,也致力于提供更多关于大数据处理的编程思想和经验分享。书中所有示例代码都可以在作者提供的网站上免费下载。
《ODPS权威指南 阿里大数据平台应用开发实践》适合想要了解和使用ODPS的读者阅读学习,对于从事大数据存储和应用以及分布式计算的专业人士来说,也是很好的参考资料。
作译者
目录
前言
第1章 ODPS概述
1.1 引言
1.2 初识ODPS
1.2.1 背景和挑战
1.2.2 为什么做ODPS
1.2.3 ODPS是什么
1.2.4 ODPS做什么
1.3 基本概念
1.3.1 账号(Account)
1.3.2 项目空间(Project)
1.3.3 表(Table)
1.3.4 分区(Partition)
1.3.5 任务(Task)、作业(Job)和作业实例(Instance)
1.3.6 资源(Resource)
1.4 应用开发模式
1.4.1 RESTful API
1.4.2 ODPS SDK
1.4.3 ODPS CLT
媒体评论
——清华大学计算机系 教授、博士生导师 武永卫
ODPS可为企业管理海量数据提供很好的支持,包括海量数据存储、数据仓库构建、数据统计和挖掘、机器学习和商业智能管理等。ODPS将为您低成本地管理海量数据提供安全、正确、稳定的优质服务。本书以用户应用为中心,简明地介绍了ODPS的功能和先进技术,并融入了许多应用案例。该书将带您轻松走进ODPS。
——东北大学信息科学与工程学院 教授、博士生导师 申德荣
云计算大数据是非常宏大的主题,这本书通过示例和原理结合的方式,从读者角度,通过实践可以更容易理解。书中示例涉及网站日志分析、LBS和推荐,这些都是非常主流的领域。我相信读者会喜欢这本书。
——美国斯坦福大学博士、加利福尼亚大学(UC San Diego)终身教授/博导 祝效国 (Kevin Zhu)
本书内容不仅包括ODPS的使用指南和独到的注解,也会对涉及数据处理相关的知识点与工具详加注释。……这本书对深入了解ODPS内核无疑也是很好的敲门砖。
徐常亮
——阿里资深技术专家(ODPS技术负责人)
古语说得好,有容乃大!当“大”数据遇到ODPS这种体量的“容”器,数据变得触手可得。愿这本书为你和ODPS、大数据之间建立起一座桥梁。
——陈鹏宇(不老) 阿里高级数据仓库专家(ODPS骨灰级用户)