(特价书)增强型分析:AI驱动的数据分析、业务决策与案例实践
从技术和业务双重维度讲解如何利用前沿的大数据和AI技术实现智能数据分析与业务决策
基本信息
- 作者: 彭鸿涛 张宗耀 聂磊
- 丛书名: 数据分析与决策技术丛书
- 出版社:机械工业出版社
- ISBN:9787111634164
- 上架时间:2020-1-7
- 出版日期:2019 年8月
- 开本:16开
- 页码:274
- 版次:1-1
- 所属分类:计算机 > 数据库 > 数据库存储与管理

编辑推荐
Augmented Analytics
AI Driven Data Analytics, Business Decisions and Case Practice
增强型分析
AI驱动的数据分析、业务决策与案例实践
彭鸿涛 张宗耀 聂磊 ◎ 著
德勤首席数据科学家、前华为资深数据科学家、
前IBM资深数据科学家联合撰写
从技术和业务双重维度讲解如何利用前沿的大数据和AI技术实现智能数据分析与业务决策
内容简介
计算机书籍
内容简介
增强型分析是数据科学的未来,本书讲解了如何通过前沿的大数据技术和AI技术实现智能的数据分析和业务决策,即增强型分析。
本书的三位作者是来自德勤、前华为和前IBM的资深数据科学家,在大数据和AI领域至少都有10年以上的工作经验,他们将各自多年来在“构建数据挖掘模型,解决实际业务问题”方面积累的经验全部总结在了这本书中。
全书的内容由两条主线贯穿:
技术主线:一方面讲解了预测模型、序列分析、预测分析、Prescriptive分析等前沿数据处理技术,一方面讲解了CNN、RNN和GNN等前沿的AI技术如何为数据分析赋能。
业务主线:在数字化转型的大时代背景下,如何通过数据分析实现智慧营销、智慧风险管控,实现由初级的“主动营销”到“被动营销”,再到“全渠道协同营销”等营销手段的升级应用。
本书的重点聚焦在本质内容上,即数据处理、算法及模型、“模型洞见到业务决策”的分析等。
全书共8章:
第1章:作者结合自己的从业经验介绍了数据科学家的职业生涯发展、工作模式和工作方法要点等内容,为有志成为数据科学家的读者指明了道路和方向;
第2章:从描述性分析的角度讲解了数据探索、数据预处理衍生指标加工方面的技巧;
第3章:介绍了预测类模型构建时的新方法、新思路、新工具;
第4章:讲解了序列分析的相关内容,包括序列模式、序列规则、序列预测等的挖掘与应用,用实例的方式说明了算法的原理、特点和使用技巧;
第5章:介绍了人工智能下一个阶段的重点领域,即如何应用数据分析做出最优决策;
第6~8章:通过与传统模型的对比,介绍了CNN、RNN、GNN等算法的原理,通过大量的实例说明了这些AI技术在数据分析与决策领域的用法和实际效果。
作译者
彭鸿涛
德勤企业咨询总监兼首席数据科学家,德勤全球AI团队核心成员,德勤数字化转型、智慧营销、智慧风控、客户体验等核心咨询服务方案的资深顾问。
2008年加入SPSS并与跨国家团队一起进行Analytical Decision Management决策自动化工具的开发,与国内外团队一起构建了SPSS在不同应用领域的解决方案,其中某些方案现已成长为IBM的知名解决方案;2014年加入IBM GBSC部门,领导数据分析团队,针对不同客户设计和实施数据分析的方案;2016年加入IBM GBS GBS Cognitive Business Decision Support担任CTO和首席数据科学家,领导团队开发实施了有一定行业影响力的人工智能应用;2017年加入德勤企业咨询担任金融服务总监及首席数据科学家,领导团队开拓数字化转型背景下的新型咨询服务方案,期间高质量交付大型银行的数字化转型及实施相关项目并得到客户高度认可。
张宗耀
上海全应科技有限公司资深数据科学家,前华为企业智能部门资深数据科学家,前IBM SPSS 算法组件团队资深算法工程师。
2009年加入IBM SPSS算法组件团队,负责Statistic和Modeler产品的升级和维护;2012年开始大数据算法组件的设计和开发,为分布式分析引擎提供了核心计算单元,主导完成开发了分布式平台下的广义线性模型、自动建模算法、ADMM优化算法等,打造了分析引擎平台以及SPSS Modeler产品的最具竞争力算法模块;2015年开始投入Spark分布式框架的算法设计和开发,主导完成开发了生存分析算法、时间序列相关算法等,丰富了SPSS产品的核心算法组件。2016年加入华为,先后就职于华为的数据挖掘团队,以及企业智能部门的机器学习服务团队和工业解决方案团队,负责算法、机器学习、实时预测、数据分析,以及行业解决方案的设计、开发和部署相关的工作。
聂磊
陕西万禾数字科技有限公司CTO,前IBM SPSS 资深数据科学家,前IBM Watson Analytics数据分析引擎技术主管及架构师。
2008 年加入IBM Analytical Decision Management团队,主导开发了业务规则引擎和基于优化技术的预测性维护解决方案;2014年加入IBM Watson Analytics团队,担任技术主管兼架构师,主导了IBM Watson Analytics数据分析引擎基于Spark技术的转换,极大提高了平台的计算能力;2017年担任IBM Cognos Analytics团队架构师,主持了自动化技术的引入。
目录
推荐序二
前言
第1章 数据科学家的成长之路 1
1.1 算法与数据科学家 1
1.1.1 数据科学、人工智能、机器学习等 2
1.1.2 室内活动还是室外活动 3
1.2 数据科学家不断成长的几个阶段 3
1.2.1 算法——如何构建数据分析模型 5
1.2.2 用法——如何回头看模型 6
1.2.3 业务——如何产生更大价值 7
1.2.4 战略——如何更广 8
1.3 数据科学家的工作模式与组织结构 9
1.3.1 数据驱动还是业务驱动 9
1.3.2 数据科学家团队的组织结构 9
1.4 数据科学家的工作方法要点 10
第2章 大数据探索及预处理 13
2.1 大数据探索 13
2.1.1 数值类型 13
2.1.2 连续型数据的探索 14
前言
增强型分析将会长足发展
多年以来,人们在构建模型时总是要花费大量的时间和精力在准备数据、数据预处理、多次尝试构建模型、模型验证等过程上。在工业发展的历程中,纯手工打造的时代势必要被标准化流水线的工厂取代,因为工序分解后可以按照统一的模式来处理。构造模型的过程也可以从纯手工打造时代发展为一个更加智能化的时代。笔者十年前在SPSS任职时,就深度参与了自动化建模相关组件的开发,即同一个模型可以按照不同的算法来实现并通过同一个评价指标筛选出最优模型。这样的功能在现在的开源算法库(如sklearn)中已经非常常见。最近AutoML、H2O等知名开源平台使得自动化建模又有了长足的发展。然而建模自动化并不是终点。
增强型分析(Augmented Analytics)于Gartner在2017年7月发表的《增强型分析是数据及分析的未来》报告中首次进入人们的视野。其核心的概念包括:
智慧数据洞察(Smart Data Discovery)。应用相关的工具能够比较智能和自动化地实现数据收集、准备、集成、分析、建模,能够输出各种洞察,可以为人们在战略方向、对应具体范围的战术活动(如针对某市场机会发起营销)、执行(具体执行营销策略)等不同层面的活动提供指导,包括相关关系的发现、模式识别、趋势判断与预测、决策建议等。
增强型数据准备(Augmented Data Preparation)。提供智能化的工具使得业务人员能够快速、轻松地访问数据,并连接各种数据源通过统一的、标准化的、可交互的视图展现内容、数据间的关系等。同时提供丰富的工具进行自动数据归约、清洗、智能化分箱、降噪等功能。增强型数据要能够在原数据和经过数据治理后的数据间灵活处理,尽量避免因为数据治理而丢失信息,同时也避免在大量原数据间进行无序的探索。
从上述的定义中可以看出,增强型分析的特点是其可以智能和自动地完成数据准备和数据分析的工作。对于增强型分析的一个美好的预期就是“交给机器大量的原数据,机器直接针对特定场景给出决策建议”。要实现这个愿景需要人们至少完成如下的几个要点。
(1)大数据存储与访问
基于大数据平台的存储、计算的相关技术发展很快,目前已经比较成熟,能够高效地处理大量数据。
(2)数据分析流程的组件化、标准化改造
数据分析过程中关键步骤如数据收集、准备、集成、分析、建模等过程,需要细分为不同的子任务,并通过子任务间的灵活搭配构成数据分析的流程。流程的自动化运行以及对应的有价值的结果输出已经有了较好的组件,如H2O等。
(3)提供大量的算法支持数据处理、模型构建
算法既可以用来构建业务模型,也可以用来分析数据间的关系、进行变量聚类等工作。
(4)将“模型洞见到业务决策”纳入分析范围
模型输出洞见,如模型输出每一个客户的购买可能性,还需要配套如“当购买可能性大于90%时再根据时机因素进行推荐”的业务决策,才能在实际营销活动中实施。这是一个“洞见—决策—行动”的过程。
实现增强型分析所需的技术势必是庞杂的,本书的重点涵盖范围是数据处理、算法及模型、“模型洞见到业务决策”的分析等内容。这些内容既是我们日常建模时要用到的技术,也是增强型分析中必不可少的内容。虽然增强型分析的表现形式是追求智能化、自动化等功能,但是增强型分析的终极目标还是通过数据分析发挥数据价值。目前增强型分析还处于概念在逐步清晰但需要不断发展的阶段,所以本书的重点是聚焦在其本质内容,即数据处理、算法及模型、“模型洞见到业务决策”的分析等内容。
本书特点
应用机器学习、人工智能技术不仅需要理解算法原理,还需要对算法参数调优、算法使用时的数据要求、算法输出结果,以及如何在具体业务场景使用数据挖掘模型等方面都有所了解,这样才能真正发挥数据价值,产生实际的业务效果。
本书作者结合多年来给不同的大型机构“构建数据挖掘模型、解决实际业务问题”的实践,总结归纳技术、应用等方面的经验,以“介绍较新机器学习及人工智能技术”和“如何应用这些技术解决实际问题”两个方面作为本书的整体选题思路。总体来讲,本书具有如下两个主要特点。
(1)介绍较新的技术
媒体评论
——吴卫军 德勤中国副主席
鸿涛和宗耀都是我的学生,是我们西安交大毕业的非常出色的学生。他们这次付出了巨大的努力完成了这本书,并得到了出版社的很高评价,祝贺他们。“路漫漫其修远兮”,我期望他们能够在工作中继续前行,努力创造出新的天地,到达新的高度!
——朱利 教授 西安交通大学软件学院副院长
增强型分析是数据分析与决策的未来发展方向,大数据技术和AI技术已经成为智能数据分析与决策的底层驱动力,这本书非常有前瞻性,它结合规范性分析等最新的大数据技术和CNN等最新的AI技术讲解了如何进行增强分析。
——江敏 数澜科技CTO/《数据中台》作者
增强型分析的本质就是将AI技术应用到数据处理与分析的各个环节,最终实现智能决策,是数据分析未来的必然发展趋势。这本书从技术和业务两个维度讲解了增强型分析的一些新技术和核心技术,以及如何通过增强型分析解决营销等方面的业务问题,包含大量案例,实用性非常强。
——张良均 资深大数据专家/畅销书《Python数据分析与挖掘实战》作者
本书中提到的“交给机器大量的原数据,机器直接针对特定场景给出决策建议”正是我多年来孜孜追寻的最终应用方式;另外,增强型分析的描述性分析、预测性分析、Prescriptive 分析的递进式工作脉络也是我认为行之有效的工作方法,因为这种方式应用价值高、业务落地性强!这本书在数据分析工作上立意高、格局大、视野广,兼顾技术和业务两条线,是一本不可多得的能帮助数据工作人员进阶提升甚至实现质的飞跃的好书!
——宋天龙 触脉咨询合作人兼副总裁/畅销书《Python数据分析与数据化运营》作者