基本信息

编辑推荐
---------------------------数据即未来:大数据王者之道---------------------------
数据科学方面的书籍玲琅满目,大多数都在介绍如何使用各种全新的工具和技术,鲜有讨论数据科学中细致入微的解决问题的过程。本书作者结合自己的亲身经历,讲述了数据科学中从项目准备、解决方案构建到项目交付的全部过程,并以案例的形势深入浅出地讲解在开展数据科学项目的过程中可能遇到的各种问题,可以帮助你按图索骥地学会数据科学。本书不会过多地纠结于细节的技术,而是更注重思维方式的梳理,以及对数据科学的深刻洞察,帮助你明晰要解决的问题,并找到实际解决方案。
如果你想了解数据科学,走进数据科学,甚至成为该领域的王者,那么本书将是你的完美参考。
内容简介
经济管理学书籍
---------------------------华为数据之道---------------------------
内容简介
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。
全书共10章,内容从逻辑上分为四个部分。
第一部分(第1~3章)
第1章以非数字原生企业在数字化转型方面面临的挑战开篇,介绍了华为在数据治理和数字化转型方面的目标、愿景、蓝图和框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章详细阐述了不同类型的数据的管理方式和要点。
第二部分(第4~6章)
详细讲解了数据治理工作中的三项重点任务:信息架构、数据底座、数据服务。第4章介绍了信息架构的四个组件,给出了建设原则和核心要素,并引出了业务对象、过程、规则三项数字化的建设方向;第5章提出了数据底座建设的整体框架,介绍了数据湖和数据主题连接两个层次的建设实践;第6章以自助、高效、复用为数据服务的目的,提出了对数据进行搜索、加工和分析的消费过程管理方案。
第三部分(第7~9章)
系统总结了数据治理的三项关键能力:数据的全量感知、综合质量提升、可控共享。第7章以数字孪生的全量、无接触感知为目标,介绍了数据的硬感知和软感知两类能力;第8章基于PDCA框架,介绍了对企业业务数据异常的全面监控;第9章介绍了如何构建以元数据为基础的数据安全隐私保护框架,如何建立动静结合的数据保护与授权管理方案。
第四部分(第10章)
基于对“机器认知世界”的理解,我们提出了对数据治理未来的思考,畅想了AI治理、数据主权和数据生态建设。未来已来,让我们共同努力,把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
---------------------------中台实践:数字化转型方法论与解决方案---------------------------
作译者
---------------------------华为数据之道---------------------------
华为公司数据管理部 著:作者简介
华为公司数据管理部
华为公司数据管理部作为集团层面的数据管理组织,主要负责如下工作:
公司数据工作的战略规划、路标举措以及实施落地;
数据从产生到消费全生命周期管理的治理框架、流程规范、方法和IT工具的制定与推行;
公司级信息架构的设计和数据资产的治理维护;
主持集团层面数据相关项目,推动以数据为核心的数字化转型;
设计公司数据质量度量模型、执行数据质量监控及重大数据问题披露;
组织跨业务领域、跨BG信息架构集成和数据问题的解决;
负责公司数据管理能力提升,推动企业数据文化建立和传播。
---------------------------中台实践:数字化转型方法论与解决方案---------------------------
目录
---------------------------华为数据之道---------------------------
序一
序二
序三
前言
第1章 数据驱动的企业数字化转型
1.1 非数字原生企业的数字化转型挑战2
1.1.1 业态特征:产业链条长、多业态并存3
1.1.2 运营环境:数据交互和共享风险高4
1.1.3 IT建设过程:数据复杂、历史包袱重4
1.1.4 数据质量:数据可信和一致化的要求程度高5
1.2 华为数字化转型与数据治理6
1.2.1 华为数字化转型整体目标6
1.2.2 华为数字化转型蓝图及对数据治理的要求7
1.3 华为数据治理实践9
译者序
---------------------------数据即未来:大数据王者之道---------------------------
汹涌的数字瀑布闪烁着神秘的光彩,密密麻麻地排满了整个屏幕,作为影史经典之作《黑客帝国》的片头,这一幕早已深入人心。而正如这一片头所显示的,今天的世界已然变成了一个数据的世界。阿里研究院甚至提出了从IT(信息科技)转向DT(数据科学)的战略方向。大数据(Big Data)也和人工智能(AI)、云计算(Cloud Computing)、区块链(DLT,分布式记账技术)合称为了ABCD四大新锐技术。
为什么会产生数据科学呢?首先,随着社会的发展,人类的社会实践、生产实践和科学实验产生了大量的数据。近年来,由于移动互联网的快速发展,数据产生的速度也随之激增。技术的进步,也使得数据的记录和整理变得越来越便利。在这一背景下,数据的海量增加使得人们对于数据采集、清洗、过滤、分析、建模和表达的需求也越来越殷切。人们的聚焦点也从如何生产、收集和管理数据,转向如何更好地建立模型和分析数据。由此,数据科学应运而生。
其实,如今在互联网行业里,也有很多从事与数据相关工作的人,包括最基础的数据库管理员(DBA)、维护大数据技术基础(Hadoop/Spark)的系统管理员、研发分布式数据处理程序的程序员、从事数据结构分析与管理的数据架构师、聚焦数据建模的工程师以及负责以可视化手段展示数据的工程师等等。虽然这些人的工作都与数据相关,其中有些人是数据的搬运工,有些人是数据的处理工,有些人是数据库的管理员,但是他们都不能称为数据领域的王者。这就像铁匠每天都在与铁打交道,但是我们从来不把铁匠称为金属学家;农民每天都在和土地打交道,但是我们从来不把农民称为土壤学家,我们每个人天天都在做各种计算,但是我们从来不把自己称为数学家。
那么,在数据的王国里,究竟谁是数据之王?我认为只有那些真正掌握数据科学项目的过程,知道如何探索数据、深入分析数据、用数据解决现实中问题的人才是数据世界里真正的王者,即数据科学家。
那么,如何从搬砖的数据民工变成一个指点江山的数据科学家呢?这需要行业的积淀,个人的努力,还有科学的指导。
本书作者布瑞恩·戈德西结合自己的亲身经历,讲述了数据科学中从项目准备、解决方案构建到项目交付的全部过程,系统地论述了数据科学的完整过程。特别是作者结合自己的成长过程以及工作经历,以案例的形式深入浅出地讲解了在开展数据科学项目的过程中可能遇到的各种问题,使本书成为有志于从事数据科学相关工作的初学者的极佳入门指南,并且对已经拥有数据科学项目经验的人来说,本书也非常实用和有借鉴价值。
数据科学作为一门独立的科学仅仅是近两三年的事情,因此,这个领域是神秘的,令人向往的,这里充满了荆棘,也蕴含着无数的机会,需要大批有志从事数据科学探索的人加入其中。如果你也想了解数据科学,走进数据科学,甚至成为该领域的王者,那么本书将是你最好的敲门砖。
陈斌
2017年11月
前言
---------------------------华为数据之道---------------------------
随着数字化转型的深入开展,数据成为新的生产要素。对于非数字原生企业,数据治理的重要性越来越突出。如何有效地开展数据治理工作、提升数据质量、打破数据孤岛、充分发挥数据的业务价值,成了业界的热门话题。本书基于华为数据治理的历程,介绍了华为数据工作的愿景、整体思路框架,阐述了企业级数据综合治理体系和方法论,回顾了华为数据底座的建设过程,总结了华为数据治理和数字化转型的经验。
华为公司作为典型的非数字原生企业,发展初期基本是以物理世界为中心构建的,缺乏以软件和数字平台为核心的数字世界架构,在数字化转型过程中,面临着巨大挑战。华为从小到大、从弱到强几十年不断发展的历程中,伴随着一次次重大业务变革、信息化建设和数字化转型。本书理论结合实践,通过对华为公司数据治理体系和数据底座建设方法与实践的介绍,讲述了数据工作如何支撑业务变革,如何驱动数字化转型,总结了华为数据工作的发展历程、经验和对未来的思考。书中所述的方法、规范、解决方案都经过华为内部的充分实践,相信对企业数字化转型的领导者、设计者、实施者和参与数据治理的同行,会有一定的启发和借鉴意义。
内容简介
本书共10章,内容从逻辑上可以分为四部分。
第一部分为第1~3章。第1章以非数字原生企业在数字化转型时面临的挑战为引导,阐述了数据驱动的企业数字化转型理念,介绍了华为公司的数据治理框架;第2章从企业政策和架构协同的角度,介绍了企业级的数据综合治理体系,理顺了数据与变革、运营、IT之间的协同关系,明确了数据管理的责任主体在业务;第3章以数据特性的差异为维度,详细阐述了不同类型数据的不同管理方式,明确了结构化数据、非结构化数据、外部数据、元数据的核心管理要点。
第二部分为第4~6章,介绍了数据治理工作中的三项重点建设任务:信息架构、数据底座、数据服务。第4章介绍了信息架构的四个组件,给出了建设原则和核心要素,并引出了业务对象、过程、规则三项数字化的建设方向;第5章提出了数据底座建设的整体框架,分别介绍了数据湖和数据主题联接两个层次的建设实践;第6章以自助、高效、复用为数据服务的目的,提出了对数据进行搜索、加工和分析的消费过程管理方案。
第三部分为第7~9章,介绍了数据治理的三项关键能力:数据的全量感知、综合质量提升、可控共享。第7章以数字孪生的全量、无接触感知为目标,介绍了数据的硬感知和软感知两类能力;第8章基于PDCA框架,介绍了对企业业务数据异常的全面监控,从而助力数据质量综合水平的提升;第9章介绍如何构建以元数据为基础的数据安全隐私保护框架,如何建立动静结合的数据保护与授权管理方案。
第四部分为第10章。基于对“机器认知世界”的理解,我们提出了对数据治理未来的思考,畅想了AI治理、数据主权和数据生态建设。未来已来,让我们共同努力,把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
读者对象
企业管理者:CEO,CIO,CDO,数字化转型项目的领导者、设计者和实施者。
数据从业人员:数据架构师、数据工程师、数据质量工程师、数据产品经理、数据分析师。
IT从业人员:应用架构师、数据库专家、业务架构师。
致谢
本书主要作者有马运(Yun Ma)、杜浩、王强、陈实和周剑锋。参与写作的还有公司数据管理部的专家韦冬、廖华赟、赵子文、傅琨等。各位作者在数据领域耕耘和坚持多年。
序言
---------------------------数据即未来:大数据王者之道---------------------------
中文版序一
大数据与太极相生新科学范式
正当我国大力推动实施大数据战略、加快建设数字中国之际,《数据即未来:大数据王者之道》一书的出版发行,对于培育造就一批大数据领军企业,进行大数据人才队伍培养的前瞻性布局,具有十分积极的意义。
本书作者布瑞恩提出“数据科学家专注于创建依赖于数据和结果的概率陈述系统”;“软件研发人员和数据科学家的系统,可以分别与数学概念的‘逻辑’和概率类比”;“‘若A则可能B’这样的概率语句并没有那么简单”等思想以及书中所介绍的具体的数据科学方法,颠覆了预先假设,用过去推断将来的重复性实验,以及具有可逆性、确定性的传统科学范式。
本书强调了“数据科学是指导数据项目开展和决策的一系列过程和概念”;大数据项目的路线图重要的是“面向过程、与客户互动提出问题”。当今,社会与科学技术飞速发展,突出了对一切事物发展的数据分析都要重视时间思维,聚焦到事物发展的关键时空点上。本书以科学的流程分析,展开大数据项目应该如何实现产品或服务的再造。
布瑞恩的上述思想与中国的太极和道德经一表一里互补的哲学思想有着很大的相似性。道德经阐述“道生一,一生二,二生三,三生万物”。道生一,一是阴;一生二,二是不一的阳;二生三,三是一不一的和,是太极;三生万物,是指一切存在物都是由阴、阳、和三态构成的,“一不一同一”的机理生成了宇宙的一切。1964 年美国科学家盖尔曼提出中子、质子这一类强子是由三个更基本的单元夸克构成的,验证了道德经中《三生万物》的物理存在原理。
本书阐明了软件与软件研发人员、数据与数据科学家、专业知识与专业人员对应的基本三要素之间的关系。起主导作用的数据科学家用大数据在概率世界中探索、研究客观对象得到相对确定的整体结构的序参数和发展态势,从而更准确地把握了事物的发展规律。参看本文插图中勾股定理的两次迭代运算,可以深刻地理解大数据是太极或和,它能够不断发现或发明新的算法或模式,将人类从阳的已知“有理世界”带入一个阴的未知“无理世界”,显然,这是科学方法论的一次伟大的变革。
道德经说“道可道也,非恒道也”。宇宙的基本规律是不规律,是规律与不规律的同一。热力学第二定律的熵增表述的是有序从无序中产生;而牛顿第三定律相互作用表明一切存在只要因相互作用而链接,它们就共存于同一个世界,存在着同一共性即“一不一同一”。以往的科学范式是基于牛顿机械力学的二元逻辑,大数据科学方法论是基于阴、阳、和(太极)的三元逻辑,这同样也是对科学范式的一项重要创新。
从2016年6月至今,本书译者陈斌为大力推广大数据,不仅在全国多处留下了他宣传演讲大数据的足迹,而且还在此期间完成了《架构即未来》《架构真经》《数据即未来:大数据王者之道》三本译作。他这种艰苦奋斗、坚持不懈的奉献精神感人至深、令人钦佩。
余晓芒,中国联通前副总裁,中国信息大学校长
中文版序二
大数据在我们这个时代的重要性愈渐凸显,大数据战略也已然高屋建瓴地提到了国家层面。2017年12月,中共中央总书记习近平在主持就实施国家大数据战略第二次集体学习时发表了讲话,习总书记强调,要坚持数据开放、市场主导,以数据为纽带促进产学研深度融合,形成数据驱动型创新体系和发展模式,培育造就一批大数据领军企业,打造多层次、多类型的大数据人才队伍。
身处滚滚洪流奔腾向前的商业时代,我们切身地感受到大数据发展的欣欣向荣。不过,恰如这本《数据即未来:大数据王者之道》所说,数据科学仍然是一个新领域,虽然它的组成部分:比如统计学、软件研发、基于证据解决问题等,都是我们非常熟悉的传统领域,但数据科学却不能简单地等同于数据库架构与管理、大数据工程、机器学习或者高性能计算。作者布瑞恩·戈德西认为,数据科学的核心在于数据内容之间的相互作用,给定项目的目标以及实现这些目标的数据分析方法。所以本书并不是要老生常谈地讲述数据库软件或者统计学方法,尽管在谈到数据科学时会不可避免地提及这些内容,但它的核心仍在于将科学方法应用于数据集从而实现项目的目标。
所以,本书并不是一本简单的操作手册,而是让你可以按图索骥地学会数据科学。确切地说,它更适合中高层的数据科学家,帮助他们明晰要解决的问题,并找到问题解决的策略。本书不会过多纠结于细节的战术,而是更注重思维方式的梳理,以及对数据科学的深刻洞察。这就是译者易宝CTO陈斌把它翻译为《数据即未来:大数据王者之道》的原因,这个名字昭示了数据科学的重要性,以及本书的读者在数据之路上不断追求,力争上游的雄心。
媒体评论
---------------------------华为数据之道---------------------------
数字经济的根本特征是高度数据化,数据成为新生产要素和企业的核心竞争力。谁拥有数据,谁就拥有未来。但数据又必须是真实的、准确的、规范的、及时的,否则海量的数据又会成为企业负担。本书是在充分的数据治理实践基础上提炼而成的,具有可操作的方法论,其对于数据底座、数据质量、数据感知、数据服务、数据共享等的描述,相信对于企业数据工作者而言是一副非常对症的、有益的良药。
——王继业国家电网大数据中心主任
党的十九届四中全会聚焦国家治理体系和治理能力现代化,提出了推进数字政府建设的重大任务。数据整合共享同样也是政府数字化转型的重要基础。数据管理是专业性很强的领域,既需要实践探索,也需要理论和方法的指导。本书是华为多年数据工作的结晶,相信本书的出版,能够为政府数据工作的同人,带来有益的借鉴和参考。
——徐春学国家信息中心公共技术服务部副主任
在企业数字化转型过程中,数据管理是最重要、最基础也是最困难的工作。数据管理涉及组织战略、治理、文化、业务和专业人才各个方面,无法以直接外购的方式获得,要求企业必须一步一个脚印地完成,其中涉及数据治理、数据分类、体系框架、数据采集、数据集成、数据可视化和数据分析及服务等多个环节。我在华为调研的过程中,深切感受到其数据管理部门的专业化领导和团队、坚实的组织推进能力和脚踏实地的工作作风,因此,他们的这本书对企业极具参考价值,强力推荐。
——董小英北京大学光华管理学院荣休教授
《变数:中国数字企业模型与实践》作者/数字产业创新研究中心主席
当前中国走在前列的企业基本都已经开始数字化转型,影响企业数字化转型能否取得预期目标的关键因素是数据。一个企业能够掌握的内外部数据量的多少、数据的质量、数据的有效拉通、数据的价值挖掘、数据驱动战略与运营等都是数字化转型的核心环节。此书全面阐述了数字化转型时期企业数据治理的全对象、全流程、全要素,包含了华为公司的很多实践,对数据治理从业者来说非常值得一读,强烈推荐给大家。
——辛海明北汽福田集团IT总监
---------------------------中台实践:数字化转型方法论与解决方案---------------------------