基本信息
- 作者: [爱尔兰]约翰· D.凯莱赫(John D. Kelleher) 布伦丹·蒂尔尼(Brendan Tierney)
- 出版社:机械工业出版社
- ISBN:9787111637264
- 上架时间:2020-5-26
- 出版日期:2019 年10月
- 开本:32开
- 页码:222
- 版次:1-1
- 所属分类:计算机 > 数据库 > 数据库存储与管理

编辑推荐
Data
Science
人人可懂的
数据科学
[ 爱尔兰 ]约翰· D. 凯莱赫(John D. Kelleher)
布伦丹·蒂尔尼 (Brendan Tierney) /著
张世武 黄元勋 /译
深入浅出介绍数据科学基本要素
零基础直观认识数据科学系统
内容简介
作译者
布伦丹·蒂尔尼(Brendan Tierney)是都柏林理工学院计算机科学学院的讲师,同时也是Oracle ACE 主任,还著有多本基于Oracle技术的数据挖掘类著作。
目录
前言
致谢
作者简介
第1章 什么是数据科学 …… 1
1.1 数据科学简史 …… 5
1.1.1 数据收集简史 …… 5
1.1.2 数据分析简史 …… 9
1.1.3 数据科学的产生与发展 …… 14
1.2 数据科学用于何处 …… 20
1.2.1 销售和营销中的数据科学 …… 21
1.2.2 数据科学在政府中的应用 …… 22
1.2.3 数据科学在竞技体育中的应用 …… 23
1.3 为什么是现在 …… 25
1.4 关于数据科学的神话 …… 28
第2章 什么是数据,什么是数据集 …… 31
2.1 关于数据的观点 …… 38
2.2 数据可以积累,而智慧不能 …… 43
2.3 CRISP-DM …… 45
第3章 数据科学生态系统 …… 54
前言
大数据和社交媒体的出现、计算能力的加速、计算机内存成本的大幅降低以及更强大的数据分析和建模方法的发展推动了当代社会对数据科学需求的增长,其中典型的技术有深度学习。这些因素共同作用意味着组织收集、存储和处理数据将比以前简单。与此同时,这些技术创新和数据科学的广泛应用意味着与数据使用和个人隐私相关的道德挑战从未如此迫切。本书的目的是提供数据科学的介绍,涵盖该领域的基本要素,并提供对该领域深刻的原则性见解。
本书第1章介绍了数据科学领域,简要回顾了数据科学的发展演化历史,还探讨了如今数据科学为什么那么重要,以及推动采用数据科学的一些因素。在这一章的最后,回顾并揭穿了与数据科学相关的一些神话。第2章介绍了与数据相关的基本概念,描述了数据科学项目的标准流程:业务理解、数据理解、数据准备、建模、评估和部署。第3章重点介绍了数据基础设施以及大数据和多源数据集成带来的挑战。数据基础设施的一个可能具有挑战性的典型方面是,数据库和数据仓库中的数据通常驻留在与用于数据分析的服务器不同的服务器上。因此,当处理大型数据集时,可能要花费大量时间在数据库或数据仓库所依赖的服务器与进行数据分析和机器学习处理的服务器之间移动数据。第3章首先描述组织中典型的数据科学基础设施,以及在数据科学基础设施中移动大型数据集的挑战的一些新兴解决方案,其中包括使用数据库内置机器学习算法,使用Hadoop进行数据存储和处理,以及混合数据库系统的开发,这些系统无缝地结合了传统的数据库软件和类似Hadoop的解决方案。这一章的最后强调了将整个组织的数据整合到适合机器学习的统一表示中的一些挑战。第4章介绍了机器学习领域,并解释了一些最流行的机器学习算法和模型,包括神经网络、深度学习和决策树模型。第5章聚焦于通过审视一系列标准业务问题,描述了机器学习解决方案如何解决这些问题来将机器学习专业知识与现实问题联系起来。第6章回顾了数据科学的道德含义、数据监管的最新发展,以及在数据科学过程中保护个人隐私的一些新的计算方法。最后,第7章描述了数据科学在不久的将来会产生重大影响的一些领域,并列出了确定数据科学项目是否会成功的一些重要原则。
媒体评论
数据科学是如何发展演化的?
数据科学项目的标准流程是什么?
数据基础设施面临的挑战有哪些?
数据科学与机器学习有什么关系?
在数据科学过程中如何进行数据监管和保护个人隐私?
数据科学项目成功的重要原则是什么?
数据科学的未来影响是什么?
如今,数据科学推动了现代社会几乎所有领域决策的发展,正在影响着人们日常生活的方方面面。本书旨在阐述理解数据科学所需的基本思想和概念,帮助你理解什么是数据科学,它是如何工作的,以及它能(和不能)做什么。