基本信息
- 作者: [美]桑迪普·乌坦坎达尼(Sandeep Uttamchandani)
- 丛书名: O’Reilly精品图书系列
- 出版社:机械工业出版社
- ISBN:9787111703853
- 上架时间:2022-5-9
- 出版日期:2022 年4月
- 开本:16开
- 页码:227
- 版次:1-1
- 所属分类:计算机 > 数据库 > 数据库存储与管理

内容简介
目录
第1章 数据介绍5
1.1 从原始数据到洞察6
1.2 定义洞察耗时记分卡13
1.3 建立数据自助服务路线图17
第一部分 数据发现自助服务
第2章 元数据目录服务21
2.1 路线图22
2.2 最小化解释耗时23
2.3 定义需求26
2.4 实现模式28
2.5 总结32
第3章 搜索服务33
3.1 路线图33
3.2 最小化搜索耗时34
3.3 定义需求36
3.4 实现模式38
3.5 总结45
第4章 特征存储服务46
4.1 路线图47
前言
本书中使用以下排版约定:
斜体(Italic)
表示新的术语、URL、电子邮件地址、文件名和文件扩展名。
等宽字体(Constant width)
用于程序清单,以及段落中的程序元素,例如变量名、函数名、数据库、数据类型、环境变量、语句以及关键字。
等宽粗体(Constant width bold)
表示应由用户直接输入的命令或其他文本。
等宽斜体(Constant width italic)
表示应由用户提供的值或由上下文确定的值替换的文本。
该图示表示提示或建议。
该图示表示一般性说明。
该图示表示警告或注意。
示例代码
可以从https://oreil.ly/ssdr-book下载补充材料(示例代码、练习、勘误等)。
这里的代码是为了帮助你更好地理解本书的内容。通常,可以在程序或文档中使用本书中的代码,而不需要联系O’Reilly获得许可,除非需要大段地复制代码。例如,使用本书中所提供的几个代码片段来编写一个程序不需要得到我们的许可,但销售或发布O’Reilly的示例代码则需要获得许可。引用本书的示例代码来回答问题也不需要许可,将本书中的很大一部分示例代码放到自己的产品文档中则需要获得许可。
非常欢迎读者使用本书中的代码,希望(但不强制)注明出处。注明出处时包含书名、作者、出版社和ISBN,例如:
The Self-Service Data Roadmap,作者Sandeep Uttamchandani,由O’Reilly出版,书号978-1-492-07525-7
如果读者觉得对示例代码的使用超出了上面所给出的许可范围,欢迎通过permissions@oreilly.com联系我们。
O’Reilly在线学习平台(O’Reilly Online Learning)
媒体评论
通过本书,数据工程师、数据科学家和团队经理将学习如何构建自助数据平台,以帮助组织从数据中提取洞察。作者在书中提供了一个记分卡,用于跟踪并解决在数据发现、转换、处理和生产过程中增加洞察耗时的瓶颈问题。
本书弥合了数据科学家与数据工程师之间的鸿沟——数据科学家被工程现实所束缚,而数据工程师对自助服务的工作方式一无所知。
通过学习本书,你将能够:
构建自助服务门户以支持数据发现、数据质量、数据沿袭和数据治理。
使用开源技术为每个自助服务功能选择合适的方法。
为数据的发现、准备、构建、实施定制自助服务。
实现数据开放与洞察提效的功能。
扩展自助服务门户,从而为组织内的大量用户提供支持。
“ 本书介绍的概念全面,内容丰富,令我印象深刻。本书将极其复杂的问题分解为可解决的问题碎片。”
——Shivnath Babu
Unravel Data Systems的联合
创始人兼首席技术官,
杜克大学计算机科学兼职教授
“ 本书为数据管理从业者提供了全面的概述,值得推荐。”
——Jennifer Yang
数据和风险管理主管
Sandeep Uttamchandani博士是Unravel Data Systems的工程副总裁兼首席数据官。他在构建数据产品以及管理用于分析和机器学习的大型数据平台方面拥有近20年的经验。此前,他是Intuit的QuickBooks产品线的首席数据架构师和数据平台负责人。