基本信息
- 作者: [英]马克·特雷维尔(Mark Treveil),[美]the Dataiku Team
- 译者: 熊峰 温泉 李磊
- 丛书名: O’Reilly精品图书系列
- 出版社:机械工业出版社
- ISBN:9787111710097
- 上架时间:2022-7-22
- 出版日期:2022 年7月
- 开本:16开
- 页码:169
- 版次:1-1
- 所属分类:计算机 > 人工智能 > 综合

内容简介
目录
第一部分 MLOps是什么,为什么要使用MLOps 5
第1章 为什么现在要使用MLOps,使用MLOps面临的挑战 7
1.1 定义MLOps及面临的挑战 8
1.2 使用MLOps以降低风险 11
1.3 大规模的MLOps 14
结语 15
第2章 MLOps的使用人员 16
2.1 行业专家 17
2.2 数据科学家 20
2.3 数据工程师 22
2.4 软件工程师 23
2.5 DevOps团队 23
2.6 模型风险管理者/审计师 24
2.7 机器学习架构师 25
结语 26
第3章 MLOps的主要组成部分 27
3.1 机器学习入门 27
3.2 模型开发 28
3.3 产品化与部署 31
前言
随着各种企业从尝试机器学习到在生产环境中扩展机器学习,其中的困难之一便是维护。企业如何从仅管理单个模型转变为管理几十乃至成百上千个模型呢?这不仅仅是MLOps发挥作用的地方,也是体现上述技术和商业方面复杂性的地方。本书将向读者介绍当前使用MLOps面临的挑战,同时还为开发MLOps功能提供实用的见解和解决方案。
本书适用人群
我们专门为分析人员和IT运营团队经理(即直接面对在生产中扩展机器学习任务的人员)编写了这本书。鉴于MLOps是一个新领域,我们编写了本书,作为创建一个成功的MLOps环境的指南,涵盖了从组织到技术方面的挑战。
本书结构
本书分为三个部分。第一部分(第1~3章)是对MLOps主题的介绍,深入探讨它如何(以及为何)发展成一门学科、需要谁参与才能成功执行MLOps以及需要哪些组成部分。
第二部分(第4~8章)大致介绍了机器学习模型的生命周期,其中包括有关模型开发、生产准备、生产部署、监控和治理的章节。这些章节不仅包括一般的注意事项,还包括MLOps生命周期每个阶段的注意事项,并提供与第3章中所涉及主题相关的更多详细信息。
最后一部分(第9~11章)提供了MLOps在当今公司中的具体示例,以便读者了解MLOps在实践中的设置和含义。尽管公司名称是虚构的,但这些故事是以现实中的公司在MLOps和大规模模型管理方面的经验为基础的。
排版约定
本书中使用以下排版约定:
斜体(Italic)
表示新的术语、URL、电子邮件地址、文件名和文件扩展名。
等宽字体(Constant width)
用于程序清单,以及段落中的程序元素,例如变量名、函数名、数据库、 数据类型、环境变量、语句以及关键字。
等宽粗体(Constant width bold)
表示应由用户直接输入的命令或其他文本。
等宽斜体(Constant width italic)
表示应由用户提供的值或由上下文确定的值替换的文本。
O’Reilly在线学习平台(O’Reilly Online Learning)
40多年来,O’Reilly Media致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。
媒体评论
本书介绍了MLOps的关键概念,以帮助数据科学家和应用工程师操作ML模型来驱动真正的业务变革,并随着时间的推移维护和改进这些模型。以全球众多MLOps应用课程为基础,9位机器学习专家深入探讨了模型生命周期的五个阶段——开发、预生产、部署、监控和治理,揭示了如何将强大的MLOps流程贯穿始终。
本书将帮助你:
? 通过减少整个ML管道和工作流程中的摩擦,实现数据科学的价值。
? 通过重新训练、定期调整和全面重构来优化ML模型,以确保长期准确性。
? 设计MLOps生命周期,以使用公正、公平、可解释的模型将组织风险降至最低。
? 为管道的部署和更复杂、标准化程度更低的外部业务系统实施ML模型。
“如果你正在寻找更好的战略和跨团队的实用ML过程,那么这本书很适合你。”
——Adi Polak
微软高级软件工程师
“本书是在企业中构建、扩展、简化和管理模型部署的优秀指南。”
——Parul Pandey
数据科学布道者,H2O.ai
Mark Treveil设计的产品涉及电信、银行和在线交易等多个领域。他自己的初创公司引领了英国地方政府的治理革命,目前它仍占据主导地位。他现在是Dataiku产品团队的一员。