基本信息
- 作者: Wil van der Aalst
- 译者: 王建民 闻立杰
- 丛书名: 世界著名计算机教材精选
- 出版社:清华大学出版社
- ISBN:9787302350859
- 上架时间:2014-6-24
- 出版日期:2014 年6月
- 开本:16开
- 页码:271
- 版次:1-1
- 所属分类:计算机 > 计算机科学理论与基础知识 > 计算理论 > 算法
内容简介
计算机书籍
《 过程挖掘:业务过程的发现、合规和改进》是过程挖掘领域的首部著作,全面讲述了过程挖掘基本概念、相关理论、核心算法、应用框架和典型案例。
《 过程挖掘:业务过程的发现、合规和改进》共14章,分为五个部分。第1章为引言,阐述了数据爆炸对过程管理的挑战,进而阐述了过程挖掘的基本概念;第一部分(第2章和第3章)阐述了过程建模与分析,以及数据挖掘的基本知识;第二部分(第4~6章)介绍了事件日志抽取方法,α系列挖掘算法,启发式挖掘算法、遗传挖掘算法和基于区域的挖掘算法;第三部分(第7~9章)介绍了一致性检查技术,数据,资源维度挖掘,以及在线运作支持技术,第四部分(第10~12章)介绍了过程挖掘工具,过程挖掘项目框架,以及结构化(“宽面条”)/非结构化(“意大利面”)过程挖掘方法及其典型案例;第五部分(第13~14章)分析了制图与导航领域的理念与进展,展望了过程挖掘的美好前景。
《 过程挖掘:业务过程的发现、合规和改进》可以作为信息系统、软件工程或数据管理专业研究生或高年级本科生教材,也可以作为业务过程管理(BPM)或商务智能(BI)领域从业者的参考手册。
作译者
目录
1.1 数据爆炸 1
1.2 建模的局限性 2
1.3 过程挖掘 6
1.4 分析一个示例日志 9
1.5 Play-In、Play-Out与Replay 14
1.6 趋势 16
1.7 展望 18
第一部分 预 备 知 识
第2章 过程建模与分析 23
2.1 建模的艺术 23
2.2 过程模型 24
2.2.1 变迁系统 25
2.2.2 Petri网 26
2.2.3 工作流网 30
2.2.4 YAWL 31
2.2.5 BPMN 33
2.2.6 事件驱动过程链 35
2.2.7 因果网 36
2.3 基于模型的过程分析 41
译者序
正如IEEE过程挖掘工作组在《过程挖掘宣言》中指出的:过程挖掘技术能够从现代信息系统普遍产生的事件日志中抽取过程知识,为相关领域应用中的过程发现、监测和改进提供了新的手段。
过程挖掘思想1995年起源于软件工程领域,1998年被引入业务过程管理领域,是一个跨“数据挖掘”和“过程管理”领域的交叉学科。近十年来,伴随着事件数据获得越来越容易,过程挖掘技术快速发展,很多软件商已经将过程挖掘功能添加到其产品套件中。
过程挖掘主要场景包括:“发现”,根据事件日志生成模型,并不使用任何先验信息;“符合性检查”,将一个已知的过程模型与这个模型的事件日志进行对比;“改进”,使用相关事件日志来扩展或者改进现有过程模型。
过程挖掘并不限于过程发现,通过将事件数据和过程模型紧密联系,能用于检查合规性、探测偏差、预测延迟、支持决策制定和辅助过程再造,给原本静态的过程模型赋予了生机,并将现今的“大数据”置入过程上下文中。
本书理清了过程挖掘涉及的核心概念,重点阐述了事件日志获取方法、??等控制流挖掘算法、合规性检查方法、数据/资源等属性挖掘方法、在线运作挖掘方法、过程挖掘项目框架以及过程挖掘典型领域案例,覆盖了从过程发现到运作支持整个过程挖掘技术谱系,最后对过程挖掘技术进行了展望。
清华大学软件学院信息系统与工程研究所的杨和东、朱笑尘、李婕、万明、窦蒙、沈晓明、林欣、冀付军、王子璇等同志参加了本书的翻译工作,在此,感谢他们的辛勤工作。
从2011年暑假我们得到书稿算起,已经两年有余。由于本书是过程挖掘领域的首部专著,涉及知识领域较多、组织视角独特,为了保证译文质量,译者认真研究、反复推敲,期望为读者奉献一个尽量准确的译文,这或许可以作为“两年有余”的一个理由。
最后衷心感谢Wil教授,他不仅让我们先睹为快,而且解答了翻译过程中的诸多疑问。
王建民 闻立杰
2014年3月
于清华园
前言
过程挖掘是一门提供全套工具来洞察事实并支持过程改进的新兴学科,这个新学科建立在过程模型驱动方法和数据挖掘的基础上。然而,过程挖掘并非现有方法的简单混合。例如,现有的数据挖掘技术主要以数据为中心,很难提供组织内端到端过程的全面理解。BI工具则聚焦于简单的仪器盘和报表,而缺乏对商务过程进行清晰明确的洞察。BPM套件则严重依赖于专家建模的理想化的未来过程,而无助于企业管理者理解现行的业务过程。
本书阐述了一系列过程挖掘技术,以帮助组织揭示它们的实际业务过程。过程挖掘并不限于过程发现,通过将事件数据和过程模型紧密联系,能用于检查合规性、探测偏差、预测延迟、支持决策制定和辅助过程再造。过程挖掘为原本静态的过程模型赋予了生机,并将现今的海量数据置入过程上下文中。因此,过程改进(如Six Sigma、TQM、CPI和CPM)和合规性(如SOX和BAM等)相关的管理浪潮能够从过程挖掘中受益。
如书中所述,过程挖掘出现于十年前[8, 19],但是它的起源却要追溯至半个世纪以前。例如,Anil Nerode在1958年[101]提出从实例轨迹合成有限状态机的方法,Carl Adam Petri 则在1962年[103]介绍了第一门精确捕捉并发的建模语言,还有Mark Gold在1967年[67]率先系统地探索了不同的可学习的概念。当数据挖掘在20世纪90年代开始繁荣的时候,很少有人注意到过程挖掘。直到最近,事件日志变得无处不在,使得端到端的过程发现成为可能。自从关于过程挖掘的第一篇综述文章于2003年[8]发表后,过程挖掘取得了长足进步。过程挖掘技术日益成熟,出现了多种支持工具。尽管最初主要聚焦于过程发现,但现今过程挖掘谱系得到了明显的拓宽。例如,合规性检查、多维度过程挖掘和运作支持已成为过程挖掘工具——ProM——的有机组成部分。
这是关于过程挖掘的第一本书,因此,面向的读者群非常广泛。本书全面概述了过程挖掘发展现状,是为实践者、学生和学者提供的过程挖掘技术的入门材料。一方面,本书适合于那些刚接触该话题的新人;另一方面,本书对于重要概念也会给予严谨的阐述。本书力求自成体系,覆盖了从过程发现到运作支持的整个过程挖掘谱系。因此,对于BPM或BI领域的从业者,本书也可作为一本参考手册。
鉴于过程挖掘技术的适用性、(开源)过程挖掘软件的可用性,以及现代信息系统中丰富的事件数据,读者可以立即将过程挖掘技术付诸实践。我诚挚希望您乐于阅读本书,并着手使用那些已有的让人兴奋的过程挖掘技术。
.致 谢
许多个人和机构都对本书中描述的技术和工具做出了贡献,在此衷心感谢他们的支持、付出和贡献。
本书源于1999年的研究项目“利用挖掘来进行过程设计:从执行日志中获得工作流知识”,这个项目是由本人和Ton Weijters发起的。那时,我还是美国科罗拉多大学波尔德分校的访问学者,BETA研究院鼓励我与TU/e(埃因霍恩技术大学)新研究组成员进行合作。经过和Ton讨论,觉得他机器学习方面的知识和我在工作流管理以及Petri网方面的知识会使我们的合作受益。显然,过程挖掘(当时我们称之为工作流挖掘)是一个能够将我们的专长进行结合的最合适的课题。于是就开始了这次成功的合作,感谢Ton!
自此,许多博士生开始投身于这个课题,他们是Laura Maruster、Ana Karla Alves de Medeiros、Boudewijn van Dongen、Minseok Song、Christian Günther、Anne Rozinat、Carmen Bratosin、R.P. Jagadeesh Chandra (JC) Bose、Ronny Mans、Maja Pesic、Joyce Nakatumba、Helen Schonenberg、Arya Adriansyah和Joos Buijs。我非常感谢他们的努力付出。
Ana Karla Alves de Medeiros是第一位在我的指导下致力于这个课题的博士生。她做了非常杰出的工作,她关于遗传过程挖掘的论文获得了ASML 2007 Promotion Prize的奖项,并入选了KNAW research school BETA优秀论文。Boudewijn van Dongen加入的时候,ProM的开发才刚刚起步,作为一个硕士生,他开发了过程挖掘工具如EMiT, 即ProM的前身,并成为一名优秀的博士生,在此期间他发明了多个过程挖掘技术。Eric Verbeek在工作流验证方向完成了博士学位,随后他逐步参与到过程挖掘研究以及ProM开发中来。很多人低估了像Eric这样的学术型程序员的重要性。工具的开发和持续发展是科学研究的基石。Boudewijn 和 Eric是ProM的推动力量,他们的贡献对于TU/e的过程挖掘研究是至关重要的。更重要的是他们一直助人为乐,谢谢你们!
Christian Günther 和 Anne Rozinat是2005年加入团队的。他们对扩展过程挖掘的范围以及提升应用水平做出了重要贡献。Christian在显著提高ProM性能的同时,使其更加美观。更重要的是,他的模糊挖掘插件促进了“意大利面过程”(Spaghetti)的处理。Anne通过在ProM中加入合规性检查以及多维度挖掘,扩大了过程挖掘的应用范围。最重要的是他们建立了一家过程挖掘公司(Fluxicon)。Peter van den Brand是另一位发展ProM的重要人物,他搭建了ProM 6的初始框架,并在其架构开发中发挥了重要作用。他基于ProM开发经验,建立了一家过程挖掘公司(Futura Process Intelligence)。与Peter、Christian和Anne这样的人共事非常愉快,他们对于将研究成果转化为商业化产品来说非常重要。我由衷希望Fluxicon和Futura Process Intelligence这两家公司能够持续成功发展(而不仅仅为了未来的跑车……)。
许多大学及其学者都对ProM的发展做出了贡献,并支持我们的过程挖掘研究。我们非常感谢Technical University of Lisbon、Katholieke Universiteit Leuven、Universitat Politècnica de Catalunya、Universit?t Paderborn、University of Rostock、Humboldt-Universit?t zu Berlin、University of Calabria、Queensland University of Technology、Tsinghua University、Universit?t Innsbruck、 Ulsan National Institute of Science and Technology、Università di Bologna, Zhejiang University、Vienna University of Technology、Universit?t Ulm、Open University、Jilin University、University of Padua和University of Nancy。我还要感谢IEEE Task Force on Process Mining的成员积极推动这个方向。我们也非常感谢以下机构对于TU/e过程挖掘研究的支持:NWO、STW、EU、IOP、LOIS、BETA、SIKS、Stichting EIT Informatica Onderwijs、Pallas Athena、IBM、LaQuSo、Philips Healthcare、ESI、Jacquard、Nuffic、BPM Usergroup和WWTF。特别致谢Pallas Athena对于过程挖掘课题的推动以及与他们多个项目的合作。有超过100个机构为我们提供事件日志,用以帮助提升过程挖掘技术。在此,我要特别提出AMC Hospital、Philips Healthcare、ASML、Ricoh、Vestia、Catharina Hospital、Thales、Océ、Rijkswaterstaat、Heusden、Harderwijk、Deloitte以及所有参加SUPER、ACSI、PoSecCo和CoSeLoG项目的机构。非常感谢他们让我们使用他们的数据并为我们提供反馈。
不可能列出所有对ProM有贡献的或帮助推动过程挖掘的每一个人,不过我还是要做一个尝试,除了之前提及过的人,我还要感谢Piet Bakker、Huub de Beer、Tobias Blickle、Andrea Burattin、Riet van Buul、Toon Calders、Jorge Cardoso、Josep Carmona、Alina Chipaila、Francisco Curbera、Marlon Dumas、Schahram Dustdar、Paul Eertink、Dyon Egberts、Dirk Fahland、Diogo Ferreira、Walid Gaaloul、Stijn Goedertier、Adela Grando、Gianluigi Greco、Dolf Grünbauer、Antonella Guzzo、Kees van Hee、Joachim Herbst、Arthur ter Hofstede、John Hoogland、Ivo de Jong、Ivan Khodyrev、Thom Langerwerf、Massimiliano de Leoni、Jiafei Li、Ine van der Ligt、Zheng Liu、Niels Lohmann、Peter Hornix、Fabrizio Maggi、Jan Mendling、Frits Minderhoud、Arnold Moleman、Marco Montali、Michael zur Muehlen、Jorge Munoz-Gama、Mariska Netjes、Andriy Nikolov、Mykola Pechenizkiy、Carlos Pedrinaci、Viara Popova、Silvana Quaglini、Manfred Reichert、Hajo Reijers、Remmert Remmerts de Vries、Stefanie Rinderle-Ma、Marcello La Rosa、Michael Rosemann、Vladimir Rubin、Stefania Rusu、Eduardo Portela Santos、Natalia Sidorova、Alessandro Sperduti、Christian Stahl、Keith Swenson、Nikola Trcka、Kenny van Uden、Irene Vanderfeesten、George Varvaressos、Marc Verdonk、Sicco Verwer、Jan Vogelaar、Hans Vrins、Jianmin Wang、Teun Wagemakers、Barbara Weber、Lijie Wen、Jan Martijn van der Werf、Mathias Weske、Michael Westergaard、Moe Wynn、Bart Ydo和Marco Zapletal,感谢他们的支持。感谢所有阅读过这本书早期草稿的人(尤其是Christian、Eric、Ton,感谢你们提出中肯的意见)。
感谢Springer-Verlag出版此书。感谢Ralf Gerstner鼓励我编写本书,并以非常出色的方式处理本书的出版事宜,谢谢你Ralf!
本书95%以上都是在漂亮的德国施莱登地区编写的。除了我的学术休假期间,平时还有许多其他任务需要处理。多亏我每周能来施莱登(这里没有因特网),从而可以在3个月内完成本书的编写。本书的逐章校对主要靠美妙的塞拉芬咖啡,其他写作时间主要靠这里美丽的风景。
按照惯例,最后的感谢要送给最珍贵的人。衷心感谢Karin、Anne、Willem、Sjaak、Loes,在没有我的日子里,克服了很多困难。若没有她们持续支持,这本书也许会花费数年的时间。