流程挖掘在“狂飙”?产学研高峰对话听听大咖怎么说!
伴随着当前业务流程的飞速迭代,流程挖掘受到越来越多人的关注,但作为新兴的商用技术,受众乃至整个行业对流程挖掘技术的熟悉尚不深进。作为国内引领者,看繁信科技特邀流程专家进行产学研高峰对话,向全行业足够普及流程挖掘发展现状及使用趋势,为企业数字化转型提供全新看法与技术支持。
主持人:看繁信科技合伙人兼咨询总监汪智鹏
嘉宾:清华大学软件学院长聘副教授、看繁信科技首席科学家闻立杰;看繁信科技创始人兼CEO索强;看繁信科技联合创始人兼CTO李进峰
以下是直播对话节选:
流程挖掘的历史发展
流程挖掘与商业智能(BI)
汪智鹏:作为从业者,我们发现很多关注流程挖掘的人,经常将流程挖掘和商业智能(BI)放在一起往做讨论和审阅,那这两项技术的区别和联系是怎样的?
闻立杰:数据科学的核心是数据,包括业务数据、物联网数据、各种各样的多模态数据以及现在社交网络里面比较火的图数据等;流程科学的核心是流程,包括流程的建模和验证、流程的部署及实施、流程的执行与监控,流程分析、流程仿真等等。
展开全文
在数据科学和流程科学的交集当中,流程挖掘充当了两者之间的桥梁。流程挖掘既关注数据,例如关注业务流程日志、系统的行为日志,同时流程挖掘也关注流程,强调流程相关的模型作为输进,产生流程相关的洞察。
关于流程挖掘和BI,无论从业务目的、面向的群体、技术体系、支撑工具和平台,还是为用户带来的收益、业界和学界从业的队伍等方面来看,两者之间都存在着明显的差异。流程挖掘是更特定的、深进的,是围绕流程展开的;而BI则是更通用、宽泛的,是围绕数据展开的。就好比切一条鱼,BI更倾向于把鱼切成段,进而看察这个段具备什么样的特征;而流程挖掘更强调把这条鱼切成片,从片的角度往发现问题,并且找到根因来给用户提供一些改良的依据。
李进峰:流程挖掘通过为流程定制化开发的语言PQL(Process Query Language)往称心企业在流程相关场景下的业务要求,而BI则使用的是SQL(Structured Query Language),从技术底层上来说,流程挖掘和BI是两种完全不同的技术栈,这是两者之间最大的一个区别。
索强:从业务人员的角度来看,BI是通过病症往猜病因,这个过程中需要非常多的专业知识以及对业务的全面了解,企业通常会找一个非常资深的业务顾问或者花昂贵的咨询费用;而流程挖掘是像X光机一样直接照出病因,以易于理解且基于实际业务的方式进行全量流程数据的可视化,让企业快速形成问题洞察。
流程挖掘与机器人流程自动化(RPA)
汪智鹏:早在2020年,Gartner提出了超自动化的概念,并连续三年将其列进十大战术趋势之一。超自动化是一种技术合集,包括了RPA、人工智能、机器学习、流程挖掘、低代码等创新技术。而这几年,RPA的发展也扶助诸多企业获益。流程挖掘和RPA之间,有什么区别与联系呢?
闻立杰:RPA(Robotic Process Automation)重在Automation,它是以点对点的任务自动化为目的,通过自动化脚本来代替人类的重复性的劳动,从而实现效率提升、质量提升和成本节约;流程挖掘(Process Mining),重在Mining,本质上是以端到端的流程优化为目的,从日志当中往发现问题的根因,为流程的进一步优化提供依据,并为人们的行动给出意见。
从他们的联系来看,流程挖掘和RPA在超级自动化场景下确实是相辅相成的,共同构成了超级自动化的基石。
李进峰:从我个人角度理解,其实流程挖掘和RPA本身没有直接的关系,而任务挖掘由于与机器人相关,它跟RPA是有关系的。因为流程挖掘,它所考虑的是企业关系性数据库表里的数据,关注的是宏看的端到端流程,聚焦业务与治理;而任务挖掘,它所考虑的是捕捉员工天天日常的操作,挖掘出那些经常被很多用户反复进行操作的行为,这些可以作为RPA的输进,从而进行自动化优化。
流程挖掘在使用中的常见误区
汪智鹏:流程挖掘作为一项商业化技术,在深度运用的过程中也面临了很多误区。有看点认为流程挖掘是一项特定的数据挖掘技术,只能做离线的分析。还有一些看点认为流程挖掘是要取代BPM的。想听听各位专家对这些看点的澄清和解答。
索强:流程挖掘是针对于流程类数据的一个分析技术,在我的从业过程中,我们对流程挖掘的使用方式,大多数是一种离线的分析以及在线的监督。
关于“流程挖掘要取代BPM”这种说法我觉得是不对的。因为BPM是流程引擎,它里面里承载了很多流程,它不仅是流程的设计器,而且也是执行器;而流程挖掘更多的是用系统中已经有的日志往分析和优化流程,所以流程挖掘是在BPM的后一端——先设定一个流程,利用流程挖掘往优化一下,再往重新调整。它们两者之间是互补而不是取代的关系。
闻立杰:非常赞同索强的看点。流程挖掘其实是不能脱离于BPM而存在的。BPM里有一个概念喊做业务流程全生命周期治理,流程挖掘刚好是在这业务流程的全生命周期治理的尾部,它是衔接尾部和头部的一个重要的桥梁,这样才能使得BPM形成一个完美的闭环。
流程挖掘在使用中面临的挑战
汪智鹏:从具体项目实施以及客户反馈中,看繁信科技梳理出一些流程挖掘在使用中所面临的挑战。例如怎么做数据清洗?怎么处理概念漂移理念?如何让普通用户更加轻易地往理解和使用流程挖掘?
李进峰:在清洗数据里边最难的一个事情是什么?刚才闻教授也提到了,就是会有很多的噪声数据,这些噪声怎么往推断,怎么往填补,这些都是一些比较难的痛点。这些痛点需要学界和业界共同往讨论、往解决,让数据在被人分析之前能够做一些比较好的清洗,从而确保数据分析结果的正确性。
闻立杰:概念漂移并不是流程领域特有的,它是在上个世纪90年代的时候,在数据挖掘里边率先提出来的,指的是数据随着时间推移会不断地发生转变。流程的概念漂移,其本质是我们的业务并不是一成不变的,随着时间的演进,我们的业务模型会发生改变,而一旦发生改变,改变的这个点就要出现一次流程的漂移。
比如在这个点之前,a和b是串行的,但后来进行了一次优化,在这个点之后,a和b开始并发执行。于是我们在这个时间段里边就出现了两个版本的流程,一个是a 、b串行的流程,一个是a 、b并行的流程。这个时候假如我们把两段流程对应的日志放在一起来进行挖掘,你就会发现你只能发现a、b并行的这个结果,于是你就认为a、b应该是并行的。
还有一种情状是,改变之前是这样的一个模型,改变之后是跟之前完全不同的另一个模型。这时候假如把两个日志合在一起往挖掘,就会得到一个像意大利面那样非常复杂且难以阐明的模型。
所以我们也把处理概念漂移当成数据日志的一个预处理,期看找到一个或多个时间点,把日志一分为多,在切分之后的每段日志里面,使用现在的流程挖掘方法往挖掘,得到一组流程模型,而不是得到一个流程模型。
索强:流程挖掘本身是一项对业务用户非常友好的技术,因为它把数据非常直看地展现在了业务用户的面前。像看繁信科技这种非常成熟的流程挖掘平台,针对主流IT系统的各种数据模型我们都已经做得很齐备了,用户可以直接使用挈拉拽的方式,在最短时间内往完成数据清洗、合并等工作。
我举个例子,在使用软件的时候,我们要计算两个流程节点之间的吞吐时间,假如想清除节假日,是中国清除中国的节假日、国外清除国外的节假日?中国按照早上9点上班、晚上7点下班、一周五天把剩下的非工作时间清除?还是按996清除?单单一个吞吐时间这里就会有非常多细小的技术点。
我们把所有像这样考虑周全的、人性化的细节点内置在流程挖掘软件里,形成了一套非常行之有效的、可以让业务用户简单上手的教程,并把这套教程共享在我们的Prothentic学院上,免费对所有人开放。我觉得这个对扶助用户理解和使用流程挖掘也是非常重要的。
流程挖掘实施落地的意见
汪智鹏:流程挖掘工作组在发布的《流程挖掘宣言》里,提出了六项对企业用户使用流程挖掘的指挥原则。头两个原则就是我们前面提到的如何往对待事件数据,以及我们如何往提取日志这两个话题,想听听三位嘉宾的看法。
闻立杰:流程挖掘把事件数据,特殊是流程相关的数据当做头等公民。同时我们已经精美化到了对事件数据往进行成熟度分级的地步,对企业当中用于流程挖掘的事件数据往做评定。假如是5级,阐明企业已经预备得非常好了;假如是1级,阐明企业还需要很长时间往预备日志。
现在一直说数据为王,但实际上数据从来都不是王。在有人存在的情状下,什么是王?人是王、人制定出来的规则是王。人制定出来的规则,它的技术实现就是流程。所以这就是我想强调的,既然要做优化,首先就要从流程的角度开始进行优化。
索强:事件数据越来越受重视,国内外各大厂商都已经有了共识,像Workday、Salesforce、用友、金蝶等都已经默认了软件中内置事件日志的笔录。
日志的提取应该百分之百由企业想用流程挖掘往解决的问题驱动!这个我觉得特殊重要,因为只有这样我们才能更加精准有效地提取数据,且这些数据可以更好地来辅助我们的分析。假如不聚焦问题,把大家丢到一个端到端的全量日志里,最终形成一个特殊复杂且难以阅读的流程图,这样是没有意义的。
2023年,随着数字化转型走到实战的深水区,企业的需求在不断进化。更极致、更高效、更便利,不仅仅是客户的需求,也是看繁信科技流程挖掘工具升级的信心与使命。未来,看繁信科技将陆续深化产学研协作,和协作伙伴一起不断拓展能力边界,做流程挖掘行业的掘金者!