DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne Markus Linden Universität Duisburg-Essen Fakultät für Betriebswirtschaftslehre Mercator School of Management Department of Technology and Operations Management Lehrstuhl für Wirtschaftsinformatik, insbesondere Business Intelligence Lotharstraße 63 D-47057 Duisburg Telefon: (+49)203 / 379-2627 Telefax: (+49)203 / 379-1856 E-Mail: sekretariat.wi@uni-duisburg-essen.de URL: http://www.msm.uni-due.de/wi Oktober 2011
I Inhaltsverzeichnis Abbildungsverzeichnis...III Tabellenverzeichnis...III Abkürzungsverzeichnis... IV 1 Einführung...1 2 Grundlagen des Geschäftsprozessmanagements...3 2.1 Definitionen...3 2.2 Lebenszyklus des Geschäftsprozessmanagements...4 2.2.1 Prozessidentifikation...4 2.2.2 Prozessimplementierung...5 2.2.3 Prozesssteuerung und Controlling...6 2.2.4 Kontinuierliche Verbesserung...6 3 Grundlagen des Data Mining und angewendete Verfahren...9 3.1 Definititorische Abgrenzung des Data Mining...9 3.2 Data-Mining-Prozess...9 3.3 Aufgabenstellungen und Data-Mining-Verfahren...11 3.3.1 Aufgabenstellungen...12 3.3.1.1 Erstellung eines Klassifikationsmodells...12 3.3.1.2 Erstellung eines Regressionsmodells...13 3.3.1.3 Bildung von Clustern...13 3.3.1.4 Entdeckung von Abhängigkeiten...14 3.3.2 Data-Mining-Verfahren...14 3.3.2.1 Entscheidungsbaumverfahren...14 3.3.2.2 Künstliche Neuronale Netze...17 3.3.2.3 Clusterverfahren...19 3.3.2.4 Assoziationsanalyse...21
II 4 Einsatz von Data-Mining-Verfahren im Process Mining...23 4.1 Grundlagen des Process Mining...23 4.2 Beziehung zwischen Data Mining und Process Mining...27 4.3 Eignung der Verfahren des Data Mining im Process Mining...27 4.3.1 Kriterienauswahl...27 4.3.2 Eignung ausgewählter Verfahren des Data Mining...28 4.3.2.1 Entscheidungsbaumverfahren...28 4.3.2.2 Künstliche Neuronale Netze...30 4.3.2.3 Clusterverfahren...31 4.3.2.4 Assoziationsanalyse...33 4.3.3 Ergebnisse des Kriterienkatalogs...35 4.4 Kritische Würdigung...35 5 Zusammenfassung, Fazit und Ausblick...37 Literaturverzeichnis...39
1 1 Einführung Geschäftsprozesse unterliegen ständigen internen und externen Veränderungen. Um den langfristigen Unternehmenserfolg zu gewährleisten, muss ein Unternehmen entsprechend anpassungsfähig und flexibel sein. Im Geschäftsprozess fallen üblicherweise viele Informationen und Daten an, die erfasst, strukturiert und ausgewertet werden müssen. Wesentliche Bestandteile des Geschäftsprozessmanagements sind Informationssysteme. Hierzu zählt zum Beispiel ein Workflowmanagementsystem, mit dem Prozesse erfasst, überwacht und gegebenenfalls verbessert werden können. Um daraus Erkenntnisse und Wissen zu schöpfen, dienen als Hilfsmittel Data-Mining-Verfahren und seit kürzerer Zeit auch das Process Mining. Mittels Data Mining können große Mengen an Daten untersucht und analysiert werden, um daraus relevante Muster zu entdecken und aus diesen Erkenntnisse abzuleiten bzw. Wissen zu generieren. Dafür werden verschiedene Verfahren verwendet. Vier der bekanntesten Data-Mining-Verfahren sind: Entscheidungsbaumverfahren, Künstliche Neuronale Netze, Clusterverfahren und Assoziationsanalysen. Für das Process Mining dienen als Input relevante und aufgezeichnete Geschäftsereignisse, die durch Informationssysteme in Form eines so genannten Event-logs gewonnen werden. Innerhalb des Process Mining wird aus dem Event-log mit Hilfe von Algorithmen ein Modell generiert, mit dem Ziel, die realen Abläufe in einem Prozess aufzudecken, anzupassen und zu erweitern. Diese Modelle ermöglichen es, die Prozessabläufe an gezielten Stellen zu optimieren. In der Literatur sind sowohl zum Data Mining als auch zum Prozess Mining jeweils spezielle Verfahren zu finden, aber eine Verknüpfung hinsichtlich der Anwendbarkeit von Verfahren des Data Mining im Process Mining wurde bislang kaum untersucht. Ziel dieses Berichts ist es, geeignete Verfahren der Musterentdeckung im Process Mining aufzuzeigen. Dafür soll überprüft werden, in wie weit bekannte und für das Data Mining geeignete Verfahren auch Anwendung im Process Mining finden können. Hierzu werden theoretische Überlegungen angestellt, die Aussagen darüber zulassen, welche Verfahren überhaupt für das Process Mining geeignet sind und darüber hinaus an welcher Stelle eine Anwendung sinnvoll erscheint. Die praktische Umsetzung der gewonnen Erkenntnisse in Modelle mit den jeweiligen Algorithmen ist allerdings nicht Bestandteil dieses Berichts. Vielmehr sollen Ansatzpunkte für den gezielten Einsatz an bestimmten Stellen im Process Mining aufgezeigt werden. Zunächst werden in Kapitel 2 das Thema Geschäftsprozessmanagement und dessen Lebenszyklus näher beschrieben. Dabei sollen vor allem das Verständnis für Prozesse
2 und deren Abläufe in einem Unternehmen übermittelt und Ansatzpunkte zur Verbesserung gegeben werden. Anschließend werden im dritten Kapitel Grundlagen und Verfahren des Data Mining dargestellt. Aus der Vielzahl der möglichen Verfahren wird eine Auswahl hinsichtlich der in der Literatur häufig angewendeten Verfahren getroffen, die näher beschrieben werden. Im vierten Kapitel werden zunächst Grundlagen des Process Mining aufgezeigt. Dies erfolgt auch im Hinblick auf den Einsatz der im dritten Kapitel ausgewählten Data-Mining-Verfahren. Anschließend werden Kriterien aufgestellt, die für das Geschäftsprozessmanagement, das Data Mining und das Process Mining von Relevanz sind. Aus diesen wird ein Katalog generiert, mit dem die ausgewählten Data- Mining-Verfahren auf deren Eignung im Prozess Mining überprüft werden. Danach erfolgt auf Basis dieses Kriterienkatalogs eine kritische Würdigung. Abschließend wird ein Fazit gegeben.