Generierung von Prozesslogs



Ähnliche Dokumente
THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

Algorithmen und Datenstrukturen Suchbaum

Telling TestStories Modellbasiertes Akzeptanz Testen Serviceorientierter Systeme

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Verhaltensanalysegraph für Petrinetze

BPM News. Folge 1. Manfred Reichert (University of Twente) Stefanie Rinderle (Universität Ulm) Barbara Weber (Universität Innsbruck)

Datenhaltung für Android Model First Christian Ingenhaag, Frederik Götz, Carl Steeg

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

3D Visualisierung von UML Umgebungsmodellen

Finaler Testbericht. Finaler Testbericht. 1 Einführung Warum Softwaretests?... 2

PSRDesigner. Punkt und Streifenrasterplatinen Designer

Verbesserung und Pflege der Dokumentation der DPP-Software Saros

15 Optimales Kodieren

Verwendung von OO-Metriken zur Vorhersage

Zwei einfache Kennzahlen für große Engagements

Algorithmen und Datenstrukturen

QuickInfo Dienstplanerstellungund Dienstplanänderung. Erstellung eines Dienstplan bzw. Arbeitszeitmodell

Entscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?

ChangePoint-Analysen - ein Überblick

Algorithmen und Datenstrukturen Balancierte Suchbäume

Data Mining-Modelle und -Algorithmen

iphone app - Anwesenheit

CeBIT CARMAO GmbH

Masterstudium Softwareentwicklung- Wirtschaft CURRICULUM 2005 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG

aktuelle Themen Kundenworkshop 11/

Einführung in die Informatik Tools

Grundbegriffe der Informatik

Dialognetze. Ziel : Beschreibung von Methoden und Beschreibungstechniken für den Entwurf und die Dokumentation von Dialogabläufen

OERA OpenEdge Reference Architecture. Mike Fechner PUG Infotag 19. Mai 05 Frankfurt

erster Hauptsatz der Thermodynamik,

HR Prozesse und Tools

Statistische Thermodynamik I Lösungen zur Serie 1

Fehlermonitor. Software zur seriellen Verbindung PC-Airdos Visualdatensignale und Fehlermeldungen-Ausagabe per SMS / Drucker

Konzept Projekt Lisa

Datenstrukturen & Algorithmen

5.2 Neue Projekte erstellen

MapReduce und Datenbanken Thema 15: Strom bzw. Onlineverarbeitung mit MapReduce

Handbuch ECDL 2003 Modul 2: Computermanagement und Dateiverwaltung Dateien löschen und wiederherstellen

Towards Automated Analysis of Business Processes for Financial Audits

Theoretische Grundlagen der Informatik WS 09/10

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

Bilder Schärfen und Rauschen entfernen

Vom Business Process Model zum Workflow

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

Praktikum Ingenieurinformatik (PI)

Reference Migration Process ReMiP

Was können Schüler anhand von Primzahltests über Mathematik lernen?

3. Stored Procedures und PL/SQL

Akonadi. Der PIM-Service für den freien Desktop. Tobias König. 30. März 2010

Workflow-Management-Systeme

Nachtrag zu binären Suchbäumen

Markovketten. Bsp. Page Ranking für Suchmaschinen. Wahlfach Entscheidung unter Risiko und stat. Datenanalyse

Hochschule Darmstadt Fachbereich Informatik

ITIL und Entwicklungsmodelle: Die zwei Kulturen

Über Randeffekte bei der Dichteschätzung räumlich verteilter Daten

Maximizing the Spread of Influence through a Social Network

ALM 11.5 Project ZentraleBenutzerVerwaltung

Ein einfaches Modell zur Fehlerfortpflanzung

Java RMI, CORBA und Firewalls

Mining High-Speed Data Streams

Some Software Engineering Principles

Multimedia im Netz. Wintersemester 2011/12. Übung 10. Betreuer: Verantwortlicher Professor: Sebastian Löhmann. Prof. Dr.

Makros aufrufen. Übungsbeispiel Aufrufmöglichkeiten

Monte-Carlo-Simulation

Python SVN-Revision 12

SZ Digital. Bedienungsanleitung zum Löschen geladener Ausgaben in der SZ Digital -App. Windows 8. Kurz- und Langversion

Data/Information Quality Management

Einführung in die Java- Programmierung

Erstellung botoptimierter Partnerlinks

Data Mining: Einige Grundlagen aus der Stochastik

Abschnitt: Algorithmendesign und Laufzeitanalyse

Grundlagen der Technischen Informatik. Sequenzielle Netzwerke. Institut für Kommunikationsnetze und Rechnersysteme. Paul J. Kühn, Matthias Meyer

Zufallszahlen. Inhaltsüberblick

Einreichung zum Call for Papers

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Motivation. Motivation

PPC und Data Mining. Seminar aus Informatik LV Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

Handbuch ECDL 2003 Basic Modul 2: Computermanagement und Dateiverwaltung Dateien löschen und wiederherstellen

Empirische Softwaretechnik Kosten und Nutzen von UML in der Wartung Dr. Victor Pankratius Andreas Höfer Wintersemester 2009/2010

TUSReport Installationsanleitung

Die Orgadata AG ist ein stark expandierendes Software-Unternehmen aus Leer. Mit unserem System LogiKal

Lernziele: Ausgleichstechniken für binäre Bäume verstehen und einsetzen können.

Klausur Softwaretechnik Feb. 2008

ARAkoll 2013 Dokumentation. Datum:

Vorlesung: Workflow-Management-Systeme Frank Eichinger

Instruktionsheft für neue Webshop Hamifleurs

Analysis I für Studierende der Ingenieurwissenschaften

Überblick. Multi-Cloud Computing Motivation Redundant Array of Cloud Storage (RACS) Zusammenfassung. c td MWCC (WS14/15) Multi-Cloud Computing 13 1

Hilfe zur Verwendung digitaler Formulare

Eine Anwendung mit InstantRails 1.7

Anmeldung eines Tiptel IP-Telefons an einer FritzBox

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

The Modular Structure of Complex Systems Seminar SoftwareArchitektur Fabian Schultz

Transkript:

Generierung von Prozesslogs Seminar Prozessmodellierungsplattform Sommersemester 2010 Prof. Dr. Mathias Weske, Matthias Kunze Thomas Milde Betreuer: Matthias Weidlich 19.07.2010

Motivation 2 Process Mining: Automatisches Ableiten von Prozessen aus Logs Testen von Process Mining Tools Logs bekannter Prozesse benötigt Echte Logs schwer zugänglich

Kriterien der Log-Generierung 3 Vollständigkeit Ordering-Completeness Trace-Completeness Rauschen (Noise) Abweichungen vom Prozessmodell Variabler Anteil Beispiele: Anfang/Ende fehlt Vertauschungen Dopplungen Berücksichtung von Pfadwahrscheinlichkeiten

Implementation Konzept (1/2) 4 Serverseitiges Plugin Erweiterung der Petrinetzdarstellung (Zeiten, Wahrscheinlichkeiten) Spezialisierung des RDFImporters Ableitungen von LabeledTransition und SilentTransition Datenstrukturen für Log Algorithmen zur Generierung Unterschiedlich je nach gewünschter Vollständigkeit Nutzung des vorhandenen PTNetInterpreter Erst Generierung eines korrekten Logs, dann fertigen Log verrauschen

Implementation Konzept (2/2) 5 Erweiterung des Petrinetz-Stencilsets Ausführungswahrscheinlichkeiten für Transitionen Zeitverbrauch für nicht-stille Transitionen Clientseitiges Plugin Konfigurationsdialog Vollständigkeit Rauschanteil Anzahl der Traces

6 Demo

Generierungs-Algorithmen 7 Trace-vollständige Logs Unvollständige Logs Anordnungsvollständige Logs

Erzeugung des Rauschens (1/3) 8 Verschiedene Arten in jeweils einzelnen Schritten Fehlender Anfang Fehlendes Ende Beliebige fehlende Schritte Duplikate Vertauschungen Unabhängig voneinander mit gewählter Wahrscheinlichkeit ausgeführt

Erzeugung des Rauschens (2/3) 9 Fehlender Anfang / Fehlendes Ende Anzahl zu löschender Elemente mit exponentiell verteiltem Zufall bestimmt Weniger Elemente wesentlich wahrscheinlicher Bei 10% Rauschen maximal 10% der Schritte gelöscht Kann zu leerem Trace führen Fehlende Zwischenschritte Auswahl der Anzahl ebenso Index der zu löschenden Elemente gleichverteilt bestimmt

Erzeugung des Rauschens (3/3) 10 Duplikate analog zu beliebigen fehlenden Elementen Vertauschungen Immer zwei Schritte vertauscht Mehrmalige Vertauschung eines Schrittes möglich Für jede Vertauschung: Zufällig (gleichverteilt) ein erstes Element auswählen Zweites Element wahrscheinlicher in der Nähe des ersten als weit entfernt Wurzelfunktion Keine Vertauschung mit sich selbst

Erfahrungen und Probleme 11 Einarbeitung in vorhandenen Code aufwendig Client-Server-Kommunikation ExtJS Richtige Stellen für den Code Ausgabeformat unproblematisch

Zusammenfassung 12 Generierung von Logs zum Test von Mining-Tools Logs aus Petrinetzen Verschiedene Arten von Vollständigkeit Mehrere Formen des Rauschens

Literatur 13 [1]W.M.P. van der Aalst, B.F. Van Dongen, J. Herbst, L. Maruster, G. Schimm, A.J.M.M. Weijters. Workflow Mining: A Survey of Issues and Approaches. Data & Knowledge Engineering 47/2003 [2]L. Maruster A.J.M.M. Weijters, W.M.P. van der Aalst, A. van den Bosch. Process Mining: Discovering Direct Successors in Process Logs. LNCS 2534/2002 [3]W.M.P. van der Aalst, A.J.M.M. Weijters, L. Maruster. Workflow Mining: Discovering process models from event logs. IEEE Transactions on Knowledge and Data Engineering 16/2004