Erkennung Sequenzieller Muster Algorithmen und Anwendungen

Größe: px
Ab Seite anzeigen:

Download "Erkennung Sequenzieller Muster Algorithmen und Anwendungen"

Transkript

1 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 1 FernUniversität in Hagen Seminar im Sommersemester 2008 Erkennung Sequenzieller Muster Algorithmen und Anwendungen Thema 1.4.3: Sequenzielle Muster Referent: Achim Eisele Agrawal, Srikant Mining sequential patterns Srikant, Agrawal Mining S equential P atterns: G eneralizations and P erformance Improvements Neckel, Knobloch C ustomer R elationship Analytics

2 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 2 Inhalt Einleitung Data Mining und KDD Grundlagen Sequenzieller Muster Lösungsansatz Generierung von Sequenzkandidaten Algorithmen Speicherverwaltung Einordnung des Problems Kommerzieller Einsatz Zusammenfassung

3 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 3 Einleitung Muster, die in zeitlicher Abhängigkeit zueinander stehen Musterbeispiel: Krieg der Sterne, Das Imperium schlägt zurück, Die Rückkehr der Jedi-Ritter Einführung der Barcode Technologie E-commerce Kommerzieller und wissenschaftlicher Einsatz Erste Vorstellung 1995 von Agrawal und Srikant

4 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 4 Data Mining und KDD Datenanalysekonzept Knowledge Discovery in Databases (KDD) Verfahren zur Mustererkennung in Prozessmodell eingebettet

5 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 5 KDD Phasen Phasen eines Datenanalyseprozesses Selektion Exploration und Modifikation Transformation Analyse / Data Mining Interpretation

6 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 6 Sequenzielle Muster Grundlagen Datenbank D mit Kundentransaktionen itemset (Warenkorb einer Transaktion) i = (i 1,i 2...i n ) Sequenz (geordnete Liste von itemsets) s = <s 1,s 2...s n > Größe einer Sequenz: Anzahl seiner Elemente (itemsets) Länge einer Sequenz: Anzahl seiner items (Produkte) Eine Sequenz der Länge k ist eine k-sequenz

7 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 7 Sequenzielle Muster Grundlagen Maximal eine Transaktion pro Kunde und Zeiteinheit Menge eines items wird nicht beachtet

8 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 8 Sequenzielle Muster Grundlagen Teilsequenz (Sequenz, die in einer anderen Sequenz enthalten ist) <(2,3)(5)(8,9)> <(2,3,4)(5,6)(8,9)> Zusammenhängende Teilsequenz erstes oder letztes Element oder item aus s i, falls s i > 1 Kundensequenz: zeitlich sortierte Transaktionen Unterstützung: Anteil der Sequenzen aus S, die einer benutzerdefinierten minimalen Unterstüzung genügen Gesucht: häufige/große Sequenzen / sequenzielle Muster

9 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 9 Sequenzielle Muster Grundlagen

10 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 10 Lösungsansatz Problemlösung in 5 Phasen Sortierphase (Vorbereitung der Datenbank) Litemset-Phase (Finden häufiger Sequenzen, anfangs 1-Sequenzen Transformationsphase (adäquate Datenstruktur) Sequenzierungsphase (Suche neuer häufiger Sequenzen) Maximierungsphase (maximale Sequenzen)

11 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 11 Algorithmen-Familien Count-All-Familie Berechnung aller großen Sequenzen (auch nicht-maximale) Anschließendes Aussortieren der nicht-maximalen Sequenzen AprioriAll Count-Some-Familie Berechnen lediglich maximale Sequenzen Vorwärts-/Rückwärtsphase AprioriSome, DynamicSome

12 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 12 Generierung von Sequenzkandidaten apriori-generate Join Phase (Verknüpfung L k-1 mit sich selbst) Prune Phase (Aussortieren von Sequenzkandidaten, deren Teilsequenzen nicht der minimalen Unterstützung genügen) on the fly generation (k + j) Sequenzen

13 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 13 Algorithmus I AprioriAll

14 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 14 Algorithmus II AprioriSome Vorwärtsphase

15 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 15 Algorithmus II AprioriSome Next (Überspringen bestimmter k-sequenzen in der Vorwärtsphase)

16 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 16 Algorithmus II AprioriSome Rückwärtsphase

17 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 17 Algorithmus III Dynamic Some Initialisierungsphase (1... step) AprioriSome generiert C k aus C k-1 (falls L k-1 nicht bekannt) DynamicSome generiert C k on-the-fly Intermediate Phase generiert Kandidaten für die übersprungenen Längen der Vorwärtsphase Rückwärtsphase identisch mit AprioriSome

18 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 18 Algorithmus IV GSP (Generalized Sequential Patterns) Taxonomien Klassifizierung (ist-ein Beziehung) Sliding window (Aufweichung des Begriffs Transaktion) Zeitbindung (Mindest-/Maximalabstand)

19 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 19 Algorithmus IV GSP Laufzeitoptimierung versucht so wenig Sequenzkandidaten wie möglich zu generieren, ohne große Sequenzen auszulassen (Hashtree) Ermittlung der Unterstützung ist nicht mehr trivial (Zeitbindung, Taxonomien)

20 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 20 Ausblick Weitere Entwicklungen IncSpan (inkrementell) CCSM (Caching der Sequenzkandidaten) SPADE (nur 3 Durchläufe) PrefixSpan (Prefix Projection) SPIRIT (reguläre Ausdrücke)

21 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 21 Speicherverwaltung Bei großen Datenbanken und niedriger Unterstützung Die Menge der k-sequenzkandidaten C k passt nicht in den Arbeitsspeicher C k aufteilen Die Menge der großen k-1 Sequenzen L k-1 passt nicht in den Arbeitsspeicher Merge/Join Verfahren

22 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 22 Einordnung des Problems Ähnlichkeiten mit Erkennung von Assoziationsregeln Intra- vs. Intertransaktionsmuster Datengetriebene Vorgehensweise (bottom-up) vs. Hypothesengetriebene Vorgehensweise (top-down) Die Technik selbst ist nicht die Antwort, sondern nur das Werkzeug, das den Analytiker dabei unterstützen soll, eine Antwort zu finden, Dorian Pyle

23 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 23 Kommerzieller Einsatz Teil der Warenkorbanalyse Gezielte Werbemaßnahmen Recommendation Engine Nutzerprofile

24 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 24 Zusammenfassung Reihe von Algorithmen zur Erkennung sequenzieller Muster Beliebter Gegenstand der Forschung Ähnlichkeit mit Erkennung von Assoziationsregeln Kommerzieller und wissenschaftlicher Einsatz

25 Achim Eisele, Thema 1.4.3: Sequenzielle Muster 25 Diskussion Fragen???

Übersicht. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007

Übersicht. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007 Übersicht Grundlagen für Assoziationsregeln Apriori Algorithmus Verschiedene Datenformate Finden von Assoziationsregeln mit mehren unteren Schranken für Unterstützung Finden von Assoziationsregeln für

Mehr

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold Algorithms for Pattern Mining AprioriTID Stefan George, Felix Leupold Gliederung 2 Einleitung Support / Confidence Apriori ApriorTID Implementierung Performance Erweiterung Zusammenfassung Einleitung 3

Mehr

Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid

Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Institut für Statistik LMU München Sommersemester 2013 Zielsetzung

Mehr

Skript zur Vorlesung. Knowledge Discovery in Databases. im Wintersemester 2009/2010. Assoziationsregeln

Skript zur Vorlesung. Knowledge Discovery in Databases. im Wintersemester 2009/2010. Assoziationsregeln Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2009/2010 Kapitel

Mehr

5. Assoziationsregeln

5. Assoziationsregeln 5. Generieren von Assoziationsregeln Grundbegriffe 5. Assoziationsregeln Assoziationsregeln beschreiben gewisse Zusammenhänge und Regelmäßigkeiten zwischen verschiedenen Dingen, z.b. den Artikeln eines

Mehr

Kapitel 7: Assoziationsregeln

Kapitel 7: Assoziationsregeln Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2007/2008 Kapitel

Mehr

Kapitel 15: Mining von Sequential Patterns

Kapitel 15: Mining von Sequential Patterns Kapitel 15: Mining von Sequential Patterns Lernziele Weitere Art von Sequential Patterns/ Constraints für den Mining Prozeß kennenlernen. Erkennen, daß Generate&Test Paradigma für diverse Mining-Problemstellungen

Mehr

Data Mining im Einzelhandel Methoden und Werkzeuge

Data Mining im Einzelhandel Methoden und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.

Mehr

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren

Mehr

Kapitel 8: Assoziationsregeln

Kapitel 8: Assoziationsregeln Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Sommersemester 2014 Kapitel 8: Assoziationsregeln

Mehr

Kapitel 8: Assoziationsregeln

Kapitel 8: Assoziationsregeln Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Sommersemester 2015 Kapitel 8: Assoziationsregeln

Mehr

Customer Relationship Analytics

Customer Relationship Analytics Peter Neckel Bernd Knobloch Customer Relationship Analytics Praktische Anwendung des Data Mining im CRM dpunkt.verlag c Inhaltsverzeichnis Teil A Grundlagen und Methoden 1 Customer Relationship Management

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Association Rule Mining Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Association Rule Mining (ARM) A-Priori Algorithmus Varianten Ulf Leser:

Mehr

Kapitel 7: Assoziationsregeln

Kapitel 7: Assoziationsregeln Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2010/2011 Kapitel

Mehr

Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007

Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007 Assoziationsregeln & Sequenzielle Muster 0 Übersicht Grundlagen für Assoziationsregeln Apriori Algorithmus Verschiedene Datenformate Finden von Assoziationsregeln mit mehren unteren Schranken für Unterstützung

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

1 Customer Relationship Management ein Bezugsrahmen 3

1 Customer Relationship Management ein Bezugsrahmen 3 D3kjd3Di38lk323nnm xv Teil A Grundlagen und Methoden 1 1 Customer Relationship Management ein Bezugsrahmen 3 1.1 Die Entwicklung zum kundenzentrierten Unternehmen........... 3 1.2 Ziel und Kernkonzepte

Mehr

Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln

Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Praktikum: Data Warehousing und Data Mining Clusteranalyse Clusteranalyse Idee Bestimmung von Gruppen ähnlicher Tupel in multidimensionalen Datensätzen.

Mehr

Kapitel 11: Association Rules

Kapitel 11: Association Rules Kapitel 11: Association Association Einleitung Association : Eine wichtige Art von Mustern, an der man im Data-Mining Kontext interessiert ist. Muster mit einfacher Struktur. Ziel im folgenden: Finden

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Data Mining auf Datenströmen Andreas M. Weiner

Data Mining auf Datenströmen Andreas M. Weiner Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas

Mehr

Kapitel 11: Association Rules

Kapitel 11: Association Rules Kapitel 11: Association Association Einleitung Association : Eine wichtige Art von Mustern, an der man im Data-Mining Kontext interessiert ist. Muster mit einfacher Struktur. Ziel im folgenden: Finden

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen INTELLIGENTE DATENANALYSE IN MATLAB Unüberwachtes Lernen: Clustern von Attributen Literatur J. Han, M. Kamber: Data Mining Concepts and Techniques. J. Han et. al: Mining Frequent Patterns without Candidate

Mehr

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren?

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren? Mining über RDBMSe von Christian Widmer Wie gut lässt sich Mining mit SQL realisieren? Müssen neue Konstrukte zur Verfügung gestellt werden, wenn ja welche? Vortragsüberblick Association Rules Apriori

Mehr

PG-402 Wissensmanagement: Zeitreihen in Datenbanken

PG-402 Wissensmanagement: Zeitreihen in Datenbanken PG-402 Wissensmanagement: Zeitreihen in Datenbanken 07.05.2002 Klaus Unterstein 07.05.02 PG402 Wissensmanagement Zeitreihen in Datenbanken 1 Übersicht Zeitreihen Schritte bei der Zeitreihenanalyse Anwendungsfallbeispiel:

Mehr

Mining conjunctive sequential patterns

Mining conjunctive sequential patterns Mining conjunctive sequential patterns Chedy Raïssi Toon Calders Pascal Poncelet Manh Linh Nguyen TU Dortmund Fakultät für Informatik Lehrstuhl 8.5.29 Inhalt. Einleitung 2. Mining von frequent sequences

Mehr

Apriori Algortihmus. Endpräsentation. Stefan George, Felix Leupold

Apriori Algortihmus. Endpräsentation. Stefan George, Felix Leupold Apriori Algortihmus Endpräsentation Stefan George, Felix Leupold Gliederung 2 Wiederholung Apriori Erweiterung: Parallelisierung Parallele Programmierung in Python Parallelisierungszenarien Implementierung

Mehr

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus FernUniversität in Hagen Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln Thema 1.1.1 Der Apriori-Algorithmus Referentin: Olga Riener Olga Riener. Thema 1.1.1. Der

Mehr

4.2 Constraints für Assoziationsregeln

4.2 Constraints für Assoziationsregeln 4.2 Constraints für Assoziationsregeln zu viele Frequent Item Sets Effizienzproblem zu viele Assoziationsregeln Evaluationsproblem Motivation manchmal Constraints apriori bekannt nur Assoziationsregeln

Mehr

DBS5 Kap. 4. Data Mining

DBS5 Kap. 4. Data Mining DBS5 Kap. 4 Data Mining Klassifikationen und Cluster-Bildung: Auffinden von Regeln zur Partitionierung von Daten in disjunkte Teilmengen (Anwendungsbeispiel: Risikoabschätzung) bzw. Herstellen von Gruppierungen

Mehr

Customer Relationship Ana lyt ics

Customer Relationship Ana lyt ics Peter Necke1 Bernd Knobloch Customer Relationship Ana lyt ics Praktische Anwendung des Data Mining im CRM d p u n kt.ve r I ag 1 1.1 1.2 1.3 Customer Relationship Management. ein Bezugsrahmen Die Entwicklung

Mehr

Algorithmen zur Entdeckung von Assoziationsregeln unter Vermeidung von redundanten und missverständlichen Regeln

Algorithmen zur Entdeckung von Assoziationsregeln unter Vermeidung von redundanten und missverständlichen Regeln Algorithmen zur Entdeckung von Assoziationsregeln unter Vermeidung von redundanten und missverständlichen Regeln PG 402 Wissensmanagment Lehrstuhl für Künstliche Intelligenz Prof. Katarina Morik und Stefan

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Lernen von Assoziationsregeln Literatur J. Han, M. Kamber: Data Mining i Concepts and Techniques. J. Han et. al: Mining i Frequent Patterns without t Candidate Generation.

Mehr

Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 -

Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 - Vorlesung Grundlagen betrieblicher Informationssysteme Prof. Dr. Hans Czap Email: Hans.Czap@uni-trier.de - II - 1 - Inhalt Kap. 1 Ziele der Datenbanktheorie Kap. 2 Datenmodellierung und Datenbankentwurf

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 13. Übungsblatt

Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 13. Übungsblatt Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 13. Übungsblatt 9. Februar 2016 1 Aufgabe 1: Apriori (1) Gegeben seien folgende Beobachtungen vom Kaufverhalten von

Mehr

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 12. Übungsblatt

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 12. Übungsblatt Data Mining und Maschinelles Lernen Lösungsvorschlag für das 12. Übungsblatt Knowledge Engineering Group Data Mining und Maschinelles Lernen Lösungsvorschlag 12. Übungsblatt 1 Aufgabe 1: Apriori (1) Gegeben

Mehr

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Teil VIII. Weiterführende Veranstaltungen im FG Wissensverarbeitung

Teil VIII. Weiterführende Veranstaltungen im FG Wissensverarbeitung Teil VIII Weiterführende Veranstaltungen im FG Wissensverarbeitung Überblick 1 Zusammenfassung AlgoDS 2 Datenbanken 3 Internet-Suchmaschinen 4 Knowledge Discovery 5 Künstliche Intelligenz 6 Seminare &

Mehr

Konzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute

Konzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene

Mehr

Informationsmaß. Konzeptbeschreibung. Beispiel für Konzept-Charakterisierung (1) Beispiel für Konzept-Charakterisierung (2)

Informationsmaß. Konzeptbeschreibung. Beispiel für Konzept-Charakterisierung (1) Beispiel für Konzept-Charakterisierung (2) Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene

Mehr

Lernen von Assoziationsregeln

Lernen von Assoziationsregeln Lernen von Assoziationsregeln Gegeben: R eine Menge von Objekten, die binäre Werte haben t eine Transaktion, t! R r eine Menge von Transaktionen S min " [0,] die minimale Unterstützung, Conf min " [0,]

Mehr

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln Apriori-Algorithmus zur Entdeckung von PG 42 Wissensmanagment Lehrstuhl für Künstliche Intelligenz 22. Oktober 21 Gliederung Motivation Formale Problemdarstellung Apriori-Algorithmus Beispiel Varianten

Mehr

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3

Teil A Grundlagen und Methoden 1. 1 Customer Relationship Management ein Bezugsrahmen 3 xi Teil A Grundlagen und Methoden 1 1 Customer Relationship Management ein Bezugsrahmen 3 1.1 Die Entwicklung zum kundenzentrierten Unternehmen 3 1.2 Ziel und Kernkonzepte des CRM 5 1.2.1 Ziel: Profitable

Mehr

Inhalt. 7.1 Motivation. 7.2 Artikelmengen. 7.3 Assoziationsregeln. 7.4 Sequenzen. Entscheidungsunterstützende Systeme / Kapitel 7: Mustererkennung

Inhalt. 7.1 Motivation. 7.2 Artikelmengen. 7.3 Assoziationsregeln. 7.4 Sequenzen. Entscheidungsunterstützende Systeme / Kapitel 7: Mustererkennung 7. Mustererkennung Inhalt 7.1 Motivation 7.2 Artikelmengen 7.3 Assoziationsregeln 7.4 Sequenzen 2 7.1 Motivation Mustererkennung (pattern mining) sucht in oft großen Datenmengen nach häufig auftretenden

Mehr

Knowledge Discovery in Databases

Knowledge Discovery in Databases Knowledge Discovery in Databases Springer-V erlag Berlin Heidelberg GmbH Martin Ester Jorg Sander Knowledge Discovery in Databases Techniken und Anwendungen Mit 150 Abbildungen i Springer Dr. Martin Ester

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Data Mining. Informationssysteme, Sommersemester 2017

Data Mining. Informationssysteme, Sommersemester 2017 Data Mining Informationssysteme, Sommersemester 2017 Literatur zu Data-Mining Pang-Ning Tan, Michael Steinbach, Vipin Kuma. Introduction to Data Minig. Ein paar relevante Kapitel sind frei verfügbar unter

Mehr

Regelbasierte Entwicklung betrieblicher Informationssysteme

Regelbasierte Entwicklung betrieblicher Informationssysteme Reihe: Wirtschaftsinformatik Band 45 Herausgegeben von Prof. (em.) Dr. Dietrich Seibt, Köln, Prof. Dr. Hans-Georg Kemper, Stuttgart, Prof. Dr. Georg Herzwurm, Stuttgart, Prof. Dr. Dirk Stelzer, Ilmenau,

Mehr

Datenanalyse mit Data Mining

Datenanalyse mit Data Mining Datenanalyse mit Data Mining von Jan-Christoph Meier Hamburg, 19.01.2012 1 Ablauf Motivation Speicherung der Daten für das Data Mining Data Mining Algorithmen Ausblick auf die Masterarbeit Konferenzen

Mehr

Wissensentdeckung in Datenbanken

Wissensentdeckung in Datenbanken Wissensentdeckung in Datenbanken SQL, Häufige Mengen Nico Piatkowski und Uwe Ligges 11.05.2017 1 von 16 Überblick Was bisher geschah... Modellklassen Verlustfunktionen Numerische Optimierung Regularisierung

Mehr

Analytics Der Weg zu datengetriebenen Geschäftsprozessen

Analytics Der Weg zu datengetriebenen Geschäftsprozessen Analytics Der Weg zu datengetriebenen Geschäftsprozessen Dr.-Ing. Philipp Gölzer 1 Ziel der Digitalisierung ist die Realisierung datengetriebener Geschäfts-/Entscheidungsprozesse Ziele Höhere Qualität

Mehr

Data Mining and Knowledge Discovery zielt darauf ab, verwertbare Erkenntnisse aus Daten zu gewinnen

Data Mining and Knowledge Discovery zielt darauf ab, verwertbare Erkenntnisse aus Daten zu gewinnen Rückblick Data Mining and Knowledge Discovery zielt darauf ab, verwertbare Erkenntnisse aus Daten zu gewinnen Klassifikation ordnet neue Datenpunkte in Klassen ein, deren Charakteristika vorab anhand von

Mehr

VII.3 Assoziationsregeln

VII.3 Assoziationsregeln VII.3 Assoziationsregelverfahren VII.3. Einführung [Bollinger 96] VII.3 Assoziationsregeln Algorithmen zum Entdecken von Assoziationsregeln sind typische Vertreter von Data Mining Verfahren. Assoziationsregeln

Mehr

Übersicht. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007

Übersicht. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007 Übersicht Grundlagen für Assoziationsregeln Apriori Algorithmus Verschiedene Datenformate Finden von Assoziationsregeln mit mehren unteren Schranken für Unterstützung Finden von Assoziationsregeln für

Mehr

Frequent Itemset Mining und FP-Tree

Frequent Itemset Mining und FP-Tree Übung 4 Frequent Itemset Mining und FP-Tree Frequent Itemset Mining Motivation: Es existiert eine Datenbank mit vielen Einträgen Man möchte wissen, welche Einträge oft zusammen vorkommen Frequent Itemset

Mehr

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer Matthias Pretzer matthias.pretzer@informatik.uni-oldenburg.de http://diko-project.de/ Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Inhalt: Motivation Grundlagen Anwendungsszenario

Mehr

Whisky-Empfehlungen. Whisky-Empfehlungen - Joachim Schole

Whisky-Empfehlungen. Whisky-Empfehlungen - Joachim Schole Whisky-Empfehlungen 1 Agenda Motivation Einführung in die Domäne Whisky Einführung Empfehlungssysteme Einführung KDD, Data Mining, Clustering Aktueller Stand & Aufgaben 2 Motivation Problem Whisky-Empfehlung

Mehr

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis Historische Aspekte Data Mining als Teildisziplin

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 13. Übungsblatt Aufgabe 1: Apriori Gegeben seien folgende Beobachtungen vom Kaufverhalten von Kunden: beer chips dip

Mehr

Projekt-INF Folie 1

Projekt-INF Folie 1 Folie 1 Projekt-INF Entwicklung eines Testbed für den empirischen Vergleich verschiedener Methoden des maschinellen Lernens im Bezug auf die Erlernung von Produktentwicklungswissen Folie 2 Inhalt Ziel

Mehr

Item-based Collaborative Filtering

Item-based Collaborative Filtering Item-based Collaborative Filtering Paper presentation Martin Krüger, Sebastian Kölle 28.04.2011 Seminar Collaborative Filtering KDD Cup 2011: Aufgabenbeschreibung Track 1 Item-based Collaborative Filtering

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation Literatur Inhalt und Ziele der Vorlesung Beispiele aus der Praxis 2 Organisation Vorlesung/Übung + Projektarbeit. 4 Semesterwochenstunden.

Mehr

Case-Based Reasoning und anderen Inferenzmechanismen

Case-Based Reasoning und anderen Inferenzmechanismen Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining

Mehr

Data Mining zur Entscheidungsunterstützung in der Hydrologie

Data Mining zur Entscheidungsunterstützung in der Hydrologie Data Mining zur Entscheidungsunterstützung in der Hydrologie Thomas Seidl, Ralph Krieger, Ira Assent, Boris Glavic, Heribert Nacken, Sabine Bartusseck, Hani Sewilam Zusammenfassung Zur Umsetzung der europäischen

Mehr

Gliederung. 1. Einleitung (1) 1. Einleitung (2) On detecting differences between groups

Gliederung. 1. Einleitung (1) 1. Einleitung (2) On detecting differences between groups Seminar im Fach Informatik Sommersemester 2006 Sascha Rüger Gliederung 1. Einleitung 2. Data Mining Systeme 3. Auswertung 4. Weitere Untersuchungen 5. Fazit 1. Einleitung (1) wichtige Aufgabe der Datenanalyse:

Mehr

Häufige Mengen ohne Kandidatengenerierung. FP-Tree: Transaktionen. Konstruktion eines FP-Trees. FP-Tree: Items

Häufige Mengen ohne Kandidatengenerierung. FP-Tree: Transaktionen. Konstruktion eines FP-Trees. FP-Tree: Items Häufige Mengen ohne Kandidatengenerierung Jiawei Han, Micheline Kamber 2006 (2nd ed.)! Ziel 1: Kompression der Datenbank in eine Frequent-Pattern Tree Struktur (FP-Tree)! Stark komprimiert, vollständig

Mehr

Zeitaspekte. Fabian Bauschulte

Zeitaspekte. Fabian Bauschulte Zeitaspekte Fabian Bauschulte 1 Zeitaspekte Überblick Zeitreihen (engl. time series) Zeitphänomene [Morik/2000a] Lernaufgaben und Repräsentation der Eingabedaten Clustering [Das et al.] Beziehungen zwischen

Mehr

Klausur Algorithmen und Datenstrukturen II 29. Juli 2013

Klausur Algorithmen und Datenstrukturen II 29. Juli 2013 Technische Universität Braunschweig Sommersemester 2013 Institut für Betriebssysteme und Rechnerverbund Abteilung Algorithmik Prof. Dr. Sándor P. Fekete Stephan Friedrichs Klausur Algorithmen und Datenstrukturen

Mehr

4. Assoziationsregeln

4. Assoziationsregeln 4.1 Einleitung 4. Assoziationsregeln Inhalt dieses Kapitels Transaktionsdatenbanken, Warenkorbanalyse 4.2 Einfache Assoziationsregeln Grundbegriffe, Aufgabenstellung, Apriori-Algorithmus, Hashbäume, Interessantheit

Mehr

XML & Intelligente Systeme. - XQuery Teil 2 - Datamining auf XML Dokumenten

XML & Intelligente Systeme. - XQuery Teil 2 - Datamining auf XML Dokumenten - XQuery Teil 2 - Datamining auf XML Dokumenten Seminarvortrag von Dominik Westhues dwesthue@techfak.uni-bielefeld.de 21.11.2005 Überblick XQuery & Datamining Verknüpfungsregeln Apriori Algorithmus Verknüpfungsregel

Mehr

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der

Mehr

Moment: Maintaining Closed Frequent Itemsets over a Stream Sliding Window

Moment: Maintaining Closed Frequent Itemsets over a Stream Sliding Window Institut für Informatik Moment: Maintaining Closed Frequent Itemsets over a Stream Sliding Window Yun Chi, Haixun Wang, Philip S. Yu, Richard R. Muntz Hauptseminar Data Science - SS 2016 Team D: Julian

Mehr

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Text Mining und Textzusammenfassung Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Übersicht 1. Definition 2. Prozessablauf 3. Textzusammenfassung 4. Praxisbeispiel Definition Text Mining is the art

Mehr

Kapitel 1: Einleitung

Kapitel 1: Einleitung Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2008/2009 Kapitel

Mehr

Zum Buch Hinweise Handhabung des Buchs Website In eigener Sache... 19

Zum Buch Hinweise Handhabung des Buchs Website In eigener Sache... 19 Vorwort 13 Zum Buch.................................................... 15 Hinweise..................................................... 17 Handhabung des Buchs.........................................

Mehr

Häufige Mengen ohne Kandidatengenerierung

Häufige Mengen ohne Kandidatengenerierung Häufige Mengen ohne Kandidatengenerierung Jiawei Han, Micheline Kamber 2006 (2nd ed.) Ziel 1: Kompression der Datenbank in eine Frequent-Pattern Tree Struktur (FP-Tree) Stark komprimiert, vollständig bzgl.

Mehr

Temporale Aspekte entdeckten Wissens: Ein Bezugssystem für die Evolution von Mustern

Temporale Aspekte entdeckten Wissens: Ein Bezugssystem für die Evolution von Mustern Temporale Aspekte entdeckten Wissens: Ein Bezugssystem für die Evolution von Mustern D I S S E R T A T I O N zur Erlangung des akademischen Grades doctor rerum politicarum (dr. rer. pol.) im Fach Wirtschaftswissenschaft

Mehr

Process Mining bei Softwareprozessen

Process Mining bei Softwareprozessen Process Mining bei Softwareprozessen Prof. Dr. Ralf Kneuper PVM 2016 Dipl.-Mathematiker, Univ. Bonn PhD Computer Science, Univ. of Manchester Professor für Wirtschaftsinformatik, Internationale Hochschule

Mehr

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Business Intelligence Master Digitale Logistik und Management Projektbericht Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Matthias Säger

Mehr

Datenstrukturen & Algorithmen

Datenstrukturen & Algorithmen Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale

Mehr

Entdeckung häufiger Episoden und repräsentativer Episode-Regeln in Ereignis-Sequenzen

Entdeckung häufiger Episoden und repräsentativer Episode-Regeln in Ereignis-Sequenzen Diplomarbeit Entdeckung häufiger Episoden und repräsentativer Episode-Regeln in Ereignis-Sequenzen Nuhad Shaabani Lehrstuhl für künstliche Intelligenz Fachbereich Informatik Universität Dortmund Dortmund,

Mehr

Programm heute. Algorithmen und Datenstrukturen (für ET/IT) Entartete Suchbäume. Beispiel: Balancieren von Suchbaum. Wintersemester 2012/13

Programm heute. Algorithmen und Datenstrukturen (für ET/IT) Entartete Suchbäume. Beispiel: Balancieren von Suchbaum. Wintersemester 2012/13 Programm heute Algorithmen und Datenstrukturen (für ET/IT) Wintersemester / Fortgeschrittene Datenstrukturen Dr. Tobias Lasser Computer Aided Medical Procedures Technische Universität München 8 Such-Algorithmen

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Einführungsveranstaltung

INTELLIGENTE DATENANALYSE IN MATLAB. Einführungsveranstaltung INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation. Literatur. Inhalt und Ziele der Vorlesung. Beispiele aus der Praxis. 2 Organisation Vorlesung/Übung + Projektarbeit.

Mehr

Frequent Pattern discovery. Hauptseminar Machine Learning WS 2003/04 Bearbeiter: Marius Morawski Betreuer: Stefan Kramer

Frequent Pattern discovery. Hauptseminar Machine Learning WS 2003/04 Bearbeiter: Marius Morawski Betreuer: Stefan Kramer Frequent Pattern discovery Hauptseminar Machine Learning WS 2003/04 Bearbeiter: Marius Morawski Betreuer: Stefan Kramer Einleitung Problemstellung: Finden von Mustern/Regelmäßigkeiten in großen Datenbeständen

Mehr

Präsentation zur Diplomprüfung. Thema der Diplomarbeit:

Präsentation zur Diplomprüfung. Thema der Diplomarbeit: Präsentation zur Diplomprüfung Thema der Diplomarbeit: Analyse der Einsatzmöglichkeiten von Data Mining- Verfahren innerhalb einer Unternehmens - Balanced Scorecard und Entwicklung eines Empfehlungskatalogs.

Mehr

Informationszuwachs - Wissensschwund? Die strategische Bedeutung des Wissensmanagements

Informationszuwachs - Wissensschwund? Die strategische Bedeutung des Wissensmanagements Wissensmanagement Informationszuwachs - Wissensschwund? Die strategische Bedeutung des Wissensmanagements Herausgegeben von Univ.-Prof. Dr. Heinz Mandl und Dr. Gabi Reinmann-Rothmeier R.Oldenbourg Verlag

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Vorlesung Wissensentdeckung Apriori 22.4.2010 Gliederung 1 Apriori 2 FP-Tree Lernen von Assoziationsregeln Gegeben: R eine Menge von Objekten, die binäre Werte haben t eine Transaktion, t R r eine Menge

Mehr

Modulliste. für den Bachelorstudiengang. Wirtschaftsinformatik. an der Otto von Guericke Universität Magdeburg Fakultät für Informatik

Modulliste. für den Bachelorstudiengang. Wirtschaftsinformatik. an der Otto von Guericke Universität Magdeburg Fakultät für Informatik Modulliste für den Bachelorstudiengang Wirtschaftsinformatik an der Otto von Guericke Universität Magdeburg Fakultät für Informatik vom Sommersemester 2019 Der Bachelorstudiengang Wirtschaftsinformatik

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Vorlesung Wissensentdeckung Apriori Katharina Morik, Claus Weihs 23.4.2015 Katharina Morik, Claus Weihs DMV 1 / 47 Gliederung 1 Apriori 2 FP-Tree Katharina Morik, Claus Weihs DMV 2 / 47 Lernen von Assoziationsregeln

Mehr

Studienarbeit. Maria Soldatova

Studienarbeit. Maria Soldatova Leibniz Universität Hannover Fakultät für Elektrotechnik und Informatik Fachgebiet Datenbanken und Informationssysteme im Studiengang Mathematik mit Studienrichtung Informatik Diskussion und Implementierung

Mehr

Data Mining und Knowledge Discovery in Databases

Data Mining und Knowledge Discovery in Databases Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining

Mehr

Einführung in die Informatik I

Einführung in die Informatik I Einführung in die Informatik I Kapitel I.5: Verzweigungen Prof. Dr.-Ing. Marcin Grzegorzek Juniorprofessur für Mustererkennung im Institut für Bildinformatik Department Elektrotechnik und Informatik Fakultät

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Gliederung Vorlesung Wissensentdeckung 1 2 16.7.2009 Lernen von Assoziationsregeln Binäre Datenbanken Gegeben: R eine Menge von Objekten, die binäre Werte haben t eine Transaktion, t R r eine Menge von

Mehr

Algorithmen und Datenstrukturen

Algorithmen und Datenstrukturen Algorithmen und Datenstrukturen Wintersemester 2012/13 17. Vorlesung Nächstes Paar Prof. Dr. Alexander Wolff Lehrstuhl für Informatik I Problem: Gegeben: Menge P von n Punkten in der Ebene, jeder Punkt

Mehr