Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid"

Transkript

1 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Institut für Statistik LMU München Sommersemester 2013

2 Zielsetzung Gegeben: Datenmatrix D mit Werten von p Variablen Ziel: Finde Kombinationen von Werten, die mit hoher Wahrscheinlichkeit auftreten ( Aufdeckung von Assoziationen zwischen den Variablen) Unsupervised learning Im Folgenden: Alle Variablen werden als binär angenommen (entspricht Dummy-Kodierung von kategoriellen Variablen) Beispiel: Supermarkt-Daten n Transaktionen p Items / gekaufte Artikel Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 1 / 22

3 Beispiel: Supermarkt Fünf Transaktionen: Kunde 1 Kunde 2 Kunde 3 Kunde 4 Kunde 5 Milch, Brot Brot, Butter Bier Milch, Brot, Butter Brot, Butter Kann man aus den gegebenen Transaktionen Regeln für ein mögliches Kaufverhalten ableiten? Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 2 / 22

4 Assoziationsregeln - formale Darstellung Gegeben ist eine Menge I = {i 1,..., i p } von p binären Items und eine Menge D = {t 1,..., t n } mit n Transaktionen (die Database). Jede Transaktion hat eine eindeutige ID und besteht aus einer Teilmenge der Items in I. Supermarkt-Beispiel: Items I = {Milch, Brot, Butter, Bier} mit der Transaktions-Database D = ID Milch Brot Butter Bier Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 3 / 22

5 Assoziationsregeln - formale Darstellung / 2 Eine Assoziationsregel ist definiert als eine Implikation X Y mit X, Y I und X Y =. X und Y sind also Mengen von Items, sogenannte Itemsets. Supermarkt-Beispiel: Eine mögliche Regel wäre zum Beispiel {Milch, Brot} {Butter}. D.h. wenn ein Kunde Milch und Brot kauft, dann kauft er auch sehr wahrscheinlich Butter. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 4 / 22

6 Assoziationsregeln - formale Darstellung / 3 Gegeben ist die Menge aller möglichen Regeln (Potenzmenge P(I)): {Milch} {Brot} {Butter} {Brot} {Bier, Milch} {Butter} {Bier, Butter} {Milch} {Butter, Milch} {Brot} Und wie findet man nun die interessanten Regeln? Um interessante Regeln in der Menge aller möglichen Regeln zu finden, werden Maßzahlen für Support und Confidence definiert und Schwellwerte für diese festgelegt. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 5 / 22

7 Support Der Support eines Itemsets X, supp(x), ist definiert als der Anteil an Transaktionen in der Database, welche X beinhalten (d.h. die relative Häufigkeit des Itemsets). Der Support einer Regel supp(x Y ) ist definiert als der Support der vereinigten Itemsets X und Y : supp(x Y ) (d.h. die relative Häufigkeit der Transaktionen, in denen die Regel anwendbar ist). Interpretation: Support entspricht der Prävalenz des Itemsets, das einer Regel zu Grunde liegt. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 6 / 22

8 Support / 2 Supermarkt-Beispiel: Das Itemset {Milch, Brot} kommt in 2 von 5 Transaktionen vor, also supp({milch, Brot}) = 2 5 = 0.4 D.h. in 40% der Transaktionen kommen Milch und Brot zusammen vor. Entspricht der Wahrscheinlichkeit P(Milch Brot). Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 7 / 22

9 Confidence Die Confidence einer Regel ist definiert als: conf (X Y ) = supp(x Y ) supp(x) (d.h. die relative Häufigkeit der Transaktionen, in denen die Regel richtig ist). Interpretation: Confidence misst die Stärke der Regel. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 8 / 22

10 Confidence / 2 Supermarkt-Beispiel: Die Regel {Milch, Brot} {Butter} hat eine Confidence von supp({milch, Brot, Butter}) supp({milch, Brot}) = 1/5 2/5 = = 0.5. D.h. für 50% der Transaktionen, welche Milch und Brot beinhalten, ist die Regel korrekt. Confidence entspricht der bedingten Wahrscheinlichkeit P(Butter Milch, Brot). Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 9 / 22

11 Starke Regeln Assoziationsregeln müssen einen benutzerdefinierten 1. minimalen Support s (die Items einer Regel sind in mindestens s 100% der Transaktionen der Database vorhanden) und eine 2. minimale Confidence c (für mindestens c 100% der Transaktionen, für welche die linke Seite der Regel zutrifft, gilt auch die rechte Seite der Regel) erfüllen. Eine Regel heißt stark, wenn sie beide Schwellwerte s und c erfüllt. Beispiel: Support mindestens 10%, Confidence mindestens 80%. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 10 / 22

12 Assoziationsanalyse Die Assoziationsanalyse bezeichnet die Suche nach starken Regeln. Problem: Es existieren 2 p mögliche Itemsets ( Fluch der Dimensionalität). Regeln werden daher in einem Zwei-Schritt-Verfahren gefunden: 1. Suche zunächst alle häufigen Itemsets in der Database, d.h. all jene Itemsets, welche den minimalen Support s erfüllen. 2. Forme starke Regeln mit Hilfe der häufigen Itemsets und der minimalen Confidence c. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 11 / 22

13 Apriori-Algorithmus Apriori-Algorithmus zum Finden von starken Regeln: R. Agrawal, H. Mannila, R. Srikant, H. Toivonen and A. I. Verkamo (1995): Fast Discovery of Association Rules, Advances in Knowledge Discovery and Data Mining, Chapter 12, AAAI/MIT Press, Cambridge, MA. Iterativer Algorithmus, der (1) alle häufigen Itemsets bezüglich des minmalen Supports s unter Zuhilfenahme der Apriori-Eigenschaft findet und (2) daraus starke Regeln bezüglich der Confidence c generiert. Apriori-Eigenschaft: Alle Teilmengen einer häufigen Itemmenge sind ebenfalls häufige Itemmengen. Alle Obermengen einer nicht-häufigen Itemmenge sind ebenfalls nicht-häufig. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 12 / 22

14 1. Suche alle häufigen Itemsets 1. C 1 alle 1-elementigen Teilmengen der Menge I L 1 alle 1-elementigen Teilmengen aus C 1 mit supp s 2. So lange L j (j = 2,...): 2.1 (join) Berechnung der Menge aller möglichen j-elementigen Itemsets C j durch Fusion der häufigen (j 1)-elementigen Itemsets aus der vorigen Iteration mit den Elementen aus L (prune) Berechnung der Menge der wirklichen häufigen Itemsets L j = {l l C j, supp(l) s} 3. Alle häufigen Itemsets sind j L j Hinreichend große Werte für s und c sind essentiell, um die Laufzeit des Verfahrens zu begrenzen. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 13 / 22

15 1. Suche alle häufigen Itemsets / 2 Supermarkt-Beispiel: Welche sind die häufigen Itemsets bei einem definierten minimalen Support von 2/5? Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 14 / 22

16 2. Forme starke Regeln Für jedes häufige Itemset Z : 1. C 1 alle Regeln der Form X Y mit Y = 1 und X = Z \Y H 1 alle Regeln (mit Itemmengen bestehend aus je einer gefundenen Konklusion) aus C 1 mit conf c 2. Solange H j (j = 2,...): 2.1 (join) Berechnung der Menge aller möglichen Regeln C j aus H j 1 mit Y = j und X = Z \Y 2.2 (prune) Berechnung der Menge aller wirklichen Regeln H j mit H j = {h h C j, conf (h) c} 3. Alle starken Regeln für das häufige Itemset Z sind j H j Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 15 / 22

17 2. Forme starke Regeln / 2 Supermarkt-Beispiel: Was sind die starken Regeln bei einer definierten minimalen Confidence von 0.8? Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 16 / 22

18 Software Paket arules: Michael Hahsler, Christian Buchta, Bettina Gruen and Kurt Hornik, arules: Mining Association Rules and Frequent Itemsets. R package version Paket arulesviz: Michael Hahsler and Sudheer Chelluboina, arulesviz: Visualizing Association Rules and Frequent Itemsets. R package version Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 17 / 22

19 Irreführende Assoziationsregeln Problem: Trotz Erfüllung des minimalen Supports s und der minimalen Confidence c muss eine Regel nicht interessant sein! Beispiel: Itemset {X, Y } mit Dann ist supp(x) = 0.6, supp(y ) = 0.75 und supp(x Y ) = conf (X Y ) = supp(x Y ) supp(x) = = Confidence ist genauso groß wie der Support von Y. Sie spiegelt also nur den Support von Y wider und gibt keine Aussage über den Zusammenhang zwischen X und Y. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 18 / 22

20 Weitere Maßzahl: Lift Der Lift einer Regel ist definiert als das Verhältnis der beobachteten Confidence zur erwarteten Confidence: lift(x Y ) = conf (X Y ) supp(y ) = supp(x Y ) supp(x) supp(y ) Interpretation: beschreibt Korrelation zwischen den Items: lift = 1 keine Korrelation zwischen X und Y lift > 1 positive Korrelation lift < 1 negative Korrelation Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 19 / 22

21 Weitere Maßzahl: Lift / 2 Supermarkt-Beispiel: Die Regel {Milch, Brot} {Butter} hat einen Lift von D.h. Butter tritt in Itemsets, die Milch und Brot beinhalten, um 25% häufiger auf als in Kombination mit Items, von denen Butter unabhängig ist. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 20 / 22

22 Weitere Maßzahlen Der Support misst die Signifikanz einer Regel, während die Confidence das Interesse einer Regel misst. Da es viele Möglichkeiten gibt, Signifikanz und Interesse zu operationalisieren, existieren alternative Maßzahlen: All-confidence, Collective strength, Coverage, Conviction, etc. measures.html gibt eine Beschreibung weiterer gängiger Maßzahlen. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 21 / 22

23 Mehr zu... Itemsets: Maximale häufige Itemsets: Ein häufiges Itemset heißt maximal, wenn es keine Teilmenge eines anderen häufigen Itemsets ist. Abgeschlossene häufige Itemsets: Ein häufiges Itemset heißt abgeschlossen, wenn keine echte Übermenge mit demselben Support existiert. Algorithmen: Eine Alternative zum Apriori-Algorithmus, die auf einer statistischen Grundlage basiert, ist das sogenannte Bump Hunting; ein Algorithmus dazu ist PRIM (patient rule induction method). Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 22 / 22

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

5. Assoziationsregeln

5. Assoziationsregeln 5. Generieren von Assoziationsregeln Grundbegriffe 5. Assoziationsregeln Assoziationsregeln beschreiben gewisse Zusammenhänge und Regelmäßigkeiten zwischen verschiedenen Dingen, z.b. den Artikeln eines

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold Algorithms for Pattern Mining AprioriTID Stefan George, Felix Leupold Gliederung 2 Einleitung Support / Confidence Apriori ApriorTID Implementierung Performance Erweiterung Zusammenfassung Einleitung 3

Mehr

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren?

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren? Mining über RDBMSe von Christian Widmer Wie gut lässt sich Mining mit SQL realisieren? Müssen neue Konstrukte zur Verfügung gestellt werden, wenn ja welche? Vortragsüberblick Association Rules Apriori

Mehr

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus FernUniversität in Hagen Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln Thema 1.1.1 Der Apriori-Algorithmus Referentin: Olga Riener Olga Riener. Thema 1.1.1. Der

Mehr

VII.3 Assoziationsregeln

VII.3 Assoziationsregeln VII.3 Assoziationsregelverfahren VII.3. Einführung [Bollinger 96] VII.3 Assoziationsregeln Algorithmen zum Entdecken von Assoziationsregeln sind typische Vertreter von Data Mining Verfahren. Assoziationsregeln

Mehr

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren

Mehr

WIRTSCHAFTSUNIVERSITÄT WIEN DIPLOMARBEIT

WIRTSCHAFTSUNIVERSITÄT WIEN DIPLOMARBEIT WIRTSCHAFTSUNIVERSITÄT WIEN DIPLOMARBEIT Titel der Diplomarbeit: Visualisierung von Assoziationsregeln mit R Verfasserin/Verfasser: Martin Vodenicharov Matrikel-Nr.: 0253795 Studienrichtung: Betriebswirtschaft

Mehr

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock. Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.de 1 Informationsflut Amazon: Alle lieferbaren Bücher (930.000 Titeln

Mehr

Warenkorbanalyse mit Hilfe der Statistiksoftware R

Warenkorbanalyse mit Hilfe der Statistiksoftware R Warenkorbanalyse mit Hilfe der Statistiksoftware R Michael Hahsler (1), Kurt Hornik (2) & Thomas Reutterer (3) (1) Institut für Informationswirtschaft, WU-Wien. (2) Institut für Statistik und Mathematik,

Mehr

4. Assoziationsregeln. 4.1 Einleitung. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation

4. Assoziationsregeln. 4.1 Einleitung. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation 4.1 Einleitung 4. Assoziationsregeln Inhalt dieses Kapitels Transaktionsdatenbanken, Warenkorbanalyse 4.2 Einfache Assoziationsregeln Grundbegriffe, Aufgabenstellung, Apriori-Algorithmus, Hashbäume, Interessantheit

Mehr

Data Mining im Einzelhandel Methoden und Werkzeuge

Data Mining im Einzelhandel Methoden und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.

Mehr

Erkennung Sequenzieller Muster Algorithmen und Anwendungen

Erkennung Sequenzieller Muster Algorithmen und Anwendungen Achim Eisele, Thema 1.4.3: Sequenzielle Muster 1 FernUniversität in Hagen Seminar 01912 im Sommersemester 2008 Erkennung Sequenzieller Muster Algorithmen und Anwendungen Thema 1.4.3: Sequenzielle Muster

Mehr

4.1 Einleitung. 4. Assoziationsregeln. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation. Assoziationsregeln

4.1 Einleitung. 4. Assoziationsregeln. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation. Assoziationsregeln 4.1 Einleitung 4. Assoziationsregeln Inhalt dieses Kapitels Transaktionsdatenbanken, Warenkorbanalyse 4.2 Einfache Assoziationsregeln Grundbegriffe, Aufgabenstellung, Apriori-Algorithmus, Hashbäume, Interessantheit

Mehr

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis Historische Aspekte Data Mining als Teildisziplin

Mehr

DBS5 Kap. 4. Data Mining

DBS5 Kap. 4. Data Mining DBS5 Kap. 4 Data Mining Klassifikationen und Cluster-Bildung: Auffinden von Regeln zur Partitionierung von Daten in disjunkte Teilmengen (Anwendungsbeispiel: Risikoabschätzung) bzw. Herstellen von Gruppierungen

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Masterarbeit. im Studiengang Informatik. Kombinationen von Data Mining-Verfahren: Analyse und Automatisierung. Ulf Mewe Matrikel.-Nr.

Masterarbeit. im Studiengang Informatik. Kombinationen von Data Mining-Verfahren: Analyse und Automatisierung. Ulf Mewe Matrikel.-Nr. LEIBNIZ UNIVERSITÄT HANNOVER FAKULTÄT FÜR ELEKTROTECHNIK UND INFORMATIK INSTITUT FÜR PRAKTISCHE INFORMATIK FACHGEBIET DATENBANKEN UND INFORMATIONSSYSTEME Masterarbeit im Studiengang Informatik Kombinationen

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

Mining top-k frequent itemsets from data streams

Mining top-k frequent itemsets from data streams Seminar: Maschinelles Lernen Mining top-k frequent itemsets from data streams R.C.-W. Wong A.W.-C. Fu 1 Gliederung 1. Einleitung 2. Chernoff-basierter Algorithmus 3. top-k lossy counting Algorithmus 4.

Mehr

Bachelorarbeit. Jörn Slotta. Vergleich von Algorithmen zur Assoziationsanalyse basierend auf Webserver Logfiles

Bachelorarbeit. Jörn Slotta. Vergleich von Algorithmen zur Assoziationsanalyse basierend auf Webserver Logfiles Bachelorarbeit Jörn Slotta Vergleich von Algorithmen zur Assoziationsanalyse basierend auf Webserver Logfiles Fakultät Technik und Informatik Studiendepartment Informatik Faculty of Engineering and Computer

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

Assoziationsanalyse und Konzeptbeschreibung

Assoziationsanalyse und Konzeptbeschreibung Assoziationsanalyse und Konzeptbeschreibung Helge Saathoff 7. März 2003 ABSTRACT Wir leben im Informationszeitalter. Fortschritte in der Hard- und Softwaretechnologie haben es ermöglicht, daß heutzutage

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Anwendung der Business Analytics

Anwendung der Business Analytics Anwendung der Business Analytics TDWI 2013 München Prof. Dr. Carsten Felden Dipl.-Wirt.-Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg (Sachsen) Institut für Wirtschaftsinformatik

Mehr

6. Überblick zu Data Mining-Verfahren

6. Überblick zu Data Mining-Verfahren 6. Überblick zu Data Mining-Verfahren Einführung Clusteranalse k-means-algorithmus Klassifikation Klassifikationsprozess Konstruktion eines Entscheidungsbaums Assoziationsregeln / Warenkorbanalse Support

Mehr

Quantitatives Frequent-Pattern Mining über Datenströmen

Quantitatives Frequent-Pattern Mining über Datenströmen Quantitatives Frequent-Pattern Mining über Datenströmen Daniel Klan, Thomas Rohe Department of Computer Science & Automation TU Ilmenau, Germany {first.last}@tu-ilmenau.de Abstract Das Aufdecken unbekannter

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne

Mehr

Ein lernendes System zurverbesserung der Datenqualität und Datenqualitätsmessung

Ein lernendes System zurverbesserung der Datenqualität und Datenqualitätsmessung Ein lernendes System zurverbesserung der Datenqualität und Datenqualitätsmessung Jens Lüssem, Peter Tasev, Maren Tiedemann-Muhlack 2 Institut für Informatik III 2 Middle Office Universität Bonn HSH Nordbank

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Universität Ulm Seminararbeit zum Thema Data Mining und Statistik: Gemeinsamkeiten und Unterschiede vorgelegt von: Daniel Meschenmoser betreut von: Dr. Tomas Hrycej Dr. Matthias Grabert Ulm, im Februar

Mehr

Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse

Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse von Peter Gerngroß Was ist Assoziationsanalyse? Das früheste bekannte Beispiel für die Nutzung von Assoziationsanalysen

Mehr

Kapitel 13: Pattern Mining unter Constraints

Kapitel 13: Pattern Mining unter Constraints Kapitel 13: Pattern Mining unter Dieses Kapitel: Nicht mehr Suche nach allen Frequent Itemsets/Association Rules, sondern Einschränkung der Ziel-Menge. Strukturen, auf denen wir operieren, sind wie bisher

Mehr

5 Data Warehouses und Data Mining

5 Data Warehouses und Data Mining 5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher

Mehr

Kapitel 15: Mining von Sequential Patterns

Kapitel 15: Mining von Sequential Patterns Kapitel 15: Mining von Sequential Patterns Lernziele Weitere Art von Sequential Patterns/ Constraints für den Mining Prozeß kennenlernen. Erkennen, daß Generate&Test Paradigma für diverse Mining-Problemstellungen

Mehr

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren Reihung von Versuchsitems und Distraktoren Reihung von Versuchsitems und Distraktoren Hinweis D1 (Verhältnis Distraktoren:Versuchsitems): Es sollten Distraktoren eingebaut werden, im Falle von Sprecherbefragungen

Mehr

6. Überblick zu Data Mining-Verfahren

6. Überblick zu Data Mining-Verfahren 6. Überblick zu Data Mining-Verfahren Einführung Clusteranalyse k-means-algorithmus Canopy Clustering Klassifikation Klassifikationsprozess Konstruktion eines Entscheidungsbaums Assoziationsregeln / Warenkorbanalyse

Mehr

Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)

Fragenkatalog zur Vorlesung Grundlagen des Data Mining (WS 2006/07) Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07) 1. Grenzen Sie die Begriffe "Daten" und "Wissen" mit je 3 charakteristischen Eigenschaften gegeander ab. 2. Nennen Sie vier verschiedene

Mehr

Beschreibung von Web- Nutzungsverhalten unter Verwendung von Data Mining Techniken

Beschreibung von Web- Nutzungsverhalten unter Verwendung von Data Mining Techniken Diplomarbeit Beschreibung von Web- Nutzungsverhalten unter Verwendung von Data Mining Techniken Irina Alesker Diplomarbeit am Fachbereich Informatik der Universität Dortmund 23. Juni 2005 Betreuer: Prof.

Mehr

Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man

Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man x / M. Man sagt, M ist Teilmenge von N und schreibt M N, wenn für jedes x M auch x N gilt.

Mehr

Einführung in die Wahrscheinlichkeitsrechnung

Einführung in die Wahrscheinlichkeitsrechnung Einführung in die Wahrscheinlichkeitsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung

Mehr

1. Welche Eigenschaften sollte ein Pseudo-Random Generator haben?

1. Welche Eigenschaften sollte ein Pseudo-Random Generator haben? Die Themen 1. Welche Eigenschaften sollte ein Pseudo-Random Generator haben? Er sollte von wirklichen Zufallsgeneratoren nicht unterscheidbar sein?! Eine viel zu starke Forderung: Stattdessen sollte ein

Mehr

Zusammenhangsanalyse in Kontingenztabellen

Zusammenhangsanalyse in Kontingenztabellen Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel

Mehr

Ermittlung charakteristischer Datensätze durch Data Mining

Ermittlung charakteristischer Datensätze durch Data Mining Ermittlung charakteristischer Datensätze durch Data Mining Diplomarbeit im Fach Informatik vorgelegt von Mathias Ruoss Winterthur Matrikelnummer 00-917-575 Angefertigt am Institut für Informatik der Universität

Mehr

Assoziationsbasierte Trenderkennung auf Microblogdaten

Assoziationsbasierte Trenderkennung auf Microblogdaten Assoziationsbasierte Trenderkennung auf Microblogdaten Master-Thesis von Klaus Wilhelmi Tag der Einreichung: 1. Gutachten: Prof. Johannes Fürnkranz 2. Gutachten: Dr. Frederik Janssen Fachbereich Informatik

Mehr

Teil X Business Intelligence Anwendungen

Teil X Business Intelligence Anwendungen Teil X Business Intelligence Anwendungen Business Intelligence Anwendungen 1 Begriffsklärung c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung: 19.09.2012 10 1 Business Intelligence

Mehr

Teil X Business Intelligence Anwendungen

Teil X Business Intelligence Anwendungen Teil X Business Intelligence Anwendungen Business Intelligence Anwendungen 1 Begriffsklärung 2 3 Report & BSC c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung: 20.01.2012 10 1 Begriffsklärung

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

On-Line Analytical Processing

On-Line Analytical Processing OLAP und Data Mining ƒ OLAP Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen ƒ Data Mining Begriff und Prozeß Verfahren Vorlesung Data-Warehouse-Technologien 9-1 On-Line Analytical Processing

Mehr

OLAP und Data Mining. On-Line Analytical Processing. Coddsche Regeln OLAP. Data Mining. Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen

OLAP und Data Mining. On-Line Analytical Processing. Coddsche Regeln OLAP. Data Mining. Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen OLAP und Data Mining OLAP Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen Data Mining Begriff und Prozeß Verfahren Vorlesung Data-Warehouse-Technologien 9-1 On-Line Analytical Processing

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Sitzung 4: Übungsaufgaben für Statistik 1

Sitzung 4: Übungsaufgaben für Statistik 1 1 Sitzung 4: Übungsaufgaben für Statistik 1 Aufgabe 1: In einem Leistungstest werden von den Teilnehmern folgende Werte erzielt: 42.3; 28.2; 30.5, 32.0, 33.0, 38.8. Geben Sie den Median, die Spannweite

Mehr

Vorlesung. Datenschutz und Privatheit in vernetzten Informationssystemen

Vorlesung. Datenschutz und Privatheit in vernetzten Informationssystemen Vorlesung Datenschutz und Privatheit in vernetzten Informationssystemen Kapitel 7: Privacy Preserving Data Mining Thorben Burghardt, Erik Buchmann buchmann@ipd.uka.de Thanks to Chris Clifton & Group IPD,

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Population und Stichprobe: Wahrscheinlichkeitstheorie

Population und Stichprobe: Wahrscheinlichkeitstheorie Population und Stichprobe: Wahrscheinlichkeitstheorie SS 2001 4. Sitzung vom 15.05.2001 Wahrscheinlichkeitstheorie in den Sozialwissenschaften: Stichprobenziehung: Aussagen über Stichprobenzusammensetzung

Mehr

Grundbegriffe der Wahrscheinlichkeitsrechnung

Grundbegriffe der Wahrscheinlichkeitsrechnung Algorithmen und Datenstrukturen 349 A Grundbegriffe der Wahrscheinlichkeitsrechnung Für Entwurf und Analyse randomisierter Algorithmen sind Hilfsmittel aus der Wahrscheinlichkeitsrechnung erforderlich.

Mehr

Surjektive, injektive und bijektive Funktionen.

Surjektive, injektive und bijektive Funktionen. Kapitel 1: Aussagen, Mengen, Funktionen Surjektive, injektive und bijektive Funktionen. Definition. Sei f : M N eine Funktion. Dann heißt f surjektiv, falls die Gleichung f(x) = y für jedes y N mindestens

Mehr

Johann Wolfgang Goethe-Universität Frankfurt am Main

Johann Wolfgang Goethe-Universität Frankfurt am Main Johann Wolfgang Goethe-Universität Frankfurt am Main Fachbereich Informatik (20) Praktische Informatik PD Dr. R. Brause Neuronales Data Mining zur Mißbrauchserkennung bei Kreditkartentransaktionen R. Brause,

Mehr

Eliciting Requirements for a Company-wide Data Leakage Prevention System

Eliciting Requirements for a Company-wide Data Leakage Prevention System Eliciting Requirements for a Company-wide Data Leakage Prevention System Stefan Gärtner, Svenja Schulz, and Kurt Schneider Software Engineering Group, Leibniz Universität Hannover, Germany Steffen Förster

Mehr

Lineare Programmierung

Lineare Programmierung Lineare Programmierung WS 2003/04 Rolle der Linearen Programmierung für das TSP 1954: Dantzig, Fulkerson & Johnson lösen das TSP für 49 US-Städte (ca. 6.2 10 60 mögliche Touren) 1998: 13.509 Städte in

Mehr

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen)

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16

Mehr

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Kursfolien Karin Haenelt 1 Übersicht Wahrscheinlichkeitsfunktion P Wahrscheinlichkeit und bedingte Wahrscheinlichkeit Bayes-Formeln

Mehr

Im allerersten Unterabschnitt wollen wir uns mit einer elementaren Struktur innerhalb der Mathematik beschäftigen: Mengen.

Im allerersten Unterabschnitt wollen wir uns mit einer elementaren Struktur innerhalb der Mathematik beschäftigen: Mengen. Kapitel 1 - Mathematische Grundlagen Seite 1 1 - Mengen Im allerersten Unterabschnitt wollen wir uns mit einer elementaren Struktur innerhalb der Mathematik beschäftigen: Mengen. Definition 1.1 (G. Cantor.

Mehr

Regelbasierte Empfehlungsdienste für Kunden im Offline-Handel Basierend auf Automatisch Geplanten Teilsortimenten

Regelbasierte Empfehlungsdienste für Kunden im Offline-Handel Basierend auf Automatisch Geplanten Teilsortimenten Universität des Saarlandes Naturwissenschaftlich-Technische Fakultät I Fachrichtung Informatik Regelbasierte Empfehlungsdienste für Kunden im Offline-Handel Basierend auf Automatisch Geplanten Teilsortimenten

Mehr

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Studienprojekt Invisible Web (Dipl.-Inform. Gudrun Fischer - WS 2003/04) Blockseminar

Mehr

Data Mining zur Entscheidungsunterstützung in der Hydrologie

Data Mining zur Entscheidungsunterstützung in der Hydrologie Data Mining zur Entscheidungsunterstützung in der Hydrologie Thomas Seidl, Ralph Krieger, Ira Assent, Boris Glavic, Heribert Nacken, Sabine Bartusseck, Hani Sewilam Zusammenfassung Zur Umsetzung der europäischen

Mehr

Wahrscheinlichkeiten

Wahrscheinlichkeiten Wahrscheinlichkeiten August, 2013 1 von 21 Wahrscheinlichkeiten Outline 1 Wahrscheinlichkeiten 2 von 21 Wahrscheinlichkeiten Zufallsexperimente Die möglichen Ergebnisse (outcome) i eines Zufallsexperimentes

Mehr

Mathematische Grundlagen der Computerlinguistik Mengen und Mengenoperationen

Mathematische Grundlagen der Computerlinguistik Mengen und Mengenoperationen Mathematische Grundlagen der Computerlinguistik Mengen und Mengenoperationen Dozentin: Wiebke Petersen 1. Foliensatz Wiebke Petersen math. Grundlagen 6 Frage Was ist eine Menge? 1 Minute zum Nachdenken

Mehr

3. Kombinatorik und Wahrscheinlichkeit

3. Kombinatorik und Wahrscheinlichkeit 3. Kombinatorik und Wahrscheinlichkeit Es geht hier um die Bestimmung der Kardinalität endlicher Mengen. Erinnerung: Seien A, B, A 1,..., A n endliche Mengen. Dann gilt A = B ϕ: A B bijektiv Summenregel:

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Anwendung der Predictive Analytics

Anwendung der Predictive Analytics TDWI Konferenz mit BARC@TDWI Track 2014 München, 23. 25. Juni 2014 Anwendung der Predictive Analytics Prof. Dr. Carsten Felden Dipl. Wirt. Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Konfidenzintervalle. die anschauliche Alternative zum p-wert...

Konfidenzintervalle. die anschauliche Alternative zum p-wert... Konfidenzintervalle die anschauliche Alternative zum p-wert... Grundidee des Konfidenzintervalls Studie Realität Studienergebnis falsch-positiver Rückschluß??? Realität???? Studie 10 % Grundidee des Konfidenzintervalls

Mehr

Räumliches Data Mining

Räumliches Data Mining Räumliches Data Mining Spatial Data Mining Data Mining = Suche nach "interessanten Mustern" in sehr großen Datensätzen => explorative Datenanlyse auch: Knowledge Discovery in Databases (KDD) verbreitete

Mehr

Methoden zur Datenanalyse

Methoden zur Datenanalyse Methoden zur Datenanalyse Inhaltsverzeichnis 1 Übersicht 2 1.1 Seite 1................................. 2 2 Statistische Schätz- und Testmethoden 3 2.1 Seite 1................................. 3 3 Methoden

Mehr

Gliederung. Bachelorseminar: Graphiken in R Visualisierung Kategorialer Daten. Einführung. Visualisierung von zweidimensionalen Kontingenztafeln

Gliederung. Bachelorseminar: Graphiken in R Visualisierung Kategorialer Daten. Einführung. Visualisierung von zweidimensionalen Kontingenztafeln Gliederung Bachelorseinar: Graphiken in R Visualisierung Kategorialer Daten Matthias Mitterayer betreut durch Sebastian Kaiser Einführung Institut für Statistik, LMU München 13. Januar 2011 Fazit Visualisierung

Mehr

Knowledge Discovery in Datenbanken I (IN5042)

Knowledge Discovery in Datenbanken I (IN5042) Knowledge Discovery in Datenbanken I (IN5042) Titel Knowledge Discovery in Databases I Typ Vorlesung mit Übung Credits 6 ECTS Lehrform/SWS 3V + 2Ü Sprache Deutsch Modulniveau Master Arbeitsaufwand Präsenzstunden

Mehr

Maschinelles Lernen und Data Mining: Methoden und Anwendungen

Maschinelles Lernen und Data Mining: Methoden und Anwendungen Maschinelles Lernen und Data Mining: Methoden und Anwendungen Eyke Hüllermeier Knowledge Engineering & Bioinformatics Fachbereich Mathematik und Informatik GFFT-Jahrestagung, Wesel, 17. Januar 2008 Knowledge

Mehr

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher Physikalisches Institut Westbau 2 OG Raum 008 Telefonnummer 07621 203 7612 E-Mail:

Mehr

Kapitel MK:V. V. Diagnoseansätze

Kapitel MK:V. V. Diagnoseansätze Kapitel MK:V V. Diagnoseansätze Diagnoseproblemstellung Diagnose mit Bayes Evidenztheorie von Dempster/Shafer Diagnose mit Dempster/Shafer Truth Maintenance Assumption-Based TMS Diagnosis Setting Diagnosis

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen

Mehr

Bachelor-, Diplom- und Masterarbeitsthemen im WS 2011/2012

Bachelor-, Diplom- und Masterarbeitsthemen im WS 2011/2012 TECHNISCHE UNIVERSITÄT ILMENAU Fakultät für Wirtschaftswissenschaften Fachgebiet für Quantitative Methoden der Wirtschaftswissenschaften Postfach 10 05 65 D-98684 Ilmenau Telefon: +49 (0)3677 69 4052 Telefax:

Mehr

Allgemeine diskrete Wahrscheinlichkeitsräume II. Beispiel II. Beispiel I. Definition 6.3 (Diskreter Wahrscheinlichkeitsraum)

Allgemeine diskrete Wahrscheinlichkeitsräume II. Beispiel II. Beispiel I. Definition 6.3 (Diskreter Wahrscheinlichkeitsraum) Allgemeine diskrete Wahrscheinlichkeitsräume I Allgemeine diskrete Wahrscheinlichkeitsräume II Verallgemeinerung von Laplaceschen Wahrscheinlichkeitsräumen: Diskrete Wahrscheinlichkeitsräume Ω endlich

Mehr

Probabilistische Primzahltests

Probabilistische Primzahltests 23.01.2006 Motivation und Überblick Grundsätzliches Vorgehen Motivation und Überblick Als Primzahltest bezeichnet man ein mathematisches Verfahren, mit dem ermittelt wird, ob eine gegebene Zahl eine Primzahl

Mehr

Ausarbeitung Prüfung Statistik und Wahrscheinlichkeitstheorie (Universität Wien)

Ausarbeitung Prüfung Statistik und Wahrscheinlichkeitstheorie (Universität Wien) Ausarbeitung Prüfung Statistik und Wahrscheinlichkeitstheorie (Universität Wien) Prüfung 28.0.03 Ausgearbeitet von Murmel (Murmel.vienna@gmx.at) Beispiel : Theorie Welche grafischen Darstellungsformen

Mehr

2.2 Ereignisse und deren Wahrscheinlichkeit

2.2 Ereignisse und deren Wahrscheinlichkeit 2.2 Ereignisse und deren Wahrscheinlichkeit Literatur: [Papula Bd., Kap. II.2 und II.], [Benning, Kap. ], [Bronstein et al., Kap. 1.2.1] Def 1 [Benning] Ein Zufallsexperiment ist ein beliebig oft wiederholbarer,

Mehr

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08 Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung

Mehr

Aufgabe 4.2 Sei G = (V, E, l) ein ungerichteter, gewichteter und zusammenhängender Graph.

Aufgabe 4.2 Sei G = (V, E, l) ein ungerichteter, gewichteter und zusammenhängender Graph. Aufgabe 4.2 Sei G = (V, E, l) ein ungerichteter, gewichteter und zusammenhängender Graph. a) Es seien W 1 = (V, E 1 ), W 2 = (V, E 2 ) Untergraphen von G, die beide Wälder sind. Weiter gelte E 1 > E 2.

Mehr

Computational Intelligence 1 / 20. Computational Intelligence Künstliche Neuronale Netze Perzeptron 3 / 20

Computational Intelligence 1 / 20. Computational Intelligence Künstliche Neuronale Netze Perzeptron 3 / 20 Gliederung / Künstliche Neuronale Netze Perzeptron Einschränkungen Netze von Perzeptonen Perzeptron-Lernen Perzeptron Künstliche Neuronale Netze Perzeptron 3 / Der Psychologe und Informatiker Frank Rosenblatt

Mehr

Iterative Lösung Linearer Gleichungssysteme

Iterative Lösung Linearer Gleichungssysteme Iterative Lösung Linearer Gleichungssysteme E. Olszewski, H. Röck, M. Watzl 1. Jänner 00 E. Olszewski, H. Röck, M. Watzl: WAP (WS 01/0) 1 Vorwort C.F.Gauß in einem Brief vom 6.1.18 an Gerling:

Mehr

Very simple methods for all pairs network flow analysis

Very simple methods for all pairs network flow analysis Very simple methods for all pairs network flow analysis Tobias Ludes 02.07.07 Inhalt Einführung Algorithmen Modifikation der Gomory-Hu Methode Einführung Nach Gomory-Hu nur n-1 Netzwerk-Fluss- Berechnungen

Mehr

Recommender-gestützte Erweiterung der Discovery in Geoportalen

Recommender-gestützte Erweiterung der Discovery in Geoportalen 232 Recommender-gestützte Erweiterung der Discovery in Geoportalen Bernhard VOCKNER und Manfred MITTLBÖCK Zusammenfassung Geoportale stellen zentrale Zugriffspunkte auf geographische (Metadaten-)Information

Mehr

(a)... ein Spieler eine Entscheidung treffen muss... (b)... der andere Spieler (Experte) über private...

(a)... ein Spieler eine Entscheidung treffen muss... (b)... der andere Spieler (Experte) über private... 1 KAP 19. Expertenberatung Wir betrachten eine Modell, in dem... (a)... ein Spieler eine Entscheidung treffen muss... (b)... der andere Spieler (Experte) über private...... entscheidungsrelevante Information

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen - nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige

Mehr