Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid

Größe: px
Ab Seite anzeigen:

Download "Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid"

Transkript

1 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Institut für Statistik LMU München Sommersemester 2013

2 Zielsetzung Gegeben: Datenmatrix D mit Werten von p Variablen Ziel: Finde Kombinationen von Werten, die mit hoher Wahrscheinlichkeit auftreten ( Aufdeckung von Assoziationen zwischen den Variablen) Unsupervised learning Im Folgenden: Alle Variablen werden als binär angenommen (entspricht Dummy-Kodierung von kategoriellen Variablen) Beispiel: Supermarkt-Daten n Transaktionen p Items / gekaufte Artikel Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 1 / 22

3 Beispiel: Supermarkt Fünf Transaktionen: Kunde 1 Kunde 2 Kunde 3 Kunde 4 Kunde 5 Milch, Brot Brot, Butter Bier Milch, Brot, Butter Brot, Butter Kann man aus den gegebenen Transaktionen Regeln für ein mögliches Kaufverhalten ableiten? Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 2 / 22

4 Assoziationsregeln - formale Darstellung Gegeben ist eine Menge I = {i 1,..., i p } von p binären Items und eine Menge D = {t 1,..., t n } mit n Transaktionen (die Database). Jede Transaktion hat eine eindeutige ID und besteht aus einer Teilmenge der Items in I. Supermarkt-Beispiel: Items I = {Milch, Brot, Butter, Bier} mit der Transaktions-Database D = ID Milch Brot Butter Bier Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 3 / 22

5 Assoziationsregeln - formale Darstellung / 2 Eine Assoziationsregel ist definiert als eine Implikation X Y mit X, Y I und X Y =. X und Y sind also Mengen von Items, sogenannte Itemsets. Supermarkt-Beispiel: Eine mögliche Regel wäre zum Beispiel {Milch, Brot} {Butter}. D.h. wenn ein Kunde Milch und Brot kauft, dann kauft er auch sehr wahrscheinlich Butter. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 4 / 22

6 Assoziationsregeln - formale Darstellung / 3 Gegeben ist die Menge aller möglichen Regeln (Potenzmenge P(I)): {Milch} {Brot} {Butter} {Brot} {Bier, Milch} {Butter} {Bier, Butter} {Milch} {Butter, Milch} {Brot} Und wie findet man nun die interessanten Regeln? Um interessante Regeln in der Menge aller möglichen Regeln zu finden, werden Maßzahlen für Support und Confidence definiert und Schwellwerte für diese festgelegt. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 5 / 22

7 Support Der Support eines Itemsets X, supp(x), ist definiert als der Anteil an Transaktionen in der Database, welche X beinhalten (d.h. die relative Häufigkeit des Itemsets). Der Support einer Regel supp(x Y ) ist definiert als der Support der vereinigten Itemsets X und Y : supp(x Y ) (d.h. die relative Häufigkeit der Transaktionen, in denen die Regel anwendbar ist). Interpretation: Support entspricht der Prävalenz des Itemsets, das einer Regel zu Grunde liegt. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 6 / 22

8 Support / 2 Supermarkt-Beispiel: Das Itemset {Milch, Brot} kommt in 2 von 5 Transaktionen vor, also supp({milch, Brot}) = 2 5 = 0.4 D.h. in 40% der Transaktionen kommen Milch und Brot zusammen vor. Entspricht der Wahrscheinlichkeit P(Milch Brot). Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 7 / 22

9 Confidence Die Confidence einer Regel ist definiert als: conf (X Y ) = supp(x Y ) supp(x) (d.h. die relative Häufigkeit der Transaktionen, in denen die Regel richtig ist). Interpretation: Confidence misst die Stärke der Regel. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 8 / 22

10 Confidence / 2 Supermarkt-Beispiel: Die Regel {Milch, Brot} {Butter} hat eine Confidence von supp({milch, Brot, Butter}) supp({milch, Brot}) = 1/5 2/5 = = 0.5. D.h. für 50% der Transaktionen, welche Milch und Brot beinhalten, ist die Regel korrekt. Confidence entspricht der bedingten Wahrscheinlichkeit P(Butter Milch, Brot). Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 9 / 22

11 Starke Regeln Assoziationsregeln müssen einen benutzerdefinierten 1. minimalen Support s (die Items einer Regel sind in mindestens s 100% der Transaktionen der Database vorhanden) und eine 2. minimale Confidence c (für mindestens c 100% der Transaktionen, für welche die linke Seite der Regel zutrifft, gilt auch die rechte Seite der Regel) erfüllen. Eine Regel heißt stark, wenn sie beide Schwellwerte s und c erfüllt. Beispiel: Support mindestens 10%, Confidence mindestens 80%. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 10 / 22

12 Assoziationsanalyse Die Assoziationsanalyse bezeichnet die Suche nach starken Regeln. Problem: Es existieren 2 p mögliche Itemsets ( Fluch der Dimensionalität). Regeln werden daher in einem Zwei-Schritt-Verfahren gefunden: 1. Suche zunächst alle häufigen Itemsets in der Database, d.h. all jene Itemsets, welche den minimalen Support s erfüllen. 2. Forme starke Regeln mit Hilfe der häufigen Itemsets und der minimalen Confidence c. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 11 / 22

13 Apriori-Algorithmus Apriori-Algorithmus zum Finden von starken Regeln: R. Agrawal, H. Mannila, R. Srikant, H. Toivonen and A. I. Verkamo (1995): Fast Discovery of Association Rules, Advances in Knowledge Discovery and Data Mining, Chapter 12, AAAI/MIT Press, Cambridge, MA. Iterativer Algorithmus, der (1) alle häufigen Itemsets bezüglich des minmalen Supports s unter Zuhilfenahme der Apriori-Eigenschaft findet und (2) daraus starke Regeln bezüglich der Confidence c generiert. Apriori-Eigenschaft: Alle Teilmengen einer häufigen Itemmenge sind ebenfalls häufige Itemmengen. Alle Obermengen einer nicht-häufigen Itemmenge sind ebenfalls nicht-häufig. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 12 / 22

14 1. Suche alle häufigen Itemsets 1. C 1 alle 1-elementigen Teilmengen der Menge I L 1 alle 1-elementigen Teilmengen aus C 1 mit supp s 2. So lange L j (j = 2,...): 2.1 (join) Berechnung der Menge aller möglichen j-elementigen Itemsets C j durch Fusion der häufigen (j 1)-elementigen Itemsets aus der vorigen Iteration mit den Elementen aus L (prune) Berechnung der Menge der wirklichen häufigen Itemsets L j = {l l C j, supp(l) s} 3. Alle häufigen Itemsets sind j L j Hinreichend große Werte für s und c sind essentiell, um die Laufzeit des Verfahrens zu begrenzen. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 13 / 22

15 1. Suche alle häufigen Itemsets / 2 Supermarkt-Beispiel: Welche sind die häufigen Itemsets bei einem definierten minimalen Support von 2/5? Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 14 / 22

16 2. Forme starke Regeln Für jedes häufige Itemset Z : 1. C 1 alle Regeln der Form X Y mit Y = 1 und X = Z \Y H 1 alle Regeln (mit Itemmengen bestehend aus je einer gefundenen Konklusion) aus C 1 mit conf c 2. Solange H j (j = 2,...): 2.1 (join) Berechnung der Menge aller möglichen Regeln C j aus H j 1 mit Y = j und X = Z \Y 2.2 (prune) Berechnung der Menge aller wirklichen Regeln H j mit H j = {h h C j, conf (h) c} 3. Alle starken Regeln für das häufige Itemset Z sind j H j Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 15 / 22

17 2. Forme starke Regeln / 2 Supermarkt-Beispiel: Was sind die starken Regeln bei einer definierten minimalen Confidence von 0.8? Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 16 / 22

18 Software Paket arules: Michael Hahsler, Christian Buchta, Bettina Gruen and Kurt Hornik, arules: Mining Association Rules and Frequent Itemsets. R package version Paket arulesviz: Michael Hahsler and Sudheer Chelluboina, arulesviz: Visualizing Association Rules and Frequent Itemsets. R package version Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 17 / 22

19 Irreführende Assoziationsregeln Problem: Trotz Erfüllung des minimalen Supports s und der minimalen Confidence c muss eine Regel nicht interessant sein! Beispiel: Itemset {X, Y } mit Dann ist supp(x) = 0.6, supp(y ) = 0.75 und supp(x Y ) = conf (X Y ) = supp(x Y ) supp(x) = = Confidence ist genauso groß wie der Support von Y. Sie spiegelt also nur den Support von Y wider und gibt keine Aussage über den Zusammenhang zwischen X und Y. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 18 / 22

20 Weitere Maßzahl: Lift Der Lift einer Regel ist definiert als das Verhältnis der beobachteten Confidence zur erwarteten Confidence: lift(x Y ) = conf (X Y ) supp(y ) = supp(x Y ) supp(x) supp(y ) Interpretation: beschreibt Korrelation zwischen den Items: lift = 1 keine Korrelation zwischen X und Y lift > 1 positive Korrelation lift < 1 negative Korrelation Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 19 / 22

21 Weitere Maßzahl: Lift / 2 Supermarkt-Beispiel: Die Regel {Milch, Brot} {Butter} hat einen Lift von D.h. Butter tritt in Itemsets, die Milch und Brot beinhalten, um 25% häufiger auf als in Kombination mit Items, von denen Butter unabhängig ist. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 20 / 22

22 Weitere Maßzahlen Der Support misst die Signifikanz einer Regel, während die Confidence das Interesse einer Regel misst. Da es viele Möglichkeiten gibt, Signifikanz und Interesse zu operationalisieren, existieren alternative Maßzahlen: All-confidence, Collective strength, Coverage, Conviction, etc. measures.html gibt eine Beschreibung weiterer gängiger Maßzahlen. Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 21 / 22

23 Mehr zu... Itemsets: Maximale häufige Itemsets: Ein häufiges Itemset heißt maximal, wenn es keine Teilmenge eines anderen häufigen Itemsets ist. Abgeschlossene häufige Itemsets: Ein häufiges Itemset heißt abgeschlossen, wenn keine echte Übermenge mit demselben Support existiert. Algorithmen: Eine Alternative zum Apriori-Algorithmus, die auf einer statistischen Grundlage basiert, ist das sogenannte Bump Hunting; ein Algorithmus dazu ist PRIM (patient rule induction method). Steffen Unkel c Sommersemester 2013 Fortgeschrittene Computerintensive Methoden: Assoziationsregeln 22 / 22

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

5. Assoziationsregeln

5. Assoziationsregeln 5. Generieren von Assoziationsregeln Grundbegriffe 5. Assoziationsregeln Assoziationsregeln beschreiben gewisse Zusammenhänge und Regelmäßigkeiten zwischen verschiedenen Dingen, z.b. den Artikeln eines

Mehr

Kapitel 11: Association Rules

Kapitel 11: Association Rules Kapitel 11: Association Association Einleitung Association : Eine wichtige Art von Mustern, an der man im Data-Mining Kontext interessiert ist. Muster mit einfacher Struktur. Ziel im folgenden: Finden

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen INTELLIGENTE DATENANALYSE IN MATLAB Unüberwachtes Lernen: Clustern von Attributen Literatur J. Han, M. Kamber: Data Mining Concepts and Techniques. J. Han et. al: Mining Frequent Patterns without Candidate

Mehr

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold

Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold Algorithms for Pattern Mining AprioriTID Stefan George, Felix Leupold Gliederung 2 Einleitung Support / Confidence Apriori ApriorTID Implementierung Performance Erweiterung Zusammenfassung Einleitung 3

Mehr

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren?

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren? Mining über RDBMSe von Christian Widmer Wie gut lässt sich Mining mit SQL realisieren? Müssen neue Konstrukte zur Verfügung gestellt werden, wenn ja welche? Vortragsüberblick Association Rules Apriori

Mehr

Probabilistische Ansätze in der Assoziationsanalyse

Probabilistische Ansätze in der Assoziationsanalyse Probabilistische Ansätze in der Assoziationsanalyse Habilitationsvortrag Dr. Michael Hahsler Institut für Informationswirtschaft Wirtschaftsuniversität Wien Wien, 19. Mai, 2006 Aufbau des Vortrags 1. Motivation

Mehr

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus FernUniversität in Hagen Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln Thema 1.1.1 Der Apriori-Algorithmus Referentin: Olga Riener Olga Riener. Thema 1.1.1. Der

Mehr

VII.3 Assoziationsregeln

VII.3 Assoziationsregeln VII.3 Assoziationsregelverfahren VII.3. Einführung [Bollinger 96] VII.3 Assoziationsregeln Algorithmen zum Entdecken von Assoziationsregeln sind typische Vertreter von Data Mining Verfahren. Assoziationsregeln

Mehr

Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln

Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Praktikum: Data Warehousing und Data Mining Clusteranalyse Clusteranalyse Idee Bestimmung von Gruppen ähnlicher Tupel in multidimensionalen Datensätzen.

Mehr

Frequent Itemset Mining + Association Rule Mining

Frequent Itemset Mining + Association Rule Mining Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,

Mehr

WIRTSCHAFTSUNIVERSITÄT WIEN DIPLOMARBEIT

WIRTSCHAFTSUNIVERSITÄT WIEN DIPLOMARBEIT WIRTSCHAFTSUNIVERSITÄT WIEN DIPLOMARBEIT Titel der Diplomarbeit: Visualisierung von Assoziationsregeln mit R Verfasserin/Verfasser: Martin Vodenicharov Matrikel-Nr.: 0253795 Studienrichtung: Betriebswirtschaft

Mehr

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets

Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren

Mehr

Warenkorbanalyse mit Hilfe der Statistiksoftware R

Warenkorbanalyse mit Hilfe der Statistiksoftware R Warenkorbanalyse mit Hilfe der Statistiksoftware R Michael Hahsler (1), Kurt Hornik (2) & Thomas Reutterer (3) (1) Institut für Informationswirtschaft, WU-Wien. (2) Institut für Statistik und Mathematik,

Mehr

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

4. Assoziationsregeln. 4.1 Einleitung. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation

4. Assoziationsregeln. 4.1 Einleitung. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation 4.1 Einleitung 4. Assoziationsregeln Inhalt dieses Kapitels Transaktionsdatenbanken, Warenkorbanalyse 4.2 Einfache Assoziationsregeln Grundbegriffe, Aufgabenstellung, Apriori-Algorithmus, Hashbäume, Interessantheit

Mehr

Data Mining im Einzelhandel Methoden und Werkzeuge

Data Mining im Einzelhandel Methoden und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.

Mehr

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg

Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis und Markov-Modelle. Christian Weiß Institut für Angewandte Mathematik und Statistitik Universität Würzburg Sequential Pattern Analysis Historische Aspekte Data Mining als Teildisziplin

Mehr

Erkennung Sequenzieller Muster Algorithmen und Anwendungen

Erkennung Sequenzieller Muster Algorithmen und Anwendungen Achim Eisele, Thema 1.4.3: Sequenzielle Muster 1 FernUniversität in Hagen Seminar 01912 im Sommersemester 2008 Erkennung Sequenzieller Muster Algorithmen und Anwendungen Thema 1.4.3: Sequenzielle Muster

Mehr

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock. Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.de 1 Informationsflut Amazon: Alle lieferbaren Bücher (930.000 Titeln

Mehr

4.1 Einleitung. 4. Assoziationsregeln. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation. Assoziationsregeln

4.1 Einleitung. 4. Assoziationsregeln. 4.2 Einfache Assoziationsregeln. 4.1 Einleitung. Inhalt dieses Kapitels. Motivation. Assoziationsregeln 4.1 Einleitung 4. Assoziationsregeln Inhalt dieses Kapitels Transaktionsdatenbanken, Warenkorbanalyse 4.2 Einfache Assoziationsregeln Grundbegriffe, Aufgabenstellung, Apriori-Algorithmus, Hashbäume, Interessantheit

Mehr

DBS5 Kap. 4. Data Mining

DBS5 Kap. 4. Data Mining DBS5 Kap. 4 Data Mining Klassifikationen und Cluster-Bildung: Auffinden von Regeln zur Partitionierung von Daten in disjunkte Teilmengen (Anwendungsbeispiel: Risikoabschätzung) bzw. Herstellen von Gruppierungen

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Masterarbeit. im Studiengang Informatik. Kombinationen von Data Mining-Verfahren: Analyse und Automatisierung. Ulf Mewe Matrikel.-Nr.

Masterarbeit. im Studiengang Informatik. Kombinationen von Data Mining-Verfahren: Analyse und Automatisierung. Ulf Mewe Matrikel.-Nr. LEIBNIZ UNIVERSITÄT HANNOVER FAKULTÄT FÜR ELEKTROTECHNIK UND INFORMATIK INSTITUT FÜR PRAKTISCHE INFORMATIK FACHGEBIET DATENBANKEN UND INFORMATIONSSYSTEME Masterarbeit im Studiengang Informatik Kombinationen

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

Datenanalyse mit Data Mining

Datenanalyse mit Data Mining Datenanalyse mit Data Mining von Jan-Christoph Meier Hamburg, 19.01.2012 1 Ablauf Motivation Speicherung der Daten für das Data Mining Data Mining Algorithmen Ausblick auf die Masterarbeit Konferenzen

Mehr

Konzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute

Konzeptbeschreibung Ziel: Methode: Vorgehen: Entfernen von Attributen Verallgemeinerung von Attributen Relevanzanalyse der restlichen Attribute Konzeptbeschreibung Ziel: Knappe Charakterisierung einer Datenmenge im Vergleich zu einer anderen Datenmenge (Kontrastmenge) Methode: Herausfinden charakteristischer Attribute auf angemessener Abstraktionsebene

Mehr

HM I Tutorium 1. Lucas Kunz. 27. Oktober 2016

HM I Tutorium 1. Lucas Kunz. 27. Oktober 2016 HM I Tutorium 1 Lucas Kunz 27. Oktober 2016 Inhaltsverzeichnis 1 Theorie 2 1.1 Logische Verknüpfungen............................ 2 1.2 Quantoren.................................... 3 1.3 Mengen und ihre

Mehr

Mining top-k frequent itemsets from data streams

Mining top-k frequent itemsets from data streams Seminar: Maschinelles Lernen Mining top-k frequent itemsets from data streams R.C.-W. Wong A.W.-C. Fu 1 Gliederung 1. Einleitung 2. Chernoff-basierter Algorithmus 3. top-k lossy counting Algorithmus 4.

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Bachelorarbeit. Jörn Slotta. Vergleich von Algorithmen zur Assoziationsanalyse basierend auf Webserver Logfiles

Bachelorarbeit. Jörn Slotta. Vergleich von Algorithmen zur Assoziationsanalyse basierend auf Webserver Logfiles Bachelorarbeit Jörn Slotta Vergleich von Algorithmen zur Assoziationsanalyse basierend auf Webserver Logfiles Fakultät Technik und Informatik Studiendepartment Informatik Faculty of Engineering and Computer

Mehr

Management Support Systeme

Management Support Systeme Management Support Systeme WS 24-25 4.-6. Uhr PD Dr. Peter Gluchowski Folie Gliederung MSS WS 4/5. Einführung Management Support Systeme: Informationssysteme zur Unterstützung betrieblicher Fach- und Führungskräfte

Mehr

6. Überblick zu Data Mining-Verfahren

6. Überblick zu Data Mining-Verfahren 6. Überblick zu Data Mining-Verfahren Einführung Clusteranalse k-means-algorithmus Klassifikation Klassifikationsprozess Konstruktion eines Entscheidungsbaums Assoziationsregeln / Warenkorbanalse Support

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne

Mehr

Anwendung der Business Analytics

Anwendung der Business Analytics Anwendung der Business Analytics TDWI 2013 München Prof. Dr. Carsten Felden Dipl.-Wirt.-Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg (Sachsen) Institut für Wirtschaftsinformatik

Mehr

Studienarbeit. Maria Soldatova

Studienarbeit. Maria Soldatova Leibniz Universität Hannover Fakultät für Elektrotechnik und Informatik Fachgebiet Datenbanken und Informationssysteme im Studiengang Mathematik mit Studienrichtung Informatik Diskussion und Implementierung

Mehr

Ein lernendes System zurverbesserung der Datenqualität und Datenqualitätsmessung

Ein lernendes System zurverbesserung der Datenqualität und Datenqualitätsmessung Ein lernendes System zurverbesserung der Datenqualität und Datenqualitätsmessung Jens Lüssem, Peter Tasev, Maren Tiedemann-Muhlack 2 Institut für Informatik III 2 Middle Office Universität Bonn HSH Nordbank

Mehr

Assoziationsanalyse und Konzeptbeschreibung

Assoziationsanalyse und Konzeptbeschreibung Assoziationsanalyse und Konzeptbeschreibung Helge Saathoff 7. März 2003 ABSTRACT Wir leben im Informationszeitalter. Fortschritte in der Hard- und Softwaretechnologie haben es ermöglicht, daß heutzutage

Mehr

Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken

Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken 7. VI. 2016 Organisatorisches nächste Woche am 14. Juni Abschlusstest (Gruppe 1: 10:00 11:15, Gruppe 2: 11:30 12:45 ) Übungsblatt

Mehr

Quantitatives Frequent-Pattern Mining über Datenströmen

Quantitatives Frequent-Pattern Mining über Datenströmen Quantitatives Frequent-Pattern Mining über Datenströmen Daniel Klan, Thomas Rohe Department of Computer Science & Automation TU Ilmenau, Germany {first.last}@tu-ilmenau.de Abstract Das Aufdecken unbekannter

Mehr

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell

Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil

Mehr

Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse

Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse Nicht nur im Einzelhandel Die vielfältigen Einsatzgebiete der Assoziationsanalyse von Peter Gerngroß Was ist Assoziationsanalyse? Das früheste bekannte Beispiel für die Nutzung von Assoziationsanalysen

Mehr

Eliciting Requirements for a Company-wide Data Leakage Prevention System

Eliciting Requirements for a Company-wide Data Leakage Prevention System Eliciting Requirements for a Company-wide Data Leakage Prevention System Stefan Gärtner, Svenja Schulz, and Kurt Schneider Software Engineering Group, Leibniz Universität Hannover, Germany Steffen Förster

Mehr

Zusammenhangsanalyse in Kontingenztabellen

Zusammenhangsanalyse in Kontingenztabellen Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Kapitel 15: Mining von Sequential Patterns

Kapitel 15: Mining von Sequential Patterns Kapitel 15: Mining von Sequential Patterns Lernziele Weitere Art von Sequential Patterns/ Constraints für den Mining Prozeß kennenlernen. Erkennen, daß Generate&Test Paradigma für diverse Mining-Problemstellungen

Mehr

5 Data Warehouses und Data Mining

5 Data Warehouses und Data Mining 5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher

Mehr

Grundbegriffe der Wahrscheinlichkeitstheorie. Karin Haenelt

Grundbegriffe der Wahrscheinlichkeitstheorie. Karin Haenelt Grundbegriffe der Wahrscheinlichkeitstheorie Karin Haenelt 1 Inhalt Wahrscheinlichkeitsraum Bedingte Wahrscheinlichkeit Abhängige und unabhängige Ereignisse Stochastischer Prozess Markow-Kette 2 Wahrscheinlichkeitsraum

Mehr

Population und Stichprobe: Wahrscheinlichkeitstheorie

Population und Stichprobe: Wahrscheinlichkeitstheorie Population und Stichprobe: Wahrscheinlichkeitstheorie SS 2001 4. Sitzung vom 15.05.2001 Wahrscheinlichkeitstheorie in den Sozialwissenschaften: Stichprobenziehung: Aussagen über Stichprobenzusammensetzung

Mehr

Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07)

Fragenkatalog zur Vorlesung Grundlagen des Data Mining (WS 2006/07) Fragenkatalog zur Vorlesung "Grundlagen des Data Mining" (WS 2006/07) 1. Grenzen Sie die Begriffe "Daten" und "Wissen" mit je 3 charakteristischen Eigenschaften gegeander ab. 2. Nennen Sie vier verschiedene

Mehr

Vorkurs Mathematik und Informatik Mengen, natürliche Zahlen, Induktion

Vorkurs Mathematik und Informatik Mengen, natürliche Zahlen, Induktion Vorkurs Mathematik und Informatik Mengen, natürliche Zahlen, Induktion Saskia Klaus 07.10.016 1 Motivation In den ersten beiden Vorträgen des Vorkurses haben wir gesehen, wie man aus schon bekannten Wahrheiten

Mehr

6. Überblick zu Data Mining-Verfahren

6. Überblick zu Data Mining-Verfahren 6. Überblick zu Data Mining-Verfahren Einführung Clusteranalyse k-means-algorithmus Canopy Clustering Klassifikation Klassifikationsprozess Konstruktion eines Entscheidungsbaums Assoziationsregeln / Warenkorbanalyse

Mehr

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren

Aufbau des Experiments Reihung von Versuchsitems und Distraktoren Reihung von Versuchsitems und Distraktoren Reihung von Versuchsitems und Distraktoren Hinweis D1 (Verhältnis Distraktoren:Versuchsitems): Es sollten Distraktoren eingebaut werden, im Falle von Sprecherbefragungen

Mehr

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer Matthias Pretzer matthias.pretzer@informatik.uni-oldenburg.de http://diko-project.de/ Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Inhalt: Motivation Grundlagen Anwendungsszenario

Mehr

Surjektive, injektive und bijektive Funktionen.

Surjektive, injektive und bijektive Funktionen. Kapitel 1: Aussagen, Mengen, Funktionen Surjektive, injektive und bijektive Funktionen. Definition. Sei f : M N eine Funktion. Dann heißt f surjektiv, falls die Gleichung f(x) = y für jedes y N mindestens

Mehr

Grundbegriffe der Wahrscheinlichkeitsrechnung

Grundbegriffe der Wahrscheinlichkeitsrechnung Algorithmen und Datenstrukturen 349 A Grundbegriffe der Wahrscheinlichkeitsrechnung Für Entwurf und Analyse randomisierter Algorithmen sind Hilfsmittel aus der Wahrscheinlichkeitsrechnung erforderlich.

Mehr

Vorlesung. Datenschutz und Privatheit in vernetzten Informationssystemen

Vorlesung. Datenschutz und Privatheit in vernetzten Informationssystemen Vorlesung Datenschutz und Privatheit in vernetzten Informationssystemen Kapitel 7: Privacy Preserving Data Mining Thorben Burghardt, Erik Buchmann buchmann@ipd.uka.de Thanks to Chris Clifton & Group IPD,

Mehr

1. Welche Eigenschaften sollte ein Pseudo-Random Generator haben?

1. Welche Eigenschaften sollte ein Pseudo-Random Generator haben? Die Themen 1. Welche Eigenschaften sollte ein Pseudo-Random Generator haben? Er sollte von wirklichen Zufallsgeneratoren nicht unterscheidbar sein?! Eine viel zu starke Forderung: Stattdessen sollte ein

Mehr

Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man

Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man Die Schreibweise x M bedeutet, dass das Objekt x in der Menge M liegt. Ist dies nicht der Fall, dann schreibt man x / M. Man sagt, M ist Teilmenge von N und schreibt M N, wenn für jedes x M auch x N gilt.

Mehr

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede

Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Universität Ulm Seminararbeit zum Thema Data Mining und Statistik: Gemeinsamkeiten und Unterschiede vorgelegt von: Daniel Meschenmoser betreut von: Dr. Tomas Hrycej Dr. Matthias Grabert Ulm, im Februar

Mehr

Beschreibung von Web- Nutzungsverhalten unter Verwendung von Data Mining Techniken

Beschreibung von Web- Nutzungsverhalten unter Verwendung von Data Mining Techniken Diplomarbeit Beschreibung von Web- Nutzungsverhalten unter Verwendung von Data Mining Techniken Irina Alesker Diplomarbeit am Fachbereich Informatik der Universität Dortmund 23. Juni 2005 Betreuer: Prof.

Mehr

Einführung in die Wahrscheinlichkeitsrechnung

Einführung in die Wahrscheinlichkeitsrechnung Einführung in die Wahrscheinlichkeitsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Wahrscheinlichkeitsrechnung

Mehr

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen)

Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Relationen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16

Mehr

Johann Wolfgang Goethe-Universität Frankfurt am Main

Johann Wolfgang Goethe-Universität Frankfurt am Main Johann Wolfgang Goethe-Universität Frankfurt am Main Fachbereich Informatik (20) Praktische Informatik PD Dr. R. Brause Neuronales Data Mining zur Mißbrauchserkennung bei Kreditkartentransaktionen R. Brause,

Mehr

Assoziationsbasierte Trenderkennung auf Microblogdaten

Assoziationsbasierte Trenderkennung auf Microblogdaten Assoziationsbasierte Trenderkennung auf Microblogdaten Master-Thesis von Klaus Wilhelmi Tag der Einreichung: 1. Gutachten: Prof. Johannes Fürnkranz 2. Gutachten: Dr. Frederik Janssen Fachbereich Informatik

Mehr

Ermittlung charakteristischer Datensätze durch Data Mining

Ermittlung charakteristischer Datensätze durch Data Mining Ermittlung charakteristischer Datensätze durch Data Mining Diplomarbeit im Fach Informatik vorgelegt von Mathias Ruoss Winterthur Matrikelnummer 00-917-575 Angefertigt am Institut für Informatik der Universität

Mehr

Kapitel 13: Pattern Mining unter Constraints

Kapitel 13: Pattern Mining unter Constraints Kapitel 13: Pattern Mining unter Dieses Kapitel: Nicht mehr Suche nach allen Frequent Itemsets/Association Rules, sondern Einschränkung der Ziel-Menge. Strukturen, auf denen wir operieren, sind wie bisher

Mehr

Teil X Business Intelligence Anwendungen

Teil X Business Intelligence Anwendungen Teil X Business Intelligence Anwendungen Business Intelligence Anwendungen 1 Begriffsklärung c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung: 19.09.2012 10 1 Business Intelligence

Mehr

Teil X Business Intelligence Anwendungen

Teil X Business Intelligence Anwendungen Teil X Business Intelligence Anwendungen Business Intelligence Anwendungen 1 Begriffsklärung 2 3 Report & BSC c Sattler / Saake / Köppen Data-Warehouse-Technologien Letzte Änderung: 20.01.2012 10 1 Begriffsklärung

Mehr

Kapitel ML:IV. IV. Statistische Lernverfahren. Wahrscheinlichkeitsrechnung Bayes-Klassifikation Maximum-a-Posteriori-Hypothesen

Kapitel ML:IV. IV. Statistische Lernverfahren. Wahrscheinlichkeitsrechnung Bayes-Klassifikation Maximum-a-Posteriori-Hypothesen Kapitel ML:IV IV. Statistische Lernverfahren Wahrscheinlichkeitsrechnung Bayes-Klassifikation Maximum-a-Posteriori-Hypothesen ML:IV-1 Statistical Learning c STEIN 2005-2011 Definition 1 (Zufallsexperiment,

Mehr

Mathematische Grundlagen der Computerlinguistik Mengen und Mengenoperationen

Mathematische Grundlagen der Computerlinguistik Mengen und Mengenoperationen Mathematische Grundlagen der Computerlinguistik Mengen und Mengenoperationen Dozentin: Wiebke Petersen 1. Foliensatz Wiebke Petersen math. Grundlagen 6 Frage Was ist eine Menge? 1 Minute zum Nachdenken

Mehr

Neuronalen Netzen. Jens Lehmann. 1. März Institut für Künstliche Intelligenz Fakultät Informatik Technische Universität Dresden

Neuronalen Netzen. Jens Lehmann. 1. März Institut für Künstliche Intelligenz Fakultät Informatik Technische Universität Dresden Institut für Künstliche Intelligenz Fakultät Informatik Technische Universität Dresden 1. März 2005 Neurosymbolische Integration versucht künstliche neuronale Netze und Logikprogrammierung zu vereinen

Mehr

Kapitel 5: Dynamisches Programmieren Gliederung

Kapitel 5: Dynamisches Programmieren Gliederung Gliederung 1. Grundlagen 2. Zahlentheoretische Algorithmen 3. Sortierverfahren 4. Ausgewählte Datenstrukturen 5. Dynamisches Programmieren 6. Graphalgorithmen 7. String-Matching 8. Kombinatorische Algorithmen

Mehr

Datenbanken und Informationssysteme

Datenbanken und Informationssysteme Datenbanken und Informationssysteme Lehrangebot Stefan Conrad Heinrich-Heine-Universität Düsseldorf Institut für Informatik April 2012 Stefan Conrad (HHU) Datenbanken und Informationssysteme April 2012

Mehr

Einführung in die Wahrscheinlichkeitsrechnung

Einführung in die Wahrscheinlichkeitsrechnung Marco Cattaneo Institut für Statistik Ludwig-Maximilians-Universität München Sommersemester 2011 1. Wahrscheinlichkeitsrechnung 2. Diskrete Zufallsvariable 3. Stetige Zufallsvariable 4. Grenzwertsätze

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Grundlagen der Mathematik

Grundlagen der Mathematik Universität Hamburg Winter 2016/17 Fachbereich Mathematik Janko Latschev Grundlagen der Mathematik Lösungsskizzen 2 Präsenzaufgaben (P2) Wir betrachten drei Teilmengen der natürlichen Zahlen: - A = {n

Mehr

Diskrete Strukturen Kapitel 2: Grundlagen (Mengen)

Diskrete Strukturen Kapitel 2: Grundlagen (Mengen) WS 2016/17 Diskrete Strukturen Kapitel 2: Grundlagen (Mengen) Hans-Joachim Bungartz Lehrstuhl für wissenschaftliches Rechnen Fakultät für Informatik Technische Universität München http://www5.in.tum.de/wiki/index.php/diskrete_strukturen_-_winter_16

Mehr

Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 3. Übungsblatt

Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 3. Übungsblatt Data Mining und Maschinelles Lernen Wintersemester 2015/2016 Lösungsvorschlag für das 3. Übungsblatt 18. November 2015 1 Aufgabe 1: Version Space, Generalisierung und Spezialisierung (1) Gegeben sei folgende

Mehr

Sitzung 4: Übungsaufgaben für Statistik 1

Sitzung 4: Übungsaufgaben für Statistik 1 1 Sitzung 4: Übungsaufgaben für Statistik 1 Aufgabe 1: In einem Leistungstest werden von den Teilnehmern folgende Werte erzielt: 42.3; 28.2; 30.5, 32.0, 33.0, 38.8. Geben Sie den Median, die Spannweite

Mehr

Thema 8 Ein Schätzverfahren für das Wachstum von Gefäßnetzwerken auf der Grundlage von Zufallsgraphen. 2.Definitionen aus Graphentheorie

Thema 8 Ein Schätzverfahren für das Wachstum von Gefäßnetzwerken auf der Grundlage von Zufallsgraphen. 2.Definitionen aus Graphentheorie Seminar Mustererkennung mit syntaktischen und graphenbasierten Methoden Thema 8 Ein Schätzverfahren für das Wachstum von Gefäßnetzwerken auf der Grundlage von Zufallsgraphen 1.Einleitung Stefan Böcker

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Vektor-Additions-Systeme und Invarianten

Vektor-Additions-Systeme und Invarianten Vektor-Additions-Systeme und Invarianten http://www.informatik.uni-bremen.de/theorie/teach/petri Renate Klempien-Hinrichs Stellen- und Transitions-Vektoren T -Invarianten S-Invarianten Bezug zu erreichbaren

Mehr

Inhalt. 1. Einführung in die Informatik. 2. Algorithmen Definition, Eigenschaften, Entwurf Darstellung von Algorithmen Beispiele.

Inhalt. 1. Einführung in die Informatik. 2. Algorithmen Definition, Eigenschaften, Entwurf Darstellung von Algorithmen Beispiele. 1. Einführung in die Informatik Inhalt 2. Algorithmen Definition, Eigenschaften, Entwurf Darstellung von Algorithmen Beispiele Peter Sobe 1 Einführende Beispiele 2. Algorithmen Täglich werden Verarbeitungsvorschriften

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen

Mehr

Lineare Programmierung

Lineare Programmierung Lineare Programmierung WS 2003/04 Rolle der Linearen Programmierung für das TSP 1954: Dantzig, Fulkerson & Johnson lösen das TSP für 49 US-Städte (ca. 6.2 10 60 mögliche Touren) 1998: 13.509 Städte in

Mehr

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Kursfolien Karin Haenelt 1 Übersicht Wahrscheinlichkeitsfunktion P Wahrscheinlichkeit und bedingte Wahrscheinlichkeit Bayes-Formeln

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher Physikalisches Institut Westbau 2 OG Raum 008 Telefonnummer 07621 203 7612 E-Mail:

Mehr

Einführung in die Logik

Einführung in die Logik Einführung in die Logik Klaus Madlener und Roland Meyer 24. April 2013 Inhaltsverzeichnis 1 Aussagenlogik 1 1.1 Syntax................................. 1 1.2 Semantik............................... 3 1.3

Mehr

1 Aussagenlogischer Kalkül

1 Aussagenlogischer Kalkül 1 Aussagenlogischer Kalkül Ein Kalkül in der Aussagenlogik soll die Wahrheit oder Algemeingültigkeit von Aussageformen allein auf syntaktischer Ebene zeigen. Die Wahrheit soll durch Umformung von Formeln

Mehr

Regelbasierte Empfehlungsdienste für Kunden im Offline-Handel Basierend auf Automatisch Geplanten Teilsortimenten

Regelbasierte Empfehlungsdienste für Kunden im Offline-Handel Basierend auf Automatisch Geplanten Teilsortimenten Universität des Saarlandes Naturwissenschaftlich-Technische Fakultät I Fachrichtung Informatik Regelbasierte Empfehlungsdienste für Kunden im Offline-Handel Basierend auf Automatisch Geplanten Teilsortimenten

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Student: Alexander Carls Matrikelnummer: Aufgabe: Beschreibung des euklidischen Algorithmus Datum:

Student: Alexander Carls Matrikelnummer: Aufgabe: Beschreibung des euklidischen Algorithmus Datum: Berufsakademie Stuttgart / Außenstelle Horb Studienbereich Technik Studiengang Informationstechnik Kurs IT2006, 2.Semester Dozent: Olaf Herden Student: Alexander Carls Matrikelnummer: 166270 Aufgabe: Beschreibung

Mehr

Wahrscheinlichkeiten

Wahrscheinlichkeiten Wahrscheinlichkeiten August, 2013 1 von 21 Wahrscheinlichkeiten Outline 1 Wahrscheinlichkeiten 2 von 21 Wahrscheinlichkeiten Zufallsexperimente Die möglichen Ergebnisse (outcome) i eines Zufallsexperimentes

Mehr

Würfelspiele und Zufall

Würfelspiele und Zufall Würfelspiele und Zufall Patrik L. Ferrari 29. August 2010 1 Random horse die Irrfahrt des Pferdchens Betrachte ein Schachbrett mit einem Pferd (Springer), welches sich nach den üblichen Springer-Regeln

Mehr

2.2 Ereignisse und deren Wahrscheinlichkeit

2.2 Ereignisse und deren Wahrscheinlichkeit 2.2 Ereignisse und deren Wahrscheinlichkeit Literatur: [Papula Bd., Kap. II.2 und II.], [Benning, Kap. ], [Bronstein et al., Kap. 1.2.1] Def 1 [Benning] Ein Zufallsexperiment ist ein beliebig oft wiederholbarer,

Mehr

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Studienprojekt Invisible Web (Dipl.-Inform. Gudrun Fischer - WS 2003/04) Blockseminar

Mehr

On-Line Analytical Processing

On-Line Analytical Processing OLAP und Data Mining ƒ OLAP Begriff Coddsche Regeln FASMI Operationen und Anfragesprachen ƒ Data Mining Begriff und Prozeß Verfahren Vorlesung Data-Warehouse-Technologien 9-1 On-Line Analytical Processing

Mehr