Data Mining. Informationssysteme, Sommersemester 2017
|
|
|
- Busso Weiner
- vor 8 Jahren
- Abrufe
Transkript
1 Data Mining Informationssysteme, Sommersemester 2017
2 Literatur zu Data-Mining Pang-Ning Tan, Michael Steinbach, Vipin Kuma. Introduction to Data Minig. Ein paar relevante Kapitel sind frei verfügbar unter kumar/dmbook/index Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Jiawei Han, Micheline Kamber. Data Mining. Concepts and Techniques. IS 2017 Kapitel 15 - Data Mining 2
3 Warenkorbanalyse Objekte sind: Brot, Milch, Windeln, Bier, Eier Transaktionen sind: 1:{Brot, Milch}, 2:{Brot, Windeln, Bier, Eier}, 3:{Milch, Windeln, Bier}, 4:{Brot, Milch, Windeln, Bier} und 5:{Brot, Milch, Windeln} TID Brot Milch Windeln Bier Eier Welche Objekte (Items) werden häufig zusammen gekauft? Können wir Regeln angeben der Form: Kunden die Windeln kaufen, kaufen auch meist Bier? IS 2017 Kapitel 15 - Data Mining 3
4 Darstellung als Binärmatrix TID Brot Milch Windeln Bier Eier Itemsets {Brot, Milch} {Brot, Windeln, Bier, Eier} {Milch, Windeln, Bier} {Brot, Milch, Windeln, Bier} {Brot, Milch, Windeln} IS 2017 Kapitel 15 - Data Mining 4
5 Itemsets Ein Itemset ist eine Menge von Objekten Eine Transaktion tt ist ein Itemset mit dazugehöriger Transaktions-ID, tt = (tttttt; II) wobei II das Itemset der Transaktion ist Eine Transaktion tt = (tttttt, II) enthält ein Itemset XX falls XX II Der Support von Itemset XX in einer Datenbank DD ist die Anzahl der Transaktionen in DD, die XX enthalten: ssssssss(xx, DD) = tt DD tt eeeeeeeällll XX Die relative Häufigkeit von Itemset X in Datenbank D ist der Support relativ zur Größe der Datenbank, ssssssss(xx, DD)/ DD Ein Itemset ist häufig (frequent), falls dessen relative Häufigkeit über einem bestimmten Schwellwert minfreq liegt. Alternativ kann man auch einen Schwellwert minsupp bzgl. des Supports betrachten. IS 2017 Kapitel 15 - Data Mining 5
6 Beispiel TID Brot Milch Windeln Bier Eier Itemset {Brot, Milch} hat Support 3 und relative Häufigkeit 3/5 Itemset {Brot, Milch, Eier} hat Support und relative Häufigkeit 0. Für minfreq = 1/2 haben wir die folgenden frequent itemsets: {Brot}, {Milch}, {Windeln}, {Bier}, {Brot, Milch}, {Brot, Windeln}, {Milch, Windeln} und {Windeln, Bier}. IS 2017 Kapitel 15 - Data Mining 6
7 Assoziationsregeln und Konfidenz Eine Assoziationsregel ist eine Regel der Form XX YY, wobei XX und YY disjunkte Itemsets sind (d.h. XX YY = ) Idee: Eine Transaktion, die Itemset XX enthält, enthält (vermutlich) auch Itemset YY Der Support einer Regel XX YY in Datenbank DD ist ssssssss XX YY, DD = ssssssss XX YY, DD Die Konfidenz der Regel XX YY in Datenbank DD ist ssssssss XX YY, DD cccccccc XX YY, DD = ssssssss XX, DD Mit anderen Worten: Die Konfidenz ist die bedingte Wahrscheinlichkeit, dass eine Transaktion Y enthält, wenn sie X enthält. IS 2017 Kapitel 15 - Data Mining 7
8 Beispiel TID Brot Milch Windeln Bier Eier {BBBBBBBB, MMMMMMMMM} {WWWWWWWWWWWWWW} hat Support 2 und Konfidenz 2/3 {WWWWWWWWWWWWWW} {BBBBBBBB, MMMMMMMMM} hat Support 2 und Konfidenz 1/2 {EEEEEEEE} {BBBBBBBB, WWWWWWWWWWWWWW, BBBBBBBB} hat Support 1 und Konfidenz 1 IS 2017 Kapitel 15 - Data Mining 8
9 Mögliche Itemset Was sind mögliche Itemset? Hier alle Itemsets, für die Items {a,b,c,d,e} in der Darstellung als Verband (Lattice). / a b c d e ab ac ad ae bc bd be cd ce de abc abd abe acd ace ade bcd bce bde cde abcd abce abde acde bcde abcde IS 2017 Kapitel 15 - Data Mining 9
10 Ein naiver Algorithms Betrachte jedes mögliche Itemset und teste ob es häufig ist. Wie berechnet man den Support? Zähle für jedes Itemset in welchen Transaktionen es enthalten ist Berechnen des Support dauert OO( II DD ) und es gibt 2 O mögliche Itemsets, also im Worstcase: OO( II DD 2 O ) IS 2017 Kapitel 15 - Data Mining 10
11 Das Apriori-Prinzip Falls ein Itemset häufig ist, so sind alle Teilmengen ebenfalls häufig. Beispiel: Ist {c,d,e} häufig, so sind auch {c}, {d}, {e}, {c,d}, {c,e} und {d,e} häufig. / a b c d e ab ac ad ae bc bd be cd ce de abc abd abe acd ace ade bcd bce bde cde abcd abce abde acde bcde abcde IS 2017 Kapitel 15 - Data Mining 11
12 Das Apriori-Prinzip Umgekehrt: falls {a,b} nicht häufig ist (Englisch: infrequent), so sind auch alle Supermengen von {a,b} / nicht häufig. a b c d e ab ac ad ae bc bd be cd ce de abc abd abe acd ace ade bcd bce bde cde abcd abce abde acde bcde abcde IS 2017 Kapitel 15 - Data Mining 12
13 Anti-Monotonie Sei II eine Menge von Items und sei JJ = 2 II die Potenzmenge von II. Ein Maß ff ist monoton (oder aufwärts geschlossen) falls XX, YY JJ XX YY ff XX ff YY Im Gegensatz, ff ist anti-monoton (oder abwärts geschlossen) falls XX, YY JJ XX YY ff YY ff XX Ist Support monoton oder anti-monoton? Support ist anti-monoton: Für Itemsets XX und YY mit XX YY gilt ssssssss XX ssssssss YY. D.h. wenn XX nicht häufig ist (infrequent), dann sind auch alle Obermengen von X nicht häufig. IS 2017 Kapitel 15 - Data Mining 13
14 Beispiel Minimum Support Schwellwert = 3 Rot markierte Itemsets sind unter Schwellwert und werden eliminiert. Kandidaten 1-Itemsets Item Count Bier 3 Brot 4 Cola 2 Windeln 4 Eier 2 Milch 4 Kandidaten 2-Itemsets Itemset Count {Bier, Brot} 2 {Bier, Windeln} 3 {Bier, Milch} 2 {Brot, Windeln} 3 {Brot, Milch} 3 {Windeln, Milch} 4 Kandidaten 3-Itemsets Itemset {Brot, Windeln, Milch} Count 3 IS 2017 Kapitel 15 - Data Mining 14
15 Der Apriori-Algorithms Der Apriori-Algorithmus benutzt die Anti-Monotonie des Support-Maßes, um die Menge an zu betrachtenden Itemsets einzuschränken. Apriori generiert niemals ein Kandidaten-Itemset, das nicht-häufige Teilmengen besitzt. IS 2017 Kapitel 15 - Data Mining 15
16 n n Der Apriori-Algorithmus: Pseudocode /* Notation: mit σσ bezeichnen wir den Support eines Itemsets */ 1. kk = 1 2. FF Z = {ii ii II σσ({ii}) mmmmmmmmmmmmmm} /*Häufige 1-Itemsets*/ 3. repeat 4. kk = kk CC Z = apriori-gen(ff Zhi ) /*generiere Kandidaten*/ 6. for each transaction tt TT do 7. CC k = ssssssssssss(cc Z, tt) /*Betrachte Kandidaten die in TA*/ 8. for each candidate itemset cc CC k do 9. σσ(cc) = σσ(cc) + 1 /*Erhöhe Support-Zähler*/ 10. end for 11. end for 12. FF Z = {cc cc CC Z σσ(cc) mmmmmmmmmmmmmm} /*Finde häufige Itemsets*/ 13. until FF Z = 14. Result = FF Z IS 2017 Kapitel 15 - Data Mining 16
17 Der Apriori-Algorithmus: Pseudocode (2) CC Z ist die Menge der kk-itemsets FF Z ist die Menge der häufigen kk-itemsets Zuerst wird ein Mal über die Daten gelaufen, um den Support jedes einzelnen Items zu finden (Schritt 2). Dann kennen wir also FF i. Danach werden iterativ neue Kandidaten-kk-Itemset berechnet, basierend auf den häufigen (kk 1)-Itemsets (Schritt 5). Die Methode dafür nennt man aaaaaaaaaaaaaa gggggg(...) Nun wird für jedes Kandidaten-Itemset der Support berechnet, indem ein Mal über die Daten (Transaktionen) gelaufen wird (Schritt 6-10). Anschließend werden nicht-häufige Itemsets entfernt (Schritt 12). Der Algorithmus terminiert sobald FF Z = (Schritt 13). IS 2017 Kapitel 15 - Data Mining 17
18 Generierung und Eliminierung von Kandidaten 1. Generierung von Kandidaten Generiert kk-itemsets (d.h. Itemsets der Länge kk) basierend auf den Itemsets der vorherigen Iteration(en). 2. Eliminierung von Kandidaten Finde und eliminiere unnütze Kandidaten - kk -Itemsets. IS 2017 Kapitel 15 - Data Mining 18
19 Generierung von Kandidaten: Ziele Ziele: Vollständigkeit: Es müssen alle häufigen k-itemsets erzeugt werden. Effizienz: Es sollte vermieden werden, unnütze Itemsets zu erzeugen, d.h. solche die ein nicht-häufiges Itemset enthalten. Ebenso sollten Itemsets nicht mehrfach generiert werden. Erfüllen die nachfolgenden Ansätze diese Ziele? IS 2017 Kapitel 15 - Data Mining 19
20 Generierung von Kandidaten: Brute-Force Ansatz Schritt 1: Generiere alle Kandidaten. Dies sind r Z verschiedene Items. viele für dd Schritt 2: Dann entferne die nicht-häufigen Itemsets. Verbesserte Variante: Betrachte nur die Items aus FF i IS 2017 Kapitel 15 - Data Mining 20
21 Generierung von Kandidaten: FF Zhi FF i Verknüpfe die häufigen (kk 1)-Itemsets mit häufigen Items. Dann entferne die nicht häufigen resultierenden Itemsets. Verbesserung: Erlaube nur Ergänzung durch 1-Itemset, wenn dies lexikographisch größer als Items des (k-1)-itemsets ist. Itemset Kandidaten 2-Itemsets {Bier, Windeln} {Brot, Windeln} {Brot, Milch} {Windeln, Milch} Itemset {Bier} {Brot} {Windeln} {Milch} Häufige 1-Itemsets Generierung von Kandidaten Itemset {Bier, Windeln, Brot} {Bier, Windeln, Milch} {Brot, Windeln, Milch} {Brot, Milch, Bier} Eliminierung nicht-häufiger Kandidaten Itemset {Brot, Windeln, Milch} IS 2017 Kapitel 15 - Data Mining 21
22 Generierung von Kandidaten: FF Zhi FF Zhi Verknüpfe die häufigen (kk 1)-Itemsets falls diese in den ersten (k-2) Items übereinstimmen. Betrachte lexikographische Sortierung der Itemsets. D.h., AA = aa i, aa v, aa Zhi und BB = bb i, bb v, bb Zhi können kombiniert werden, falls aa x = bb x (für ii = 1, 2,, kk 2) und aa Zhi bb Zhi Itemset {Bier, Windeln} {Brot, Windeln} {Brot, Milch} {Windeln, Milch} Itemset {Bier, Windeln} {Brot, Windeln} {Brot, Milch} {Windeln, Milch} Häufige 2-Itemsets Generierung von Kandidaten Häufige 2-Itemsets Itemset {Brot, Windeln, Milch} Eliminierung nicht-häufiger Kandidaten Itemset {Brot, Windeln, Milch} IS 2017 Kapitel 15 - Data Mining 22
23 Assoziationsregeln (Association Rules) Basierend auf den häufigen Itemsets können wir nun Assoziationsregeln generieren. Falls ZZ ein häufiges Itemset ist und XX ZZ ist eine echte Teilmenge von ZZ, dann haben wir eine Regel XX YY, mit YY = ZZ\XX. Diese Regeln sind häufig da ssssssss(xx YY) = ssssssss(xx YY ) = ssssssss(zz) IS 2017 Kapitel 15 - Data Mining 23
24 Assoziationsregeln: Konfidenz Für eine Regel XX YY betrachten wir die Konfidenz, die wie folgt definiert ist ssssssss XX YY cccccccc XX YY = ssssssss XX Eine Regel XX YY mit cccccccc(xx YY) mmmmmmmmmmmmmm wird als confident bezeichnet. Ist eine Regel XX ZZ XX nicht confident, so kann keine Regel WW ZZ WW mit WW XX confident sein. IS 2017 Kapitel 15 - Data Mining 24
25 Assoziationsregeln: Berechnung Input: Menge F von häufigen Itemsets, minconf Schwellwert. 1. foreach ZZ FF mit ZZ 2 do 2. AA = XX XX ZZ, XX } 3. while AA do 4. XX = größtes Itemset aus AA 5. AA = AA XX 6. cc = supp(zz)/supp(xx) /* Berechnung Konfidenz */ 7. if cc mmmmmmmmmmmmmm then 8. print XX YY, supp(zz), cc /* Ausgabe, wobei YY = ZZ XX */ 9. else 10. AA = AA {WW WW XX} 11. end 12. end 13. end IS 2017 Kapitel 15 - Data Mining 25
26 Beispiel: Daten Wir haben folgende Transaktionen 1. {Brot, Milch}, 2. {Brot, Windeln, Bier, Eier}, 3. {Milch, Windeln, Bier}, 4. {Brot, Milch, Windeln, Bier} 5. {Brot, Milch, Windeln} Mit minfreq=0.05 haben wir die folgenden häufigen Itemsets: {Brot}, {Milch}, {Windeln}, {Bier}, {Brot, Milch}, {Brot, Windeln}, {Brot, Bier}, {Milch, Windeln}, {Milch, Bier}, {Windeln, Bier}, {Brot, Milch, Windeln}, {Brot, Windeln, Bier}, {Milch, Windeln, Bier} Notation: Auf der folgenden Folie ist AA (x) die Menge AA in Iteration ii IS 2017 Kapitel 15 - Data Mining 26
27 Beispiel minfreq = 0.05, minconf = 0.5 und für Z={Milch, Windeln, Bier} AA (~) = {{Milch}, {Windeln}, {Bier}, {Milch, Windeln}, {Milch, Bier}, {Windeln, Bier}} XX = {Windeln, Bier} Ausgabe: {Windeln, Bier} {Milch} AA (i) = {{Milch}, {Windeln}, {Bier}, {Milch, Windeln}, {Milch, Bier}} XX = {Milch, Bier} Ausgabe: {Milch, Bier} {Windeln} AA (v) = {{Milch}, {Windeln}, {Bier}, {Milch, Windeln}} XX = {Milch, Windeln} Ausgabe: {Milch, Windeln} {Bier} AA () = {{Milch}, {Windeln}, {Bier}} XX = {Milch} Ausgabe: {Milch} {Windeln, Bier} AA (Ä) = {{Windeln}, {Bier}} XX = {Windeln} Ausgabe: {Windeln} {Milch, Bier} AA (Å) = {{Bier}} XX = {Bier} Ausgabe: {Bier} {Milch, Windeln} IS 2017 Kapitel 15 - Data Mining 27
28 Zusammenfassung Itemsetmining Warenkorbanalyse ist klassisches Beispiel für Data-Mining Dabei werden Transaktionen bestehend aus Items auf häufig zusammen auftretende Items sowie nach Assoziationsregeln der Form Wer Brot kauf kauft auch Bier durchsucht. Apriori-Algorithmus generiert Itemsets bottom-up basierend auf häufigen Itemsets kleinerer Länge. Dies funktioniert aufgrund der Anti-Monotonie des Supports. Assoziationsregeln werden basierend auf häufigen Itemsets berechnet. IS 2017 Kapitel 15 - Data Mining 28
29 Clustering Gegeben eine Menge von Objekten. Ziel: Finden eines guten Clusterings (Gruppierung) der Objekte anhand ihrer Eigenschaften. Hier, anhand ihrer 3D Koordinaten. Abbildung nach Tan, Steinbach, Kumar IS 2017 Kapitel 15 - Data Mining 29
30 Das Clustering-Problem (2) Gegeben eine Menge UU von Objekten und eine Distanzfunktion dd: UU UU R Ö Gruppiere Objekte aus UU in Cluster (Teilmengen), so dass die Distanz zwischen den Punkten eines Clusters klein ist und die Distanz zwischen den einzelnen Clustern groß ist. Intra-cluster Distanzen minimiert Inter-cluster Distanzen maximiert Abbildung nach Tan, Steinbach, Kumar IS 2017 Kapitel 15 - Data Mining 30
31 n n n Partitionen und Prototypen Wir betrachten hier exklusives Clustering, d.h. ein Objekt ist genau einem Cluster zugeordnet: Die Menge UU ist partitioniert in kk Cluster CC i, CC v,, CC Z mit Ü CC x x = UU und CC x CC â = für ii jj Jedes Cluster CC x wird von einem sogenannten Prototypen μμ x repräsentiert (aka. Schwerpunkt/Centroid oder Mitte/Durchschnitt) Dieser Prototyp μμ x muss nicht notwendigerweise eines der Objekte aus CC x sein Die Qualität des Clusterings wird dann in der Regel berechnet als der quadratische Fehler zwischen den Objekten eines Clusters und dem Prototypen eines Clusters (hier für dd-dimensionale Daten): Z v é é xx â μμ x v xîi ê ë í ì Z r = é é é xx âï μμ xï v xîi ê ë í ì ïîi IS 2017 Kapitel 15 - Data Mining 31
32 Clustering nicht (immer) eindeutig Wie viele Cluster? Sechs Cluster Zwei Clusters Vier Cluster Abbildung nach Tan, Steinbach, Kumar IS 2017 Kapitel 15 - Data Mining 32
33 Ein Naiver (Brute-Force) Ansatz 1. Generiere alle möglichen Clusterings, eins nach dem anderen 2. Berechne den quadratischen Fehler 3. Wähle das Cluster mit dem kleinsten Fehler aus Dieser Ansatz ist leider unbrauchbar: Es gibt viel zu viele mögliche Clusterings, die ausprobiert werden müssen. Es gibt kk nn Möglichkeiten kk Cluster zu erzeugen bei nn Objekten. Davon können einige Cluster leer sein. Also für 50 Objekte und 3 Cluster gibt es 3 50 = Möglichkeiten. Die Anzahl der Möglichkeiten diese nn Punkte in kk nicht leere Cluster aufzuteilen ist die Stirling-Zahl der zweiten Art. SS(50, 3) = Nur zur Info, hier die Definition der Stirling-Zahl der zweiten Art: SS nn, kk = nn kk = 1 kk! é( 1)â kk jj Z âî~ (kk jj) ù IS 2017 Kapitel 15 - Data Mining 33
34 K-Means Clustering Jedes Cluster wird durch einen Mittelpunkt (Centroid) repräsentiert Ein Objekt wird dem Centroid mit der geringsten Distanz zugewiesen Es gibt kk Cluster. kk ist ein Parameter. Algorithmus: 1. Wähle zufällig kk Objekte als initiale Centroids aus. 2. repeat 3. Ordne Objekte dem jeweils nächstgelegenen Centroid zu 4. Berechne für jedes Cluster den neuen Centroid. 5. until die Centroide ändern sich nicht mehr IS 2017 Kapitel 15 - Data Mining 34
35 K-Means: Beispiel Wähle zufällig kk = 4 Centroide aus und ordne Objekte zu IS 2017 Kapitel 15 - Data Mining 35
36 K-Means: Beispiel Berechne Centroid jedes Clusters neu IS 2017 Kapitel 15 - Data Mining 36
37 K-Means: Beispiel Ordne Objekte neu zu IS 2017 Kapitel 15 - Data Mining 37
38 K-Means: Beispiel Berechne Centroid jedes Clusters neu IS 2017 Kapitel 15 - Data Mining 38
39 K-Means: Beispiel Ordne Objekte neu zu IS 2017 Kapitel 15 - Data Mining 39
40 K-Means: Beispiel Berechne Centroid jedes Clusters neu IS 2017 Kapitel 15 - Data Mining 40
41 K-Means: Beispiel Ordne Objekte neu zu IS 2017 Kapitel 15 - Data Mining 41
42 K-Means: Beispiel Berechne Centroid jedes Clusters neu IS 2017 Kapitel 15 - Data Mining 42
43 K-Means: Beispiel Ordne Objekte neu zu IS 2017 Kapitel 15 - Data Mining 43
44 K-Means: Beispiel Berechne Centroid jedes Clusters neu IS 2017 Kapitel 15 - Data Mining 44
45 K-Means: Beispiel Ordne Objekte neu zu IS 2017 Kapitel 15 - Data Mining 45
46 K-Means: Beispiel Berechne Centroid jedes Clusters neu: Hat sich nichts geändert! IS 2017 Kapitel 15 - Data Mining 46
47 K-Means-Clustering Die initialen Centroids werden normalerweise zufällig ausgewählt. Dadurch können verschiedene Durchläufe auf den gleichen Daten unterschiedliche Cluster erzeugen. Als Centroid benutzt man typischerweise den Mittelwert (Mean) der Objekte eines Clusters. Als Distanzmaß wird z.b. die Euklidische Distanz benutzt. Der K-Means-Algorithmus konvergiert In den ersten Iterationen sind die Änderungen des Clusterings am deutlichsten Abbruchkriterium auch: Bis nur noch sehr wenige Objekte das Cluster wechseln Komplexität ist OO(nn kk II dd). nn = Anzahl Objekte, kk =Anzahl Cluster, II=Anzahl Iterationen, dd =Dimensionalität der Daten. IS 2017 Kapitel 15 - Data Mining 47
Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007
Assoziationsregeln & Sequenzielle Muster 0 Übersicht Grundlagen für Assoziationsregeln Apriori Algorithmus Verschiedene Datenformate Finden von Assoziationsregeln mit mehren unteren Schranken für Unterstützung
Maschinelles Lernen: Symbolische Ansätze
Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 13. Übungsblatt Aufgabe 1: Apriori Gegeben seien folgende Beobachtungen vom Kaufverhalten von Kunden: beer chips dip
5. Assoziationsregeln
5. Generieren von Assoziationsregeln Grundbegriffe 5. Assoziationsregeln Assoziationsregeln beschreiben gewisse Zusammenhänge und Regelmäßigkeiten zwischen verschiedenen Dingen, z.b. den Artikeln eines
Lernen von Assoziationsregeln
Lernen von Assoziationsregeln Gegeben: R eine Menge von Objekten, die binäre Werte haben t eine Transaktion, t! R r eine Menge von Transaktionen S min " [0,] die minimale Unterstützung, Conf min " [0,]
INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen
INTELLIGENTE DATENANALYSE IN MATLAB Unüberwachtes Lernen: Clustern von Attributen Literatur J. Han, M. Kamber: Data Mining Concepts and Techniques. J. Han et. al: Mining Frequent Patterns without Candidate
Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln
Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Praktikum: Data Warehousing und Data Mining Clusteranalyse Clusteranalyse Idee Bestimmung von Gruppen ähnlicher Tupel in multidimensionalen Datensätzen.
Apriori-Algorithmus zur Entdeckung von Assoziationsregeln
Apriori-Algorithmus zur Entdeckung von PG 42 Wissensmanagment Lehrstuhl für Künstliche Intelligenz 22. Oktober 21 Gliederung Motivation Formale Problemdarstellung Apriori-Algorithmus Beispiel Varianten
Kapitel 12: Schnelles Bestimmen der Frequent Itemsets
Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren
Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid
Fortgeschrittene Computerintensive Methoden: Assoziationsregeln Steffen Unkel Manuel Eugster, Bettina Grün, Friedrich Leisch, Matthias Schmid Institut für Statistik LMU München Sommersemester 2013 Zielsetzung
Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
6.6 Vorlesung: Von OLAP zu Mining
6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum
Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren?
Mining über RDBMSe von Christian Widmer Wie gut lässt sich Mining mit SQL realisieren? Müssen neue Konstrukte zur Verfügung gestellt werden, wenn ja welche? Vortragsüberblick Association Rules Apriori
Häufige Mengen ohne Kandidatengenerierung. FP-Tree: Transaktionen. Konstruktion eines FP-Trees. FP-Tree: Items
Häufige Mengen ohne Kandidatengenerierung Jiawei Han, Micheline Kamber 2006 (2nd ed.)! Ziel 1: Kompression der Datenbank in eine Frequent-Pattern Tree Struktur (FP-Tree)! Stark komprimiert, vollständig
Wissensentdeckung in Datenbanken
Wissensentdeckung in Datenbanken SQL, Häufige Mengen Nico Piatkowski und Uwe Ligges 11.05.2017 1 von 16 Überblick Was bisher geschah... Modellklassen Verlustfunktionen Numerische Optimierung Regularisierung
Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung
Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.
Kapitel 11: Association Rules
Kapitel 11: Association Association Einleitung Association : Eine wichtige Art von Mustern, an der man im Data-Mining Kontext interessiert ist. Muster mit einfacher Struktur. Ziel im folgenden: Finden
5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Vorbemerkungen 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer
Data Mining und Statistik: Gemeinsamkeiten und Unterschiede. Daniel Meschenmoser
Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Daniel Meschenmoser Übersicht Gemeinsamkeiten von Data Mining und Statistik Unterschiede zwischen Data Mining und Statistik Assoziationsregeln
Mathematische Grundlagen III
Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten
Data Mining auf Datenströmen Andreas M. Weiner
Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas
5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene
... Text Clustern. Clustern. Einführung Clustern. Einführung Clustern
Clustern Tet Clustern Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so daß: Beispiele innerhalb eines Clusters sich sehr ähnlich Beispiele in verschiedenen Clustern
4. Lernen von Entscheidungsbäumen
4. Lernen von Entscheidungsbäumen Entscheidungsbäume 4. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse
Algorithms for Pattern Mining AprioriTID. Stefan George, Felix Leupold
Algorithms for Pattern Mining AprioriTID Stefan George, Felix Leupold Gliederung 2 Einleitung Support / Confidence Apriori ApriorTID Implementierung Performance Erweiterung Zusammenfassung Einleitung 3
Frequent Itemset Mining und FP-Tree
Übung 4 Frequent Itemset Mining und FP-Tree Frequent Itemset Mining Motivation: Es existiert eine Datenbank mit vielen Einträgen Man möchte wissen, welche Einträge oft zusammen vorkommen Frequent Itemset
FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus
FernUniversität in Hagen Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln Thema 1.1.1 Der Apriori-Algorithmus Referentin: Olga Riener Olga Riener. Thema 1.1.1. Der
Methoden zur Cluster - Analyse
Kapitel 4 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics
Frequent Itemset Mining + Association Rule Mining
Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,
Clustern: Voraussetzungen
Clustering Gruppen (Cluster) ähnlicher Elemente bilden Elemente in einem Cluster sollen sich möglichst ähnlich sein, u. den Elementen in anderen Clustern möglichst unähnlich im Gegensatz zu Kategorisierung
Data Mining im Einzelhandel Methoden und Werkzeuge
Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.
Übungen zur Vorlesung Grundlagen der Mathematik II Lösungsvorschlag
MATHEMATISCHES INSTITUT DER UNIVERSITÄT MÜNCHEN Dr. E. Schörner SS 2013 Blatt 3 0.05.2013 Übungen zur Vorlesung Grundlagen der Mathematik II Lösungsvorschlag 9. Wir betrachten die Ereignisse A, B, C A;
Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität
Datenstrukturen und Algorithmen Christian Sohler FG Algorithmen & Komplexität 1 Clustering: Partitioniere Objektmenge in Gruppen(Cluster), so dass sich Objekte in einer Gruppe ähnlich sind und Objekte
Maschinelles Lernen: Symbolische Ansätze
Semestralklausur zur Vorlesung Maschinelles Lernen: Symbolische Ansätze Prof. J. Fürnkranz / Dr. G. Grieser Technische Universität Darmstadt Wintersemester 2005/06 Termin: 23. 2. 2006 Name: Vorname: Matrikelnummer:
Kapitel MK:IV. IV. Modellieren mit Constraints
Kapitel MK:IV IV. Modellieren mit Constraints Einführung und frühe Systeme Konsistenz I Binarization Generate-and-Test Backtracking-basierte Verfahren Konsistenz II Konsistenzanalyse Weitere Analyseverfahren
4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum
4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.
Elemente der Mathematik - Sommer 2016
Elemente der Mathematik - Sommer 06 Prof. Dr. Matthias Lesch, Regula Krapf Übungsblatt 8 Aufgabe 7 (8 Punkte). Ein Parallelogramm ist ein Rechteck ABCD mit Seiten a, b, c, d wie unten dargestellt, mit
Effiziente Algorithmen 2
Effiziente Algorithmen 2 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Algorithmen
VII.3 Assoziationsregeln
VII.3 Assoziationsregelverfahren VII.3. Einführung [Bollinger 96] VII.3 Assoziationsregeln Algorithmen zum Entdecken von Assoziationsregeln sind typische Vertreter von Data Mining Verfahren. Assoziationsregeln
Mathematische Grundlagen der Computerlinguistik Ordnungsrelationen
Mathematische Grundlagen der Computerlinguistik Ordnungsrelationen Dozentin: Wiebke Petersen 4. Foliensatz Wiebke Petersen math. Grundlagen 86 starke / schwache Ordnungen Eine Ordnung R einer Menge A ist
DBS5 Kap. 4. Data Mining
DBS5 Kap. 4 Data Mining Klassifikationen und Cluster-Bildung: Auffinden von Regeln zur Partitionierung von Daten in disjunkte Teilmengen (Anwendungsbeispiel: Risikoabschätzung) bzw. Herstellen von Gruppierungen
Data Mining - Wiederholung
Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)
Fortgeschrittene Netzwerk- und Graph-Algorithmen
Fortgeschrittene Netzwerk- und Graph-Algorithmen Prof. Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Wintersemester
2. Lernen von Entscheidungsbäumen
2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse
Theoretische Grundlagen der Informatik
Theoretische Grundlagen der Informatik Vorlesung am 15.01.2015 INSTITUT FÜR THEORETISCHE 0 KIT 15.01.2015 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik
Algorithmische Bioinformatik 1
Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Algorithmen
2. Datenvorverarbeitung
Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy
Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken
Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken 7. VI. 2016 Organisatorisches nächste Woche am 14. Juni Abschlusstest (Gruppe 1: 10:00 11:15, Gruppe 2: 11:30 12:45 ) Übungsblatt
9 Minimum Spanning Trees
Im Folgenden wollen wir uns genauer mit dem Minimum Spanning Tree -Problem auseinandersetzen. 9.1 MST-Problem Gegeben ein ungerichteter Graph G = (V,E) und eine Gewichtsfunktion w w : E R Man berechne
Datenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale
Sprache untersuchen sortieren B E. Ab c & De f. Sprache untersuchen sortieren B E. Ab c & De f
Sprache untersuchen sortieren B CD E A F Ab c & De f 20 Sprache untersuchen sortieren B CD E A F Ab c & De f 20 Stell dir mal vor: ich heiße Otto. Schreibe Otto und Oskar auf. Ot to Os kar Nein! Ich heiße
Lösbarkeit linearer Gleichungssysteme
Lösbarkeit linearer Gleichungssysteme Lineares Gleichungssystem: Ax b, A R m n, x R n, b R m L R m R n Lx Ax Bemerkung b 0 R m Das Gleichungssystem heißt homogen a A0 0 Das LGS ist stets lösbar b Wenn
Sprache untersuchen sortieren B E. A bc & D ef. Sprache untersuchen sortieren B E. A bc & D ef
Sprache untersuchen sortieren B CD E A F A bc & D ef 19 Sprache untersuchen sortieren B CD E A F A bc & D ef 19 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Wörter können nach dem Alphabet sortiert
Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing
SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0
7.1.2 Membership-Test - fortgesetzt
7. Formaler Datenbankentwurf 7.1. Funktionale Abhängigkeiten Seite 1 7.1.2 Membership-Test - fortgesetzt Membership-Test: X Y F +? (Attribut-)Hülle X + von X (bzgl. F) X + = {A A V und X A F + }. Membership-Test
2 Die Menge der ganzen Zahlen. von Peter Franzke in Berlin
Die Menge der ganzen Zahlen von Peter Franzke in Berlin Das System der natürlichen Zahlen weist einen schwerwiegenden Mangel auf: Es gibt Zahlen mn, derart, dass die lineare Gleichung der Form mx n keine
Kapitel 4: Das Überdeckungsproblem
Kapitel : Das Überdeckungsproblem Kapitel Das Überdeckungsproblem Kapitel : Das Überdeckungsproblem Seite / 25 Kapitel : Das Überdeckungsproblem Inhaltsverzeichnis. Überdeckungsmatrizen.2 Minimalüberdeckungen.
Mathematische Grundlagen der Computerlinguistik Relationen und Funktionen
Mathematische Grundlagen der Computerlinguistik Relationen und Funktionen Dozentin: Wiebke Petersen 2. Foliensatz Wiebke Petersen math. Grundlagen 20 n-tupel und Cartesisches Produkt Mengen sind ungeordnet,
4.Tutorium Multivariate Verfahren
4.Tutorium Multivariate Verfahren - Clusteranalyse - Hannah Busen: 01.06.2015 und 08.06.2015 Nicole Schüller: 02.06.2015 und 09.06.2015 Institut für Statistik, LMU München 1 / 17 Gliederung 1 Idee der
Lemma Für jede monotone Grammatik G gibt es eine kontextsensitive
Lemma Für jede monotone Grammatik G gibt es eine kontextsensitive Grammatik G mit L(G) = L(G ). Beweis im Beispiel (2.): G = (V,Σ, P, S) : P = {S asbc, S abc, CB BC, ab ab, bb bb, bc bc, cc cc}. (i) G
Datenanalyse mit Data Mining
Datenanalyse mit Data Mining von Jan-Christoph Meier Hamburg, 19.01.2012 1 Ablauf Motivation Speicherung der Daten für das Data Mining Data Mining Algorithmen Ausblick auf die Masterarbeit Konferenzen
Induktion von Assoziationsregeln. Stefan Mandl
Induktion von Assoziationsregeln Stefan Mandl Inhalt Was sind Assoziationsregeln? Qualitätsbewertung Algorithmus Was sind Assoziationsregeln? Assoziationsregeln Assoziationsregeln beschreiben Korrelationen
2.2 Der Algorithmus von Knuth, Morris und Pratt
Suchen in Texten 2.1 Grundlagen Ein Alphabet ist eine endliche Menge von Symbolen. Bsp.: Σ a, b, c,..., z, Σ 0, 1, Σ A, C, G, T. Wörter über Σ sind endliche Folgen von Symbolen aus Σ. Wörter werden manchmal
/-010 2% 3%.-&"(2#( 4#5% 6077## 7 8$$04%27.0& 905$0& :0;+
! "#$%&'() *+,-#.(! "#$%&'() *+,-#.( // /011#)1.#) 234#5: 61$03#7 8$("(1$5% 5 15#9($(-:1$5%4 # 90.+;(. 5 6. [?.] I.!"#$%&'(&) *&#+,-& "$./0-/1/
Datenbanksysteme I Übung: Relationaler Datenbankentwurf. Jana Bauckmann
Datenbanksysteme I Übung: Relationaler Datenbankentwurf Jana Bauckmann Bei den Abgaben... 2 Dateiname blattaufgabe.pdf blatt2aufgabe1meiermueller.pdf nicht blatt1-aufgabe1-foo.pdf
Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: - Von Hieroglyphen, Pyramiden, Schreibern und Grabräubern Das komplette Material finden Sie hier: Download bei School-Scout.de Inhalt
Algorithmen mit konstantem Platzbedarf: Die Klasse REG
Algorithmen mit konstantem Platzbedarf: Die Klasse REG Sommerakademie Rot an der Rot AG 1 Wieviel Platz brauchen Algorithmen wirklich? Daniel Alm Institut für Numerische Simulation Universität Bonn August
Data Mining-Modelle und -Algorithmen
Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,
Informatik II, SS 2014
Informatik II SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 7 (21.5.2014) Binäre Suche, Hashtabellen I Algorithmen und Komplexität Abstrakte Datentypen : Dictionary Dictionary: (auch: Maps, assoziative
Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Die Schrift im Alten Ägypten - Hieroglyphen übersetzen & schreiben
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Die Schrift im Alten Ägypten - Hieroglyphen übersetzen & schreiben Das komplette Material finden Sie hier: School-Scout.de 2.-8. Schuljahr
Kapitel 2 Mathematische Grundlagen
Kapitel 2 Mathematische Grundlagen Ziel: Einführung/Auffrischung einiger mathematischer Grundlagen 2.1 Mengen, Relationen, Ordnungen Definition: Eine Menge ist eine Zusammenfassung von wohlbestimmten und
Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
Lineare Algebra I. - 1.Vorlesung - Prof. Dr. Daniel Roggenkamp & Falko Gauß. Monday 12 September 16
Lineare Algebra I - 1.Vorlesung - Prof. Dr. Daniel Roggenkamp & Falko Gauß 1. Mengen und Abbildungen: Mengen gehören zu den Grundlegendsten Objekten in der Mathematik Kurze Einführung in die (naive) Mengelehre
Grundlagen der Theoretischen Informatik
Grundlagen der Theoretischen Informatik 4. Kellerautomaten und kontextfreie Sprachen (II) 11.06.2015 Viorica Sofronie-Stokkermans e-mail: [email protected] 1 Übersicht 1. Motivation 2. Terminologie
k-means als Verfahren zur Clusteranalyse basierend auf Repräsentanten bestimmt ein flaches Clustering
Rückblick k-means als Verfahren zur Clusteranalyse basierend auf Repräsentanten bestimmt ein flaches Clustering Hierarchisches Clustering bestimmt eine Folge von Clusterings, die als Dendrogramm darstellbar
7. Sortieren Lernziele. 7. Sortieren
7. Sortieren Lernziele 7. Sortieren Lernziele: Die wichtigsten Sortierverfahren kennen und einsetzen können, Aufwand und weitere Eigenschaften der Sortierverfahren kennen, das Problemlösungsparadigma Teile-und-herrsche
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse Tobias Scheffer Thomas Vanck Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer
Softwareprojektpraktikum Maschinelle Übersetzung
Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl [email protected] Vorbesprechung 5. Aufgabe 22. Juni 2017 Human Language Technology
Stand der Vorlesung Komplexität von Algorithmen (Kapitel 3)
Stand der Vorlesung Komplexität von Algorithmen (Kapitel 3) Technische Universität München Motivation: IT gestützte Steuerung, Überwachung, Fertigung, Produktion,. : erfordert effiziente Berechnungsvorschriften
Grundlagen der Kombinatorik
Statistik 1 für SoziologInnen Grundlagen der Kombinatorik Univ.Prof. Dr. Marcus Hudec Zufallsauswahl aus Grundgesamtheiten In der statistischen Praxis kommt dem Ziehen von Stichproben größte Bedeutung
Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. [email protected]
Datenbankanwendung Wintersemester 2014/15 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern [email protected] Wiederholung: Anfragegraph Anfragen dieses Typs können als Graph dargestellt werden: Der
1 Einleitung. 2 Clustering
Lernende Vektorquantisierung (LVQ) und K-Means-Clustering David Bouchain Proseminar Neuronale Netze Kurs-Nr.: CS4400 ISI WS 2004/05 [email protected] 1 Einleitung Im Folgenden soll zum einen ein Überblick
Algorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Sommersemester 2007 11. Vorlesung Peter F. Stadler Universität Leipzig Institut für Informatik [email protected] Das Rucksack-Problem Ein Dieb, der einen Safe
Algorithmen und Datenstrukturen 2
Algorithmen und Datenstrukturen 2 Sommersemester 2009 11. Vorlesung Uwe Quasthoff Universität Leipzig Institut für Informatik [email protected] Das Rucksack-Problem Ein Dieb, der einen
Der euklidische Algorithmus für ganze Zahlen
Der euklidische Algorithmus für ganze Zahlen Ein unverzichtbares Verfahren in der Kryptographie ist der euklidische Algorithmus. In diesem Kapitel stellen wir die erste Version für ganze Zahlen vor. Sei
1 Mengen. 1.1 Definition
1 Mengen 1.1 Definition Eine Menge M ist nach dem Begründer der Mengenlehre Georg Cantor eine Zusammenfassung von wohlunterschiedenen(verschiedenen) Elementen. Eine Menge lässt sich durch verschiedene
Informatik I: Einführung in die Programmierung
Informatik I: Einführung in die Programmierung 7. Albert-Ludwigs-Universität Freiburg Bernhard Nebel 31. Oktober 2014 1 31. Oktober 2014 B. Nebel Info I 3 / 20 Um zu, muss man zuerst einmal. Abb. in Public
IR Seminar SoSe 2012 Martin Leinberger
IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite
Effiziente Algorithmen
Effiziente Algorithmen Aufgabe 5 Gruppe E Martin Schliefnig, 0160919 Christoph Holper, 9927191 Ulrike Ritzinger, 0125779 1. Problemstellung Gegeben ist eine Datei, die eine Million reelle Zahlen enthält.
4.6.1 Mathematische Grundlagen
4.6.1 Mathematische Grundlagen Die Basiseinheit für Berechnungen im AES stellt das Byte dar, daher sind viele Operationen im AES im GF(2 8 ) definiert. Um den Wert eines Byte darzustellen benutzen wir
Kombinatorik. 1. Permutationen 2. Variationen 3. Kombinationen. ad 1) Permutationen. a) Permutationen von n verschiedenen Elementen
Kombinatorik Zur Berechnung der Wahrscheinlichkeit eines zusammengesetzten Ereignisses ist oft erforderlich, zwei verschiedene Anzahlen zu berechnen: die Anzahl aller Elementarereignisse und die Anzahl
Grundlagen: Algorithmen und Datenstrukturen
Technische Universität München Fakultät für Informatik Lehrstuhl für Effiziente Algorithmen Dr. Hanjo Täubig Tobias Lieber Sommersemester 2011 Übungsblatt 1 16. September 2011 Grundlagen: Algorithmen und
4. Anhang 4.1 Wertetabellen zum 2. Algorithmus //Suche alle k, welche quadratische Reste mod 64 sind print "Quadratische Reste mod 64:"; for k:=0 to 31 do print (k^2 mod 64); end for; k 0 1 2 3 4 5 6 7
