Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken

Größe: px
Ab Seite anzeigen:

Download "Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken"

Transkript

1 Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken 7. VI. 2016

2 Organisatorisches nächste Woche am 14. Juni Abschlusstest (Gruppe 1: 10:00 11:15, Gruppe 2: 11:30 12:45 ) Übungsblatt mit vermischten Aufgaben als Vorbereitung heute letzte Wissensüberprüfung Am 21. Juni VO + UE im RWZ HS (von 8:30 bis 11 Uhr). XML-Einführung von Martin Antenreiter voraussichtlich am 21. Juni ab 10 Uhr Abschlusstest VO am 28. Juni, 9 11 Uhr im Zeichensaal (Anmeldung über MU Online) alte Prüfung online

3 Organisatorisches VO nächste Woche (14. Juni): Fragen zum UE-Abschlusstest VO übernächste Woche (21. Juni): Fragen zur VO-Abschlussprüfung & weitere Normalisierungsbeispiele

4 Nachbetrachtung Wissensüberprüfung DIE REGEL!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Alles was im SELECT keine Aggregatfunktion ist,!! muss ins GROUP BY!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

5 Nachbetrachtung Wissensüberprüfung DIE REGEL!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Alles was im SELECT keine Aggregatfunktion ist,!! muss ins GROUP BY!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Hat man mehrere Attribute neben Aggregatfunktion im SELECT, dann müssen auch mehrere Attribute ins GROUP BY.

6 Nachbetrachtung Wissensüberprüfung DIE REGEL!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Alles was im SELECT keine Aggregatfunktion ist,!! muss ins GROUP BY!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Hat man mehrere Attribute neben Aggregatfunktion im SELECT, dann müssen auch mehrere Attribute ins GROUP BY. z.b.: SELECT spalte1, spalte2, COUNT(*) FROM tabelle GROUP BY spalte1, spalte2

7 SQL: Erstellen und Ändern von Datenbanken und Tabellen Heute: Erstellen und Ändern von Datenbanken und Tabellen Index auf Datenbanken

8 Index auf Datenbanken Outline 1 Organisatorisches 2 Ranking und Data Mining Index auf Datenbanken Ranking Klassifikation Assoziationsregeln Clustering 3 Datenschutz 4 Normalisierung

9 Index auf Datenbanken Indexstrukturen auf Datenbanken (letzte Kopien dazu im Sekretariat) Sucht man in Tabelle Zeilen mit bestimmtem Wert in Spalte, muss man sich im schlimmsten Fall alle Zeilen ansehen. Indexstrukturen auf Tabellen helfen durch Vorsortierung, sodass Abfragen schneller ausgeführt werden können. Verschiedene Indexstrukturen: Index Sequential Access Method (ISAM) B-Bäume B + -Bäume Hashing Bitmap Indizes

10 Index auf Datenbanken Indexstrukturen auf Datenbanken Verschiedene Indexstrukturen: Index Sequential Access Method (ISAM) B-Bäume B + -Bäume Hashing Bitmap Indizes Der Performancegewinn von Abfragen sowie der Performanceverlust von Änderungen hängen von der verwendeten Indexstruktur ab. In SQL hat man entsprechend je nach verwendeter Variante die Wahl zwischen verschiedenen Indextypen.

11 Ranking Outline 1 Organisatorisches 2 Ranking und Data Mining Index auf Datenbanken Ranking Klassifikation Assoziationsregeln Clustering 3 Datenschutz 4 Normalisierung

12 Ranking Ranking Aufgabe: haben mehrere Listen derselben Objekte, gereiht nach verschiedenen Kriterien aggregieren die verschiedenen Kriterien zu einem Wert (einfachster Fall: Summe) hätten gerne die besten k Objekte Naive Lösung: Berechnen Wert für alle Objekte und sortieren Bessere Lösung: Threshold Algorithmus No Random Access Algorithmus

13 Klassifikation Outline 1 Organisatorisches 2 Ranking und Data Mining Index auf Datenbanken Ranking Klassifikation Assoziationsregeln Clustering 3 Datenschutz 4 Normalisierung

14 Klassifikation Data Mining Idee: haben viele Daten suchen nach speziellen Mustern

15 Klassifikation Data Mining Idee: haben viele Daten suchen nach speziellen Mustern Wir unterscheiden dabei: Klassifikation Assoziationsregeln Clustering

16 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese

17 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele:

18 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele: Risiko für Versicherungsfall (gegeben: Geschlecht, Alter etc.)

19 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele: Risiko für Versicherungsfall (gegeben: Geschlecht, Alter etc.) Risiko, dass Kredit nicht zurückgezahlt wird (gegeben: Geschlecht, Alter, Familienstand, Arbeitsverhältnis, etc.)

20 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele: Risiko für Versicherungsfall (gegeben: Geschlecht, Alter etc.) Risiko, dass Kredit nicht zurückgezahlt wird (gegeben: Geschlecht, Alter, Familienstand, Arbeitsverhältnis, etc.) Aussicht, dass medizinische Behandlung erfolgreich

21 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele: Risiko für Versicherungsfall (gegeben: Geschlecht, Alter etc.) Risiko, dass Kredit nicht zurückgezahlt wird (gegeben: Geschlecht, Alter, Familienstand, Arbeitsverhältnis, etc.) Aussicht, dass medizinische Behandlung erfolgreich Ist Spam?

22 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele: Risiko für Versicherungsfall (gegeben: Geschlecht, Alter etc.) Risiko, dass Kredit nicht zurückgezahlt wird (gegeben: Geschlecht, Alter, Familienstand, Arbeitsverhältnis, etc.) Aussicht, dass medizinische Behandlung erfolgreich Ist Spam? Enthält dieses Bild eine Katze?

23 Klassifikation Klassifikation Setting: interessieren uns für bestimmte Eigenschaft schauen uns vergangene Daten an und generieren Hypothese Beispiele: Risiko für Versicherungsfall (gegeben: Geschlecht, Alter etc.) Risiko, dass Kredit nicht zurückgezahlt wird (gegeben: Geschlecht, Alter, Familienstand, Arbeitsverhältnis, etc.) Aussicht, dass medizinische Behandlung erfolgreich Ist Spam? Enthält dieses Bild eine Katze? Ist diese Website über Datenbanknormalisierung?

24 Klassifikation Maschinelles Lernen Es gibt viele verschiedene Methoden, um aus Daten zu lernen : Neuronale Netze Entscheidungsbäume Support Vector Machines. Lehrveranstaltung Maschinelles Lernen (Auer)

25 Assoziationsregeln Outline 1 Organisatorisches 2 Ranking und Data Mining Index auf Datenbanken Ranking Klassifikation Assoziationsregeln Clustering 3 Datenschutz 4 Normalisierung

26 Assoziationsregeln Assoziationsregeln Setting: möchten aus großer Datenmenge bestimmte Regeln ableiten Beispiel: Wenn jemand einen PC kauft, dann auch einen Drucker.

27 Assoziationsregeln Assoziationsregeln Setting: möchten aus großer Datenmenge bestimmte Regeln ableiten Beispiel: Wenn jemand einen PC kauft, dann auch einen Drucker. Diese Assoziationsregeln gelten i.a. nicht immer:

28 Assoziationsregeln Assoziationsregeln Setting: möchten aus großer Datenmenge bestimmte Regeln ableiten Beispiel: Wenn jemand einen PC kauft, dann auch einen Drucker. Diese Assoziationsregeln gelten i.a. nicht immer: Konfidenz: In wievielen % der Fälle stimmt die Regel? (Wieviele PC Käufer haben auch einen Drucker gekauft?)

29 Assoziationsregeln Assoziationsregeln Setting: möchten aus großer Datenmenge bestimmte Regeln ableiten Beispiel: Wenn jemand einen PC kauft, dann auch einen Drucker. Diese Assoziationsregeln gelten i.a. nicht immer: Konfidenz: In wievielen % der Fälle stimmt die Regel? (Wieviele PC Käufer haben auch einen Drucker gekauft?) Support: Aus wievielen Daten wurde die Regel abgeleitet? (In wievielen % der Einkäufe wurden ein PC und ein Drucker zusammen gekauft?)

30 Assoziationsregeln Der A Priori Algorithmus möchten alle Assoziationsregeln mit Support s min und Konfidenz c min. frequent itemset := Menge von Items mit Support s min Algorithmus für das Finden von frequent itemsets: Überprüfe für jeden Item i, ob {i} ein frequent itemset ist. Wiederhole: Für jedes gefundene frequent itemset F und jeden Item i / F überprüfe ob F {i} ein frequent itemset ist.

31 Assoziationsregeln Ableiten von Regeln aus Frequent Itemsets Sind frequent itemsets bekannt, so lassen sich leicht Assoziationsregeln daraus ableiten: Wenn F ein frequent itemset und F = L R mit L R =, dann ist L R Assoziationsregel mit Konfidenz(L R) = Support(F) Support(L) Überprüfe, ob Regel Konfidenz c min hat.

32 Assoziationsregeln Ableiten von Regeln aus Frequent Itemsets Wenn F ein frequent itemset und F = L R mit L R =, dann ist L R Assoziationsregel mit Konfidenz(L R) = Support(F) Support(L) Überprüfe, ob Regel Konfidenz c min hat. Beispiel: Wenn {Drucker, Papier, Toner} ein frequent itemset, dann haben wir die Assoziationsregel mit Konfidenz Drucker Papier, Toner Support({Drucker, Papier, Toner}) Support({Drucker})

33 Assoziationsregeln Erhöhen der Konfidenz Für zwei Assoziationsregeln L R, L + R abgeleitet aus demselben frequent itemset F = L R = L + R mit L L + und R R, gilt allgemein Konfidenz(L + R ) Konfidenz(L R). kann Konfidenz durch Verschieben von Items von rechts nach links erhöhen!

34 Assoziationsregeln Erhöhen der Konfidenz Für zwei Assoziationsregeln L R, L + R abgeleitet aus demselben frequent itemset F = L R = L + R mit L L + und R R, gilt allgemein Konfidenz(L + R ) Konfidenz(L R). kann Konfidenz durch Verschieben von Items von rechts nach links erhöhen! Beispiel: Konfidenz({Drucker, Papier} {Toner}) (1) Konfidenz({Drucker} {Papier, Toner}) (2)

35 Assoziationsregeln Anwendung: Empfehlungen Beispiel: Empfehlungen bei amazon funktioniert nicht immer gut (etwa bei Kunden mit ausgefallenem Geschmack): Liebe Kundin, lieber Kunde! Kunden, die sich für The Art of Chess Combination von Eugene Znosko-Borovsky interessierten, haben Read the High Country: A Guide to Western Books and Films von Mort bestellt. Daher möchten wir Sie darüber informieren, dass Read the High Country: A Guide to Western Books and Films von Mort in Kürze erscheinen wird. Bestellen Sie jetzt Ihr Exemplar vor! (Support zu gering!)

36 Clustering Outline 1 Organisatorisches 2 Ranking und Data Mining Index auf Datenbanken Ranking Klassifikation Assoziationsregeln Clustering 3 Datenschutz 4 Normalisierung

37 Clustering Clustering Setting: Gegeben: große Datenmenge finde Cluster von ähnlichen Daten

38 Clustering Clustering Setting: Gegeben: große Datenmenge finde Cluster von ähnlichen Daten Beispiel: Cluster in Bilddaten Bilder im gleichen Cluster zeigen ähnliche Objekte

39 Clustering Beispiel: Books that make you dumb

40 Clustering Beispiel: Music that makes you dumb

41 Datenschutz In George Orwells Dystopie 1984 überwacht die Regierung ihre Bürger. ( Big brother is watching you. )

42 Datenschutz In George Orwells Dystopie 1984 überwacht die Regierung ihre Bürger. ( Big brother is watching you. ) Die Gegenwart ist noch schlimmer: Menschen teilen alle Details ihres Leben mit

43 Datenschutz In George Orwells Dystopie 1984 überwacht die Regierung ihre Bürger. ( Big brother is watching you. ) Die Gegenwart ist noch schlimmer: Menschen teilen alle Details ihres Leben mit ihren Freunden und Bekannten,

44 Datenschutz In George Orwells Dystopie 1984 überwacht die Regierung ihre Bürger. ( Big brother is watching you. ) Die Gegenwart ist noch schlimmer: Menschen teilen alle Details ihres Leben mit ihren Freunden und Bekannten, jedem, den es interessiert,

45 Datenschutz In George Orwells Dystopie 1984 überwacht die Regierung ihre Bürger. ( Big brother is watching you. ) Die Gegenwart ist noch schlimmer: Menschen teilen alle Details ihres Leben mit ihren Freunden und Bekannten, jedem, den es interessiert, großen Firmen wie Facebook oder google (und der NSA).

46 Datenschutz In George Orwells Dystopie 1984 überwacht die Regierung ihre Bürger. ( Big brother is watching you. ) Die Gegenwart ist noch schlimmer: Menschen teilen alle Details ihres Leben mit ihren Freunden und Bekannten, jedem, den es interessiert, großen Firmen wie Facebook oder google (und der NSA). If it s free, YOU (=your data) are the product.

47 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können?

48 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste?

49 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol)

50 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol) Bücher, die Sie lesen / Musik, die Sie hören?

51 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol) Bücher, die Sie lesen / Musik, die Sie hören? (siehe oben)

52 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol) Bücher, die Sie lesen / Musik, die Sie hören? (siehe oben) Ihre Hobbies

53 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol) Bücher, die Sie lesen / Musik, die Sie hören? (siehe oben) Ihre Hobbies (Fallschirmspringen)

54 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol) Bücher, die Sie lesen / Musik, die Sie hören? (siehe oben) Ihre Hobbies (Fallschirmspringen) Informationen können isoliert betrachtet harmlos aussehen, in Kombination jedoch unerwünschte Schlüsse zulassen: Sie haben gestern früh Milch gekauft. Sie haben sich gestern nachmittag auf Facebook eingeloggt.

55 Datenschutz Welche Informationen sind so harmlos, dass Sie sie mit jedem teilen können? Ihre Einkaufsliste? (regelmäßig große Mengen an Alkohol) Bücher, die Sie lesen / Musik, die Sie hören? (siehe oben) Ihre Hobbies (Fallschirmspringen) Informationen können isoliert betrachtet harmlos aussehen, in Kombination jedoch unerwünschte Schlüsse zulassen: Sie haben gestern früh Milch gekauft. Sie haben sich gestern nachmittag auf Facebook eingeloggt. Sie waren gestern krank gemeldet.

56 Datenschutz Gewisse Information möchte man u.u. nicht mit anderen teilen (z.b. dem Arbeitgeber, der Versicherung, dem Nachbarn, usw.): Krankheiten politische Einstellung sexuelle Orientierung...

57 Datenschutz Gewisse Information möchte man u.u. nicht mit anderen teilen (z.b. dem Arbeitgeber, der Versicherung, dem Nachbarn, usw.): Krankheiten politische Einstellung sexuelle Orientierung... Darüber sprechen Sie nicht auf Facebook?

58 Datenschutz Zuverlässigkeit der Einschätzung nach 170 Facebook Likes:

59 Datenschutz Zuverlässigkeit der Einschätzung nach 170 Facebook Likes: Sexuelle Orientierung: 88 %

60 Datenschutz Zuverlässigkeit der Einschätzung nach 170 Facebook Likes: Sexuelle Orientierung: 88 % Politische Einstellung: 85 %

61 Datenschutz Zuverlässigkeit der Einschätzung nach 170 Facebook Likes: Sexuelle Orientierung: 88 % Politische Einstellung: 85 % Religion: 82 %

62 Datenschutz Zuverlässigkeit der Einschätzung nach 170 Facebook Likes: Sexuelle Orientierung: 88 % Politische Einstellung: 85 % Religion: 82 % Beziehungsstatus: 67 %

63 Datenschutz Zuverlässigkeit der Einschätzung nach 170 Facebook Likes: Sexuelle Orientierung: 88 % Politische Einstellung: 85 % Religion: 82 % Beziehungsstatus: 67 % Drogenkonsum: 65 %

64 Datenschutz Auch ohne Likes können aus dem Facebook-Graphen Rückschlüsse gezogen werden über: ehemalige Mitschüler Arbeitskollegen mit wem Sie Ihre Freizeit verbringen Ihren Partner

65 Datenschutz Social credit sytem (SCS) in China bewertet Bürger anhand Verhalten in sozialen Netzwerken Einkaufsverhalten Bankdaten Jeder Bürger erhält sogenannte Sesame credit points für gutes Verhalten, für schlechtes Verhalten gibt es Punkteabzüge. Ob ein Bürger z.b. ein Visum fürs Ausland bekommt, hängt dann von seinem Punktestand ab.

Datenbanken Unit 11: Erstellen u. Ändern von Datenbanken und Tabellen Verbindung von Java auf Datenbanken

Datenbanken Unit 11: Erstellen u. Ändern von Datenbanken und Tabellen Verbindung von Java auf Datenbanken Datenbanken Unit 11: Erstellen u Ändern von Datenbanken und Tabellen Verbindung von Java auf Datenbanken 13 VI 2017 Organisatorisches morgen Abschlusstest UE (Gruppe 1: 14:45 16:00, Gruppe 2: 16:00 17:15

Mehr

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 17. V. 2017 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel

Mehr

Datenbanksysteme 2009

Datenbanksysteme 2009 Datenbanksysteme 2009 Kapitel 17: Data Warehouse Oliver Vornberger Institut für Informatik Universität Osnabrück 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen

Mehr

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken

Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken Datenbanken Unit 9: OLAP, OLTP und objektrelationale Datenbanken 31. V. 2016 Outline 1 Organisatorisches 2 SQL 3 OLTP, OLAP, SAP, and Data Warehouse OLTP and OLAP SAP 4 Objekt-relationale Datenbanken Beispiel

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 13. Übungsblatt Aufgabe 1: Apriori Gegeben seien folgende Beobachtungen vom Kaufverhalten von Kunden: beer chips dip

Mehr

Kapitel 17: Date Warehouse

Kapitel 17: Date Warehouse Kapitel 17: Date Warehouse 1 OLTP versus OLAP OLTP (Online Transaction Processing) z.b. Flugreservierung, Handelsunternehmen kleine, kurze Transaktionen jeweils auf jüngstem Zustand OLAP (Online Analytical

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Datenbanken & Informationssysteme (WS 2016/2017)

Datenbanken & Informationssysteme (WS 2016/2017) Datenbanken & Informationssysteme (WS 2016/2017) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)

Mehr

Es geht also im die SQL Data Manipulation Language.

Es geht also im die SQL Data Manipulation Language. 1 In diesem Abschnitt wollen wir uns mit den SQL Befehlen beschäftigen, mit denen wir Inhalte in Tabellen ( Zeilen) einfügen nach Tabelleninhalten suchen die Inhalte ändern und ggf. auch löschen können.

Mehr

SELECT dient dazu, aus einer vorhandenen Datenbank bestimmte Spalten und Zeilen auszugeben es handelt sich also um eine Auswahlabfrage.

SELECT dient dazu, aus einer vorhandenen Datenbank bestimmte Spalten und Zeilen auszugeben es handelt sich also um eine Auswahlabfrage. SELECT-FROM SELECT dient dazu, aus einer vorhandenen Datenbank bestimmte Spalten und Zeilen auszugeben es handelt sich also um eine Auswahlabfrage. Inhaltsverzeichnis 1 Der grundlegende Aufbau 2 Doppelte

Mehr

Data Mining auf Datenströmen Andreas M. Weiner

Data Mining auf Datenströmen Andreas M. Weiner Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas

Mehr

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren?

Mining über RDBMSe. von. Christian Widmer. Wie gut lässt sich Mining mit SQL realisieren? Mining über RDBMSe von Christian Widmer Wie gut lässt sich Mining mit SQL realisieren? Müssen neue Konstrukte zur Verfügung gestellt werden, wenn ja welche? Vortragsüberblick Association Rules Apriori

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Semestralklausur zur Vorlesung Maschinelles Lernen: Symbolische Ansätze Prof. J. Fürnkranz / Dr. G. Grieser Technische Universität Darmstadt Wintersemester 2005/06 Termin: 23. 2. 2006 Name: Vorname: Matrikelnummer:

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language:

SQL. strukturierte Datenbankabfragesprache eine Datenbanksprache zur. Structured Query Language: SQL Structured Query Language: strukturierte Datenbankabfragesprache eine Datenbanksprache zur Definition, Abfrage und Manipulation von Daten in relationalen Datenbanken In der SQL-Ansicht arbeiten In

Mehr

Oracle 10g Einführung

Oracle 10g Einführung Kurs Oracle 10g Einführung Teil 5 Einführung Timo Meyer Administration von Oracle-Datenbanken Timo Meyer Sommersemester 2006 Seite 1 von 16 Seite 1 von 16 Agenda 1 Tabellen und Views erstellen 2 Indizes

Mehr

Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007

Assoziationsregeln & Sequenzielle Muster. A. Hinneburg, Web Data Mining MLU Halle-Wittenberg, SS 2007 Assoziationsregeln & Sequenzielle Muster 0 Übersicht Grundlagen für Assoziationsregeln Apriori Algorithmus Verschiedene Datenformate Finden von Assoziationsregeln mit mehren unteren Schranken für Unterstützung

Mehr

Aggregatfunktionen in SQL

Aggregatfunktionen in SQL Aggregatfunktionen in SQL Michael Dienert 14. April 2008 1 Definition von Aggregatfunktionen Ihren Namen haben die Aggregatfunktionen vom englischen Verb to aggregate, was auf deutsch anhäufen, vereinigen,

Mehr

Wissensentdeckung in Datenbanken

Wissensentdeckung in Datenbanken Wissensentdeckung in Datenbanken SQL, Häufige Mengen Nico Piatkowski und Uwe Ligges 11.05.2017 1 von 16 Überblick Was bisher geschah... Modellklassen Verlustfunktionen Numerische Optimierung Regularisierung

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Inhaltsverzeichnis. Lothar Piepmeyer. Grundkurs Datenbanksysteme. Von den Konzepten bis zur Anwendungsentwicklung ISBN:

Inhaltsverzeichnis. Lothar Piepmeyer. Grundkurs Datenbanksysteme. Von den Konzepten bis zur Anwendungsentwicklung ISBN: Lothar Piepmeyer Grundkurs Datenbanksysteme Von den Konzepten bis zur Anwendungsentwicklung ISBN: 978-3-446-42354-1 Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-42354-1

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Bibliografische Informationen digitalisiert durch http://d-nb.info/995021198

Bibliografische Informationen digitalisiert durch http://d-nb.info/995021198 Auf einen Blick 1 Einleitung 15 2 Datenbankentwurf 23 3 Datenbankdefinition 43 4 Datensätze einfügen (INSERT INTO) 95 5 Daten abfragen (SELECT) 99 6 Daten aus mehreren Tabellen abfragen (JOIN) 143 7 Unterabfragen

Mehr

Datenbanken Unit 2: Das ER-Modell

Datenbanken Unit 2: Das ER-Modell Datenbanken Unit 2: Das ER-Modell 28. II. 2017 Outline 1 Organisatorisches 2 SQL 3 Das Entity-Relationship Modell Grundbegriffe Termin erster Zwischentest UE-Tests (Thema: SQL) erster Zwischentests am

Mehr

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln

Apriori-Algorithmus zur Entdeckung von Assoziationsregeln Apriori-Algorithmus zur Entdeckung von PG 42 Wissensmanagment Lehrstuhl für Künstliche Intelligenz 22. Oktober 21 Gliederung Motivation Formale Problemdarstellung Apriori-Algorithmus Beispiel Varianten

Mehr

Datenbanken Unit 7: Normalisierung ctd.

Datenbanken Unit 7: Normalisierung ctd. Datenbanken Unit 7: Normalisierung ctd. 4. IV. 2017 Outline 1 Organisatorisches 2 SQL 3 Normalisierung ctd Wiederholung 1NF bis 3NF/BCNF Organisatorisches Zweiter Zwischentest in der ersten UE nach den

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen

INTELLIGENTE DATENANALYSE IN MATLAB. Unüberwachtes Lernen: Clustern von Attributen INTELLIGENTE DATENANALYSE IN MATLAB Unüberwachtes Lernen: Clustern von Attributen Literatur J. Han, M. Kamber: Data Mining Concepts and Techniques. J. Han et. al: Mining Frequent Patterns without Candidate

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

5 Data Warehouses und Data Mining

5 Data Warehouses und Data Mining 5 Data Warehouses und Data Mining Mittels OLAP Techniken können große Datenmengen unterschiedlich stark verdichtet und gezielt aufbereitet werden. Mittels Data Mining können große Datenmengen nach bisher

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

SQL. SQL SELECT Anweisung SQL-SELECT SQL-SELECT

SQL. SQL SELECT Anweisung SQL-SELECT SQL-SELECT SQL SQL SELECT Anweisung Mit der SQL SELECT-Anweisung werden Datenwerte aus einer oder mehreren Tabellen einer Datenbank ausgewählt. Das Ergebnis der Auswahl ist erneut eine Tabelle, die sich dynamisch

Mehr

Data Cubes PG Wissensmangement Seminarphase

Data Cubes PG Wissensmangement Seminarphase PG 402 - Wissensmangement Seminarphase 23.10.2001-25.10.2001 Hanna Köpcke Lehrstuhl für Künstliche Intelligenz Universität Dortmund Übersicht 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit

Mehr

Quelle: TU Dresden, Fakultät Informatik, Institut für Systemarchitektur, Professur für Datenbanken, Dr.-Ing. B. Keller

Quelle: TU Dresden, Fakultät Informatik, Institut für Systemarchitektur, Professur für Datenbanken, Dr.-Ing. B. Keller Arbeitsblatt: Aufgaben zur Wiederholung DATENBANKEN 1. Was versteht an unter Datenbanken? 2. Nennen Sie Beispiele für den Einsatz von Datenbanken! 3. Welche Modelle liegen Datenbanken beispielseise zugrunde?

Mehr

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung

Ermittlung von Assoziationsregeln aus großen Datenmengen. Zielsetzung Ermittlung von Assoziationsregeln aus großen Datenmengen Zielsetzung Entscheidungsträger verwenden heutzutage immer häufiger moderne Technologien zur Lösung betriebswirtschaftlicher Problemstellungen.

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Methoden, Chancen und Risiken beim Auswerten großer Datenmengen

Methoden, Chancen und Risiken beim Auswerten großer Datenmengen Methoden, Chancen und Risiken beim Auswerten großer Datenmengen Peter Dauscher Gymnasium am Kaiserdom, Speyer peter dauscher gak speyer de Data-Mining in der Schule - Eine Annäherung

Mehr

Data Mining. Informationssysteme, Sommersemester 2017

Data Mining. Informationssysteme, Sommersemester 2017 Data Mining Informationssysteme, Sommersemester 2017 Literatur zu Data-Mining Pang-Ning Tan, Michael Steinbach, Vipin Kuma. Introduction to Data Minig. Ein paar relevante Kapitel sind frei verfügbar unter

Mehr

Frequent Itemset Mining und FP-Tree

Frequent Itemset Mining und FP-Tree Übung 4 Frequent Itemset Mining und FP-Tree Frequent Itemset Mining Motivation: Es existiert eine Datenbank mit vielen Einträgen Man möchte wissen, welche Einträge oft zusammen vorkommen Frequent Itemset

Mehr

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube

Data Cube. 1. Einführung. 2. Aggregation in SQL, GROUP BY. 3. Probleme mit GROUP BY. 4. Der Cube-Operator. 5. Implementierung des Data Cube Data Cube 1. Einführung 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator 5. Implementierung des Data Cube 6. Zusammenfassung und Ausblick Dank an Hanna Köpcke! 1 On-line Analytical

Mehr

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Uwe Ligges Informatik LS 8 22.04.2010 1 von 26 Gliederung 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der

Mehr

12 BG EDV Access / Inf-SQL1 Theodor-Heuss-Schule Wetzlar

12 BG EDV Access / Inf-SQL1 Theodor-Heuss-Schule Wetzlar Abfragen aus einer Tabelle mit Hilfe der Datenbank-Sprache SQL SQL (Structured Query Language) ist eine Computersprache zum Speichern, Bearbeiten und Abfragen von Daten in relationalen Datenbanken. Eine

Mehr

SQL: Abfragen für einzelne Tabellen

SQL: Abfragen für einzelne Tabellen Musterlösungen zu LOTS SQL: Abfragen für einzelne Tabellen Die Aufgaben lösen Sie mit dem SQL-Training-Tool LOTS der Universität Leipzig: http://lots.uni-leipzig.de:8080/sql-training/ Wir betrachten für

Mehr

Marcus Throll, Oliver Bartosch. Einstieg in SQL. Verstehen, einsetzen, nachschlagen. Galileo Press

Marcus Throll, Oliver Bartosch. Einstieg in SQL. Verstehen, einsetzen, nachschlagen. Galileo Press Marcus Throll, Oliver Bartosch Einstieg in SQL Verstehen, einsetzen, nachschlagen Galileo Press Auf einen Blick 1 Einleitung 15 2 Datenbankentwurf 23 3 Datenbankdefinition 43 4 Datensätze einfügen (INSERT

Mehr

SQL - Datenbankdesign - Aufbau

SQL - Datenbankdesign - Aufbau SQL - Datenbankdesign - Aufbau Kompakt-Intensiv-Training Unsere fünftägige ANSI SQL Schulung vermittelt Ihnen alle nötigen Kenntnisse zur Erstellung von Datenauswertungen und Programmierung wiederkehrender

Mehr

Vorlesung Wissensentdeckung in Datenbanken

Vorlesung Wissensentdeckung in Datenbanken Gliederung Vorlesung Wissensentdeckung in Datenbanken Data Cube Katharina Morik, Claus Weihs 14.07.2009 1 Einführung 2 Aggregation in SQL, GROUP BY 3 Probleme mit GROUP BY 4 Der Cube-Operator 5 Implementierung

Mehr

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de

ISU 1. Ue_08/02_Datenbanken/SQL. 08 Datenbanken. Übung. SQL Einführung. Eckbert Jankowski. www.iit.tu-cottbus.de 08 Datenbanken Übung SQL Einführung Eckbert Jankowski www.iit.tu-cottbus.de Datenmodell (Wiederholung, Zusammenfassung) Objekte und deren Eigenschaften definieren Beziehungen zwischen den Objekten erkennen/definieren

Mehr

NOREA Sprachführer Norwegisch: Ein lustbetonter Sprachkurs zum Selbstlernen (German Edition)

NOREA Sprachführer Norwegisch: Ein lustbetonter Sprachkurs zum Selbstlernen (German Edition) NOREA Sprachführer Norwegisch: Ein lustbetonter Sprachkurs zum Selbstlernen (German Edition) Click here if your download doesn"t start automatically NOREA Sprachführer Norwegisch: Ein lustbetonter Sprachkurs

Mehr

Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 -

Informationssysteme. Prof. Dr. Hans Czap. Lehrstuhl für Wirtschaftsinformatik I. Lehrstuhl für Wirtschaftsinformatik I - II - 1 - Vorlesung Grundlagen betrieblicher Informationssysteme Prof. Dr. Hans Czap Email: Hans.Czap@uni-trier.de - II - 1 - Inhalt Kap. 1 Ziele der Datenbanktheorie Kap. 2 Datenmodellierung und Datenbankentwurf

Mehr

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen

Access [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen Abfragen lassen sich längst nicht nur dazu benutzen, die gewünschten Felder oder Datensätze einer oder mehrerer Tabellen darzustellen. Sie können Daten auch nach bestimmten Kriterien zu Gruppen zusammenfassen

Mehr

GROUP BY, HAVING und Sichten

GROUP BY, HAVING und Sichten GROUP BY, HAVING und Sichten Tutorübungen 09/33 zu Grundlagen: Datenbanken (WS 14/15) Michael Schwarz Technische Universität München 11.11 / 12.11.2014 1/12 GROUP BY HAVING Sichten Eine Tabelle studenten

Mehr

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P

Index- und Zugriffsstrukturen für. Holger Brämer, 05IND-P Index- und Zugriffsstrukturen für Data Warehousing Holger Brämer, 05IND-P Index- und Zugriffstrukturen für Data Warehousing Materialisierte Sichten Bitmap-Indexe Verbundindexe Materialisierte Sichten gehören

Mehr

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.

Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen. PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock. Vom Suchen und Finden individueller Empfehlungen aus großen Objektmengen PD Dr.-Ing. habil. Meike Klettke meike.klettke@uni-rostock.de 1 Informationsflut Amazon: Alle lieferbaren Bücher (930.000 Titeln

Mehr

Induktion von Assoziationsregeln. Stefan Mandl

Induktion von Assoziationsregeln. Stefan Mandl Induktion von Assoziationsregeln Stefan Mandl Inhalt Was sind Assoziationsregeln? Qualitätsbewertung Algorithmus Was sind Assoziationsregeln? Assoziationsregeln Assoziationsregeln beschreiben Korrelationen

Mehr

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP

Datenbanktechnologie mit praktischen Übungen in MySQL und PHP Datenbanktechnologie mit praktischen Übungen in MySQL und PHP Übung, Sommersemester 2013 13. Mai 2013 - MySQL 4 Sebastian Cuy sebastian.cuy@uni-koeln.de Aufgaben Aufgabe 1 Installieren Sie XAMPP (http://www.apachefriends.org/de/xampp.html)

Mehr

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten

Einführung in SQL. Sprachumfang: Indizes. Datensätzen. Zugriffsrechten Einführung in SQL Die Sprache SQL (Structured Query Language) ist eine Programmiersprache für relationale Datenbanksysteme, die auf dem ANSI-SQL-Standard beruht. SQL wird heute von fast jedem Datenbanksystem

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus

FernUniversität in Hagen. Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln. Thema 1.1.1 Der Apriori-Algorithmus FernUniversität in Hagen Seminar 01912 Data Mining im Sommersemester 2008 Häufige Muster und Assoziationsregeln Thema 1.1.1 Der Apriori-Algorithmus Referentin: Olga Riener Olga Riener. Thema 1.1.1. Der

Mehr

Häufige Mengen ohne Kandidatengenerierung. FP-Tree: Transaktionen. Konstruktion eines FP-Trees. FP-Tree: Items

Häufige Mengen ohne Kandidatengenerierung. FP-Tree: Transaktionen. Konstruktion eines FP-Trees. FP-Tree: Items Häufige Mengen ohne Kandidatengenerierung Jiawei Han, Micheline Kamber 2006 (2nd ed.)! Ziel 1: Kompression der Datenbank in eine Frequent-Pattern Tree Struktur (FP-Tree)! Stark komprimiert, vollständig

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen. Tobias Scheffer Michael Brückner

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen. Tobias Scheffer Michael Brückner Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Tobias Scheffer Michael Brückner Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Übung: Mo 10:00-11:30

Mehr

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung

Mehr

Industrie Chance oder Risiko? Martin Botteck Prof. Dr.-Ing. Kommunikationsdienste und -anwendungen

Industrie Chance oder Risiko? Martin Botteck Prof. Dr.-Ing. Kommunikationsdienste und -anwendungen Industrie 4.0 - Chance oder Risiko? Martin Botteck Prof. Dr.-Ing. Kommunikationsdienste und -anwendungen Industrielle Revolution, Version 4.0 Der Kongress im Jahr 2015: Worum geht es überhaupt? Kongress

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Microsoft SQL Server 2000 Programmierung

Microsoft SQL Server 2000 Programmierung Rebecca M. Riordan Microsoft SQL Server 2000 Programmierung Schritt für Schritt Microsoft Press Einführung Ihr Ausgangspunkt Neue Features in SQL Server 2000 Verwenden der beiliegenden CD-ROM Systemanforderungen

Mehr

119+1/182 Maschinelles Lernen und Data Mining WS 2002,3 Prof. Dr. Katharina Morik. Data Cube +, *!!**)* -. Dank an Hanna Köpcke!

119+1/182 Maschinelles Lernen und Data Mining WS 2002,3 Prof. Dr. Katharina Morik. Data Cube +, *!!**)* -. Dank an Hanna Köpcke! 119+1/182 Maschinelles Lernen und Data Mining WS 2002,3 Prof. Dr. Katharina Morik Data Cube!! "#$% & '(!&!)*#$ +, *!!**)* -. Dank an Hanna Köpcke! 119+2/182 Maschinelles Lernen und Data Mining WS 2002,3

Mehr

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität

Datenbanken Unit 4: Das Relationale Modell & Datenintegrität Datenbanken Unit 4: Das Relationale Modell & Datenintegrität 15. III. 2016 Outline 1 Organisatorisches 2 SQL 3 Relationale Algebra Notation 4 Datenintegrität Organisatorisches Erster Zwischentest: nach

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische

Mehr

Projekt Maschinelles Lernen WS 06/07

Projekt Maschinelles Lernen WS 06/07 Projekt Maschinelles Lernen WS 06/07 1. Auswahl der Daten 2. Evaluierung 3. Noise und Pruning 4. Regel-Lernen 5. ROC-Kurven 6. Pre-Processing 7. Entdecken von Assoziationsregeln 8. Ensemble-Lernen 9. Wettbewerb

Mehr

Informationssysteme im Electronic Commerce. Social Recommendation Systems

Informationssysteme im Electronic Commerce. Social Recommendation Systems Informationssysteme im Electronic Commerce Social Recommendation Systems Seminar für Bachelor-/Master-/Diplomstudiengang Sommersemester 2012 Prof. Dr. Oliver Hinz Professur für Wirtschaftsinformatik insb.

Mehr

Übersicht der wichtigsten MySQL-Befehle

Übersicht der wichtigsten MySQL-Befehle Übersicht der wichtigsten MySQL-Befehle 1. Arbeiten mit Datenbanken 1.1 Datenbank anlegen Eine Datenbank kann man wie folgt erstellen. CREATE DATABASE db_namen; 1.2 Existierende Datenbanken anzeigen Mit

Mehr

Frequent Itemset Mining + Association Rule Mining

Frequent Itemset Mining + Association Rule Mining Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,

Mehr

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen:

Data Warehouse. Kapitel 17. Abbildung 17.1: Zusammenspiel zwischen OLTP und OLAP. Man unterscheidet zwei Arten von Datenbankanwendungen: Kapitel 17 Data Warehouse OLTP Online Transaction Processing OLAP Online Analytical Processing Decision Support-Anfragen Data Mining opera- tionale DB opera- tionale DB opera- tionale DB Data Warehouse

Mehr

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort... 13 Auf einen Blick Vorwort... 13 Teil 1 Vorbereitung Kapitel 1 Einleitung... 17 Kapitel 2 SQL der Standard relationaler Datenbanken... 21 Kapitel 3 Die Beispieldatenbanken... 39 Teil 2 Abfrage und Bearbeitung

Mehr

Information Retrieval Einführung

Information Retrieval Einführung Information Retrieval Einführung Kursfolien Karin Haenelt 22.7.2015 Themen Traditionelles Konzept / Erweitertes Konzept Auffinden von Dokumenten Rankingfunktionen Auffinden und Aufbereiten von Information

Mehr

MCSA: SQL 2016 Database Development

MCSA: SQL 2016 Database Development MCSA: SQL 2016 Database Development Querying Data with Transact-SQL & Developing SQL Databases Seminarziel In diesem 6-tägigen Kurs werden die Teilnehmer von Grund auf in die Entwicklung

Mehr

Datenbanken Unit 5: Funktionale Abhängigkeit

Datenbanken Unit 5: Funktionale Abhängigkeit Datenbanken Unit 5: Funktionale Abhängigkeit 19 IV 2016 Outline 1 Organisatorisches 2 SQL 3 Funktionale Abhängigkeit 4 Anomalien 5 Datenbank Normalisierung Zerlegung von Relationen Organisatorisches Heute

Mehr

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13

Auf einen Blick. Abfrage und Bearbeitung. Erstellen einer Datenbank. Komplexe Abfragen. Vorwort 13 Auf einen Blick Vorwort 13 Teil 1 Vorbereitung Kapitel 1 Einleitung 17 Kapitel 2 SQL - der Standard relationaler Datenbanken 21 Kapitel 3 Die Beispieldatenbanken 39 Teil 2 Abfrage und Bearbeitung Kapitel

Mehr

insert, update, delete Definition des Datenbankschemas select, from, where Rechteverwaltung, Transaktionskontrolle

insert, update, delete Definition des Datenbankschemas select, from, where Rechteverwaltung, Transaktionskontrolle Einführung in SQL insert, update, delete Definition des Datenbankschemas select, from, where Rechteverwaltung, Transaktionskontrolle Quelle Wikipedia, 3.9.2015 SQL zur Kommunikation mit dem DBMS SQL ist

Mehr

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar

SQL für Trolle. mag.e. Dienstag, 10.2.2009. Qt-Seminar Qt-Seminar Dienstag, 10.2.2009 SQL ist......die Abkürzung für Structured Query Language (früher sequel für Structured English Query Language )...ein ISO und ANSI Standard (aktuell SQL:2008)...eine Befehls-

Mehr

Der Grundstein. Idealkunden definieren, finden und verstehen

Der Grundstein. Idealkunden definieren, finden und verstehen 2 Der Grundstein Idealkunden definieren, finden und verstehen Was Sie aus diesem Kapitel mitnehmen Wer Ihre idealen Kunden sind Was Ihre idealen Kunden beschäftigt Wie Sie Ihre Zielgruppe(n) mit gezielter

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Datenbanken Grundlagen und Design

Datenbanken Grundlagen und Design Frank Geisler Datenbanken Grundlagen und Design 3., aktualisierte und erweiterte Auflage mitp Vorwort 15 Teil I Grundlagen 19 i Einführung in das Thema Datenbanken 21 i.i Warum ist Datenbankdesign wichtig?

Mehr

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der

Mehr

Opinion Mining Herausforderungen und Anwendung in der Politik

Opinion Mining Herausforderungen und Anwendung in der Politik Opinion Mining Herausforderungen und Anwendung in der Politik 28.09.2011 Umut Yilmaz Inhaltsübersicht 1. Einführung 2. Grundlagen 3. Anwendung in der Politik 4. Anwendungsbeispiel 5. Fazit 2 1. Einführung

Mehr

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter

bersicht Datenbanken und Datawarehouses Datenbank Datenbanksysteme Niels Schršter bersicht Niels Schršter EinfŸhrung GROUP BY Roll UpÔs Kreuztabellen Cubes Datenbank Ansammlung von Tabellen, die einen ãausschnitt der WeltÒ fÿr eine Benutzergruppe beschreiben. Sie beschreiben die funktionalen

Mehr

5. Assoziationsregeln

5. Assoziationsregeln 5. Generieren von Assoziationsregeln Grundbegriffe 5. Assoziationsregeln Assoziationsregeln beschreiben gewisse Zusammenhänge und Regelmäßigkeiten zwischen verschiedenen Dingen, z.b. den Artikeln eines

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Information Mining - Einführung

Information Mining - Einführung Information Mining - Einführung Norbert Fuhr Abteilung Informatik und Angewandte Kognitionswissenschaften Fachgebiet Informationssysteme norbert.fuhr@uni-due.de 1 Aufgabenstellungen im Data Mining Klassifikation

Mehr

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Aufgabe 1. Data Mining a) Mit welchen Aufgabenstellungen befasst sich Data Mining? b) Was versteht man unter Transparenz einer Wissensrepräsentation?

Mehr

Mathematische Grundlagen III

Mathematische Grundlagen III Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten

Mehr

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Business Intelligence Master Digitale Logistik und Management Projektbericht Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Matthias Säger

Mehr

Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln

Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Unüberwachtes Lernen: Clusteranalyse und Assoziationsregeln Praktikum: Data Warehousing und Data Mining Clusteranalyse Clusteranalyse Idee Bestimmung von Gruppen ähnlicher Tupel in multidimensionalen Datensätzen.

Mehr

Jugendliche und Internet

Jugendliche und Internet Jugendliche und Internet Ratgeber für Eltern Ein Heft in Leichter Sprache Was steht in diesem Heft? Im Internet surfen 3 Soziale Netzwerke 4 Alters-Grenzen bei sozialen Netz-Werken 5 Privates im Internet

Mehr

Datenbank Grundlagen. Performanceuntersuchungen

Datenbank Grundlagen. Performanceuntersuchungen Vorlesung Datenbanken, Entwurfsarbeit 1 Fachbereich Automatisierung und Informatik Wernigerode Datenbank Grundlagen Performanceuntersuchungen Entwicklung einer Datenbank zur Verwaltung eines Bestellwesens

Mehr

Entscheidungsbäume aus großen Datenbanken: SLIQ

Entscheidungsbäume aus großen Datenbanken: SLIQ Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:

Mehr

Abfragen: Grundbausteine

Abfragen: Grundbausteine Abfragen: Grundbausteine Abfragen sollen gezielt Teile der Information wiedergeben. Das Ergebnis einer solchen Operation ist eine. Der Aufbau der Ergebnistabelle wird durch zwei Grundverfahren festgelegt:

Mehr

SQL,Teil 2: SELECT. W. Spiegel. Übersicht SELECT. Mehrfache Werte vermeiden: SELECT DISTINCT. Ausgabe ordnen: ORDER BY. Projektion.

SQL,Teil 2: SELECT. W. Spiegel. Übersicht SELECT. Mehrfache Werte vermeiden: SELECT DISTINCT. Ausgabe ordnen: ORDER BY. Projektion. SQL,Teil 2: SELECT W. Spiegel Übersicht SELECT Mehrfache Werte vermeiden: SELECT DISTINCT Ausgabe ordnen: ORDER BY Projektion Selektion: WHERE Join mit SELECT Beispiel Aufgaben 1 SELECT Die SELECT-Anweisung

Mehr