Methoden, Chancen und Risiken beim Auswerten großer Datenmengen

Größe: px
Ab Seite anzeigen:

Download "Methoden, Chancen und Risiken beim Auswerten großer Datenmengen"

Transkript

1 Methoden, Chancen und Risiken beim Auswerten großer Datenmengen Peter Dauscher Gymnasium am Kaiserdom, Speyer peter <dot> dauscher <AT> gak <minus> speyer <punkt>de Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 1 /

2 Einordnung in den Unterricht Datenbanken zur Informationsgewinnung nutzen??? Datenerhebungen unter dem Aspekt Datenschutz bewerten Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 2 /

3 Einordnung in den Unterricht Datenbanken zur Informationsgewinnung nutzen Data Mining und Entscheidungsbäume Datenerhebungen unter dem Aspekt Datenschutz bewerten Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 3 /

4 Einordnung in den Unterricht Datenbanken zur Informationsgewinnung nutzen Informatische Logische Modellierung Grundlagen Informatische Logische Modellierung Grundlagen Data Mining und Entscheidungsbäume Datenstrukturen Problemlösen mit StandardAlgorithmen Datenerhebungen unter dem Aspekt Datenschutz bewerten Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 4 /

5 Einordnung in den Unterricht Zielgruppe: Datenbanken zur Informationsgewinnung nutzen Motivierte und leistungsstarke Informatische Logische Informatische Logische Grundkurse Informatik Modellierung Grundlagen Modellierung Grundlagen (wie imdata gezeigten Mining undbeispiel) Entscheidungsbäume Datenstrukturen Leistungskurse Problemlösen mit StandardInformatikAlgorithmen Datenerhebungen unter dem Aspekt Datenschutz bewerten Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 5 /

6 Data Mining Erkennen von Regelhaftigkeiten in (großen) Datenbeständen (z.b. Klassifikation von Daten) Anwendungen Wissenschaftliche Datenanalyse Kundensegmentierung Werbung (Kampagnen-Management) Web-Empfehlungsdienste Voraussage der Kreditwürdigkeit Versuch der Detektion von Versicherungsbetrug Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 6 /

7 Klassifikation X Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 7 /

8 Klassifikation Name: Fritz Alter: 17 Schuhgröße: 42,5 verheiratet: X Name: Anton Alter: 38 Schuhgröße: 43,5 verheiratet: Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 8 /

9 Klassifikation Name: Fritz Alter: 17 Schuhgröße: 42,5 verheiratet: K1 K2 K3 Name: Anton Alter: 38 Schuhgröße: 43,5 verheiratet: Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 9 /

10 Lernen an Beispielen X Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 10 /

11 Lernen an Beispielen K1 K2 K3 Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 11 /

12 Darstellung von Klassifikationen Symbolisch Entscheidungslisten Entscheidungsbäume Subsymbolisch Neuronale Netze Support-Vektor-Maschinen Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 12 /

13 Darstellung von Klassifikationen Symbolisch Entscheidungslisten Entscheidungsbäume Subsymbolisch Neuronale Netze Support-Vektor-Maschinen Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 13 /

14 Entscheidungsbäume Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 14 /

15 Manuelle Konstruktion Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 15 /

16 Maschinelles Entscheidungsbaumlernen X Beispiel-Datensätze (bereits klassifiziert) Maschinell gelernter Baum Klassifikation durch den Baum K K K Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 16 /

17 Genereller Algorithmus Tabelle mit klassifizierten Beispielen X1,Xn: Merkmale; K: Klasse Nr X1 X2 X K Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 17 /

18 Genereller Algorithmus Tabelle mit klassifizierten Beispielen X1,Xn: Merkmale; K: Klasse Nr X1 X2 X3 K Wähle AUSSAGEKRÄFTIGSTES MERKMAL (das Merkmal, dessen Ausprägung am meisten über die Klasse verrät) Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 18 /

19 Genereller Algorithmus Tabelle mit klassifizierten Beispielen X1,Xn: Merkmale; K: Klasse Nr X1 X2 X3 K X2 2. Verwende dieses Merkmal als Wurzel des Entscheidungsbaumes. Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 19 /

20 Genereller Algorithmus Tabelle mit klassifizierten Beispielen X1,Xn: Merkmale; K: Klasse Nr X1 X2 X3 K X2 3. Erzeuge für jede Ausprägung (hier: und ) eine Kante. Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 20 /

21 Genereller Algorithmus X2= Nr X1 X2 X3 K X2 X2= Nr X1 X2 X3 K Teile die Liste in so viele Teillisten, wie das AUSSAGEKRÄFTIGSTE MERKMAL Ausprägungen hat (hier zwei: / ). Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 21 /

22 Genereller Algorithmus X2= Nr X1 X2 X3 K X2 X2= Nr X1 X2 X3 K X2= X2= 4. Erzeuge aus jeder Teilliste einen Unterbaum (rekursiv nach dem oben beschriebenen Verfahren) Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 22 /

23 Genereller Algorithmus X2= Nr X1 X2 X3 K X2= Nr X1 X2 X3 K X2 0 X Erzeuge aus jeder Teilliste einen Unterbaum (rekursiv nach dem oben beschriebenen Verfahren) Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 23 /

24 Genereller Algorithmus Rekursionsabbrüche Eine Teilliste ist leer Blatt = Standard-Klasse Alle Elemente einer (Teil-)Liste gehören zur gleichen Klasse: Blatt = ebendiese Klasse Kein weiteres Merkmal zum Unterscheiden vorhanden: Blatt = häufigste Klasse in der (Teil-)Liste (Fehlklassifikation bestimmter klassifizierter Beispiele!!) Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 24 /

25 Einordnung in den Unterricht Datenbanken zur Informationsgewinnung nutzen Informatische Modellierung Logische Grundlagen Data Mining und Entscheidungsbäume Datenstrukturen Problemlösen mit StandardAlgorithmen Datenerhebungen unter dem Aspekt Datenschutz bewerten Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 25 /

26 Eine Unterrichtsreihe Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 26 /

27 Eine Unterrichtsreihe 1. Stunde Szenario: Eine Umfrage zur Ermittlung von potentiellen Kunden Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 27 /

28 Eine Unterrichtsreihe 1. Stunde Vorgabe: Verbale Entscheidungs-Regeln Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 28 /

29 Eine Unterrichtsreihe 1. Stunde Erfahrung: Verbale Regeln sind umständlich Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 29 /

30 Eine Unterrichtsreihe 1. Stunde Alternative: Graphische Darstellung Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 30 /

31 Lehrervortrag Eine Unterrichtsreihe 1. Stunde Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 31 /

32 Eine Unterrichtsreihe 2. Stunde Gruppe A Umsetzung von Entscheidungsbäumen in SQL (Bäume wachsender Komplexität) und Test an Beispieldatenbank (OpenOffice) Voraussetzung: SQL mit AND und OR Ableitung einer allgemeinen Übersetzungsregel (Disjunktion über Konjunktionen von Pfaden natürlich nicht so ausgedrückt) Anwendung der eigenen Regel an einem komplexen Beispiel. Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 32 /

33 Eine Unterrichtsreihe 2. Stunde Gruppe B Finden eines Maßes für die Güte einer Klassifikation (Fehlermaß) Umsetzung des Fehlermaßes in SQL und Test an Beispieldatenbank (OpenOffice) Voraussetzung: SQL mit COUNT oder AVG Kritischer Umgang mit Fehlermaßen und Betriebswirtschaftliche Bewertung Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 33 /

34 Eine Unterrichtsreihe 2. Stunde Gruppe C Nachvollziehen eines automatisierten Entscheidungsbaumlernens (ohne Rechner, mit Karteikarten) Dabei Auffinden des jeweilig AUSSAGEKRÄFTIGSTEN MERKMALS durch intuitive Statistik Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 34 /

35 Chancen und Risiken Denn wenn man verstehen möchte, welche Schäden Krebszellen von gesunden Zellen unterscheiden, dann muss man zuerst den normalen epigenetischen Zustand einer gesunden Zelle kennen.dafür haben wir eine Webbasierte Data Mining Software entwickelt, die es uns erlaubte, die DNA-Methylierungsmuster in weißen Blutkörperchen mit vielfältigen Informationen über das menschliche Erbgut zu vergleichen. Diese Software ist basiert auf Methoden des statistischen Lernens (z.b. Support-Vektor-Maschinen). Quelle: Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 35 /

36 Chancen und Risiken Auswahl von Angeboten an Kunden von (z.b.) Online-Buchhändlern, abhängig davon, was in der Vergangenheit vom Kunden bestellt wurde. Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 36 /

37 Chancen und Risiken BANK Max Mustermann Elendsherbergswühl Speyer Antrag auf ein Darlehen in Höhe von EUR Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 37 /

38 Chancen und Risiken BANK Data.Mining.Fox kann einer Bank also beispielsweise helfen, Kreditwürdigkeiten von Kunden besser vorherzusagen und somit einerseits die Anzahl von Kreditausfällen zu reduzieren, andererseits bessere Konditionen für Kunden mit geringem Kreditausfallrisiko anzubieten. Der resultierende Vorteil ergibt sich für die Bank, aber auch für deren Kunden. Quelle: Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 38 /

39 Chancen und Risiken Data.Mining.Fox kann einer Bank also beispielsweise helfen, Kreditwürdigkeiten von Kunden besser Leider bedauern wir, Ihren Antrag auf Kredit ablehnen zu müssen. vorherzusagen und somit einerseits die BANK Anzahl von für Kreditausfällen zu Wir wünschen Ihnen viel Erfolg die Zukunft und verbleiben reduzieren, andererseits bessere Konditionen für Kunden mit geringem mit freundlichen Grüßen Kreditausfallrisiko anzubieten. Der resultierende Vorteil ergibt sich für Ihre Bank die Bank, aber auch für deren Kunden. Quelle: Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 39 /

40 Chancen und Risiken vom Der Suchmaschinenbetreiber Google hat auf solchen Formeln erst ein Geschäftsmodell errichtet und versucht nun, sie für Vorhersagen zu nutzen. Bei Google berechnet man bereits, welcher Mitarbeiter demnächst kündigen will. "So können wir in die Köpfe der Leute gucken, ehe sie selbst wissen, dass sie vielleicht gehen wollen", zitiert das Wall Street Journal den Google Personalmanager Laszlo Bock. Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 40 /

41 FAZIT Datenbanken zur Informationsgewinnung nutzen Informatische Logische Modellierung Grundlagen Informatische Logische Modellierung Grundlagen Data Mining und Entscheidungsbäume Datenstrukturen Problemlösen mit StandardAlgorithmen Datenerhebungen unter dem Aspekt Datenschutz bewerten Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 41 /

42 Anknüpfungspunkte Informatisch-Technisch Implementation von Entscheidungsbaumlernern Facharbeiten und/oder Jugend-forscht-Arbeiten im Bereich Data Mining/Machine Learning Gesellschaftlich Weitere Beispiele für Data Mining-Anwendungen Diskussion von Chancen und Gefahren Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 42 /

43 S. Russell, P. Norvig Künstliche Intelligenz ein moderner Ansatz Pearson Studium, 2004 Frank Schirrmacher Payback Karl-Blesising-Verlag, 2009 Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 43 /

44 ! t i e k m Methoden, Chancen und Risiken a s k r e beim Auswerten m f u A großer Datenmengen ie d r ü f k Peter Dauscher an D Gymnasium am Kaiserdom, Speyer n e l e Vi peter <dot> dauscher <AT> gak <minus> speyer <punkt>de Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 44 /

45 ! t i e k m Methoden, Chancen und Risiken a s k r e beim Auswerten m f u A großer Datenmengen ie d r ü f k Peter Dauscher an D Gymnasium am Kaiserdom, Speyer n e l e Vi peter <dot> dauscher <AT> gak <minus> speyer <punkt>de Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 45 /

46 noch was ganz anderes Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 46 /

47 noch was ganz anderes Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 47 /

48 noch was ganz anderes werkzeuge-und-software/digitaltechnik-rechnerarchitektur.html oder mit Google-Suchbegriffen: dauscher simulator johnny peter <dot> dauscher <AT> gak <minus> speyer <punkt>de Data-Mining in der Schule - Eine Annäherung an Algorithmen zum Entscheidungsbaumlernen 48 /

2. Lernen von Entscheidungsbäumen

2. Lernen von Entscheidungsbäumen 2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014

Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Übungsblatt LV Künstliche Intelligenz, Data Mining (1), 2014 Aufgabe 1. Data Mining a) Mit welchen Aufgabenstellungen befasst sich Data Mining? b) Was versteht man unter Transparenz einer Wissensrepräsentation?

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

Data Mining und Text Mining Einführung. S2 Einfache Regellerner

Data Mining und Text Mining Einführung. S2 Einfache Regellerner Data Mining und Text Mining Einführung S2 Einfache Regellerner Hans Hermann Weber Univ. Erlangen, Informatik 8 Wintersemester 2003 hans.hermann.weber@gmx.de Inhalt Einiges über Regeln und Bäume R1 ein

Mehr

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum 4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien, 7. 5. 2011

MythMiner. Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner. Balázs Bárány. Linuxwochen Wien, 7. 5. 2011 Voraussetzungen für Data Mining und Text Mining Schluÿ Ein Empfehlungssystem für Fernsehprogramme auf Basis von RapidMiner Linuxwochen Wien, 7. 5. 2011 Voraussetzungen für Data Mining und Text Mining Schluÿ

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Mining High-Speed Data Streams

Mining High-Speed Data Streams Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

LISE MEITNER GYMNASIUM NEUENHAUS UELSEN

LISE MEITNER GYMNASIUM NEUENHAUS UELSEN Entwurf eines schulinternen Curriculums im Fach Informatik für die Qualifikationsphase (Jahrgang 11 und 12) Für die Gestaltung des Informatikunterrichts in der Qualifikationsphase sind für das schulinterne

Mehr

Maschinelles Lernen Entscheidungsbäume

Maschinelles Lernen Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Paul Prasse Entscheidungsbäume Eine von vielen Anwendungen: Kreditrisiken Kredit - Sicherheiten

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Was bisher geschah. Aufgaben: Diagnose, Entscheidungsunterstützung Aufbau Komponenten und Funktion

Was bisher geschah. Aufgaben: Diagnose, Entscheidungsunterstützung Aufbau Komponenten und Funktion Was bisher geschah Daten, Information, Wissen explizites und implizites Wissen Wissensrepräsentation und -verarbeitung: Wissensbasis Kontextwissen Problemdarstellung fallspezifisches Wissen repräsentiert

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

riskkv Scorenalyse riskkv Scoring Seite 1 von 9

riskkv Scorenalyse riskkv Scoring Seite 1 von 9 riskkv Scorenalyse riskkv Scoring Seite 1 von 9 Das Modul dient der flexiblen Erstellung, Auswertung und Verwendung von Scores. Durch vordefinierte Templates können in einer Einklicklösung bspw. versichertenbezogene

Mehr

Big Data Wer gewinnt, wer verliert? Köln Revolvermänner AG

Big Data Wer gewinnt, wer verliert? Köln Revolvermänner AG Big Data Wer gewinnt, wer verliert? Düsseldorf 16.06.2015 Köln 10.09.2015 Bernd Fuhlert - Vorstand Revolvermänner AG Fast 10 Jahre Expertise in den Bereichen Online- Krisenkommunikation, IT-Sicherheit,

Mehr

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten

Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten Prognosen via Datenanalyse Predictive Analytics: Darauf müssen Unternehmen achten von Jürgen Mauerer Foto: Avantum Consult AG Seite 1 von 21 Inhalt Mehrwert aufzeigen nach Analyse des Geschäftsmodells...

Mehr

Master Logistik. Modultitel / Bezeichnung der Lehrveranstaltung Vertiefungsmodul Verfahren und IT-Systeme 1-3. Anzahl der SWS.

Master Logistik. Modultitel / Bezeichnung der Lehrveranstaltung Vertiefungsmodul Verfahren und IT-Systeme 1-3. Anzahl der SWS. Modulnummer 8 a 8 c Modultitel / Bezeichnung der Lehrveranstaltung Vertiefungsmodul Verfahren und IT-Systeme 1-3 Kurzbezeichnung Semeste Anzahl der SWS Häufigkeit des - r 12 Angebots 1 oder 2 jedes Semester/jedes

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Anwendung der Predictive Analytics

Anwendung der Predictive Analytics TDWI Konferenz mit BARC@TDWI Track 2014 München, 23. 25. Juni 2014 Anwendung der Predictive Analytics Prof. Dr. Carsten Felden Dipl. Wirt. Inf. Claudia Koschtial Technische Universität Bergakademie Freiberg

Mehr

Data Mining-Modelle und -Algorithmen

Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining-Modelle und -Algorithmen Data Mining ist ein Prozess, bei dem mehrere Komponenten i n- teragieren. Sie greifen auf Datenquellen, um diese zum Training,

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Binäre Bäume Darstellung und Traversierung

Binäre Bäume Darstellung und Traversierung Binäre Bäume Darstellung und Traversierung Name Frank Bollwig Matrikel-Nr. 2770085 E-Mail fb641378@inf.tu-dresden.de Datum 15. November 2001 0. Vorbemerkungen... 3 1. Terminologie binärer Bäume... 4 2.

Mehr

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn

Maschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn 16. Januar 2014 Übersicht Stand der Kunst im Bilderverstehen: Klassifizieren und Suchen Was ist ein Bild in Rohform? Biologische

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen 5.1 Lernen mit Entscheidungsbäumen Falls zum Beispiel A = {gelb, rot, blau} R 2 und B = {0, 1}, so definiert der folgende Entscheidungsbaum eine Hypothese H : A B (wobei der Attributvektor aus A mit x

Mehr

Idee: Wenn wir beim Kopfknoten zwei Referenzen verfolgen können, sind die Teillisten kürzer. kopf Eine Datenstruktur mit Schlüsselwerten 1 bis 10

Idee: Wenn wir beim Kopfknoten zwei Referenzen verfolgen können, sind die Teillisten kürzer. kopf Eine Datenstruktur mit Schlüsselwerten 1 bis 10 Binäre Bäume Bäume gehören zu den wichtigsten Datenstrukturen in der Informatik. Sie repräsentieren z.b. die Struktur eines arithmetischen Terms oder die Struktur eines Buchs. Bäume beschreiben Organisationshierarchien

Mehr

Digital traces: Möglichkeiten der bedeutungsvollen Analyse von komplexen Online-Daten

Digital traces: Möglichkeiten der bedeutungsvollen Analyse von komplexen Online-Daten Digital traces: Möglichkeiten der bedeutungsvollen Analyse von komplexen Online-Daten Andreas Breiter & Andreas Hepp Gliederung 1. Digital traces trotz big data: Zur Komplexität der heutigen Medienumgebung

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY

Data Cube. Aggregation in SQL. Beispiel: Autoverkäufe. On-line Analytical Processing (OLAP) 1. Einführung. 2. Aggregation in SQL, GROUP BY Data Cube On-line Analytical Processing (OLAP). Einführung Ziel: Auffinden interessanter Muster in großen Datenmengen 2. Aggregation in SQL, GROUP BY 3. Probleme mit GROUP BY 4. Der Cube-Operator! Formulierung

Mehr

Positionspapier Big Data

Positionspapier Big Data TeleTrusT-interner Workshop Berlin, 05.06.2014 Positionspapier Big Data Oliver Dehning, antispameurope GmbH Leiter der AG Cloud Security Definition Big Data Big Data bezeichnet große Datenmengen (Volume)

Mehr

Maschinelles Lernen. Kapitel 5

Maschinelles Lernen. Kapitel 5 Kapitel 5 Maschinelles Lernen Im täglichen Leben begegnet uns das Lernen meist in einer Mischung aus den Aspekten der Vergrößerung von Wissen und der Verbesserung von Fähigkeiten. Beim Erlernen einer Fremdsprache

Mehr

www.easydatamining.com Analyse-Beispiel Banken

www.easydatamining.com Analyse-Beispiel Banken Data.Mining.Fox (DMF) von Easy.Data.Mining Eine beispielhafte Analyse für den Bereich Banken [0] Der Sinn & Zweck dieser Folien für Sie Einblick in die Welt des Data-Mining bei Easy.Data.Mining: Wie sieht

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse

Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Data Warehouse Definition (1) http://de.wikipedia.org/wiki/data-warehouse Ein Data-Warehouse bzw. Datenlager ist eine zentrale Datensammlung (meist eine Datenbank), deren Inhalt sich aus Daten unterschiedlicher

Mehr

Was bisher geschah Wissensrepräsentation und -verarbeitung in Zustandsübergangssystemen Constraint-Systemen Logiken Repräsentation von Mengen

Was bisher geschah Wissensrepräsentation und -verarbeitung in Zustandsübergangssystemen Constraint-Systemen Logiken Repräsentation von Mengen Was bisher geschah Wissensrepräsentation und -verarbeitung in Zustandsübergangssystemen Constraint-Systemen Logiken Repräsentation von Mengen aussagenlogischer Regeln: Wissensbasis (Kontextwissen): Formelmenge,

Mehr

Automatische Gesprächsauswertung im Callcenter

Automatische Gesprächsauswertung im Callcenter Einleitung Forschungsbeitrag Automatische Gesprächsauswertung im Callcenter Projekt CoachOST Dipl.-Wirtsch.-Inf. Mathias Walther Prof. Dr. Taïeb Mellouli Lehrstuhl für Wirtschaftsinformatik und Operations

Mehr

Algorithmen & Datenstrukturen 1. Klausur

Algorithmen & Datenstrukturen 1. Klausur Algorithmen & Datenstrukturen 1. Klausur 7. Juli 2010 Name Matrikelnummer Aufgabe mögliche Punkte erreichte Punkte 1 35 2 30 3 30 4 15 5 40 6 30 Gesamt 180 1 Seite 2 von 14 Aufgabe 1) Programm Analyse

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung Prof. Dr. Gerhard Arminger Dipl.-Ök. Alexandra Schwarz Bergische Universität Wuppertal Fachbereich Wirtschaftswissenschaft Fach Statistik Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

Kreditscoring zur Klassifikation von Kreditnehmern. Variablenübersicht des Datensatzes "Kreditscoring zur Klassifikation von Kreditnehmern"

Kreditscoring zur Klassifikation von Kreditnehmern. Variablenübersicht des Datensatzes Kreditscoring zur Klassifikation von Kreditnehmern Ergänzung zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Kreditscoring zur Klassifikation von Kreditnehmern Beschreibung des Datensatzes Die Vergabe von Privatkrediten wird von der Bonität der

Mehr

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? best-reactions GmbH Hirschberger Straße 33 D 90559 Burgthann Alle Rechte vorbehalten HRB 23679, Amtsgericht Nürnberg Geschäftsführer Alexander P.

Mehr

Fakultät Wirtschaftswissenschaft

Fakultät Wirtschaftswissenschaft Fakultät Wirtschaftswissenschaft Matrikelnr. Name Vorname KLAUSUR: Entwurf und Implementierung von Informationssystemen (32561) TERMIN: 11.09.2013, 14.00 16.00 Uhr PRÜFER: Univ.-Prof. Dr. Stefan Strecker

Mehr

Der Informatikunterricht vermittelt ein breites Grundverständnis über Funktionsweise, Möglichkeiten, Auswirkungen und Grenzen des Computers.

Der Informatikunterricht vermittelt ein breites Grundverständnis über Funktionsweise, Möglichkeiten, Auswirkungen und Grenzen des Computers. INFORMATIK Allgemeine Bildungsziele Der Informatikunterricht vermittelt ein breites Grundverständnis über Funktionsweise, Möglichkeiten, Auswirkungen und Grenzen des Computers. Er vermittelt das Verständnis

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 15, Donnerstag, 12.

Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 15, Donnerstag, 12. Algorithmen und Datenstrukturen (ESE) Entwurf, Analyse und Umsetzung von Algorithmen (IEMS) WS 2014 / 2015 Vorlesung 15, Donnerstag, 12. Februar 2015 (Evaluation, Klausur, Vorstellung Arbeitsgruppe) Junior-Prof.

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe

Risiken bei der Analyse sehr großer Datenmengen. Dr. Thomas Hoppe Risiken bei der Analyse sehr großer Datenmengen Dr. Thomas Hoppe Datenaufbereitung Datenanalyse Data Mining Data Science Big Data Risiken der Analyse Sammlung Integration Transformation Fehlerbereinigung

Mehr

Treffsichere Absatzprognosen durch Predictive Analytics

Treffsichere Absatzprognosen durch Predictive Analytics Treffsichere Absatzprognosen durch Predictive Analytics Prof. Dr. Michael Feindt, Karlsruhe Institute of Technology KIT Chief Scientific Advisor, Phi-T GmbH und Blue Yonder GmbH & Co KG 3. Europäischer

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

KREDIT BEWILLIGT ODER NICHT?

KREDIT BEWILLIGT ODER NICHT? KREDIT BEWILLIGT ODER NICHT? Mathematik A-lympiade Aufgabe Finalrunde März 2002 oder Kredit bewilligt oder nicht? In vielen Geschäften kann man auf Kredit kaufen. Käufer und Geschäftsinhaber profitieren

Mehr

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori

Häufige Item-Mengen: die Schlüssel-Idee. Vorlesungsplan. Apriori Algorithmus. Methoden zur Verbessung der Effizienz von Apriori Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Schulinternes Curriculum im Fach Informatik

Schulinternes Curriculum im Fach Informatik Schulinternes Curriculum im Fach Informatik Unterricht in EF : 1. Geschichte der elektronischen Datenverarbeitung (3 Stunden) 2. Einführung in die Nutzung von Informatiksystemen und in grundlegende Begriffe

Mehr

Einführung in die Wissensverarbeitung und Data Mining

Einführung in die Wissensverarbeitung und Data Mining Einführung in die Wissensverarbeitung und Data Mining Peter Becker FH Bonn-Rhein-Sieg Fachbereich Angewandte Informatik!" $# Vorlesung Wintersemester 2001/02 1. Einführung Vorbemerkungen 1 Einführung Vorbemerkungen

Mehr

MICHAEL RÜGER. Abschluss Diplom Fach Informatik. Geburtsjahr 1985 Profil-Stand April 2015

MICHAEL RÜGER. Abschluss Diplom Fach Informatik. Geburtsjahr 1985 Profil-Stand April 2015 MICHAEL RÜGER Abschluss Diplom Fach Informatik Geburtsjahr 1985 Profil-Stand April 2015 Triona Information und Technologie GmbH Wilhelm-Theodor-Römheld-Str. 14 55130 Mainz Fon +49 (0) 61 31 9 21-122 Fax

Mehr

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc.

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc. Advanced Analytics Michael Ridder Was ist Advanced Analytics? 2 Was heißt Advanced Analytics? Advanced Analytics ist die autonome oder halbautonome Prüfung von Daten oder Inhalten mit ausgefeilten Techniken

Mehr

Lernziele: Ausgleichstechniken für binäre Bäume verstehen und einsetzen können.

Lernziele: Ausgleichstechniken für binäre Bäume verstehen und einsetzen können. 6. Bäume Lernziele 6. Bäume Lernziele: Definition und Eigenschaften binärer Bäume kennen, Traversierungsalgorithmen für binäre Bäume implementieren können, die Bedeutung von Suchbäumen für die effiziente

Mehr

Machine Learning - Maschinen besser als das menschliche Gehirn?

Machine Learning - Maschinen besser als das menschliche Gehirn? Machine Learning - Maschinen besser als das menschliche Gehirn? Seminar Big Data Science Tobias Stähle 23. Mai 2014 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der

Mehr

Visual Business Intelligence Eine Forschungsperspektive

Visual Business Intelligence Eine Forschungsperspektive Visual Business Intelligence Eine Forschungsperspektive Dr. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung IGD Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 646 Fax.: +49

Mehr

Visualisierung der Imperfektion in multidimensionalen Daten

Visualisierung der Imperfektion in multidimensionalen Daten Visualisierung der Imperfektion in multidimensionalen Daten Horst Fortner Imperfektion und erweiterte Konzepte im Data Warehousing Betreuer: Heiko Schepperle 2 Begriffe (1) Visualisierung [Wikipedia] abstrakte

Mehr

Seminar Visual Analytics and Visual Data Mining

Seminar Visual Analytics and Visual Data Mining Seminar Visual Analytics and Visual Data Mining Dozenten:, AG Visual Computing Steffen Oeltze, AG Visualisierung Organisatorisches Seminar für Diplom und Bachelor-Studenten (max. 18) (leider nicht für

Mehr

Umfrage Internet-Sicherheit 2010

Umfrage Internet-Sicherheit 2010 eco Verband der deutschen Internetwirtschaft e.v. Umfrage Internet-Sicherheit 2010 Auswertung erstellt von: Dr. Kurt Brand AK-Leiter und Geschäftsführer Pallas GmbH Pallas GmbH Hermülheimer Straße 10 50321

Mehr

Spezialisierung Business Intelligence

Spezialisierung Business Intelligence Spezialisierung Business Intelligence Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg peter.becker@h-brs.de 10. Juni 2015 Was ist Business Intelligence? Allgemein umfasst der Begriff Business

Mehr

Watson Elementary. Fast. Easy. Data. High. Innovative Technik für die Diagnose von Prostatakrebs

Watson Elementary. Fast. Easy. Data. High. Innovative Technik für die Diagnose von Prostatakrebs Watson Elementary Innovative Technik für die Diagnose von Prostatakrebs Easy Fast High Data to use diagnosis accuracy friendly Watson Elementary Computer-Aided Diagnosis for Prostate Cancer using multiparametric

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Kapiteltests zum Leitprogramm Binäre Suchbäume

Kapiteltests zum Leitprogramm Binäre Suchbäume Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Techniken der Ausspähung bedrohte Privatheit

Techniken der Ausspähung bedrohte Privatheit Techniken der Ausspähung bedrohte Privatheit Der gläserne Mensch was wir von uns preisgeben? Data Mining und Profiling Dr. Siegfried Streitz Öffentlich bestellter und vereidigter Sachverständiger Geschäftsführer

Mehr

EXASOL Anwendertreffen 2012

EXASOL Anwendertreffen 2012 EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder Programmieren in PASCAL Bäume 1 1. Baumstrukturen Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder 1. die leere Struktur oder 2. ein Knoten vom Typ Element

Mehr

Workflow- basiertes Data Mining in der Bioinformatik

Workflow- basiertes Data Mining in der Bioinformatik 05/ 04/ 06 mine- IT: Workflow- basiertes Data Mining in der Bioinformatik Theoretical Bioinformatics Hintergrund Medizinische Bioinformatik: Forschungsbereich an der Schnitt stelle zwischen Molekularbiologie

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Bereiche der KI. KI und das Web Eine Übersicht. Allgemeines zur KI. Einfluss der KI auf die Informatik. Herausforderungen im Web

Bereiche der KI. KI und das Web Eine Übersicht. Allgemeines zur KI. Einfluss der KI auf die Informatik. Herausforderungen im Web Bereiche der KI KI und das Web Eine Übersicht Web Site Engineering, Vorlesung Nr. 13 Neuronale Netze Suchverfahren Expertensysteme Fallbasiertes Schließen (Case-Based Reasoning) Planen Maschinelles Lernen

Mehr

MINT-Initiative am FKG: Von der Mathematik zur IT

MINT-Initiative am FKG: Von der Mathematik zur IT MINT-Initiative am FKG: Von der Mathematik zur IT Michael Adam ma@sernet.de 2012-05-23 Hi! Michael Adam Mathe...IT (3 / 12) Mathematik Mathe... Mathematik ist NICHT Rechnen! Reine Wissenschaft Streng logische

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Datenstrukturen & Algorithmen

Datenstrukturen & Algorithmen Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Binäre Suchbäume Einführung und Begriffe Binäre Suchbäume 2 Binäre Suchbäume Datenstruktur für dynamische Mengen

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

AutoSPARQL. Let Users Query Your Knowledge Base

AutoSPARQL. Let Users Query Your Knowledge Base AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik

Mehr

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen Kapitel ML: I I. Einführung Beispiele für Lernaufgaben Spezifikation von Lernproblemen ML: I-8 Introduction c STEIN/LETTMANN 2005-2010 Beispiele für Lernaufgaben Autoeinkaufsberater Welche Kriterien liegen

Mehr

B.SC. INFORMATIK TIM JUNGNICKEL

B.SC. INFORMATIK TIM JUNGNICKEL ABOUT ME (21) 5. SEMESTER B.SC. INFORMATIK TU-BERLIN SEIT 2008 2 AGENDA Was ist Informatik? Wie geht es weiter? Was kann ich an der Uni machen? 1 2 3 4 Struktur des Studiums Was lernt man an der Universität?

Mehr

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH Lars Priebe Senior Systemberater ORACLE Deutschland GmbH Data Mining als Anwendung des Data Warehouse Konzepte und Beispiele Agenda Data Warehouse Konzept und Data Mining Data Mining Prozesse Anwendungs-Beispiele

Mehr

Informatik (G9) Sek I - Differenzierung 8/9/10

Informatik (G9) Sek I - Differenzierung 8/9/10 Schulinternes Curriculum für das Fach Informatik (G9) Sek I - Differenzierung 8/9/10 am Gymnasium Lohmar Das Fach Informatik wird am Gymnasium Lohmar im Rahmen der Differenzierung in Form eines 2-stündigen

Mehr

Data Mining in SAP NetWeaver BI

Data Mining in SAP NetWeaver BI Martin Kießwetter, Dirk Vahl kam p Data Mining in SAP NetWeaver BI Galileo Press Bonn Boston 2.1 Was ist Data Mining? 17 2.2 Data Mining, KDD und Business Intelligence 20 2.3 KDD-Prozessmodelle 22 2.4

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Übersicht. 20. Verstärkungslernen

Übersicht. 20. Verstärkungslernen Übersicht I Künstliche Intelligenz II Problemlösen III Wissen und Schlußfolgern IV Logisch Handeln V Unsicheres Wissen und Schließen VI Lernen 18. Lernen aus Beobachtungen 19. Lernen in neuronalen & Bayes

Mehr