DOAG BI Data-Mining in sozialen Online-Netzwerken

Größe: px
Ab Seite anzeigen:

Download "DOAG BI Data-Mining in sozialen Online-Netzwerken"

Transkript

1 DOAG BI 2013 Data-Mining in sozialen Online-Netzwerken Bianca Vornamen Böckelmann, Name, 17. dd.mm.yyyy April 2013

2 Agenda Über Robotron Motivation Knowledge Discovery in Databases (KDD)-Prozess Oracle Data Mining (ODM) Indirekte Bestimmung privater Informationen Selektion Vorverarbeitung Transformation Data-Mining Evaluierung Ausblick Praxiserfahrungen 2

3 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Mitarbeiterzahl 303 (Stand 02/2013) Stammkapital Umsatz 2012 Geschäftssitz 2,4 Mio. EUR 31,1 Mio. EUR Stuttgarter Str Dresden Oracle-Partner ISO 9001 zertifiziert 3

4 Robotron-Firmengruppe Tschechien: Robotron Database Solutions s.r.o. Schweiz: Robotron Schweiz GmbH Österreich: Robotron Austria GmbH Russland: Robotron Rus GmbH Deutschland, mit ECG Erdgas-Consult GmbH: Robotron ECG solutions GmbH 4

5 Motivation Soziale Online-Netzwerke erfreuen sich großer Beliebtheit Veröffentlichung privater Daten vs. Schutz der Privatsphäre Konsequenzen der Veröffentlichung: personenbezogene Daten können von Fremden missbraucht werden Privatsphäreeinstellungen ausreichender Schutz durch Verbergen der Profilinformationen? Ableiten privater Profilinformationen einer Person nur anhand der öffentlichen Daten seiner Freunde möglich? 5

6 Motivation Masterarbeit an der Brandenburgischen Technischen Universität Cottbus in Kooperation mit der Robotron Datenbank-Software GmbH und der IHP GmbH im Jahr 2012 Einsatz von Oracle Data Mining 11gR2, speziell Oracle Data Miner (ODMr) Umsetzung am Beispiel des sozialen Graphen von Facebook Können Fremde mittels Data-Mining (DM) die privaten Profilinformationen eines Nutzers nur anhand der öffentlichen Daten seiner Freunde vorhersagen? Ziel: Risiken aufzeigen, um Privatsphäre eines Einzelnen zu schützen Schlussfolgerung: Neben Profilinformationen auch Freundschaftsbeziehungen privat halten, um eigene Privatsphäre zu schützen? 6

7 KDD-Prozess KDD (semi-)automatischer Prozess zum Finden von Mustern in Daten KDD-Prozessmodell Entnommen aus Fayyad, Usama M.; Piatetsky-Shapiro, Gregory; Smyth, Padhraic: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine 17 (1996), Nr. 3, S

8 Oracle Data Mining Teil der Oracle Advanced Analytics Option Data-Mining in der Datenbank Zugriff über PL/SQL, SQL, R Grafische Benutzeroberfläche: Oracle Data Miner Erweiterung des SQL Developers 8

9 Oracle Data Mining Beispiel-Workflow im Oracle Data Miner 9

10 Oracle Data Mining Datenüberprüfungsknoten: einfache Statistiken Transformationsknoten: Binning Normalisierung Fehlende Werte Ausreißer 10

11 Oracle Data Mining Überwachtes Lernen Unüberwachtes Lernen Data-Mining-Verfahren Klassifikation Regression Assoziationsanalyse Clustering Anomalieerkennung Data-Mining-Algorithmen Entscheidungsbaum Naive Bayes Support Vector Machine (SVM) Generalisiertes Lineares Modell (GLM) logistische Regression GLM lineare Regression SVM Apriori k-means O-Cluster One-Class SVM 11

12 Oracle Data Mining Modellknoten 12

13 Oracle Data Mining Gelernte Modelle und Testergebnisse 13

14 privater Informationen Selektion PHP-Anwendung Hidden Profile in Facebook Graph API - Abfrage folgender Informationen Profilinformationen: Geburtstag Geschlecht Wohn- und Heimatort Gefällt mir -Angaben (TV, Film, Musik, Buch, Spiel, Sport) Informationen zur Arbeit und zur Bildung Freundschaftsbeziehungen Weltweit 698 Nutzer 14

15 privater Informationen Vorverarbeitung Fehlende Werte behandeln Geschlecht anhand öffentlicher Informationen herleiten Ableiten des Wohn- und Heimatorts anhand des Orts der Schule bzw. Hochschule und des Unternehmens Mittelwert, Modus Selten angegebene Attribute von Analyse ausschließen Bereinigung der Daten Vereinheitlichung des Vokabulars Notwendigkeit, da kaum Restriktionen bei Facebook-Eingabe Automatisches Matching anhand Syntax: Jaro-Winkler-Ähnlichkeit zu extrahierten Informationen aus DBpedia, Freebase Manuelle Korrektur aufgrund von Synonymen und Homonymen 15

16 privater Informationen Transformation Datentypkonvertierung Normalisierung: Automatisches Vorbereiten der Daten (ADP) Kategorisierung: Klassifikationshierarchien (vorwiegend automatisch mittels DBpedia, Freebase, ) Ort Gemeinde Kreis Bundesland Staat Studiengang Studienrichtung TV-Sendung TV-Genres Alter Altersgruppe (Quantil-Binning) Ausreißer Erkennen: One-Class SVM und manuell Behandeln: Glättung Alter; seltene, aber reale Werte nicht filtern Anteil in % Alter in Jahren 16

17 privater Informationen Transformation Hidden Profile Graph Kante entspricht Facebook-Freundschaft 17

18 privater Informationen Transformation Auswahl der Freunde Maximale Anzahl an Facebook-Freunden: 700 Zu analysierende Nutzer haben mind. 3 bzw. 5 direkte Freunde (min_friends) Direkte und indirekte Freunde Anzahl erfasster Nutzer min_friends 18

19 privater Informationen Transformation Attribut für einen Nutzer Atomar: CHAR,VARCHAR2,NUMBER,FLOAT Verschachtelt: DM_NESTED_NUMERICALS,DM_NESTED_CATEGORICALS Attributname VARCHAR2(4000) z.b. Fernsehsendungen DM_NESTED_CATEGORICALS( DM_NESTED_CATEGORICAL('Simpsons', '1'), DM_NESTED_CATEGORICAL ('Grey`s Anatomy', '1')) Wert NUMBER bei DM_NESTED_NUMERICAL VARCHAR2(4000) bei DM_NESTED_CATEGORICAL 19

20 privater Informationen Transformation Attribut für die Freunde eines Nutzers ODM setzt genau eine Falltabelle voraus mit genau einer Zeile pro Fall unterschiedliche Freundesanzahl unter Nutzern Aggregation der Freundeswerte notwendig Einsatz verschachtelter Datentypen Aggregation: relativer Anteil des Vorkommens unter Freunden Anzahl indirekter Freunde meist viel größer als Anzahl direkter separate Aggregation für direkte und indirekte Freunde, anschließende gewichtete Summierung Gewichtung w d in Abhängigkeit von kürzester Distanz d: w 1 = 1,0 und w 2 = 0,0 bzw. w 1 = 0,6 und w 2 = 0,4 20

21 privater Informationen Transformation Problemtransformierende Methode: Transformation Multi- in Single-Label-Daten anhand Auswahl eines Werts Auswahl relevanter Attribute Manuell: Granularitätsstufen Unbereinigt Bereinigt Kategorisiert auf verschiedenen Ebenen Automatisch: Minimum Description Length (MDL) Filterung irrelevanter Attribute für Vorhersage von Wohnort, Geschlecht, Alter Alle Single-Label-Attribute der Freunde irrelevant, außer bei Alter ist nur Alter der Freunde relevant Alle Multi-Label-Attribute der Freunde relevant 21

22 privater Informationen Data-Mining Überwachtes Lernen Verwendung des zuvor modellierten Graphen Nur Angaben der Freunde als Prädiktoren (Geschlecht, Wohn- und Heimatort, Alter, Schule, Unternehmen, TV ) vorherzusagender Nutzer = Blackbox Aufteilung in Trainings- und Testmenge Klassifikation: Geschlecht, aktueller Wohnort SVM Naive Bayes Entscheidungsbaum (ODM: nur Single-Label-Daten) GLM (logistische Regression nur für Geschlecht) Regression: Alter SVM GLM (lineare Regression) 22

23 privater Informationen Data-Mining Unüberwachtes Lernen Alle Nutzer einbeziehen, nicht nur die Freunde Assoziationsregeln Annahme: Nutzer hat mindestens eine Ausprägung eines Attributs A öffentlich Ziel: für Nutzer restliche private Ausprägungen von A vorhersagen Exemplarisch für TV-Angaben 23

24 privater Informationen Evaluierung Klassifikation Entscheidungsbaum im Allgemeinen schlechte Ergebnisse Wohnort - beste Prognosen bei Naive Bayes Gesamtklassifikationsgenauigkeit (CA) von 71 % auf bereinigter Ebene CA von 86 % auf Bundeslandebene Geschlecht - 65 % CA bei SVM Regression Alter - mittlerer absoluter Fehler von 2,05 Jahren bei GLM, wenn nur gewichteter Altersdurchschnitt der Freunde verwendet wird 24

25 privater Informationen Evaluierung Bestes Regressionsmodell für Alter liefert folgende Prognosen vorhergesagtes Alter tatsächliches Alter 25

26 privater Informationen Evaluierung Beim Wohnort Multi-Label-Daten besser als Single-Label-Daten, beim Geschlecht keine Priorisierung Beste Altersvorhersage nur anhand gewichtetem Altersdurchschnitt der Freunde MDL nicht zuverlässig Hoher Zeitaufwand für Bereinigung und Kategorisierung, Einsatz nur beim Wohnort sinnvoll Einbeziehen indirekter Freunde nicht nötig Bessere Ergebnisse bei mind. 5 direkten Freunden als bei 3 26

27 privater Informationen Evaluierung Assoziationsregeln R = A B auf TV-Sendungen Support(R) 0,1 Allgemeingültigkeit Konfidenz(R) 0,4 Verlässlichkeit Lift(R) > 1 positive Korrelation A und B 27

28 privater Informationen Evaluierung Keine Regeln mit sehr guten Werten für alle 3 Maße Bereinigung sinnvoll Höherer Support Keine sinnlosen Regeln wie American Dad AND How I Met Your Mother AND South Park South Park 28

29 privater Informationen Evaluierung Gibt der Nutzer nur wenige TV-Sendungen öffentlich preis, so können weitere anhand der Angaben aller 698 erfassten Nutzer vorhergesagt werden! Anhand ausschließlich öffentlicher Informationen direkter Freunde können private Informationen eines Einzelnen geschlussfolgert werden! (Grundlage:150 Nutzer) Gute Vorhersage des Alters und des Wohnorts Mittelmäßige Ergebnisse für Geschlecht Fazit: Sämtliche Profilinformationen und Freundschaftsbeziehungen privat halten, um seine persönlichen Informationen vor Fremden zu schützen! 29

30 privater Informationen Ausblick Mögliche Verbesserung der Ergebnisse Anwendung auf größerer Datenmenge Mindestanzahl an direkten Freunden erhöhen Modellierung eines Interaktionsgraphen Anderes Anwendungsgebiet Andere graphenbasierte Strukturen 30

31 Praxiserfahrungen Vorverarbeitung und Transformation nehmen Großteil am KDD-Prozess ein Oracle Data Miner Einfache Handhabung aufgrund von Workflows, für Vergleich der Ergebnisse bei vielen unterschiedlichen Knoteneinstellungen auf gleichen Daten eher PL/SQL-API geeignet Nicht unterstützte Transformationen mittels SQL, PL/SQL selbst implementieren kein zusätzlicher Datentransport nötig 31

32 Praxiserfahrungen Oracle Data Mining Implizite Behandlung von fehlenden Werten und implizite Zuweisung des Skalentyps eines Attributs anhand des Datentyps beachten Einschränkungen Keine verschachtelten Prädiktoren beim Entscheidungsbaum Keine Vorhersage von verschachtelten Zielattributen 32

33 Bianca Böckelmann M.Sc. Systemberaterin BI/DW Vielen Dank für Ihre Aufmerksamkeit! Robotron Datenbank-Software GmbH Stuttgarter Straße Dresden Telefon: Telefax:

Data-Mining in sozialen Online-Netzwerken

Data-Mining in sozialen Online-Netzwerken Data-Mining in sozialen Online-Netzwerken Bianca Böckelmann Robotron Datenbank-Software GmbH Dresden Schlüsselworte Data-Mining, Oracle Data Mining, Knowledge Discovery in Databases, indirektes Bestimmen

Mehr

Praktikum und Masterarbeit bei Robotron

Praktikum und Masterarbeit bei Robotron Praktikum und Masterarbeit bei Robotron Mein Sprungbrett ins Berufsleben Bianca Böckelmann 20. Juni 2014 Agenda Studium & beruflicher Werdegang Robotron Datenbank-Software GmbH Allgemeine Informationen

Mehr

Oracle BI Publisher Webservice API in Action

Oracle BI Publisher Webservice API in Action Oracle BI Publisher Webservice API in Action Marco Fischer Agenda Firmenvorstellung Einführung Oracle BI Publisher Webservice API WSDL-Beispiel Security Nutzung der BI Publisher Webservices soapui APEX

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Wohnungsmarktbeobachtung Niedersachsen (WOM-DB)

Wohnungsmarktbeobachtung Niedersachsen (WOM-DB) Neue Datenbanklösung für Wohnungsmarktbeobachtung Niedersachsen (WOM-DB) Bianca Böckelmann Darmstadt, 12. November 2015 Agenda Vorstellung Robotron Überblick WOM-DB Funktionalitäten der WOM-DB Interesse

Mehr

Robotron Datenbank-Software GmbH

Robotron Datenbank-Software GmbH Robotron Datenbank-Software GmbH Prozessoptimierung durch Datenanalyse & Datenprognose mit R in der Praxis Simon Hofinger Nürnberg, 20.11.2013 Prozessoptimierung durch Datenanalyse & -prognose mit R in

Mehr

Datenbank Services. Thomas Lehmann, Düsseldorf. Die Datenbank-Spezialisten.

Datenbank Services. Thomas Lehmann, Düsseldorf. Die Datenbank-Spezialisten. Datenbank Services Thomas Lehmann, 31.05.2017 Düsseldorf Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (8 Gesellschafter) Mitarbeiterzahl 414 (Stand 05/2017)

Mehr

Adaptive Features Fluch oder Segen

Adaptive Features Fluch oder Segen Oracle Datenbank 12c Adaptive Features Fluch oder Segen Thomas Lehmann Düsseldorf, 10.05.2016 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (9 Gesellschafter)

Mehr

Robotron Datenbank-Software GmbH

Robotron Datenbank-Software GmbH Robotron Datenbank-Software GmbH Thematische Karten in Oracle BI EE 11g Bianca Böckelmann Nürnberg, 18.11.2014 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Mitarbeiterzahl 349

Mehr

Whisky-Empfehlungen. Whisky-Empfehlungen - Joachim Schole

Whisky-Empfehlungen. Whisky-Empfehlungen - Joachim Schole Whisky-Empfehlungen 1 Agenda Motivation Einführung in die Domäne Whisky Einführung Empfehlungssysteme Einführung KDD, Data Mining, Clustering Aktueller Stand & Aufgaben 2 Motivation Problem Whisky-Empfehlung

Mehr

Big Data als neuer Partner von Six Sigma Optimierung der diskreten Produktion

Big Data als neuer Partner von Six Sigma Optimierung der diskreten Produktion Big Data als neuer Partner von Six Sigma Optimierung der diskreten Produktion Frank Effenberger, Marco Fischer, 22.06.2015, München Agenda Firmenpräsentation Einführung Anwendungsfall Fazit Zahlen und

Mehr

Jens Schmidt Senior Member Technical Staff

Jens Schmidt Senior Member Technical Staff Jens Schmidt Senior Member Technical Staff Oracle 9i Data Mining Connector 1.1 für mysap BW Agenda Data Mining Grundlagen Der Data Mining Prozess Oracle Data Mining Integration mit mysap BW Agenda Data

Mehr

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar

Projektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Business Intelligence Master Digitale Logistik und Management Projektbericht Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Matthias Säger

Mehr

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens

Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung

Mehr

Data Mining in technischen Daten sinnvoll oder nicht? DOAG BI 2014

Data Mining in technischen Daten sinnvoll oder nicht? DOAG BI 2014 Data Mining in technischen Daten sinnvoll oder nicht? DOAG BI 2014 Yves Philippe Chassein, PROMATIS software GmbH München, 1 Prolog Leistungsexplosion bei IT-Infrastrukturen Zusätzlicher Treiber für advanced

Mehr

Kapitel 4: Data Mining

Kapitel 4: Data Mining LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2017 Kapitel 4: Data Mining Vorlesung:

Mehr

Berechnung von Kennzahlen mit der SQL Model Clause

Berechnung von Kennzahlen mit der SQL Model Clause Berechnung von Kennzahlen mit der Thomas Mauch 12.07.2018 DOAG BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MÜNCHEN STUTTGART WIEN 1 AGENDA 1. Einführung 2. Syntax 3. Performance

Mehr

Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken

Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken 7. VI. 2016 Organisatorisches nächste Woche am 14. Juni Abschlusstest (Gruppe 1: 10:00 11:15, Gruppe 2: 11:30 12:45 ) Übungsblatt

Mehr

Projekt-INF Folie 1

Projekt-INF Folie 1 Folie 1 Projekt-INF Entwicklung eines Testbed für den empirischen Vergleich verschiedener Methoden des maschinellen Lernens im Bezug auf die Erlernung von Produktentwicklungswissen Folie 2 Inhalt Ziel

Mehr

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren

Mehr

H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z

H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z 2 0 1 6 A D V A N C E D A N A L Y T I C S : V O N S E M I - S T R U K T U R I E R T E N D A T E N Z U W I S S E N T O M S E I D E L &

Mehr

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer

Personalisierung internetbasierter Handelsszenarien. Matthias Pretzer Matthias Pretzer matthias.pretzer@informatik.uni-oldenburg.de http://diko-project.de/ Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Inhalt: Motivation Grundlagen Anwendungsszenario

Mehr

Maschinelles Lernen und Data Mining

Maschinelles Lernen und Data Mining Semestralklausur zur Vorlesung Maschinelles Lernen und Data Mining Prof. J. Fürnkranz / Dr. G. Grieser Technische Universität Darmstadt Wintersemester 2004/05 Termin: 14. 2. 2005 Name: Vorname: Matrikelnummer:

Mehr

Automated Feature Generation from Structured Knowledge Seminar aus maschinellem Lernen WS 11/12 Dr. Heiko Paulheim, Frederik Janssen

Automated Feature Generation from Structured Knowledge Seminar aus maschinellem Lernen WS 11/12 Dr. Heiko Paulheim, Frederik Janssen Automated Feature Generation from Structured Knowledge Seminar aus maschinellem Lernen WS 11/12 Dr. Heiko Paulheim, Frederik Janssen 13.12.2011 Automated Feature Generation from Structured Knowledge Johanna

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen Universität Potsdam Institut für Informatik Lehrstuhl Niels Landwehr, Silvia Makowski, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Übung: Di 10:00-11:30

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Einführung in Data Mining Ulf Leser Wissensmanagement in der Bioinformatik Wo sind wir? Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung des

Mehr

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern

Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Chahine Abid Bachelor Arbeit Betreuer: Prof. Johannes Fürnkranz Frederik Janssen 28. November 2013 Fachbereich Informatik Fachgebiet Knowledge

Mehr

Data Mining im Einzelhandel Methoden und Werkzeuge

Data Mining im Einzelhandel Methoden und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Data Mining auf Datenströmen Andreas M. Weiner

Data Mining auf Datenströmen Andreas M. Weiner Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas

Mehr

<Insert Picture Here> Datenschätze heben: Data Mining Carsten Czarski Leitender Systemberater Business Unit Database ORACLE Deutschland GmbH

<Insert Picture Here> Datenschätze heben: Data Mining Carsten Czarski Leitender Systemberater Business Unit Database ORACLE Deutschland GmbH Datenschätze heben: Data Mining Carsten Czarski Leitender Systemberater Business Unit Database ORACLE Deutschland GmbH Agenda Data Mining... erste Schritte... Der Data Mining-Ansatz

Mehr

Datenvorverarbeitung von nominalen Daten für Data Mining

Datenvorverarbeitung von nominalen Daten für Data Mining Datenvorverarbeitung von nominalen Daten für Data Mining Entstanden 2004/2005 bei der T-Systems International GmbH unter Betreuung von Prof. Dr. J. Fürnkranz Seite 1 Gliederung Datenvorverarbeitung Prepared

Mehr

Inhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume

Inhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume 4. Klassifikation Inhalt 4.1 Motivation 4.2 Evaluation 4.3 Logistische Regression 4.4 k-nächste Nachbarn 4.5 Naïve Bayes 4.6 Entscheidungsbäume 4.7 Support Vector Machines 4.8 Neuronale Netze 4.9 Ensemble-Methoden

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Knowledge Discovery in Databases Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik

Knowledge Discovery in Databases Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik Knowledge Discovery in Databases Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik 1 Organisatorisches Vorlesung Beginn: 13. April 2005 Mittwoch, 14.15 15.45 Uhr in Raum 0443 Übungen Dienstag,

Mehr

Knowledge Discovery in Databases

Knowledge Discovery in Databases Knowledge Discovery in Databases Organisatorisches Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik Vorlesung Beginn: 13. April 2005 Mittwoch, 14.15 15.45 Uhr in Raum 0443 Übungen Dienstag,

Mehr

Klassifikation und Ähnlichkeitssuche

Klassifikation und Ähnlichkeitssuche Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell

Mehr

Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer?

Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer? ASQF Automation Day 2018 - Predictive Analytics Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer? Vasilij Baumann Co-Founder/Co-CEO vasilij.baumann@instrunext.com +49 931

Mehr

Kapitel 1: Einleitung

Kapitel 1: Einleitung Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2003/2004 Kapitel

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

Kapitel 1: Einleitung

Kapitel 1: Einleitung Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2008/2009 Kapitel

Mehr

Oracle Data Mining 10g Rel 2

Oracle Data Mining 10g Rel 2 18. Deutsche ORACLE-Anwenderkonferenz Mittwoch, 9. November 2005 11h00, Variohalle 2 Oracle Data Mining 10g Rel 2 Lars Priebe ORACLE Deutschland GmbH Geschäftsstelle Hamburg Schlüsselworte: Data Mining,

Mehr

Data Mining Cup deck using PDA or similar devices. Wissensextraktion Multimedia Engineering

Data Mining Cup deck using PDA or similar devices. Wissensextraktion Multimedia Engineering Data Mining Cup 2012 Wissensextraktion Multimedia Engineering deck using PDA or similar devices Fakultät für Ingenieurwissenschaften Jevgenij Jakunschin Christian Mewes www.hs-wismar.de 2 Gliederung 1.

Mehr

Tipps und Tricks bei der Nutzung von EclipseLink (JPA)

Tipps und Tricks bei der Nutzung von EclipseLink (JPA) Tipps und Tricks bei der Nutzung von EclipseLink (JPA) Falko Steglich Nürnberg, 19.November 2015 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (9 Gesellschafter)

Mehr

Datenbanken Unit 11: Data Mining

Datenbanken Unit 11: Data Mining Datenbanken Unit 11: Data Mining 11. VI. 2018 Organisatorisches Diesen Mittwoch UE-Abschlusstest (Gruppe 1: 17:30 18:30, Gruppe 2: 16:15 17:15 ) Klassifikation Outline 1 Organisatorisches 2 Data Mining

Mehr

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML

Data Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,

Mehr

Wilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz

Wilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz Wilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz FHDW-Fachbericht Band 1/2009 Raphael Fockel Wilhelm Nüsser (Hrsg.) Carsten Weigand

Mehr

Frequent Itemset Mining + Association Rule Mining

Frequent Itemset Mining + Association Rule Mining Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,

Mehr

Zeitaspekte. Fabian Bauschulte

Zeitaspekte. Fabian Bauschulte Zeitaspekte Fabian Bauschulte 1 Zeitaspekte Überblick Zeitreihen (engl. time series) Zeitphänomene [Morik/2000a] Lernaufgaben und Repräsentation der Eingabedaten Clustering [Das et al.] Beziehungen zwischen

Mehr

Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten

Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten M. Siebers 1 U. Schmid 2 1 Otto-Friedrich-Universität Bamberg 2 Fakultät für Wirtschaftsinformatik und Angewandte Informatik

Mehr

Vorlesung Wissensentdeckung

Vorlesung Wissensentdeckung Vorlesung Wissensentdeckung Einführung 5.4.2011 Gliederung 1 Modellbildung und Evaluation 2 Verlaufsmodell der Wissensentdeckung 3 Einführung in das Werkzeug RapidMiner Problem Wir haben nur eine endliche

Mehr

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz

Data Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz Data Mining mit RapidMiner Fakultät Informatik Motivation CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Copyright 2009 Oracle Corporation

Copyright 2009 Oracle Corporation Bereitstellung und Nutzung von aussagekräftigen Data Mining Analysen in Real-Time-Datenströmen Oracle Team Dr. Holger Dresing Leitender Systemberater STCC Nord MW Oracle Deutschland

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Promotoren des Data Mining im betrieblichen Umfeld

Promotoren des Data Mining im betrieblichen Umfeld Gliederung MSS. Einführung in die Management Support Systeme (MSS) 2. Data Warehouse als Basis-Konzept aktueller MSS 3. Business Intelligence (BI) als Weiterführung des DW-Ansatzes 4. XML und BI 5. Grundlagen

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB

INTELLIGENTE DATENANALYSE IN MATLAB INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation Literatur Inhalt und Ziele der Vorlesung Beispiele aus der Praxis 2 Organisation Vorlesung/Übung + Projektarbeit. 4 Semesterwochenstunden.

Mehr

Data Mining - Oracle vs. Open Source

Data Mining - Oracle vs. Open Source Data Mining - Oracle vs. Open Source ein Erfahrungsbericht Prof. Dr. Reinhold von Schwerin D. Adam, K. Böll, S. Funk, F. Knittel, F. Langenbruch S. Nagel, H. Weissbach Hochschule Ulm, Fakultät für Informatik

Mehr

Mathematische Grundlagen III

Mathematische Grundlagen III Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten

Mehr

Motivation. Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus

Motivation. Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus 3. Klassifikation Motivation Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus Beispiel: Bestimme die Herkunft eines Autos

Mehr

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung

Mehr

Data Mining Cup Dokumentation

Data Mining Cup Dokumentation Data Mining Cup 2012 - Dokumentation Martin Dreissig, Michael Flau May 14, 2012 1 Beschreibung der zu analysierenden Daten Die zu analysierenden Daten für den diesjährigen Data Mining Cup bestehen aus

Mehr

Profiling Linked Open Data with ProLOD. LiDDM: A Data Mining System for Linked Data

Profiling Linked Open Data with ProLOD. LiDDM: A Data Mining System for Linked Data Profiling Linked Open Data with ProLOD LiDDM: A Data Mining System for Linked Data Seminar aus maschinellem Lernen Frederik Janssen, Dr. Heiko Paulheim 20. Dez.2011 Fachbereich 20 Informatik Seminar aus

Mehr

Über die Autoren 7 Widmung 8 Danksagung 9. Einführung 21

Über die Autoren 7 Widmung 8 Danksagung 9. Einführung 21 Inhaltsverzeichnis Über die Autoren 7 Widmung 8 Danksagung 9 Einführung 21 Über dieses Buch 21 Einige törichte Annahmen 22 In diesem Buch verwendete Symbole 22 Über dieses Buch hinaus 23 Wie es weitergeht

Mehr

APEX 5. Mit 6 Klicks kostenfrei zur APEX Webapplikation. Robotron Datenbank-Software GmbH Schulungszentrum Heilbronner Straße Dresden

APEX 5. Mit 6 Klicks kostenfrei zur APEX Webapplikation. Robotron Datenbank-Software GmbH Schulungszentrum Heilbronner Straße Dresden APEX 5 Mit 6 Klicks kostenfrei zur APEX Webapplikation Robotron Datenbank-Software GmbH Schulungszentrum Heilbronner Straße 21 01189 Dresden Agenda Wie können Sie in nur 6 Schritten zu einer Oracle Application

Mehr

Geodaten mal ohne Karte

Geodaten mal ohne Karte Geodaten mal ohne Karte Was man mit SQL alles machen kann Carsten Czarski Business Unit Database Oracle Deutschland B.V. & Co KG Oracle: Offene Geodaten-Plattform Native Datentypen in der Datenbank Vektordaten

Mehr

BI Publisher-Praxis: Komplexe Reports und Apex- Dokugenerator

BI Publisher-Praxis: Komplexe Reports und Apex- Dokugenerator BI Publisher-Praxis: Komplexe Reports und Apex- Dokugenerator Frank Effenberger Nürnberg, 17.11.2015 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (9 Gesellschafter)

Mehr

Predictive Analytics Organisationsstrukturen Serdar Süzen areto consulting gmbh Köln

Predictive Analytics Organisationsstrukturen Serdar Süzen areto consulting gmbh Köln Predictive Analytics Organisationsstrukturen Serdar Süzen areto consulting gmbh Köln Schlüsselworte Predictive Analytics, Data Scientist, Klassifikation, Regression, Clustering, Assoziation, Organisationsstrukturen

Mehr

Inhalt. Einleitung... XIII

Inhalt. Einleitung... XIII Inhalt Einleitung................................................. XIII 1 Vektoren, Matrizen und Arrays.................................. 1 1.0 Einführung.......................................... 1 1.1

Mehr

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung

2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Dokument Klassifikation. Thomas Uhrig: Data-Mining SS10

Dokument Klassifikation. Thomas Uhrig: Data-Mining SS10 Agenda: 1: Klassifizierung allgemein 2: der naive Bayes-Klassifizierer 3: Beispiel 4: Probleme 5: Fazit 6: Quellen 1: Klassifizierung allgemein: 1: Klassifizierung allgemein: - Einordnung von Objekten

Mehr

Opinion Mining Herausforderungen und Anwendung in der Politik

Opinion Mining Herausforderungen und Anwendung in der Politik Opinion Mining Herausforderungen und Anwendung in der Politik 28.09.2011 Umut Yilmaz Inhaltsübersicht 1. Einführung 2. Grundlagen 3. Anwendung in der Politik 4. Anwendungsbeispiel 5. Fazit 2 1. Einführung

Mehr

Institut für angewandte Datenanalyse GmbH

Institut für angewandte Datenanalyse GmbH Institut für angewandte Datenanalyse GmbH Überblick Vorstellung Marktforschung oder Data Mining? Database Enrichment Machine-Learning-Verfahren Zwei Fallstudien Ausblick und Fazit Vorstellung IfaD Institut

Mehr

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion

Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der

Mehr

INTELLIGENTE DATENANALYSE IN MATLAB. Einführungsveranstaltung

INTELLIGENTE DATENANALYSE IN MATLAB. Einführungsveranstaltung INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation. Literatur. Inhalt und Ziele der Vorlesung. Beispiele aus der Praxis. 2 Organisation Vorlesung/Übung + Projektarbeit.

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Data Mining 7-1. Kapitel 7: Advertising on the Web. Johannes Zschache Wintersemester 2018/19

Data Mining 7-1. Kapitel 7: Advertising on the Web. Johannes Zschache Wintersemester 2018/19 Data Mining Kapitel 7: Advertising on the Web Johannes Zschache Wintersemester 2018/19 Abteilung Datenbanken, Universität Leipzig http://dbs.uni-leipzig.de Data Mining 7-1 7-2 Data Mining Übersicht Hochdimension.

Mehr

Schneller als Hadoop?

Schneller als Hadoop? Schneller als Hadoop? Einführung in Spark Cluster Computing 19.11.2013 Dirk Reinemann 1 Agenda 1. Einführung 2. Motivation 3. Infrastruktur 4. Performance 5. Ausblick 19.11.2013 Dirk Reinemann 2 EINFÜHRUNG

Mehr

Data Warehousing und Data Mining

Data Warehousing und Data Mining Data Warehousing und Data Mining Einführung in Data Mining Ulf Leser Wissensmanagement in der Bioinformatik Wo sind wir? Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung des

Mehr

Entscheidungsbäume aus großen Datenbanken: SLIQ

Entscheidungsbäume aus großen Datenbanken: SLIQ Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

ID3 und Apriori im Vergleich

ID3 und Apriori im Vergleich ID3 und Apriori im Vergleich Lassen sich bei der Klassifikation mittels Apriori bessere Ergebnisse als durch ID3 erzielen? Sebastian Boldt, Christian Schulz, Marc Thielbeer KURZFASSUNG Das folgende Dokument

Mehr

Oracle ACFS / CloudFS zuverlässig nutzbar?

Oracle ACFS / CloudFS zuverlässig nutzbar? Beratung Software Lösungen Oracle ACFS / CloudFS zuverlässig nutzbar? Claudia Gabriel Ralf Appelbaum Zahlen und Fakten Unternehmensgruppe Materna: 1.500 Mitarbeiter 160 Mio. Euro Umsatz in 2014 Geschäftsführung:

Mehr

Data-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick

Data-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick Institut für Angewandte Informatik Professur für Technische Informationssysteme Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ Data-Mining und Knowledge Discovery in Databases (KDD)

Mehr

Maschinelles Lernen I Einführung. Uwe Reichel IPS, LMU München 22. April 2008

Maschinelles Lernen I Einführung. Uwe Reichel IPS, LMU München 22. April 2008 Maschinelles Lernen I Einführung Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 22. April 2008 Inhalt Einführung Lernen Maschinelle Lernverfahren im Überblick Phonetische Anwendungsbeispiele

Mehr

Hauptseminar Data Mining im Wintersemester 2008 / 2009

Hauptseminar Data Mining im Wintersemester 2008 / 2009 Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Hauptseminar Data Mining im Wintersemester 2008 / 2009 Prof. Dr. Christian Böhm Annahita

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische

Mehr

Performante Verarbeitung großer Datenbanken am praktischem Beispiel

Performante Verarbeitung großer Datenbanken am praktischem Beispiel Performante Verarbeitung großer Datenbanken am praktischem Beispiel Thomas Lehmann 08.09.2015, Dresden Agenda 1. Technische Rahmenbedingungen 2. Theoretische Grundlagen 3. Verschiedene Probleme am praktischen

Mehr

Deep Learning Prof. Dr. E. Rahm und Mitarbeiter

Deep Learning Prof. Dr. E. Rahm und Mitarbeiter Deep Learning Prof. Dr. E. Rahm und Mitarbeiter Seminar, WS 2017/18 Big Data Analyse-Pipeline Dateninte -gration/ Anreicherung Datenextraktion / Cleaning Datenbeschaffung Datenanalyse Interpretation Volume

Mehr

Eine Einführung in R: Hochdimensionale Daten: n << p Teil II

Eine Einführung in R: Hochdimensionale Daten: n << p Teil II Eine Einführung in R: Hochdimensionale Daten: n

Mehr

Roland Tilgner. Solution Architects & Team Coaching DEVELOPMENT. ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten

Roland Tilgner. Solution Architects & Team Coaching DEVELOPMENT. ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten Roland Tilgner Solution Architects & Team Coaching DEVELOPMENT ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten ZURPERSON Roland Tilgner ZURFIRMA Roland Tilgner Solution Architects & Team Coaching

Mehr

Vorlesung Digitale Bildverarbeitung Sommersemester 2013

Vorlesung Digitale Bildverarbeitung Sommersemester 2013 Vorlesung Digitale Bildverarbeitung Sommersemester 2013 Sebastian Houben (Marc Schlipsing) Institut für Neuroinformatik Inhalt Crash-Course in Machine Learning Klassifikationsverfahren Grundsätzliches

Mehr

Einsatz von Datenbanken im Forschungslabor. Workflow und Data Mining

Einsatz von Datenbanken im Forschungslabor. Workflow und Data Mining Einsatz von Datenbanken im Forschungslabor Friedrich-Alexander-Universität Erlangen-Nürnberg Technische Fakultät, Institut für Informatik Lehrstuhl für Informatik 6 (Datenbanksysteme) Datenbanken weshalb?

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Case-Based Reasoning und anderen Inferenzmechanismen

Case-Based Reasoning und anderen Inferenzmechanismen Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining

Mehr