DOAG BI Data-Mining in sozialen Online-Netzwerken
|
|
- Angelika Gerhardt
- vor 6 Jahren
- Abrufe
Transkript
1 DOAG BI 2013 Data-Mining in sozialen Online-Netzwerken Bianca Vornamen Böckelmann, Name, 17. dd.mm.yyyy April 2013
2 Agenda Über Robotron Motivation Knowledge Discovery in Databases (KDD)-Prozess Oracle Data Mining (ODM) Indirekte Bestimmung privater Informationen Selektion Vorverarbeitung Transformation Data-Mining Evaluierung Ausblick Praxiserfahrungen 2
3 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Mitarbeiterzahl 303 (Stand 02/2013) Stammkapital Umsatz 2012 Geschäftssitz 2,4 Mio. EUR 31,1 Mio. EUR Stuttgarter Str Dresden Oracle-Partner ISO 9001 zertifiziert 3
4 Robotron-Firmengruppe Tschechien: Robotron Database Solutions s.r.o. Schweiz: Robotron Schweiz GmbH Österreich: Robotron Austria GmbH Russland: Robotron Rus GmbH Deutschland, mit ECG Erdgas-Consult GmbH: Robotron ECG solutions GmbH 4
5 Motivation Soziale Online-Netzwerke erfreuen sich großer Beliebtheit Veröffentlichung privater Daten vs. Schutz der Privatsphäre Konsequenzen der Veröffentlichung: personenbezogene Daten können von Fremden missbraucht werden Privatsphäreeinstellungen ausreichender Schutz durch Verbergen der Profilinformationen? Ableiten privater Profilinformationen einer Person nur anhand der öffentlichen Daten seiner Freunde möglich? 5
6 Motivation Masterarbeit an der Brandenburgischen Technischen Universität Cottbus in Kooperation mit der Robotron Datenbank-Software GmbH und der IHP GmbH im Jahr 2012 Einsatz von Oracle Data Mining 11gR2, speziell Oracle Data Miner (ODMr) Umsetzung am Beispiel des sozialen Graphen von Facebook Können Fremde mittels Data-Mining (DM) die privaten Profilinformationen eines Nutzers nur anhand der öffentlichen Daten seiner Freunde vorhersagen? Ziel: Risiken aufzeigen, um Privatsphäre eines Einzelnen zu schützen Schlussfolgerung: Neben Profilinformationen auch Freundschaftsbeziehungen privat halten, um eigene Privatsphäre zu schützen? 6
7 KDD-Prozess KDD (semi-)automatischer Prozess zum Finden von Mustern in Daten KDD-Prozessmodell Entnommen aus Fayyad, Usama M.; Piatetsky-Shapiro, Gregory; Smyth, Padhraic: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine 17 (1996), Nr. 3, S
8 Oracle Data Mining Teil der Oracle Advanced Analytics Option Data-Mining in der Datenbank Zugriff über PL/SQL, SQL, R Grafische Benutzeroberfläche: Oracle Data Miner Erweiterung des SQL Developers 8
9 Oracle Data Mining Beispiel-Workflow im Oracle Data Miner 9
10 Oracle Data Mining Datenüberprüfungsknoten: einfache Statistiken Transformationsknoten: Binning Normalisierung Fehlende Werte Ausreißer 10
11 Oracle Data Mining Überwachtes Lernen Unüberwachtes Lernen Data-Mining-Verfahren Klassifikation Regression Assoziationsanalyse Clustering Anomalieerkennung Data-Mining-Algorithmen Entscheidungsbaum Naive Bayes Support Vector Machine (SVM) Generalisiertes Lineares Modell (GLM) logistische Regression GLM lineare Regression SVM Apriori k-means O-Cluster One-Class SVM 11
12 Oracle Data Mining Modellknoten 12
13 Oracle Data Mining Gelernte Modelle und Testergebnisse 13
14 privater Informationen Selektion PHP-Anwendung Hidden Profile in Facebook Graph API - Abfrage folgender Informationen Profilinformationen: Geburtstag Geschlecht Wohn- und Heimatort Gefällt mir -Angaben (TV, Film, Musik, Buch, Spiel, Sport) Informationen zur Arbeit und zur Bildung Freundschaftsbeziehungen Weltweit 698 Nutzer 14
15 privater Informationen Vorverarbeitung Fehlende Werte behandeln Geschlecht anhand öffentlicher Informationen herleiten Ableiten des Wohn- und Heimatorts anhand des Orts der Schule bzw. Hochschule und des Unternehmens Mittelwert, Modus Selten angegebene Attribute von Analyse ausschließen Bereinigung der Daten Vereinheitlichung des Vokabulars Notwendigkeit, da kaum Restriktionen bei Facebook-Eingabe Automatisches Matching anhand Syntax: Jaro-Winkler-Ähnlichkeit zu extrahierten Informationen aus DBpedia, Freebase Manuelle Korrektur aufgrund von Synonymen und Homonymen 15
16 privater Informationen Transformation Datentypkonvertierung Normalisierung: Automatisches Vorbereiten der Daten (ADP) Kategorisierung: Klassifikationshierarchien (vorwiegend automatisch mittels DBpedia, Freebase, ) Ort Gemeinde Kreis Bundesland Staat Studiengang Studienrichtung TV-Sendung TV-Genres Alter Altersgruppe (Quantil-Binning) Ausreißer Erkennen: One-Class SVM und manuell Behandeln: Glättung Alter; seltene, aber reale Werte nicht filtern Anteil in % Alter in Jahren 16
17 privater Informationen Transformation Hidden Profile Graph Kante entspricht Facebook-Freundschaft 17
18 privater Informationen Transformation Auswahl der Freunde Maximale Anzahl an Facebook-Freunden: 700 Zu analysierende Nutzer haben mind. 3 bzw. 5 direkte Freunde (min_friends) Direkte und indirekte Freunde Anzahl erfasster Nutzer min_friends 18
19 privater Informationen Transformation Attribut für einen Nutzer Atomar: CHAR,VARCHAR2,NUMBER,FLOAT Verschachtelt: DM_NESTED_NUMERICALS,DM_NESTED_CATEGORICALS Attributname VARCHAR2(4000) z.b. Fernsehsendungen DM_NESTED_CATEGORICALS( DM_NESTED_CATEGORICAL('Simpsons', '1'), DM_NESTED_CATEGORICAL ('Grey`s Anatomy', '1')) Wert NUMBER bei DM_NESTED_NUMERICAL VARCHAR2(4000) bei DM_NESTED_CATEGORICAL 19
20 privater Informationen Transformation Attribut für die Freunde eines Nutzers ODM setzt genau eine Falltabelle voraus mit genau einer Zeile pro Fall unterschiedliche Freundesanzahl unter Nutzern Aggregation der Freundeswerte notwendig Einsatz verschachtelter Datentypen Aggregation: relativer Anteil des Vorkommens unter Freunden Anzahl indirekter Freunde meist viel größer als Anzahl direkter separate Aggregation für direkte und indirekte Freunde, anschließende gewichtete Summierung Gewichtung w d in Abhängigkeit von kürzester Distanz d: w 1 = 1,0 und w 2 = 0,0 bzw. w 1 = 0,6 und w 2 = 0,4 20
21 privater Informationen Transformation Problemtransformierende Methode: Transformation Multi- in Single-Label-Daten anhand Auswahl eines Werts Auswahl relevanter Attribute Manuell: Granularitätsstufen Unbereinigt Bereinigt Kategorisiert auf verschiedenen Ebenen Automatisch: Minimum Description Length (MDL) Filterung irrelevanter Attribute für Vorhersage von Wohnort, Geschlecht, Alter Alle Single-Label-Attribute der Freunde irrelevant, außer bei Alter ist nur Alter der Freunde relevant Alle Multi-Label-Attribute der Freunde relevant 21
22 privater Informationen Data-Mining Überwachtes Lernen Verwendung des zuvor modellierten Graphen Nur Angaben der Freunde als Prädiktoren (Geschlecht, Wohn- und Heimatort, Alter, Schule, Unternehmen, TV ) vorherzusagender Nutzer = Blackbox Aufteilung in Trainings- und Testmenge Klassifikation: Geschlecht, aktueller Wohnort SVM Naive Bayes Entscheidungsbaum (ODM: nur Single-Label-Daten) GLM (logistische Regression nur für Geschlecht) Regression: Alter SVM GLM (lineare Regression) 22
23 privater Informationen Data-Mining Unüberwachtes Lernen Alle Nutzer einbeziehen, nicht nur die Freunde Assoziationsregeln Annahme: Nutzer hat mindestens eine Ausprägung eines Attributs A öffentlich Ziel: für Nutzer restliche private Ausprägungen von A vorhersagen Exemplarisch für TV-Angaben 23
24 privater Informationen Evaluierung Klassifikation Entscheidungsbaum im Allgemeinen schlechte Ergebnisse Wohnort - beste Prognosen bei Naive Bayes Gesamtklassifikationsgenauigkeit (CA) von 71 % auf bereinigter Ebene CA von 86 % auf Bundeslandebene Geschlecht - 65 % CA bei SVM Regression Alter - mittlerer absoluter Fehler von 2,05 Jahren bei GLM, wenn nur gewichteter Altersdurchschnitt der Freunde verwendet wird 24
25 privater Informationen Evaluierung Bestes Regressionsmodell für Alter liefert folgende Prognosen vorhergesagtes Alter tatsächliches Alter 25
26 privater Informationen Evaluierung Beim Wohnort Multi-Label-Daten besser als Single-Label-Daten, beim Geschlecht keine Priorisierung Beste Altersvorhersage nur anhand gewichtetem Altersdurchschnitt der Freunde MDL nicht zuverlässig Hoher Zeitaufwand für Bereinigung und Kategorisierung, Einsatz nur beim Wohnort sinnvoll Einbeziehen indirekter Freunde nicht nötig Bessere Ergebnisse bei mind. 5 direkten Freunden als bei 3 26
27 privater Informationen Evaluierung Assoziationsregeln R = A B auf TV-Sendungen Support(R) 0,1 Allgemeingültigkeit Konfidenz(R) 0,4 Verlässlichkeit Lift(R) > 1 positive Korrelation A und B 27
28 privater Informationen Evaluierung Keine Regeln mit sehr guten Werten für alle 3 Maße Bereinigung sinnvoll Höherer Support Keine sinnlosen Regeln wie American Dad AND How I Met Your Mother AND South Park South Park 28
29 privater Informationen Evaluierung Gibt der Nutzer nur wenige TV-Sendungen öffentlich preis, so können weitere anhand der Angaben aller 698 erfassten Nutzer vorhergesagt werden! Anhand ausschließlich öffentlicher Informationen direkter Freunde können private Informationen eines Einzelnen geschlussfolgert werden! (Grundlage:150 Nutzer) Gute Vorhersage des Alters und des Wohnorts Mittelmäßige Ergebnisse für Geschlecht Fazit: Sämtliche Profilinformationen und Freundschaftsbeziehungen privat halten, um seine persönlichen Informationen vor Fremden zu schützen! 29
30 privater Informationen Ausblick Mögliche Verbesserung der Ergebnisse Anwendung auf größerer Datenmenge Mindestanzahl an direkten Freunden erhöhen Modellierung eines Interaktionsgraphen Anderes Anwendungsgebiet Andere graphenbasierte Strukturen 30
31 Praxiserfahrungen Vorverarbeitung und Transformation nehmen Großteil am KDD-Prozess ein Oracle Data Miner Einfache Handhabung aufgrund von Workflows, für Vergleich der Ergebnisse bei vielen unterschiedlichen Knoteneinstellungen auf gleichen Daten eher PL/SQL-API geeignet Nicht unterstützte Transformationen mittels SQL, PL/SQL selbst implementieren kein zusätzlicher Datentransport nötig 31
32 Praxiserfahrungen Oracle Data Mining Implizite Behandlung von fehlenden Werten und implizite Zuweisung des Skalentyps eines Attributs anhand des Datentyps beachten Einschränkungen Keine verschachtelten Prädiktoren beim Entscheidungsbaum Keine Vorhersage von verschachtelten Zielattributen 32
33 Bianca Böckelmann M.Sc. Systemberaterin BI/DW Vielen Dank für Ihre Aufmerksamkeit! Robotron Datenbank-Software GmbH Stuttgarter Straße Dresden Telefon: Telefax:
Data-Mining in sozialen Online-Netzwerken
Data-Mining in sozialen Online-Netzwerken Bianca Böckelmann Robotron Datenbank-Software GmbH Dresden Schlüsselworte Data-Mining, Oracle Data Mining, Knowledge Discovery in Databases, indirektes Bestimmen
MehrPraktikum und Masterarbeit bei Robotron
Praktikum und Masterarbeit bei Robotron Mein Sprungbrett ins Berufsleben Bianca Böckelmann 20. Juni 2014 Agenda Studium & beruflicher Werdegang Robotron Datenbank-Software GmbH Allgemeine Informationen
MehrOracle BI Publisher Webservice API in Action
Oracle BI Publisher Webservice API in Action Marco Fischer Agenda Firmenvorstellung Einführung Oracle BI Publisher Webservice API WSDL-Beispiel Security Nutzung der BI Publisher Webservices soapui APEX
MehrData Mining - Wiederholung
Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)
MehrWohnungsmarktbeobachtung Niedersachsen (WOM-DB)
Neue Datenbanklösung für Wohnungsmarktbeobachtung Niedersachsen (WOM-DB) Bianca Böckelmann Darmstadt, 12. November 2015 Agenda Vorstellung Robotron Überblick WOM-DB Funktionalitäten der WOM-DB Interesse
MehrRobotron Datenbank-Software GmbH
Robotron Datenbank-Software GmbH Prozessoptimierung durch Datenanalyse & Datenprognose mit R in der Praxis Simon Hofinger Nürnberg, 20.11.2013 Prozessoptimierung durch Datenanalyse & -prognose mit R in
MehrDatenbank Services. Thomas Lehmann, Düsseldorf. Die Datenbank-Spezialisten.
Datenbank Services Thomas Lehmann, 31.05.2017 Düsseldorf Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (8 Gesellschafter) Mitarbeiterzahl 414 (Stand 05/2017)
MehrAdaptive Features Fluch oder Segen
Oracle Datenbank 12c Adaptive Features Fluch oder Segen Thomas Lehmann Düsseldorf, 10.05.2016 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (9 Gesellschafter)
MehrRobotron Datenbank-Software GmbH
Robotron Datenbank-Software GmbH Thematische Karten in Oracle BI EE 11g Bianca Böckelmann Nürnberg, 18.11.2014 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Mitarbeiterzahl 349
MehrWhisky-Empfehlungen. Whisky-Empfehlungen - Joachim Schole
Whisky-Empfehlungen 1 Agenda Motivation Einführung in die Domäne Whisky Einführung Empfehlungssysteme Einführung KDD, Data Mining, Clustering Aktueller Stand & Aufgaben 2 Motivation Problem Whisky-Empfehlung
MehrBig Data als neuer Partner von Six Sigma Optimierung der diskreten Produktion
Big Data als neuer Partner von Six Sigma Optimierung der diskreten Produktion Frank Effenberger, Marco Fischer, 22.06.2015, München Agenda Firmenpräsentation Einführung Anwendungsfall Fazit Zahlen und
MehrJens Schmidt Senior Member Technical Staff
Jens Schmidt Senior Member Technical Staff Oracle 9i Data Mining Connector 1.1 für mysap BW Agenda Data Mining Grundlagen Der Data Mining Prozess Oracle Data Mining Integration mit mysap BW Agenda Data
MehrProjektbericht. Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar
Business Intelligence Master Digitale Logistik und Management Projektbericht Evaluation und Ableitung von Ergebnissen anhand eines Fragebogens zur Studentensituation an der Hochschule Wismar Matthias Säger
MehrSeminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens
Seminar Künstliche Intelligenz WS 2013/14 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 19.12.2013 Allgemeine Problemstellung
MehrData Mining in technischen Daten sinnvoll oder nicht? DOAG BI 2014
Data Mining in technischen Daten sinnvoll oder nicht? DOAG BI 2014 Yves Philippe Chassein, PROMATIS software GmbH München, 1 Prolog Leistungsexplosion bei IT-Infrastrukturen Zusätzlicher Treiber für advanced
MehrKapitel 4: Data Mining
LUDWIG- MAXIMILIANS- UNIVERSITY MUNICH DEPARTMENT INSTITUTE FOR INFORMATICS Skript zur Vorlesung: Einführung in die Informatik: Systeme und Anwendungen Sommersemester 2017 Kapitel 4: Data Mining Vorlesung:
MehrBerechnung von Kennzahlen mit der SQL Model Clause
Berechnung von Kennzahlen mit der Thomas Mauch 12.07.2018 DOAG BASEL BERN LAUSANNE ZÜRICH DÜSSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MÜNCHEN STUTTGART WIEN 1 AGENDA 1. Einführung 2. Syntax 3. Performance
MehrDatenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken
Datenbanken Unit 10: Ranking und Data Mining Erstellen und Ändern von Datenbanken 7. VI. 2016 Organisatorisches nächste Woche am 14. Juni Abschlusstest (Gruppe 1: 10:00 11:15, Gruppe 2: 11:30 12:45 ) Übungsblatt
MehrProjekt-INF Folie 1
Folie 1 Projekt-INF Entwicklung eines Testbed für den empirischen Vergleich verschiedener Methoden des maschinellen Lernens im Bezug auf die Erlernung von Produktentwicklungswissen Folie 2 Inhalt Ziel
MehrData Mining Künstliche Neuronale Netze vs. Entscheidungsbäume
Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren
MehrH E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z
H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z 2 0 1 6 A D V A N C E D A N A L Y T I C S : V O N S E M I - S T R U K T U R I E R T E N D A T E N Z U W I S S E N T O M S E I D E L &
MehrPersonalisierung internetbasierter Handelsszenarien. Matthias Pretzer
Matthias Pretzer matthias.pretzer@informatik.uni-oldenburg.de http://diko-project.de/ Fachbereich Informatik Abteilung Informationssysteme Prof. Dr. Appelrath Inhalt: Motivation Grundlagen Anwendungsszenario
MehrMaschinelles Lernen und Data Mining
Semestralklausur zur Vorlesung Maschinelles Lernen und Data Mining Prof. J. Fürnkranz / Dr. G. Grieser Technische Universität Darmstadt Wintersemester 2004/05 Termin: 14. 2. 2005 Name: Vorname: Matrikelnummer:
MehrAutomated Feature Generation from Structured Knowledge Seminar aus maschinellem Lernen WS 11/12 Dr. Heiko Paulheim, Frederik Janssen
Automated Feature Generation from Structured Knowledge Seminar aus maschinellem Lernen WS 11/12 Dr. Heiko Paulheim, Frederik Janssen 13.12.2011 Automated Feature Generation from Structured Knowledge Johanna
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen
Universität Potsdam Institut für Informatik Lehrstuhl Niels Landwehr, Silvia Makowski, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Übung: Di 10:00-11:30
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Einführung in Data Mining Ulf Leser Wissensmanagement in der Bioinformatik Wo sind wir? Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung des
MehrVergleich von SVM und Regel- und Entscheidungsbaum-Lernern
Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Chahine Abid Bachelor Arbeit Betreuer: Prof. Johannes Fürnkranz Frederik Janssen 28. November 2013 Fachbereich Informatik Fachgebiet Knowledge
MehrData Mining im Einzelhandel Methoden und Werkzeuge
Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.
MehrVorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
MehrData Mining auf Datenströmen Andreas M. Weiner
Technische Universität Kaiserslautern Fachbereich Informatik Lehrgebiet Datenverwaltungssysteme Integriertes Seminar Datenbanken und Informationssysteme Sommersemester 2005 Thema: Data Streams Andreas
Mehr<Insert Picture Here> Datenschätze heben: Data Mining Carsten Czarski Leitender Systemberater Business Unit Database ORACLE Deutschland GmbH
Datenschätze heben: Data Mining Carsten Czarski Leitender Systemberater Business Unit Database ORACLE Deutschland GmbH Agenda Data Mining... erste Schritte... Der Data Mining-Ansatz
MehrDatenvorverarbeitung von nominalen Daten für Data Mining
Datenvorverarbeitung von nominalen Daten für Data Mining Entstanden 2004/2005 bei der T-Systems International GmbH unter Betreuung von Prof. Dr. J. Fürnkranz Seite 1 Gliederung Datenvorverarbeitung Prepared
MehrInhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume
4. Klassifikation Inhalt 4.1 Motivation 4.2 Evaluation 4.3 Logistische Regression 4.4 k-nächste Nachbarn 4.5 Naïve Bayes 4.6 Entscheidungsbäume 4.7 Support Vector Machines 4.8 Neuronale Netze 4.9 Ensemble-Methoden
MehrMotivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi
Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data
MehrKnowledge Discovery in Databases Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik
Knowledge Discovery in Databases Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik 1 Organisatorisches Vorlesung Beginn: 13. April 2005 Mittwoch, 14.15 15.45 Uhr in Raum 0443 Übungen Dienstag,
MehrKnowledge Discovery in Databases
Knowledge Discovery in Databases Organisatorisches Dr. Andreas Hotho FG Wissensverarbeitung FB Mathematik/Informatik Vorlesung Beginn: 13. April 2005 Mittwoch, 14.15 15.45 Uhr in Raum 0443 Übungen Dienstag,
MehrKlassifikation und Ähnlichkeitssuche
Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell
MehrKünstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer?
ASQF Automation Day 2018 - Predictive Analytics Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer? Vasilij Baumann Co-Founder/Co-CEO vasilij.baumann@instrunext.com +49 931
MehrKapitel 1: Einleitung
Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2003/2004 Kapitel
MehrData Mining und maschinelles Lernen
Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:
MehrKapitel 1: Einleitung
Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Skript zur Vorlesung Knowledge Discovery in Databases im Wintersemester 2008/2009 Kapitel
MehrOracle Data Mining 10g Rel 2
18. Deutsche ORACLE-Anwenderkonferenz Mittwoch, 9. November 2005 11h00, Variohalle 2 Oracle Data Mining 10g Rel 2 Lars Priebe ORACLE Deutschland GmbH Geschäftsstelle Hamburg Schlüsselworte: Data Mining,
MehrData Mining Cup deck using PDA or similar devices. Wissensextraktion Multimedia Engineering
Data Mining Cup 2012 Wissensextraktion Multimedia Engineering deck using PDA or similar devices Fakultät für Ingenieurwissenschaften Jevgenij Jakunschin Christian Mewes www.hs-wismar.de 2 Gliederung 1.
MehrTipps und Tricks bei der Nutzung von EclipseLink (JPA)
Tipps und Tricks bei der Nutzung von EclipseLink (JPA) Falko Steglich Nürnberg, 19.November 2015 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (9 Gesellschafter)
MehrDatenbanken Unit 11: Data Mining
Datenbanken Unit 11: Data Mining 11. VI. 2018 Organisatorisches Diesen Mittwoch UE-Abschlusstest (Gruppe 1: 17:30 18:30, Gruppe 2: 16:15 17:15 ) Klassifikation Outline 1 Organisatorisches 2 Data Mining
MehrData Mining Standards am Beispiel von PMML. Data Mining Standards am Beispiel von PMML
Data Mining Standards am Beispiel von PMML Allgemeine Definitionen im Data Mining Data Mining (DM) Ein Prozess, um interessante neue Muster, Korrelationen und Trends in großen Datenbeständen zu entdecken,
MehrWilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz
Wilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz FHDW-Fachbericht Band 1/2009 Raphael Fockel Wilhelm Nüsser (Hrsg.) Carsten Weigand
MehrFrequent Itemset Mining + Association Rule Mining
Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,
MehrZeitaspekte. Fabian Bauschulte
Zeitaspekte Fabian Bauschulte 1 Zeitaspekte Überblick Zeitreihen (engl. time series) Zeitphänomene [Morik/2000a] Lernaufgaben und Repräsentation der Eingabedaten Clustering [Das et al.] Beziehungen zwischen
MehrGlobale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten
Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten M. Siebers 1 U. Schmid 2 1 Otto-Friedrich-Universität Bamberg 2 Fakultät für Wirtschaftsinformatik und Angewandte Informatik
MehrVorlesung Wissensentdeckung
Vorlesung Wissensentdeckung Einführung 5.4.2011 Gliederung 1 Modellbildung und Evaluation 2 Verlaufsmodell der Wissensentdeckung 3 Einführung in das Werkzeug RapidMiner Problem Wir haben nur eine endliche
MehrData Mining mit RapidMiner. Fakultät Informatik Lehrstuhl für Künstliche Intelligenz
Data Mining mit RapidMiner Fakultät Informatik Motivation CRISP: DM-Prozess besteht aus unterschiedlichen Teilaufgaben Datenvorverarbeitung spielt wichtige Rolle im DM-Prozess Systematische Evaluationen
MehrData Mining - Wiederholung
Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)
MehrCopyright 2009 Oracle Corporation
Bereitstellung und Nutzung von aussagekräftigen Data Mining Analysen in Real-Time-Datenströmen Oracle Team Dr. Holger Dresing Leitender Systemberater STCC Nord MW Oracle Deutschland
MehrMS SQL Server 2012 (4)
MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql
MehrPromotoren des Data Mining im betrieblichen Umfeld
Gliederung MSS. Einführung in die Management Support Systeme (MSS) 2. Data Warehouse als Basis-Konzept aktueller MSS 3. Business Intelligence (BI) als Weiterführung des DW-Ansatzes 4. XML und BI 5. Grundlagen
MehrINTELLIGENTE DATENANALYSE IN MATLAB
INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation Literatur Inhalt und Ziele der Vorlesung Beispiele aus der Praxis 2 Organisation Vorlesung/Übung + Projektarbeit. 4 Semesterwochenstunden.
MehrData Mining - Oracle vs. Open Source
Data Mining - Oracle vs. Open Source ein Erfahrungsbericht Prof. Dr. Reinhold von Schwerin D. Adam, K. Böll, S. Funk, F. Knittel, F. Langenbruch S. Nagel, H. Weissbach Hochschule Ulm, Fakultät für Informatik
MehrMathematische Grundlagen III
Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten
MehrMotivation. Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus
3. Klassifikation Motivation Klassifikationsverfahren sagen ein abhängiges nominales Merkmal anhand einem oder mehrerer unabhängiger metrischer Merkmale voraus Beispiel: Bestimme die Herkunft eines Autos
MehrNutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten
Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung
MehrData Mining Cup Dokumentation
Data Mining Cup 2012 - Dokumentation Martin Dreissig, Michael Flau May 14, 2012 1 Beschreibung der zu analysierenden Daten Die zu analysierenden Daten für den diesjährigen Data Mining Cup bestehen aus
MehrProfiling Linked Open Data with ProLOD. LiDDM: A Data Mining System for Linked Data
Profiling Linked Open Data with ProLOD LiDDM: A Data Mining System for Linked Data Seminar aus maschinellem Lernen Frederik Janssen, Dr. Heiko Paulheim 20. Dez.2011 Fachbereich 20 Informatik Seminar aus
MehrÜber die Autoren 7 Widmung 8 Danksagung 9. Einführung 21
Inhaltsverzeichnis Über die Autoren 7 Widmung 8 Danksagung 9 Einführung 21 Über dieses Buch 21 Einige törichte Annahmen 22 In diesem Buch verwendete Symbole 22 Über dieses Buch hinaus 23 Wie es weitergeht
MehrAPEX 5. Mit 6 Klicks kostenfrei zur APEX Webapplikation. Robotron Datenbank-Software GmbH Schulungszentrum Heilbronner Straße Dresden
APEX 5 Mit 6 Klicks kostenfrei zur APEX Webapplikation Robotron Datenbank-Software GmbH Schulungszentrum Heilbronner Straße 21 01189 Dresden Agenda Wie können Sie in nur 6 Schritten zu einer Oracle Application
MehrGeodaten mal ohne Karte
Geodaten mal ohne Karte Was man mit SQL alles machen kann Carsten Czarski Business Unit Database Oracle Deutschland B.V. & Co KG Oracle: Offene Geodaten-Plattform Native Datentypen in der Datenbank Vektordaten
MehrBI Publisher-Praxis: Komplexe Reports und Apex- Dokugenerator
BI Publisher-Praxis: Komplexe Reports und Apex- Dokugenerator Frank Effenberger Nürnberg, 17.11.2015 Zahlen und Fakten Robotron Datenbank-Software GmbH Gründungsjahr 1990 Geschäftsform GmbH (9 Gesellschafter)
MehrPredictive Analytics Organisationsstrukturen Serdar Süzen areto consulting gmbh Köln
Predictive Analytics Organisationsstrukturen Serdar Süzen areto consulting gmbh Köln Schlüsselworte Predictive Analytics, Data Scientist, Klassifikation, Regression, Clustering, Assoziation, Organisationsstrukturen
MehrInhalt. Einleitung... XIII
Inhalt Einleitung................................................. XIII 1 Vektoren, Matrizen und Arrays.................................. 1 1.0 Einführung.......................................... 1 1.1
Mehr2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung
2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg
MehrPersonalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.
Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen
MehrDokument Klassifikation. Thomas Uhrig: Data-Mining SS10
Agenda: 1: Klassifizierung allgemein 2: der naive Bayes-Klassifizierer 3: Beispiel 4: Probleme 5: Fazit 6: Quellen 1: Klassifizierung allgemein: 1: Klassifizierung allgemein: - Einordnung von Objekten
MehrOpinion Mining Herausforderungen und Anwendung in der Politik
Opinion Mining Herausforderungen und Anwendung in der Politik 28.09.2011 Umut Yilmaz Inhaltsübersicht 1. Einführung 2. Grundlagen 3. Anwendung in der Politik 4. Anwendungsbeispiel 5. Fazit 2 1. Einführung
MehrInstitut für angewandte Datenanalyse GmbH
Institut für angewandte Datenanalyse GmbH Überblick Vorstellung Marktforschung oder Data Mining? Database Enrichment Machine-Learning-Verfahren Zwei Fallstudien Ausblick und Fazit Vorstellung IfaD Institut
MehrEntwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion
Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der
MehrINTELLIGENTE DATENANALYSE IN MATLAB. Einführungsveranstaltung
INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation. Literatur. Inhalt und Ziele der Vorlesung. Beispiele aus der Praxis. 2 Organisation Vorlesung/Übung + Projektarbeit.
MehrMotivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.
Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später
MehrData Mining 7-1. Kapitel 7: Advertising on the Web. Johannes Zschache Wintersemester 2018/19
Data Mining Kapitel 7: Advertising on the Web Johannes Zschache Wintersemester 2018/19 Abteilung Datenbanken, Universität Leipzig http://dbs.uni-leipzig.de Data Mining 7-1 7-2 Data Mining Übersicht Hochdimension.
MehrSchneller als Hadoop?
Schneller als Hadoop? Einführung in Spark Cluster Computing 19.11.2013 Dirk Reinemann 1 Agenda 1. Einführung 2. Motivation 3. Infrastruktur 4. Performance 5. Ausblick 19.11.2013 Dirk Reinemann 2 EINFÜHRUNG
MehrData Warehousing und Data Mining
Data Warehousing und Data Mining Einführung in Data Mining Ulf Leser Wissensmanagement in der Bioinformatik Wo sind wir? Einleitung & Motivation Architektur Modellierung von Daten im DWH Umsetzung des
MehrEntscheidungsbäume aus großen Datenbanken: SLIQ
Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:
MehrDatenbanken-Themen im OS "Data Mining" SS 2010
Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend
MehrID3 und Apriori im Vergleich
ID3 und Apriori im Vergleich Lassen sich bei der Klassifikation mittels Apriori bessere Ergebnisse als durch ID3 erzielen? Sebastian Boldt, Christian Schulz, Marc Thielbeer KURZFASSUNG Das folgende Dokument
MehrOracle ACFS / CloudFS zuverlässig nutzbar?
Beratung Software Lösungen Oracle ACFS / CloudFS zuverlässig nutzbar? Claudia Gabriel Ralf Appelbaum Zahlen und Fakten Unternehmensgruppe Materna: 1.500 Mitarbeiter 160 Mio. Euro Umsatz in 2014 Geschäftsführung:
MehrData-Mining und Knowledge Discovery in Databases (KDD) Ein Überblick
Institut für Angewandte Informatik Professur für Technische Informationssysteme Fakultätsname XYZ Fachrichtung XYZ Institutsname XYZ, Professur XYZ Data-Mining und Knowledge Discovery in Databases (KDD)
MehrMaschinelles Lernen I Einführung. Uwe Reichel IPS, LMU München 22. April 2008
Maschinelles Lernen I Einführung Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 22. April 2008 Inhalt Einführung Lernen Maschinelle Lernverfahren im Überblick Phonetische Anwendungsbeispiele
MehrHauptseminar Data Mining im Wintersemester 2008 / 2009
Ludwig Maximilians Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme Hauptseminar Data Mining im Wintersemester 2008 / 2009 Prof. Dr. Christian Böhm Annahita
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische
MehrPerformante Verarbeitung großer Datenbanken am praktischem Beispiel
Performante Verarbeitung großer Datenbanken am praktischem Beispiel Thomas Lehmann 08.09.2015, Dresden Agenda 1. Technische Rahmenbedingungen 2. Theoretische Grundlagen 3. Verschiedene Probleme am praktischen
MehrDeep Learning Prof. Dr. E. Rahm und Mitarbeiter
Deep Learning Prof. Dr. E. Rahm und Mitarbeiter Seminar, WS 2017/18 Big Data Analyse-Pipeline Dateninte -gration/ Anreicherung Datenextraktion / Cleaning Datenbeschaffung Datenanalyse Interpretation Volume
MehrEine Einführung in R: Hochdimensionale Daten: n << p Teil II
Eine Einführung in R: Hochdimensionale Daten: n
MehrRoland Tilgner. Solution Architects & Team Coaching DEVELOPMENT. ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten
Roland Tilgner Solution Architects & Team Coaching DEVELOPMENT ORACLE TEXT AUS PL/SQL-SICHT Features und Möglichkeiten ZURPERSON Roland Tilgner ZURFIRMA Roland Tilgner Solution Architects & Team Coaching
MehrVorlesung Digitale Bildverarbeitung Sommersemester 2013
Vorlesung Digitale Bildverarbeitung Sommersemester 2013 Sebastian Houben (Marc Schlipsing) Institut für Neuroinformatik Inhalt Crash-Course in Machine Learning Klassifikationsverfahren Grundsätzliches
MehrEinsatz von Datenbanken im Forschungslabor. Workflow und Data Mining
Einsatz von Datenbanken im Forschungslabor Friedrich-Alexander-Universität Erlangen-Nürnberg Technische Fakultät, Institut für Informatik Lehrstuhl für Informatik 6 (Datenbanksysteme) Datenbanken weshalb?
MehrData Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih
Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard
MehrCase-Based Reasoning und anderen Inferenzmechanismen
Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining
Mehr