Institut für angewandte Datenanalyse GmbH
|
|
- Leon Bretz
- vor 5 Jahren
- Abrufe
Transkript
1 Institut für angewandte Datenanalyse GmbH
2 Überblick Vorstellung Marktforschung oder Data Mining? Database Enrichment Machine-Learning-Verfahren Zwei Fallstudien Ausblick und Fazit
3 Vorstellung IfaD Institut für angewandte Datenanalyse Seit fast 40 Jahren Dienstleister für Marktforscher in Instituten und Unternehmen Über 50 Mitarbeiter Umfassendes Service-Angebot Datenerhebung Datenverarbeitung Präsentation Analyse Zu meiner Person Naturwissenschaftlicher Hintergrund Promotion in der Elementarteilchen-Physik Seit 1½ Jahren bei IfaD Schwerpunkte Statistische Methoden Data Mining Software-Entwicklung
4 Marktforschung vs. Data Mining? Wozu im Big-Data-Zeitalter neue Daten erheben? Wozu noch Marktforschung, wenn man sowieso schon alles weiß? Marktforschung Big Data Einstellung, Meinung Inhalt Verhalten, Beschreibung Erhebungsaufwand Verfügbarkeit Liegen ohnehin vor Hoch Qualität Bearbeitungsaufwand Subjektiv Validität Objektiv Hoch Relevanz Analyseaufwand Will ein Unternehmen erfolgreich sein, muss es seine Kunden verstehen Muss es tatsächlich die Einstellung und Meinung kennen? Nicht unbedingt: Mit ausreichend Daten über Stimuli + Reaktionen lässt sich die Frage nach der Meinung umgehen Aber: Selten liegen diese Daten ausreichend vor Was ist mit echten Innovationen?
5 Marktforschung und Data Mining! Beide Welten für sich ergeben kein komplettes Bild Mehrwert durch Verknüpfung von Big Data mit sorgfältig erhobenen Marktforschungsdaten Quantität und Objektivität von Big Data Qualität und Relevanz von Marktforschungsdaten 360-Grad-Sicht auf den Kunden Herausforderung Daten-getriebener Ansatz Mustererkennung in den Zusammenhängen: Welche Verhaltensweisen und welche Eigenschaften lassen auf welche Einstellung und welche Meinung schließen? Fallweise Prognosen der Einstellung und Meinung
6 Simples Beispiel Befragung: Welche Eissorte mögen Sie am liebsten? Mehrheiten Weiblich Männlich Kinder Schoko Schoko Erwachsene Erdbeere Vanille Für jede Person, von der Alter und Geschlecht bekannt sind, kann das Lieblingseis geschätzt werden Als Vorhersage-Modell Alter und Geschlecht dienen als Prädiktoren Modell mit Befragungsdaten trainiert Alter Modell w/m Mit diesem Modell könnte eine Datenbank um die Variable Lieblingseis ergänzt werden Database Enrichment Lieblingseis
7 Database Enrichment DATENBANK BIG DATA : Verhalten, Beschreibung MARKTFORSCHUNG: Einstellung, Meinung
8 Database Enrichment Modell erstellen DATENBANK BIG DATA : Verhalten, Beschreibung MARKTFORSCHUNG: Einstellung, Meinung Modell anwenden MODELL- VORHERSAGEN
9 repräsentativ Database Enrichment externe Daten z.b. Panel DATENBANK BIG DATA : Verhalten, Beschreibung MARKTFORSCHUNG: Datenbank-Variablen Einstellung, Meinung
10 Database Enrichment externe Daten z.b. Panel Modell erstellen DATENBANK BIG DATA : Verhalten, Beschreibung MARKTFORSCHUNG: Datenbank-Variablen Einstellung, Meinung Modell anwenden MODELL- VORHERSAGEN
11 Verfahren: Predictive Analytics Intuitives Verfahren: k-nearest-neighbors Verknüpfung der Fälle, die einander in den Prädiktoren am ähnlichsten sind Was heißt k? Nicht nur der ähnlichste Fall, sondern die k nächsten Nachbarn Schätzung: Mittelwert, Mehrheit der Nachbarn Klassische Verfahren Diskriminanzanalyse: lineare Trennung zwischen den Klassen Lineare Regression: lineare Funktion, um eine kontinuierliche Zielvariable zu beschreiben Machine Learning Überwachtes maschinelles Lernen Trainingsdatensatz mit vollständigen Fällen Komplexere Verfahren, die Wechselwirkungen und Nicht-Linearitäten besser abbilden können Entscheidungsbäume Neuronale Netze Support-Vector-Machines
12 Machine Learning: Entscheidungsbäume Fälle werden hierarchisch in Gruppen aufgeteilt Alle Ein Prädiktor je Teilung X < 10 X > 10 Random Forest Viele Bäume mit zufällig gewählten Prädiktoren Y = A, C Y = B Z < 0 Z > 0 Ergebnis: Mehrheit/Mittelwert der Bäume Boosted Trees Aufeinander aufbauende Entscheidungsbäume Jeder Baum versucht, die Schwächen des vorherigen auszugleichen Vor- und Nachteile + z.t. inhaltlich interpretierbar + Kann mit fehlenden Werten umgehen + Kann mit verschiedenen Skalenniveaus umgehen Splits orthogonal: Problem bei starken Abhängigkeiten zwischen Prädiktoren
13 Prädiktoren Hidden Layer Zielvariable Machine Learning: Neuronale Netze Feed-forward Perceptron Netzwerk aus Neuronenschichten 1. Schicht: Prädiktoren Letzte Schicht: Zielvariable Dazwischen: Hidden Layers Reize nur an Neuronen der nächsten Schicht Ein Hidden Layer ausreichend für sehr viele Anforderungen Lernprozess: Anpassen der Stärke, mit der ein Reiz an das folgende Neuron weitergegeben wird ( Gewicht ) In letzter Zeit wieder populärer: Deep Learning mit vielen Hidden Layers Vor- und Nachteile + Können sehr komplexe Prozesse abbilden Black Box : Modelle nicht interpretierbar Nur kontinuierliche Prädiktoren Schwierig zu optimieren
14 ϕ2(x) X2 Machine Learning: Support Vector Machines (SVM) Suche nach Trennfläche zwischen Klassen, definiert durch Stützvektoren Maximaler Leerraum zwischen Klassen Nicht-linear durch Transformation ( Kernel-Trick ) Verschiedene Funktionen Effektiv: Projektion in höherdimensionalen Raum Lineare Trennung Eigentlich nur dichotome Klassifikation Erweiterbar für mehr als zwei Klassen oder kontinuierliche Zielvariable Vor- und Nachteile + Mathematisch elegant + Art der Nicht-Linearität steuerbar Black Box : Modelle nicht interpretierbar Nur kontinuierliche Prädiktoren X1 ϕ1(x) Transformation
15 Welches Verfahren ist das beste? Keine allgemeingültige Antwort Hängt von vielen Faktoren ab: Was ist die Aufgabenstellung? Welche Anforderungen gibt es? Wie sind die Daten? Komplexität Fallzahl Geringe Fallzahl kann zu großen Fluktuationen führen Einfache Modelle stabiler Das Modell sollte nicht komplexer sein als das Problem Lineare Zusammenhänge werden am besten von linearen Modellen erklärt Fehlende Werte Fehlende Werte in wichtigen Prädiktoren? Imputation sinnvoll? Manche Modelle können mit fehlenden Werten umgehen Prädiktoren Anzahl und Skalenniveaus Wechselwirkungen zwischen den Prädiktoren Verteilung der Information auf die Prädiktoren Best Practice Testen und vergleichen
16 Fallbeispiele Illustration anhand von zwei Fallbeispielen Reine Befragungen mit jeweils hohen Fallzahlen Aufteilung in Datenbank- und Marktforschungsdaten nachträglich Fälle: zufällig, wiederholt Variablen: typisch Die Ergebnisse der Verfahren können wirklich getestet werden Allerdings: keine echten Verhaltensdaten 1. Der Schuh-Händler Fälle Segmentierung Kategorische Zielvariable: Klassifikation 2. Der Event-Veranstalter Fälle Zufriedenheits-Score Kontinuierliche Zielvariable: Regression
17 1. Fallbeispiel: Der Schuh-Händler Ergebnis der Befragung: Kundentypisierung Einstellung zu Schuhen, Kleidung und Mode 5 Segmente: Praktisch, modebewusst, experimentierfreudig, Ziel der Analyse Individuelle Ansprache zugeschnitten auf den Kundentyp, Sonderangebote, Prädiktoren Präferenzen zu konkreten Schuhmodellen Schuhgröße Alter, Körpergröße, Körpergewicht In einer realen Situation könnten weitaus mehr Informationen vorliegen, sofern Befragte aus Datenbank entnommen Bisherige Einkäufe Reklamationen, Bewertungen Klickverhalten im Webshop
18 Der Schuh-Händler: Test-Setup Fallzahl: Testen aller Modelle mit verschiedenen Fallzahlen Fluktuationen: Wiederholte Aufteilung der Fälle in Befragungs- und Datenbankdaten Test Cluster- Analyse Übertrag anhand der Befragungsvariablen Prognose anhand der Datenbankvariablen Durch Übertrag ist der wahre Kunden-Typ für alle Fälle bekannt Übertrag nur möglich, da alle Daten aus der Befragung Dadurch können Modelle tatsächlich getestet werden
19 Der Schuh-Händler: Modell-Güte Erwartbare Güte Bei 5 gleichgroßen Segmenten wird 1/5 der Fälle (20%) per Zufall richtig zugeordnet Trennschärfe der Segmente Lässt sich jeder Kunde eindeutig einem Segment zuordnen? Prognose kann nicht genauer sein, als die Segmente selbst Gütemaße Klassifikation Trefferquote: Anteil der richtigen Prognosen an allen Fällen Problem bei verschieden großen Gruppen Cohens Kappa Setzt die erreichte Trefferquote ins Verhältnis zum Zufall Fälle zufällig zugeordnet κ = 0 Alle Fälle in der Mehrheitsklasse κ = 0 Alle Fälle richtig zugeordnet κ = 1 Zuordnung schlechter als zufällig κ < 0
20 Der Schuh-Händler: Ergebnis
21 Der Schuh-Händler: Bestimmung der Güte Wie gut sind die Prognosen? Muss in Realität aus den vorliegenden Daten geschätzt werden Hier konnte getestet werden, wie gut die Schätzung funktioniert Am Beispiel der Prognosen des SVM-Modells Differenz der geschätzten von der tatsächlichen Trefferquote Höhere Fallzahlen führen nicht nur zu besseren Modellen, die Modell-Qualität lässt sich auch besser abschätzen
22 2. Fallbeispiel: Der Event-Veranstalter Befragung der lokalen Partner im Anschluss an eine Veranstaltung Verschiedene Aspekte der Zufriedenheit Zusammengefasst in einem Score Ziel der Analyse Individuelle Ansprache, Gestaltung der weitere Zusammenarbeit Prävention von Unzufriedenheit Prädiktoren Art der Veranstaltung Charakteristika der Partnerschaft Branche, Charakteristika des Partnerunternehmens Gütemaß Regression Bestimmtheitsmaß R 2 Quadrat der Korrelation zwischen den wahren und der vorhergesagten Werten Anteil erklärte Varianz Alle Fälle exakt vorhergesagt R 2 = 1 Zufällige Prognosen R 2 = 0
23 Der Event-Veranstalter: Ergebnis
24 Der Event-Veranstalter: Ergebnis
25 Der Event-Veranstalter: Ergebnis-Einordnung Bestes Modell: R 2 = 0.2 Ein Fünftel der Varianz des Zufriedenheits-Scores kann durch das Modell erklärt werden Gut genug? Was steckt in den Daten? Geht es besser? Hängt von Fragestellung und Anforderungen ab Bsp.: spezielles Angebot um möglicher Unzufriedenheit entgegenzuwirken Angebot an ein Viertel der Partner: 50% der Unzufriedenen können erreicht werden
26 Ausblick Feature Selection Auswahl der Prädiktoren für ein Modell Optimierung des Modells Vereinfachung des Modells Meta-Learning Statt eines Modells eine Kombination mehrerer Modelle Verknüpfung der Ergebnisse einzelner Modelle zu einem Gesamtergebnis Vorhersagen eines oder mehrerer Modelle als (zusätzliche) Prädiktoren für ein finales Modell verwenden Real-Life-Test Tatsächlicher Effekt durch Anreicherung der Daten im echten Leben Bsp. Mailing: Kann die Response-Rate tatsächlich erhöht werden? Test-Gruppe als Vergleich
27 Fazit Marktforschung kann Big Data um eine neue Qualität ergänzen. Data Mining kann Marktforschung nicht ersetzen, wohl aber dazu beitragen, dass Marktforschungsdaten im Big-Data-Umfeld genutzt werden können. Mit Machine-Learning-Algorithmen können Erkenntnisse aus der Marktforschung z.b. mit CRM-Daten verknüpft werden. Die Modelle müssen sorgsam erstellt und validiert werden. Informationserhaltung: Was in den Daten nicht drinsteckt, kann man auch nicht rausholen. Wofür braucht Big Data die Marktforschung? Um zu lernen, wie von den Eigenschaften und dem Verhalten eines Kunden auf dessen Einstellung zu schließen ist.
28
SKOPOS Webinar 22. Mai 2018
SKOPOS Webinar 22. Mai 2018 Marktforschung 2020: Künstliche Intelligenz und automatische Text Analysen? Christopher Harms, Consultant Research & Development 2 So? Terminator Exhibition: T-800 by Dick Thomas
MehrGlobale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten
Globale und Individuelle Schmerz-Klassifikatoren auf Basis relationaler Mimikdaten M. Siebers 1 U. Schmid 2 1 Otto-Friedrich-Universität Bamberg 2 Fakultät für Wirtschaftsinformatik und Angewandte Informatik
MehrModellierung mit künstlicher Intelligenz
Samuel Kost kosts@mailbox.tu-freiberg.de Institut für Numerische Mathematik und Optimierung Modellierung mit künstlicher Intelligenz Ein Überblick über existierende Methoden des maschinellen Lernens 13.
MehrStatistisches Analyseverfahren
Zusatzmaterial zum Beitrag Evers, O. und Schröder, P. (2018). One size fits all? Die Eignung von Risikoscreenings zur Prognose der Inanspruchnahme von Angeboten der Frühen Hilfen. Praxis der Kinderpsychologie
MehrVergleich von SVM und Regel- und Entscheidungsbaum-Lernern
Vergleich von SVM und Regel- und Entscheidungsbaum-Lernern Chahine Abid Bachelor Arbeit Betreuer: Prof. Johannes Fürnkranz Frederik Janssen 28. November 2013 Fachbereich Informatik Fachgebiet Knowledge
MehrKlassifikation und Ähnlichkeitssuche
Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell
MehrData Science Marktforschung
Data Science Marktforschung Webinar 12. Juli 2018 Wie Data Science die Marktforschung verändert Christopher Harms, Consultant Research & Development Klassische Marktforschungsprojekte sind fokussiert auf
MehrFeature Selection / Preprocessing
1 Feature Selection / Preprocessing 2 Was ist Feature Selection? 3 Warum Feature Selection? Mehr Variablen führen nicht automatisch zu besseren Ergebnissen. Lernen von unwichtigen Daten Mehr Daten notwendig
MehrViele Fragen? Und doch kurze Interviews! Über Modularisierung und Data Mining. Institut für angewandte Datenanalyse GmbH
Viele Fragen? Und doch kurze Interviews! Über Modularisierung und Data Mining Julia Georgi Frank Zander Institut für angewandte Datenanalyse GmbH Institut für angewandte Datenanalyse GmbH Institut für
MehrInstitut für angewandte Datenanalyse GmbH
Institut für angewandte Datenanalyse GmbH Latent Class Cluster Analysen (LCCA) Was erwartet Sie nachfolgend? Einführung Klassifizierung der Segmentierungs-Verfahren Case Study Urlaubsreisen Das Prinzip
MehrTesttheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität
Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch
MehrKann SAS Ihre Handschrift lesen? Machine Learning am Beispiel von Stacked Denoising Autoencoders
Kann SAS Ihre Handschrift lesen? Machine Learning am Beispiel von Stacked Denoising Autoencoders Gerhard Svolba SAS Austria Mariahilfer Straße 116 A-1070 Wien Sastools.by.gerhard@gmx.net Zusammenfassung
MehrNeuronale Netze. Christian Böhm.
Ludwig Maximilians Universität München Institut für Informatik Forschungsgruppe Data Mining in der Medizin Neuronale Netze Christian Böhm http://dmm.dbs.ifi.lmu.de/dbs 1 Lehrbuch zur Vorlesung Lehrbuch
MehrVorlesung Digitale Bildverarbeitung Sommersemester 2013
Vorlesung Digitale Bildverarbeitung Sommersemester 2013 Sebastian Houben (Marc Schlipsing) Institut für Neuroinformatik Inhalt Crash-Course in Machine Learning Klassifikationsverfahren Grundsätzliches
MehrPredictive Analytics. Warum datenbasierte Vorhersagen kein Hexenwerk sind. ASQF Automation Day Dr. Stefano Signoriello
Predictive Analytics Warum datenbasierte Vorhersagen kein Hexenwerk sind Dr. Stefano Signoriello Seite 1 Inhalte des Vortrags Analytics Von Daten zu Wissen Von Nachsicht über Einsicht zu Voraussicht Descriptive,
MehrDer Sprung in die Zukunft! Einführung in neuronale Netzwerke
Der Sprung in die Zukunft! Einführung in neuronale Netzwerke Inhalt 1. Warum auf einmal doch? 2. Welche Einsatzgebiete gibt es? 3. Was sind neuronale Netze und wie funktionieren sie? 4. Wie lernen neuronale
MehrKlausurvorbereitung - Statistik
Aufgabe 1 Klausurvorbereitung - Statistik Studenten der Politikwissenschaft der Johannes Gutenberg-Universität wurden befragt, seit wie vielen Semestern sie eingeschrieben sind. Berechnen Sie für die folgenden
MehrFrequent Itemset Mining + Association Rule Mining
Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,
MehrBig Data - und nun? Was kann die Bioinformatik?
Big Data - und nun? Was kann die Bioinformatik? Jochen Kruppa Institut für Biometrie und Klinische Epidemiologie jochenkruppa@charitede 1 59 Vorstellung Wer spricht heute zu Ihnen? Studium der Pflanzenbiotechnologie
MehrJens Schmidt Senior Member Technical Staff
Jens Schmidt Senior Member Technical Staff Oracle 9i Data Mining Connector 1.1 für mysap BW Agenda Data Mining Grundlagen Der Data Mining Prozess Oracle Data Mining Integration mit mysap BW Agenda Data
MehrHuman-machine learning im Bereich Soccer Analytics Vergleich verschiedener Prognoseansätze am Beispiel Fußball
Human-machine learning im Bereich Soccer Analytics Vergleich verschiedener Prognoseansätze am Beispiel Fußball Bachelorthesis von Jonas Birk Betreuer: Prof. Dr. Hendrik Meth Zweitbetreuer: Prof. Dr. Peter
MehrBusiness Analytics Day Predictive Sales in CRM
Business Analytics Day Predictive Sales in CRM Business Analytics Day 07.03.2019 Artur Felic, CAS Software AG in Zahlen CAS Software AG eine Netzwerkorganisation Jedem Kunden seine CAS CAS Mittelstand:
MehrSupport Vector Machines (SVM)
Universität Ulm 12. Juni 2007 Inhalt 1 2 3 Grundlegende Idee Der Kern-Trick 4 5 Multi-Klassen-Einteilung Vor- und Nachteile der SVM 1 2 3 Grundlegende Idee Der Kern-Trick 4 5 Multi-Klassen-Einteilung Vor-
MehrBusiness Analytics. Aktuelle Methoden und Werkzeuge im Zeitalter der Digitalisierung. Business Analytics
Aktuelle Methoden und Werkzeuge im Zeitalter der Digitalisierung Workshop für Führungskräfte (Gesamtheitlicher Überblick) mit Excel 2019 mit R Workshop für Führungskräfte (Gesamtheitlicher Überblick) Chancen
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Niels Landwehr, Jules Rasetaharison, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische
MehrCase-Based Reasoning und anderen Inferenzmechanismen
Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining
MehrTextmining Klassifikation von Texten Teil 2: Im Vektorraummodell
Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrData Mining Kapitel 11: Machine Learning. Johannes Zschache Wintersemester 2018/19
Data Mining Kapitel 11: Machine Learning Johannes Zschache Wintersemester 2018/19 Abteilung Datenbanken, Universität Leipzig http://dbs.unileipzig.de Data Mining 111 112 Data Mining Übersicht Hochdimension.
MehrCD-AUSGABE (Stand: 1999) HANDBUCH KURSPROGNOSE Quantitative Methoden im Asset Management von Thorsten Poddig 676 Seiten, Uhlenbruch Verlag, 1999 erstmals als Buch publiziert EUR 79,- inkl. MwSt. und Versand
MehrELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK
DIETER RASCH ELEMENTARE EINFÜHRUNG IN DIE MATHEMATISCHE STATISTIK MIT 53 ABBILDUNGEN UND 111 TABELLEN ZWEITE, BERICHTIGTE UND ERWEITERTE AUFLAGE s-~v VEB DEUTSCHER VERLAG DER WISSENSCHAFTEN BERLIN 1970
MehrSupervised & Unsupervised Machine Learning
Machine Learning-Algorithmen in Python mit scikit-learn Machine Learning-Algorithmen in Python mit scikit-learn Kurzbeschreibung Machine Learning-Algorithmen sind ein elementares Element von Künstlicher
MehrOPT Optimierende Clusteranalyse
Universität Augsburg Fakultät für angewandte Informatik Lehrstuhl für Physische Geographie und Quantitative Methoden Übung zum Projektseminar: Wetterlagen und Feinstaub Leitung: Dr. Christoph Beck Referentin:
MehrMachine Learning. Dr. Bartholomäus Wissmath 3. Swiss Innovation Day
Machine Learning Dr. Bartholomäus Wissmath 3. Swiss Innovation Day Artificial Intelligence (AI) Teilgebiet der Informatik, welches sich mit der Automatisierung von intelligenten Verhalten und dem Maschinenlernen
MehrPrognose von Kostenschwankungen mit Predictive Analytics DOAG 2016
Prognose von Kostenschwankungen mit Predictive Analytics DOAG 2016 CGI Deutschland Ltd. & Co. KG (Sulzbach) Alfred Stelzl (Lead Consultant Big Data Analytics) November 2016 CGI Group Inc. Agenda 2 Agenda
MehrWie beurteilen Studierende computergestützte Prüfungen? Erste Ergebnisse der Evaluation der E-Examinations an der Freien Universität Berlin
Wie beurteilen Studierende computergestützte Prüfungen? Erste Ergebnisse der Evaluation der E-Examinations an der Freien Universität Berlin Dr. Susanne Bergann Arbeitsstelle Lehr- und Studienqualität Fachbereich
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
Mehr2. Datenvorverarbeitung
Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy
MehrValidation Model Selection Kreuz-Validierung Handlungsanweisungen. Validation. Oktober, von 20 Validation
Validation Oktober, 2013 1 von 20 Validation Lernziele Konzepte des maschinellen Lernens Validierungsdaten Model Selection Kreuz-Validierung (Cross Validation) 2 von 20 Validation Outline 1 Validation
MehrData Mining - Wiederholung
Data Mining - Wiederholung Norbert Fuhr 18. Januar 2006 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)
MehrMathematische Grundlagen III
Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten
MehrInhalt. 4.1 Motivation. 4.2 Evaluation. 4.3 Logistische Regression. 4.4 k-nächste Nachbarn. 4.5 Naïve Bayes. 4.6 Entscheidungsbäume
4. Klassifikation Inhalt 4.1 Motivation 4.2 Evaluation 4.3 Logistische Regression 4.4 k-nächste Nachbarn 4.5 Naïve Bayes 4.6 Entscheidungsbäume 4.7 Support Vector Machines 4.8 Neuronale Netze 4.9 Ensemble-Methoden
MehrVorwort... V. Abbildungsverzeichnis... XIII. 1. Überblick über die behandelten Problembereiche... 3
Inhaltsverzeichnis Vorwort... V Abbildungsverzeichnis... XIII 1. Überblick über die behandelten Problembereiche... 3 2. Aufgaben und wissenschaftstheoretische Grundzüge der Marktforschung... 9 2.1. Klassische
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen
Universität Potsdam Institut für Informatik Lehrstuhl Niels Landwehr, Silvia Makowski, Christoph Sawade, Tobias Scheffer Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Übung: Di 10:00-11:30
MehrEine Einführung in R: Hochdimensionale Daten: n << p Teil II
Eine Einführung in R: Hochdimensionale Daten: n
MehrLernzielkatalog für das Modul Einführung in die Wissenschaftstheorie
Lernzielkatalog für das Modul Einführung in die Wissenschaftstheorie Die im Folgenden angegebenen Kapitel und Seitenzahlen beziehen sich auf diese Lernquelle: Helfrich, Hede: Wissenschaftstheorie für Betriebswirtschaftler,
MehrDeep Learning Prof. Dr. E. Rahm und Mitarbeiter
Deep Learning Prof. Dr. E. Rahm und Mitarbeiter Seminar, WS 2017/18 Big Data Analyse-Pipeline Dateninte -gration/ Anreicherung Datenextraktion / Cleaning Datenbeschaffung Datenanalyse Interpretation Volume
MehrBACKPROPAGATION & FEED-FORWARD DAS MULTILAYER PERZEPTRON
BACKPROPAGATION & FEED-FORWARD DAS MULTILAYER PERZEPTRON EINFÜHRUNG IN KÜNSTLICHE NEURONALE NETZE Modul Leitung Technischer Datenschutz und Mediensicherheit Nils Tekampe Vortrag Jasmin Sunitsch Abgabe
MehrRidge Regression und Kernalized Support Vector Machines : Einführung und Vergleich an einem Anwendungsbeispiel
Ridge Regression und Kernalized Support Vector Machines : Einführung und Vergleich an einem Anwendungsbeispiel Dr. Dominik Grimm Probelehrveranstaltung Fakultät für Informatik und Mathematik Hochschule
MehrArtificial Intelligence. Was ist das? Was kann das?
Artificial Intelligence Was ist das? Was kann das? Olaf Erichsen Tech-Day Hamburg 13. Juni 2017 Sehen wir hier bereits Künstliche Intelligenz (AI)? Quelle: www.irobot.com 2017 Hierarchie der Buzzwords
MehrJetzt mitmachen: CASA Monitor B2C Finanzen. Multi Client-Studie zum deutschen Finanzmarkt auf Basis der Befragung von 2.
Zahlreiche unverzichtbare Marketing-Insights zu þ Beliebten Anlageformen, þ Kreditarten und -gebern, þ Banken und Wechselverhalten, þ Online-/Of ine-zahlungsverhalten, þ Immobilien: Besitz und Investition,
MehrDecision-Tree-Klassifikator
D3kjd3Di38lk323nnm Decision-Tree-Klassifikator Decision Trees haben einige Vorteile gegenüber den beiden schon beschriebenen Klassifikationsmethoden. Man benötigt in der Regel keine so aufwendige Vorverarbeitung
MehrINTELLIGENTE DATENANALYSE IN MATLAB
INTELLIGENTE DATENANALYSE IN MATLAB Einführungsveranstaltung Überblick Organisation Literatur Inhalt und Ziele der Vorlesung Beispiele aus der Praxis 2 Organisation Vorlesung/Übung + Projektarbeit. 4 Semesterwochenstunden.
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)
Aufgabe 3 (9 + 5 + 7 + 7 + 3 + 9 + 7 + 10 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Zu Beginn der Studienjahre 2011 und 2012 wurden Studienanfänger an
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
Mehr2.2. Wissenschaftstheoretische Grundzüge der Gewinnung von Erkenntnissen über Märkte 10
Vorwort V Abbildungsverzeichnis XIII 1. Überblick über die behandelten Problembereiche 3 2. Aufgaben und wissenschaftstheoretische Grundzüge der Marktforschung 9 2.1. Klassische Aufgaben der Marktforschung
MehrWir haben in den vorherigen Kapiteln verschiedene Verfahren zur Regression und Klassifikation kennengelernt (z.b. lineare Regression, SVMs)
6. Neuronale Netze Motivation Wir haben in den vorherigen Kapiteln verschiedene Verfahren zur Regression und Klassifikation kennengelernt (z.b. lineare Regression, SVMs) Abstrakt betrachtet sind alle diese
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrDISSERTATION. Nichtlineare Analyse und Klassifikation von instationären Biosignalen mit Anwendung in der Kognitionsforschung
Technische Universität Ilmenau DISSERTATION Nichtlineare Analyse und Klassifikation von instationären Biosignalen mit Anwendung in der Kognitionsforschung zur Erlangung des akademischen Grades Doktor-Ingenieur
MehrEinsatz von Alterungsmodellen zur Prognose der Zustandsentwicklung von Abwasserkanälen. Nicolas Caradot, Hauke Sonnenberg, Pascale Rouault
Einsatz von Alterungsmodellen zur Prognose der Zustandsentwicklung von Abwasserkanälen Nicolas Caradot, Hauke Sonnenberg, Pascale Rouault Warum ein Kanalalterungsmodell? TV-Inspektion Manuell (Betreiber)
MehrKapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen.
Kapitel 5 Prognose Josef Leydold c 2006 Mathematische Methoden V Prognose 1 / 14 Lernziele Aufgabe der Prognose Problemtypen Ablauf einer Prognoseaufgabe Zeitreihe Josef Leydold c 2006 Mathematische Methoden
MehrVorlesung. Data und Web Mining. Kurzinformation zur. Univ.-Prof. Dr. Ralph Bergmann. Lehrstuhl für Wirtschaftsinformatik II
Kurzinformation zur Vorlesung Data und Web Mining Univ.-Prof. Dr. Ralph Bergmann www.wi2.uni-trier.de - I - 1 - Die Ausgangssituation (1) Unternehmen und Organisationen haben enorme Datenmengen angesammelt
MehrData Mining und maschinelles Lernen
Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:
MehrBiometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern
Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem
MehrH E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z
H E R Z L I C H W I L L K O M M E N Z U R D O A G K O N F E R E N Z 2 0 1 6 A D V A N C E D A N A L Y T I C S : V O N S E M I - S T R U K T U R I E R T E N D A T E N Z U W I S S E N T O M S E I D E L &
MehrWeitere Untersuchungen hinsichtlich der Anwendung von KNN für Solvency 2. Tom Schelthoff
Weitere Untersuchungen hinsichtlich der Anwendung von KNN für Solvency 2 Tom Schelthoff 30.11.2018 Inhaltsverzeichnis Deep Learning Seed-Stabilität Regularisierung Early Stopping Dropout Batch Normalization
MehrAnalytics Der Weg zu datengetriebenen Geschäftsprozessen
Analytics Der Weg zu datengetriebenen Geschäftsprozessen Dr.-Ing. Philipp Gölzer 1 Ziel der Digitalisierung ist die Realisierung datengetriebener Geschäfts-/Entscheidungsprozesse Ziele Höhere Qualität
MehrBig Data und die Energiewende: Kann man genug Daten haben?
Big Data und die Energiewende: Kann man genug Daten haben? Malek Alouini Fachgespräch BigData Konzepte zur Analyse komplexer Infrastrukturen 16. Mai 2017 Was ist Big Data? Technologien zur Verarbeitung
MehrEntscheidungsbäume aus großen Datenbanken: SLIQ
Entscheidungsbäume aus großen Datenbanken: SLIQ C4.5 iteriert häufig über die Trainingsmenge Wie häufig? Wenn die Trainingsmenge nicht in den Hauptspeicher passt, wird das Swapping unpraktikabel! SLIQ:
MehrMaschinelles Lernen und Data Mining
Semestralklausur zur Vorlesung Maschinelles Lernen und Data Mining Prof. J. Fürnkranz / Dr. G. Grieser Technische Universität Darmstadt Wintersemester 2004/05 Termin: 14. 2. 2005 Name: Vorname: Matrikelnummer:
MehrAlgorithmische Modelle als neues Paradigma
Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN
MehrMethoden zur Cluster - Analyse
Kapitel 4 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics
MehrÜber die Autoren 7 Widmung 8 Danksagung 9. Einführung 21
Inhaltsverzeichnis Über die Autoren 7 Widmung 8 Danksagung 9 Einführung 21 Über dieses Buch 21 Einige törichte Annahmen 22 In diesem Buch verwendete Symbole 22 Über dieses Buch hinaus 23 Wie es weitergeht
MehrW09 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung
Der Verhältnisschätzer - Ratio estimator Beispiel: Schätzung der Anzahl Objekte (Bäume) in einem bestimmten Gebiet. Situation: Die Fläche ist unterteilt in Streifen / Transekte. Man wählt zufällig n =
MehrINTEGER Visuelle Entscheidungsunterstützung bei der Auswertung von Daten aus sozialen Netzwerken
INTEGER Visuelle Entscheidungsunterstützung bei der Auswertung von Daten aus sozialen Netzwerken BMBF-Innovationsforum Zivile Sicherheit Berlin Megatrends verändern das Arbeitsumfeld für Analysten (1/2)
MehrMarco Dohle & Gerhard Vowe. Mediatisierung aus subjektiver Sicht. Untersuchungen zur Einschätzung der politischen Relevanz von Medien.
Marco Dohle & Gerhard Vowe Mediatisierung aus subjektiver Sicht. Untersuchungen zur Einschätzung der politischen Relevanz von Medien. MLFZ-Workshop Köln, 18.-20. November 2010 Fragestellung Welche politische
MehrEntwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion
Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der
MehrWas ist, kann und darf Deep Learning? Dr. Beat Tödtli Laboratory for Web Science
Was ist, kann und darf Deep Learning? Dr. Beat Tödtli Laboratory for Web Science 15.12.2017 Suchinteresse 15.12.2017 Was ist, kann und darf Deep Learning? 2 Google Trends für Deep Learning ILSVRC 2012:
MehrLineare Regression 2: Gute Vorhersagen
Lineare Regression 2: Gute Vorhersagen Markus Kalisch 23.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2,
Mehrinsara: Hierarchische Netzwerke zur Analyse, Visualisierung und Vorhersage von Struktur-Aktivitäts-Beziehungen
insara: Hierarchische Netzwerke zur Analyse, Visualisierung und Vorhersage von Struktur-Aktivitäts-Beziehungen Von der Fakultät für Lebenswissenschaften der Technischen Universität Carolo-Wilhelmina zu
MehrWilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz
Wilhelm Nüsser (Hrsg.) Carsten Weigand (Hrsg.) Raphael Fockel (Autor) Methoden des Data Mining im praktischen Einsatz FHDW-Fachbericht Band 1/2009 Raphael Fockel Wilhelm Nüsser (Hrsg.) Carsten Weigand
MehrEchtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung , Dr.-Ing. Steffen Herbort, A.R.T. GmbH
Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung 26.10.2016, TP 2: Arbeiten von A.R.T. TP2: Tracking und Umfelderkennung Markerloses Tracking texturierte Objekte Umfelderkennung
MehrBusiness Intelligence & Machine Learning
AUSFÜLLHILFE: BEWEGEN SIE DEN MAUSZEIGER ÜBER DIE ÜBERSCHRIFTEN. AUSFÜHRLICHE HINWEISE: LEITFADEN MODULBESCHREIBUNG Business Intelligence & Machine Learning Kennnummer Workload Credits/LP Studiensemester
MehrKonzepte der AI Neuronale Netze
Konzepte der AI Neuronale Netze Franz Wotawa Institut für Informationssysteme, Database and Artificial Intelligence Group, Technische Universität Wien Email: wotawa@dbai.tuwien.ac.at Was sind Neuronale
Mehrlimhatewerzeoelhiniii
limhatewerzeoelhiniii Vorwort 13 Kapitel 1 Einleitung 15 1.1 Wozu brauchen wir Statistik? 16 1.2 Medizinische Statistik 16 1.3 Beschreibende und schließende Statistik 17 1.4 Das Buch in Kürze 17 Kapitel
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Grundlagen 1 1.1 Einleitung 1 1.2 Grundbegriffe 2 1.2.1 Systemgrenzen 3 1.2.2 Qualitätsmerkmal 4 1.2.3 Parameter und Faktoren 5 1.2.4 Stufen 6 1.2.5 Vergleich zu traditionellen Verfahren 6 1.3 Auswertung
MehrMaschinelle Sprachverarbeitung Übung
Maschinelle Sprachverarbeitung Übung Aufgabe 3: SPAM-Klassifikation Mario Sänger Aufgabe Rund 50% des weltweiten Email-Verkehrs ist Spam* Spam- und Phishing-Mails stellen eines der größten Sicherheitsrisiken
Mehr5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
MehrKünstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer?
ASQF Automation Day 2018 - Predictive Analytics Künstliche Intelligenz im Maschinen- und Anlagenbau Heilsbringer oder Hypebringer? Vasilij Baumann Co-Founder/Co-CEO vasilij.baumann@instrunext.com +49 931
MehrStandardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrVon der Marktforschung zur Wertforschung
Von der Marktforschung zur Wertforschung understanding minds Was tun wir? Seite 2 1 Erklärungsversuche 1. Wir befragen Menschen 2. Wir generieren daraus Informationen, die dem Unternehmen Mehrwert bringen.
MehrDer diskrete Kalman Filter
Der diskrete Kalman Filter Fachbereich: Informatik Betreuer: Marc Drassler Patrick Winkler 1168954 6. Dezember 2004 Technische Universität Darmstadt Simulation und Systemoptimierung Darmstadt Dribbling
MehrStichwortverzeichnis. E Extrapolation, außerhalb des Datenbereichs 230
335 Stichwortverzeichnis A Abweichung 12 mittlere 13 Additivität 141 Anova siehe Varianzanalyse Anpassungsgüte 252, 279 χ 2 -Test zur 270 279 mehr als zwei Klassen 272 274 Anpassungstest (χ 2 ) 270 278
MehrData Mining und Statistik: Gemeinsamkeiten und Unterschiede. Daniel Meschenmoser
Data Mining und Statistik: Gemeinsamkeiten und Unterschiede Daniel Meschenmoser Übersicht Gemeinsamkeiten von Data Mining und Statistik Unterschiede zwischen Data Mining und Statistik Assoziationsregeln
MehrData Mining Künstliche Neuronale Netze vs. Entscheidungsbäume
Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Maschinelles Lernen. Tobias Scheffer Michael Brückner
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Tobias Scheffer Michael Brückner Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Übung: Mo 10:00-11:30
MehrPPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.
PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt
MehrFlorian Keller. Strukturelle Faktoren. des Bildungserfolgs. Wie das Bildungssystem den. Übertritt ins Berufsleben bestimmt.
Florian Keller Strukturelle Faktoren des Bildungserfolgs Wie das Bildungssystem den Übertritt ins Berufsleben bestimmt 4^ Springer VS Inhalt 1 Einleitung 11 1.1 Theoretischer Zugang, Forschungsstand und
Mehr