Algorithmische Modelle als neues Paradigma

Größe: px
Ab Seite anzeigen:

Download "Algorithmische Modelle als neues Paradigma"

Transkript

1 Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar / 29

2 LEO BREIMAN geb: 27.Januar 1928, gest: 5.Juli 2005 Sohn europäischer Einwanderer Studium der Physik und Mathematik Professor für Wahrscheinlichkeitstheorie (zu seiner Zeit einer der wenigen) Verließ die Universität zeitweise und arbeitet als statistischer Berater 2 / 29

3 y nature x Data Modeling Culture Algorithmic Modeling Culture y Lineare Regression Logistische Regression Cox Regression x y unbekannt x Entscheidungsbäume Neuronale Netze Modelüberprüfung Anpassungsgüte Überprüfung der Residuen -> 98% der Statistiker Modelüberprüfung Messung der Vorhersagegenauigkeit -> 2% der Statistiker 3 / 29 Abbildungen aus: Statistical Science2001, Vol. 16, No. 3,

4 Data Modeling führt zu schnell zu: fragwürdigen Schlussfolgerungen hält Benutzer von anwenderfreundlichen algorithmischen Modellen ab versperrt Statistikern neue Bereiche die Fragestellung orientiert sich zu stark an den Modellen und zu wenig an der Fragestellung an sich Beispiel am Ozonprojekt Ende der 69er Ozonwerte Drei Warnstufen Mitte 70 EPA sucht nach Vorhersage für die nächsten 12 Stunden Täglich/Stündlich mehr als 450 Variablen über 7 Jahre und den dazugehörenden Ozonwerten. 4 / 29

5 Breimans Anforderungen an die Statistik Assume that the data are generated by the following model: (a) Lösungsorientiertes arbeiten. (b) Datenbetrachtung vor der Modellwahl (c) Suche nach dem besten Modell (Beide Kulturen ) (d) Gütekriterium des Modells ist die Vorhersagegenauigkeit (e) Computer sind unverzichtbare Hilfsmittel 5 / 29

6 Data Modeling + Einfache Interpretierbarkeit Unterschiedliche Modelle führen zu unterschiedlichen Schlussfolgerunge über die Natur - Faced with an applied problem, think of a data model Schlussfolgerung anhand der Modellannahmen und nicht der Vorgaben der Natur Modell bildet Natur schlecht ab, führt zu fehlerhafter Schlussfolgerung 6 / 29 McCullah and Nelder (1989): Data will often point with almost equal emphasis on several possible models, and it is important that the statistician recognize and accept this.

7 Algorithmische Modelle Mitte der 80er Jahre wurden Algorithmen populär bei den Modellen waren waren Informatiker, Physiker und Ingenieure führend Ziel war eine hohe Vorhersagegenauigkeit Hauptaugenmerk: komplexe Modelle für die bisherige Verfahren nicht passten Spracherkennung Bilderkennung Handschrifterkennung Vorhersagen im Finanzbereich 7 / 29

8 Grundgedanken Data Modeling war in diesen Bereichen kaum verwendet worden Die Natur verarbeitet die Daten in einer Black Bock, deren Inhalt, mysteriös und oft unbekannt ist. Rashomon Occam Bellman 8 / 29

9 Rashomon Die besten 5 Variablen aus Kombinationen Problem auch bei Entscheidungsbäumen 9 / 29 Abbildungen aus: Statistical Science2001, Vol. 16, No. 3,

10 Occam Je einfacher desto besser Einfachheit vs. Genauigkeit Darstellung und Qualität Bäume einfach zu interpretieren Genauigkeit erst durch den Wald random forests 10 / 29 Abbildungen aus: Statistical Science2001, Vol. 16, No. 3,

11 Bellman Der Fluch der vielen Variablen Verringerung der Variablen ist Verringerung der Informationen Ziel: Viele (noch so kleine) Informationen mit einzubauen Der Segen der vielen Variablen 11 / 29

12 Konfrontation mit der Black Box y Natur x y Neuronale Netze Bäume x Inhalt oft unbekannt, komplex undurchschaubar Einfacher zu interpretieren Inhalt komplex Durchschaubarer schwieriger zu interpretieren Führt zu der Frage nach der Hautaufgabe des Modells? 12 / 29 Abbildungen aus: Statistical Science2001, Vol. 16, No. 3,

13 Beispiel Hepatitis 13 / 29 Abbildungen aus: Statistical Science2001, Vol. 16, No. 3,

14 Beispiel Hepatitis 14 / 29 Abbildungen aus: Statistical Science2001, Vol. 16, No. 3,

15 Klassifikations- und Regressions-Bäume 15 / 29

16 Klassifikations- und Regressions-Bäume Technik der Segmentierung sind Entscheidungsbäume Baumstruktur von Klassifikations- und Regressionsbäumen identisch y kategorial Klassifikation Die Werte sollten am Ende: innerhalb der Knoten möglichst homogen zwischen den Gruppen möglichst heterogen y stetig Regression Mittelwerte der Zielvariablen sollen sich stark unterscheiden Die Daten werden nach geeigneten Kriterien aufgeteilt 16 / 29

17 Gütekriterium Anforderungen an ein Maß zur Messung der Güte Heterogener Knoten = niedriges Maß Weitere Verzweigungen sollten damit auf ihre Güte messbar gemacht werden. 17 / 29

18 Splitkriterien Klassifikation Binäre Zielgröße Kategoriale Zielgröße Regression Stetige Zielgröße wobei p den Anteil der Klasse 1 im Knoten t beschreibt Gini Koeffizient Entropy Missklassifikationsfehler 18 / 29

19 Splitkriterien Klassifikation Binäre Zielgröße Kategoriale Zielgröße Regression Stetige Zielgröße wobei p den Anteil der Klasse 1 im Knoten t beschreibt Gini Koeffizient Entropy Missklassifikationsfehler 19 / 29 -> Erweiterung des binären Falls auf k Variablen mit 2 k-1-1 Splitmöglichkeiten.

20 Übersicht der Gütekriterien für die Heterogenität innerhalb der Knoten 20 / 29

21 Beispiel 400, ,400 Split anhand Variable A oder Split anhand Variable B 21 / 29

22 Beispiel 400, , , , , ,100 Missqualifikationsfehler: ¼ ¼ 2/5 1/3 gewichtet (300/800) ¼ +(100/800)* ¼ =1/8 = 0,125 (200/800)* 2/5 + (200/800)*1/3 = 11/60 = 0,1833 -> Die linke Aufteilung sollte hier gewählt werden. 22 / 29

23 Beispiel 400, , , , , ,0 Missqualifikationsfehler: ¼ ¼ ½ 0 gewichtet (300/800) ¼ +(100/800)* ¼ =1/8 (200/800)* ½ + 0 = 1/8 -> Nach dem Missqualifikationsfehler sind beide Aufteilungen hier äquivalent 23 / 29

24 Beispiel 400, , , , , ,0 Gini Index: 3/8 3/8 4/9 0 gewichtet (300/800) 3/8 +(100/800)* 3/8 =3/16 = 0,1875 (200/800)* 4/9 + 0 = 1/9 = 0,11 -> Nach dem Gini-Index ist die zweite Variante zu bevorzugen 24 / 29

25 Beispiel 400, , , , , ,0 Missqualifikationsfehler: =1/8 = 1/8 Gini-Index =3/16 = 0,1875 = 1/9 = 0,11 25 / 29 -> Missqualifikationsfehler führt in diesem Fall zum gleichen Ergebnis -> Gini-Index bevorzugt die 2. Auswahl, da ein reiner Knoten vorhanden ist.

26 Splitkriterien Klassifikation Binäre Zielgröße Kategoriale Zielgröße Regression Stetige Zielgröße Für y wird aus den Kovariablen ein Paar, bestehend aus einer Variablen und einem Splitpunkt gesucht, das folgendes Kriterium erfüllt: Die Minimierung wird berechnet durch: und somit das optimale Paar bestimmt. 26 / 29

27 Beispiel eines Regressionsbaumes 27 / 29

28 Vorgehensweise in der Praxis Aufteilung in Trainingsset und Testset Entscheidung ob binärer Split vs. multipler Split Bestimmung des Splitkriteriums pro Knoten Split sollte so gewählt werden, dass jeder Unterknoten homogener ist als der aktuelle Knoten Festlegung über Ende der Aufsplittung (Stoppkriterium) Überprüfung der Qualität des Baumes 28 / 29

29 Fazit Vorteile Einfache Interpretation Leicht anzuwenden (Black Box) Nonparametrisches Verfahren Große Anzahl an Variablen können einbezogen werden Nachteile Instabil bei Änderung des Trainingssets Gefahr von Overfitting Orientiert sich am Testdatensatz 29 / 29

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07

Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07 Regression Trees Methoden der Datenanalyse AI-basierte Decision Support Systeme WS 2006/07 Ao.Univ.Prof. Dr. Marcus Hudec marcus.hudec@univie.ac.at Institut für Scientific Computing, Universität Wien 2

Mehr

1 Predictive Analytics mit Random Forest

1 Predictive Analytics mit Random Forest Predictive Analytics Demokratie im Wald 1 Agenda 1. Predictive Analytics Übersicht 2. Random Forest Grundkonzepte und Anwendungsfelder 3. Entscheidungsbaum Classification and Regression Tree (CART) 4.

Mehr

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014 Lernen von Entscheidungsbäumen Volker Tresp Summer 2014 1 Anforderungen an Methoden zum Datamining Schnelle Verarbeitung großer Datenmengen Leichter Umgang mit hochdimensionalen Daten Das Lernergebnis

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Data Mining und maschinelles Lernen

Data Mining und maschinelles Lernen Data Mining und maschinelles Lernen Einführung und Anwendung mit WEKA Caren Brinckmann 16. August 2000 http://www.coli.uni-sb.de/~cabr/vortraege/ml.pdf http://www.cs.waikato.ac.nz/ml/weka/ Inhalt Einführung:

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Maschinelles Lernen Entscheidungsbäume

Maschinelles Lernen Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Paul Prasse Entscheidungsbäume Eine von vielen Anwendungen: Kreditrisiken Kredit - Sicherheiten

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Entscheidungsbäume

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Entscheidungsbäume Christoph Sawade/Niels Landwehr Jules Rasetaharison, Tobias Scheffer Entscheidungsbäume Eine von vielen Anwendungen:

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.

PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28. PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Explorative Datenanalyse EDA Auffinden von Strukturen

Mehr

Ludwig Maximilians Universität München. Seminar über Philosophische Grundlagen der Statistik WS 2010/11. Prof. Dr. Thomas Augustin.

Ludwig Maximilians Universität München. Seminar über Philosophische Grundlagen der Statistik WS 2010/11. Prof. Dr. Thomas Augustin. Ludwig Maximilians Universität München Seminar über Philosophische Grundlagen der Statistik WS 2010/11 Prof. Dr. Thomas Augustin Seminararbeit Algorithmische Modelle als neues Paradigma Vorgelegt von:

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung

Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten am Beispiel der Kreditwürdigkeitsprüfung Prof. Dr. Gerhard Arminger Dipl.-Ök. Alexandra Schwarz Bergische Universität Wuppertal Fachbereich Wirtschaftswissenschaft Fach Statistik Automatische Mustererkennung zur Klassifikation von Konsumentenverhalten

Mehr

Maschinelles Lernen Entscheidungsbäume

Maschinelles Lernen Entscheidungsbäume Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Christoph Sawade /Niels Landwehr/Paul Prasse Dominik Lahmann Tobias Scheffer Entscheidungsbäume

Mehr

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG

Data Mining mit der SEMMA Methodik. Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining mit der SEMMA Methodik Reinhard Strüby, SAS Institute Stephanie Freese, Herlitz PBS AG Data Mining Data Mining: Prozeß der Selektion, Exploration und Modellierung großer Datenmengen, um Information

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Künstliche Neuronale Netze und Data Mining

Künstliche Neuronale Netze und Data Mining Künstliche Neuronale Netze und Data Mining Catherine Janson, icasus GmbH Heidelberg Abstract Der Begriff "künstliche Neuronale Netze" fasst Methoden der Informationstechnik zusammen, deren Entwicklung

Mehr

Data Mining Anwendungen und Techniken

Data Mining Anwendungen und Techniken Data Mining Anwendungen und Techniken Knut Hinkelmann DFKI GmbH Entdecken von Wissen in banken Wissen Unternehmen sammeln ungeheure mengen enthalten wettbewerbsrelevantes Wissen Ziel: Entdecken dieses

Mehr

Moderne Methoden der KI: Maschinelles Lernen

Moderne Methoden der KI: Maschinelles Lernen Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen 5.1 Lernen mit Entscheidungsbäumen Falls zum Beispiel A = {gelb, rot, blau} R 2 und B = {0, 1}, so definiert der folgende Entscheidungsbaum eine Hypothese H : A B (wobei der Attributvektor aus A mit x

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Data Mining - Wiederholung

Data Mining - Wiederholung Data Mining - Wiederholung Norbert Fuhr 9. Juni 2008 Problemstellungen Problemstellungen Daten vs. Information Def. Data Mining Arten von strukturellen Beschreibungen Regeln (Klassifikation, Assoziations-)

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

Mining High-Speed Data Streams

Mining High-Speed Data Streams Mining High-Speed Data Streams Pedro Domingos & Geoff Hulten Departement of Computer Science & Engineering University of Washington Datum : 212006 Seminar: Maschinelles Lernen und symbolische Ansätze Vortragender:

Mehr

2. Lernen von Entscheidungsbäumen

2. Lernen von Entscheidungsbäumen 2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse

Mehr

Entscheidungsbaumverfahren

Entscheidungsbaumverfahren Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch

Mehr

Machine Learning - Maschinen besser als das menschliche Gehirn?

Machine Learning - Maschinen besser als das menschliche Gehirn? Machine Learning - Maschinen besser als das menschliche Gehirn? Seminar Big Data Science Tobias Stähle 23. Mai 2014 KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der

Mehr

TNS EX A MINE BehaviourForecast Predictive Analytics for CRM. TNS Infratest Applied Marketing Science

TNS EX A MINE BehaviourForecast Predictive Analytics for CRM. TNS Infratest Applied Marketing Science TNS EX A MINE BehaviourForecast Predictive Analytics for CRM 1 TNS BehaviourForecast Warum BehaviourForecast für Sie interessant ist Das Konzept des Analytischen Customer Relationship Managements (acrm)

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme

Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume. von Lars-Peter Meyer. im Seminar Methoden wissensbasierter Systeme Seminarvortrag zum Thema maschinelles Lernen I - Entscheidungsbäume von Lars-Peter Meyer im Seminar Methoden wissensbasierter Systeme bei Prof. Brewka im WS 2007/08 Übersicht Überblick maschinelles Lernen

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Formale Systeme. Binary Decision Diagrams. Prof. Dr. Bernhard Beckert WS 2010/2011 KIT INSTITUT FÜR THEORETISCHE INFORMATIK

Formale Systeme. Binary Decision Diagrams. Prof. Dr. Bernhard Beckert WS 2010/2011 KIT INSTITUT FÜR THEORETISCHE INFORMATIK Formale Systeme Prof. Dr. Bernhard Beckert WS / KIT INSTITUT FÜR THEORETISCHE INFORMATIK KIT University of the State of Baden-Württemberg and National Large-scale Research Center of the Helmholtz Association

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

MÖGLICHKEITEN UND GRENZEN DER VORHERSAGBARKEIT VON EPIDEMIEN IN FRÜHEN STADIEN

MÖGLICHKEITEN UND GRENZEN DER VORHERSAGBARKEIT VON EPIDEMIEN IN FRÜHEN STADIEN MÖGLICHKEITEN UND GRENZEN DER VORHERSAGBARKEIT VON EPIDEMIEN IN FRÜHEN STADIEN Mario Ziller Friedrich-Loeffler-Institut Bundesforschungsinstitut für Tiergesundheit Institut für Epidemiologie Seestr. 55,

Mehr

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih

Data Mining mit Rapidminer im Direktmarketing ein erster Versuch. Hasan Tercan und Hans-Peter Weih Data Mining mit Rapidminer im Direktmarketing ein erster Versuch Hasan Tercan und Hans-Peter Weih Motivation und Ziele des Projekts Anwendung von Data Mining im Versicherungssektor Unternehmen: Standard

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Stichprobenauslegung. für stetige und binäre Datentypen

Stichprobenauslegung. für stetige und binäre Datentypen Stichprobenauslegung für stetige und binäre Datentypen Roadmap zu Stichproben Hypothese über das interessierende Merkmal aufstellen Stichprobe entnehmen Beobachtete Messwerte abbilden Schluss von der Beobachtung

Mehr

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf

Mehr

Künstliche Intelligenz Maschinelles Lernen

Künstliche Intelligenz Maschinelles Lernen Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen

Mehr

Vorhersagetechniken für zukünftiges Verhalten von Kunden

Vorhersagetechniken für zukünftiges Verhalten von Kunden IBM 360 Grad-Sicht auf den Kunden: Vorhersagetechniken für zukünftiges Verhalten von Kunden Sven Fessler, sven.fessler@de.ibm.com Solution Architect, IBM Germany Business Analytics & Optimization Das Spektrum

Mehr

Data-Mining: Ausgewählte Verfahren und Werkzeuge

Data-Mining: Ausgewählte Verfahren und Werkzeuge Fakultät Informatik Institut für Angewandte Informatik Lehrstuhl Technische Informationssysteme Data-Mining: Ausgewählte Verfahren und Vortragender: Jia Mu Betreuer: Dipl.-Inf. Denis Stein Dresden, den

Mehr

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de

Datenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de Datenbankanwendung Wintersemester 2014/15 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de Wiederholung: Anfragegraph Anfragen dieses Typs können als Graph dargestellt werden: Der

Mehr

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum

4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum 4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.

Mehr

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München Gemischte Modelle Fabian Scheipl, Sonja Greven Institut für Statistik Ludwig-Maximilians-Universität München SoSe 2011 Inhalt Amsterdam-Daten: LMM Amsterdam-Daten: GLMM Blutdruck-Daten Amsterdam-Daten:

Mehr

Was ist Data Mining... in der Fundraising Praxis?

Was ist Data Mining... in der Fundraising Praxis? Was ist Data Mining...... in der Fundraising Praxis? Erkennen von unbekannten Mustern in sehr grossen Datenbanken (> 1000 GB) wenige und leistungsfähige Verfahren Automatisierung Erkennen von unbekannten

Mehr

Random Forests. Angewandte Biostatistik mit R. Fabian Knorre 26.11.2012. Ein Seminar bei Prof. Dr. Jörg Rahnenführer

Random Forests. Angewandte Biostatistik mit R. Fabian Knorre 26.11.2012. Ein Seminar bei Prof. Dr. Jörg Rahnenführer Angewandte Biostatistik mit R Fabian Knorre 26.11.2012 Ein Seminar bei Prof. Dr. Jörg Rahnenführer 1 / 53 Inhaltsverzeichnis 1 Motivation und Einleitung: Was ist ein... und wozu? 2 CART - Einleitung Konstruktion

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß

Fachgruppe Statistik, Risikoanalyse & Computing. STAT672 Data Mining. Sommersemester 2007. Prof. Dr. R. D. Reiß Fachgruppe Statistik, Risikoanalyse & Computing STAT672 Data Mining Sommersemester 2007 Prof. Dr. R. D. Reiß Überblick Data Mining Begrifflichkeit Unter Data Mining versteht man die Computergestützte Suche

Mehr

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen** Effektschätzung in Cluster-Randomized Trials mit binärer Zielgröße: Eine Sensitivitätsanalyse mit numerischer Integration, MCMC und NPMLE am Beispiel der DHP Oliver Kuß*; Dorothee Twardella**; Maria Blettner***;

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Gliederung. Bachelorseminar: Graphiken in R Visualisierung Kategorialer Daten. Einführung. Visualisierung von zweidimensionalen Kontingenztafeln

Gliederung. Bachelorseminar: Graphiken in R Visualisierung Kategorialer Daten. Einführung. Visualisierung von zweidimensionalen Kontingenztafeln Gliederung Bachelorseinar: Graphiken in R Visualisierung Kategorialer Daten Matthias Mitterayer betreut durch Sebastian Kaiser Einführung Institut für Statistik, LMU München 13. Januar 2011 Fazit Visualisierung

Mehr

Einführung in automatische Handelssysteme und Implementierung in Metatrader 4

Einführung in automatische Handelssysteme und Implementierung in Metatrader 4 Einführung in automatische Handelssysteme und Implementierung in Metatrader 4 Sebastian Dingler s.dingler@gmail.com 04.12.2013 Sebastian Dingler (s.dingler@gmail.com) Einführung in automatische Handelssysteme

Mehr

Null-Werte in Relationalen Datenbanken

Null-Werte in Relationalen Datenbanken Seminar: Imperfektion in Datenbanken WS03/04 Null-Werte in Relationalen Datenbanken Thomas Bierhance Einführung Null-Werte in DBen sind notwendiges Übel, da... (1) das Wissen über die tatsächliche Welt

Mehr

Titel anhand der der Präsentation. nicht fett geschrieben

Titel anhand der der Präsentation. nicht fett geschrieben Schätzung von Vollzeitäquivalenten Titel anhand der der Präsentation AHV-Lohndaten wenn nötig Jann Potteratmit und Monique Untertitel Graf Bundesamt für Statistik, Statistische Methoden METH nicht fett

Mehr

Profilierung von Einrichtungen

Profilierung von Einrichtungen Tagesspiegel Berlin, 5. Februar 2004 1 Profilierung von Einrichtungen Einführung in das Thema Modelle Statistik Prof. Dr. Karl Wegscheider Universität Hamburg wegsch@econ.uni-hamburg.de 2 Profilieru erung

Mehr

Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen

Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen Die Analyse sozialen Wandels auf Basis wiederholter Querschnittserhebungen Beitrag für den RatSWD-Nachwuchsworkshop: Längsschnittanalysen auf der Basis amtlicher Sozial- und Wirtschaftsdaten, Berlin, 25.-26.

Mehr

Inhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14

Inhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14 VII 1 Einführung... 1 1.1 Warum Versuche?... 1 1.2 Warum Statistik?... 1 1.3 Warum Versuchsplanung?... 4 1.4 Welche Art von Ergebnissen kann man erwarten?... 6 1.5 Versuche oder systematische Beobachtung?...

Mehr

Inhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17

Inhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17 Inhalt Vorwort.................................................................. V Inhalt.................................................................... VII 1 Einführung..........................................................

Mehr

Bioinformatik I (Einführung)

Bioinformatik I (Einführung) Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00

Mehr

Schwerpunkt Statistik

Schwerpunkt Statistik 1. Vorstellung des Schwerpunktes Statistik 1.1. Informationsveranstaltung Schwerpunkt Statistik Informationsveranstaltung UHH 02.05.2016 Informationsveranstaltung (UHH) Schwerpunkt Statistik 02.05.2016

Mehr

26. GIL Jahrestagung

26. GIL Jahrestagung GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Modellbildung und Simulation (M&S): Gegenstand oder Hilfsmittel der Fernausbildung. Axel Lehmann

Modellbildung und Simulation (M&S): Gegenstand oder Hilfsmittel der Fernausbildung. Axel Lehmann Modellbildung und Simulation (M&S): Gegenstand oder Hilfsmittel der Fernausbildung Axel Lehmann Institut für Technische Informatik Fakultät für Informatik Universität der Bundeswehr München ITIS e.v. Institut

Mehr

Gewöhnliche Differentialgleichungen (ODEs) I

Gewöhnliche Differentialgleichungen (ODEs) I Gewöhnliche Differentialgleichungen (ODEs) I Autor: Harald Höller letzte Änderung: 17.03.10 Lizenz: Creative Commons Lizenz by-nc-sa 3.0 at Differentialgleichungen lösen und plotten in Mathematica Grundlegendes

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Engineering Design via Surrogate Modelling Sampling Plans

Engineering Design via Surrogate Modelling Sampling Plans Engineering Design via Surrogate Modelling Sampling Plans Lisa Weber Universität Trier 01.06.2011 L. Weber (Universität Trier) Surrogate Models - Seminar Numerik 11 01.06.2011 1 / 34 Inhaltsverzeichnis

Mehr

Zeichnen von Graphen. graph drawing

Zeichnen von Graphen. graph drawing Zeichnen von Graphen graph drawing WS 2006 / 2007 Gruppe: D_rot_Ala0607 Christian Becker 11042315 Eugen Plischke 11042351 Vadim Filippov 11042026 Gegeben sei ein Graph G = (V; E) Problemstellung V E =

Mehr

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh?

Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? Bestandskundenmanagement Wo drückt bei Ihnen der Schuh? best-reactions GmbH Hirschberger Straße 33 D 90559 Burgthann Alle Rechte vorbehalten HRB 23679, Amtsgericht Nürnberg Geschäftsführer Alexander P.

Mehr

Monod-Kinetik. Peter Bützer

Monod-Kinetik. Peter Bützer Monod-Kinetik Peter Bützer Inhalt 1 Einleitung... 1 1.1 Modell... 1 1.2 Modellannahmen... 2 1. Gleichung... 2 1.4 Drei Fälle... 2 Simulation, Systemdynamik... 2.1 Simulationsdiagramm (Typ 1)... 2.2 Dokumentation

Mehr

Alles für den Kunden Analyse von Kundendaten. Katrin Plickert, Heiko Hartenstein

Alles für den Kunden Analyse von Kundendaten. Katrin Plickert, Heiko Hartenstein Alles für den Kunden Analyse von Kundendaten Katrin Plickert, Heiko Hartenstein Zum Verständnis 9. Februar 2007 Heiko Hartenstein, Katrin Plickert 2 Quelle: Heilmann, Kempner, Baars: Business and Competitive

Mehr

Next Best Product. Kundenspezifische Produktangebote in einer Multichannel Umgebung

Next Best Product. Kundenspezifische Produktangebote in einer Multichannel Umgebung Next Best Product Kundenspezifische Produktangebote in einer Multichannel Umgebung - Mag. Thomas Schierer - Erste Bank der oesterreichischen Sparkassen AG Agenda Erste Bank Allgemeine Information CRM in

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Regressionsanalyse zur Optimierung von künstlichen neuronalen Netzen bei der DAX-Prognose

Regressionsanalyse zur Optimierung von künstlichen neuronalen Netzen bei der DAX-Prognose Informatik Philipp von der Born Regressionsanalyse zur Optimierung von künstlichen neuronalen Netzen bei der DAX-Prognose Bachelorarbeit Universität Bremen Studiengang Informatik Regressionsanalyse zur

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Angewandte Informatik

Angewandte Informatik Angewandte Informatik Master-Studiengang Studienvoraussetzungen erster akademischer Grad (Bachelor) mit mindestens 180 Leistungspunkten Bachelorabschluss Angewandte Informatik Bachelor- oder Master Degree

Mehr

Diplomarbeit. Entwurf eines generischen Prozessleitstandes für Change Request Systeme

Diplomarbeit. Entwurf eines generischen Prozessleitstandes für Change Request Systeme Fakultät für Mathematik, Informatik und Naturwissenschaften Forschungsgruppe Softwarekonstruktion Diplomarbeit Entwurf eines generischen Prozessleitstandes für Change Request Systeme Development of a Generic

Mehr

Management von Softwaresystemen Systembewertung: Metriken und Prozess

Management von Softwaresystemen Systembewertung: Metriken und Prozess Management von Softwaresystemen Systembewertung: Metriken und Prozess Referent: Vadym Alyokhin Betreuer: Florian Deißenböck Übersicht Definition Einführung in die Messtheorie Meilensteine von Software-Metriken

Mehr

Kompakte Graphmodelle handgezeichneter Bilder

Kompakte Graphmodelle handgezeichneter Bilder Kompakte Graphmodelle handgezeichneter Bilder Einbeziehung in Authentizierung und Bilderkennung Inhaltsverzeichnis Seminar Mustererkennung WS 006/07 Autor: Stefan Lohs 1 Einleitung 1 Das graphische Modell.1

Mehr

Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Nugget

Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Nugget Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Nugget Ansprechpartner/in: Frau Anja Klimek Tel. +49 (5341) 29359-20 E-Mail: a.klimek@aw-systems.net Website: www.aw-systems.net AW-SYSTEMS GmbH Moränenweg

Mehr

Lean Six Sigma als Instrument für die Messung von ITIL -Prozessen

Lean Six Sigma als Instrument für die Messung von ITIL -Prozessen Informatik Anja Theisen Lean Six Sigma als Instrument für die Messung von ITIL -Prozessen Studienarbeit UNIVERSITÄT DUISBURG-ESSEN Seminararbeit zum Thema Lean Six Sigma als Instrument für die Messung

Mehr

Die Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse

Die Clusteranalyse 24.06.2009. Clusteranalyse. Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele. methodenlehre ll Clusteranalyse Clusteranalyse Thomas Schäfer SS 2009 1 Die Clusteranalyse Grundidee Mögliche Anwendungsgebiete gg Vorgehensweise Beispiele Thomas Schäfer SS 2009 2 1 Die Clusteranalyse Grundidee: Eine heterogene Gesamtheit

Mehr

1. In 8 Abs. 1 wird die bisherige Modulbezeichnung Geobezugssysteme durch die Modulbezeichnung Parameterschätzung und Geobezugssysteme ersetzt.

1. In 8 Abs. 1 wird die bisherige Modulbezeichnung Geobezugssysteme durch die Modulbezeichnung Parameterschätzung und Geobezugssysteme ersetzt. Dritte Satzung zur Änderung der Studien und Prüfungsordnung für den Bachelorstudiengang Geotelematik und Navigation (Geotelematics and Navigation) an der Hochschule für angewandte Wissenschaften Fachhochschule

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

WETRAX (Weather Patterns, Storm TRAcks and related precipitation Extremes) Arbeitspaket 3 Wetterlagen

WETRAX (Weather Patterns, Storm TRAcks and related precipitation Extremes) Arbeitspaket 3 Wetterlagen WETRAX (Weather Patterns, Storm TRAcks and related precipitation Extremes) Arbeitspaket 3 Wetterlagen Markus Homann, Christoph Beck, Jucundus Jacobeit, Andreas Philipp University of Augsburg, Institute

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Vorbesprechung Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2015 Vorbesprechung, SS 2015 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source:

Mehr

Seminar Business Intelligence Teil II: Data-Mining und Knowledge-Discovery

Seminar Business Intelligence Teil II: Data-Mining und Knowledge-Discovery Seminar usiness Intelligence Teil II: Data-Mining und Knowledge-Discovery Thema : Vortrag von Philipp reitbach. Motivation Übersicht. rundlagen. Entscheidungsbauminduktion. ayes sche Klassifikation. Regression.

Mehr