Überblick und Ausblick



Ähnliche Dokumente
Datenanalyse und Statistik

Datenanalyse und Statistik

Statistik Vorlesung 6 (Tests II)

Statistik Vorlesung Statistik 1

Korrelation - Regression. Berghold, IMI

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Einführung in statistische Analysen

Zeichen bei Zahlen entschlüsseln

Die Wahlpflichtfächer. Operations Research Statistik/Ökonometrie. Optimierung linearer Modelle Statistische Analyseverfahren

Modellierung von Korrelationen zwischen Kreditausfallraten für Kreditportfolios. Bernd Rosenow, 3. Kölner Workshop Quantitative Finanzmarktforschung

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Willkommen zur Vorlesung Statistik

Grundlagen der Künstlichen Intelligenz

1. Einfuhrung zur Statistik

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Übungen zur Veranstaltung Statistik 2 mit SPSS

Algorithmen und Datenstrukturen

Problemlösung aus systemischer Sicht

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Info-Veranstaltung zur Erstellung von Zertifikaten

Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Stochastik und Statistik

Professionelle Seminare im Bereich MS-Office

13 Öffentliche Güter

Statistische Auswertung:

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Stochastik und Statistik Vorlesung 2 (Graphik I)

Also kann nur A ist roter Südler und B ist grüner Nordler gelten.

Einführung in die Programmierung Laborübung bei Korcan Y. Kirkici. 12.Übung bis

Korrelation (II) Korrelation und Kausalität

Basis (=100%) zusätzlichen Schulabschluss an. Befragungszeitraum:

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Erfolg beginnt im Kopf

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

W-Rechnung und Statistik für Ingenieure Übung 11

Inverted Classroom für anspruchsvolle Themen

Eine mathematische Reise ins Unendliche. Peter Koepke Universität Bonn

Vorarlberger Standardschulinstallation Anbindung von Android Mobile Devices

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Kernel, Perceptron, Regression. Erich Schubert, Arthur Zimek KDD Übung

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

(1) Problemstellung. (2) Kalman Filter

MIN oder MAX Bildung per B*Tree Index Hint

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Tutorial 2: Simulationen

Data Mining: Einige Grundlagen aus der Stochastik

How to do? Projekte - Zeiterfassung

Regulation und Dysregulation beim Übergang von der Krippe in den Kindergarten

0, v 6 = , v 4 = span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 )

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Schritte 4. Lesetexte 13. Kosten für ein Girokonto vergleichen. 1. Was passt? Ordnen Sie zu.

Statuten in leichter Sprache

Womit beschäftigt sich Soziologie? (1) Verschiedene Antworten:

AW: AW: AW: AW: Kooperationsanfrage anwalt.de

TREND SEARCH VISUALISIERUNG. von Ricardo Gantschew btk Berlin Dozent / Till Nagel

Abb. 1 Einstellungen Supervisor Oprionen Gebäude-/Verteilertätigkeit

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Vorlesung - Medizinische Biometrie

Kosten-Leistungsrechnung Rechenweg Optimales Produktionsprogramm

Blumen-bienen-Bären Academy. Kurzanleitung für Google Keyword Planer + Google Trends

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Statistik II für Betriebswirte Vorlesung 2

Bei der Focus Methode handelt es sich um eine Analyse-Methode die der Erkennung und Abstellung von Fehlerzuständen dient.

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

QM: Prüfen -1- KN

iq digital quarterly #1 Content Marketing

Mädchen Jungen Smartphone Computer Fernsehgerät feste Spielkonsole 37 62

Wissenschaftliche Grundlagen des Mathematischen Schulstoffs IV. Die erste Stunde. Die erste Stunde

Nutzung und Akzeptanz von QR-Codes

Quantitative Methoden der Bildungsforschung

Animationen erstellen

Einfache statistische Auswertungen mit dem Programm SPSS

Webinar. Mach Dir die Welt, wie sie Dir gefällt! Die Antriebskräfte des Lebens nach dem Reiss-Profil erkennen

HERZLICH WILLKOMMEN!

Elternzeit Was ist das?

Optimierung und Simulation ökonomischer Problemlagen privater Haushalte 3. Vorlesung

Wie beschneide ich ein Bild passend für den Ausdruck auf Papier eines bestimmten Formats?

Hinweise zum Datenschutz, Einwilligungs-Erklärung

Klassenarbeit zu linearen Gleichungssystemen

Binäre abhängige Variablen

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Transkript:

Letzte Vorlesung Statistik Vorlesung Datenanalyse und Statistik

Gliederung 1 Sortiert nach dem Inhalt der Vorlesung Sortiert nach Daten 2 Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse 3 Zusammenfassung

Sortiert nach dem Inhalt der Vorlesung Sortiert nach Daten Daten: Statistische Graphik Deskriptive Statistik Statistische Tests Hypothese, Alternative, Fehler 1. und 2. Art. Nachweis, α-niveau, p-werte Bonferroni Korrektur Auswahl der Tests parametrisch, nichtparametrisch, robust Lineare Modelle

Sortiert nach dem Inhalt der Vorlesung Sortiert nach Daten Univariate Statistik Bivariate Statistik Zeitreihen Zufallsfelder...

Kovarianzmatrizen Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse var(x 1 ) cov(x 1,X 2 ) cov(x 1,X 3 ) cov(x 1,X 4 ) cov(x 2,X 1 ) var(x 2 ) cov(x 2,X 3 ) cov(x 2,X 4 ) cov(x 3,X 1 ) cov(x 3,X 2 ) var(x 3 ) cov(x 3,X 4 ) cov(x 4,X 1 ) cov(x 4,X 2 ) cov(x 4,X 3 ) var(x 4 )

Klusteranalyse II Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse Y 0.5 0.0 0.5 1.0 1.5 0.5 0.0 0.5 1.0 X

X Hauptkomponentenanalyse IV Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse Y 6 4 2 0 2 4 10 5 0

Faktorenanalyse Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse X 3 1 0 1 2 Y 6 2 0 2 4 3 2 1 0 1 2 Z 3 2 1 0 1 2 Z X 3 1 0 1 2 6 4 2 0 2 4 Y

Diskriminazanalyse Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse Y 0.0 0.5 1.0 1.5 0.5 0.0 0.5 1.0 1.5 X

Zusammenfassung MV-Statistik Kovarianzmatrizen Klusteranalyse Hauptkomponentenanalyse Faktorenanalyse Diskriminazanalyse Die Klusteranalyse versucht Gruppen in den Daten zu finden. Die Hauptkomponentenanalyse versucht die Hauptrichtung der Streuung im Datensatz aufzufinden. Die Faktorenanalyse versucht unbeobachtbare gemeinsame Ursachen in den Daten zu entdecken. Die Diskriminazanalyse versucht Individuen einer Gruppe zuzuordnen.

Zeitreihen Zusammenfassung z 0.10 0.05 0.00 0.05 0 20 40 60 80 100 Tage

Eigenschaften von Zeitreihen Zusammenfassung Daten werden in regelmäßigen Zeitabständen erhoben In kurzer Zeit ändert sich nicht so viel Daten sind also stochastisch abhängig Daten verhalten sich oft zyklisch (z.b. immer große Werte im Sommer)

Methoden für Zeitreihen Zusammenfassung Test ob Abhängigkeit tatsächlich vorliegt (z.b. Ansari-Friedmann) Abhängigkeit quantifizieren durch Autokovarianzfunktion: c(h) = cov(z(t + h),z(t)) Vorhersage: Wie geht es weiter? Welche Gesetze verbergen sich hinter der Zeitreihe?

Zusammenfassung Was ist eine geostatistische Vorhersage? y 10 20 30 40 50 Observation Locations 10 20 30 40 50 x Ẑ(s) = A ( n f i=1 Z(s i ) = True value at location s i ) w i (s)z(s i ), i = 1,...,n ds

Zusammenfassung Was ist eine geostatistische Vorhersage? 10 20 30 40 50 What do we expect here? y? 10 20 30 40 50 x Ẑ(s) = A ( n f i=1 w i (s) = Kriging weights ) w i (s)z(s i ), i = 1,...,n ds

Zusammenfassung What ist geostatististische Simulation? y 10 20 30 40 50 Simulation 4 10 20 30 40 50 x reality is unkown prediction is to smooth predict conditional distribution simulating possible szenarios... many possible szenaries are qualitatively similar *but qualitatively different from reality

Zusammenfassung Komponenten addieren zu 100% Komponenten sind also abhängig und automatisch negativ korreliert. Komponenten sind einzeln Anteile, aber hängen zusammen.

Ternäre Diagramme Zusammenfassung MgO NA20.K20 Fe2O3

Zusammenfassung SD Zusammenfassung Daten mit zeitlichen Abhängigkeiten Daten mit räumlichen Abhängigkeiten Werte addieren zu 1 bzw. Summe egal.

Zusammenfassung Daten Schätzung Test Mathe Die Datenminen Riesige Halde mit nichtrepräsentativen Daten Die unwegsamen Ausreißerberge Bayes-Land Gletscherspalte der gleichen Messwerte Klippe der unüberprüfbaren Voraussetzungen Rangviertel ML-City Vorhersagebereich Vertrauensbereich Schätzervorstadt Statistika Modell-Platz Aussichtsturm Grafingen Normalviertel Klippe der unüberprüfbaren Voraussetzungen Sequenzielle Passage Momentenmethoden u. Lineare Modelle t-dorf Steppe der unwesentlich verletzten Voraussetzungen Todeswüste, der nicht erfüllten Voraussetzungen Steig der Nichtparametrik Posthoc robuster Weg Bonferroni Passage Sümpfe des multiplen Testens Benjamini Passage Nacht der angenommen Hypothesen Schlaraffia oder das Land des gelungen statistischen Nachweis Land des offenen Betrugs

Ich wünsche Ihnen Zusammenfassung eine bestandene Klausur schöne Ferien! ein erfolgreiches Leben