Statistische Methoden der Datenanalyse

Ähnliche Dokumente
Statistische Methoden der Datenanalyse

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

I. Deskriptive Statistik 1

Statistische Methoden der Datenanalyse

Statistik - Fehlerrechnung - Auswertung von Messungen

Statistik für Ökonomen

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

10. Vorlesung. Grundlagen in Statistik. Seite 291. Martin-Luther-Universität Halle/Wittenberg

Inhaltsverzeichnis. Teil I Einführung

Elementare Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung und schließende Statistik

Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure

Grundlagen der Mathematik, der Statistik und des Operations Research für Wirtschaftswissenschaftler

Stochastik für Informatiker

Statistische Auswertungsmethoden für Ingenieure

Wahrscheinlichkeitsrechnung und schließende Statistik

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen

Einführung in Statistik und Messwertanalyse für Physiker

Grundlagen der Probabilistik

Tabellarische und graphie Darstellung von univariaten Daten

1 Inhaltsverzeichnis. 1 Einführung...1

Statistische Methoden der Datenanalyse

Über den Autor 7. Teil Beschreibende Statistik 29

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Ulrich Rohland. Statistik. Erläuterung grundlegender Begriffe und Verfahren

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Kapitel 1. Grundlagen der Statistik. 1.1 Wahrscheinlichkeit Definition über die Häufigkeit Kombinatorische Definition

Statistics, Data Analysis, and Simulation SS 2015

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Statistik, Datenanalyse und Simulation

Einführung in die computergestützte Datenanalyse

I. Zahlen, Rechenregeln & Kombinatorik

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Ü b u n g s b l a t t 15

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Einführung in die Maximum Likelihood Methodik

8. Stetige Zufallsvariablen

Inhaltsverzeichnis. Vorwort

Statistics, Data Analysis, and Simulation SS 2015

Copula Funktionen. Eine Einführung. Nils Friewald

Übungsbuch Statistik für Dummies

Über den Autor 7 Über den Fachkorrektor 7. Einführung 19

Keine Panik vor Statistik!

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25

Statistik II. Statistische Tests. Statistik II

Statistik für das Psychologiestudium

Mathematik für Ingenieure und Naturwissenschaftler BandS

Universitätsprofessor Dr. rer. nat. habil. Karl-Ernst Biebler und Dr. rer. nat. Bernd Jäger

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Univariates Datenmaterial

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Simulation von Zufallsversuchen mit dem Voyage 200

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Signalverarbeitung 2. Volker Stahl - 1 -

Zufallsvariablen [random variable]

Stochastik I. Vorlesungsmitschrift

Hydrologie und Flussgebietsmanagement

Wahrscheinlichkeitstheorie und Statistik vom

Berichte aus der Statistik. Christian Köck. Multivariate Copula-Modelle für Finanzmarktdaten

Vorlesung Wirtschaftsstatistik 2 (FK ) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren. Dipl.-Ing.

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Das Histogramm ist glockenförmig. Es würde bei mehr als vier Fehlerquellen sich der Glockenform noch besser annähern.

Klausur Stochastik und Statistik 31. Juli 2012

Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016

Kapitel VI - Lage- und Streuungsparameter

Mathematik in den Life Siences

Jahrgangscurriculum 11.Jahrgang

Moderne Methoden der Datenanalyse WS 2010/11

Wahrscheinlichkeiten

Basiswissen Mathematik, Statistik. und Operations Research für. Wirtschaftswissenschaftler. von. Prof. Dr. Gert Heinrich DHBW Villingen-Schwenningen

Klausur zur Mathematik für Biologen

6.1 Definition der multivariaten Normalverteilung

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67

Statistik ohne Angst vor Formeln

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik II SoSe 2006 immer von 8:00-9:30 Uhr

Ein- und Zweistichprobentests

2.1 Gemeinsame-, Rand- und bedingte Verteilungen

Wahrscheinlichkeitsrechnung

Statistik für Psychologen und Sozialwissenschaftler

Übersicht deskriptiver Maße & anderer. Nützliche Funktionen. Statistische Software (R-Vertiefung) artihmetische Mittel median() mean()

Einführung in die Wahrscheinlichkeitsrechnung

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31.

Statistik Klausur Wintersemester 2012/2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

1 Grundprinzipien statistischer Schlußweisen

Simulationsmethoden in der Bayes-Statistik

7.2 Moment und Varianz

K8 Stetige Zufallsvariablen Theorie und Praxis

1 Wahrscheinlichkeitsrechnung und Zufallsvariablen

Mathematische und statistische Methoden II

Bayes sches Lernen: Übersicht

Willkommen zur Vorlesung Statistik (Master)

Grundlagen, Vorgehensweisen, Aufgaben, Beispiele

Teil I Beschreibende Statistik 29

Transkript:

Statistische Methoden der Datenanalyse Vorlesung im Sommersemester 2008 H. Kolanoski Humboldt-Universität zu Berlin

Inhaltsverzeichnis Literaturverzeichnis iii 1 Grundlagen der Statistik 3 1.1 Wahrscheinlichkeit............................ 3 1.1.1 Definition über die Häufigkeit.................. 3 1.1.2 Kombinatorische Definition................... 3 1.1.3 Axiomatische Definition der Wahrscheinlichkeit........ 4 1.2 Verteilungen von Zufallsvariablen.................... 7 1.2.1 Eigenschaften von Verteilungen................. 8 1.2.2 Erwartungswerte......................... 11 1.2.3 Wahrscheinlichster Wert und Median.............. 12 1.2.4 Stichproben und Schätzwerte.................. 13 1.3 Simulation von Verteilungen....................... 14 1.3.1 Umkehrung der Verteilungsfunktion............... 14 1.3.2 Hit and Miss Methode..................... 16 2 Spezielle Verteilungen einer Variablen 19 2.1 Binomial-Verteilung............................ 19 2.2 Multinomial-Verteilung.......................... 24 2.3 Poisson-Verteilung............................ 25 2.4 Gleichverteilung.............................. 27 2.5 Normalverteilung............................. 30 2.5.1 Vertrauensintervalle:....................... 32 2.6 Zentraler Grenzwertsatz......................... 34 3 Verteilungen mehrerer Variablen 37 3.1 Eigenschaften von Verteilungen mehrerer Variablen.......... 37 3.1.1 Wahrscheinlichkeitsdichte, Verteilungsfunktion, Randverteilung 37 3.1.2 Bedingte Wahrscheinlichkeitsdichten, Selektionsschnitte.... 38 3.2 Erwartungswerte............................. 39 3.3 Kovarianzmatrix............................. 40 3.3.1 Definition und Eigenschaften der Kovarianzmatrix....... 40 3.3.2 Beispiel: Multi-dimensionale Gaussverteilung.......... 40 3.3.3 Kovarianzen von Stichproben.................. 41 3.3.4 Kovarianzmatrix von unabhängigen Variablen......... 41 3.3.5 Korrelationen........................... 42 3.4 Lineare Funktionen von mehreren Zufallsvariablen........... 44 i

3.5 Nicht-lineare Funktionen von Zufallsvariablen............. 46 3.5.1 Eine Funktion von einem Satz von Zufallsvariablen...... 46 3.5.2 Mehrere Funktionen von einem Satz von Zufallszahlen.... 47 3.6 Transformationen von Zufallsvariablen................. 50 4 Stichproben und Schätzungen 53 4.1 Stichproben, Verteilungen und Schätzwerte............... 53 4.2 Eigenschaften von Schätzwerten..................... 54 4.3 Stichproben aus Normalverteilungen; χ 2 -Verteilung............................... 56 5 Monte-Carlo-Methoden 63 5.1 Zufallszahlengeneratoren......................... 63 5.2 Monte-Carlo-Integration......................... 63 5.3 Monte-Carlo-Erzeugung von Ereignissen nach Zufallsverteilungen.. 63 6 Die Maximum-Likelihood-Methode 65 6.1 Das Maximum-Likelihood-Prinzip.................... 65 6.2 Fehlerbestimmung für ML-Schätzungen................. 68 6.2.1 Allgemeine Methoden der Varianzabschätzung......... 68 6.2.2 Varianzabschätzung durch Entwicklung um das Maximum.. 68 6.2.3 Vertrauensintervalle und Likelihood-Kontouren........ 69 6.3 Eigenschaften von ML-Schätzungen................... 71 7 Methode der kleinsten Quadrate 75 7.1 Prinzip der Methode der kleinsten Quadrate.............. 75 7.2 Lineare Anpassung............................ 76 7.2.1 Anpassung der Messwerte an eine Gerade............ 76 7.2.2 Anpassung einer allgemeinen linearen Funktion der Parameter 79 7.3 Anpassung nicht-linearer Funktionen der Parameter.......... 84 8 Entfaltung 87 8.1 Einführung................................ 87 8.2 Entfaltung von Histogrammen...................... 87 9 Neuronale Netze zur Datenklassifikation 89 9.1 Einleitung................................. 89 9.1.1 Attraktivität neuronaler Modelle................ 89 9.2 Natürliche und künstliche neuronale Netze............... 91 9.2.1 Natürliche neuronale Netze.................... 91 9.2.2 Künstliche neuronale Netze (KNN)............... 94 9.3 Feed-Forward-Netzwerke......................... 96 9.3.1 Das einfache Perzeptron..................... 97 9.3.2 Das Mehrlagen-Perzeptron.................... 100 9.3.3 Lernen............................... 103 9.3.4 Typische Anwendungen für Feed-Forward-Netze........ 109 9.3.5 BP-Lernen und der Bayes-Diskriminator............ 112 ii

Literaturverzeichnis [1] S. Brandt: Datenanalyse, 4. Auflage, 1999, Spektrum Akademischer Verlag. [2] R.J. Barlow, Statistics: A Guide to the Use of Statistic al Methods in the Physical Sciences, Wiley, 1989. [3] V. Blobel und E. Lohrmann, Statistische und numerische Methoden der Datenanalyse, Teubner Studienbücher, 1998. [4] G. Bohm und G. Zech, Einführung in Statistik und Messwertanalyse für Physiker, Hamburg, DESY 2005; e-book:<http://wwwlibrary.desy.de/preparch/books/vstatmp.pdf> Zu Neuronale Netze : [5] D.E.Rumelhart and J.L.McClelland: Parallel Distributed Processing, MIT Press 1984 (9.Aufl. 1989). [6] J.Hertz, A.Krogh and R.G.Palmer: Introduction to the Theory of Neural Computation, Addison-Wesley Publishing Company, 1991. [7] R.Brause: Neuronale Netze, Teubner Verlag 1991. [8] R.Hecht-Nielsen: Neurocomputing, Addison-Wesley Publishing Company, 1987. [9] H.Ritter, T.Martinetz und K.Schulten: Neuronale Netze. Eine Einführung in die Neuroinformatik selbstorganisierender Netze, Addison-Wesley Publishing Company, 1991. [10] G.E.Hinton: Wie Neuronale Netze aus Erfahrung lernen, Spektrum der Wissenschaft, Nov. 1992. [11] T.Kohonen: Self-Organization and Associative Memory, Springer Verlag, 3.Auflage 1989. [12] A.Zell: Simulation Neuronaler Netze, Addison-Wesley, 1.Auflage 1994. [13] Scientific American: The Brain, Vol. 241, Sept. 1979. [14] Spektrum der Wissenschaft, Nov. 1992. PDG : [15] W.-M. Yao et al. (Particle Data Group), Review of Particle Physics, J. Phys. G33, 1 (2006); http://pdg.lbl.gov (Kapitel 31-32, reviews). iii

iv