Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Ähnliche Dokumente
Statistik und Wahrscheinlichkeitsrechnung

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra

I. Deskriptive Statistik 1

Bitte am PC mit Windows anmelden!

Mathematische und statistische Methoden I

Statistik II: Grundlagen und Definitionen der Statistik

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Einführung in die computergestützte Datenanalyse

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

3. Deskriptive Statistik

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Kapitel 5 Kenngrößen empirischer Verteilungen 5.1. Lagemaße. x mod (lies: x-mod) Wofür? Lageparameter. Modus/ Modalwert Zentrum. Median Zentralwert

5 Erwartungswerte, Varianzen und Kovarianzen

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Brückenkurs Statistik für Wirtschaftswissenschaften

Kapitel VI - Lage- und Streuungsparameter

Statistik für Ökonomen

Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Statistik und Wahrscheinlichkeitsrechnung

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Kapitel 1 Beschreibende Statistik

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

2. Beschreibung von eindimensionalen (univariaten) Stichproben

Deskriptive Statistik

Univariates Datenmaterial

Über den Autor 7 Über den Fachkorrektor 7. Einführung 19

Hydrologie und Flussgebietsmanagement

Beispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)


Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)

Inhaltsverzeichnis. Teil I Einführung

Statistische Grundlagen I

Statistik eindimensionaler Größen

Beide Verteilungen der Zeiten sind leicht schief. Der Quartilsabstand für Zeiten zum Surfen ist kleiner als der zum Fernsehen.

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Lage- und Streuungsparameter

- Beschreibung der Stichprobe(n-Häufigkeitsverteilung) <- Ermittlung deskriptiver Maßzahlen (Mittelungsmaße, Variationsmaße, Formparameter)

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

4 Statistische Maßzahlen

Tabellarische und graphie Darstellung von univariaten Daten

Deskriptive Statistik

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

N

Mittelwert und Standardabweichung

Mögliche Fragen für mündliche Prüfung aus Statistik und Wahrscheinlichkeitstheorie von Prof. Dutter

Auswahl von Schätzfunktionen

Beschreibende Statistik Eindimensionale Daten

Keine Panik vor Statistik!

Eine zweidimensionale Stichprobe

Inhaltsverzeichnis. Vorwort

Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

benötigen. Die Zeit wird dabei in Minuten angegeben und in einem Boxplot-Diagramm veranschaulicht.

Harry Potter und die Kammer des Schreckens : m, s, g, a, a, a, sg, g, a, g, m, m, g, g, sg, s, a, a, a, g, a, a, g, g, a

Fachrechnen für Tierpfleger

Statistik, Geostatistik

Wolf-Gert Matthäus, Jörg Schulze. Statistik mit Excel. Beschreibende Statistik für jedermann. 3./ überarbeitete und erweiterte Auflage.

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Mathematische und statistische Methoden I

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

Auswertung und Darstellung wissenschaftlicher Daten (1)

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse

Statistische Auswertung von Meß- und Versuchsdaten mit Taschenrechner und Tischcomputer

Thema: Mittelwert einer Häufigkeitsverteilung. Welche Informationen kann der Mittelwert geben?

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Kapitel 1: Deskriptive Statistik

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Übung zur Vorlesung: Geostatistik 1 Philipp, Mo. 15: Türcode: 1516

Stochastik für die Naturwissenschaften

Stochastik für die Naturwissenschaften

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

Einfache Statistiken in Excel

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

1.6 Der Vorzeichentest

Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?

Physikalische Übungen für Pharmazeuten

Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Deskriptive Statistik

Zusammenfassung Statistik, Martina Böni

Angewandte Statistik 3. Semester

Zufallsvariablen [random variable]

P (X = 2) = 1/36, P (X = 3) = 2/36,...

Jahrgangscurriculum 11.Jahrgang

Sozialwissenschaftliche Datenanalyse mit R

Kenngrößen von Zufallsvariablen

Grundgesamtheit und Stichprobe

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Einführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25

2 Grundlagen der Statistik

Das Histogramm ist glockenförmig. Es würde bei mehr als vier Fehlerquellen sich der Glockenform noch besser annähern.

Mathematik für Biologen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Grundlagen der Statistik und Fehlerrechnung

Transkript:

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG Markus.Schumacher@physik.uni-freiburg.de stan.lai@cern.ch http://terascale.physik.uni-freiburg.de/lehre/ws_1213/statmethoden_ws1213

Kapitel 1 Beschreibung von Daten Deskriptive Statistik

Kapitel 0 Beschreibung von Daten Deskriptive Statistik

Datensatz und Typen von Daten Messung liefert Stichprobe von Messdaten vom Umfang n: xi i=1,n Ziel: Information extrahieren Auditorium erklären Mittel: übersichtliche Darstellung Graphik Bestimmung weniger charakteristischer Zahlen Typen von Daten: numerische: - diskrete: abzählbar viele z.b: natürliche oder ganze Zahlen - kontinuierliche: meist reelle Zahlen (Größe, Gewicht, ) qualitative: Farben, Sorten, ja/nein,

Darstellung von Daten Tabelle Balkendiagramm Histogramm In Naturwissenschaften: meistens Histogramme (auch mehrdimensionale) Andere Darstellungsoptionen: Säulendiagramme, Kuchendiagram,

Wahl der Bin-Breiten Kriterien; - statistische Fluktuationen in Bins klein große Breiten - keine Struktur/ Eigenschaft verstecken kleine Breiten Faustregel: > 5 bis 10 Einträge pro Bin

Wahl der Bin-Breiten (II) Beispiel: Stichprobe vom Umfang 100 gezogen aus Gauss(µ=3,σ=1)+Gauss( µ=7,σ=1) Mittelwert aus Einzelwerten: Mean (correct) Mittelwert aus Binmittelwerten und Binhäufigkeit: Mean (binned hist) Kein Binning/Balkendiagramm M. Schumacher 50 Bins (Breite = 0.2) Stat. Methoden der Datenanalyse Kapitel 0: Einführung WiSe 2011/2012

Wahl der Bin-Breiten (III)

Charakteristische Schwerpunkt Ch a r ak tgrößen: e r ist isch e Gr össe n Schwerpunkt : Schwerpunkt meist: arithmetischer Mittelwert meistens: arithmetischer Mittelwert selten: harmonisches, geometrisches Mittel, Streuung: Bei Einteilungmeist: in j Bins mit Varianz = mittlere quadratische nj Einträgen und Binzentralwerten xj Abweichung von arithmetischem Mittel Achtung: Informationsverlust durch Binning ungenauer Mittelwert teilweise: FWHM volle Breite auf halber Höhe selten weitere Größen: Schiefe, Wölbung (später) seltener: harmonisches geometrisches Mittel mittlere absolute Abweichung vom Mittelwert) Prof. M. Schumacher Stat Meth. der Datenanalyse Kap. 0: Einführung Uni. Freiburg / SoSe0912

Charakteristische Größen: Schwerpunkt (II) Modalwert (Mode): wahrscheinlichster, häufigster Wert in der Stichprobe Median: 50% der Daten oberhalb und 50% der Daten unterhalb Stichprobenumfang n ungerade: (n-1)/2 unterhalb, (n-1)/2 oberhalb Median = (n-1)/2+1 te Wert Stichprobenumfang n gerade: Median = Mittelpunkt zwischen n/2 ten und (n/2)+1 ten Wert Bei Histogrammen keine einfache Angabe möglich

Mittelwert, Median und Modalwert (Mode)

Charakteristische Größen: Streuung/Breite 2 Verteilungen mit gleichem Mittelwert aber unterschiedlicher Streuung 2. charakteristische Zahl: Streuung/Breite/Dispersion Erster Versuch: mittlerer Abstand vom Mittelwert kein sinnvolles Ergebnis

Charakteristische Größen: Streuung/Breite (II) Varianz = mittlere quadratische Abweichung vom arithmetischem Mittel kleine Rechung liefert Standardabweichung (gleiche Einheit wie Messwerte) In Praxis: meist Standardabweichung da gleiche Einheit wie Messwerte In Theorie: oft Varianz da mathematisch einfacher zu handhaben

Charakteristische Größen: Streuung/Breite (II) Andere Definition von Varianz und Standardabweichung: Varianz verändert durch Besselkorrektur N/(N-1) Erste Definition liefert keinen erwartungstreuen Schätzer der Varianz Erläuterung später. Für große n ist Unterschied marginal. Weitere Größen für die Breite: FWHM = volle Breite auf halber Höhe mittlere absolute Abweichung vom Mittelwert

2 Observablen: Darstellungsoptionen Teilweise besteht ein Messung aus mehreren Observablen z.b: Größe und Gewicht, Noten in 2 Fächern, Scatter-Plot Kontur-Histogramm

2 Observablen: Darstellungsoptionen (II) 3-dimensionale Darstellung als Lego-Plot M. Schumacher Stat. Methoden der Datenanalyse Kapitel 0: Einführung WiSe 2011/2012

Kovarianz für 2 Observable Zusätzliche Frage: Beziehung/Relation zwischen Messgrößen? Kovarianz: wenn für x > Mittelwert(x), bevorzugt y > Mittelwert(y) dann cov(x,y) > 0 < < Beispiele: Größe und Gewicht: Kovarianz > 0 Fitness und Gewicht: Kovarianz < 0 Größe und IQ: Kovarianz = 0

Korrelation für 2 Observable Kovarianz hat teilweise komische Einheit (z.b.für Größe und Gewicht: kg m) Interpretation schwierig Definition der Korrelation/ des Korrelationskoeffizienten Korrelation zwischen 0 und 1 = 0: unkorrelliert = ±1: vollständig korreliert d.h. Kenntnis von x liefert Kenntnis von y

Beispiel für Korrelationen M. Schumacher Stat. Methoden der Datenanalyse Kapitel 0: Einführung WiSe 2011/2012

Beispiel für Korrelationen (II)

Beispiel für Korrelationen (II) M. Schumacher Stat. Methoden der Datenanalyse Kapitel 0: Einführung WiSe 2011/2012