7. Ideen aus der Statistik 7.1 Deskriptive Statistik
|
|
- Oswalda Geier
- vor 6 Jahren
- Abrufe
Transkript
1 1/ Ideen aus der Statistik 7.1 Deskriptive Statistik Matthias Birkner
2 Inhalt Ansatz der Statistik 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 2/101
3 Ansatz der Statistik 3/101 Viele Menschen stehen Statistik kritisch gegenüber: It is easy to lie with statistics.
4 Ansatz der Statistik 3/101 It is easy to lie with statistics. It is hard to tell the truth without it. Andrejs Dunkels ( )
5 4/101 Ansatz der Statistik Worum geht es in der Statistik? Die Welt ist voller Variabilität.
6 4/101 Ansatz der Statistik Worum geht es in der Statistik? Die Welt ist voller Variabilität. Wie geht man mit variablen Daten um?
7 4/101 Ansatz der Statistik Worum geht es in der Statistik? Die Welt ist voller Variabilität. Wie geht man mit variablen Daten um? Idee der Statistik: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren
8 4/101 Ansatz der Statistik Worum geht es in der Statistik? Die Welt ist voller Variabilität. Wie geht man mit variablen Daten um? Idee der Statistik: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden.
9 4/101 Ansatz der Statistik Worum geht es in der Statistik? Die Welt ist voller Variabilität. Wie geht man mit variablen Daten um? Idee der Statistik: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden. Man versucht dann, anhand der Daten Rückschlüsse auf Parameter des Modells zu ziehen, und so systematische Effekte von Zufälligem zu trennen.
10 5/101 Ansatz der Statistik Deskriptive (d.h. beschreibende) Statistik Wie geht man mit variablen Daten um?
11 5/101 Ansatz der Statistik Deskriptive (d.h. beschreibende) Statistik Wie geht man mit variablen Daten um? 0. Antwort : Man verschafft sich einen ersten Eindruck mittels graphischer Darstellungen und statistischer Kenngrößen
12 Inhalt Graphische Darstellungen 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 6/101
13 7/101 Ein Beispiel Graphische Darstellungen Bei einer biologischen Expedition wurden in der Nordsee Springkrebse (Galathea intermedia) gefangen und untersucht.
14 7/101 Ein Beispiel Graphische Darstellungen Bei einer biologischen Expedition wurden in der Nordsee Springkrebse (Galathea intermedia) gefangen und untersucht. Die Daten: Helgoländer Tiefe Rinne, Fang vom 6.9. Carapaxlänge (mm): Nichteiertragende Weibchen (n = 215) 2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,0 3,0 2,9 3,4 2,8 2,9 2,8 2,8 2,4 2,8 2,5 2,7 3,0 2,9 3,2 3,1 3,0 2,7 2,5 3,0 2,8 2,8 2,8 2,7 3,0 2,6 3,0 2,9 2,8 2,9 2,9 2,3 2,7 2,6 2,7 2,5.....
15 Graphische Darstellungen 8/101 Stichprobe vom 6. September, n=215 Carapaxlänge [mm] Index
16 Inhalt Graphische Darstellungen Histogramme und Dichtepolygone 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 9/101
17 Graphische Darstellungen Histogramme und Dichtepolygone 10/101 Eine Möglichkeit der graphischen Darstellung: das Histogramm
18 11/101 Graphische Darstellungen Histogramme und Dichtepolygone Histogramm der Carapaxlängen in der Stichprobe Stichprobe vom 6. September, n=215 Anzahl Carapaxlänge [mm]
19 Graphische Darstellungen Histogramme und Dichtepolygone Histogramm der Carapaxlängen in der Stichprobe Stichprobe vom 6. September, n=215 Anzahl Carapaxlänge [mm] Wieviele hatten Carapaxlänge zwischen 2,0 und 2,2 mm? 11/101
20 Wieviele hatten Carapaxlänge zwischen 2,0 und 2,2 mm? 22 12/101 Graphische Darstellungen Histogramme und Dichtepolygone Histogramm der Carapaxlängen in der Stichprobe Stichprobe vom 6. September, n=215 Anzahl Carapaxlänge [mm]
21 13/101 Graphische Darstellungen Histogramme und Dichtepolygone Analoge Daten zwei Monate später (Stichprobe vom der Größe n = 57) Stichprobe vom 3. November, n=57 Anzahl Carapaxlänge [mm]
22 Graphische Darstellungen Histogramme und Dichtepolygone 14/101 Vergleich der beiden Verteilungen Beide Stichproben Anzahl Carapaxlänge [mm]
23 Graphische Darstellungen Histogramme und Dichtepolygone 14/101 Vergleich der beiden Verteilungen Beide Stichproben Anzahl Carapaxlänge [mm] Problem: ungleiche Stichprobenumfänge: 6.Sept: n = Nov : n = 57
24 Graphische Darstellungen Histogramme und Dichtepolygone 14/101 Vergleich der beiden Verteilungen Beide Stichproben Anzahl Carapaxlänge [mm] 6.Sept: n = 215 Problem: ungleiche Stichprobenumfänge: 3.Nov : n = 57 Idee: stauche vertikale Achse so, dass Gesamtfläche = 1.
25 Graphische Darstellungen Histogramme und Dichtepolygone 15/101 Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm] Die Gesamtfläche der Balken ist nun = 1.
26 Graphische Darstellungen Histogramme und Dichtepolygone 15/101 Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm] Die Gesamtfläche der Balken ist nun = 1. Die neue vertikale Koordinate ist jetzt eine Dichte (engl. density).
27 Graphische Darstellungen Histogramme und Dichtepolygone 16/101 Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm] Gesamtfläche = 1. Dichte = Anteil am Ganzen pro mm.
28 Graphische Darstellungen Histogramme und Dichtepolygone 16/101 Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm] Gesamtfläche = 1. Dichte = Anteil am Ganzen pro mm. Welcher Anteil hatte Länge zwischen 2,8 und 3,0 mm?
29 Graphische Darstellungen Histogramme und Dichtepolygone Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm] Gesamtfläche = 1. Dichte = Anteil am Ganzen pro mm. Welcher Anteil hatte Länge zwischen 2,8 und 3,0 mm? Etwa (3,0 2,8) 0,5 = 0,1, d.h. ca. 10% 16/101
30 Graphische Darstellungen Histogramme und Dichtepolygone 17/101 Die beiden Histogramme sind jetzt vergleichbar
31 Graphische Darstellungen Histogramme und Dichtepolygone 17/101 Die beiden Histogramme sind jetzt vergleichbar (sie haben dieselbe Gesamtfläche).
32 18/101 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen: Beide Stichproben Dichte Carapaxlänge [mm]
33 19/101 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen: Beide Stichproben Dichte Carapaxlänge [mm]
34 20/101 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen: Beide Stichproben
35 21/101 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen: Beide Stichproben Sept Nov
36 22/101 Vorschlag Graphische Darstellungen Histogramme und Dichtepolygone Total abgefahrene 3D-Plots können in der Werbung nützlich sein
37 22/101 Vorschlag Graphische Darstellungen Histogramme und Dichtepolygone Total abgefahrene 3D-Plots können in der Werbung nützlich sein, für die Wissenschaft sind einfache und klare 2D-Darstellungen meistens angemessener.
38 23/101 Problem Graphische Darstellungen Histogramme und Dichtepolygone Histogramme kann man nicht ohne weiteres in demselben Graphen darstellen,
39 23/101 Problem Graphische Darstellungen Histogramme und Dichtepolygone Histogramme kann man nicht ohne weiteres in demselben Graphen darstellen, weil sie einander überdecken würden.
40 24/101 Graphische Darstellungen Histogramme und Dichtepolygone Einfache und klare Lösung: Dichtepolygone Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm]
41 25/101 Graphische Darstellungen Histogramme und Dichtepolygone Einfache und klare Lösung: Dichtepolygone Stichprobe vom 6. September, n=215 Dichte Carapaxlänge [mm]
42 26/101 Graphische Darstellungen Histogramme und Dichtepolygone Einfache und klare Lösung: Dichtepolygone Stichprobe vom 3. November, n=57 Anzahl Carapaxlänge [mm]
43 27/101 Graphische Darstellungen Histogramme und Dichtepolygone Zwei (oder mehr) Dichtepolygone in einem Plot Beide Stichproben Dichte Sept Nov Carapaxlänge [mm]
44 Graphische Darstellungen Histogramme und Dichtepolygone Zwei (oder mehr) Dichtepolygone in einem Plot Beide Stichproben Dichte Sept Nov Man sieht sofort: Carapaxlänge [mm] Die Verteilung in der Stichprobe vom November ist gegenüber der vom September nach links verschoben (und sie ist auch stärker um den häufigsten Wert konzentriert). 27/101
45 28/101 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl
46 28/101 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl Anzahl
47 28/101 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl Anzahl Dichte
48 28/101 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl Anzahl Also: Bei Histogrammen mit ungleichmäßiger Unterteilung immer Dichten verwenden! Dichte
49 Inhalt Graphische Darstellungen Stripcharts 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 29/101
50 30/101 Graphische Darstellungen Stripchart, einfach Stripcharts Carapaxlängen in den beiden Stichproben Sept Nov
51 31/101 Graphische Darstellungen Stripchart, mit jitter Stripcharts Carapaxlängen in den beiden Stichproben Sept Nov
52 32/101 Graphische Darstellungen Stripchart, mit stacking Stripcharts Carapaxlängen in den beiden Stichproben Sept Nov
53 Graphische Darstellungen Stripcharts 33/101 Histogramme/Dichtepolygone und Stripcharts geben ein ausführliches Bild eines Datensatzes.
54 Graphische Darstellungen Stripcharts 33/101 Histogramme/Dichtepolygone und Stripcharts geben ein ausführliches Bild eines Datensatzes. Manchmal zu ausführlich.
55 Inhalt Graphische Darstellungen Boxplots 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 34/101
56 35/101 Graphische Darstellungen Boxplots Zu viel Information erschwert den Überblick Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum
57 35/101 Graphische Darstellungen Boxplots Zu viel Information erschwert den Überblick Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Wald?
58 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung Carapaxlänge [mm]
59 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung Carapaxlänge [mm]
60 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 50 % der Daten 50 % der Daten Carapaxlänge [mm]
61 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 50 % der Daten 50 % der Daten Median Carapaxlänge [mm]
62 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 50 % der Daten 50 % der Daten Min Median Max Carapaxlänge [mm]
63 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 25% 25% 25% 25% Min Median Max Carapaxlänge [mm]
64 36/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 25% 25% 25% 25% Min 1. Quartil 3. Quartil Median Max Carapaxlänge [mm]
65 37/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Carapaxlänge [mm]
66 37/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Interquartilbereich Carapaxlänge [mm]
67 37/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Interquartilbereich 1,5*Interquartilbereich 1,5*Interquartilbereich Carapaxlänge [mm]
68 37/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Carapaxlänge [mm]
69 38/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Profiausstattung Carapaxlänge [mm]
70 38/101 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Profiausstattung 95 % Konfidenzintervall für den Median Carapaxlänge [mm]
71 Graphische Darstellungen Boxplots 39/101 Beispiel: Vergleich von mehreren Gruppen
72 Graphische Darstellungen Boxplots 40/101 Dichte Dichte Dichte Dichte
73 Graphische Darstellungen Boxplots 40/
74 Inhalt Graphische Darstellungen Geschummelt: Graphische Tricksereien 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 41/101
75 Graphische Darstellungen Geschummelt: Graphische Tricksereien 42/101 Graphische Tricksereien im Bereich der deskriptiven Statistik / der Kommunikation von numerischen Beobachtungen oder Resultaten: (Graphische) Tricksereien / Aufhübschen von Beobachtungen, z.b. Irreführende Wahl des Nullpunkts Stillschweigende nicht-lineare Transformationen der Achsen optische Täuschung durch unpassende 2d/3d-Grafiken... können den Betrachter (manchmal absichtlich) in die Irre führen.
76 Graphische Darstellungen Geschummelt: Graphische Tricksereien Beunruhigend große Fluktuationen beim Dornfelder? Hektarerträge Dornfelder, (in hl) Hektarertrag Jahr 43/101
77 Graphische Darstellungen Geschummelt: Graphische Tricksereien Beunruhigend große Fluktuationen beim Dornfelder? Hektarerträge Dornfelder, (in hl) Hektarertrag Jahr 44/101
78 Graphische Darstellungen Geschummelt: Graphische Tricksereien Rotwein in RLP: nur ein Tröpfchen? Bestockte Weinflächen in RLP 2013 Rotwein: 8881 ha Weißwein: ha Daten: Statistisches Landesamt RLP; Bilder (c) Benutzer André Karwath 45/101
79 Graphische Darstellungen Geschummelt: Graphische Tricksereien Rotwein in RLP: nur ein Tröpfchen? Bestockte Weinflächen in RLP Rotwein: 8881 ha Weißwein: ha Daten: Statistisches Landesamt RLP 46/101
80 47/101 Fazit Graphische Darstellungen Geschummelt: Graphische Tricksereien 1 Histogramme erlauben einen detailierten Blick auf die Daten
81 47/101 Fazit Graphische Darstellungen Geschummelt: Graphische Tricksereien 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen
82 47/101 Fazit Graphische Darstellungen Geschummelt: Graphische Tricksereien 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen 3 Boxplot können große Datenmengen vereinfacht zusammenfassen
83 47/101 Fazit Graphische Darstellungen Geschummelt: Graphische Tricksereien 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen 3 Boxplot können große Datenmengen vereinfacht zusammenfassen 4 Bei kleinen Datenmengen eher Stripcharts angemessen
84 47/101 Fazit Graphische Darstellungen Geschummelt: Graphische Tricksereien 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen 3 Boxplot können große Datenmengen vereinfacht zusammenfassen 4 Bei kleinen Datenmengen eher Stripcharts angemessen 5 Vorsicht mit Tricks wie 3D oder halbtransparenten Farben
85 Inhalt Statistische Kenngrößen 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 48/101
86 Statistische Kenngrößen 49/101 Es ist oft möglich, das Wesentliche an einer Stichprobe mit ein paar Zahlen zusammenzufassen.
87 Statistische Kenngrößen 50/101 Wesentlich: 1. Wie groß? 2. Wie variabel?
88 Statistische Kenngrößen 50/101 Wesentlich: 1. Wie groß? Lageparameter 2. Wie variabel?
89 Statistische Kenngrößen 50/101 Wesentlich: 1. Wie groß? Lageparameter 2. Wie variabel? Streuungsparameter
90 Inhalt Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 51/101
91 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 52/101 Eine Möglichkeit kennen wir schon aus dem Boxplot:
92 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 53/101 Lageparameter Der Median
93 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 53/101 Lageparameter Der Median Streuungsparameter
94 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 53/101 Lageparameter Der Median Streuungsparameter Der Quartilabstand (Q 3 Q 1 )
95 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 54/101 Der Median 1 : die Hälfte der Beobachtungen sind kleiner, die Hälfte sind größer. 1 saloppe Definition (wir sehen gleich die präzise Definition)
96 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 54/101 Der Median 1 : die Hälfte der Beobachtungen sind kleiner, die Hälfte sind größer. Der Median ist das 50%-Quantil der Daten. 1 saloppe Definition (wir sehen gleich die präzise Definition)
97 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das erste Quartil 2, Q 1 : 2 saloppe Definition (wir sehen gleich die präzise Definition) 55/101
98 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das erste Quartil 2, Q 1 : ein Viertel der Beobachtungen sind kleiner, drei Viertel sind größer. 2 saloppe Definition (wir sehen gleich die präzise Definition) 55/101
99 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das erste Quartil 2, Q 1 : ein Viertel der Beobachtungen sind kleiner, drei Viertel sind größer. Q 1 ist das 25%-Quantil der Daten. 2 saloppe Definition (wir sehen gleich die präzise Definition) 55/101
100 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das dritte Quartil 3, Q 3 : 3 saloppe Definition (wir sehen gleich die präzise Definition) 56/101
101 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das dritte Quartil 3, Q 3 : drei Viertel der Beobachtungen sind kleiner, ein Viertel sind größer. 3 saloppe Definition (wir sehen gleich die präzise Definition) 56/101
102 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das dritte Quartil 3, Q 3 : drei Viertel der Beobachtungen sind kleiner, ein Viertel sind größer. Q 3 ist das 75%-Quantil der Daten. 3 saloppe Definition (wir sehen gleich die präzise Definition) 56/101
103 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 57/101 (Empirische) Quantile, allgemein Seien n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). q ist (ein) α-quantil der n Beobachtungswerte, wenn gilt 1 n {1 i n x i q} α und 1 n {1 i n x i q} 1 α.
104 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 57/101 (Empirische) Quantile, allgemein Seien n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). q ist (ein) α-quantil der n Beobachtungswerte, wenn gilt 1 n {1 i n x i q} α und 1 n {1 i n x i q} 1 α. Bem.: Im Allgemeinen ist ein α-quantil nicht eindeutig: Seien x (1) x (2) x (n) die der Größe nach sortierten Werte. Wenn α = k n mit 1 k < n, so ist jeder Wert q [x (k), x (k+1) ] ein α-quantil, denn {i x i x (k) } k, {i x i x (k) } n k + 1. Wenn nα / {1,..., n 1}, so ist das α-quantil der Wert x (k) mit k = αn.
105 58/101 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile (Empirische) Quantile, allgemein II n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). (ein) α-quantil q der n Beobachtungswerte erfüllt 1 n {1 i n x i q} α und 1 n {1 i n x i q} 1 α.
106 Bem.: Die Definition passt zu unserer früheren Definition für Verteilungen, wenn man die empirische Verteilung 1 n n i=1 δ xi betrachtet. In der Literatur (und auch in Statistik-Software) sind verschiedene Interpolationen üblich, um das α-quantil stetig in α zu machen. (In R siehe etwa help(quantile), es sind 9 Varianten implementiert.) Die Uneindeutigkeit des α-quantils ist für halbwegs große n in der Praxis oft wenig von Belang. 58/101 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile (Empirische) Quantile, allgemein II n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). (ein) α-quantil q der n Beobachtungswerte erfüllt 1 n {1 i n x i q} α und 1 n {1 i n x i q} 1 α.
107 Inhalt Statistische Kenngrößen Mittelwert und Standardabweichung 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 59/101
108 Statistische Kenngrößen Mittelwert und Standardabweichung 60/101 n (reelle) Beobachtungswerte x 1, x 2,..., x n Am häufigsten werden benutzt: Lageparameter Der Mittelwert x = 1 n n x i i=1
109 Statistische Kenngrößen Mittelwert und Standardabweichung 60/101 n (reelle) Beobachtungswerte x 1, x 2,..., x n Am häufigsten werden benutzt: Lageparameter Der Mittelwert x = 1 n n x i i=1 Streuungsparameter Die Standardabweichung s (bzw. σ)
110 Statistische Kenngrößen Mittelwert und Standardabweichung 60/101 n (reelle) Beobachtungswerte x 1, x 2,..., x n σ 2 = 1 n s 2 = n i=1 1 n 1 Am häufigsten werden benutzt: Lageparameter Der Mittelwert x = 1 n n x i i=1 Streuungsparameter Die Standardabweichung s (bzw. σ) wobei (x i x) 2 die (empirische) Varianz n i=1 ( = n n 1 σ2 ) (x i x) 2 die korrigierte Stichproben-Varianz
111 Statistische Kenngrößen Mittelwert und Standardabweichung 61/101 Erinnerung: Geometrische Bedeutung des Mittelwerts Der Schwerpunkt
112 Statistische Kenngrößen Mittelwert und Standardabweichung 62/101 Wir stellen uns die Beobachtungen als gleich schwere Gewichte auf einer Waage vor: x
113 Statistische Kenngrößen Mittelwert und Standardabweichung 62/101 Wo muß der Drehpunkt sein, damit die Waage im Gleichgewicht ist? x
114 Statistische Kenngrößen Mittelwert und Standardabweichung 63/101 m = 1,5?
115 Statistische Kenngrößen Mittelwert und Standardabweichung 63/101 m = 1,5? zu klein
116 Statistische Kenngrößen Mittelwert und Standardabweichung 63/101 m = 2?
117 Statistische Kenngrößen Mittelwert und Standardabweichung 63/101 m = 2? zu groß
118 Statistische Kenngrößen Mittelwert und Standardabweichung 63/101 m = 1,8?
119 Statistische Kenngrößen Mittelwert und Standardabweichung 63/101 m = 1,8? richtig
120 Statistische Kenngrößen Mittelwert und Standardabweichung 64/101 Oft kann man mit dem bloßen Auge anhand eines Histogramms den Mittelwert gut einschätzen. Beispiel: Galathea intermedia Rundlichkeit := Abdominalbreite / Carapaxlänge
121 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
122 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
123 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
124 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
125 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
126 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
127 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
128 Statistische Kenngrößen Mittelwert und Standardabweichung 65/101
129 Statistische Kenngrößen Mittelwert und Standardabweichung 66/101 Beispiel:
130 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
131 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
132 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
133 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
134 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
135 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
136 Statistische Kenngrößen Mittelwert und Standardabweichung 67/101
137 Statistische Kenngrößen Mittelwert und Standardabweichung 68/101 Die Standardabweichung (auch: Streuung)
138 Statistische Kenngrößen Mittelwert und Standardabweichung 68/101 Die Standardabweichung (auch: Streuung) Wie weit weicht eine typische Beobachtung vom Mittelwert ab?
139 69/101 Statistische Kenngrößen Mit n oder n 1 berechnen? Mittelwert und Standardabweichung Die Standardabweichung σ eines Zufallsexperiments mit n gleichwahrscheinlichen Ausgängen x 1,..., x n (z.b. Würfelwurf) ist definiert durch σ = 1 n n i=1 (x i x) 2.
140 69/101 Statistische Kenngrößen Mit n oder n 1 berechnen? Mittelwert und Standardabweichung Die Standardabweichung σ eines Zufallsexperiments mit n gleichwahrscheinlichen Ausgängen x 1,..., x n (z.b. Würfelwurf) ist definiert durch σ = 1 n n i=1 (x i x) 2. Wenn es sich bei x 1,..., x n um Beobachtungswerte in einer Stichprobe handelt, verwendet man eher s = 1 n 1 n i=1 (x i x) 2.
141 70/101 Statistische Kenngrößen s als Schätzer für σ Mittelwert und Standardabweichung Wir werden sehen: Wenn X 1,..., X n u.i.v. Zufallsvariablen mit Varianz Var[X 1 ] = σ 2, so hat die Zufallsvariable X = 1 n n i=1 X i, die Eigenschaft S 2 = 1 n 1 n i=1 E[S 2 ] = σ 2. (X i X) 2
142 71/101 Statistische Kenngrößen Mittelwert und Standardabweichung Faustregel für die Standardabweichung Bei ungefähr glockenförmigen (also eingipfligen und symmetrischen) Verteilungen liegen ca. 2/3 der Verteilung zwischen x σ und x + σ. probability density x σ x x + σ
143 Statistische Kenngrößen Mittelwert und Standardabweichung Faustregel für die Standardabweichung Bei ungefähr glockenförmigen (also eingipfligen und symmetrischen) Verteilungen liegen ca. 2/3 der Verteilung zwischen x σ und x + σ. probability density x σ x x + σ Oft kann man so die Standardabweichung mit bloßem Auge abschätzen. 71/101
144 72/101 Statistische Kenngrößen Mittelwert und Standardabweichung Standardabweichung der Carapaxlängen nichteiertragender Weibchen vom Nichteiertragende Weibchen Dichte x = Carapaxlänge [mm]
145 72/101 Statistische Kenngrößen Mittelwert und Standardabweichung Standardabweichung der Carapaxlängen nichteiertragender Weibchen vom Nichteiertragende Weibchen Dichte σ = 0.28 σ 2 = x = Carapaxlänge [mm]
146 72/101 Statistische Kenngrößen Mittelwert und Standardabweichung Standardabweichung der Carapaxlängen nichteiertragender Weibchen vom Nichteiertragende Weibchen Dichte σ = 0.28 σ 2 = x = Carapaxlänge [mm] Hier liegt der Anteil zwischen x σ und x + σ bei 72%.
147 Inhalt Beispiele zum Sinn und Unsinn von Mittelwerten 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 73/101
148 Beispiele zum Sinn und Unsinn von Mittelwerten 74/101 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung (zumindest in etwa) glockenförmig ist
149 Beispiele zum Sinn und Unsinn von Mittelwerten 74/101 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung (zumindest in etwa) glockenförmig ist und müssen andernfalls mit Vorsicht interpretiert werden.
150 Beispiele zum Sinn und Unsinn von Mittelwerten 74/101 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung (zumindest in etwa) glockenförmig ist und müssen andernfalls mit Vorsicht interpretiert werden. Wir betrachten dazu einige Lehrbuch-Beispiele aus der Biologie, siehe z.b. M. Begon, C. R. Townsend, and J. L. Harper. Ecology: From Individuals to Ecosystems. Blackell Publishing, 4 edition, (Wir verwenden an die Originalpublikationen angelehnte simulierte Daten, nehmen Sie also nicht alle Datenpunkte wörtlich.)
151 Inhalt Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 75/101
152 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wa hlerische Bachstelzen Bachstelzen fressen Dungfliegen Ra uber Beute Bachstelze (White Wagtail) Motacilla alba alba Gelbe Dungfliege Scatophaga stercoraria image (c) by Artur Mikołajewski image (c) by Viatour Luc 76/101
153 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 77/101 Vermutung Die Fliegen sind unterschiedlich groß Effizienz für die Bachstelze = Energiegewinn / Zeit zum Fangen und fressen Laborexperimente lassen vermuten, dass die Effizienz bei 7mm großen Fliegen maximal ist. N.B. Davies. Prey selection and social behaviour in wagtails (Aves: Motacillidae). J. Anim. Ecol., 46:37 57, 1977.
154 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 available dung flies number length [mm]
155 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 available dung flies number mean= length [mm]
156 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 available dung flies number mean= 7.99 sd= length [mm]
157 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 captured dung flies number length [mm]
158 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 captured dung flies number mean= length [mm]
159 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 captured dung flies number mean= 6.79 sd= length [mm]
160 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 78/101 dung flies: available, captured fraction per mm captured available length [mm]
161 79/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen Mittelwert captured available dung flies: available, captured fraction per mm captured available length [mm]
162 79/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured Mittelwert < available dung flies: available, captured fraction per mm captured available length [mm]
163 79/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 dung flies: available, captured fraction per mm captured available length [mm]
164 79/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 Standardabweichung dung flies: available, captured fraction per mm captured available length [mm]
165 79/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 Standardabweichung < dung flies: available, captured fraction per mm captured available length [mm]
166 79/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 Standardabweichung 0.69 < 0.96 dung flies: available, captured fraction per mm captured available length [mm]
167 80/101 Beispiele zum Sinn und Unsinn von Mittelwerten Interpretation Beispiel: Wählerische Bachstelzen Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mm groß sind.
168 80/101 Beispiele zum Sinn und Unsinn von Mittelwerten Interpretation Beispiel: Wählerische Bachstelzen Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mm groß sind. Hier waren die Verteilungen glockenförmig und es genügten 4 Werte (die beiden Mittelwerte und die beiden Standardabweichungen), um die Daten adäquat zu beschreiben.
169 Inhalt Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 81/101
170 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 82/101 Nephila madagascariensis image (c) by Bernard Gagnon
171 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 83/101 Simulierte Daten: Eine Stichprobe von 70 Spinnen Mittlere Größe: 21,06 mm Standardabweichung der Größe: 12,94 mm
172 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 84/101????? Frequency size [mm]
173 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 84/101 Nephila madagascariensis (n=70) Frequency size [mm]
174 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 84/101 Nephila madagascariensis (n=70) Frequency mean= size [mm]
175 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 84/101 Nephila madagascariensis (n=70) Frequency males females size [mm]
176 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 84/101 Nephila madagascariensis (n=70) Frequency males females size [mm]
177 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman Nephila madagascariensis image (c) by Arthur Chapman 85/101
178 86/101 Beispiele zum Sinn und Unsinn von Mittelwerten Fazit des Spinnenbeispiels Beispiel: Spiderman & Spiderwoman Wenn die Daten aus verschiedenen Gruppen zusammengesetzt sind, die sich bezüglich des Merkmals deutlich unterscheiden, kann es sinnvoll sein, Kenngrößen wie den Mittelwert für jede Gruppe einzeln zu berechnen.
179 Inhalt Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 87/101
180 88/101 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras Kupfertolerantes Rotes Straußgras Rotes Straußgras Agrostis tenuis image (c) Kristian Peters Kupfer Cuprum Hendrick met de Bles
181 Beispiele zum Sinn und Unsinn von Mittelwerten Anpassung an Kupfer? Beispiel: Kupfertoleranz beim Roten Straußgras Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. A.D. Bradshaw. Population Differentiation in agrostis tenius Sibth. III. populations in varied environments. New Phytologist, 59(1):92 103, T. McNeilly and A.D Bradshaw. Evolutionary Processes in Populations of Copper Tolerant Agrostis tenuis Sibth. 89/101
182 Beispiele zum Sinn und Unsinn von Mittelwerten Anpassung an Kupfer? Beispiel: Kupfertoleranz beim Roten Straußgras Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. Die Wurzellängen von Pflanzen aus der Umgebung von Kupferminen wird gemessen. A.D. Bradshaw. Population Differentiation in agrostis tenius Sibth. III. populations in varied environments. New Phytologist, 59(1):92 103, T. McNeilly and A.D Bradshaw. Evolutionary Processes in Populations of Copper Tolerant Agrostis tenuis Sibth. 89/101
183 Beispiele zum Sinn und Unsinn von Mittelwerten Anpassung an Kupfer? Beispiel: Kupfertoleranz beim Roten Straußgras Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. Die Wurzellängen von Pflanzen aus der Umgebung von Kupferminen wird gemessen. Samen von unbelasteten Wiesen werden bei Kupferminen eingesät. A.D. Bradshaw. Population Differentiation in agrostis tenius Sibth. III. populations in varied environments. New Phytologist, 59(1):92 103, T. McNeilly and A.D Bradshaw. Evolutionary Processes in Populations of Copper Tolerant Agrostis tenuis Sibth. 89/101
184 Beispiele zum Sinn und Unsinn von Mittelwerten Anpassung an Kupfer? Beispiel: Kupfertoleranz beim Roten Straußgras Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. Die Wurzellängen von Pflanzen aus der Umgebung von Kupferminen wird gemessen. Samen von unbelasteten Wiesen werden bei Kupferminen eingesät. Die Wurzellängen dieser Wiesenpflanzen werden gemessen. A.D. Bradshaw. Population Differentiation in agrostis tenius Sibth. III. populations in varied environments. New Phytologist, 59(1):92 103, T. McNeilly and A.D Bradshaw. Evolutionary Processes in Populations of Copper Tolerant Agrostis tenuis Sibth. 89/101
185 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 90/101 Browntop Bent (n=50) density per cm Copper Mine Grass root length (cm)
186 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 90/101 Browntop Bent (n=50) density per cm Grass seeds from a meadow root length (cm)
187 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 90/101 Browntop Bent (n=50) density per cm Grass seeds from a meadow copper tolerant? root length (cm)
188 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 90/101 Browntop Bent (n=50) density per cm meadow plants copper mine plants root length (cm)
189 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 90/101 Browntop Bent (n=50) density per cm copper mine plants m s m m+s root length (cm)
190 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 90/101 Browntop Bent (n=50) density per cm m s m m+s meadow plants root length (cm) 2/3 der Wurzellängen innerhalb [m-sd,m+sd]???? Nein!
191 91/101 Beispiele zum Sinn und Unsinn von Mittelwerten Fazit des Straußgras-Beispiels Beispiel: Kupfertoleranz beim Roten Straußgras Manche Verteilungen können nur mit mehr als zwei Variablen angemessen beschrieben werden.
192 91/101 Beispiele zum Sinn und Unsinn von Mittelwerten Fazit des Straußgras-Beispiels Beispiel: Kupfertoleranz beim Roten Straußgras Manche Verteilungen können nur mit mehr als zwei Variablen angemessen beschrieben werden. z.b. mit den fünf Werten der Boxplots: min, Q 1, median, Q 3, max
193 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 92/101 Browntop Bent n=50+50 copper mine plants meadow plants root length (cm)
194 93/101 Beispiele zum Sinn und Unsinn von Mittelwerten Schlussfolgerung Beispiel: Kupfertoleranz beim Roten Straußgras Viele Datenverteilungen sind annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung hinreichend beschrieben werden.
195 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 93/101 Schlussfolgerung Viele Datenverteilungen sind annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung hinreichend beschrieben werden. Es gibt aber auch Ausnahmen. Also: Besser ist es, die Daten auch graphisch zu untersuchen, und sich nicht allein auf numerische Kenngrößen zu verlassen.
196 Inhalt Übrigens: Das Statistikpaket R 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 94/101
197 95/101 Was ist R? Übrigens: Das Statistikpaket R Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden.
198 95/101 Was ist R? Übrigens: Das Statistikpaket R Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden. (R ist eine für die Statistik und für stochastische Simulation entwickelte Programmiersprache, zudem sind viele statistische Standardverfahren bereits in R implementiert oder als Zusatzpaket verfügbar. R wird auch im Stochastik-Praktikum verwendet.)
199 95/101 Was ist R? Übrigens: Das Statistikpaket R Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden. (R ist eine für die Statistik und für stochastische Simulation entwickelte Programmiersprache, zudem sind viele statistische Standardverfahren bereits in R implementiert oder als Zusatzpaket verfügbar. R wird auch im Stochastik-Praktikum verwendet.) R hat eine sehr aktive Benutzer- und Entwicklergemeinde (die nahezu alle Bereiche der Statistik und viele Anwendungsbereiche (z.b. Populationsgenetik, Finanzmathematik) überdeckt).
200 Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden. (R ist eine für die Statistik und für stochastische Simulation entwickelte Programmiersprache, zudem sind viele statistische Standardverfahren bereits in R implementiert oder als Zusatzpaket verfügbar. R wird auch im Stochastik-Praktikum verwendet.) R hat eine sehr aktive Benutzer- und Entwicklergemeinde (die nahezu alle Bereiche der Statistik und viele Anwendungsbereiche (z.b. Populationsgenetik, Finanzmathematik) überdeckt). R ist frei verfügbar unter der GNU general public license, für (nahezu) alle Rechnerarchitekturen erhältlich: R ist auf ZDV-Rechnern installiert. 95/101 Was ist R? Übrigens: Das Statistikpaket R
201 Übrigens: Das Statistikpaket R 96/101 R installieren, starten, anhalten Installation: Windows, Mac OS: Binaries von (siehe Link Download, Packages, CRAN dort) Linux: Für die meisten Distributionen gibt es fertige Pakete Fragen oder Probleme: Sprechstunde (F. Klement), Mi 16-18h, PC-Pool R starten: Windows, Mac OS: Icon (ggf. aus Menu) anklicken, Linux/Unix: > R auf einer Konsole (oder mit ESS aus Emacs heraus, oder aus rstudio,...). R beenden: q() (fragt, ob Daten gespeichert werden sollen) laufende Rechnungen unterbrechen: CTRL-C
202 Inhalt Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots Geschummelt: Graphische Tricksereien 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 97/101
203 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R Datensatz x in R eingeben x <- c( 53,52,41,41,42,58,40,43,42,38,43,49,34,51,45, 39,41,45,45,39,37,36,42,44,47,43,46,43,43,45, 42,52,49,44,50,40,47,46,50,50,41,51,41,47,42, 52,36,46,42,56,39,40,36,42,36,36,47,45,47,49 ) (aus Datei einlesen: x <- scan( Dateiname )) Mittelwert (mean), Standardabweichung (sd), Median, und Quantile mean(x) sd(x) median(x) quantile(x, 0.25, type=1) quantile(x, 0.75, type=1) summary(x) Boxplot, Histogramm boxplot(x) hist(x) 98/101
204 99/101 Übrigens: Das Statistikpaket R Nur zur Information: Literatur zu R Deskriptive Statistik mit R Wir werden im Zusammenhang der Vorlesung nur (fakultativ) einige wenige R-Befehle ansprechen, so dass Sie für etwaige freiwillige R-Schnupperei i.a. keine Literatur benötigen werden. Standardreferenz : W.N. Venables et al, An Introduction to R, Günther Sawitzki, Einführung in R, William N. Venables, Brian D. Ripley, Modern applied statistics with S ( Standardlehrbuch, UB Lehrbuchsammlung) Lothar Sachs and Jürgen Hedderich, Angewandte Statistik Methodensammlung mit R (E-Book, UB) Christine Duller, Einführung in die nichtparametrische Statistik mit SAS und R : ein anwendungsorientiertes Lehr- und Arbeitsbuch (E-Book, UB) Helge Toutenburg, Christian Heumann, Deskriptive Statistik : Eine Einführung in Methoden und Anwendungen mit R und SPSS (E-Book, UB) Uwe Ligges, Programmieren mit R (E-Book, UB)
205 Übrigens: Das Statistikpaket R Deskriptive Statistik mit R 100/101
206 101/101 Nochmal: Idee der Statistik Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren
207 101/101 Nochmal: Idee der Statistik Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden.
Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik
Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Martin Hutzenthaler & Dirk Metzler 17. April 2012 Inhaltsverzeichnis 1 Einführung 1 1.1 Konzept und Quellen.........................................
MehrWahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik
Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik Noémie Becker & Dirk Metzler 17. April 2013 Inhaltsverzeichnis 1 Einführung 1 1.1 Konzept und Quellen.........................................
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler
Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 27. April 2010 1 Eine kurze Wiederholung
MehrIDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch. Zufall (mathematische Abstraktion) modellieren.
IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren. Statistik = Datenanalyse mit Hilfe stochastischer Modelle Theoretische Statistik ist ein Teil
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Der Standardfehler
Wahrscheinlichkeitsrechnung und Statistik für Biologen Der Standardfehler Matthias Birkner & Dirk Metzler 28 April 2009 1 Inhaltsverzeichnis 1 Ein 11 12 13 14 kurze Wiederholung zur deskriptiven Statistik
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
MehrTeil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele
Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler
Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Noémie Becker & Dirk Metzler 15. April 2016 Inhaltsverzeichnis 1 Der Standardfehler 1 1.1 Ein Versuch............................................
Mehr2. Deskriptive Statistik
Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten
MehrIf something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra
If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If you torture your data long enough, they will tell you whatever you want to hear. James L. Mills Warum Biostatistik?
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten
MehrBitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
MehrErste Schritte mit R. 2.1 Herunterladen der freien Software R
Erste Schritte mit R 2 BevorwirunsmitdeninKap.1 eingeführten Fragestellungen beschäftigen, brauchen wir noch ein Werkzeug, um die Datensätze später wirklich auswerten zu können. Sicher lässt sich das in
Mehr1 Univariate Statistiken
1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik
MehrDatenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung
Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt
MehrBeispiel 4 (Einige weitere Aufgaben)
1 Beispiel 4 (Einige weitere Aufgaben) Aufgabe 1 Bestimmen Sie für die folgenden Zweierstichproben, d. h. Stichproben, die jeweils aus zwei Beobachtungen bestehen, a) den Durchschnitt x b) die mittlere
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive
Mehr3. Deskriptive Statistik
3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht
MehrStatistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg
Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG Markus.Schumacher@physik.uni-freiburg.de
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey
Mehr5 Exkurs: Deskriptive Statistik
5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe
MehrBeschreibende Statistik und der Übergang zur beurteilenden Statistik
Beschreibende Statistik und der Übergang zur beurteilenden Statistik Guido Herweyers KHBO Campus Oostende K.U.Leuven 1. Vorwort Der Einsatz des Voyage 200 erleichert die Verarbeitung von Daten und erlaubt
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter
MehrEinheit 1. Einführung in R. IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11
Einheit 1 Einführung in R IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11 Einführung R ist ein Software-Paket für Statistisches Rechnen und Graphik. Es ist die Open Source Implementierung
MehrUnivariate explorative Datenanalyse in R
Univariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-03 1 Ein metrisches Merkmal Wir laden den Datensatz: R> load("statlab.rda") und machen die Variablen direkt verfügbar: R>
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 26.02.2008 1 Warum Statistik und Wahrscheinlichkeits rechnung im Ingenieurwesen? Zusammenfassung der letzten Vorlesung Statistik und Wahrscheinlichkeitsrechnung
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrMathematik IV: Statistik
für D-UWIS, D-ERDW, D-USYS und D-HEST SS16 Sie hören Vitamin String Quartet Daniel Stekhoven 14.04.2016 1 Daniel Stekhoven 14.04.2016 2 Überblick Lernziele Erledigt! Grundlagen Wahrscheinlichkeitsmodell
MehrBerechnung von W für die Elementarereignisse einer Zufallsgröße
R. Albers, M. Yanik Skript zur Vorlesung Stochastik (lementarmathematik) 5. Zufallsvariablen Bei Zufallsvariablen geht es darum, ein xperiment durchzuführen und dem entstandenen rgebnis eine Zahl zuzuordnen.
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal
MehrI. Deskriptive Statistik 1
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................
MehrEinführung in die Statistik mit R
Einführung in die Statistik mit R Bernd Weiler syntegris information solutions GmbH Neu Isenburg Schlüsselworte Statistik, R Einleitung Es ist seit längerer Zeit möglich statistische Berechnungen mit der
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
Mehr10. Die Normalverteilungsannahme
10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrStichwortverzeichnis. Symbole
Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,
MehrGrundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik
INSTITUT FÜR STOCHASTIK WS 2007/08 UNIVERSITÄT KARLSRUHE Blatt 1 Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen
MehrHerzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer
MehrStatistik I für Betriebswirte Vorlesung 9
Statistik I für Betriebswirte Vorlesung 9 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik Vorlesung am 8. Juni 2017 im Audi-Max (AUD-1001) Dr. Andreas Wünsche Statistik I für Betriebswirte
MehrTeil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation
Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-214 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2017 Organisatorisches Anmeldung in Basis: 19. 23.06.2017 Skript und Übungsaufgaben unter: http://www.iam.uni-bonn.de/users/rezny/statistikpraktikum
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrKapitel 1: Deskriptive Statistik
Kapitel 1: Deskriptive Statistik Grafiken 1 Statistische Kennwerte 5 z-standardisierung 7 Grafiken Mit Hilfe von SPSS lassen sich eine Vielzahl unterschiedlicher Grafiken für unterschiedliche Zwecke erstellen.
MehrPROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
MehrWas ist R? Warum R? Literatur Eine Beispielsitzung mit R. Einführung in R. Dr. Mike Kühne. Technische Universität Dresden Institut für Soziologie
Technische Universität Dresden Institut für Soziologie Übersicht 1 Was ist R? 2 3 4 Die Sprache R Geschichte Übersicht 1 Was ist R? Die Sprache R Geschichte 2 3 4 Die Sprache R Geschichte Was ist R? Flexible
MehrDatenanalyse. (PHY231) Herbstsemester Olaf Steinkamp
Datenanalyse (PHY23) Herbstsemester 207 Olaf Steinkamp 36-J-05 olafs@physik.uzh.ch 044 63 55763 Vorlesungsprogramm Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Mehr1.5 Erwartungswert und Varianz
Ziel: Charakterisiere Verteilungen von Zufallsvariablen durch Kenngrößen (in Analogie zu Lage- und Streuungsmaßen der deskriptiven Statistik). Insbesondere: a) durchschnittlicher Wert Erwartungswert, z.b.
MehrEine Einführung in R: Dichten und Verteilungsfunktionen
Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 25. November 2009 Bernd
MehrInhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Die Grundgesamtheit......................... 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................ 10
MehrStatistik und Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Im ersten Schritt werden wir die Daten nur beschreiben:
MehrGrundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften
Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Grundlagen der Biometrie, WS 2011/12 Vorlesung: Dienstag 8.15-9.45,
Mehr1.5 Erwartungswert und Varianz
Ziel: Charakterisiere Verteilungen von Zufallsvariablen (Bildbereich also reelle Zahlen, metrische Skala) durch Kenngrößen (in Analogie zu Lage- und Streuungsmaßen der deskriptiven Statistik). Insbesondere:
MehrEinführung in die computergestützte Datenanalyse
Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL
MehrEine Einführung in R: Dichten und Verteilungsfunktionen
Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
MehrAnteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen
DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung
MehrFerienkurse Mathematik Sommersemester 2009
Ferienkurse Mathematik Sommersemester 2009 Statistik: Grundlagen 1.Aufgabenblatt mit praktischen R-Aufgaben Aufgabe 1 Lesen Sie den Datensatz kid.weights aus dem Paket UsingR ein und lassen sie die Hilfeseite
MehrHäufigkeitsverteilungen und Statistische Maßzahlen. Häufigkeitsverteilungen und Statistische Maßzahlen. Variablentypen. Stichprobe und Grundgesamtheit
TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Häufigkeitsverteilungen und Statistische Maßzahlen Statistik SS Variablentypen Qualitative
MehrTeil VIII Hypothesentests für zwei Stichproben
Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrDeskriptive Statistik
Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer
Mehr3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität 0.0 0.1 0.2 0.3 0.4 0.
Eine Verteilung ist durch die Angabe von einem oder mehreren Mittelwerten nur unzureichend beschrieben. Beispiel: Häufigkeitsverteilungen mit gleicher zentraler Tendenz: geringe Variabilität mittlere Variabilität
MehrBiostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 Wahrscheinlichkeitstheorie:, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 7. Vorlesung: 09.12.2011 1/58 Inhalt 1 2 Kenngrößen von Lagemaße 2/58 mit Dichte Normalverteilung
MehrStatistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt
MehrDer Mittelwert (arithmetisches Mittel)
Der Mittelwert (arithmetisches Mittel) x = 1 n n x i bekanntestes Lagemaß instabil gegen extreme Werte geeignet für intervallskalierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut
MehrNachklausur zur Vorlesung. Statistik für Studierende der Biologie
Institut für Mathematische Stochastik WS 1999/2000 Universität Karlsruhe 11. Mai 2000 Dr. Bernhard Klar Nachklausur zur Vorlesung Statistik für Studierende der Biologie Bearbeitungszeit: 90 Minuten Name:
Mehr8 Stichprobenkennwerteverteilung
8 Stichprobenkennwerteverteilung 8.1 Vorbemerkungen 8.2 Die Normalverteilung: Teil 2 8.3 Die t Verteilung 8.4 Normalverteilungs Approximation: Der zentrale Grenzwertsatz 8.1 Vorbemerkungen Daten x 1,...,
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Wahrscheinlichkeitsfunktionen
MehrStatistik. Einführung in die com putergestützte Daten an alyse. Oldenbourg Verlag München B , überarbeitete Auflage
Statistik Einführung in die com putergestützte Daten an alyse von Prof. Dr. Karlheinz Zwerenz 4., überarbeitete Auflage B 366740 Oldenbourg Verlag München Inhalt Vorwort XI Hinweise zu EXCEL und SPSS XII
Mehr5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 5.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrUniversität Basel Wirtschaftswissenschaftliches Zentrum. Zufallsvariablen. Dr. Thomas Zehrt
Universität Basel Wirtschaftswissenschaftliches Zentrum Zufallsvariablen Dr. Thomas Zehrt Inhalt: 1. Einführung 2. Zufallsvariablen 3. Diskrete Zufallsvariablen 4. Stetige Zufallsvariablen 5. Erwartungswert
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Mehr1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18
3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen
MehrBOXPLOT 1. Begründung. Boxplot A B C
BOXPLOT 1 In nachstehender Tabelle sind drei sortierte Datenreihen gegeben. Zu welchem Boxplot gehört die jeweilige Datenreihe? Kreuze an und begründe Deine Entscheidung! Boxplot A B C Begründung 1 1 1
MehrBeispiel 2 (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter)
Beispiel (Einige Aufgaben zu Lageparametern) Aufgabe 1 (Lageparameter) 1 Ein Statistiker ist zu früh zu einer Verabredung gekommen und vertreibt sich nun die Zeit damit, daß er die Anzahl X der Stockwerke
Mehr4. Kumulierte Häufigkeiten und Quantile
4. Kumulierte Häufigkeiten und Quantile Statistik für SoziologInnen 1 4. Kumulierte Häufigkeiten und Quantile Kumulierte Häufigkeiten Oft ist man nicht an der Häufigkeit einzelner Merkmalsausprägungen
MehrChristine Duller. Einfuhrung in die Statistik. mit EXCEL und SPSS. Ein anwendungsorientiertes. Lehr- und Arbeitsbuch. 3., uberarbeitete Auflage
Christine Duller Einfuhrung in die Statistik mit EXCEL und SPSS Ein anwendungsorientiertes Lehr- und Arbeitsbuch 3., uberarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Einfiihrung 1 Was
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrLösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI
Lösungen zu Übungsblatt 9 Höhere Mathematik/Stochastik Anpassung von Verteilungen Zu Aufgabe ) a) Zeichnen des Histogranmmes: Um das Histogramm zu zeichnen, benötigen wir die Höhe der Balken. Die Höhe
MehrStatistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN
MehrStatistik für Ökonomen
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS tfü. Springer Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R 3 1.1 Installieren und Starten von R 3 1.2 R-Befehle
MehrWahrscheinlichkeitsverteilungen
Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet
MehrTests für Erwartungswert & Median
Mathematik II für Biologen 26. Juni 2015 Prolog Varianz des Mittelwerts Beispiel: Waage z-test t-test Vorzeichentest Wilcoxon-Rangsummentest Varianz des Mittelwerts Beispiel: Waage Zufallsvariable X 1,...,X
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrMathematik für Naturwissenschaften, Teil 2
Lösungsvorschläge für die Aufgaben zur Vorlesung Mathematik für Naturwissenschaften, Teil Zusatzblatt SS 09 Dr. J. Schürmann keine Abgabe Aufgabe : Eine Familie habe fünf Kinder. Wir nehmen an, dass die
MehrLehrinhalte Statistik (Sozialwissenschaften)
Lehrinhalte Technische Universität Dresden Institut für Mathematische Stochastik Dresden, 13. November 2007 Seit 2004 Vorlesungen durch Klaus Th. Hess und Hans Otfried Müller. Statistik I: Beschreibende
MehrBiomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
Mehr