7. Ideen aus der Statistik 7.1 Deskriptive Statistik

Größe: px
Ab Seite anzeigen:

Download "7. Ideen aus der Statistik 7.1 Deskriptive Statistik"

Transkript

1 1/90 7. Ideen aus der Statistik 7.1 Deskriptive Statistik Matthias Birkner

2 Ansatz der Statistik Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 2/90

3 Ansatz der Statistik 3/90 Viele Menschen stehen Statistik kritisch gegenüber: It is easy to lie with statistics.

4 Ansatz der Statistik 3/90 It is easy to lie with statistics. It is hard to tell the truth without it. Andrejs Dunkels ( )

5 4/90 Ansatz der Statistik Worum geht es in der Statistik? Die Natur ist voller Variabilität.

6 4/90 Ansatz der Statistik Worum geht es in der Statistik? Die Natur ist voller Variabilität. Wie geht man mit variablen Daten um?

7 4/90 Ansatz der Statistik Worum geht es in der Statistik? Die Natur ist voller Variabilität. Wie geht man mit variablen Daten um? Idee der Statistik: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren

8 4/90 Ansatz der Statistik Worum geht es in der Statistik? Die Natur ist voller Variabilität. Wie geht man mit variablen Daten um? Idee der Statistik: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden.

9 4/90 Ansatz der Statistik Worum geht es in der Statistik? Die Natur ist voller Variabilität. Wie geht man mit variablen Daten um? Idee der Statistik: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden. Man versucht dann, anhand der Daten Rückschlüsse auf Parameter des Modells zu ziehen, und so systematische Effekte von Zufälligem zu trennen.

10 5/90 Ansatz der Statistik Deskriptive (d.h. beschreibende) Statistik Wie geht man mit variablen Daten um?

11 5/90 Ansatz der Statistik Deskriptive (d.h. beschreibende) Statistik Wie geht man mit variablen Daten um? 0. Antwort : Man verschafft sich einen ersten Eindruck mittels graphischer Darstellungen und statistischer Kenngrößen

12 Graphische Darstellungen Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 6/90

13 Graphische Darstellungen (Daten aus einer Diplomarbeit aus 2001 am Forschungsinstitut Senckenberg, Frankfurt am Main, Crustaceensektion, Leitung: Prof. Michael Türkay) 7/90 Der Springkrebs Galathea intermedia

14 Graphische Darstellungen 8/90 Helgoländer Tiefe Rinne, Fang vom Carapaxlänge (mm): Nichteiertragende Weibchen (n = 215) 2,9 3,0 2,9 2,5 2,7 2,9 2,9 3,0 3,0 2,9 3,4 2,8 2,9 2,8 2,8 2,4 2,8 2,5 2,7 3,0 2,9 3,2 3,1 3,0 2,7 2,5 3,0 2,8 2,8 2,8 2,7 3,0 2,6 3,0 2,9 2,8 2,9 2,9 2,3 2,7 2,6 2,7 2,5.....

15 Graphische Darstellungen Nichteiertragende Weibchen am 6. Sept. '88, n=215 Index Carapaxlänge [mm] 9/90

16 Graphische Darstellungen Histogramme und Dichtepolygone Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 10/90

17 Graphische Darstellungen Histogramme und Dichtepolygone 11/90 Eine Möglichkeit der graphischen Darstellung: das Histogramm

18 Graphische Darstellungen Histogramme und Dichtepolygone 12/90 Nichteiertragende Weibchen am 6. Sept. '88, n=215 Anzahl Carapaxlänge [mm]

19 Graphische Darstellungen Histogramme und Dichtepolygone 12/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Anzahl Wieviele haben Carapaxlänge zwischen 2,0 und 2,2? Carapaxlänge [mm]

20 Graphische Darstellungen Histogramme und Dichtepolygone 12/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Anzahl Wieviele haben Carapaxlänge zwischen 2,0 und 2,2? Carapaxlänge [mm]

21 Graphische Darstellungen Histogramme und Dichtepolygone 12/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Anzahl Wieviele haben Carapaxlänge zwischen 2,0 und 2,2? Carapaxlänge [mm]

22 Graphische Darstellungen Histogramme und Dichtepolygone 13/90 Analoge Daten zwei Monate später ( ):

23 Graphische Darstellungen Histogramme und Dichtepolygone 14/90 Nichteiertragende Weibchen am 3. Nov. '88, n=57 Anzahl Carapaxlänge [mm]

24 Graphische Darstellungen Histogramme und Dichtepolygone 15/90 Vergleich der beiden Verteilungen Nichteiertragende Weibchen Anzahl Carapaxlänge [mm]

25 Graphische Darstellungen Histogramme und Dichtepolygone 15/90 Vergleich der beiden Verteilungen Nichteiertragende Weibchen Anzahl Carapaxlänge [mm] Problem: ungleiche Stichprobenumfänge: 6.Sept: n = Nov : n = 57

26 Graphische Darstellungen Histogramme und Dichtepolygone 15/90 Vergleich der beiden Verteilungen Nichteiertragende Weibchen Anzahl Carapaxlänge [mm] 6.Sept: n = 215 Problem: ungleiche Stichprobenumfänge: 3.Nov : n = 57 Idee: stauche vertikale Achse so, dass Gesamtfläche = 1.

27 Graphische Darstellungen Histogramme und Dichtepolygone 16/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Carapaxlänge [mm]

28 Graphische Darstellungen Histogramme und Dichtepolygone 17/90 Die neue vertikale Koordinate ist jetzt eine Dichte (engl. density).

29 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Gesamtfläche= Carapaxlänge [mm]

30 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Dichte? 2.0 Gesamtfläche= Carapaxlänge [mm]

31 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Dichte = Anteil des Ganzen pro mm 2.0 Gesamtfläche= Carapaxlänge [mm]

32 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Dichte = Anteil des Ganzen pro mm 2.0 Gesamtfläche=1 Welcher Anteil hatte eine Länge zwischen 2.8 und 3.0 mm? Carapaxlänge [mm]

33 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Dichte = Anteil des Ganzen pro mm Gesamtfläche=1 Welcher Anteil hatte eine Länge zwischen 2.8 und 3.0 mm? Carapaxlänge [mm]

34 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Dichte = Anteil des Ganzen pro mm Gesamtfläche=1 Welcher Anteil hatte eine Länge zwischen 2.8 und 3.0 mm? ( ) 0.5 = Carapaxlänge [mm]

35 Graphische Darstellungen Histogramme und Dichtepolygone 18/90 Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Dichte = Anteil des Ganzen pro mm Gesamtfläche=1 Welcher Anteil hatte eine Länge zwischen 2.8 und 3.0 mm? ( ) 0.5 = % Carapaxlänge [mm]

36 Graphische Darstellungen Histogramme und Dichtepolygone 19/90 Die beiden Histogramme sind jetzt vergleichbar

37 Graphische Darstellungen Histogramme und Dichtepolygone 19/90 Die beiden Histogramme sind jetzt vergleichbar (sie haben dieselbe Gesamtfläche).

38 20/90 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen: Nichteiertragende Weibchen Dichte Carapaxlänge [mm]

39 20/90 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen: Nichteiertragende Weibchen Dichte Carapaxlänge [mm]

40 20/90 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen:

41 20/90 Graphische Darstellungen Histogramme und Dichtepolygone Versuche, die Histogramme zusammen zu zeigen:

42 21/90 Vorschlag Graphische Darstellungen Histogramme und Dichtepolygone Total abgefahrene 3D-Plots können in der Werbung nützlich sein

43 21/90 Vorschlag Graphische Darstellungen Histogramme und Dichtepolygone Total abgefahrene 3D-Plots können in der Werbung nützlich sein, für die Wissenschaft sind einfache und klare 2D-Darstellungen meistens angemessener.

44 22/90 Problem Graphische Darstellungen Histogramme und Dichtepolygone Histogramme kann man nicht ohne weiteres in demselben Graphen darstellen,

45 22/90 Problem Graphische Darstellungen Histogramme und Dichtepolygone Histogramme kann man nicht ohne weiteres in demselben Graphen darstellen, weil sie einander überdecken würden.

46 Graphische Darstellungen Histogramme und Dichtepolygone Einfache und klare Lösung: Dichtepolygone Nichteiertragende Weibchen am 6. Sept. 88, n=215 Dichte Carapaxlänge [mm] 23/90

47 Graphische Darstellungen Histogramme und Dichtepolygone Einfache und klare Lösung: Dichtepolygone Nichteiertragende Weibchen am 6. Sept. '88, n=215 Dichte Carapaxlänge [mm] 23/90

48 Graphische Darstellungen Histogramme und Dichtepolygone Einfache und klare Lösung: Dichtepolygone Nichteiertragende Weibchen am 3. Nov. '88, n=57 Dichte Carapaxlänge [mm] 23/90

49 24/90 Graphische Darstellungen Histogramme und Dichtepolygone Zwei und mehr Dichtepolygone in einem Plot Nichteiertragende Weibchen Dichte Nov. '88 6. Sept. ' Carapaxlänge [mm]

50 24/90 Graphische Darstellungen Histogramme und Dichtepolygone Zwei und mehr Dichtepolygone in einem Plot Nichteiertragende Weibchen Dichte Nov. '88 6. Sept. ' Carapaxlänge [mm] Biologische Interpretation der Verschiebung?

51 Graphische Darstellungen Histogramme und Dichtepolygone 25/90

52 Graphische Darstellungen Histogramme und Dichtepolygone 25/90

53 Graphische Darstellungen Histogramme und Dichtepolygone 25/90

54 26/90 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl

55 26/90 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl Anzahl

56 26/90 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl Anzahl Dichte

57 26/90 Graphische Darstellungen Anzahl vs. Dichte Histogramme und Dichtepolygone Anzahl Anzahl Also: Bei Histogrammen mit ungleichmäßiger Unterteilung immer Dichten verwenden! Dichte

58 Graphische Darstellungen Stripcharts Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 27/90

59 Graphische Darstellungen Stripcharts 28/ Carapax

60 Graphische Darstellungen Stripcharts 28/ Carapax

61 Graphische Darstellungen Stripcharts 28/ Carapax

62 Graphische Darstellungen Stripcharts 29/90 Histogramme und Dichtepolygone geben ein ausführliches Bild eines Datensatzes.

63 Graphische Darstellungen Stripcharts 29/90 Histogramme und Dichtepolygone geben ein ausführliches Bild eines Datensatzes. Manchmal zu ausführlich.

64 Graphische Darstellungen Boxplots Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 30/90

65 31/90 Graphische Darstellungen Boxplots Zu viel Information erschwert den Überblick Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum

66 31/90 Graphische Darstellungen Boxplots Zu viel Information erschwert den Überblick Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Baum Wald?

67 Graphische Darstellungen Boxplots 32/90 Beispiel: Vergleich von mehreren Gruppen

68 Graphische Darstellungen Boxplots 33/90 Dichte Dichte Dichte Dichte

69 Graphische Darstellungen Boxplots 33/

70 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung Carapaxlänge [mm]

71 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung Carapaxlänge [mm]

72 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 50 % der Daten 50 % der Daten Carapaxlänge [mm]

73 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 50 % der Daten 50 % der Daten Median Carapaxlänge [mm]

74 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 50 % der Daten 50 % der Daten Min Median Max Carapaxlänge [mm]

75 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 25% 25% 25% 25% Min Median Max Carapaxlänge [mm]

76 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, einfache Ausführung 25% 25% 25% 25% Min 1. Quartil 3. Quartil Median Max Carapaxlänge [mm]

77 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Carapaxlänge [mm]

78 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Interquartilbereich Carapaxlänge [mm]

79 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Interquartilbereich 1,5*Interquartilbereich 1,5*Interquartilbereich Carapaxlänge [mm]

80 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Standardausführung Carapaxlänge [mm]

81 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Profiausstattung Carapaxlänge [mm]

82 34/90 Der Boxplot Graphische Darstellungen Boxplots Boxplot, Profiausstattung 95 % Konfidenzintervall für den Median Carapaxlänge [mm]

83 35/90 Fazit Graphische Darstellungen Boxplots 1 Histogramme erlauben einen detailierten Blick auf die Daten

84 35/90 Fazit Graphische Darstellungen Boxplots 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen

85 35/90 Fazit Graphische Darstellungen Boxplots 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen 3 Boxplot können große Datenmengen vereinfacht zusammenfassen

86 35/90 Fazit Graphische Darstellungen Boxplots 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen 3 Boxplot können große Datenmengen vereinfacht zusammenfassen 4 Bei kleinen Datenmengen eher Stripcharts angemessen

87 35/90 Fazit Graphische Darstellungen Boxplots 1 Histogramme erlauben einen detailierten Blick auf die Daten 2 Dichtepolygone erlauben Vergleiche zwischen vielen Verteilungen 3 Boxplot können große Datenmengen vereinfacht zusammenfassen 4 Bei kleinen Datenmengen eher Stripcharts angemessen 5 Vorsicht mit Tricks wie 3D oder halbtransparenten Farben

88 Statistische Kenngrößen Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 36/90

89 Statistische Kenngrößen 37/90 Es ist oft möglich, das Wesentliche an einer Stichprobe mit ein paar Zahlen zusammenzufassen.

90 Statistische Kenngrößen 38/90 Wesentlich: 1. Wie groß? 2. Wie variabel?

91 Statistische Kenngrößen 38/90 Wesentlich: 1. Wie groß? Lageparameter 2. Wie variabel?

92 Statistische Kenngrößen 38/90 Wesentlich: 1. Wie groß? Lageparameter 2. Wie variabel? Streuungsparameter

93 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 39/90

94 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 40/90 Eine Möglichkeit kennen wir schon aus dem Boxplot:

95 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 41/90 Lageparameter Der Median

96 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 41/90 Lageparameter Der Median Streuungsparameter

97 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile 41/90 Lageparameter Der Median Streuungsparameter Der Quartilabstand (Q 3 Q 1 )

98 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Der Median 1 : die Hälfte der Beobachtungen sind kleiner, die Hälfte sind größer. 1 saloppe Definition (wir sehen gleich die präzise Definition) 42/90

99 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Der Median 1 : die Hälfte der Beobachtungen sind kleiner, die Hälfte sind größer. Der Median ist das 50%-Quantil der Daten. 1 saloppe Definition (wir sehen gleich die präzise Definition) 42/90

100 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das erste Quartil 2, Q 1 : 2 saloppe Definition (wir sehen gleich die präzise Definition) 43/90

101 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das erste Quartil 2, Q 1 : ein Viertel der Beobachtungen sind kleiner, drei Viertel sind größer. 2 saloppe Definition (wir sehen gleich die präzise Definition) 43/90

102 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das erste Quartil 2, Q 1 : ein Viertel der Beobachtungen sind kleiner, drei Viertel sind größer. Q 1 ist das 25%-Quantil der Daten. 2 saloppe Definition (wir sehen gleich die präzise Definition) 43/90

103 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das dritte Quartil 3, Q 3 : 3 saloppe Definition (wir sehen gleich die präzise Definition) 44/90

104 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das dritte Quartil 3, Q 3 : drei Viertel der Beobachtungen sind kleiner, ein Viertel sind größer. 3 saloppe Definition (wir sehen gleich die präzise Definition) 44/90

105 Die Quartile Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Das dritte Quartil 3, Q 3 : drei Viertel der Beobachtungen sind kleiner, ein Viertel sind größer. Q 3 ist das 75%-Quantil der Daten. 3 saloppe Definition (wir sehen gleich die präzise Definition) 44/90

106 45/90 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile (Empirische) Quantile, allgemein Seien n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). q ist (ein) α-quantil der n Beobachtungswerte, wenn gilt 1 n {1 i n : x i q} α und 1 n {1 i n : x i q} 1 α.

107 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile (Empirische) Quantile, allgemein Seien n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). q ist (ein) α-quantil der n Beobachtungswerte, wenn gilt 1 n {1 i n : x i q} α und 1 n {1 i n : x i q} 1 α. Bem.: Im Allgemeinen ist ein α-quantil nicht eindeutig: Seien x (1) x (2) x (n) die der Größe nach sortierten Werte. Wenn α = k n mit 1 k < n, so ist jeder Wert q [x (k), x (k+1) ] ein α-quantil, denn {i : x i x (k) } k, {i : x i x (k) } n k + 1. Wenn nα {1,..., n 1}, so ist das α-quantil der Wert x (k) mit k = αn. 45/90

108 46/90 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile (Empirische) Quantile, allgemein II n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). (ein) α-quantil q der n Beobachtungswerte erfüllt 1 n {1 i n : x i q} α und 1 n {1 i n : x i q} 1 α.

109 Bem.: Die Definition passt zu unserer früheren Definition für Verteilungen, wenn man die empirische Verteilung 1 n n i=1 δ x i betrachtet. In der Literatur (und auch in Statistik-Software) sind verschiedene Interpolationen üblich, um das α-quantil stetig in α zu machen. (In R siehe etwa help(quantile), es sind 9 Varianten implementiert.) Die Uneindeutigkeit des α-quantils ist für halbwegs große n in der Praxis oft wenig von Belang. 46/90 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile (Empirische) Quantile, allgemein II n (reelle) Beobachtungswerte x 1, x 2,..., x n gegeben, α (0, 1). (ein) α-quantil q der n Beobachtungswerte erfüllt 1 n {1 i n : x i q} α und 1 n {1 i n : x i q} 1 α.

110 Statistische Kenngrößen Mittelwert und Standardabweichung Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 47/90

111 Statistische Kenngrößen Mittelwert und Standardabweichung 48/90 n (reelle) Beobachtungswerte x 1, x 2,..., x n Am häufigsten werden benutzt: Lageparameter Der Mittelwert x := 1 n n x i i=1

112 Statistische Kenngrößen Mittelwert und Standardabweichung 48/90 n (reelle) Beobachtungswerte x 1, x 2,..., x n Am häufigsten werden benutzt: Lageparameter Der Mittelwert x := 1 n n i=1 Streuungsparameter Die Standardabweichung s (bzw. σ) x i

113 Statistische Kenngrößen Mittelwert und Standardabweichung n (reelle) Beobachtungswerte x 1, x 2,..., x n Am häufigsten werden benutzt: Lageparameter Der Mittelwert x := 1 n n i=1 Streuungsparameter Die Standardabweichung s (bzw. σ) wobei σ 2 = 1 n (x i x) 2 die (empirische) Varianz n i=1 s 2 = 1 n (x i x) 2 die korrigierte Stichproben-Varianz n 1 i=1 ( = n σ2) n 1 48/90 x i

114 Statistische Kenngrößen Mittelwert und Standardabweichung 49/90 Erinnerung: Geometrische Bedeutung des Mittelwerts Der Schwerpunkt

115 Statistische Kenngrößen Mittelwert und Standardabweichung 50/90 Wir stellen uns die Beobachtungen als gleich schwere Gewichte auf einer Waage vor: x

116 Statistische Kenngrößen Mittelwert und Standardabweichung 50/90 Wo muß der Drehpunkt sein, damit die Waage im Gleichgewicht ist? x

117 Statistische Kenngrößen Mittelwert und Standardabweichung 51/90 m = 1,5?

118 Statistische Kenngrößen Mittelwert und Standardabweichung 51/90 m = 1,5? zu klein

119 Statistische Kenngrößen Mittelwert und Standardabweichung 51/90 m = 2?

120 Statistische Kenngrößen Mittelwert und Standardabweichung 51/90 m = 2? zu groß

121 Statistische Kenngrößen Mittelwert und Standardabweichung 51/90 m = 1,8?

122 Statistische Kenngrößen Mittelwert und Standardabweichung 51/90 m = 1,8? richtig

123 Statistische Kenngrößen Mittelwert und Standardabweichung 52/90 Oft kann man mit dem bloßen Auge anhand eines Histogramms den Mittelwert gut einschätzen. Beispiel: Galathea intermedia Rundlichkeit := Abdominalbreite / Carapaxlänge

124 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

125 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

126 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

127 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

128 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

129 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

130 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

131 Statistische Kenngrößen Mittelwert und Standardabweichung 53/90

132 Statistische Kenngrößen Mittelwert und Standardabweichung 54/90 Beispiel:

133 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

134 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

135 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

136 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

137 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

138 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

139 Statistische Kenngrößen Mittelwert und Standardabweichung 55/90

140 Statistische Kenngrößen Mittelwert und Standardabweichung 56/90 Die Standardabweichung (auch: Streuung)

141 Statistische Kenngrößen Mittelwert und Standardabweichung 56/90 Die Standardabweichung (auch: Streuung) Wie weit weicht eine typische Beobachtung vom Mittelwert ab?

142 57/90 Statistische Kenngrößen Mit n oder n 1 berechnen? Mittelwert und Standardabweichung Die Standardabweichung σ eines Zufallsexperiments mit n gleichwahrscheinlichen Ausgängen x 1,..., x n (z.b. Würfelwurf) ist definiert durch σ = 1 n (x i x) 2. n i=1

143 57/90 Statistische Kenngrößen Mit n oder n 1 berechnen? Mittelwert und Standardabweichung Die Standardabweichung σ eines Zufallsexperiments mit n gleichwahrscheinlichen Ausgängen x 1,..., x n (z.b. Würfelwurf) ist definiert durch σ = 1 n (x i x) 2. n Wenn es sich bei x 1,..., x n um Beobachtungswerte in einer Stichprobe handelt, verwendet man eher s = 1 n (x i x) 2. n 1 i=1 i=1

144 Statistische Kenngrößen Mittelwert und Standardabweichung 58/90 s als Schätzer für σ Wir werden sehen: Wenn X 1,..., X n u.i.v. Zufallsvariablen mit Varianz Var[X 1 ] = σ 2, so hat die Zufallsvariable X := 1 n n X i, i=1 die Eigenschaft S 2 := 1 n 1 n (X i X) 2 i=1 E[S 2 ] = σ 2.

145 59/90 Statistische Kenngrößen Mittelwert und Standardabweichung Faustregel für die Standardabweichung Bei ungefähr glockenförmigen (also eingipfligen und symmetrischen) Verteilungen liegen ca. 2/3 der Verteilung zwischen x σ und x + σ. probability density x σ x x + σ

146 Statistische Kenngrößen Mittelwert und Standardabweichung Faustregel für die Standardabweichung Bei ungefähr glockenförmigen (also eingipfligen und symmetrischen) Verteilungen liegen ca. 2/3 der Verteilung zwischen x σ und x + σ. probability density x σ x x + σ Oft kann man so die Standardabweichung mit bloßem Auge abschätzen. 59/90

147 60/90 Statistische Kenngrößen Mittelwert und Standardabweichung Standardabweichung der Carapaxlängen nichteiertragender Weibchen vom Nichteiertragende Weibchen Dichte x = Carapaxlänge [mm]

148 60/90 Statistische Kenngrößen Mittelwert und Standardabweichung Standardabweichung der Carapaxlängen nichteiertragender Weibchen vom Nichteiertragende Weibchen Dichte σ = 0.28 σ 2 = x = Carapaxlänge [mm]

149 60/90 Statistische Kenngrößen Mittelwert und Standardabweichung Standardabweichung der Carapaxlängen nichteiertragender Weibchen vom Nichteiertragende Weibchen Dichte σ = 0.28 σ 2 = x = Carapaxlänge [mm] Hier liegt der Anteil zwischen x σ und x + σ bei 72%.

150 Beispiele zum Sinn und Unsinn von Mittelwerten Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 61/90

151 Beispiele zum Sinn und Unsinn von Mittelwerten 62/90 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung glockenförmig ist

152 Beispiele zum Sinn und Unsinn von Mittelwerten 62/90 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung glockenförmig ist und müssen andernfalls mit Vorsicht interpretiert werden.

153 Beispiele zum Sinn und Unsinn von Mittelwerten 62/90 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung glockenförmig ist und müssen andernfalls mit Vorsicht interpretiert werden. Wir betrachten dazu einige Lehrbuch-Beispiele aus der Ökologie, siehe z.b. M. Begon, C. R. Townsend, and J. L. Harper. Ecology: From Individuals to Ecosystems. Blackell Publishing, 4 edition, 2008.

154 Beispiele zum Sinn und Unsinn von Mittelwerten 62/90 Mittelwert und Standardabweichung... charakterisieren die Daten gut, falls deren Verteilung glockenförmig ist und müssen andernfalls mit Vorsicht interpretiert werden. Wir betrachten dazu einige Lehrbuch-Beispiele aus der Ökologie, siehe z.b. M. Begon, C. R. Townsend, and J. L. Harper. Ecology: From Individuals to Ecosystems. Blackell Publishing, 4 edition, Im Folgenden verwenden wir zum Teil simulierte Daten, wenn die Originaldaten nicht verfügbar waren. (Nehmen Sie also nicht alle Datenpunkte wörtlich.)

155 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 63/90

156 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wa hlerische Bachstelzen Bachstelzen fressen Dungfliegen Ra uber Beute Bachstelze (White Wagtail) Motacilla alba alba Gelbe Dungfliege Scatophaga stercoraria image (c) by Artur Mikołajewski image (c) by Viatour Luc 64/90

157 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 65/90 Vermutung Die Fliegen sind unterschiedlich groß Effizienz für die Bachstelze = Energiegewinn / Zeit zum Fangen und fressen Laborexperimente lassen vermuten, dass die Effizienz bei 7mm großen Fliegen maximal ist. N.B. Davies. Prey selection and social behaviour in wagtails (Aves: Motacillidae). J. Anim. Ecol., 46:37 57, 1977.

158 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 available dung flies number length [mm]

159 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 available dung flies number mean= length [mm]

160 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 available dung flies number mean= 7.99 sd= length [mm]

161 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 captured dung flies number length [mm]

162 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 captured dung flies number mean= length [mm]

163 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 captured dung flies number mean= 6.79 sd= length [mm]

164 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen 66/90 dung flies: available, captured fraction per mm captured available length [mm]

165 67/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen Mittelwert captured available dung flies: available, captured fraction per mm captured available length [mm]

166 67/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured Mittelwert < available dung flies: available, captured fraction per mm captured available length [mm]

167 67/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 dung flies: available, captured fraction per mm captured available length [mm]

168 67/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 Standardabweichung dung flies: available, captured fraction per mm captured available length [mm]

169 67/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 Standardabweichung < dung flies: available, captured fraction per mm captured available length [mm]

170 67/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Vergleich der Größenverteilungen captured available Mittelwert 6.29 < 7.99 Standardabweichung 0.69 < 0.96 dung flies: available, captured fraction per mm captured available length [mm]

171 68/90 Beispiele zum Sinn und Unsinn von Mittelwerten Interpretation Beispiel: Wählerische Bachstelzen Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mm groß sind.

172 68/90 Beispiele zum Sinn und Unsinn von Mittelwerten Interpretation Beispiel: Wählerische Bachstelzen Die Bachstelzen bevorzugen Dungfliegen, die etwa 7mm groß sind. Hier waren die Verteilungen glockenförmig und es genügten 4 Werte (die beiden Mittelwerte und die beiden Standardabweichungen), um die Daten adäquat zu beschreiben.

173 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 69/90

174 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 70/90 Nephila madagascariensis image (c) by Bernard Gagnon

175 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 71/90 Simulierte Daten: Eine Stichprobe von 70 Spinnen Mittlere Größe: 21,06 mm Standardabweichung der Größe: 12,94 mm

176 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 72/90????? Frequency size [mm]

177 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 72/90 Nephila madagascariensis (n=70) Frequency size [mm]

178 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 72/90 Nephila madagascariensis (n=70) Frequency mean= size [mm]

179 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 72/90 Nephila madagascariensis (n=70) Frequency males females size [mm]

180 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman 72/90 Nephila madagascariensis (n=70) Frequency males females size [mm]

181 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Spiderman & Spiderwoman Nephila madagascariensis image (c) by Arthur Chapman 73/90

182 74/90 Beispiele zum Sinn und Unsinn von Mittelwerten Fazit des Spinnenbeispiels Beispiel: Spiderman & Spiderwoman Wenn die Daten aus verschiedenen Gruppen zusammengesetzt sind, die sich bezüglich des Merkmals deutlich unterscheiden, kann es sinnvoll sein, Kenngrößen wie den Mittelwert für jede Gruppe einzeln zu berechnen.

183 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 75/90

184 76/90 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras Kupfertolerantes Rotes Straußgras Rotes Straußgras Agrostis tenuis image (c) Kristian Peters Kupfer Cuprum Hendrick met de Bles

185 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 77/90 A.D. Bradshaw. Population Differentiation in agrostis tenius Sibth. III. populations in varied environments. New Phytologist, 59(1):92 103, T. McNeilly and A.D Bradshaw. Evolutionary Processes in Populations of Copper Tolerant Agrostis tenuis Sibth. Evolution, 22: , 1968.

186 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 77/90 A.D. Bradshaw. Population Differentiation in agrostis tenius Sibth. III. populations in varied environments. New Phytologist, 59(1):92 103, T. McNeilly and A.D Bradshaw. Evolutionary Processes in Populations of Copper Tolerant Agrostis tenuis Sibth. Evolution, 22: , Wir verwenden hier wieder simulierte Daten, da die Originaldaten nicht zur Verfügung stehen.

187 78/90 Beispiele zum Sinn und Unsinn von Mittelwerten Anpassung an Kupfer? Beispiel: Kupfertoleranz beim Roten Straußgras Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln.

188 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 78/90 Anpassung an Kupfer? Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. Die Wurzellängen von Pflanzen aus der Umgebung von Kupferminen wird gemessen.

189 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 78/90 Anpassung an Kupfer? Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. Die Wurzellängen von Pflanzen aus der Umgebung von Kupferminen wird gemessen. Samen von unbelasteten Wiesen werden bei Kupferminen eingesät.

190 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 78/90 Anpassung an Kupfer? Pflanzen, denen das Kupfer schadet, haben kürzere Wurzeln. Die Wurzellängen von Pflanzen aus der Umgebung von Kupferminen wird gemessen. Samen von unbelasteten Wiesen werden bei Kupferminen eingesät. Die Wurzellängen dieser Wiesenpflanzen werden gemessen.

191 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 79/90 Browntop Bent (n=50) density per cm Copper Mine Grass root length (cm)

192 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 79/90 Browntop Bent (n=50) density per cm Grass seeds from a meadow root length (cm)

193 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 79/90 Browntop Bent (n=50) density per cm Grass seeds from a meadow copper tolerant? root length (cm)

194 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 79/90 Browntop Bent (n=50) density per cm meadow plants copper mine plants root length (cm)

195 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 79/90 Browntop Bent (n=50) density per cm copper mine plants m s m m+s root length (cm)

196 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 79/90 Browntop Bent (n=50) density per cm m s m m+s meadow plants root length (cm) 2/3 der Wurzellängen innerhalb [m-sd,m+sd]???? Nein!

197 80/90 Beispiele zum Sinn und Unsinn von Mittelwerten Fazit des Straußgras-Beispiels Beispiel: Kupfertoleranz beim Roten Straußgras Manche Verteilungen können nur mit mehr als zwei Variablen angemessen beschrieben werden.

198 80/90 Beispiele zum Sinn und Unsinn von Mittelwerten Fazit des Straußgras-Beispiels Beispiel: Kupfertoleranz beim Roten Straußgras Manche Verteilungen können nur mit mehr als zwei Variablen angemessen beschrieben werden. z.b. mit den fünf Werten der Boxplots: min, Q 1, median, Q 3, max

199 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 81/90 Browntop Bent n=50+50 copper mine plants meadow plants root length (cm)

200 82/90 Beispiele zum Sinn und Unsinn von Mittelwerten Schlussfolgerung Beispiel: Kupfertoleranz beim Roten Straußgras Viele Datenverteilungen sind annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung hinreichend beschrieben werden.

201 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Kupfertoleranz beim Roten Straußgras 82/90 Schlussfolgerung Viele Datenverteilungen sind annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung hinreichend beschrieben werden. Es gibt aber auch Ausnahmen. Also: Besser ist es, die Daten auch graphisch zu untersuchen, und sich nicht allein auf numerische Kenngrößen zu verlassen.

202 Das Statistikpaket R Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 83/90

203 84/90 Was ist R? Das Statistikpaket R Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden.

204 84/90 Was ist R? Das Statistikpaket R Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden. (R ist eine für die Statistik und für stochastische Simulation entwickelte Programmiersprache, zudem sind viele statistische Standardverfahren bereits in R implementiert oder als Zusatzpaket verfügbar. R wird auch im Stochastik-Praktikums verwendet.)

205 84/90 Was ist R? Das Statistikpaket R Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden. (R ist eine für die Statistik und für stochastische Simulation entwickelte Programmiersprache, zudem sind viele statistische Standardverfahren bereits in R implementiert oder als Zusatzpaket verfügbar. R wird auch im Stochastik-Praktikums verwendet.) R hat eine sehr aktive Benutzer- und Entwicklergemeinde (die nahezu alle Bereiche der Statistik und viele Anwendungsbereiche (z.b. Populationsgenetik, Finanzmathematik) überdeckt).

206 Man kann R als (sehr mächtigen) Statistik-Taschenrechner verwenden. (R ist eine für die Statistik und für stochastische Simulation entwickelte Programmiersprache, zudem sind viele statistische Standardverfahren bereits in R implementiert oder als Zusatzpaket verfügbar. R wird auch im Stochastik-Praktikums verwendet.) R hat eine sehr aktive Benutzer- und Entwicklergemeinde (die nahezu alle Bereiche der Statistik und viele Anwendungsbereiche (z.b. Populationsgenetik, Finanzmathematik) überdeckt). R ist frei verfügbar unter der GNU general public license, für (nahezu) alle Rechnerarchitekturen erhältlich: R ist auf ZDV-Rechnern installiert. 84/90 Was ist R? Das Statistikpaket R

207 Das Statistikpaket R 85/90 R installieren, starten, anhalten Installation: Windows, Mac OS: Binaries von (siehe Link Download, Packages, CRAN dort) Linux: Für die meisten Distributionen gibt es fertige Pakete Fragen oder Probleme: Tutorium (J. Blauth), Do 10-12, Raum MI 2 R starten: Windows, Mac OS: Icon (ggf. aus Menu) anklicken, Linux/Unix: > R auf einer Konsole (oder mit ESS aus Emacs heraus, oder aus rstudio,...). R beenden: q() (fragt, ob Daten gespeichert werden sollen) laufende Rechnungen unterbrechen: CTRL-C

208 Das Statistikpaket R Deskriptive Statistik mit R Inhalt 1 Ansatz der Statistik 2 Graphische Darstellungen Histogramme und Dichtepolygone Stripcharts Boxplots 3 Statistische Kenngrößen Median und andere Quartile, (empirische) Quantile Mittelwert und Standardabweichung 4 Beispiele zum Sinn und Unsinn von Mittelwerten Beispiel: Wählerische Bachstelzen Beispiel: Spiderman & Spiderwoman Beispiel: Kupfertoleranz beim Roten Straußgras 5 Das Statistikpaket R Deskriptive Statistik mit R 86/90

209 Das Statistikpaket R Deskriptive Statistik mit R Datensatz x in R eingeben x <- c( 53,52,41,41,42,58,40,43,42,38,43,49,34,51,45, 39,41,45,45,39,37,36,42,44,47,43,46,43,43,45, 42,52,49,44,50,40,47,46,50,50,41,51,41,47,42, 52,36,46,42,56,39,40,36,42,36,36,47,45,47,49 ) (aus Datei einlesen: x <- scan( Dateiname )) Mittelwert (mean), Standardabweichung (sd), Median, und Quantile mean(x) sd(x) median(x) quantile(x, 0.25, type=1) quantile(x, 0.75, type=1) summary(x) Boxplot, Histogramm boxplot(x) hist(x) 87/90

210 88/90 Das Statistikpaket R Nur zur Information: Literatur zu R Deskriptive Statistik mit R Wir werden im Zusammenhang der Vorlesung nur (fakultativ) einige wenige R-Befehle ansprechen, so dass Sie für etwaige freiwillige R-Schnupperei i.a. keine Literatur benötigen werden. Standardreferenz : W.N. Venables et al, An Introduction to R, Günther Sawitzki, Einführung in R, William N. Venables, Brian D. Ripley, Modern applied statistics with S ( Standardlehrbuch, UB Lehrbuchsammlung) Lothar Sachs and Jürgen Hedderich, Angewandte Statistik Methodensammlung mit R (E-Book, UB) Christine Duller, Einführung in die nichtparametrische Statistik mit SAS und R : ein anwendungsorientiertes Lehr- und Arbeitsbuch (E-Book, UB) Helge Toutenburg, Christian Heumann, Deskriptive Statistik : Eine Einführung in Methoden und Anwendungen mit R und SPSS (E-Book, UB) Uwe Ligges, Programmieren mit R (E-Book, UB)

211 Das Statistikpaket R Deskriptive Statistik mit R 89/90

212 90/90 Nochmal: Idee der Statistik Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren

213 90/90 Nochmal: Idee der Statistik Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden.

214 90/90 Nochmal: Idee der Statistik Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren Die Daten werden als Realisierungen von Zufallsvariablen aufgefasst, die in einem stochastischen Modell spezifiert werden. Man versucht dann, anhand der Daten Rückschlüsse auf Parameter des Modells zu ziehen, und so systematische Effekte von Zufälligem zu trennen.

7. Ideen aus der Statistik 7.1 Deskriptive Statistik

7. Ideen aus der Statistik 7.1 Deskriptive Statistik 1/101 7. Ideen aus der Statistik 7.1 Deskriptive Statistik Matthias Birkner http://www.staff.uni-mainz.de/birkner/grundlstoch_1617/ 18.1.2017 Inhalt Ansatz der Statistik 1 Ansatz der Statistik 2 Graphische

Mehr

Biostatistik, WS 2010/2011 Deskriptive Statistik. It is hard to tell the truth without it. It is easy to lie with statistics.

Biostatistik, WS 2010/2011 Deskriptive Statistik. It is hard to tell the truth without it. It is easy to lie with statistics. Biostatistik, WS 2010/2011 Deskriptive Statistik Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1011/ 19.11.2010 1/112 Wozu Statistik? It is easy to lie with statistics. It is

Mehr

Biostatistik, WS 2013/2014 Deskriptive Statistik

Biostatistik, WS 2013/2014 Deskriptive Statistik 1/117 Biostatistik, WS 2013/2014 Deskriptive Statistik Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 22.11.2013 Wozu Statistik? 3/117 It is easy to lie with statistics.

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik

Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Martin Hutzenthaler & Dirk Metzler 17. April 2012 Inhaltsverzeichnis 1 Einführung 1 1.1 Konzept und Quellen.........................................

Mehr

Biostatistik, WS 2017/18 Deskriptive Statistik

Biostatistik, WS 2017/18 Deskriptive Statistik 1/119 Biostatistik, WS 2017/18 Deskriptive Statistik Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 10. und 17.11.2017 3/119 Wozu Statistik? It is easy to lie with statistics.

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik

Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Martin Hutzenthaler & Dirk Metzler http://evol.bio.lmu.de/statgen.html 20. und 23. April 2010 1 Einführung Konzept

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik

Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik 1 / 120 Wahrscheinlichkeitsrechnung und Statistik für Biologen Einführung: Deskriptive Statistik Martin Hutzenthaler & Dirk Metzler http://evol.bio.lmu.de/_statgen.html 18. April 2012 1 Einführung Konzept

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik Noémie Becker & Dirk Metzler 17. April 2013 Inhaltsverzeichnis 1 Einführung 1 1.1 Konzept und Quellen.........................................

Mehr

IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch. Zufall (mathematische Abstraktion) modellieren.

IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch. Zufall (mathematische Abstraktion) modellieren. IDEE DER STATISTIK: Variabilität (Erscheinung der Natur) durch Zufall (mathematische Abstraktion) modellieren. Statistik = Datenanalyse mit Hilfe stochastischer Modelle Theoretische Statistik ist ein Teil

Mehr

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Statistik für Informatiker, SS 2017 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung 1/18 Statistik für Informatiker, SS 2017 Organisatorisches, ein und eine sehr knappe R-Einführung Matthias Birkner http://www.staff.uni-mainz.de/birkner/statinfo17/ 19.4.2017 2/18 Herzlich willkommen zur

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 27. April 2010 1 Eine kurze Wiederholung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Martin Hutzenthaler & Dirk Metzler 27. April 2010 Inhaltsverzeichnis 1 Eine kurze Wiederholung zur deskriptiven Statistik 2

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik

Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik Wahrscheinlichkeitsrechnung und Statistik für Studierende der Biologie Einführung: Deskriptive Statistik Dirk Metzler, Noémie Becker 11. April 2018 Inhaltsverzeichnis 1 Einführung 1 1.1 Zum Inhalt des

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen Der Standardfehler Matthias Birkner & Dirk Metzler 28 April 2009 1 Inhaltsverzeichnis 1 Ein 11 12 13 14 kurze Wiederholung zur deskriptiven Statistik

Mehr

Statistik für Informatiker, SS 2019 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung

Statistik für Informatiker, SS 2019 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung 1/28 Statistik für Informatiker, SS 2019 Organisatorisches, ein Startbeispiel und eine sehr knappe R-Einführung Matthias Birkner http://www.staff.uni-mainz.de/birkner/statinfo19/ 15.4.2019 2/28 Herzlich

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/59 Biostatistik, Sommer 2017 Beschreibende Statistik Prof. Dr. Achim Klenke http://www.aklenke.de 5. Vorlesung: 19.05.2017 2/59 Inhalt 1 Vorbetrachtungen 2 Beschreibende Statistik Beispiel: Versuch zur

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt

Mehr

Biostatistik, WS 2017/18 Wiederholung

Biostatistik, WS 2017/18 Wiederholung 1/143 Biostatistik, WS 2017/18 Wiederholung Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 9.2.2018 2/143 Inhalt Differential- und Integralrechnung 1 Differential- und Integralrechnung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler Noémie Becker & Dirk Metzler 15. April 2016 Inhaltsverzeichnis 1 Der Standardfehler 1 1.1 Ein Versuch............................................

Mehr

Statistik I für Betriebswirte Vorlesung 3

Statistik I für Betriebswirte Vorlesung 3 Statistik I für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. April 2019 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 3 Version: 1. April

Mehr

Biostatistik, WS 2017/18 Der Standardfehler

Biostatistik, WS 2017/18 Der Standardfehler 1/70 Biostatistik, WS 2017/18 Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 24.11.2017 3/70 Ein Versuch Hirse Bild: Panicum miliaceum 4/70 Ein Versuch Ein Versuch Versuchsaufbau:

Mehr

Statistik I für Betriebswirte Vorlesung 4

Statistik I für Betriebswirte Vorlesung 4 Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Deskriptive Statistik. (basierend auf Slides von Lukas Meier)

Deskriptive Statistik. (basierend auf Slides von Lukas Meier) Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst

Mehr

Biostatistik, WS 2013/2014 Konfidenzintervalle

Biostatistik, WS 2013/2014 Konfidenzintervalle 1/41 Biostatistik, WS 2013/2014 Konfidenzintervalle Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 17.1.2014 Beispiel: Carapaxlänge des Springkrebses 4/41 Beispiel: Springkrebs

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II,

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf. Vorlesung 04 Mathematische Grundlagen II, Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Was sollen Sie heute lernen? 2 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter

Mehr

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele

Teil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

Teil IV Deskriptive Statistik

Teil IV Deskriptive Statistik Woche 5: Deskriptive Statistik Teil IV Deskriptive Statistik WBL 15/17, 18.05.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner Fachhochschule Haute école spécialisée

Mehr

Statistik für Ingenieure Vorlesung 3

Statistik für Ingenieure Vorlesung 3 Statistik für Ingenieure Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 14. November 2017 3. Zufallsgrößen 3.1 Zufallsgrößen und ihre Verteilung Häufig sind

Mehr

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If you torture your data long enough, they will tell you whatever you want to hear. James L. Mills Warum Biostatistik?

Mehr

Stochastik-Praktikum

Stochastik-Praktikum Stochastik-Praktikum Deskriptive Statistik Peter Frentrup Humboldt-Universität zu Berlin 7. November 2017 (Humboldt-Universität zu Berlin) Zufallszahlen und Monte Carlo 7. November 2017 1 / 27 Übersicht

Mehr

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt

Mehr

1 Univariate Statistiken

1 Univariate Statistiken 1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen

Mehr

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Prof. Dr. M. Schweizer ETH Zürich Sommer 2018 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Bitte... Lege deine Legi auf den Tisch. Trage deine Daten in dieses Deckblatt ein, und schreibe auf jedes

Mehr

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017 1/51 Biostatistik, Sommer 2017 Wahrscheinlichkeitstheorie: Verteilungen, Kenngrößen Prof. Dr. Achim Klenke http://www.aklenke.de 8. Vorlesung: 09.06.2017 2/51 Inhalt 1 Verteilungen Normalverteilung Normalapproximation

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie (3) Überblick. Deskriptive Statistik I 2. Deskriptive

Mehr

Erste Schritte mit R. 2.1 Herunterladen der freien Software R

Erste Schritte mit R. 2.1 Herunterladen der freien Software R Erste Schritte mit R 2 BevorwirunsmitdeninKap.1 eingeführten Fragestellungen beschäftigen, brauchen wir noch ein Werkzeug, um die Datensätze später wirklich auswerten zu können. Sicher lässt sich das in

Mehr

5 Exkurs: Deskriptive Statistik

5 Exkurs: Deskriptive Statistik 5 EXKURS: DESKRIPTIVE STATISTIK 6 5 Ekurs: Deskriptive Statistik Wir wollen zuletzt noch kurz auf die deskriptive Statistik eingehen. In der Statistik betrachtet man für eine natürliche Zahl n N eine Stichprobe

Mehr

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Übungsrunde 2, Gruppe 2 LVA , Übungsrunde 1, Gruppe 2, Markus Nemetz, TU Wien, 10/2006 1 1.2.3.4. 1.1 Angabe Übungsrunde 2, Gruppe 2 LVA 107.369, Übungsrunde 1, Gruppe 2, 24.10. Markus Nemetz, markus.nemetz@tuwien.ac.at, TU Wien, 10/2006 Bestimmen Sie für den Datensatz bulb.dat die Quartile,

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 7. Konfidenzintervalle

Wahrscheinlichkeitsrechnung und Statistik für Biologen 7. Konfidenzintervalle Wahrscheinlichkeitsrechnung und Statistik für Biologen 7. Konfidenzintervalle Matthias Birkner & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 9. Juni 2009 1 Wiederholung: Bedingte

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2016 Anmeldung in Basis: 06. 10.06.2016 Organisatorisches Einführung Statistik Analyse empirischer Daten

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

2. Deskriptive Statistik

2. Deskriptive Statistik Philipps-Universitat Marburg 2.1 Stichproben und Datentypen Untersuchungseinheiten: mogliche, statistisch zu erfassende Einheiten je Untersuchungseinheit: ein oder mehrere Merkmale oder Variablen beobachten

Mehr

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen.

Der Modus ist. Der Median ist. 3. Übung. Aufgabe 1. a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. 3. Übung Aufgabe 1 Der Modus ist a) der häufigste Wert. b) der Wert unter dem 50 % aller anderen Werte liegen. c) der Durchschnitt aller Werte. d) der Wert mit der größten Häufigkeitsdichte. e) der Schwerpunkt

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

3. Deskriptive Statistik

3. Deskriptive Statistik 3. Deskriptive Statistik Eindimensionale (univariate) Daten: Pro Objekt wird ein Merkmal durch Messung / Befragung/ Beobachtung erhoben. Resultat ist jeweils ein Wert (Merkmalsausprägung) x i : - Gewicht

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Beschreibende Statistik und der Übergang zur beurteilenden Statistik

Beschreibende Statistik und der Übergang zur beurteilenden Statistik Beschreibende Statistik und der Übergang zur beurteilenden Statistik Guido Herweyers KHBO Campus Oostende K.U.Leuven 1. Vorwort Der Einsatz des Voyage 200 erleichert die Verarbeitung von Daten und erlaubt

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Univariate explorative Datenanalyse in R

Univariate explorative Datenanalyse in R Univariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-03 1 Ein metrisches Merkmal Wir laden den Datensatz: R> load("statlab.rda") und machen die Variablen direkt verfügbar: R>

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 20. Oktober 2010 1 empirische Verteilung 2 Lageparameter Modalwert Arithmetisches Mittel Median 3 Streuungsparameter

Mehr

10. Die Normalverteilungsannahme

10. Die Normalverteilungsannahme 10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man

Mehr

Beispiel 4 (Einige weitere Aufgaben)

Beispiel 4 (Einige weitere Aufgaben) 1 Beispiel 4 (Einige weitere Aufgaben) Aufgabe 1 Bestimmen Sie für die folgenden Zweierstichproben, d. h. Stichproben, die jeweils aus zwei Beobachtungen bestehen, a) den Durchschnitt x b) die mittlere

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun http://blog.ruediger-braun.net Heinrich-Heine-Universität Düsseldorf 05. Dezember 2014 Termine Mittwoch, 10.12.: Doppelstunde Vorlesung, Ausgabe von Übungsblatt

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

Einheit 1. Einführung in R. IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11

Einheit 1. Einführung in R. IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11 Einheit 1 Einführung in R IFAS JKU Linz c 2018 Programmieren mit Statistischer Software 1 0 / 11 Einführung R ist ein Software-Paket für Statistisches Rechnen und Graphik. Es ist die Open Source Implementierung

Mehr

Mathematik IV: Statistik

Mathematik IV: Statistik für D-UWIS, D-ERDW, D-USYS und D-HEST SS16 Sie hören Vitamin String Quartet Daniel Stekhoven 14.04.2016 1 Daniel Stekhoven 14.04.2016 2 Überblick Lernziele Erledigt! Grundlagen Wahrscheinlichkeitsmodell

Mehr

Ü B U N G S S K R I P T S T A T I S T I K

Ü B U N G S S K R I P T S T A T I S T I K Ü B U N G S S K R I P T S T A T I S T I K A. Ploner H. Strelec C. Yassouridis Universität für Bodenkultur Department für Raum, Landschaft und Infrastruktur Institut für Angewandte Statistik & EDV Peter-Jordan-Strasse

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/62 Summenzeichen

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Hypothesentests. 5 Regression

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Hypothesentests. 5 Regression 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests 5 Regression Zufallsgrößen Ergebnisse von Zufallsexperimenten werden als Zahlen

Mehr

Stichwortverzeichnis. Symbole

Stichwortverzeichnis. Symbole Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote

Mehr

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Grundlagen der Biometrie, WS 2011/12 Vorlesung: Dienstag 8.15-9.45,

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG Markus.Schumacher@physik.uni-freiburg.de

Mehr

Hypothesentests und Konfidenzintervalle

Hypothesentests und Konfidenzintervalle Beispiel 1: Befüllen von Cornflakesschachteln Problem Ein Hersteller von Cornflakes möchte überprüfen, ob der Abfüllprozess den Zielvorgaben entspricht. Das Sollgewicht der Schachteln beträgt 365 Gramm.

Mehr

1.5 Erwartungswert und Varianz

1.5 Erwartungswert und Varianz Ziel: Charakterisiere Verteilungen von Zufallsvariablen (Bildbereich also reelle Zahlen, metrische Skala) durch Kenngrößen (in Analogie zu Lage- und Streuungsmaßen der deskriptiven Statistik). Insbesondere:

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 19. Oktober 2009 Hinweise Internetseite zur Vorlesung: http://blog.ruediger-braun.net Dort können Sie Materialien

Mehr

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign Marcel Dettling Institut für Datenanalyse und Prozessdesign Zürcher Hochschule für Angewandte Wissenschaften marcel.dettling@zhaw.ch http://stat.ethz.ch/~dettling Winterthur, 17. Mai 2017 1 Verteilung

Mehr

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik INSTITUT FÜR STOCHASTIK WS 2007/08 UNIVERSITÄT KARLSRUHE Blatt 1 Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen

Mehr

Einführung in die Statistik mit R

Einführung in die Statistik mit R Einführung in die Statistik mit R Bernd Weiler syntegris information solutions GmbH Neu Isenburg Schlüsselworte Statistik, R Einleitung Es ist seit längerer Zeit möglich statistische Berechnungen mit der

Mehr

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf 1 Agenda Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Erwartsungswert und Varianz

Mehr

Eine Einführung in R: Dichten und Verteilungsfunktionen

Eine Einführung in R: Dichten und Verteilungsfunktionen Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 25. November 2009 Bernd

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Grundlagen der. h Rückblick. Dr. K. Krüger. Grundwissen Mathematik

Grundlagen der. h Rückblick. Dr. K. Krüger. Grundwissen Mathematik Grundlagen der Schulmathematik h Rückblick Sommersemester 2009 Dr. K. Krüger Grundwissen Mathematik (DGS) Folie aus der 1. Vorlesung Inhalte 1. Beschreibende Statistik Mauna Loa Co2 1200 Streudiagramm

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2017 Organisatorisches Anmeldung in Basis: 19. 23.06.2017 Skript und Übungsaufgaben unter: http://www.iam.uni-bonn.de/users/rezny/statistikpraktikum

Mehr

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),

Mehr

1.5 Erwartungswert und Varianz

1.5 Erwartungswert und Varianz Ziel: Charakterisiere Verteilungen von Zufallsvariablen durch Kenngrößen (in Analogie zu Lage- und Streuungsmaßen der deskriptiven Statistik). Insbesondere: a) durchschnittlicher Wert Erwartungswert, z.b.

Mehr

Eine Einführung in R: Dichten und Verteilungsfunktionen

Eine Einführung in R: Dichten und Verteilungsfunktionen Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Stetige und diskrete Wahrscheinlichkeitsverteilungen Lageparameter Streuungsparameter Diskrete und stetige Zufallsvariablen Eine Variable (oder Merkmal

Mehr

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Berechnung von W für die Elementarereignisse einer Zufallsgröße

Berechnung von W für die Elementarereignisse einer Zufallsgröße R. Albers, M. Yanik Skript zur Vorlesung Stochastik (lementarmathematik) 5. Zufallsvariablen Bei Zufallsvariablen geht es darum, ein xperiment durchzuführen und dem entstandenen rgebnis eine Zahl zuzuordnen.

Mehr