Kenngro ßen von Ha ufigkeitsverteilungen Glockenfo rmige Verteilungen Streuungsmaße 1 I I I Ziel: Breite der Verteilung auf der Achse beschreiben nur bei quantitativen Merkmalen mo glich hier: I I I Spannweite Halbweite empirische Streuung und Standardabweichung Beispiel x = x1/2 = 4 Welche Verteilung streut breiter? 15 / 28
Streuungsmaße 1 Spannweite d ist die Differenz aus dem größten und dem kleinsten Beobachtungswert d = xmax x min Halbweite H ist die Differenz der beiden Viertelwerte H = x 3/4 x 1/4, also die Länge des Intervalls [x 1/4 ; x 3/4 ]. 16 / 28
Kenngro ßen von Ha ufigkeitsverteilungen Glockenfo rmige Verteilungen Boxplot Ziel: Gestalt der Ha ufigkeitsverteilung mit Hilfe der Kenngro ßen xmin, x1/4, x1/2, x3/4, xmax darstellen. Boxplot Mindestens die Ha lfte der Beobachtungswerte liegt in der Box. 17 / 28
Boxplot Beispiel Tageshöchsttemperaturen Anfang Januar/Anfang Februar, Berlin Tegel 1990 bis 2017, n = 28 Tempmax -9-8 -7-6 -5-4 -3-2 -1 0 Häufigkeit Jan. 1 1 1 1 1 1 3 3 Häufigkeit Febr. 1 3 2 Tempmax 1 2 3 4 5 6 7 8 9 10 11 12 Häufigkeit Jan. 1 2 1 1 2 3 2 2 2 Häufigkeit Febr. 6 4 3 1 2 2 2 2 x min x 1/4 x 1/2 x 3/4 xmax Januar 9 1 2 7 10 Februar 6 1 3 8 12 18 / 28
Boxplot x min x 1/4 x 1/2 x 3/4 xmax Januar 9 1 2 7 10 Februar 6 1 3 8 12 19 / 28
Boxplot Beispiel Laufzeiten Silvesterlauf 5km 20 / 28
Streuungsmaße 2 empirische Streuung s 2 und Standardabweichung s n Beobachtungen, arithmetisches Mittel x Merkmalsausprägung x 1 x 2... x r Häufigkeit H n (x 1 ) H n (x 2 )... H n (x r ) rel. Häufigkeit h n (x 1 ) h n (x 2 )... h n (x r ) s 2 = (x 1 x) 2 H n (x 1 ) + (x 2 x) 2 H n (x 2 ) + + (x r x) 2 H n (x r ) n = (x 1 x) 2 h n (x 1 ) + (x 2 x) 2 h n (x 2 ) + + (x r x) 2 h n (x r ) s 2 ist die mittlere quadratische Abweichung vom arithmetischen Mittel. Die Wurzel aus s 2 heißt Standardabweichung s. 21 / 28
Streuungsmaße 2 Simples Beispiel x i 1 2 3 4 5 H 10 (x i ) 1 2 4 2 1 h 10 (x i ) 0,1 0,2 0,4 0,2 0,1 y i 1 2 3 4 5 H 10 (y i ) 3 1 2 1 3 h 10 (y i ) 0,3 0,1 0,2 0,1 0,3 x =?, ȳ =? 22 / 28
Streuungsmaße 2 x = ȳ = 3 x i 1 2 3 4 5 H 10 (x i ) 1 2 4 2 1 h 10 (x i ) 0,1 0,2 0,4 0,2 0,1 s 2 = (1 3)2 1 + (2 3) 2 2 + (3 3) 2 4 + (4 3) 2 2 + (5 3) 2 1 10 = 1, 2 s 1, 1 y i 1 2 3 4 5 H 10 (y i ) 3 1 2 1 3 h 10 (y i ) 0,3 0,1 0,2 0,1 0,3 s 2 = (1 3) 2 0, 3 + (2 3) 2 0, 1 + (3 3) 2 0, 2 + (4 3) 2 0, 1 + (5 3) 2 0, 3 = 7, 8 s 2, 8 23 / 28
Streuungsmaße 2 Streuungsmaße beschreiben Breite der Verteilung Absolut: Spannweite: größter - kleinster Beobachtungswert Halbweite: x 3/4 x 1/4, mindestens mittlere 50% Streuung um einen Lageparameter Pärchen: Lage- Streuungs- Kriterium parameter parameter arithm. empirische 1 Mittel Streuung n n (x k c) 2 min Median mittl. lineare Abweichung 1 n k=1 n x k c min k=1 24 / 28
Kenngro ßen von Ha ufigkeitsverteilungen Glockenfo rmige Verteilungen Klasseneinteilung?, arithmetische Mittel?, Wann streut es mehr? 25 / 28
Glockenförmige Gestalt treten bei vielen Beobachtungen von Messgrößen wie auf. Niederschlagsmengen an einem Ort in einem bestimmten Zeitraum, Gewichte von neugeborenen Mädchen, Körpergrößen zehnjähriger Schüler, Hektarerträge auf Weizenfeldem einer Region 26 / 28
Bei Glockengestalt gilt näherungsweise: Symmetrieachse der Glocke ungefähr durch x parallel zur y-achse ( x bestimmt Lage der Verteilung) Intervall [ x s, x + s] = {x : x s x x + s]} enthält ungefahr 68% aller Daten, Intervall [ x 2s, x + 2s] enthält ungefähr 95% aller Daten (s bestimmt die Breite der Verteilung) Für kleine n und Abweichung von einer Glockengestalt können sich größere Abweichungen von diesen Prozentangaben einstellen. Die Länge des Intervalls [ x s, x + s] beträgt 2s. Je kleiner also die Standardabweichung ist, desto schmäler ist die Glocke. Intervall heißen ks-intervalle. 27 / 28
Kenngro ßen von Ha ufigkeitsverteilungen Glockenfo rmige Verteilungen Januar: xj = 45, 4, sj = 20, 5, [24; 66] 87%, [4; 87] 99% August: xa = 65, 7, sa = 33, 2, [32; 99] 80%, [0; 132] 96% 28 / 28