Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand
Lagemaße und Streumaße Üblicherweise wird der Mittelwert gemeinsam mit der Standardabweichung und der Median gemeinsam mit dem Interquartilsabstand präsentiert. Speziell für schief verteilte Daten ist der Median zu bevorzugen.
Arithmetisches Mittel, Varianz und Standardabweichung Stichprobe der Größe = n Daten der Stichprobe: x 1, x,, x n Mittelwert: Varianz: s x = = 1 n 1 n 1 n i= 1 n i= 1 x i ( x i x) Standardabweichung: s = s
Rechenbeispiel: Die Zahl der Kühe von 4 Bauern sei: 3, 6, 7, 4 Stichprobenumfang: n=4 ( x i x) x s = = 1 4 1 3 (3 + 6 + (4 + 1+ 7 + 4) 4 + 1) = = 10 3 0 4 = = 5 3,333 s =1,86
Drei Dörfer Dorf 1 Dorf Dorf 3 5, 5, 5, 5 3, 6, 7, 4 0, 0, 0, 0 x = 5 x = 5 x = 5 s = 0 s =1,86 s = 8,66
Variationskoeffizient Setzt die Standardabweichung in Relation zum arithmetischen Mittel v Rechenbeispiel: = x s 100 1,86 v = 100 = 36,5 % 5
Beispiel Kleber s x = = 1 43 1 4 = 9,63 MPa (,80 + 3,63 +... + 14,01+ 14,48) = 8,8 MPa [ (,80 8,8) + (3,63 8,8) +... + (14,48 8,8) ] s = 9,63 = 3,10 MPa
Grafische Darstellung Mittelwert und Standardabweichung 14 1 10 MPa 8 6 4 0 Kleber
Der Median Ist ein anderes Lagemaß für metrische sowie auch ordinale Merkmale. Definition: Der Median ist eine Zahl, so dass mindestens die Hälfte der Daten größer oder gleich und mindestens die Hälfte der Daten kleiner oder gleich dem Wert x~ sind. x~
n gerade In diesem Fall liegt der Median zwischen zwei Datenpunkten. An welcher Stelle der Rangliste? unterer Datenpunkt: Stelle = n/ obere Datenpunkt: Stelle = (n/)+1 Median = (unterer + oberer Datenpunkt)/
Rechenbeispiel zum Median (n gerade, d.h. n/ eine ganze Zahl) Daten:,1 3,4 7,3 8,9 untere Stelle: Wert: 3,4 obere Stelle: 3 Wert: 7,3 Median = (3,4 + 7,3)/ = 5,35
n ungerade In diesem Fall ist der Median einer der Datenpunkte! An welcher Stelle der Rangliste liegt der Median? Stelle = n/ aufgerundet auf die nächste ganze Zahl. z.b. n = 5 n/=,5 Stelle = 3
Rechenbeispiel zum Median (n ungerade, d.h. n/ keine ganze Zahl) Daten 3/5=60% 3/5=60% 1,3,6 3,6 4,3 5,1 Median ~ = 3,6 x
Median der Haftstärke Rangliste: (n = 43),80; 3,63; 4,14; 4,0; 4,58; 5,; 5,8; 5,51; 6,05; 6,11; 6,49; 6,88; 7,19; 7,6; 7,3; 7,3; 7,39; 7,86; 7,89; 8,0; 8,1; 8,7; 8,88; 8,98; 9,33; 9,39; 10,19; 10,19; 10,5; 11,05; 11,05; 11,08; 11,46; 11,71; 11,90; 1,10; 1,51; 1,70; 13,18; 13,31; 13,43; 14,01; 14,48. 43/ = 1,5 Daher ist Median die -te Beobachtung der Rangliste
Das erste und dritte Quartil Das 1. Quartil: (5%-Percentil) eine Zahl, so dass mind. 5% der Beobachtungen kleiner gleich und mind. 75% der Beobachtungen größer gleich dieser Zahl sind. Das 3. Quartil: (75%-Percentil) eine Zahl, so dass mind. 75% der Beobachtungen kleiner gleich und mind. 5% der Beobachtungen größer gleich dieser Zahl sind. Das. Quartil ist der Median
Berechnung des 1. Quartils (5%-Percentil) n (1/4) eine ganze Zahl: untere Stelle: n (1/4) obere Stelle: n (1/4)+1 z.b. n = 4, n (1/4)=1 untere Stelle = 1 obere Stelle = n (1/4) keine ganze Zahl: Stelle = n (1/4) aufgerundet auf die nächste ganze Zahl z.b. n=5 n (1/4)=1,5 Stelle =
Rechenbeispiele zum 1. Quartil Beispiel 1: n/4=1.5 /5=40% 4/5=80% 1,3;,6; 3,6; 4,3; 5,1 1. Quartil =,6
Rechenbeispiele zum 1. Quartil Beispiel :,1; 3,4 ; 7,3 ; 8,9 n/4=1 1. Quartil = (,1 + 3,4 )/ =.75
Berechnung des 3-ten Quartils (75%-Percentil) n (3/4) eine ganze Zahl: n (3/4) keine ganze Zahl: untere Stelle: n (3/4) obere Stelle: n (3/4)+1 z.b. n = 4, n (3/4)=3 untere Stelle = 3 obere Stelle = 4 Stelle = n (3/4) aufgerundet auf die nächste ganze Zahl z.b. n=5 n (3/4)=3,75 Stelle = 4
Rechenbeispiele zum 3. Quartil 4/5=80% /5=40% Beispiel 1: 1,3;,6; 3,6; 4,3; 5,1 n (3/4)=3,75 3. Quartil = 4,3
Rechenbeispiele zum 3. Quartil Beispiel : n (3/4)=3,1; 3,4 ; 7,3 ; 8,9 3. Quartil = (7,3 + 8,9 )/ = 8,1
1. Und 3.Quartil der Haftstärke Rangliste: (n = 43),80; 3,63; 4,14; 4,0; 4,58; 5,; 5,8; 5,51; 6,05; 6,11; 6,49; 6,88; 7,19; 7,6; 7,3; 7,3; 7,39; 7,86; 7,89; 8,0; 8,1; 8,7; 8,88; 8,98; 9,33; 9,39; 10,19; 10,19; 10,5; 11,05; 11,05; 11,08; 11,46; 11,71; 11,90; 1,10; 1,51; 1,70; 13,18; 13,31; 13,43; 14,01; 14,48. 43 (1/4) 43 (3/4) =10,75 =3,5 Daher ist das 1. 3. Quartil die 11-te 33-te Beobachtung der Rangliste
Berechnung des q-quantils (q 100 %-Percentil) n q eine ganze Zahl: n q keine ganze Zahl: untere Stelle: n q obere Stelle: n q+1 q- Quantil ist der Mittelwert der entsprechenden Werte aus der Rangliste Stelle = n q aufgerundet auf die nächste ganze Zahl q-quantil ist der Wert aus der Rangliste an dieser Stelle
Box & Whisker - Plot Haftstärke [MPa] 14 1 10 8 6 4 Max = 14,48 3. Quartil = 11,46 Median = 8,7 1. Quartil = 6,49 Min =,80 0 Kleber
Interquartilsabstand Interquartilsabstand = 3. Quartil 1. Quartil ist ein Streuungsmaß. Wird im Zusammenhang mit Median verwendet. Haftstärke in Beispiel 1.: Interquartilsabstand = 11,46 6,49 = 4,97
Vergleich der grafischen Methoden für metrische Variable Histogramm Zeigt die detailierte Verteilung der Daten. Ausreißer sind gut erkennbar Mittelwertsplot sehr starke Reduktion der Information Boxplot Gibt einen guten Eindruck der Verteilung der Daten, Minimum, Maximum, Median, Quartile und Quartilsabstand sind direkt ablesbar Platzsparender als Histogramme Relative Häufigkeit Haftstärke [MPa] 0,3 0,5 0, 0,15 0,1 0,05 MPa 0 14 1 10 8 6 4 0 14 1 10 8 6 4 0 3 5 7 9 11 13 15 Haftstärke [MPa] Mittelwert und Standardfehler Kleber Kleber
Vergleich der Lage- und Streuungsmaße Mittelwert und Varianz Nur für metrische Variable Instabil gegenüber Ausreißern Interpretierbar als durchschnittlicher Wert Spezielle Interpretation für Normalverteilung Der Mittelwert beschreibt das Zentrum der Verteilung von schiefverteilten Daten schlecht. Median und Interquartilsabstand Für metrische und ordinale Variable Robust gegenüber Ausreißern
Robustheit gegen Ausreißer Anzahl der täglich gerauchten Zigaretten (7 Personen wurden befragt) Beispiel 1: 0 5 5 10 8 15 0 Mittelwert: 9 Median: 8 Beispiel : 0 5 5 10 8 15 100 Mittelwert: 0.4 Median: 8
Anzahl Anzahl Symmetrie Verteilung (Rechts-)Schiefe Verteilung 30 30 0 0 10 10 0 -,00-1,00 0,00 1,00,00 3,00 norm 0 1,00,00 3,00 absnorm
Mittelwert und Median bei einer symmetrischen Verteilung 150 F r e q u e n c y 100 50 0 1.5.75 4.5 5.75 7.5 Ery Mean=4.05 Median=4.0 Mode=3.67
Mittelwert und Median bei einer schiefen Verteilung Häufigkeit 40 35 30 5 0 15 10 5 0 10 30 50 70 90 Mittelwert=3.9 Median=3.5
Die Momente einer Verteilung Um die Schiefe einer Verteilung mathematisch zu beschreiben definieren wir zunächst die Momente. Definition: n 1 m = ( x x) k i n i= 1 k Beachte: m 1 = 0 m = n n 1 s
Die Schiefe Die Schiefe ist proportional dem dritten Moment α 3 = m m 3 3/ = n i= 1 i= 1 ( x ( x x) Verteilung symmetrisch: α 3 = 0 n n i i x) rechts schief: α 3 > 0 links schief: α 3 < 0 3 3/
Alternatives Maß für Schiefe Wie bereits gesehen befindet sich bei einer rechtsschiefen (linksschiefen)verteilung der Mittlewert rechts (links) vom Median. Bei symmetrischen Verteilung sind Mittelwert und Median gleich. Dieser Zusammenhang kann für folgende Definition genutzt werden: 3( x ~ x) α 3 = s