Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57
Die Deskriptivstatistik dient der Beschreibung der erhobenen Daten in der Stichprobe durch 1. Tabellen, 2. Statistische Kennwerte, und/oder 3. Grafiken. Diese Strukturierung, Zusammenfassung und anschauliche Darstellung der Daten dient aber auch dazu, sich zunächst einen Überblick zu verschaffen und ev. Widersprüchlichkeiten zu entdecken (verursacht z.b. durch Dateneingabefehler, falsche Angaben eines Untersuchungsteilnehmers, etc.). Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 2/57
Die Datenmatrix liefert Informationen über die Charakteristika jeder einzelnen Person. Im allgemeinen ist man allerdings daran interessiert, wie häufig die einzelnen Merkmalsausprägungen in der Stichprobe vorkommen. Dazu kann man sich die Häufigkeitstabelle bzw. Häufigkeitsverteilung ansehen. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 3/57
Nominalskalierte Merkmale Absolute Häufigkeit, f j, ist die Anzahl von Personen mit der j-ten Ausprägung des Merkmals X. Es gilt stets: Die Summe der absoluten Häufigkeiten für die verschiedenen Ausprägungen beträgt n: k f j = n j=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 4/57
Die absoluten Häufigkeiten sind vom Stichprobenumfang abhängig; eignen sich nicht um die Ergebnisse verschiedener Erhebungen mit unterschiedlichem Stichprobenumfang zu vergleichen. Größen, die unabhängig vom Stichprobenumfang sind, sind die relative Häufigkeit und Prozentwerte. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 5/57
Relative Häufigkeit, r j, ist der Quotient absolute Häufigkeit Anzahl der Personen = f j n Es gilt stets: Es können nur Werte zwischen 0 und 1 vorkommen; die Summe der relativen Häufigkeiten für die verschiedenen Ausprägungen beträgt 1. Prozentwerte, pz j : k r j = 1 j=1 Prozentuelle Häufigkeit = r j 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 6/57
Datenbeispiel 1: Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS 2006): 1 Variable Erhebungsgebiet: Alte Bundesländer (= Westdeutschland) oder Neue Bundesländer (= Ostdeutschland) ; Zufallsstichprobe von n = 50 Personen. Kodierung: 1 = Westdeutschland, 2 = Ostdeutschland. Urliste: 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 1, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2 1 Das ALLBUS-Programm ist 1980-1986 und 1991 von der DFG (Deutsche Forschungsgemeinschaft) gefördert worden. Die weiteren Erhebungen wurden von Bund und Ländern über die GESIS (Gesellschaft sozialwissenschaftlicher Infrastruktureinrichtungen) finanziert. ALLBUS wird innerhalb der GESIS an den Standorten Mannheim und Köln in Zusammenarbeit mit dem ALLBUS-Ausschuß realisiert. Die vorgenannten Institutionen und Personen tragen keine Verantwortung für die Verwendung der Daten in dieser Vorlesung. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 7/57
Häufigkeitstabelle für Datenbeispiel 1 Erhebungsgebiet Strichliste abs. H. rel. H. Prozent x j f j r j pz j Westdeutschland 29 0.58 58 Ostdeutschland 21 0.42 42 Summe 50 1 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 8/57
Ordinalskalierte Merkmale Zusätzlich kumulative Häufigkeitsfunktionen interessant und sinnvoll. Voraussetzung ist, dass die Merkmalsausprägungen der Größe nach geordnet sind. Kumulierte absolute Häufigkeit oder Empirische Verteilungsfunktion f + = die Summe der absoluten Häufigkeiten der betreffenden Merkmalsausprägung und aller kleineren. Gibt an, wieviele Personen einen Wert haben, der kleiner oder gleich der betreffenden Kategorie l ist. f + l = l j=1 f j Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 9/57
Kumulierte relative Häufigkeit r + = die Summe der relativen Häufigkeiten der betreffenden Merkmalsausprägung und aller kleineren. Anteil der Personen, die einen Wert haben, der kleiner oder gleich der betreffenden Kategorie l ist. r + l = 1 n l j=1 f j Kumulierte prozentuelle Häufigkeit pz + = die Summe der prozentuellen Häufigkeiten der betreffenden Merkmalsausprägung und aller kleineren. Prozentwert der Personen, die einen Wert haben, der kleiner oder gleich der betreffenden Kategorie l ist. pz + l = r + l 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 10/57
Es gilt stets: f + k = k f j = n j=1 r + k = 1 n k f j = 1 j=1 pz + k = 100 bei j = 1,..., k Merkmalsausprägungen. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 11/57
Datenbeispiel 2: Variable Gesundheitszustand aus ALLBUS (2006): Kodierung: 1 = sehr gut, 2 = gut, 3 = zufriedenstellend, 4 = weniger gut, 5 = schlecht; Zufallsstichprobe von n = 50 Personen. Urliste: 1, 2, 3, 2, 3, 2, 3, 4, 3, 2, 2, 5, 2, 3, 3, 2, 2, 3, 2, 2, 2, 2, 2, 1, 1, 1, 2, 4, 3, 3, 2, 4, 3, 5, 1, 3, 5, 2, 1, 2, 2, 2, 2, 4, 2, 3, 1, 2, 4, 4 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 12/57
Häufigkeitstabelle für Datenbeispiel 2 Gesundheitszustand f j r j pz j f + j r + j pz + j sehr gut 7 0.14 14 7 0.14 14 gut 22 0.44 44 29 (7+22) 0.58 58 zufriedenstellend 12 0.24 24 41 (29+12) 0.82 82 weniger gut 6 0.12 12 47 0.94 94 schlecht 3 0.06 6 50 1.00 100 Summe 50 1.00 100 - - - Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 13/57
Metrische Merkmale Univariate Deskriptive Statistik Häufigkeitstabelle unübersichtlich, insbesondere bei stetigen Variablen Intervalle (= Klassenzusammenfassung oder gruppierte Daten). 5-15 Intervalle (max. 20). Je weniger Intervalle umso größer Informationsverlust, je mehr Intervalle umso unübersichtlicher. Variable Alter aus ALLBUS (2006), Zufallsstichprobe von n = 50 Personen. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 14/57
Häufigkeitstabelle für Datenbeispiel 3 mit Originaldaten Alter f j r j pz j f + j r + j pz + j 19 1 0.02 2 1 0.02 2 20 1 0.02 2 2 0.04 4 24 2 0.04 4 4 0.08 8 31 1 0.02 2 5 0.10 10 33 1 0.02 2 6 0.12 12 35 1 0.02 2 7 0.14 14 36 2 0.04 4 9 0.18 18 38 2 0.04 4 11 0.22 22 40 4 0.08 8 15 0.30 30 41 2 0.04 4 17 0.34 34 42 2 0.04 4 19 0.38 38 43 1 0.02 2 20 0.40 40 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 15/57
Fortsetzung Häufigkeitstabelle für Datenbeispiel 3 mit Originaldaten 45 1 0.02 2 21 0.42 42 46 2 0.04 4 23 0.46 46 47 2 0.04 4 25 0.50 50 48 2 0.04 4 27 0.54 54 49 1 0.02 2 28 0.56 56 51 1 0.02 2 29 0.58 58 52 1 0.02 2 30 0.60 60 53 2 0.04 4 32 0.64 64 54 1 0.02 2 33 0.66 66 55 2 0.04 4 35 0.70 70 56 1 0.02 2 36 0.72 72 57 1 0.02 2 37 0.74 74 58 1 0.02 2 38 0.76 76 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 16/57
Fortsetzung Häufigkeitstabelle für Datenbeispiel 3 mit Originaldaten 60 1 0.02 2 39 0.78 78 62 1 0.02 2 40 0.80 80 64 2 0.04 4 42 0.84 84 66 1 0.02 2 43 0.86 86 67 1 0.02 2 44 0.88 88 69 1 0.02 2 45 0.90 90 71 2 0.04 4 47 0.94 94 75 1 0.02 2 48 0.96 96 82 1 0.02 2 49 0.98 98 85 1 0.02 2 50 1.00 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 17/57
Häufigkeitstabelle für Datenbeispiel 3 mit gruppierten Daten Alter f j r j pz j f + j r + j pz + j 29 Jahre 4 0.08 8 4 0.08 8 30-39 Jahre 7 0.14 14 11 0.22 22 40-49 Jahre 17 0.34 34 28 0.56 56 50-59 Jahre 10 0.20 20 38 0.76 76 60-69 Jahre 7 0.14 14 45 0.90 90 70 Jahre 5 0.10 10 50 1.00 100 Summe 50 1 100 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 18/57
Häufigkeitstabelle mit SPSS Menü Analysieren... Deskriptive Statistik Häufigkeiten... Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 19/57
Histogramm Univariate Deskriptive Statistik Histogramm oder Blockdiagramm - Grafische Darstellung der Häufigkeitstabelle Beobachtete Ausprägungen x j geordnet auf der X -Achse Relative (r j ) oder absolute Häufigkeiten (f j ) auf der Y -Achse Rechtecksflächen sind gleich den r j oder f j Gesamtfläche des Histogramms ist gleich 1 bzw. n Maßstab auf der X -Achse beliebig und wird so gewählt, dass die Verteilung möglichst anschaulich wird Balkendiagramm für nominalskalierte Variablen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 20/57
Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 21/57
Treppenfunktion Univariate Deskriptive Statistik Grafische Darstellung der kumulativen Häufigkeitstabelle analog zu Histogramm Letzte und größte Teilfläche ist gleich 1 bzw. n Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 22/57
Treppenfunktion Univariate Deskriptive Statistik Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 23/57
Lagemaße - Zweck Univariate Deskriptive Statistik Wir wollen die zentrale Tendenz einer Stichprobe möglichst gut schätzen Eine Maßzahl, die in geeigneter Weise ein Zentrum der Stichprobe angibt Mittelwert, Modalwert und Median Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 24/57
Arithmetisches Mittel (Mittelwert) Der Mittelwert oder Durchschnittswert ist die Summe aller Werte dividiert durch den Stichprobenumfang n: n x = i=1 n x i = 1 n n i=1 Das arithmetische Mittel ist nur für metrische Variablen sinnvoll! x i Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 25/57
Arithmetisches Mittel (Mittelwert) Beispiel: Anzahl der Kinder: Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 x = 0 + 1 + 2 + 3 + 2 + 1 + 2 + 2 + 4 + 3 + 1 + 2 + 3 + 1 + 0 15 = 27 15 = 1.8 Die durchschnittliche Kinderzahl in der Stichprobe beträgt 1.8 Kinder. = Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 26/57
Arithmetisches Mittel (Mittelwert) Auf Grundlage der Häufigkeitstabelle lässt sich der Mittelwert berechnen, indem man jede Merkmalsausprägung mit ihrer absoluten Häufigkeit multipliziert und die Summe über alle Merkmalsausprägungen bildet. x = 1 n k x j f j j=1 Beispiel: Berechnung des Mittelwertes für Datenbeispiel 3 aus der Häufigkeitstabelle x = 1 2459 (19 1 + 20 1 + 24 2 + 31 1 +...) = 50 50 = 49.18 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 27/57
Eigenschaften des Mittelwertes (1) Die Summe der Differenzen aller Werte vom Mittelwert ist Null, n (x i x) = 0 i=1 d.h. positive und negative Abweichungen vom Mittelwert heben sich auf. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 28/57
Eigenschaften des Mittelwertes (2) Die Summe der quadrierten Differenzen aller Werte zum Mittelwert ist ein Minimum (d.h. ist kleiner als die Summe der quadrierten Differenzen aller Werte zu irgendeinem anderen Wert) n (x i x) 2 = Min i=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 29/57
Gemeinsamer Mittelwert für zwei oder mehr Datensätze Den gemeinsamen Mittelwert aus zwei Stichproben mit Mittelwerten x 1 und x 2 und Stichprobenumfängen n 1 und n 2 berechnet man, indem man die Mittelwerte mit den Stichprobenumfängen gewichtet: x = n 1 x 1 + n 2 x 2 n 1 + n 2 Analog für mehr als zwei Datensätze. Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 30/57
Median und das α-quantil Der Median ist dadurch charakterisiert, dass jeweils mindestens 50% der Beobachtungen einen Wert größer oder gleich bzw. kleiner oder gleich dem Median annehmen Sind x (1) x (n) die der Größe nach geordneten Beobachtungswerte, so ist der Median definiert als x = x ( n+1 2 ) falls n ungerade x ( n 2 ) + x ( n+2 2 ) 2 falls n gerade Bei einer ungeraden Anzahl von Merkmalsausprägungen ist der Median der Wert in der Mitte der geordneten Reihe Bei einer geraden Anzahl ist der Median das arithmetische Mittel zwischen den beiden mittleren Werten der geordneten Reihe Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 31/57
Median und das α-quantil Beispiel 1: Anzahl der Kinder (n = 15): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 x = x (8) = 2 Beispiel 2: Anzahl der Kinder (n = 16): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 5 Geordn. Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 5 x = x (8) + x (9) 2 = 2 + 2 2 = 2 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 32/57
Median und das α-quantil Sind x (1) x (n) die der Größe nach geordneten Beobachtungswerte, so ist das α-quantil (0 < α < 1) definiert als x α = x (l) falls n α keine ganze Zahl ist; l = die auf n α folgende ganze Zahl x (l) +x (l+1) 2 falls n α eine ganze Zahl ist; l = n α Der Median ist das Quantil mit α = 0.50 (0.50-Quantil) Die Quantile mit α = 0.25 und α = 0.75 heißen unteres bzw. oberes Quartil Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 33/57
Median und das α-quantil Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 x = x (8) = 2 x 0.25 = x (4) = 1 x 0.75 = x (12) = 3 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 34/57
Median und das α-quantil Der Median hat gegenüber dem arithmetischen Mittel den Vorteil, dass er auch bei rangskalierten Merkmalen verwendet werden kann Der Median ist weniger empfindlich gegenüber Ausreissern in der Stichprobe Werte, die weit von allen übrigen entfernt liegen, beeinflussen den Median kaum Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 35/57
Ausreisser - Graphische Überprüfung Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 36/57
Modalwert Bei nominalskalierten Merkmalen wie Geschlecht oder Beruf kann man weder das arithmetische Mittel noch den Median als Lagemaß verwenden Der Modalwert (Mod) (häufigster Wert) ist ein dafür geeignetes Lagemaß Der Modalwert gibt die Ausprägung an, welche die größte Häufigkeit in der Stichprobe besitzt Falls mehrere Ausprägungen diese Bedingung erfüllen, der Modalwert also nicht eindeutig ist, ist es nicht sinnvoll ihn als Lagemaß zu verwenden Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 37/57
Modalwert Univariate Deskriptive Statistik Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0 Mod = 1, 2, 3 Modalwert nicht eindeutig Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 38/57
Bemerkungen zu den Lagemaßen Bei mehrgipfeligen und U-förmigen Häufigkeitsverteilungen sind Lagemaße nicht charakteristisch für die Verteilung Vor der Verwendung eines Lagemaßes immer seine Sinnhaftigkeit überprüfen Charakterisierung von Häufigkeitsverteilungen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 39/57
Charakterisierung von Häufigkeitsverteilungen Bei einer symmetrischen Verteilung gilt x = x = Mod Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 40/57
Charakterisierung von Häufigkeitsverteilungen Lagemaße charakterisieren den Datensatz nicht richtig Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 41/57
Bei einer linksschiefen Verteilung gilt x < x < Mod Bei einer rechtsschiefen Verteilung gilt x > x > Mod Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 42/57
Wegweiser Lagemaße Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 43/57
Streuungsmaße - Zweck Streuungsmaße beschreiben die Abweichung von einem Zentrum einer Häufigkeitsverteilung Präzisierung einer Häufigkeitsverteilung durch Lagemaß und Streuungsmaß Spannweite, Standardabweichung, Varianz, Variationskoeffizient und Quartilabstand Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 44/57
Spannweite Univariate Deskriptive Statistik Streubereich einer Häufigkeitsverteilung ist derjenige Bereich, in dem alle Werte der Stichprobe liegen Sind x (1) x (n) die der Größe nach geordneten Beobachtungswerte, so ist das Intervall [ x (1), x (n) ] der Streubereich der Stichprobe Spannweite R = x (n) x (1), d.h. die Breite des Streubereichs Ausreisser beeinflussen die Spannweite sehr stark Berechnung der Spannweite ist nur für metrische Variablen sinnvoll Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 45/57
Varianz Univariate Deskriptive Statistik Die Varianz s 2 ist ein Maß, das die Streuung der Werte um den Mittelwert ausdrückt s 2 = 1 n 1 [ n n (x i x) 2 = 1 n 1 i=1 i=1 x 2 i ( n i=1 x i) 2 n }{{} praktische Berechnungsformel Varianz ist ein quadratisches Streuungsmaß und nimmt somit stets positive Werte an Ausreisser beeinflussen die Varianz sehr stark, da die Bezugsgröße der Mittelwert ist Berechnung der Varianz ist nur für metrische Variablen sinnvoll Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 46/57 ]
Varianz Univariate Deskriptive Statistik Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 1 3 2 2 2 3 4 3 1 2 3 1 0 15 i=1 x i = 28 15 i=1 xi 2 = 72 s 2 = 1 [ 72 784 ] = 1.38 14 15 Die Varianz läßt sich auch durch die Häufigkeitstabelle berechnen, analog zu Mittelwert s 2 = 1 k f j x j 2 ( k j=1 f jx j )2 n 1 n j=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 47/57
Varianz Univariate Deskriptive Statistik Beispiel Datenbeispiel 3: Häufigkeitstabelle siehe 1. Vorlesungseinheit 50 i=1 s 2 = 1 49 x i = 2459 50 i=1 [132027 24592 50 x 2 i = 132027 ] = 226.396 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 48/57
Standardabweichung Univariate Deskriptive Statistik Die Standardabweichung s ist die positive Wurzel aus der Varianz einer Stichprobe s = + s 2 = 1 + n 1 n (x i x) 2 Die Standardabweichung besitzt die gleiche Dimension wie die Beobachtungswerte (Vorteil gegenüber der Varianz) Ausreisser beeinflussen die Standardabweichung sehr stark, da die Bezugsgröße der Mittelwert ist i=1 Berechnung der Standardabweichung ist sinnvoll nur für metrische Variablen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 49/57
Variationskoeffizient Univariate Deskriptive Statistik Der Variationskoeffizient v ist ein vom Mittelwert bereinigtes Streuungsmaß v = s x Der Variationskoeffizient misst das Verhältnis von Standardabweichung und Mittelwert Berechnung von v nur für metrische Variablen mit positiven Werten sinnvoll Der Variationskoeffizient eignet sich zum Vergleich der Streuungen verschiedener Messreihen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 50/57
Quartilabstand Univariate Deskriptive Statistik q A = x 0.75 x 0.25 Quartilabstand ist robust gegenüber Ausreissern Zwischen dem unteren und oberen Quartil liegen 50% aller Werte Berechnung des Quartilabstandes ist sinnvoll für mindestens rangskalierte Variablen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 51/57
Quartilabstand Univariate Deskriptive Statistik Beispiel Anzahl der Kinder (n = 15): Urliste: 0 1 2 3 2 1 2 2 4 3 1 2 3 1 0 Geordnete Urliste: 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 x = x (8) = 2 x 0.25 = x (4) = 1 x 0.75 = x (12) = 3 q A = x 0.75 x 0.25 = 2 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 52/57
Ausreisser - Grafische Überprüfung Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 53/57
Wegweiser Streuungsmaße Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 54/57
Schiefe Univariate Deskriptive Statistik Die Schiefe g 1 ist eine Maßzahl, die uns angibt, in welche Richtung eine Häufigkeitsverteilung schief ist g 1 = 1 n n i=1 (x i x) 3 ( 1 n n i=1 (x i x) 2 ) 3 Ist g 1 = 0, so ist die Verteilung symmetrisch Je stärker negativ/positiv g 1 ist, desto linksschiefer/rechtsschiefer ist die Verteilung Die Schiefe ist sinnvoll für eingipfelige Verteilungen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 55/57
Messwerte von Personen verschiedener Populationen sind oft nicht direkt vergleichbar, z.b. die Leistung eines Mädchens in Kugelstoßen mit jener eines Knaben Dennoch möchte man ausdrücken können, wie gut jeder der beiden Leistungen innerhalb der Bezugsgruppe ist Der Standardmesswert ti bezieht den beobachteten Messwert x i der i-ten Person auf den Mittelwert x der Gruppe und drückt die Abweichung in Standardeinheiten s aus Es gilt t = 0 und s 2 t = 1 t i = x i x s Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 56/57
Beispiel Ein Knabe erzielt 5.20m bei Gruppenkennwerten x M = 5.03, bzw. s M = 0.92 Ein Mädchen erreicht 4.50m bei Gruppenkennwerten x W = 4.21, bzw. s W = 0.85 Daher ist t M = 0.18 und t W = 0.42 Der Knabe liegt 0.18, das Mädchen 0.42 Standardeinheiten über dem Mittelwert (0!); die Leistung des Mädchens ist relativ besser Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 57/57