Statistik II für Betriebswirte Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 2. November 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 1
Wilcoxon-Rangsummentest Der Wilcoxon-Rangsummentest dient zum Vergleich zweier unabhängiger Stichproben hinsichtlich ihrer Lage. Er kann im Fall von nicht-normalverteilten Grundgesamtheiten an Stelle des doppelten t Tests verwendet werden. Er wird auch als Rangtest nach Wilcoxon bezeichnet und ist äquivalent zum U-Test von Mann-Whitney. Geg.: 2 unabhängige Stichproben X 1,..., X n1 mit stetiger Verteilungsfunktion F X und Y 1,..., Y n2 mit stetiger Verteilungsfunktion F Y, wobei F Y (t) = F X (t + a) mit einer reellen Zahl a vorausgesetzt wird (falls Erwartungswerte existieren gilt µ X = EX = EY + a = µ Y + a). Er kann als zweiseitiger oder als einseitiger Test ausgeführt werden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 2
Wilcoxon-Rangsummentest kleine Stichprobenumfänge Hypothesen: H 0 : a = 0, H A : a 0 (zweiseitiger Test) (bzw. H 0 : µ X = µ Y, H A : µ X µ Y ). In der gemeinsamen Stichprobe werden die Ränge bestimmt. Die Testgröße T = R 1 ist die Summe der Ränge zu der ersten Stichprobe. Kritischer Bereich (n 1, n 2 klein): K = {t > 0 : t w n1,n 2 ;α/2} {t > 0 : t w n1,n 2 ;1 α/2} ; die Quantile w n1,n 2 ;α/2 und w n1,n 2 ;1 α/2 kann man in Tabellen finden, dabei gilt w n1,n 2 ;1 α = n 1 (n 1 + n 2 + 1) w n1,n 2 ;α. Grundüberlegung: Beide Stichproben sollten sich unter H 0 ungefähr gleichartig in der gemeinsamen geordneten Stichprobe durchmischen. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 3
Wilcoxon-Rangsummentest große Stichprobenumfänge Hypothesen: H 0 : a = 0, H A : a 0 (zweiseitiger Test) (bzw. H 0 : µ X = µ Y, H A : µ X µ Y ). Testgröße: Mit der Summe R 1 der Ränge zur ersten Stichprobe in der gemeinsamen Stichprobe nutzt man T = R 1 1 2 n 1(n 1 + n 2 + 1). 1 12 n 1n 2 (n 1 + n 2 + 1) Kritischer Bereich (n 1, n 2 groß): (Faustregel: n 1 4, n 2 4, n 1 + n 2 20) K = {t R : t > z 1 α/2 } (da T näherungsweise standardnormalverteilt ist). Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 4
Beispiel: Flugschrauber Mit zwei Typen von Flugschraubern wurden jeweils 6 Flüge zwischen zwei Flughäfen durchgeführt und die totale Flugzeit in Minuten gemessen. Wird diese Strecke im Mittel gleich schnell bewältigt? Daten: (Quelle: Aczel, Sounderpandian: Complete Business Statistics, 2006, Bsp.14-4) Modell A 35 38 40 42 41 36 Modell B 29 27 30 33 39 37 Ordnen und Rangvergabe (Ränge zur ersten Stichprobe in rot): A 35 36 38 40 41 42 B 27 29 30 33 37 39 Rang 1 2 3 4 5 6 7 8 9 10 11 12 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 5
Fortsetzung Beispiel: Flugschrauber Hypothesen: H 0 : µ A = µ B, H A : µ A µ B, α = 0.05. Wert der Testgröße des Wilcoxon-Rangsummentests: t = r 1 = 5 + 6 + 8 + 10 + 11 + 12 = 52. Kritischer Bereich: aus Tabelle w 6,6;0.025 = 26, w 6,6;0.975 = 6 13 26 = 52, K = {t > 0 : t 26} {t > 0 : t 52}. Testergebnis: t K, H 0 signifikant unterschiedlich. wird abgelehnt, die Flugzeiten sind Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 6
Bindungen Bei Vorzeichen- oder auf Rängen basierten Tests kann es trotz der Stetigkeitsannahme der entsprechenden Verteilungen vorkommen, dass in der Stichprobe gleiche Werte vorkommen. Man spricht dann von auftretenden Bindungen (engl. ties ). Der Testaufbau sieht Bindungen eigentlich nicht vor (die Wahrscheinlichkeit dafür ist Null), deshalb muss man die Tests geeignet modifizieren. Beim Auftreten von Bindungen mittelt man die Rangzahlen. Besonders kritisch sind Bindungen bei Vorzeichentests, wenn im Einstichprobenproblem einige Werte gleich dem Median sind bzw. im Zweistichprobenproblem einige Differenzen gleich Null sind. Bei bestimmten Tests, wie z.b. dem Wilcoxon-Rangsummentest oder dem Kruskal-Wallis-Test (er wird später behandelt) muss die Testgröße beim Vorliegen von Bindungen in der Stichprobe entsprechend angepasst werden (siehe Literatur). Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 7
Bindungen bei Vorzeichentests Einige mögliche Vorgehensweisen: Oft kann man Bindungen vermeiden, indem man die Messgenauigkeit erhöht. Beobachtungen mit Bindung werden nicht berücksichtigt ( geringerer Stichprobenumfang). Beobachtungen mit Bindung werden zu gleichen Teilen beiden Gruppen (+ bzw., etc.) zugeordnet, bei ungerader Anzahl der Bindungen wird eine Beobachtung nicht berücksichtigt. Die Beobachtungen mit Bindung werden zufällig mit einer Wahrscheinlichkeit von 0.5 einer der beiden Gruppen zugeordnet. Nulldifferenzen erhalten das seltenere Vorzeichen. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 8
Verteilungstests Eine weitere Klasse von Tests beschäftigt sich mit der Prüfung, ob die Werte der Stichprobe aus einer Grundgesamtheit mit einer speziellen hypothetischen Verteilungsfunktion stammen. Ausführlicher wird hier der χ 2 Anpassungstest behandelt. Kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auch Kolmogorow-Anpassungstest genannt) und der Shapiro-Wilk-Test. Weitere Tests, die zum Teil für ganz bestimmte Typen von Verteilungsfunktionen entwickelt wurden, kann man in der Literatur finden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 9
Der χ 2 Anpassungstest Test, ob die vorliegende Stichprobe aus einer Grundgesamtheit mit einer hypothetischen Verteilungsfunktion F 0 entstammt. Prinzipielles Vorgehen: Klasseneinteilung der Stichprobe; Vergleich mit der hypothetischen Verteilung; falls die Abweichungen zu groß sind erfolgt eine Ablehnung der Nullhypothese. Dieser Test ist ein asymptotischer Test, d.h. man rechnet mit der asymptotischen Verteilung (für n ) der Testgröße unter H 0. Hypothesen: H 0 : F (x) = F 0 (x), x R, F 0 ist eine Verteilungsfunktion, ( ) x µ z.b. F 0 (x) = Φ falls X N(µ, σ 2 ) ; σ H A : F (x) F 0 (x) für mindestens ein x R. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 10
χ 2 Anpassungstest Testgröße T Einteilung der gesamten Merkmalsachse in k Klassen A 1 = (, a 1 ), A 2 = [a 1, a 2 ),..., A k = [a k 1, ). Bestimmung der absoluten Klassenhäufigkeiten H 1, H 2,..., H k (Anzahl der Stichprobenwerte in der jeweiligen Klasse). Bestimmung der theoretischen Wahrscheinlichkeiten für die Klassenzugehörigkeiten unter der Annahme der Gültigkeit von H 0, p 1 = P H0 (A 1 ) = P H0 (X < a 1 ) = F 0 (a 1 ), p 2 = P H0 (A 2 ) = P H0 (a 1 X < a 2 ) = F 0 (a 2 ) F 0 (a 1 ),... p k = P H0 (A k ) = P H0 (a k 1 X ) = 1 F 0 (a k 1 ) Testgröße: T = k (H j np j ) 2 j=1 diese Größe ist unter H 0 np j ( χ 2 Abstandsfunktion ), asymptotisch χ 2 k 1 verteilt. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 11
χ 2 Anpassungstest Kritischer Bereich Kritischer Bereich: K = {t R : t > χ 2 k 1;1 α }. Bemerkungen: Der Stichprobenumfang n sollte nicht zu klein sein. Die Anzahl und die Größe der Klassen A j sollte so sein, dass np j = np H0 (X A j ) > 1 für alle j = 1,..., k gilt (und zusätzlich np j 5 für mindestens 80% der Klassen; ggf. Klassen zusammenfassen oder gesamte Klasseneinteilung ändern). Bei diskreten Verteilungen und nicht zu kleinen Einzelwahrscheinlichkeiten sollte pro Merkmalswert jeweils eine Klasse gewählt werden. Modifikation: Unbekannte Parameter in der Verteilungsfunktion F 0 können durch (Maximum-Likelihood-)Schätzungen ersetzt werden. Sind m Parameter zu schätzen, so ist anstelle der χ 2 k 1 Verteilung die χ2 k m 1 Verteilung zu benutzen. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 12
Beispiel: Test auf gerechten Würfel Anhand einer Stichprobe von n = 90 Würfelergebnissen soll mit α = 0.05 getestet werden, ob der Würfel gerecht ist, d.h. ob für die Augenzahl X gilt: H 0 : p i = P(X = i) = 1 6, i = 1,..., 6. Daten: Wert der Testgröße: Augenzahl 1 2 3 4 5 6 H j 19 13 14 12 17 15 np j 15 15 15 15 15 15 t = 16 15 + 4 15 + 1 15 + 9 15 + 4 15 + 0 15 = 34 15 = 2.26. Kritischer Bereich: K = (χ 2 5;0.95, ) = (11.07, ). Testergebnis: t K, H 0 wird nicht abgelehnt, die Abweichungen der beobachteten Häufigkeiten von einer diskreten Gleichverteilung sind nicht signifikant. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 13
Beispiel: technisches Nennmaß X... Abweichung vom Nennmaß; X N(µ, σ 2 ) wird getestet. ( ) x µ : F (x) = Φ, x R; σ ( ) x µ H A : F (x) Φ für mindestens ein x R. σ H 0 α = 0.05. n = 150 Messungen, ˆµ = x = 40.48, ˆσ = s = 5.71 m = 2 Schätzparameter. Sei k = 8 (Anzahl der Klassen); z j = a j x, j = 1,..., k. s Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 14
Beispiel: technisches Nennmaß Daten und Test a j H j z j Φ(z j ) p j np j... 30.5 5-1.75 0.04006 0.04006 6.009 30.5... 33.5 13-1.22 0.11123 0.07117 10.676 33.5... 36.5 23-0.70 0.24196 0.13073 19.610 36.5... 39.5 22-0.17 0.43250 0.19054 28.581 39.5... 42.5 29 0.35 0.63683 0.20433 30.650 42.5... 45.5 29 0.88 0.81085 0.17402 26.103 45.5... 48.5 16 1.40 0.91924 0.10839 16.259 48.5... 13 0.08076 12.114 150 1.0000 t = k (H j np j ) 2 = 3.25, K = (χ 2 8 2 1;0.95 = 11.1, ), np j j=1 t K, H 0 wird nicht abgelehnt, zum Niveau von 5% sind die Abweichungen zur Normalverteilung nicht signifikant. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 15
Der Kolmogorow-Smirnow-Test Der Kolmogorow-Smirnow-Test (Kolmogorow-Anpassungstest) basiert auf der empirischen Verteilungsfunktion ˆF n zur Stichprobe (vom Umfang n): ˆF n (x) := Anzahl Stichprobenwerte < x, x R. n Voraussetzung: Die hypothetische Verteilungsfunktion F 0 stetig und enthält keine unbekannten Parameter. Hypothesen: H 0 : F (x) = F 0 (x), x R ; H A : F (x) F 0 (x) für mindestens ein x R. Testgröße: T = sup ˆF n (x) F 0 (x). x R Der Test wird günstigerweise mit einem Computerprogramm durchgeführt. ist Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 16
Bemerkungen zum Kolmogorow-Smirnow-Test Der Kolmogorow-Smirnow-Test (kurz auch K-S-Test ) ist im Gegensatz zum χ 2 Anpassungstest auch für kleine Stichproben anwendbar und das Testergebnis hängt nicht von einer Klasseneinteilung ab. Man kann einseitige Tests mit dem K-S-Test durchführen. Es gibt Verallgemeinerungen des K-S-Tests, bei denen statt festgelegter Parameterwerte der hypothetischen Verteilung F 0 geeignete Schätzwerte eingesetzt werden (z.b. der Lilliefors-Test im Fall von Normalverteilungen). Man kann mit einer Version des K-S-Testes auch prüfen, ob zwei Stichproben aus einer Grundgesamtheit stammen, also übereinstimmende Verteilungen zugrundeliegen. Der K-S-Test kann auch für diskrete Verteilungen genutzt werden, besitz dann aber eine geringere Güte. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 17
Der Shapiro-Wilk-Test zur Normalverteilungsprüfung Der Shapiro-Wilk-Test prüft ausschließlich, ob bei einer Stichprobe eine Normalverteilung vorliegt. Dieser Test besitzt eine hohe Güte, insbesondere auch im Fall von kleinen Stichprobenumfängen. Grundlage des Tests sind bestimmte Eigenschaften der Ordnungsstatistiken einer Stichprobe aus einer normalverteilten Grundgesamtheit. Der Test ist sehr rechenintensiv und sollte mit Statistik-Software durchgeführt werden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 18
Der χ 2 Unabhängigkeitstest Mit dem χ 2 Unabhängigkeitstest überprüft man, ob zwei Merkmale X und Y stochastisch unabhängig sind, d.h. ob für beliebige (zulässige) Mengen A, B gilt: P(X A, Y B) = P(X A) P(Y B). Konkreter prüft man, ob die relativen Häufigkeiten (berechnet aus einer verbundenen Stichprobe) näherungsweise diese Produktregel erfüllen. Hypothesen: H 0 : X und Y sind stochastisch unabhängig, H A : X und Y sind abhängig. Verbundene Stichproben: x 1, x 2,..., x n ; y 1, y 2,..., y n. Einteilung der Merkmalsachsen in Klassen: für X : A 1,..., A k ; für Y : B 1,..., B l. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 19
Kontingenztafel (vgl. Statistik I Vorl. 10) Absolute Häufigkeiten: H ij : Anzahl der Beobachtungen bei denen das Merkmal X in der Klasse A i und gleichzeitig das dazugehörige Merkmal Y in B j liegt. l Randhäufigkeiten: H i = H ij, k H j = H ij. j=1 i=1 Kontingenztafel: X \Y B 1... B l A 1 H 11 H 1l H 1. A k H k1 H kl H k H 1 H l n Im Fall k = l = 2 wird eine solche Tafel auch Vierfeldertafel oder 2 2 Felder-Tafel genannt. Sie wird häufig bei nominellen Merkmalen mit zwei Ausprägungen (dichotome Merkmale) benutzt. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 20
χ 2 Unabhängigkeitstest Testgröße, kritischer Bereich Testgröße: ( empirische Kontingenz ) T = k i=1 j=1 ( l H ij H i H j n H i H j n ) 2. Für eine Vierfeldertafel kann die Testgröße einfacher berechnet werden durch T = n (H 11H 22 H 12 H 21 ) 2 H 1 H 2 H 1 H 2. Kritischer Bereich: K = {t R : t > χ 2 (k 1)(l 1);1 α }. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 21
χ 2 Unabhängigkeitstest Bemerkungen Von den Klassenhäufigkeiten sollten höchstens 20% kleiner als 5 sein, aber alle mindestens gleich 1. Der χ 2 Unabhängigkeitstest mit Hilfe einer Vierfeldertafel sollte für Stichprobenumfänge n < 20 nicht verwendet werden (sondern der exakte Test von Fisher ). Für 20 n 60 eignet sich die nach Yates korrigierte Teststatistik ) 2 T = n ( H 11 H 22 H 12 H 21 n 2. H 1 H 2 H 1 H 2 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 22
Beispiel: Eignung vom Studienabschluß 30 Wirtschaftsingenieure (b 1 ), 35 graduierte Betriebswirte (b 2 ) und 35 Diplomkaufleute (b 3 ), die sich bei einem Unternehmen beworben haben, werden nach einer Eignungsprüfung in die Kategorien geeignet (a 1) und ungeeignet (a 2 ) eingeordnet. Ist diese Eignung vom Studienabschluß abhängig oder nicht. Merkmal A (Eignung), Merkmal B (Studienabschluss); α = 0.05. Hypothesen: H 0 : Merkmal A und Merkmal B sind unabhängig, H A : Merkmal A und Merkmal B sind abhängig. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 23
Beispiel: Eignung vom Studienabschluß Kontingenztafel: (Quelle: Bleymüller, Gehlert, Gülicher: Statistik für Wirtschaftswissenschaftler, 2004, Abschn. 19.2.) A\B b 1 b 2 b 3 a 1 14 10 16 40 a 2 16 25 19 60 30 35 35 100 Berechnung Testgröße: H i H j n : 12 14 14 18 21 21 (14 12)2 (10 14)2 (16 14)2 (16 18)2 t = + + + + 12 14 14 18 (25 21) 2 (19 21)2 + = 2.937 < χ 2 2;0.95 = 5.99. 21 21 Die Hypothese H 0 : A und B sind unabhängig wird nicht abgelehnt, man kann nicht davon ausgehen, dass die Eignung signifikant vom Studienabschluss abhängt. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 24