PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013
Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst möchte testen, ob nach einem Aktiensplit (2-für-1) die Erträge steigen. Er verfügt über eine Stichprobe von 10 Aktien, bei denen eine solche Aufteilung vorgenommen wurde. Dabei kennt er die prozentualen Returns der Aktien jeweils im Monat vor (x i ) und im Monat nach (y i ) dem Aktiensplit. Daten: x i 0.5-0.2 0.9 1.1-0.7 1.5 2.0 1.3 1.6 2.1 y i 1.1 0.3 1.2 1.9-0.2 1.4 1.8 1.8 2.4 2.2 y i x i 0.6 0.5 0.3 0.8 0.5-0.1-0.2 0.5 0.8 0.1 R i + 8 6 4 9.5 6 1.5 3 6 9.5 1.5 Wert der Testgröße des Wilcoxon-Vorzeichen-Rangtests: t = w 10 + = 8 + 6 + 4 + 9.5 + 6 + 0 + 0 + 6 + 9.5 + 1.5 = 50.5 Kritischer Bereich (α = 0.05): w 10;0.05 + = 10, w 10;0.95 + = 10 11 2 w 10;0.05 + = 55 10 = 45, K = {t R : 45 t 55} Testergebnis: t K, H 0 wird abgelehnt, Erträge steigen signifikant PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 1
Wilcoxon-Rangsummentest Wilcoxon-Rangsummentest dient zum Vergleich zweier unabhängiger Stichproben hinsichtlich ihrer zentralen Tendenz (ihrer Lage) kann im Fall von Grundgesamtheiten an Stelle des doppelten t-tests verwendet werden Wilcoxon-Rangsummentest wird unter anderem auch als Rangtest nach Wilcoxon bezeichnet, er ist äquivalent zum U-Test von Mann-Whitney gegeben: 2 unabhängige Stichproben X 1,..., X n1 mit stetiger Verteilungsfunktion F X und Y 1,..., Y n2 mit stetiger Verteilungsfunktion F Y, wobei F Y (t) = F X (t + a) mit einer reellen Zahl a vorausgesetzt wird (dann gilt auch µ X = EX = EY + a = µ Y + a falls Erwartungswerte existieren). kann als zweiseitiger oder als einseitiger Test ausgeführt werden PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 2
Wilcoxon-Rangsummentest Fortsetzung H 0 : a = 0, H A : a 0 (bzw. H 0 : µ X = µ Y, H A : µ X µ Y ). In der gemeinsamen Stichprobe (beide Stichproben zusammen) werden die Ränge bestimmt. Bildet man die Summe der Ränge in der ersten Stichprobe, erhält man die Testgröße T = R 1. Kritischer Bereich (kleine n 1, n 2 ): K = {t : t w n1,n 2 ;α/2} {t : t w n1,n 2 ;1 α/2}; die Quantile w n1,n 2 ;α/2 und w n1,n 2 ;1 α/2 kann man in Tabellen finden, dabei gilt w n1,n 2 ;1 α = n 1 (n 1 + n 2 1) w n1,n 2 ;α. Für (Faustregel: n 1 4, n 2 4, n 1 + n 2 20) ist T = R 1 1 2 n 1(n 1 + n 2 + 1) 1 12 n 1n 2 (n 1 + n 2 + 1) näherungsweise standardnormalverteilt, so dass man zur Bestimmung des kritischen Bereichs die entsprechenden Quantile der Standardnormalverteilung nutzen kann. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 3
Beispiel: Abiturnoten und Studienrichtungen Mit Hilfe einer Untersuchung sollte geprüft werden, ob sich Studenten verschiedener Studienrichtungen (Psychologie X und Medizin Y ) hinsichtlich ihrer Leistungsvoraussetzungen für ein Studium, erhoben mit der Durchschnittsnote ihres Abiturs, unterscheiden. Hypothesen: H 0 : a = 0, (d.h. F X = F Y ), H A : a 0. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 4
Daten und Rangplätze im Beispiel Abiturnoten und Studienrichtungen Daten und Rangplätze Psychologiestudenten: n 1 = 21 x i 2.12 2.17 2.00 1.62 1.59 1.93 1.90 r i 26 28 22 4 1 19 18 x i 2.05 2.01 1.97 2.60 2.34 1.60 1.66 r i 25 23 21 42 37 2 8 x i 1.95 2.25 1.81 1.83 2.29 1.65 2.46 r i 20 32 12 13 35 7 39 Daten und Rangplätze Medizinstudenten: n 2 = 21 y i 1.86 2.24 1.84 2.27 1.61 1.74 2.13 r i 16 31 14 34 3 10 27 y i 2.18 1.63 1.87 2.26 1.75 2.43 2.49 r i 29 5 17 33 11 38 40 y i 1.69 1.64 2.19 2.04 2.57 2.33 1.85 r i 9 6 30 24 41 36 15 PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 5
Test im Beispiel Abiturnoten und Studienrichtungen Summe Rangzahlen Psychologiestudenten: R 1 = 434. Summe Rangzahlen Medizinstudenten: R 2 = 469. Test für große Stichproben: Wert der Testgröße: t = 434 0.5 21 43 21 2 43 12 Kritischer Bereich (α = 0.01, zweiseitiger Test) K = {t R : t > z 0.995 = 2.567}. = 0.440. Testergebnis: t K, H 0 wird nicht abgelehnt, Leistungsvoraussetzungen unterscheiden sich nicht signifikant. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 6
Bindungen Bei Vorzeichen- oder auf Rängen basierten Tests kann es trotz der Stetigkeitsannahme der entsprechenden Verteilungen vorkommen, dass in der Stichprobe Werte vorkommen. Man spricht dann von auftretenden Bindungen (engl. ties ). Der Testaufbau sieht Bindungen eigentlich nicht vor (die Wahrscheinlichkeit dafür ist ), deshalb muss man die Tests geeignet modifizieren. Bei rangbasierten Tests mittelt man beim Auftreten von Bindungen einfach die Rangzahlen. Besonders kritisch sind Bindungen bei Vorzeichentests, wenn im Einstichprobenproblem einige Werte gleich dem Median sind bzw. im Zweistichprobenproblem einige Differenzen gleich Null sind. Bei bestimmten Tests, wie z.b. dem Wilcoxon-Rangsummentest oder dem Kruskal-Wallis-Test (er wird später behandelt) muss die Testgröße beim Vorliegen von Bindungen in der Stichprobe entsprechend angepasst werden (siehe Literatur). PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 7
Mögliche Vorgehensweisen beim Auftreten von Bindungen bei Vorzeichentests oft kann man Bindungen Messgenauigkeit erhöht, indem man die Beobachtungen mit Bindung werden nicht berücksichtigt ( geringerer Stichprobenumfang) Beobachtungen mit Bindung werden zu gleichen Teilen beiden Gruppen (+ bzw., etc.) zugeordnet, bei ungerader Anzahl der Bindungen wird eine Beobachtung nicht berücksichtigt die Beobachtungen mit Bindung werden zufällig mit einer Wahrscheinlichkeit von einer der beiden Gruppen zugeordnet Nulldifferenzen erhalten das Vorzeichen PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 8
Verteilungstests eine weitere Klasse von Tests beschäftigt sich mit der Prüfung, ob die Werte der Stichprobe aus einer Grundgesamtheit mit einer speziellen hypothetischen Verteilungsfunktion stammen ausführlicher wird hier der χ 2 -Anpassungstest behandelt kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auch Kolmogorow-Anpassungstest) und der Shapiro-Wilk-Test weitere Tests, die zum Teil für bestimmte Typen von Verteilungsfunktionen entwickelt wurden, kann man in der Literatur finden PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 9
Der χ 2 -Anpassungstest Test, ob vorliegende Stichprobe aus einer Grundgesamtheit mit einer hypothetischen Verteilungsfunktion F 0 entstammt. Prinzipielles Vorgehen: der Stichprobe mit der hypothetischen Verteilung falls die Abweichungen zu groß sind, dann erfolgt eine Nullhypothese der Der Test ist ein asymptotischer Test, d.h. man rechnet mit der asymptotischen Verteilung (für n ) der Testgröße unter H 0. Hypothesen: H 0 : F (x) = F 0 (x), x R, F 0 ist eine Verteilungsfunktion, ( ) x µ z.b. F 0 (x) = Φ falls X N (µ, σ 2 ); σ H A : F (x) F 0 (x) für mindestens ein x R. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 10
Definition der Testgröße T Einteilung der gesamten Merkmalsachse in k Klassen A 1 = (, a 1 ), A 2 = [a 1, a 2 ),..., A k = [a k 1, ). Bestimmung der absoluten Klassenhäufigkeiten H 1, H 2,..., H k (Anzahl der Stichprobenwerte in der jeweiligen Klasse). Bestimmung der theoretischen Wahrscheinlichkeiten für die Klassenzugehörigkeiten unter der Annahme der Gültigkeit von H 0, p 1 = P H0 (A 1 ) = P H0 (X < a 1 ) = F 0 (a 1 ), p 2 = P H0 (A 2 ) = P H0 (a 1 X < a 2 ) = F 0 (a 2 ) F 0 (a 1 ),... p k = P H0 (A k ) = P H0 (a k 1 X) = 1 F 0 (a k 1 ) Testgröße: T = k (H j np j ) 2 j=1 diese Größe ist unter H 0 np j ( χ 2 Abstandsfunktion ), asymptotisch χ 2 k 1 -verteilt PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 11
Kritischer Bereich und Bemerkungen Kritischer Bereich: K = {t R : t > χ 2 k 1;1 α }. Bemerkungen: Der Stichprobenumfang n sollte nicht zu klein sein. Die Anzahl und die Größe der Klassen A j sollte so sein, dass np j = np H0 (X A j ) > 1 für alle j = 1,..., k gilt (und zusätzlich np j 5 für mindestens 80% der Klassen; ggf. Klassen zusammenfassen oder gesamte Klasseneinteilung ändern). Bei diskreten Verteilungen und nicht zu kleinen Einzelwahrscheinlichkeiten sollte pro Merkmalswert gewählt werden. Klasse Modifikation: Unbekannte Parameter in der Verteilungsfunktion F 0 können durch (Maximum-Likelihood-)Schätzungen ersetzt werden. Sind m Parameter zu schätzen, so ist anstelle χ 2 k 1 die -Verteilung zu benutzen. χ 2 k m 1 PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 12
Beispiel: Test auf gerechten Würfel Anhand einer Stichprobe von n = 90 Würfelergebnissen soll mit α = 0.05 getestet werden, ob der Würfel gerecht ist, d.h. ob für die Augenzahl X gilt: H 0 : p i = P (X = i) = 1 6, i = 1,..., 6. Daten: Augenzahl 1 2 3 4 5 6 H j 19 13 14 12 17 15 np j 15 15 15 15 15 15 Wert der Testgröße: t = 16 15 + 4 15 + 1 15 + 9 15 + 4 15 + 0 15 = 34 15 = 2.26. Kritischer Bereich: K = (χ 2 5;0.95, ) = (11.07, ). Testergebnis: t K, H 0 wird nicht abgelehnt, die Abweichungen der beobachteten Häufigkeiten von den theoretischen sind nicht signifikant. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 13
Beispiel: technisches Nennmaß X... Abweichung vom Nennmaß; X N (µ, σ 2 ) wird getestet. ( ) x µ H 0 : F (x) = Φ, x R; σ ( ) x µ H A : F (x) Φ für mindestens ein x R σ α = 0.05 n = 150 Messungen, ˆµ = x = 40.48, ˆσ = s = 5.71, m = 2 Schätzparameter, sei k = 8 (Anzahl der Klassen); z j = a j x, j = 1,..., k s PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 14
Daten und Test im Beispiel technisches Nennmaß a j H j z j Φ(z j ) p j np j... 30.5 5-1.75 0.04006 0.04006 6.009 30.5... 33.5 13-1.22 0.11123 0.07117 10.676 33.5... 36.5 23-0.70 0.24196 0.13073 19.610 36.5... 39.5 22-0.17 0.43250 0.19054 28.581 39.5... 42.5 29 0.35 0.63683 0.20433 30.650 42.5... 45.5 29 0.88 0.81085 0.17402 26.103 45.5... 48.5 16 1.40 0.91924 0.10839 16.259 48.5... 13 0.08076 12.114 150 1.0000 k (H j np j ) 2 t = = 3.25, K = (χ 2 8 2 1;0.95 = 11.1, ), np j=1 j t K, H 0 wird nicht abgelehnt. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 15
Der Kolmogorow-Smirnow-Test Der Kolmogorow-Smirnow-Test (Kolmogorow-Anpassungstest) basiert auf der empirischen Verteilungsfunktion ˆF n zur Stichprobe (vom Umfang n): Anzahl Stichprobenwerte < x ˆF n (x) :=, x R. n Voraussetzung: Die hypothetische Verteilungsfunktion F 0 ist stetig und enthält unbekannten Parameter. Hypothesen: H 0 : F (x) = F 0 (x), x R; H A : F (x) F 0 (x) für mindestens ein x R. Testgröße: T = sup ˆF n (x) F 0 (x). x R Der Test wird günstigerweise mit einem Computerprogramm durchgeführt. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 16
Bemerkungen zum Kolmogorow-Smirnow-Test Der Kolmogorow-Smirnow-Test (kurz auch K-S-Test ) ist im Gegensatz zum χ 2 -Anpassungstest auch für kleine Stichproben anwendbar und das Testergebnis hängt nicht von einer Klasseneinteilung ab. Man kann Tests mit dem K-S-Test durchführen. Es gibt Verallgemeinerungen des K-S-Tests, bei denen statt festgelegter Parameterwerte der hypothetischen Verteilung F 0 geeignete Schätzwerte eingesetzt werden (z.b. der Lilliefors-Test im Fall von Normalverteilungen). Man kann mit einer Version des K-S-Testes auch prüfen, ob zwei Stichproben aus einer Grundgesamtheit stammen, also übereinstimmende Verteilungen zugrundeliegen. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 17
Der Shapiro-Wilk-Test zur Normalverteilungsprüfung Der Shapiro-Wilk-Test prüft ausschließlich, ob bei einer Stichprobe eine Normalverteilung vorliegt. Dieser Test besitzt eine kleinen Stichprobenumfängen., insbesondere auch im Fall von Grundlage des Tests sind bestimmte Eigenschaften der Ordnungsstatistiken einer Stichprobe aus einer normalverteilten Grundgesamtheit. Der Test ist sehr rechenintensiv und sollte mit Statistik-Software durchgeführt werden. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 18