XV. Testen von Hypothesen ================================================================== 15.1 Alternativtest ------------------------------------------------------------------------------------------------------------------ Eine Urne enthält entweder a) 4 rote und weiße Kugeln b)7 rote und 3 weiße Kugeln enthält. Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert. Man spricht von einer Stichprobe der Länge 5. Nullhypothese H 0 : Es sind 4 rote Kugeln in der Urne d.h. die Wahrscheinlichkeit eine rote Kugel zu ziehen ist gleich 0.4. Man schreibt kurz : H 0 : p = p 0 = 0,4 Gegenhypothese H 1 : Es sind rote Kugeln in der Urne d.h. die Wahrscheinlichkeit eine rote Kugel zu ziehen ist gleich 0,7. Man schreibt kurz : H 1 : p = p 1 = 0,4 Dr Wert, den die Zufallsgröße Z : Anzahl der gezogenen roten Kugeln, annimmt soll darüber entscheiden, welche Hypothese angenommen wird. Es ist W Z = 0, 1, 2, 3, 4, 5 Werden wenig rote Kugeln gezogen, dann ist es sinnvoll anzunehmen, dass die Urne nur 3 rote Kugeln enthält und die Nullhypothese anzunehmen. Werden viele rote Kugeln gezogen lehnt man sie ab. Man definiert den Annahmebereich von H 0 als a = 0, 1, 2
d. h. ist Z a, dann wird H 0 angenommen. Als Ablehnungsbereich von H 0 fefiniert man a = 3, 4, 5} d. h. ist Z a, dann wird H 0 abgelehnt. Als Ergebnis des Tests ist dann möglich : H 0 wird angenommen H 0 wird abgelehnt H 0 ist wahr d.h. p = 0,4 richtig falsch (Fehler 1. Art) H 1 ist wahr d.h. p = 0,7 falsch (Fehler 2. Art) richtig Die Wahrscheinlichkeit, dass man den Fehler 1. Art begeht bezeichnet man mit α und den Fehler 2. Art mit β. Es ist α = P p=0,4 (Z a) = P 0,4 (Z > 2) = 1 P 0,4 (Z 2) = 1 F 5 0,4 (2) 0,317 = 31,7% 1 α 8,3% heißt Sicherheitswahrscheinlichkeit des Tests β = P p=0,7 (Z a) = P 0,7 (Z 2) = F 5 0,7 (2) 1,3% Alternativer Hypothesentest : 1. Aufstellen der Nullhypothese 2. Festlegung von Annahmebereich aund Ablehnungsbereich a 3. a) Fehler 1. Art oder Signifikanzniveau : Obwohl die Nullhyothese stimmt, wird sie abgelehnt α = P p = p0 (Z A) b) Fehler 2. Art Obwohl die Nullhyothese nicht stimmt, wird sie angenommen β = P p = p1 (Z A)
Ein Test mit einem Fehler 1. Art von höchstens 5% bzw. 1% heißt signifikant bzw. hochsignifikant. Bemerkungen : a) Der Fehler 1. Art kann durch Vergrößern des Annahmebereichs verkleinert werden. Allerdings erhöht sich dann der Fehler 2. Art. b) Der Fehler 2. Art kann durch Verkleinern des Anahmebereichs verkleinert werden. Allerdings erhöht sich dann der Fehler 1. Art. c) Durch Vergrößern der Stichprobenlänge lassen sich beide Fehler verkleinern. Für obiges Beispiel ergibt dann : a) Wählt man für das Einführungsbeispiel a = 0, 1, 2, 3, dann ergibt sich α = P 0,4 (Z > 3) = 1 P 0,4 (Z 3) = 1 F 5 0,4 (3) 0,087 = 8,7 % β = P 0,7 (Z 3) = F 5 0,7 (3) 0,472 = 47,2 % b) Wählt man dagegen a = 0, 1, dann ergibt sich α = P 0,4 (Z > 1) = 1 P 0,4 (Z 1) = 1 F 5 0,4 (1) 0,3 =,3 % β = P 0,7 (Z 1) = F 5 0,7 (1) 0,031 = 3,1 % c) Wählt man als Stichprobenlänge n = 20 und a = 0, 1, 2,..., 10, 11 = 1; 11 bzw. a = 12, 13, 14, 15,..., 20 = 12; 20 α = P 0,4 (Z > 11) = 1 P 0,4 (Z 11) = 1 F 20 0,4 (11) 0,057 = 5,7% β = P 0,7 (Z 11) = F 20 0,7 (11) 0,113 = 11,3 %
Aufgabentypen : Bei einem Würfel soll entschieden werden, ob es sich um einen L-Würfel oder um ein gezinkten Würfel handelt bei dem die Sechs mit einer Wahrscheinlichkeit von p = 0,2 auftritt. Berechnen der Fehler 1. und 2. Art Der Würfel wird 200-mal bzw. 00-mal geworfen. Fällt dabei höchstens 3-mal bzw. 110-mal die Sechs, dann nimmt man die Nullhypothese H 0 : Es handelt sich um einen L-Würfel. an, anderfalls wird sie verworfen. Bestimmen Sie den Fehler 1. und 2. Art. α = P 1 (Z > 3) = 1 P 1 α = P 1 (Z > 110) = 1 P 1 (Z 3) = 1 F 200 (3) 27,0% 1 (Z 110) = 1 Φ( 110 1 00 + 0,5 ) 1 Φ(1,15) 12,5% 00 1 5 β = P 1 5 (Z 3) = F 200 1 5 27,2% β = P 1 (Z 110) = Φ( 110 1 5 00 + 0,5 ) Φ( 0,97) = 1 Φ(0,97) 1,% 5 00 1 5 4 5
Bestimmung des Annahmebereichs bzw. Ablehnungsbereichs bei vorgegebenem Fehlern 1. bzw 2. Art Bestimmen Sie zu obigem Beispiel jeweils den Anahmebereich a = 0; 1;... ; k so, dass der Fehler 1. Art bzw. der Fehler 2. Art höchstens 5% beträgt und der jeweilig andere Fehler möglichst klein bleibt. Bedingung : α = P 1 (Z > k) = 1 P 1 Aus der Stochastiktabelle entnimmt man k 42. (Z k) = 1 F 200 (k) 5% F 200 (k) 0,95 1 Damit der Fehler 2. Art möglichst klein bleibt, muss der Annahmebereich möglichst klein gehalten werden. Also ergibt sich a = 0; 1;... ; 44 Bedingung : α = P 1 (Z > k) = 1 P 1 Φ( k 1 00 + 0,5 ) 0,95 00 1 5 (Z k) = 1 Φ( k 1 00 + 0,5 ) 5% 00 1 5 1 Daraus ergibt sich a = 0; 1;... ; 108
Entscheidung über Annahme oder Ablehnung einer Hypothese Der Würfel wird 00mal geworfen und es fällt 117mal die Sechs. Kamm mit einer Irrtumswahrscheinlichkeit von 2,5% (auf einem Signifikanzniveau von 2,5% die Nullhypothese abgelehnt werden. Man bestimmt den Annahmebereich zum Signifikanzniveau von 2,5%. Es ergibt sich a = 0; 1;...; 118. Wegen 117 a kann die Nullhypothese unter der gestellten Bedingung nicht abgelehnt werden. Ermittlung der Stichprobenlänge Die Nullhypothese soll jetzt abgelehnt werden, wenn die Anzahl der Sechsen um mehr als 10% von ihrem Erwartungswert nach oben abweicht. Wie oft muss man mindestens würfeln, damit der Fehler 1. Art unter 2,5% liegt. Bedingung : α = P 1 (Z > k) = 1 P 1 (Z k) < 0,025 Φ( 1 n + 0,1 1 n 1 n 1 5 Das ergibt n 181 n + 0,5 ) = Φ( 1 0 n + 0,5 ) > 0,975% n 1 5
15.2 Einseitiger Hypothesentest ----------------------------------------------------------------------------------------------------------------- Beispiel : Ein Biologe, behauptet ein Mittel entdeckt zu haben, dass die Geburt weiblicher Kälber (p 0 = 50%) wahrscheinlicher macht. Das Mittel wird 10 Kühen verabreicht. Die Nullhypothese geht davon aus, dass sich diese Wahrscheinlichkeit nicht geändert hat. H 0 : p = 0,5 Die Gegenhypothese läßt nur durch eine Ungleichung angeben. Sie H 1 : p > 0,5 Als Annahme bzw. Ablehungsbereich wird a = {0, 1, 2, 3, 4, 5, } bzw. a = {7, 8, 9, 10} gewählt. Der Fehler 1. Art : α = P 0,5 (Z > ) = 1 P 0,5 (Z ) = 1 F 10 0,51 () 0,17 = 17 % Der größe Fehler 2. Art ergibt sich im Fall p p 0 d.h. die Erhöhung der Wahrscheinlichkeit für die Geburt weiblicher Kälber ist infinitesimal klein. Es ist dann β = lim P p (Z ) = P 0,5 (Z ) = 1 α = 83 % p p 0
Bei einem einseitigen Test liegt der Ablehnungsbereich "auf einer Seite" das Annahmebereichs. Man unterscheidet rechtseitigen und linksseitigen Hypothesentest. p Annahmebereich Ablehnungsbereich k Beim rechtseitigen Hypothesentest (Stichprobenlänge n) gilt : H 0 : p p 0 und a = {0; 1;... ; g}, g n p Ablehnungsbereich Annahmebereich k Beim linksseitigen Hypothesentest (Stichprobenlänge n) gilt : H 0 : p p 0 und a = {g + 1;...n}, g 0 Ist bei einem Test die Gegenhypothese nicht scharf festgelegt (man spricht dann auch von einer zusammengesetzten Gegenhypothese), dann ist der Fehler 2. Art nicht exakt angebbar. Ist die Hypothese H 0 : p p 0 bzw. H 0 : p p 0 und hat die die Gegenhypothese die Form H 1 : p > p 0 bzw. H 1 : p < p 0 und stoßen a und a aneinander, dann ist 1 α die kleinste obere Schranke für den Fehler 2. Art. Ist auch die Nullhypothese nicht scharf festgelegt, dann läßt sich auch der Fehler 1. Art nur nach oben abschätzen. Man spricht analog von einer zusammengesetzten Nullhypothese. Der größte Fehler erster Art ergibt sich für die Wahrscheinlichkeit der Nullhypothese, die dem Wahrscheinlichkeitsbereich der Gegenhypothese am nächsten liegt. Der größte Fehler zweiter Art ergibt sich für die Wahrscheinlichkeit der Gegenhypothese, die dem Wahrscheinlichkeitsbereich der Nullhypothese am nächsten liegt.
Beispiel : H 0 : p = 0,25 H 1 : p > 0,25 Stichprobenlänge n = 20 Bestimme a so, dass α 0,05 ist und der Fehler 2. Art möglichst gering ist. Ansatz : a = {0,..., c} a = {c + 1,..., 20} Bedingung : P(Z > c) 0,05 1 P(Z c) 0,05 P(Z c) 0,95 F 20 0,25 (c) 0,95 Damit der Fehler zweiter Art möglichst gering ist, muss c minimal gewählt werden. Aus der Tabelle entnimmt man : c = 8 d.h. a = {0,..., c}.
15.3 Zweiseitiger Hypothesentest ----------------------------------------------------------------------------------------------------------------- Beispiel : Es wird vermutet, dass der Anteil roter Kugeln in einer Urne bei 20% liegt Es wird 1000mal mit Zurücklegen gezogen H 0 : p = 0,2 und a = 180,..., 220 H 1 : p 0,2 und a = 0,..., 180 221,..., 1000 Fehler 1. Art : α = P(Z 179) + P(Z > 220) = P(Z 180) + 1 P(Z 220) = = Φ( 179 200 + 0,5 ) + 1 Φ( 1000 0,2 0,8 220 200 + 0,5 ) = 1000 0,2 0,8 = Φ( 1,2) + 1 Φ(1,2) = 2 2Φ(1,2) 10,74 % Kleinste obere Schranke für den Größter Fehler 2. Art : β max = 1 α 89,47 %
Bei einem zweiseitigen Test liegt der Ablehnungsbereich "auf beiden Seite" des Annahmebereichs. p Ablehnungsbereich I Annahmebereich Ablehnungsbereich II g g 1 2 k Der Annahmebereich hat die Form a = g 1, g 1 + 1,..., g 2 mit 0 < g 1 g 2 < n. Bei der Wahl des Annahmebereichs bei vorgegebenem Signifikanzniveau verteilt man den Fehler 1. Art meist symmetrisch auf beide Teile des Ablehnungsbereiches oder man wählt den Annahmebereich im Falle einer einfachen Nullhypothese H 0 : p = p 0 symmetrisch zum Erwartungswert E(Z) = n p 0 mit der Stichprobenlänge n. Ist die Hypothese einfach, die Gegenhypothesezusammengesetzte,dann ist der Fehler 2. Art nicht exakt festgelegt. Stoßen a und a jedoch aneinander, dann ist 1 α die kleinste obere Schranke für den Fehler 2. Art. Ist auch die Nullhypothese zusammengesetztt, dann lässt sich auch der Fehler 1. Art nur nach oben abschätzen.
Beispiel 1 : Bestimme für obiges Beispiel den zum Erwartungswert symmetrischen Annahmebereich zum Signifikanzniveau 5%, für den der Fehler 2. Art möglichst gering ist. a = 200 k,..., 200 + k a = 0,..., 200 k 1 200 + k + 1,...,1000 Bedingung : P(Z 200 k 1) + P(Z > 200 + k) 0,05 P(Z 200 k 1) + 1 P(Z 200 + k) 0,05 Φ( 2Φ( k 0,5 ) Φ( 1000 0,8 0,2 k + 0,5 ) 1,95 1000 0,8 0,2 k + 0,5 ) 0,95 1000 0,8 0,2 Φ( k + 0,5 1000 0,8 0,2 ) 0,975 Φ 1 k 25 Damit der Fehler 2.Art möglichst klein ist, wählt man k so klein wie möglich d. h. a = 175,..., 225 a = 0,...,174 22,..., 1000 Beispiel 2 : Die Nullhypothese soll abgelehnt werden, wenn mehr der Anteil der Wähler mehr als 10% vom Erwartungswert abweicht. Wie viele Wahlberechtigte müssen mindestens befragt werden, damit die Nullypothese mit mindestens 95% Wahrscheinlichkeit als richtig erkannt wird. a = 0,9np,..., 1,1np Bedingung : P(0,9np Z 1,1np) 0,95 0,02n + 0,5 Φ( 0,1n 0,02p 0,5 ) Φ( ) 0,95 0,1n
0,02n + 0,5 2Φ( 0,1n ) 1,95 0,02n + 0,5 Φ( 0,1n ) 0,975 Φ 1 n = 1487