Testverfahren zur Prüfung von Hypothesen über Parameter oder Verteilungen

Testverfahre zur Prüfug vo Hypothese über Parameter oder Verteiluge Eiführug ud Begriffe beim Hypothesetest Hypothesetest für de Mittelwert Testverfahre I 1 Bibliografie Prof. Dr. Kück Uiversität Rostock tatistik, Vorlesugsskript, Abschitt 7..1 ud 7.. Bleymüller / Gehlert / Gülicher Verlag Vahle tatistik für Wirtschaftswisseschaftler MM*tat. Eie iteraktive Eiführug i die Welt der tatistik PC Pool WIO-Fakultät \\zeus\statistik\mmstat\start Dr. Rolad Jeske, Uiversität Kostaz http://www.wiwi.ui-kostaz.de/heiler/os/ Dr. H.-J. Mittag, Feruiversität Hage http://www.ferui-hage.de/ewstatistics Testverfahre I 1

Testverfahre Zusamme mit dem chätze bildet das Teste vo Hypothese de Kerbereich der schließede oder iduktive tatistik. tatistische Tests sid Verfahre zur Überprüfug vo Aahme bzw. Hypothese über ubekate Parameterwerte oder über die ubekate Verteilug eies Merkmals i der Grudgesamtheit auf Basis der Ergebisse eier Zufallsstichprobe. Hypothese köe auf theoretische Überleguge, frühere Beobachtuge, ollwerte, Güteaforderuge, Erfahruge, Behauptuge usw. basiere. ie habe bis zum Beweis des Gegeteils ihre Gültigkeit, sie werde also zum Zweck der empirische Widerlegug oder Bekräftigug aufgestellt. Testverfahre I 3 Gericht - Beispiel Freispruch Verurteilug Freispruch Verurteilug Realität Uschuld chuld Gerichtsverfahre zum Beweis des Gegeteils, wobei i der Demokratie die Uschuldshypothese Ausgagshypothese ist. Verfahre edet mit pruch. Etscheidug Testverfahre I 4

Dügemittelwerk - Beispiel Dügemittelwerk Verpackugsautomat Zufallsgröße X: Gewicht der äcke ollgewicht der äcke: E(X)= =5 kg tichprobemittelwert: X Abweichug zwische tichprobemittelwert X ud ollwert : k die Abweichug ist ur zufällig Der Automat ist richtig eigestellt oder arbeitet fehlerfrei. > k die Abweichug ist icht ur zufällig Der Automat wurde falsch eigestellt oder arbeitet Xfehlerhaft. Mit Hilfe statistischer Testverfahre ka i eiem solche Fall bestimmt werde, wie groß die Abweichug midestes sei muss, damit mit ausreicheder Wahrscheilichkeit auf eie falsch eigestellte bzw. defekte Verpackugsautomate geschlosse werde ka. Diese Verfahre fide i der modere Idustrie uter dem Begriff der statistische Produktioskotrolle massehaft Awedug. Testverfahre I 5 tatistische Hypothese eies Tests I eiem statistische Test werde zwei gegesätzliche Hypothese gegeüber gestellt. Die eie Hypothese egiert die adere. Eie Hypothese wird Nullhypothese geat ud mit H bezeichet. ie beihaltet immer das Gleichheitszeiche. Die adere Hypothese wird Alterativhypothese geat ud mit H 1 bzw. H A bezeichet. Weil Alterativhypothese ud Forschugsvermutug oft übereistimme, wird H 1 auch Forschugshypothese geat. Null- ud Alterativhypothese sid stets disjuktiv. Die Ablehug der eie bedeutet die Aahme der adere ud umgekehrt. Um Missverstädisse zu vermeide, wird hier meistes ur über die Ablehug oder die Aahme vo H geredet. H vs. H 1 H : Nullhypothese H 1 : Alterativhypothese oder Forschugshypothese Testverfahre I 6 3

Treffe vo Etscheiduge i eiem statistische Hypothesetest Aus der icht der tatistik gibt es zwei Möglichkeite, eie Etscheidug über die Aahme oder Ablehug eier Hypothese zu treffe. Determiistisch, we der Wert des Parameters oder die Verteilug i der Grudgesamtheit auf Grud eier Totalerhebug berechet werde ka. Es reicht ei simpler Vergleich, um die Etscheidug ohe Irrtum zu treffe. tochastisch oder statistisch, we der wahre Wert des Parameters oder die Verteilug i der Grudgesamtheit aus praktische Grüde icht bestimmt, soder ur mittels eier zufällig ausgewählte tichprobe vom Umfag geschätzt werde ka. I diesem Fall ist icht gesichert, dass die Etscheidug fehlerfrei ist. Hier sid zwei Zustäde möglich: Treffe oder Irrtum. Treffe oder berechtigte Etscheidug, we eie i der Realität zutreffede Hypothese ageomme oder eie icht zutreffede Hypothese abgeleht wird. Irrtum oder Fehler, we eie zutreffede Hypothese abgeleht oder eie icht zutreffede Hypothese ageomme wird. Testverfahre I 7 Fehlertyp bei eiem statistische Hypothesetest Etscheidug Aahme vo H Ablehug vo H Realität durch H ausgedrückt durch H 1 ausgedrückt Treffe Irrtum (Fehler zweiter Art) Irrtum (Fehler erster Art) Treffe Leht ma H i eiem Test ab, we i der Wirklichkeit H zutrifft, da macht ma eie Fehler. Wird H ageomme (icht abgeleht), we H icht zutrifft, da macht ma auch eie Fehler. Beide Fehler uterscheide sich ihaltlich. ie werde Fehler erster Art bzw. Fehler zweiter Art geat. Zwei richtige Etscheiduge (Treffe) sid auch möglich. I der Tabelle werde die vier mögliche Zustäde bei eiem statistische Test zusammegefasst dargestellt. Testverfahre I 8 4

Fehlermessug bei eier stochastische Etscheidug Die Größe der Fehler eies Tests werde mit Hilfe ihrer Wahrscheilichkeit gemesse ud mit W(I) bzw. W(II) bezeichet. Ma ka da uterscheide: W(I) =W(Fehler 1. Art) = W(H wird abgeleht H trifft zu) W(II)=W(Fehler. Art) = W(H wird icht abgeleht H trifft icht zu) I der empirische Forschug legt ma große Wert darauf, dass der Fehler bei der Aahme eier icht zutreffede Forschugshypothese H 1 (Ablehug vo H, we H zutrifft) so klei wie möglich bleibt. Dazu setzt ma eie obere Greze für die Wahrscheilichkeit dieses Fehlers. Der Wert, der icht überschritte werde soll, wird igifikaziveau des Tests geat. Es gilt da W(Fehler 1. Art). Die obere Greze für die Größe des Fehlers. Art wird mit β bezeichet. Es gilt W(Fehler. Art) β. Die Differez 1-β wird Macht oder Power des Tests geat. 1-β ist die Wahrscheilichkeit dafür, dass ma eie zutreffede Forschugshypothese (Alterativhypothese) H 1 fehlerfrei aimmt. Es ist atürlich auch erwüscht, eie Test durchzuführe, bei dem diese Wahrscheilichkeit so groß wie möglich zu erhalte ist. Testverfahre I 9 Fehlermessug - Zusammefassug Etscheidug Aahme vo H Ablehug vo H durch H ausgedrückt Treffe Irrtum W(Fehler 1. Art) : igifikaziveau Realität durch H 1 ausgedrückt Irrtum W(Fehler. Art) β Treffe W(H wird abgeleht H 1 trifft zu) 1- β: Macht W(I) = W(Fehler 1. Art) = W(H wird abgeleht H trifft zu) W(II)= W(Fehler. Art) = W(H wird icht abgeleht H trifft icht zu) β W(fehlerfreie Aahme eier zutreffede Forschugshypothese H 1 ) = W(H wird abgeleht H trifft icht zu) = 1- W(H wird icht abgeleht H trifft icht zu) = 1 - W(II) 1 - β (Macht) Testverfahre I 1 5

Prüfgröße, kritischer Bereich Um eie statistische Etscheidug über die Richtigkeit eier Hypothese auf Grud eier zufällig gezogee tichprobe (X 1, X,..., X ) zu treffe, defiiert ma eie geeigete tichprobefuktio γˆ ud teilt de Wertebereich dieser Fuktio i zwei ausschließede Teile: eie Teilbereich K ud seier Komplemet K, so dass, we der Wert der Fuktio i de Teilbereich K hifällt, H abgeleht wird. Fällt der Wert der tichprobefuktio i de adere Teilbereich, da wird H icht abgeleht (H wird ageomme). Die tichprobefuktio ud die Teilbereiche werde i diesem Zusammehag Prüfgröße, Ablehugsbereich (Ablehug vo H ) ud Aahmebereich (Aahme vo H ) geat. Der Ablehugsbereich vo H wird auch kritischer Bereich geat. γˆ K H wird abgeleht (H1 wird ageomme) γˆ K γˆ K H wird ageomme (H wird icht abgeleht) Es gilt für die Wahrscheilichkeit des Irrtums erster Art: W( γˆ K H trifft i der Realität zu) = W(H wird abgeleht H trifft i der Realität zu) = W(Fehler 1. Art) Testverfahre I 11 Klassifizierug vo statistische Tests Nach dem Ihalt der Hypothese: -Parametrische Tests (Tests über die Parameter eier ubekate Verteilug) -Verteilugstests (Tests über eie ubekate Verteilug) Nach der Abhägigkeit der Verteilug der tichprobefuktio vo der Verteilug der Grudgesamtheit: - Verteilugsgebudee Tests -Verteilugsfreie Tests Nach der Azahl der tichprobe, die für de Hypothesetest otwedig sid: -Eistichprobetest -Zweistichprobetest -Mehrstichprobetest Nach der Form des kritische Bereiches -Zweiseitige Tests -Eiseitige Tests (rechtsseitige Tests bzw. liksseitige Tests) Testverfahre I 1 6

Bestadteile eies Hypothesetests Ei Hypothesetest besteht aus siebe Elemete: 1. zwei etgegegesetzt formulierte Hypothese (H ud H 1 ). eiem vo vorherei festgelegte igifikaziveau 3. eier bzw. mehrere tichprobe 4. eier tichprobefuktio oder Prüfgröße bzw. Testgröße 5. eiem Ablehugsbereich bzw. eiem Aahmebereich für H 6. eier Etscheidugsregel 7. eier Etscheidug Zusamme mit dem chätze bildet das Teste vo Hypothese de Kerbereich der schließede oder iduktive tatistik. Testverfahre I 13 Parametrische Eistichprobetests I diesem Abschitt werde folgede Parametertests behadelt, über dere Aahme eie tichprobeutersuchug Aufschluss gebe soll: Parametertest über de Mittelwert (1) H : = vs. H 1 : (Zweiseitiger Test) () H : vs. H 1 : < (Liksseitiger Test) (3) H : vs. H 1 : > (Rechtsseitiger Test) Parametertest über die Variaz eier Normalverteilug (1) H : ²= ² vs. H 1 : ² ² () H : ² ² vs. H 1 : < ² (3) H : ² ² vs. H 1 : ²> ² Parametertest über de Ateilwert (1) H : θ= θ vs. H 1 : θ θ () H : θ θ vs. H 1 : θ < θ (3) H : θ θ vs. H 1 : θ > θ Testverfahre I 14 7

Zweiseitiger Test für de Mittelwert eier Normalverteilug mit bekater Variaz (A) ei X eie ormalverteilte Zufallsvariable i eier Grudgesamtheit mit dem ubekate Mittelwert ud der bekate Variaz ², X~ N(, ²). Es wird auf eiem igifikaziveau getestet, ob der Parameter gleich ist oder icht, d. h. es wird zwische de folgede Hypothese etschiede: H : = vs. H 1 : (Zweiseitiger Test) Null- ud Alterativhypothese W(H wird abgeleht = ) = W(Fehler 1. Art) = : igifikaziveau ei (X 1, X,..., X ) eie tichprobe vom Umfag. Es gilt für jede X i ~ N(, ²). Um eie Etscheidug über de Mittelwert der Grudgesamtheit zu treffe ist es zweckmäßig, de tichprobemittelwert azuwede. Für diese tichprobefuktio (Prüfgröße bzw. Testgröße) gilt: ² X ~ N( ; ) Z = ~ N( ;1) Testverfahre I 15 Zweiseitiger Test für de Mittelwert eier Normalverteilug mit bekater Variaz (B) Der kritische Bereich K ist die Mege aller mögliche Werte des tichprobemittelwertes, für welche gilt: 1. der Abstad vo ist so groß, dass ma die Nullhypothese ablehe soll,. die Wahrscheilichkeit, dass der Fehler bei dieser Etscheidug icht größer als ist. { X : > c ud W( > c = ) } K = W( > c = ) = W( c = ) = W( c c W( Z c c c = ) = W( ) = c = ) = Testverfahre I 16 8

Zweiseitiger Test für de Mittelwert eier Normalverteilug mit bekater Variaz (C) c c W( Z ) = c K = = Z c = Z { X : > c ud W( > c = ) = } K( ) = {X : > Z } = {X : > Z } Testverfahre I 17 Zweiseitiger Test für de Mittelwert eier Normalverteilug mit bekater Variaz (D) Etscheidugsregel ud Treffe der Etscheidug: X K( ) H wird abgeleht (H1 wird ageomme) Die Fehlerwahrscheilichkeit liegt uter. W[ X K( ) = ] = Diese Aussage ist richtig vor der Ziehug der kokrete tichprobe. Zieht ma eie kokrete tichprobe, da ist der berechete tichprobemittelwert keie Zufallsvariable mehr ud deswege hat es keie i, ach der Ziehug der P eie Wahrscheilichkeitsaussage zu mache. Da der Wert vo ahe Eis gewählt wird, ka ma ur hoffe, dass die Etscheidug richtig ist. X K( ) H wird icht abgeleht (H wird ageomme) Die Fehlerwahrscheilichkeit bei dieser Etscheidug ist ubekat. W[ X K( ) ] = W[H wird icht abgeleht H trifft icht zu] = Testverfahre I 18 β 9

Zweiseitiger Test für de Mittelwert eier Normalverteilug mit bekater Variaz - Zusammefassug - 1. H : = vs. H 1 : (Zweiseitiger Test). igifikaziveau: 3. tichprobe vom Umfag : (X 1, X,..., X ) 4. Prüfgröße bzw. Testgröße: 5. Kritischer Bereich: ² X ~ N( ; ) Z = ~ N( ;1) K( ) = {X : > Z } = {X : > Z } 6. Etscheidugsregel: 7. Treffe der Etscheidug X K( ) H wird abgeleht (H1 wird ageomme) X K( ) H wird icht abgeleht (H wird ageomme) auf Basis eier kokrete tichprobe (x 1, x,..., x ) Testverfahre I 19 Zusammehag zwische de Größe beider Fehler H : = vs. H 1 : ( = 1 ) (1) : (igifikaziveau): Größe des Fehlers erster Art (Vorgegebe) 1 β: Größe des Fehlers zweiter Art (Im Allgemeie ubekat) () (3) 1 1 Beide Fehler wachse umgekehrt. 1 > > 3 β 1 < β < β 3 Testverfahre I 1

Test für de Mittelwert eier Normalverteilug mit bekater Variaz - Beispiel Beispiel: Das Durchschittsgewicht vo Masthähche lag i der Vergageheit bei 49,5 g mit eier tadardabweichug vo 18,9 g. Nach Übergag zu eiem eue Futtermittel liefert eie tichprobe im Umfag vo 81 ei Durchschittsgewicht vo 496,3 g. Ka ma aufgrud dieses tichprobeergebisses uter der Aahme eier gleichgebliebee tadardabweichug mit eiem igifikaziveau vo 1 % schließe, dass sich das Durchschittsgewicht i der Grudgesamtheit verädert hat? H : = vs. H 1 : ( = 49,5 ) =,1 H : =49,5 vs. H 1 : 49,5 x = 496,3 Z = Z,995 =,58 Z = K( ) = {X : > Z 49,5 } = {X : >,58} 18,9 81 496,3 49,5 z = = 1,81 18,9 81 Etscheidug: Da 1,81 <,58 gilt, wird H icht abgeleht. Testverfahre I 1 Eiseitige Tests für de Mittelwert eier Normalverteilug mit bekater Variaz Ei eiseitiger Test für de Mittelwert eier Normalverteilug mit bekater Variaz uterscheidet sich vo dem zweiseitige Test ur i seiem etsprechede kritische Bereich. 5. Kritische Bereiche: Liksseitiger Test Rechtsseitiger Test () H : vs. H 1 : < (3) H : vs. H 1 : > K( ) = {X : X < Z1 } = {X : < - Z1 } K( ) = {X : X > + Z1 } = {X : > Z1 } -Z 1- Z 1- Testverfahre I 11

Tests für de Mittelwert eier Normalverteilug mit ubekater Variaz Die Tests für de Mittelwert eier Normalverteilug mit ubekater Variaz uterscheide sich vo de vorige Tests ur i der Prüfgröße ud de etsprechede kritische Bereiche. ² Prüfgröße X ~ N( ; ) T = ~ t 1 Test Kritischer Bereich: (1) H : = vs. H 1 : K( ) = {X : X - > t } = {X : T > t } 1 ; 1 ; () H : vs. H 1 : < (3) H : vs. H 1 : > K( ) = {X : X < t 1 ; } = {X :T < - t 1 ; } K( ) = {X : X > + t 1 ; } = {X :T > t 1 ; } Testverfahre I 3 Test für de Mittelwert eier Normalverteilug mit ubekater Variaz - Beispiel Beispiel: Eie Maschie stellt Plättche her, dere Dicke ormalverteilt ist, mit dem ollwert (Mittelwert),5 cm. Eie tichprobe vo 1 Plättche liefert ei arithmetisches Mittel vo,53 cm bei eier tadardabweichug vo,3 cm. Die Hypothese, dass die Maschie och exakt arbeitet, ist auf eiem igifikaziveau vo,5 zu überprüfe. H : = vs. H 1 : ( =,5 ) =,5 t = t 9 ;,975 1 ; =,6 H : =,5 vs. H 1 :,5 x =,53 s =,3 T = K( ) = {X : X - > t } = {X : T,6} > 1 ;,53,5 t = = 3,16,3 1 Etscheidug: Da 3,16 >,6 ist, wird H abgeleht. Testverfahre I 4 1

Tests für de Mittelwert eier ubekate Verteilug für große tichprobe Für die ubekate Verteilug i der GG ud große tichprobeumfag (>3) gilt: Prüfgröße ² X ~ N( ; ) T = ~ t 1 Z ~ N( ;1) Ma ka i diesem Fall de tichprobemittelwert oder eie Fuktio vo ihm als Prüfgröße für de Test über de Mittelwert utze. Die etsprechede kritische Bereiche werde durch Verwedug der Normalverteilug bestimmt. Test () H : vs. H 1 : < (3) H : vs. H 1 : > Kritischer Bereich: (1) H : = vs. H 1 : K( ) = {X : X - > Z } = {X : T > Z } K( ) = {X : X < Z1 } = {X :T < - Z1 } K( ) = {X : X > + Z1 } = {X :T > Z1 } Testverfahre I 5 Test für de Mittelwert eier ubekate Verteilug Beispiel (1) Beispiel: Bei der Überprüfug des Verpackugsautomate im Dügemittelwerk werde 31 äcke achgewoge, für die ei Durchschittsgewicht 5,1 kg ud eie tadardabweichug 5 g berechet werde. Aufgrud dieses tichprobebefudes ist eie Etscheidug über die Arbeit des Automate (fehlerhaft/ icht fehlerhaft) zu treffe. Die Etscheidug soll bei 5 prozetiger Irrtumswahrscheilichkeit getroffe werde. Über die Verteilug des Gewichtes der äcke liegt keie Iformatio vor. =,5 t = t 3 ;,975 1 ; =,4 H : =5 vs. H 1 : 5 T = x = 5,1 K( ) = {X : X - > t } = {X : T,4} > 1 ; s =,5 5, 5 t = =,7,5 31 Etscheidug: Da,7 >,4 ist, wird H abgeleht, d. h. ma ka aehme, dass der Automat fehlerhaft arbeitet. Testverfahre I 6 13

Test für de Mittelwert eier ubekate Verteilug Beispiel () Beispiel: 3 beträgt das Durchschittsalter der Zuzüge aus adere Kreise MV ach Rostock 3 Jahre. Im Jahr 4 liegt, bei eier tichprobe vo 1 Persoe, das Durchschittsalter der Zuzüge bei 9, Jahre mit eier tadardabweichug vo 14,65 Jahre. Hat sich der Wert im Jahr 4 sigifikat verrigert, bei eiem igifikaziveau vo,5? Quelle: tatistische Berichte 3. Über die Verteilug des Alters liegt keie Iformatio vor. H : 3 vs. H 1 : < 3 x = 9, T = =,5 K( ) = {X : (X - ) < - t 1 ; } = {X :T < -1,66} t 1 ; = t 99 ;,95 = 1,66 s = 14,65 9, 3 t = =,55 14,65 1 Etscheidug: Da -,55>-1,66 ist, wird H icht abgeleht, d. h. die Verrigerug des durchschittliche Waderugsalters (Zuzüge) ist icht sigifikat. Testverfahre I 7 Test für de Mittelwert eier ubekate Verteilug Beispiel (3) Beispiel: Das durchschittliche Nettoeikomme liegt im März 4 bei 1.63. Bei eier tichprobe vo Persoe im Jui 4 lag das durchschittliche Nettoeikomme bei 1.715 mit eier tadardabweichug vo 1.7. Hat sich das durchschittliche moatliche Nettoeikomme bei eiem igifikaziveau vo,5 statistisch sigifikat erhöht? Quelle: Mikrozesus 4, Tabelle 36. Über die Verteilug des Nettoeikomme liegt keie Iformatio vor. =,5 x = 1.715 t 1 ; = t199 ;,95 = s = 1.7 Etscheidug: Da 1,91<1,645 ist, wird H icht abgeleht, d. h. das durchschittliche Nettoeikomme im Jui 4 ist icht sigifikat höher als im März 4. Testverfahre I 8 1,645 H : 1.63 vs. H 1 : > 1.63 1.715 1.63 1,91 T = K( ) = {X : (X - ) t } {X :T 1,645} t = = > 1 ; = > 1.7 14