Testen von Hypothesen:

Testen von Hypothesen: Ein Beispiel: Eine Firma produziert Reifen. In der Entwicklungsabteilung wurde ein neues Modell entwickelt, das wesentlich ruhiger läuft. Vor der Markteinführung muss aber auch noch die Bodenhaftung überprüft werden. Die Entwickler gehen davon aus, dass die Bodenhaftung dieselbe ist wie beim Vorgängermodell. Durch eine Stichprobe von n Bremsweguntersuchungen soll überprüft werden, ob sich die Bodenhaftung im Vergleich zum alten Modell verändert hat. Die Bremswege des alten Modells sind normalverteilt mit N(µ 0, σ Die Bremswege des neuen Modells sind unbekannt und haben die Verteilung N(µ,σ. Wenn die Annahme, dass die Bodenhaftung dieselbe ist wie beim Vorgängermodell (µ 0 = µ... Nullhypothese zutrifft, dann ist der Mittelwert der Stichprobe X ebenfalls ( normalverteilt mit X N µ 0, σ n (Gleiche Varianz wird angenommen. Die Alternativhypothese wäre, dass die Bodenhaftung sich verändert hat (µ µ 0. Um später eine Entscheidungsgrundlage zu haben, setzt man fest, die Nullhypothese (Die Bodenhaftung hat sich nicht verändert nur dann in Zweifel zu ziehen, wenn das Messergebnis X eine so starke Abweichung von µ 0 bringt, dass dieser Messwert eine Wahrscheinlichkeit von weniger als 5% hat. (Signifikanzniveau Damit kann man ein Intervall ausrechnen in dem sich der Messswert X bewegen darf, damit man an der Nullhypothese festhält. Liegt der gemessene Wert von X außerhalb dieses Intervalls im sogenannen Ablehnungsbereich X A so geht man davon aus, dass der neu entwickelte Reifen auch eine andere Bodenhaftung hat. (Man verwirft die Nullhypothese Allgemeine Vorgangsweise: 1. Formulieren einer Nullhypothese H 0 und einer Alternativhypothese H 1. Wahl eines Signifikanzniveaus 3. Auswahl eines geeigneten Testverfahrens. Berechnung des Ablehnungsbereichs X A für die Teststatistik T. 4. Beobachtungen sammeln 5. Durchführen des Tests. Falls T X A, so wird die Nullhypothese verworfen. 1

Wahrscheinlichkeiten für falsche Entscheidungen: Fehler (Fehler erster Art: Die Nullhypothese wird zu unrecht abgelehnt = P(H 0 wird verworfen H 0 ist richtig Die Wahrscheinlichkeit für den -Fehler ist gleich dem Signifikanzniveau. Die Wahrscheinlichkeit für den -Fehler heißt auch Irrtumswahrscheinlichkeit. Die Festsetzung der Irrtumswahrscheinlichkeit ist Teil des Testverfahrens. β Fehler (Fehler zweiter Art: An der Nullhypothese wird zu Unrecht festgehalten. β = P(An H 0 wird festgehalten H 1 ist richtig Wählt man eine kleine Wahrscheinlichkeit für den Fehler, so steigt die Wahrscheinlichkeit für den β Fehler und umgekehrt. Zweiseitiger Test: Man testet z.b., ob eine Abfüllanlage für Weinflaschen, die 0,75ł-Flaschen abfüllt, richtig arbeitet. Die Ungenauigkeit mit der die Maschine arbeitet ist hier bekannt mit σ = 1 ml= 0.01l. Das Füllvolumen X ist eine normalverteilte Zufallsvariable. Man geht zunächst davon aus, dass die Maschine richtig arbeitet. Nullhypothese: H 0 : µ = 750ml, Alternativhypothese H 1 : µ 750ml Um die Nullhypothese zu testen wird vorgeschlagen, 10 Weinflaschen zu entleeren und das Füllvolumen zu messen. Wir wissen, dass der Mittelwert X dieser Stichprobe dann ebenfalls normalverteilt ist. Unter der Voraussetzung, dass die Nullhypothese gilt, ist X N(750; 1 und X N (750; 1 10 Man enschließt sich, die Einstellung der Maschine nur dann in Zweifel zu ziehen, wenn der Mittelwert der Stichprobe so weit weg vom angenommenen Sollwert µ = 750 ml liegt, dass die Wahrscheinlichkeit dafür nur = 5% beträgt. Dann ist die Abweichung signifikant und die Maschine muss neu eingestellt werden. Wir berechnen jetzt die Grenzen zwischen denen sich X befinden muss, damit wir die Nullhypothese beibehalten können: Liegt X außerhalb dieser Grenzen im sogenannten Ablehnungsbereich, dann wird die Nullhypothese verworfen und die Maschine muss neu eingestellt werden. Zur Berechnung des Ablehnungsbereichs des Stichprobenmittelwerts haben wir den

Ablehnungsbereich der Teststatistik T = x µ 0 σ n verwendet. Da T N(0; 1 verteilt ist, können wir auch angeben: Ablehnen der Nullhypothese genau dann, wenn T < Q (N( = Q (N( 1 oder T > Q (N( 1 bzw. T > Q (N( 1 Der Mittelwert der Stichprobe ergibt 743 ml. Weil 743 [74,56; 757,44] müssen wir die Nullhypothese beibehalten. Lösung der Aufgabe über den Ablehnungsbereich der Teststatistik T : T = Für den Ablehnungsbereich der Teststatistik T erhalten wir: Ablehnungsbereich: T > Wir sezten x in die Formel für die Teststatistik T ein: T = 3

Einseitiger Test: Da ein höherer Füllwert als 750 ml bei den Käufern ein gutes Bild macht, möchte der Weinproduzent die Nullhypothese: H 0 : µ 750 absichern. Die Alternativhypothese H 1 wäre: µ < 750. Die Nullhypothese soll nur dann verworfen werden, wenn der Mittelwert der Stichprobe soweit unterhalb des Werts von 750 ml liegt, dass die Wahrscheinlichkeit dafür weniger als = 5% beträgt. Wir bestimmen wieder die Verteilung für den Mittelwert der Stichprobe unter der Annahme, dass µ = 750ml ist. Wir können wieder jenen Bereich für den Mittelwert der Stichprobe bestimmen, der zur Ablehnung der Nullhypothese führt: Wenn wir mit der Teststatistik T arbeiten, dann bekommen wir den Ablehnungsbereich für T < Q (N ( = Q (N (1 = 0.05 : Ob die Nullhypothese verworfen oder beibehalten wird, können wir wieder über den Ablehnungsbereich für den Mittelwert der Stichprobe oder über den Ablehnungsbereich für die Teststatistik entscheiden. Bemerkung: Der einseitige Test für die Nullhypothese: H 0 : µ µ 0 versus die Alternativhypothese H 1 : µ > µ 0 läuft völlig analog und führt für das Signifikanzniveau auf den Ablehnungsbereich T > Q(1 für die Teststatistik. 4

p Wert: Gibt man eine Nullhypothese vor und zieht dann eine Stichprobe, so gibt der p Wert an, wie wahrscheinlich diese oder eine noch unwahrscheinlichere Stichprobe unter der angenommenen Nullhypothese ist. Der p-wert gibt an, wie signifikant eine Stichprobe unter der angenommenen Nullhypothese ist. Je kleiner der p-wert umso unwahrscheinlicher ist der Wert der Teststatistik unter der angenommenen Nullhypothese. Wenn man den p-wert kennt, dann muss man bei einem Test nur mehr vergleichen mit dem Signifikanzniveau. Die Berechnung des entsprechenden Quantils für das Signifikanzniveau ist nicht notwendig. Lösung der Aufgabe unter Verwendung des p-wertes: Der p-wert im vorigen Beispiel wäre: Asymmetrie zwischen Null- und Alternativhypothese: Die Nullhypothese hat eine wesentlich bessere Position als die Alternativhypothese. Die Nullhypothse wird ja nur dann verworfen, wenn sie genügend unplausibel ist, wenn ein Beibehalten nur mit einer sehr kleinen Wahrscheinlichkeit, kleiner als abgesichert wäre. Falls bei einem Test die Teststatistik T nicht im Ablehnungsbereich liegt, dann sagt das keinesfalls, dass die Nullhypothese stimmt, sondern nur, dass das der Messwert zu wenig unplausibel für das Ablehnen der Nullhypothese ist. Die oben exemplarische Beschreibung für das Vorgehen bei einseitigen und zweiseitigen Tests lässt sich auf viele Größen anwenden. Um eine Entscheidung über Ablehnen oder Beibehalten der Nullhypothese treffen zu können muss man das Signifikanzniveau, und die Quantile Q der Teststatistik T kennen. Natürlich muss man auch wissen, wie man aus den Beobachtungsgrößen die passende Teststatistik T ausrechnet. 5

Zusammenfassung: Zweiseitiger Test für eine Größe g: Nullhypothese: H 0 : g = g 0, Alternativhypothese: H 1 : g g 0 Dichtefunktion der Teststatistik T T [ Q ( ; Q ( 1 ]... Die Nullhypothese wird beibehalten. Q ( Q ( 1 Einseitiger Test für eine Größe g: Fall 1: Nullhypothese: H 0 : g g 0, Alternativhypothese: H 1 : g > g 0 Dichtefunktion der Teststatistik T T < Q(1... Die Nullhypothese wird beibehalten. Q(1 Fall : Nullhypothese: H 0 : g g 0, Alternativhypothese: H 1 : g < g 0 Dichtefunktion der Teststatistik T T > Q(... Die Nullhypothese wird beibehalten. Q( 6

Beispiel : Ein Naturheilmittel soll auf seine blutdrucksenkende Wirkung getestet werden. Dazu wird das Mittel an 10 Personen verabreicht. Der Blutdruck wird vor der Einnahme des Mittels und zwei Stunden nach der Einnahme gemessen. Damit ein möglicher Placebo-Effekt ausgeschlossen werden kann, wird zusätzlich an 8 weitere Personen ein Mittel ohne Wirkstoff verabreicht. Es handelt sich um eine sogenannte Doppelblindstudie. D.h.: Der verabreichende Arzt weiß nicht, ob er ein Mittel mit oder ohne Wirkstoff verabreicht. Allen Patienten wird gesagt, dass sie ein Mittel mit Wirkstoff bekommen. Die (frei erfundenen Ergebnisse sind in den folgenden Tabellen zusammengefasst: Personen, die ein Medikament mit Wirkstoff bekommen haben. P 1 P P 3 P 4 P 5 P 6 P 7 P 8 P 9 P 10 x s Blutdruck vor der 133 135 138 168 133 145 17 130 146 148 140.3 144.9 Einnahme Blutdruck h nach der Einnahme 119 14 130 163 16 140 117 14 141 135 131.9 186.3 Differenz der 14 11 8 5 7 5 10 6 5 13 8.4 11.6 Blutdruckwerte Personen, die ein Medikament ohne Wirkstoff bekommen haben. P 1 P P 3 P 4 P 5 P 6 P 7 P 8 x s Blutdruck vor der 117 133 136 139 141 138 14 14 136 68.6 Einnahme Blutdruck h nach der Einnahme 108 19 17 13 133 13 133 14 19.5 94.6 Differenz der 9 4 9 7 8 6 9 0 6.5 10 Blutdruckwerte (a Formuliere und teste die Nullhypothese, dass das Medikament mit Wirkstoff keine blutdrucksenkende Wirkung hat! (Signifikanzniveau 5% (b Formuliere und teste die Nullhypothese, dass das Medikament ohne Wirkstoff keine blutdrucksenkende Wirkung hat! (Signifikanzniveau 5% (c Formuliere und teste die Nullhypothese, dass das Mittel keine über den Placebo-Effekt hinausgehende Wirkung hat! (Signifikanzniveau 5% 7

Beispiel 3: Um Daten über die Disziplin von FußgängerInnen im Straßenverkehr zu bekommen, wird eine Umfrage durchgeführt, bei der die Leute angeben müssen, ob sie innerhalb der vergangenen 10 Tage mindestens einmal eine rote Ampel überquert haben. Das Geschlecht der Befragten wird ebenfalls erhoben. Die folgende Tabelle zeigt die Ergebnisse: überquert überquert bei rot nicht bei rot Männer 54 34 Frauen 41 7 Überprüfe die Nullhypothese, dass Männer und Frauen mit derselben Wahrscheinlichkeit rote Ampeln überqueren (Signifikanzniveau von = 5%. 8

Beispiel 4: Um herauszufinden, ob die Kopfhaardichte von Schwarzhaarigen oder von Blonden höher ist wurde bei 10 blonden und 1 schwarzhaarigen Personen jeweils die Anzahl der Haare auf einem cm an einer bestimmten Stelle des Kopfs gezählt. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst: X s Schwarzhaarige 174, 04, 196, 195, 180, 06, 176, 00, 09, 186, 18, 199 19.5 147.8 Blonde 199, 9, 00, 03, 4, 00, 18, 190, 18, 193 00. 47.1 (a Formuliere und teste die Hypothese, dass die Kopfhaardichte unabhängig von der Haarfarbe ist! (Signifikanzniveau = 10% 9