Tests statistischer Hypothesen

KAPITEL 0 Tests statistischer Hypothese I der Statistik muss ma oft Hypothese teste, z.b. muss ma ahad eier Stichprobe etscheide, ob ei ubekater Parameter eie vorgegebee Wert aimmt. Zuerst betrachte wir ei Beispiel. 0.. Ist eie Müze fair? Es sei eie Müze gegebe. Wir wolle teste, ob diese Müze fair ist, d.h. ob die Wahrscheilichkeit vo Kopf, die wir mit θ bezeiche, gleich / ist. Dazu werfe wir die Müze z.b. = 00 Mal. Sei S die Azahl der Würfe, bei dee die Müze Kopf zeigt. Nu betrachte wir zwei Hypothese: () Nullhypothese H 0 : Die Müze ist fair, d.h., θ = /. () Alterativhypothese H : Die Müze ist icht fair, d.h., θ /. Wir müsse us etscheide, ob wir die Nullhypothese H 0 verwerfe oder beibehalte. Die Etscheidug muss ahad des Wertes vo S getroffe werde. Uter der Nullhypothese gilt, dass E H0 S = 00 = 00. Die Idee besteht u dari, die Nullhypothese zu verwerfe, we S stark vo 00 abweicht. Dazu wähle wir eie Kostate c {0,,...} ud verwerfe H 0, falls S 00 > c. Aderfalls behalte wir die Hypothese H 0 bei. Bei diesem Vorgehe köe wir zwei Arte vo Fehler mache: () Fehler. Art: H 0 wird verworfe, obwohl H 0 richtig ist. () Fehler. Art: H 0 wird icht verworfe, obwohl H 0 falsch ist. Wie sollte u die Kostate c gewählt werde? Ma möchte atürlich die Wahrscheilichkeite der beide Arte vo Fehler klei halte. I diesem Beispiel ist es allerdigs icht möglich, die Wahrscheilichkeit eies Fehlers. Art zu bestimme. Der Grud dafür ist, dass ma für die Berechug dieser Wahrscheilichkeit de Wert vo θ kee muss, bei eiem Fehler. Art ist allerdigs ur bekat, dass θ / ist. Die Wahrscheilichkeit eies Fehlers. Art ka aber sehr wohl bestimmt werde ud ist P H0 [ S 00 > c] = P H0 [S > 00 + c] = 00 k=00+c+ ( ) k, da S Bi(00, /) uter H 0. Wir wolle u c so wähle, dass die Wahrscheilichkeit eies Fehlers. Art icht größer als ei kleies vorgegebees Niveau (0, ) ist. Normalerweise wählt ma = 0.0 oder 0.05. Hier wähle wir das Niveau = 0.05. Nu rechet ma ach, dass { 0.05596, für c = 3, P H0 [ S 00 > c] = 0.04003, für c = 4.

Damit die Wahrscheilichkeit eies Fehlers. Art kleier als = 0.05 ist, müsse wir also c 4 wähle. Dabei ist es sivoll, c möglichst klei zu wähle, de sost vergrößert ma die Wahrscheilichkeit eies Fehlers. Art. Somit wähle wir c = 4. Usere Etscheidugsregel lautet u wie folgt: () Wir verwerfe H 0, falls S 00 > 4. () Sost behalte wir die Hypothese H 0 bei. I diesem Beispiel ka ma für die Berechug der Wahrscheilichkeite die Approximatio durch die Normalverteilug beutze. Es soll ei c mit P H0 [S 00 < c] bestimmt werde. Um die Güte der Approximatio zu verbesser, beutze wir de Trick. Da c gaz ist, ist die obige Ugleichug äquivalet zu P H0 [S 00 c 0.5]. Uter H 0 gilt S Bi(00, /) ud somit E H0 S = 00, Var H0 S = 00 Ugleichug ist äquivalet zu P H0 [ S 00 50 c + 0.5 50 ]. = 50. Die obige Nu köe wir die Normalverteilugsapproximatio beutze ud die obige Ugleichug durch die folgede ersetze: ( Φ c + 0.5 ) 50 Somit muss für c die folgede Ugleichug gelte: c + 0.5 z. 50 Wege der Symmetrie der Stadardormalverteilug gilt z = z. Für = 0.05 ist z = z 0.975 =.96 ud somit ist die obige Ugleichug äquivalet zu c 3.36. Somit müsse wir c = 4 wähle. Die Etscheidugsregel bleibt geauso wie obe. 0.. Allgemeie Modellbeschreibug Wir beschreibe u allgemei das statistische Testproblem. Sei X = (X,..., X ) eie Stichprobe vo uabhägige ud idetisch verteilte Zufallsvariable mit Dichte bzw. Zähldichte h θ, wobei θ Θ ubekat sei. Es sei außerdem eie Zerlegug des Parameterraums Θ i zwei disjukte Teilmege Θ 0 ud Θ gegebe, d.h. Θ = Θ 0 Θ, Θ 0 Θ =. Wir betrachte u zwei Hypothese: () Die Nullhypothese H 0 : θ Θ 0. () Die Alterativhypothese H : θ Θ. Wir solle ahad der Stichprobe X,..., X etscheide, ob wir H 0 verwerfe oder beibehalte. Dazu wähle wir eie Borel Mege K R, die Ablehugsbereich geat wird. Die Etscheidug wird u wie folgt getroffe:

() Wir verwerfe H 0, falls (X,..., X ) K. () Wir behalte H 0 bei, falls (X,..., X ) / K. Diese Etscheidugsregel ka auch mit Hilfe eier Fuktio φ : R {0, } formuliert werde, wobei {, falls x K, φ(x) = 0, falls x / K. Die Nullhypothese wird verworfe, falls φ(x,..., X ) = ud wird beibehalte, falls φ(x,..., X ) = 0. Nu köe zwei Arte vo Fehler mache: () Fehler. Art: H 0 wird verworfe, obwohl H 0 richtig ist. () Fehler. Art: H 0 wird icht verworfe, obwohl H 0 falsch ist. Normalerweise versucht ma K bzw. φ so zu wähle, dass die Wahrscheilichkeit eies Fehlers. Art durch ei vorgegebees Niveau (0, ) beschräkt ist, typischerweise = 0.0 oder 0.05. Defiitio 0... Eie Borel Fuktio φ : R {0, } heißt Test zum Niveau (0, ), falls P θ [φ(x,..., X ) = ] für alle θ Θ 0. Im Folgede werde wir zahlreiche Beispiele vo Tests kostruiere. 0.3. Tests für die Parameter der Normalverteilug Seie X,..., X N(µ, σ ) uabhägige ud mit Parameter (µ, σ ) ormalverteilte Zufallsvariable. Wir wolle Hypothese über die Parameter µ ud σ teste. Wir werde folgede vier Fälle betrachte: () Tests für µ bei bekatem σ. () Tests für µ bei ubekatem σ. (3) Tests für σ bei bekatem µ. (4) Tests für σ bei ubekatem µ. Fall : Tests für µ bei bekatem σ (Gauß z Test). Seie X,..., X N(µ, σ 0) uabhägig, wobei die Variaz σ 0 bekat sei. Wir wolle u verschiedee Hypothese für µ teste, z. B. µ = µ 0, µ µ 0 oder µ µ 0, wobei µ 0 vorgegebe ist. Wir betrachte die Teststatistik T := X µ 0 σ 0. 3

Uter µ = µ 0 gilt T N(0, ). Wir betrachte drei Fälle i Abhägigkeit davo, wie die zu testede Hypothese formuliert wird. Fall A. H 0 : µ = µ 0 ; H : µ µ 0. Die Nullhypothese H 0 sollte verworfe werde, we T groß ist. Dabei sollte die Wahrscheilichkeit eies Fehlers. Art höchstes sei. Dies führt zu der Etscheidugsregel, dass die Nullhypothese H 0 verworfe wird, falls T > z. Fall B. H 0 : µ µ 0 ; H : µ < µ 0. Die Nullhypothese H 0 sollte verworfe werde, we T klei ist. Dies führt zu der Etscheidugsregel, dass H 0 verworfe wird, falls T < z. Fall C. H 0 : µ µ 0 ; H : µ > µ 0. Hier sollte H 0 verworfe werde, we T groß ist. I diesem Fall wird H 0 verworfe, we T > z. Fall : Tests für µ bei ubekatem σ (Studet t Test). Seie X,..., X N(µ, σ ), wobei µ ud σ ubekat seie. Wir möchte Hypothese über µ teste, z. B. µ = µ 0, µ µ 0 oder µ µ 0, wobei µ 0 vorgegebe ist. Die Teststatistik aus Fall köe wir dafür icht verwede, de sie ethält de ubekate Parameter σ. Deshalb schätze wir zuerst σ durch Wir betrachte die Teststatistik S = Da gilt uter µ = µ 0, dass T t. (X i X ). i= T := X µ 0 S. Fall A. H 0 : µ = µ 0 ; H : µ µ 0. Die Nullhypothese H 0 sollte verworfe werde, we T groß ist. Dabei sollte die Wahrscheilichkeit eies Fehlers. Art höchstes sei. Wege der Symmetrie der t Verteilug erhalte wir die folgede Etscheidugsregel: H 0 wird verworfe, falls T > t,. Fall B. H 0 : µ µ 0 ; H : µ < µ 0. Die Nullhypothese H 0 wird verworfe, we T < t,. Fall C. H 0 : µ µ 0 ; H : µ > µ 0. Die Nullhypothese H 0 wird verworfe, we T > t,. Fall 3: Tests für σ bei bekatem µ (χ Streuugstest). Seie X,..., X N(µ 0, σ ) uabhägig, wobei der Erwartugswert µ 0 bekat sei. Wir wolle verschiedee Hypothese über die quadratische Streuug σ der Stichprobe teste, wie z. B. σ = σ0, σ σ0 oder σ σ0, wobei σ0 vorgegebe ist. Ei atürlicher Schätzer für σ ist S = (X i µ 0 ). Uter σ = σ 0 gilt T := S σ 0 = i= i= ( ) Xi µ 0 χ. 4 σ 0

Fall 3A. H 0 : σ = σ0; H : σ σ0. Die Nullhypothese H 0 sollte abgeleht werde, we T zu groß oder zu klei ist. Die χ Verteilug ist icht symmetrisch. Dies führt zu folgeder Etscheidugsregel: H 0 wird verworfe, we T < χ, oder T > χ,. Fall 3B. H 0 : σ σ 0; H : σ < σ 0. Die Nullhypothese H 0 sollte verworfe werde, we T zu klei ist. Dies führt zu folgeder Etscheidugsregel: H 0 wird verworfe, we T < χ, ist. Fall 3C. H 0 : σ σ 0; H : σ > σ 0. Die Nullhypothese H 0 sollte verworfe werde, we T zu groß ist. Dies führt zu folgeder Etscheidugsregel: H 0 wird verworfe, we T > χ, ist. Fall 4: Tests für σ bei ubekatem µ (χ Streuugstest). Seie X,..., X N(µ, σ ), wobei µ ud σ ubekat seie. Wir wolle Hypothese über σ teste, z. B. σ = σ0, σ σ0 oder σ σ0, wobei σ0 vorgegebe ist. Ei atürlicher Schätzer für σ ist i diesem Fall S = (X i X ). Uter σ = σ 0 gilt i= T := ( )S σ 0 χ. Die Etscheidugsregel sid also die gleiche wie i Fall 3, lediglich muss ma die Azahl der Freiheitsgrade der χ Verteilug durch ersetze. 0.4. Zweistichprobetests für die Parameter der Normalverteilug Nu betrachte wir zwei Stichprobe (X,..., X ) ud (Y,..., Y m ). Wir wolle verschiedee Hypothese über die Lage ud die Streuug dieser Stichprobe teste. Z. B. ka ma sich für die Hypothese iteressiere, dass die Erwartugswerte (bzw. Streuuge) der beide Stichprobe gleich sid. Wir mache folgede Aahme: () X,..., X, Y,..., Y m sid uabhägige Zufallsvariable. () X,..., X N(µ, σ ). (3) Y,..., Y m N(µ, σ ). Wir wolle u Hypothese über µ µ ud σ /σ teste. Dabei werde wir us auf die Nullhypothese der Form µ = µ bzw. σ = σ beschräke. Nullhypothese der Form µ µ, µ µ, σ σ, σ σ köe aalog betrachtet werde. Fall : Test für µ = µ bei bekate σ ud σ (Zweistichprobe z Test). Es seie also σ ud σ bekat. Wir köe µ µ durch X Ȳm schätze. Uter der Nullhypothese H 0 : µ = µ gilt, dass T := X Ȳm σ + σ m 5 N(0, ).

Die Nullhypothese H 0 wird verworfe, we T groß ist, also we T > z. Fall : Test für µ = µ bei ubekate aber gleiche σ ud σ (Zweistichprobe t Test). Es seie u σ ud σ ubekat. Um das Problem zu vereifache, werde wir aehme, dass die Variaze gleich sid, d.h. σ := σ = σ. Wir schätze σ durch ( ) S = (X i + m X m ) + (Y j Ȳm). i= Wir betrachte die folgede Teststatistik: T := X Ȳm. S + m Wir habe bei der Kostruktio der Kofidezitervalle gezeigt, dass T t +m uter µ = µ. Somit wird die Nullhypothese H 0 verworfe, we T > t +m,. Fall 3: Test für σ = σ bei ubekate µ ud µ (F Test). Seie also µ ud µ ubekat. Wir wolle die Nullhypothese H 0 : σ = σ teste. Natürliche Schätzer für σ ud σ sid gegebe durch SX = (X i X ), SY = m (Y j m Ȳm). i= Bei der Kostruktio der Kofidezitervalle habe wir gezeigt, dass für σ = σ T := S X F SY,m. Die Hypothese H 0 sollte verworfe werde, we T zu klei oder zu groß ist. Dabei ist die F Verteilug icht symmetrisch. Die Nullhypothese wird also verworfe, we T < F,m, oder T > F,m,. Fall 4: Test für σ = σ bei bekate µ ud µ (F Test). Aalog zu Fall 3 (Übug). 0.5. Asymptotische Tests für die Erfolgswahrscheilichkeit bei Beroulli Experimete Machmal ist es icht möglich oder schwierig, eie exakte Test zum Niveau zu kostruiere. I diesem Fall ka ma versuche, eie Test zu kostruiere, der zumidest approximativ (bei großem Stichprobeumfag ) das Niveau erreicht. Wir werde u die etsprechede Defiitio eiführe. Seie X, X,... uabhägige ud idetisch verteilte Zufallsvariable mit Dichte bzw. Zähldichte h θ, wobei θ Θ. Es sei außerdem eie Zerlegug des Parameterraumes Θ i zwei disjukte Teilmege Θ 0 ud Θ gegebe: j= Θ = Θ 0 Θ, Θ 0 Θ =. 6 j=

Wir wolle die Nullhypothese H 0 : θ Θ 0 gege die Alterativhypothese H : θ Θ teste. Defiitio 0.5.. Eie Folge vo Borel Fuktioe φ, φ,... mit φ : R {0, } heißt asymptotischer Test zum Niveau (0, ), falls lim sup sup P θ [φ (X,..., X ) = ]. θ Θ 0 Dabei ist φ die zum Stichprobeumfag gehörede Etscheidugsregel. Wir werde u asymptotische Tests für die Erfolgswahrscheilichkeit θ bei Beroulli Experimete kostruiere. Seie X,..., X uabhägige ud mit Parameter θ (0, ) Beroulli verteilte Zufallsvariable. Wir wolle verschiedee Hypothese über de Parameter θ teste, z. B. θ = θ 0, θ θ 0 oder θ θ 0. Ei atürlicher Schätzer für θ ist X. Wir betrachte die Teststatistik T := X θ 0 θ0 ( θ 0 ). Uter der Hypothese θ = θ 0 gilt ach dem Zetrale Grezwertsatz d T N(0, ). Wir betrachte u drei verschiedee Fälle. Fall A. H 0 : θ = θ 0 ; H : θ θ 0. I diesem Fall sollte H 0 verworfe werde, we T groß ist. Etscheidugsregel: H 0 wird verworfe, we T z. Fall B. H 0 : θ θ 0 ; H : θ < θ 0. Die Nullhypothese H 0 sollte verworfe werde, we T klei ist. Etscheidugsregel: H 0 wird verworfe, we T z. Fall C. H 0 : θ θ 0 ; H : θ > θ 0. Die Nullhypothese H 0 sollte verworfe werde, we T groß ist. Etscheidugsregel: H 0 wird verworfe, we T z. Nu betrachte wir ei Zweistichprobeproblem, bei dem zwei Parameter θ ud θ vo zwei Beroulli verteilte Stichprobe vergliche werde solle. Wir mache folgede Aahme: () X,..., X, Y,..., Y m sid uabhägige Zufallsvariable. () X,..., X Ber(θ ). (3) Y,..., Y m Ber(θ ). Es solle u Hypothese über die Erfolgswahrscheilichkeite θ ud θ getestet werde, z. B. θ = θ, θ θ oder θ θ. Ei atürlicher Schätzer für θ θ ist X Ȳm. Wir defiiere us folgede Größe X T,m = Ȳm. θ ( θ ) + θ ( θ ) m Satz 0.5.. Uter θ := θ = θ gilt T,m d N(0, ) für, m. Beweis. Wir habe die Darstellug T,m = Z ;,m +... + Z +m;,m, wobei X k θ, falls k =,...,, θ( θ) Z k;,m = + m Y k θ, falls k = +,..., + m. m θ( θ) + m 7

Wir wolle de Zetrale Grezwertsatz vo Ljapuow verwede. Es gilt: () Die Zufallsvariable Z ;,m,..., Z +m;,m sid uabhägig. () EZ k;,m = 0. (3) +m k= EZ k;,m =. Die letzte Eigeschaft ka ma folgedermaße beweise: +m k= EZ k;,m = θ( θ) ( + ) m ( θ( θ) + m ) θ( θ) =. m Wir müsse also ur och die Ljapuow Bedigug überprüfe. Sei δ > 0 beliebig. Es gilt +m E Z k;,m +δ { = +δ ( k= θ( θ) + E X m)+δ +δ θ +δ + m } m E Y +δ θ +δ { C(θ) ( + + } m)+δ +δ m +δ = δ C(θ) ( + m ) +δ + ( m δ m C(θ) +δ + ) was für, m gege 0 kovergiert. Dabei ist C(θ) eie vo, m uabhägige Größe. Nach dem Zetrale Grezwertsatz vo Ljapuow folgt die Behauptug des Satzes. Die Größe T,m kovergiert zwar gege die Stadardormalverteilug, wir köe diese Größe allerdigs icht direkt zur Kostruktio vo asymptotische Tests verwede, de T,m beihaltet die ubekate Parameter θ ud θ. Deshalb betrachte wir eie Modifizierug vo T,m, i der θ ud θ durch die etsprechede Schätzer X ud Ȳm ersetzt wurde: X T,m = Ȳm. X ( X ), + Ȳm( Ȳm) m Nach dem Gesetz der große Zahle gilt X θ ud Ȳm θ fast sicher für, m. Aus dem Satz vo Slutsky ka ma da herleite (Übugsaufgabe), dass T,m d N(0, ) für, m. Wir betrachte u drei verschiedee Nullhypothese. Fall A. H 0 : θ = θ ; H : θ θ. I diesem Fall sollte H 0 verworfe werde, we T,m groß ist. Etscheidugsregel: H 0 wird verworfe, we T,m z. Fall B. H 0 : θ θ ; H : θ < θ. Die Nullhypothese H 0 sollte verworfe werde, we T,m klei ist. Etscheidugsregel: H 0 wird verworfe, we T,m z. Fall C. H 0 : θ θ ; H : θ > θ. Die Nullhypothese H 0 sollte verworfe werde, we T,m groß ist. Etscheidugsregel: H 0 wird verworfe, we T,m z. 8