Wahrscheinlichkeit & Statistik Musterlösung Serie 13

ETH Zürich FS 2013 D-MATH Has Rudolf Küsch Koordiator Blaka Horvath Wahrscheilichkeit & Statistik Musterlösug Serie 13 1. a) Die Nullhypothese lautet dass das echte Medikamet höchstes gleich gut ist wie das Scheimedikamet, d.h. H 0 : µ 0 ud daher ist die Alterativhypothese H A : µ > 0, wobei µ die erwartete Differez der Resultate eies beliebige Kides im IQ-Test mit ud ohe Epilepsie-medikamet bezeichet, ud zwar so, dass bei positiver Differez X i, i {...}, das erreichte IQ-Tesergebis mit Epilepsie-medikamet höher ist als ohe, ud bei egativer Differez kleier. Ei eiseitiger Test ist agebracht, da wir eie positive Wirkug des Epilepsie-medikametes (was H A etspricht) teste wolle ud icht bloss dara iteressiert sid, ob das Medikamet irged eie Wirkug mit Bezug auf die Lerstörug hat. b) Die Teststatistik im Vorzeichetest ist gegebe als T I [Xi >0], d.h. T zählt die Azahl positiver Differeze X i i der Stichprobe. Uter der Nullhypothese ist T Bi(10, 0.5)-verteilt, daher ist für k {1,..., } ( ) P H0 [T k] 0.5. k Isbesodere, mit 10 ist P H0 [T 10] 0.5 10 0.000977 P H0 [T 10] 0.000977 P H0 [T 9] 10 0.5 10 0.009766 P H0 [T 9] 0.010742 P H0 [T 8] ( ) 10 8 0.5 10 0.043945 P H0 [T 8] 0.043945 Das Niveau des Tests kotrolliert die Wahrscheilichkeit für eie Fehler erster Art, i.e. dass ma die Nullhypothese verwirft, obwohl sie stimmt. Deshalb wird die Nullhypothese zum Niveau 5% wege P[T 8] 0.043945 verworfe. Sie wird higege zum 1% Niveau wege P[T 9] 0.010742 akzeptiert. Bemerkug: Der P-Wert beträgt P[T 9] 0.010742, ud ach der Diskussio auf Seite 83 im Skript verwirft ma H 0 auf dem Niveau α, falls der P-Wert kleier oder gleich α ist, ud sost akzeptiert ma sie. Dies ist kosistet mit userem obige Testetscheid zu de Niveaus α 5% ud α 1%. Bitte wede!

c) Da es sich um eie gepaarte Stichprobe hadelt, berechet ma die Teststatistik gemäss dem 1-Stichprobe-t-Test auf Seite 86 im Skript. Daher ist die Teststatistik gegebe als T ( X µ0 ) S, S 2 1 1 (X i X) 2, X 1 X i, wobei i userem Fall 10, ud daher T eie t-verteilug mit 1 9 Freiheitsgrade. Des weitere ist µ 0 0, ud die x i gemäss der Tabelle gegebe sid als x 1 16, x 2 7, x 3 5, x 4 24, x 5 9, x 6 11, x 7 6, x 8 2, x 9 20, x 10 30. Somit ist x 12, s 2 1 ( 4 2 + 5 2 + 17 2 + 12 2 + 3 2 + 1 2 + 6 2 + 10 2 + 8 2 + 18 2) 112, deshalb 9 s 112. Daher hat die Teststatistik t de Wert t ( x µ0 ) s 10 12 112 3.586. Aus der Tabelle erhält ma t 9,0.95 1.833 ud t 9,0.99 2.281, ud so wird die Nullhypothese sowohl zum 5%-Niveau, als auch zum 1%-Niveau verworfe. d) Da der P-Wert gleich 0.003 ist, etscheidet der Test wege 0.003 < 0.01 gemäss der Diskussio auf Seite 83 im Skript verwirft ma H 0 auf dem Niveau α 0.01. Dies ist kosistet mit dem Testetscheid zum Niveau 1% aus Aufgabeteil c). 2. a),b),c) I der utestehede Skizze ist eie mögliche Dichte vo T uter der Nullhypothese (die mittlere Fuktio) eigezeichet. Die Macht uter der like Alterative ist etwa 30%, uter der rechte etwa 90%. Siehe ächstes Blatt!

d) Der Aahmebereich wird grösser ud die Macht kleier. 3. a) Die iteressierede Frage ist atürlich, ob sich die Verteilug der Azahl Ufälle auf die verschiedee Sterzeiche vo der Verteilug der Sterzeiche i der Bevölkerug icht ur zufällig uterscheidet. Für eie mathematische Formulierug idiziere wir die Sterzeiche mit i, bezeiche de Ateil des Sterzeiches i i der Bevölkerug mit p i (also zum Beispiel p 3 0.0904) ud die beobachtete Azahl Ufälle vo Fahrer mit Sterzeiche i mit N i (also zum Beispiel N 3 2258). Die Azahl utersuchter Persoe i der Studie war 25003. Die Nullhypothese H 0 lautet da: Die Azahl Ufälle i de zwölf Klasse besitzt eie Multiomialverteilug mit de Parameter (p 1,..., p 12 ) ud 25003. Uter H 0 erwartet ma also p i Ufälle i der Klasse i. b) Die Teststatistik im Chi-Quadrat-Apassugstest ist (siehe s. 89 im Skript) gegebe als χ 2 k (N i p i ) 2 p i, wobei wie obe, p i de Ateil des Sterzeiches i i der Bevölkerug bezeichet, N i die beobachtete Azahl Ufälle vo Fahrer mit Sterzeiche i, ud die Azahl utersuchter Persoe i der Studie ist. Für die fehlede Bitte wede!

Werte i der Tabelle (i 1) bereche wir (N i p i ) 2 p i Es ergibt sich folgede Tabelle: (2135 2225.27)2. 2225.27 Sterzeiche i Bevölkerug beobachtete Az. erwartete Azahl p i Beitrag zu χ 2 ( i p i ) 2 Widder 8.90% 2135 2225.27 3.66 Stier 8.58% 2440 2145.26 40.50 Zwillige 9.04% 2258 2260.27 0.00 Krebs 8.56% 2120 2140.26 0.19 Löwe 8.60% 1963 2150.26 16.31 Jugfrau 8.45% 2240 2112.75 7.67 Waage 7.94% 2043 1985.24 1.68 Skorpio 7.70% 1778 1925.23 11.26 Schütze 7.48% 1835 1870.22 0.66 Steibock 8.01% 2053 2002.74 1.26 Wasserma 8.32% 2030 2080.25 1.21 Fische 8.42% 2108 2105.25 0.00 Total 100.00% 25003 84.40 p i c) Gemäss der Diskussio auf Seite 89 im Skript ist χ 2 asymptotisch Chiquadrat- Verteilt mit k 1 Freiheitsgrade, wobei k die Azahl der Klasse bezeichet. I diesem Beispiel mit 11 Freiheitsgrade. Die Teststatistik beim Chiquadrattest beträgt χ 2 84.40. Das bedeutet eie P -Wert vo weiger als 0.0005. (Das grösste tabellierte Quatil ist das 99.5%-Quatil bei 26.76.) Die Uterschiede i de Ufallhäufigkeite bei de verschiedee Sterzeiche lasse sich also icht durch de Zufall erkläre. d) Mit dem Test aus Aufgabeteil c) ist zwar ei systematischer Effekt statistisch achgewiese, dass dieser aber mit dem Eifluss der Stere zu tu habe muss, akzeptiere wir wohl icht ohe weiteres. Hat die im Sterbild Stier gegrüdete Versicherugsgesellschaft beispielsweise vor zwei Jahre alle Stiere ei Jubiläumsagebot gemacht, zählt sie heute etwas mehr Stiere zu ihre Kude gemesse am Ateil der Stiere i der Bevölkerug. Auch we die Verteilug der Ufälle auf die verschiedee Sterzeiche mit de Ateile der Sterzeiche uter de Kude der Versicherug übereistimmt, fällt i diesem Fall der obige Test sigifikat aus. Es ist ebe so, dass bei derart grosse Stichprobeumfäge scho ei sehr kleier Ateil vo Beobachtuge die Nullhypothese kippe ka! 4. a) X bezeichet wie gewoht, das arithmetische Mittel X 1 X i. Sei des Weitere X : 1 1 i2 X i. Ma bemerke, dass X für x 1 kostat bleibt. Da ist X X 1 + 1 X. (1) Siehe ächstes Blatt!

Somit ka ma die Teststatistik wie folgt ausdrücke: T 1 Xi (1) S ( X1 + 1 X ), S ud S ka umgeformt werde uter Beutzug des Hiweises (mit c x ) ud der Gleichug (1) wie i achsteheder Rechug: S 2 : 1 1 Hiweis (1) 1 1 ( Xi X ) 2 ( 1 ( Xi 1 X ) 2 ( X X ) ) 2 ( Xi X ) 2 1 + 1 (X 1 X ) 2 i2 1 ( X X 1 ) 2 + 1 1 (X i X ) 2. i2 ( ( X X1 1 + 1 X )) 2 Deshalb folgt 1 Xi T S 1 ( X1 ( X X 1 ) 2 + 1 + 1 1 X ) i2 (X i X ) 2 x 1 1. b) Für grosses ka die t-verteilug mit Freiheitsgrade approximiert werde durch die Normalverteilug (siehe die Diskussio auf S. 87 im Skript). Dies erlaubt für grosses die folgede Näherug für de P-Wert: 1 F t 1 (1) 1 Φ(1) 1 0.8413 1 6. D.h. bei eiem Ausreisser wird die Nullhypothese auf dem übliche Niveau icht verworfe, wobei die Werte der adere Beobachtuge keie Rolle spiele.