Musterlösung zu Serie 8

Dr. Markus Kalisch Statistik I für Biol./Pharm. Wiss./HST) FS 15 Musterlösung zu Serie 8 1. a) Damit fx) eine Dichte ist, muss die Fläche des Dreiecks gleich 1 sein. Es muss also gelten c = 1. Daraus folgt c = 1 1. Die Dichte lässt sich somit durch die Funktion x < 1 fx) = 1 1 x ) x x > beschreiben. b) Die kumulative Verteilungsfunktion von X lässt sich durch Integration der Dichtefunktion berechnen: Für x gilt: F x) = P X x] = x ft) dt = x 1 1 t ) dt = x 1 x 4 Für x ist F x) = und für x gilt F x) = 1. Insbesondere gilt: P X < 5] = F 5) =.475 und P X < 1] = F 1) =.75. c) Die kumulative Verteilungsfunktion wurde bereits in b) berechnet. Skizze von F x): Kumulative Verteilungsfunktion von X Fx)..4.8 5 1 15 x d) E X] = xfx)dx = Var X) = E X ] E X]) E X ] = x fx)dx = 1 x 1 x ) ] dx = 1 ) x 1 1 x x 1 1 Var X) = E X ] E X] = 1 x ) dx = 1 x 1 ) = 9 x4 8 ) = = Also ist die Standardabweichung sdx) = Var X) = 1/ 4.71. Für den Median m muss gelten: F m)! =.5. Der Median liegt sicher im Intervall,] und somit haben wir m 1 m! =.5 = m = 1 5.858. 4

e) P K 1 ] = P 4 X ] ] 1 = P X = P X 9] = F 9) = 9 1 9 4 =.975 f) Die Exponential-verteilung hat die Dichte gx): { x gx) = λ exp λx) x >. Wenn X exponentialverteilt ist, dann ist der Erwartungswert EX] = 1 λ. Für λ = erhalten wir somit denselben Erwartungswert wie in der bisherigen Verteilung. g) Die kumulative Verteilungsfunktion Gx) ist für x > Gx) = P X x] = 1 exp λx). Daher P K 1 ] = P 4 X ] ] 1 = P X = P X 9] = G9) = 1 exp 9) = 1.59 =.741 Wenn die Dauer der Baustellen als exponentialverteilt angenommen wird, ist die Wahrscheinlichkeit also grösser, dass die Kosten einer Baustelle unter 1 Fr. liegen, verglichen mit der ursprünglich angenommenen Verteilung, obwohl der Erwartungswert für die Dauer der Baustellen identisch ist für beide Verteilungen.. a) Skizze:...4. 1 1 4 8 4 44 48 5 b) X bezeichne den Bleigehalt. Es gilt: X N µ, σ ) mit µ = und σ =. Ohne Computer geht man aus praktischen Gründen Tabelle!) normalerweise zur standardisierten Zufallsvariablen Z = X µ)/σ über. Es gilt: Z N, 1). ] 4 P X 4] = P Z = P Z 1.] = Φ1.) =.98 Mit R kann die Wahrscheinlichkeit direkt ohne Transformation) berechnet werden:

> pnorm4, mean=, sd=) 1].987888 Die kleine Differenz zur Zahl welche von Hand berechnet wurde beruht auf einem Rundungsfehler: > pnorm1., mean=, sd=1) # == pnorm1.) 1].9849 > pnorm4-)/, mean=, sd=1) # == pnorm4-)/) 1].987888 c) P X 7] = P Z.8] = Φ.8) = 1 Φ.8) =. d) P X c] =.975 = P ] Z c = Φ c ) Mit Hilfe der Tabelle findet man Φ1.9) =.975. Also muss gelten: c Mit R kann man die Zahl wie folgt berechnen: > qnorm.975,mean=, sd=) 1] 4.75978 = 1.9 und deshalb c = + 1.9 = 4.7 e) Aus der Tabelle: Φ1.8) =.9 und Φ 1.8) = 1.9 =.1. Somit c = 1.8 = 4.1 f) Φ1) Φ 1) = Φ1) 1 =.841 1 =.8. a) Die drei Gruppen unterscheiden sich sowohl in der Lage wie auch in der Streuung. Bei tiefer Dosis ist der Anteil des zurückgehaltenen Eisens höher als bei hoher Dosis. Je kleiner die Dosis, desto grösser wird die Streuung. b) Wenn man die Daten logarithmiert, so wird die Varianz stabilisiert, d.h. alle Gruppen zeigen jetzt eine ähnlich grosse Streuung. Der Unterschied in der Lage ist immer noch ersichtlich. iron 4 8 1 14 18 logiron)..5 1. 1.5..5..5 high medium low high medium low c) Bei normalverteilten Daten sollte man im Normalplot ungefähr eine Gerade erhalten. Aus den Plots sieht man, dass dies bei den ursprünglichen Daten links) nicht der Fall ist, während man in der Abbildung mit den logarithmierten Daten rechts) eher eine Gerade erkennt. Die Lognormalverteilung scheint also besser zu passen. R: qqnormiron,"medium"]); qqnormlogiron,"medium"]))

4 Normal Q Q Plot Normal Q Q Plot Sample Quantiles 4 8 1 1 14 1 18 Sample Quantiles.8 1. 1...4.8. 1...5 1. 1.5. Theoretical Quantiles. 1...5 1. 1.5. Theoretical Quantiles 4. a) Sei X die Anzahl Kunden, welche die neue Speisekarte bevorzugen. X ist binomialverteilt mit Parametern n = 5 und π =.8. Daher gilt E X] = n π = 5.8 = 84.8 b) Die Wahrscheinlichkeit, dass keiner der ersten vier befragten Kunden die neue Karte bevorzugt, der fünfte Kunde jedoch die neue Karte bevorzugt ist gegeben durch:.....8 =. 4.8 =.1. Die Wahrscheinlichkeit, dass drei der ersten vier befragten Kunden die neue Karte bevorzugen ist gegeben durch: P X = ] = 4 ).8. 1 =.49. c) Z = X E X] Var X) = X nπ nπ1 π) ist standardnormalverteilt. Also gilt X nπ 1 5.8 P X 1) = P ) = P Z.15) nπ1 π) 5.8. = Φ.15) = 1 Φ.15) 8 1 4 d) 1. Modell: X: Anzahl Kunden, die die neue Karte bevorzugen. X Binomialn, π), mit n = 5.. Nullhypothese: H : π = π =.8 Alternative: H A : π.8. Teststatistik: X n : Anzahl Kunden, die die neue Karte bevorzugen geteilt durch Gesamtanzahl Kunden. Verteilung der Teststatistik unter H : X n N µ, σx /n) mit µ = π =.8 und σx = π 1 π ) =.8. =.1 4. Signifikanzniveau: α =.5 5. Verwerfungsbereich für die Teststatistik: Analog zum Beispiel im Skript ist der Verwerfungsbereich gegeben durch ] π 1 π ) K =, π Φ 1 1 α ) n ) π 1 π ) π + Φ 1 1 α n ), =,.8 =,.758].84, ). ] ).1.1 1.9.8 + 1.9, 5 5. Testentscheid: Der beobachtete Wert der Teststatistik ist x n = 1 5 =.7. Da dieser Wert im Verwerfungsbereich K liegt, wird die Nullhypothese auf dem 5%-Signifikanzniveau verworfen. Die Zweifel von Lecker und Co., dass wirklich 8% der Kunden die neue Karte bevorzugen sind berechtigt.

5 Alternativ kann die Aufgabe analog zur Aufgabe d) in Serie ) wie folgt gelöst werden: 1. Modell: X: Anzahl Kunden, die die neue Karte bevorzugen. X Binomialn, π), mit n = 5.. Nullhypothese: H : π = π =.8 Alternative: H A : π.8. Teststatistik: X: Anzahl Kunden, die die neue Karte bevorzugen. Verteilung der Teststatistik unter H : X Binomial5,.8). 4. Signifikanzniveau: α =.5 5. Verwerfungsbereich für die Teststatistik: Da eine zweiseitige Alternativhypothese getestet wird ist der Verwerfungsbereich von der Form K =, c u ] c o, n], wobei c u = nπ Φ 1 1 α ) nπ 1 π ) = 7.7 abgerundet, c o = nπ + Φ 1 1 α ) nπ 1 π ) = 99.59 aufgerundet. Also ist der Verwerfungsbereich gegeben durch: K =, 7], 5]. Testentscheid: Der beobachtete Wert der Teststatistik ist x = 1. Da dieser Wert im Verwerfungsbereich K liegt, wird die Nullhypothese auf dem 5%-Signifikanzniveau verworfen. Die Zweifel von Lecker und Co., dass 8% der Kunden die neue Karte bevorzugen sind berechtigt. Die zwei Lösungsansätze sind äquivalent, der Unterschied basiert lediglich auf unterschiedlichen Definitionen der Teststatistik.