Musterlösung zu Serie 8

Ähnliche Dokumente
Stochastik Musterlösung 4

Biostatistik, Sommer 2017

Musterlösung. Kind Blume (beredet) Blume (nicht beredet)

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Biostatistik, Winter 2011/12

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Wahrscheinlichkeit und Statistik BSc D-INFK

Aufgaben. d) Seien X und Y Poissonverteilt mit Parameter µ, X, Y P(µ). 2. Dann ist die Summe auch Poissonverteilt mit (X + Y ) P(2µ).

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Wichtige Definitionen und Aussagen

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung

Zusammenfassung PVK Statistik

Musterlösung zur Klausur im Fach Fortgeschrittene Statistik am Gesamtpunktzahl: 60

Wahrscheinlichkeit und Statistik BSc D-INFK

Auswertung und Lösung

Schriftliche Prüfung (2 Stunden)

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Wirtschaftsmathematik

Wahrscheinlichkeitstheorie und Statistik

Stochastik Serie 11. ETH Zürich HS 2018

Bachelorprüfung: Statistik (1 Stunde)

Schriftliche Prüfung (90 Minuten)

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Einführung in die Induktive Statistik: Testen von Hypothesen

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 240/476 c Ernst W. Mayr

Statistik für Ingenieure Vorlesung 5

Statistik und Wahrscheinlichkeitsrechnung

1 Dichte- und Verteilungsfunktion

70 Wichtige kontinuierliche Verteilungen

4. Verteilungen von Funktionen von Zufallsvariablen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Serie 9, Musterlösung

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

f(x) = P (X = x) = 0, sonst heißt Poisson-verteilt mit Parameter (oder Rate) λ > 0, kurz X P o(λ). Es gilt x x! 1 Wahrscheinlichkeitsrechnung 212

DWT 1.4 Rechnen mit kontinuierlichen Zufallsvariablen 234/467 Ernst W. Mayr

Wahrscheinlichkeit und Statistik BSc D-INFK

Tests für Erwartungswert & Median

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

5. Spezielle stetige Verteilungen

Mathematik für Biologen

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Bachelorprüfung: Mathematik 4 - Statistik (2 Stunden)

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich HS 2015 Prof. Dr. P. Embrechts Januar Nachname. Vorname. Legi Nummer

Statistik I für Betriebswirte Vorlesung 4

Bem. 6 Die charakterische Funktion existiert.

Wahrscheinlichkeit und Statistik: Zusammenfassung

Binomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Punkte 2 und 3 genau gleich für stetige Verteilungen. zl uniform verteilte Zz. in (0,1)

Wichtige Begriffe und Sätze aus der Wahrscheinlichkeitsrechnung

Statistik I für Betriebswirte Vorlesung 3

Schriftliche Prüfung (2 Stunden)

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich SS 2016 Prof. Dr. P. Embrechts August BSc INFK. Nachname. Vorname.

Mathematik für Naturwissenschaften, Teil 2

PVK Statistik Carlos Mora

Schriftliche Prüfung (1 Stunde)

Fit for Abi & Study Stochastik

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Mathematik für Biologen

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Statistisches Testen

7.4 Charakteristische Funktionen

Statistik I für Betriebswirte Vorlesung 5

Mathematik für Biologen

Schriftliche Prüfung (2 Stunden)

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Wahrscheinlichkeit und Statistik BSc D-INFK

Schriftliche Prüfung (90 Minuten)

Kapitel VII. Einige spezielle stetige Verteilungen

Wahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Teil VIII Hypothesentests für zwei Stichproben

0 für t < für 1 t < für 2 t < für 3 t < für 4 t < 5 1 für t 5

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung.

Wahrscheinlichkeit und Statistik BSc D-INFK

Vorlesung: Statistik II für Wirtschaftswissenschaft

Übungsscheinklausur,

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2

10. Die Normalverteilungsannahme

4 Absolutstetige Verteilungen und Zufallsvariablen 215/1

Probeklausur zu Mathematik 3 für Informatik Lösungshinweise (ohne Garantie auf Fehlefreiheit)

Schriftliche Prüfung (90 Minuten)

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

3) Testvariable: T = X µ 0

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Klausur zur Vorlesung Stochastik II

Auswertung und Lösung

Transkript:

Dr. Markus Kalisch Statistik I für Biol./Pharm. Wiss./HST) FS 15 Musterlösung zu Serie 8 1. a) Damit fx) eine Dichte ist, muss die Fläche des Dreiecks gleich 1 sein. Es muss also gelten c = 1. Daraus folgt c = 1 1. Die Dichte lässt sich somit durch die Funktion x < 1 fx) = 1 1 x ) x x > beschreiben. b) Die kumulative Verteilungsfunktion von X lässt sich durch Integration der Dichtefunktion berechnen: Für x gilt: F x) = P X x] = x ft) dt = x 1 1 t ) dt = x 1 x 4 Für x ist F x) = und für x gilt F x) = 1. Insbesondere gilt: P X < 5] = F 5) =.475 und P X < 1] = F 1) =.75. c) Die kumulative Verteilungsfunktion wurde bereits in b) berechnet. Skizze von F x): Kumulative Verteilungsfunktion von X Fx)..4.8 5 1 15 x d) E X] = xfx)dx = Var X) = E X ] E X]) E X ] = x fx)dx = 1 x 1 x ) ] dx = 1 ) x 1 1 x x 1 1 Var X) = E X ] E X] = 1 x ) dx = 1 x 1 ) = 9 x4 8 ) = = Also ist die Standardabweichung sdx) = Var X) = 1/ 4.71. Für den Median m muss gelten: F m)! =.5. Der Median liegt sicher im Intervall,] und somit haben wir m 1 m! =.5 = m = 1 5.858. 4

e) P K 1 ] = P 4 X ] ] 1 = P X = P X 9] = F 9) = 9 1 9 4 =.975 f) Die Exponential-verteilung hat die Dichte gx): { x gx) = λ exp λx) x >. Wenn X exponentialverteilt ist, dann ist der Erwartungswert EX] = 1 λ. Für λ = erhalten wir somit denselben Erwartungswert wie in der bisherigen Verteilung. g) Die kumulative Verteilungsfunktion Gx) ist für x > Gx) = P X x] = 1 exp λx). Daher P K 1 ] = P 4 X ] ] 1 = P X = P X 9] = G9) = 1 exp 9) = 1.59 =.741 Wenn die Dauer der Baustellen als exponentialverteilt angenommen wird, ist die Wahrscheinlichkeit also grösser, dass die Kosten einer Baustelle unter 1 Fr. liegen, verglichen mit der ursprünglich angenommenen Verteilung, obwohl der Erwartungswert für die Dauer der Baustellen identisch ist für beide Verteilungen.. a) Skizze:...4. 1 1 4 8 4 44 48 5 b) X bezeichne den Bleigehalt. Es gilt: X N µ, σ ) mit µ = und σ =. Ohne Computer geht man aus praktischen Gründen Tabelle!) normalerweise zur standardisierten Zufallsvariablen Z = X µ)/σ über. Es gilt: Z N, 1). ] 4 P X 4] = P Z = P Z 1.] = Φ1.) =.98 Mit R kann die Wahrscheinlichkeit direkt ohne Transformation) berechnet werden:

> pnorm4, mean=, sd=) 1].987888 Die kleine Differenz zur Zahl welche von Hand berechnet wurde beruht auf einem Rundungsfehler: > pnorm1., mean=, sd=1) # == pnorm1.) 1].9849 > pnorm4-)/, mean=, sd=1) # == pnorm4-)/) 1].987888 c) P X 7] = P Z.8] = Φ.8) = 1 Φ.8) =. d) P X c] =.975 = P ] Z c = Φ c ) Mit Hilfe der Tabelle findet man Φ1.9) =.975. Also muss gelten: c Mit R kann man die Zahl wie folgt berechnen: > qnorm.975,mean=, sd=) 1] 4.75978 = 1.9 und deshalb c = + 1.9 = 4.7 e) Aus der Tabelle: Φ1.8) =.9 und Φ 1.8) = 1.9 =.1. Somit c = 1.8 = 4.1 f) Φ1) Φ 1) = Φ1) 1 =.841 1 =.8. a) Die drei Gruppen unterscheiden sich sowohl in der Lage wie auch in der Streuung. Bei tiefer Dosis ist der Anteil des zurückgehaltenen Eisens höher als bei hoher Dosis. Je kleiner die Dosis, desto grösser wird die Streuung. b) Wenn man die Daten logarithmiert, so wird die Varianz stabilisiert, d.h. alle Gruppen zeigen jetzt eine ähnlich grosse Streuung. Der Unterschied in der Lage ist immer noch ersichtlich. iron 4 8 1 14 18 logiron)..5 1. 1.5..5..5 high medium low high medium low c) Bei normalverteilten Daten sollte man im Normalplot ungefähr eine Gerade erhalten. Aus den Plots sieht man, dass dies bei den ursprünglichen Daten links) nicht der Fall ist, während man in der Abbildung mit den logarithmierten Daten rechts) eher eine Gerade erkennt. Die Lognormalverteilung scheint also besser zu passen. R: qqnormiron,"medium"]); qqnormlogiron,"medium"]))

4 Normal Q Q Plot Normal Q Q Plot Sample Quantiles 4 8 1 1 14 1 18 Sample Quantiles.8 1. 1...4.8. 1...5 1. 1.5. Theoretical Quantiles. 1...5 1. 1.5. Theoretical Quantiles 4. a) Sei X die Anzahl Kunden, welche die neue Speisekarte bevorzugen. X ist binomialverteilt mit Parametern n = 5 und π =.8. Daher gilt E X] = n π = 5.8 = 84.8 b) Die Wahrscheinlichkeit, dass keiner der ersten vier befragten Kunden die neue Karte bevorzugt, der fünfte Kunde jedoch die neue Karte bevorzugt ist gegeben durch:.....8 =. 4.8 =.1. Die Wahrscheinlichkeit, dass drei der ersten vier befragten Kunden die neue Karte bevorzugen ist gegeben durch: P X = ] = 4 ).8. 1 =.49. c) Z = X E X] Var X) = X nπ nπ1 π) ist standardnormalverteilt. Also gilt X nπ 1 5.8 P X 1) = P ) = P Z.15) nπ1 π) 5.8. = Φ.15) = 1 Φ.15) 8 1 4 d) 1. Modell: X: Anzahl Kunden, die die neue Karte bevorzugen. X Binomialn, π), mit n = 5.. Nullhypothese: H : π = π =.8 Alternative: H A : π.8. Teststatistik: X n : Anzahl Kunden, die die neue Karte bevorzugen geteilt durch Gesamtanzahl Kunden. Verteilung der Teststatistik unter H : X n N µ, σx /n) mit µ = π =.8 und σx = π 1 π ) =.8. =.1 4. Signifikanzniveau: α =.5 5. Verwerfungsbereich für die Teststatistik: Analog zum Beispiel im Skript ist der Verwerfungsbereich gegeben durch ] π 1 π ) K =, π Φ 1 1 α ) n ) π 1 π ) π + Φ 1 1 α n ), =,.8 =,.758].84, ). ] ).1.1 1.9.8 + 1.9, 5 5. Testentscheid: Der beobachtete Wert der Teststatistik ist x n = 1 5 =.7. Da dieser Wert im Verwerfungsbereich K liegt, wird die Nullhypothese auf dem 5%-Signifikanzniveau verworfen. Die Zweifel von Lecker und Co., dass wirklich 8% der Kunden die neue Karte bevorzugen sind berechtigt.

5 Alternativ kann die Aufgabe analog zur Aufgabe d) in Serie ) wie folgt gelöst werden: 1. Modell: X: Anzahl Kunden, die die neue Karte bevorzugen. X Binomialn, π), mit n = 5.. Nullhypothese: H : π = π =.8 Alternative: H A : π.8. Teststatistik: X: Anzahl Kunden, die die neue Karte bevorzugen. Verteilung der Teststatistik unter H : X Binomial5,.8). 4. Signifikanzniveau: α =.5 5. Verwerfungsbereich für die Teststatistik: Da eine zweiseitige Alternativhypothese getestet wird ist der Verwerfungsbereich von der Form K =, c u ] c o, n], wobei c u = nπ Φ 1 1 α ) nπ 1 π ) = 7.7 abgerundet, c o = nπ + Φ 1 1 α ) nπ 1 π ) = 99.59 aufgerundet. Also ist der Verwerfungsbereich gegeben durch: K =, 7], 5]. Testentscheid: Der beobachtete Wert der Teststatistik ist x = 1. Da dieser Wert im Verwerfungsbereich K liegt, wird die Nullhypothese auf dem 5%-Signifikanzniveau verworfen. Die Zweifel von Lecker und Co., dass 8% der Kunden die neue Karte bevorzugen sind berechtigt. Die zwei Lösungsansätze sind äquivalent, der Unterschied basiert lediglich auf unterschiedlichen Definitionen der Teststatistik.