Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Ähnliche Dokumente
How To Find Out If A Ball Is In An Urn

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Wahrscheinlichkeit und Statistik BSc D-INFK

Stochastik Serie 11. ETH Zürich HS 2018

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Aufgaben. d) Seien X und Y Poissonverteilt mit Parameter µ, X, Y P(µ). 2. Dann ist die Summe auch Poissonverteilt mit (X + Y ) P(2µ).

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Wahrscheinlichkeit und Statistik BSc D-INFK

Bachelorprüfung: Statistik (1 Stunde)

Wahrscheinlichkeit und Statistik BSc D-INFK

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Zusammenfassung PVK Statistik

Wahrscheinlichkeit und Statistik BSc D-INFK

Wahrscheinlichkeit und Statistik BSc D-INFK

Auswertung und Lösung

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Schriftliche Prüfung (2 Stunden)

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich SS 2016 Prof. Dr. P. Embrechts August BSc INFK. Nachname. Vorname.

Stochastik Musterlösung 10

Auswertung und Lösung

Wahrscheinlichkeit und Statistik BSc D-INFK

Tests für Erwartungswert & Median

Auswertung und Lösung

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung.

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Schriftliche Prüfung (1 Stunde)

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

D-MATH Wahrscheinlichkeitsrechnung und Statistik FS18 Prof. J. Teichmann. Serie 12

Stochastik Musterlösung 4

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Schriftliche Prüfung (90 Minuten)

Mathematische Statistik Aufgaben zum Üben. Schätzer

Institut für Stochastik Prof. Dr. N. Henze Dipl.-Math. V. Riess

Schriftliche Prüfung (2 Stunden)

Wahrscheinlichkeit und Statistik BSc D-INFK

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Musterlösung. Kind Blume (beredet) Blume (nicht beredet)

Serie 9, Musterlösung

Statistik II. Statistische Tests. Statistik II

Schriftliche Prüfung (2 Stunden)

Musterlösung zu Serie 8

Statistisches Testen

Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester Oktober 2011

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich HS 2015 Prof. Dr. P. Embrechts Januar Nachname. Vorname. Legi Nummer

Wahrscheinlichkeitstheorie und Statistik vom

Schriftliche Prüfung (2 Stunden)

Punktetabelle (wird von den Korrektoren beschriftet)

Statistik II. Statistische Tests. Statistik II

Bemerkungen zu statistischen Tests

Nachgefragte Aufgaben über spezifische Themen

3 Grundlagen statistischer Tests (Kap. 8 IS)

Mathematik für Biologen

Klausur Stochastik und Statistik 31. Juli 2012

Stochastik Musterlösung 3

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Fit for Abi & Study Stochastik

Schriftliche Prüfung (90 Minuten)

Stichproben Parameterschätzung Konfidenzintervalle:

Wichtige Definitionen und Aussagen

Auswertung und Lösung

1. Eigenschaften einer Zufallsstichprobe

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Mathematik 2 Probeprüfung 1

Bachelorprüfung: Mathematik 4 - Statistik (2 Stunden)

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Schriftliche Prüfung (90 Minuten)

Testen von Hypothesen:

Statistik für Ingenieure Vorlesung 5

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2

Biostatistik, Winter 2011/12

PVK Statistik Carlos Mora

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Schriftliche Prüfung (90 Minuten)

Biostatistik, Winter 2011/12

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm./HST) FS 2014

Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Klausur Statistik 2 RE Statistik für Soziologen Do,

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistik und Wahrscheinlichkeitsrechnung

Transkript:

Prof. Dr. M. Maathuis ETH Zürich Winter 2015 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Schreiben Sie für Aufgabe 2-4 stets alle Zwischenschritte und -rechnungen sowie Begründungen auf. Aufgabe 1 ist eine Multiple Choice Aufgabe (keine Begründungen notwendig). Die für die Aufgaben benötigten Tabellen (Normalverteilung, Quantile der t-verteilung, Verwerfungsbereiche für den Wilcoxon-Test) wurden mit der Prüfung ausgeteilt. 1. (10 Punkte) Bei den folgenden 10 Fragen ist jeweils genau eine Antwort richtig. Es gibt pro richtig beantwortete Frage 1 Punkt und pro falsche Antwort 1/2 Punkt Abzug. Minimal erhält man für die gesamte Aufgabe 0 Punkte. Bitte benützen Sie das beiliegende Antwortblatt. a) Sei X Bernoulli(p) mit p (0, 1). Dann gilt 1. E[X(1 X)] = p 2 2. X 2 Bernoulli(p) 3. E[X 3 ] = p 3. b) Sei X Exp(λ) mit E[X] = 2. Dann ist Var(2X 3) gleich 1. 16 2. 8 3. 13 Bitte wenden!

c) Sei f eine Dichtefunktion mit für ein c > 0. Dann gilt f(x) = 1. P(X 1) = 1 9. 2. Das 8/27-Quantil liegt in [1.8, 2.2]. 3. Weder 1. noch 2. ist richtig. { cx 2, 0 x 3 0, sonst. d) Es seinen A und B Ereignisse mit P (A B) = 2 3 und P (B) = 1 3. Dann 1. kann P (A) = 1 4 gelten. 2. kann P (A) = 2 3 gelten. 3. muss P (A) = 1 3 gelten. e) Seien X und Y zwei Zufallsvariablen welche nur die Werte 0, 1 und 2 annehmen können. Die Wahrscheinlichkeitsfunktion von (X, Y ) ist veranschaulicht in folgender Tabelle (z.b. P (X = 0, Y = 0) = p(0, 0) = 0.10): Sind X und Y unabhängig? 1. Ja. 2. Nein. 3. Ist aus der Tabelle nicht ersichtlich. X \ Y 0 1 2 0 0.1 0.1 0.3 1 0.06 0.06 0.18 2 0.04 0.04 0.12 f) Eine Münze hat bei 6 Würfen 6 mal Kopf ergeben. Wir möchten testen ob die Münze fair ist oder nicht und führen einen geeigneten einseitigen Binomialtest zum Niveau 5% mit Nullhypothese H 0 : p = 0.5 durch, wobei p die Wahrscheinlichkeit für Kopf bezeichnet. Dies ergibt einen Verwerfungsbereich K = {6}. Dann gilt: 1. Die Wahrscheinlichkeit für einen Fehler 1. Art ist ungefähr 95%. 2. Die Wahrscheinlichkeit für einen Fehler 2. Art bei p = 0.8 ist ungefähr 26%. 3. Die Macht des Tests bei p = 0.8 ist ungefähr 26%. g) Wird bei einem Z-Test anstelle eines 95%-Vertrauensintervalls ein 99%-Vertrauensintervall betrachtet (deren Längen wir mit L 0.95 und L 0.99 bezeichnen), so ist das Verhältnis der Länge der beiden Intervalle L 0.95 L 0.99 gegeben durch (wobei z q das q-quantil der Standardnormalverteilung ist): z 0.975 1. z 0.995 2. z 0.95 z 0.99 3. Es sind zu wenige Informationen verfügbar um dies zu beurteilen. Siehe nächstes Blatt!

h) Es seien X 1,..., X n unabhängig und identisch verteilt mit X i Pois(λ). Dann ist 1 n n i=1 X i 1. Ein Schätzer für λ, aber nicht erwartungstreu. 2. Ein erwartungstreuer Schätzer für λ. 3. N (λ, λ n )-verteilt für n = 10. i) In einer medizinischen Fachzeitschrift wird ein zweisetiger t-test mit Nullhypothese H 0 : µ = 0 angewendet um zwei Behandlungsmethoden zu vergleichen. Beide Methoden wurden an 100 Patienten erprobt. Die Wissenschaftler haben aus den Daten einen p-wert von 3% errechnet. Dann gilt: 1. Ein zweiseitiger Test zum Niveau 1% wird die Nullhypothese verwerfen. 2. Das entsprechende 99%-Vertrauensintervall enthält den Wert 0. 3. Um Aussagen 1. und 2. beurteilen zu können benötigen Sie weitere Angaben aus dem Forschungsartikel. j) Für drei Stichproben vom Umfang n = 100 wurden je ein Boxplot und die empirische Verteilungsfunktion gezeichnet. Welche Zuordnung der Boxplots zu den entsprechenden empirischen Verteilungsfunktionen ist korrekt? 0.2 0.4 0.6 0.8 I a 0.0 0.2 0.4 0.6 0.8 1.0 II b 0.0 0.2 0.4 0.6 0.8 1.0 III c 0.0 0.2 0.4 0.6 0.8 1.0 1. Ia, IIc, IIIb. 2. Ic, IIb, IIIa. 3. Ib, IIc, IIIa. Bitte wenden!

2. (Total 8 Punkte) Alice und Bob arbeiten in zwei verschiedenen Labors an der Herstellung von Nanopartikeln. Um aus der Ausgangsprobe ein einzelnes Partikel herzustellen ist eine Abfolge von Schritten nötig, die einen ganzen Tag in Anspruch nehmen. An jedem Werktag wird also ein Partikel hergestellt. In diesem Prozess gibt es ein paar schwierige Schritte, die beide noch nicht ganz beherrschen. Wird die Vorbereitung von einem Laboranten übernommen, so gelingt Alice die Herstellung in 80% der Fälle, Bob immerhin noch in 70% der Fälle. Manchmal ist jedoch kein Laborant zur Stelle, dann misslingt Alice der Herstellungsprozess in 70% der Fälle und Bob in 60% der Fälle. Erfahrungsgemäss arbeitet der Laborant in Alices Labor an 75% der Werktage, in Bobs Labor sind es sogar 90%. Wir nehmen an, dass die Herstellung in den beiden Labors unabhängig voneinander ist. a) (2 Punkte) Alices Betreuerin besucht das Labor an einem zufällig auswählten Tag. Wie gross ist die Wahrscheinlichkeit, dass Alice an diesem Tag erfolgreich ein Nanopartikel herstellt? b) (2 Punkte) An einem zufällig auswählten Tag besuchen beide Betreuerinnen das Labor ihrer Studenten Alice bzw. Bob. Danach wollen Sie sich zu viert auf ein Bier treffen, dies aber nur, wenn die Herstellung in beiden Labors gelungen ist. Berechnen Sie die Wahrscheinlichkeit, dass die vier auf das Bier verzichten müssen. c) (2 Punkte) Angenommen man besucht Alices Labor am Ende eines zufällig gewählten Tages und ihr ist die Herstellung gelungen. Berechnen Sie die Wahrscheinlichkeit, dass ihr der Laborant an diesem Tag geholfen hat. d) (2 Punkte) Da die Schweiz Steuern senken möchte, sollen Forschungselder eingespart werden. Daher dürfen der Laborant in Alices Labor und der Laborant in Bobs Labor zusammen nur noch ein 100%-Pensum an Anstellung haben. Die Universitätsleitung fragt sich nun wie sie dieses optimal aufteilen soll. Wir betrachten also dasselbe Setup wie oben, nur dass nun p [0, 1] die Wahrscheinlichkeit ist, dass in Alices Labor ein Laborant anwesend ist und 1 p die Wahrscheinlichkeit, dass in Bobs Labor ein Laborant anwesend ist. Bestimmen Sie p so, dass die Wahrscheinlichkeit, dass an einem zufällig gewälten Tag beide Labors erfolgreich ein Nanopartikel herstellen, maximiert wird. Siehe nächstes Blatt!

3. (Total 9 Punkte) Der Fabrikant F. Engels stellt in Wädenswil Schokoladeneis her. Die Anlage ist leider ziemlich veraltet und produziert täglich etwas zuviel oder zuwenig. Der angepeilte Wert ist 50 Tonnen, die Abweichung U (in Tonnen) davon ist Unif( ϑ, ϑ)- verteilt, wobei ϑ = 3. a) (1 Punkt) Wie gross ist die Wahrscheinlichkeit, dass die Menge an Eis, die an einem bestimmten Tag produziert wird, mehr als eine Tonne vom angepeilten Wert abweicht? b) Da es in der Fabrik einen grossen Kühlraum gibt, spielt es keine Rolle, wenn zuviel Eis produziert wird. Heute morgen hat F. Engels keinerlei Eis auf Lager. Er erhält einen grossen Auftrag: Er hat 30 Tage Zeit um 1515 Tonnen Eis zu produzieren. (i) (1 Punkt) Wie gross muss die durchschnittliche tägliche Abweichung vom Sollwert von 50 Tonnen mindestens sein, damit er dieses Ziel erreicht? (ii) (1 Punkt) Unter der Annahme, dass die Abweichungen vom angepeilten Wert für jeden der 30 Tage unabhängig sind, durch welche Verteilung kann man die durchschnittliche tägliche Abweichung approximieren? (Geben Sie sowohl die Art der Verteilung als auch den/die zugehörigen Parameter an). (iii)) (2 Punkte) Wie gross ist die Wahrscheinlichkeit, dass er die verlangte Menge an Eis liefern kann? Benutzen Sie zur Berechnung die Approximation aus (ii). F. Engels ist sich nun etwas unsicher über den Wert von ϑ. Er weiss also, dass die Abweichung an einem bestimmten Tag Unif( ϑ, ϑ)-verteilt ist, allerdings ist ϑ unbekannt. Er überwacht die Eisproduktion an 5 Tagen und beobachtet folgende Abweichungen vom Sollwert: Tag Nr. 1 2 3 4 5 Abweichung (in Tonnen) 1.9 2.3 1.6 0.5 1.2 c) (2 Punkte) Leiten Sie einen Momentenschätzer für ϑ her und werten Sie diesen aus für die angegebene Stichprobe. Tipp: Sie können das 2. Moment verwenden. d) (2 Punkte) Leiten Sie den Maximum-Likelihood Schätzer für ϑ her und werten Sie diesen aus für die angegebene Stichprobe. Bitte wenden!

4. (Total 9 Punkte) Im Alltag von Frau Fuchs und Herrn Hürzeler bleibt es nur wenig Zeit für Hausarbeit. Sie möchten sich daher einen Saugroboter kaufen, der selbständig ihre riesige gemeinsame Wohnung mit 99 Zimmern staubsaugt. Leider können sie sich nicht auf ein Modell einigen und entscheiden daher, sowohl den Neato Signature als auch den Ecovacs Deboot D76 zu kaufen und selbst zu testen, welcher von beiden schneller saubermacht. Die Hersteller geben an, dass die Roboter gleich leistungsfähig sind. Frau Fuchs glaubt jedoch, dass Ecovacs schneller ist und möchte dies mit einem statistischen Test zum Niveau 5% überprüfen. Dazu misst sie in einer Auswahl von Zimmern ihrer Wohnung die Saugzeit und erhält folgende Zahlen (in Minuten): Zimmer Nr (i) 1 2 3 4 5 6 7 8 9 10 Neato (a i ) 12 10 8 7 40 20 15 50 13 31 Ecovacs (b i ) 15 6 9 5 22 12 11 19 7 56 d i = a i b i -3 4-1 2 18 8 4 31 6-25 Es ergeben sich daraus die folgenden empirischen Kennwerte (in Minuten): Mittelwert: a 10 = 20.6, b 10 = 16.2, d 10 = 4.4. Streuung: s a = 14.8, s b = 15, s d = 14.4. Gepoolte Streuung von a und b: s pool = 14.9. a) (1 Punkt) Ist die Stichprobe gepaart oder ungepaart? b) (2 Punkte) Welche der folgenden Graphiken ist der korrekte Normal-QQ-Plot der Differenzen (d 1,..., d 10 ) (in Minuten)? Begründen Sie Ihre Antwort, d.h. geben Sie für jeden der anderen Plots eine Begründung warum dieser nicht der geeignete QQ-Plot ist. Siehe nächstes Blatt!

Plot 1 Plot 2 5 0 5 10 20 0 20 Plot 3 Plot 4 20 0 20 20 0 20 c) (2 Punkte) Ist die Annahme der Normalverteilung für die für den Test relevanten Daten gerechtfertigt? Geben Sie auch hier eine Begründung an. Welcher Test ist daher (unter den üblichen i.i.d. Annahmen) am besten geeignet um die gegebenen Informationen bestmöglich auszunutzen? d) (4 Punkte) Führen Sie den Test durch, für den Sie sich in b) entschieden haben, d.h. formulieren Sie die Null- und Alternativhypothese berechnen Sie den realisierten Wert der Teststatistik geben Sie den Verwerfungsbereich an bestimmen Sie den Testentscheid. Kann nachgewiesen werden, dass Ecovacs schneller ist?