Biostatistik, Winter 2011/12

Ähnliche Dokumente
Biostatistik, Winter 2011/12

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Lösungen zum Aufgabenblatt 14

Auswertung und Lösung

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

4.1. Nullhypothese, Gegenhypothese und Entscheidung

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Auswertung und Lösung

3 Grundlagen statistischer Tests (Kap. 8 IS)

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Kapitel 3 Schließende Statistik

How To Find Out If A Ball Is In An Urn

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Biostatistik, Sommer 2017

Biostatistik, Sommer 2017

Statistik II. Statistische Tests. Statistik II

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Biostatistik, Winter 2011/12

Wahrscheinlichkeitsrechnung und Statistik

1 wenn Erfolg im j-ten Versuch

Biostatistik, WS 2013/2014 Konfidenzintervalle

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Biostatistik. Lösung

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Serie 9, Musterlösung

Wichtige Definitionen und Aussagen

Statistik-Notfallkit für Schüler und Lehrer

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik Serie 11. ETH Zürich HS 2018

Klausur zur Vorlesung

Wahrscheinlichkeit und Statistik BSc D-INFK

Einführung in die Induktive Statistik: Testen von Hypothesen

Kapitel 3 Schließende Statistik

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

8. Konfidenzintervalle und Hypothesentests

Biostatistik, Sommer 2017

1 Dichte- und Verteilungsfunktion

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Biostatistik, Sommer Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test. Prof. Dr. Achim Klenke.

Statistik II für Betriebswirte Vorlesung 1

5. Seminar Statistik

Grundlagen der schließenden Statistik

Hypothesentest. Ablehnungsbereich. Hypothese Annahme, unbewiesene Voraussetzung. Anzahl Kreise

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

Stochastik Musterlösung 10

Mathematik 2 Dr. Thomas Zehrt

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Statistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Fit for Abi & Study Stochastik

Beurteilende Statistik

3) Testvariable: T = X µ 0

Klassifikation von Signifikanztests

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Statistisches Testen

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich HS 2015 Prof. Dr. P. Embrechts Januar Nachname. Vorname. Legi Nummer

Stellen Sie den Sachverhalt durch eine geeignete Vierfeldertafel mit relativen Häufigkeiten

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Allgemeines zu Tests. Statistische Hypothesentests

Klassifikation von Signifikanztests

Induktive Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Kapitel III: Einführung in die schließende Statistik

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Mathematik für Biologen

Praktikum zur Statistik

Wahrscheinlichkeit und Statistik BSc D-INFK

6.2 Approximation der Binomialverteilung

Einführung in Quantitative Methoden

Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Prüfung Schließende Statistik Wintersemester 2012/13. Namensschild. Dr.

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematik für Biologen

Wahrscheinlichkeit und Statistik BSc D-INFK

Nachklausur zur Vorlesung

R. Brinkmann Seite

Wahrscheinlichkeit und Statistik BSc D-INFK

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Klassifikation von Signifikanztests

Schließende Statistik: Hypothesentests (Forts.)

P n (k) f(k) = 1 σ 2π e ) 2. σ 2π

Mathematik 2 für Naturwissenschaften

das Kleingedruckte...

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Vorlesung: Statistik II für Wirtschaftswissenschaft

Kapitel 10: Testtheorie

Statistische Tests für unbekannte Parameter

Mathematik für Biologen

Forschungsstatistik I

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Erstellen Sie eine Vierfeldertafel, die diese Situation wiedergibt.

Transkript:

Biostatistik, Winter 2011/12 : Binomial, Gauß Prof. Dr. Achim Klenke http://www.aklenke.de 10. Vorlesung: 20.01.2012 1/31 Inhalt 1 Einführung Binomialtest 2/31

Beispiel Einführung Bohnenlieferant liefert Säcke mit weißen und schwarzen (teuren) Bohnen. Lieferant behauptet: H 0 = Anteil schwarzer Bohnen θ = 1 4. Unser Verdacht: H 1 : θ < 1 4. Stichprobe: n Bohnen, daraus x schwarz. H 0 verwerfen, falls x K. H 0 beibehalten, falls x > K. Problem: Wie ist K zu wählen? 3/31 Beispiel Einführung Zwei Fehlermöglichkeiten 1 Fehler 1. Art H 0 ist wahr, aber (zufälligerweise) ist x K. [Falsches Verwerfen von H 0 ] 2 Fehler 2. Art H 0 ist falsch, aber (zufälligerweise) ist x > K. [Ungültigkeit von H 0 wird nicht erkannt.] Problem Wie sind n und K zu wählen, damit Wahrscheinlichkeiten für Fehler 1. und 2. Art klein sind? 4/31

Einführung Fahrplan für Testprobleme 1 Schranke α (0, 1) für die Wahrscheinlichkeit des Fehlers 1. Art festlegen (Niveau). Typisch: α = 0.05, α = 0.01. 2 n (möglichst groß) wählen (= Kosten). 3 K wählen, sodass Wahrscheinlichkeit(Fehler 1. Art) α. 5/31 Einführung Fahrplan für Testprobleme Variante: Fallzahlplanung 1 Schranke α (0, 1) für die Wahrscheinlichkeit des Fehlers 1. Art festlegen (Niveau). 2 Schranke β (0, 1) für die Wahrscheinlichkeit des Fehlers 2. Art festlegen. 3 Minimales n und optimales K berechnen, sodass Wahrscheinlichkeit (Fehler 1. Art) α Wahrscheinlichkeit (Fehler 2. Art) β. 6/31

Formales Testproblem Einführung Niveau α (0, 1) festlegen. X = Beobachtungsraum Θ = Parametermenge P ϑ Verteilung der zufälligen Beobachtung X (Werte in X), falls ϑ Θ wahrer Parameter. H 0 Θ : konservative Hypothese oder Nullhypothese. H 1 Θ \ H 0 : Gegenhypothese oder Alternative. 7/31 Definition: Test Einführung Ein Test für H 0 gegen H 1 ist eine Abbildung ϕ : X {0, 1}. ϕ(x) = 1 ϕ(x) = 0 H 0 verwerfen, H 0 bewahren. Gilt P ϑ [ϕ(x) = 1] α für jedes ϑ H 0, so hält ϕ das Niveau α ein. Für ϑ H 1 ist G ϑ (ϕ) := P ϑ [ϕ(x) = 1] die Schärfe. 8/31

Konstruktion von Einführung Gibt es eine Abbildung T : X R und eine Menge R R mit ϕ(x) = 1 T (x) R, so heißt T tatistik für ϕ mit Verwerfungsbereich R. 9/31 p-werte Einführung Gegeben: Testproblem mit tatistik T für jedes Niveau α einen Verwerfungsbereich R α es gelte R α R α, falls α α. Definition Für gegebene Beobachtung x X ist der p-wert p = p(x) die kleinste Zahl p, sodass T (x) R p. Mit anderen Worten: p(x) ist die kleinste Zahl, sodass der Test zum Niveau p die Hypothese gerade noch verworfen hätte. 10/31

Binomialtest Binomialtest Niveau α (0, 1). X = {0,..., n} Menge der möglichen Beobachtungen (die Anzahl der Erfolge ) Θ = [0, 1] oder Θ [0, 1] Menge der Erfolgswahrscheinlichkeiten, die in Betracht kommen. Verteilung P p = b n,p, p Θ Binomialverteilung. Hypothese H 0 = {p 0 } (p 0 ist unser Vorurteil) Gegenhypothese H 1 [0, p 0 ): linksseitige Alternative Gegenhypothese H 1 (p 0, 1]: rechtsseitige Alternative Gegenhypothese H 1 [0, 1] \ {p 0 }: beidseitige Alternative x p 0 n tatistik T (x) = p0 (1 p 0 )n 11/31 Verwerfungsregel Binomialtest x p 0 n Test verwirft H 0, wenn T (x) = von 0 stark p0 (1 p 0 )n abweicht. Linksseitige Alternative H 1 [0, p 0 ). H 0 verwerfen, falls T (x) z 1 α. z 1 α Quantil der Normalverteilung (Tabelle!). Rechtsseitige Alternative H 1 (p 0, 1]. H 0 verwerfen, falls T (x) z 1 α. Beidseitige Alternative H 1 [0, 1] \ {p 0 }. H 0 verwerfen, falls T (x) z 1 α/2. 12/31

Fallzahlplanung Binomialtest Gegenhypothese mit Lücke zu H 0. WSK für Fehler 2. Art soll kleiner als β sein. Einseitige Alternative H 1 = [0, p 1 ] für p 1 < p 0 oder H 1 = [p 1, 1] für p 1 > p 0. Kleinste Fallzahl: ( p1 (1 p 1 ) z 1 β + ) 2 p 0 (1 p 0 ) z 1 α n =. p 0 p 1 13/31 Beispiel Anteil der Knaben unter allen Neugeborenen p =? Hypothese H 0 : p = 1 2. Gegenhypothese H 1 : p > 1 2. Test zum Niveau α = 1%. Stichprobe n, darunter x Knaben. Verwirf H 0, falls T (x) z 0.99 = 2.32635. Stadt Düsseldorf 1999: n = 5234 Geburten, x = 2676 Knaben. T (x) = x p 0 n p0 (1 p 0 )n = 2676 1 2 5234 1 1 2 2 5234 = 1.63 < 2.32635. Fazit Der Test verwirft H 0 nicht.

Beispiel, p-werte Binomialtest Zu welchem Niveau hätte der Test die Hypothese verworfen? T (x) = 1.631 α = 2%? z 0.98 = 2.053 > T (x) : NEIN. α = 5%? z 0.95 = 1.645 > T (x) : NEIN. α = 5.1%? z 0.949 = 1.635 > T (x) : NEIN. α = 5.2%? z 0.948 = 1.626 < T (x) : JA! Kleinster Wert von α, sodass der Test H 0 verwirft, heißt p-wert. Hier p-wert = 5.2%. Kleiner p-wert (< 1%): Test ist stark signifikant. Großer p-wert: Test liefert keine Aussage. 15/31 Beispiel Binomialtest Fallzahlplanung Gegenhypothese präzisieren: H 1 : p > p 1 = 0.51. Grenze für Fehler 2. Art β = 0.05. Minimale Fallzahl ( ) 2 p1 (1 p n = 1 ) z 1 β + p 0 (1 p 0 ) z 1 α p 0 p 1. ( 0.51 0.49 z0.95 + 1 2 = z ) 2 0.99. 0.01 ( 0.2499 1.64485 + 1 2 = 2.32635 ) 2. 0.01 = 39 420. 16/31

, Problemstellung Merkmal (Messgröße) zufällig und normalverteilt. Erwartungswert µ R unbekannt. Varianz σ 2 > 0 bekannt. Hypothese H 0 = {µ 0 } für ein µ 0 R (Lehrmeinung). Alternative H 1. H 1 : H 1 : H 1 : µ < µ 0 linksseitig, µ > µ 0 rechtsseitig, µ µ 0 beidseitig. Test zum Niveau α (0, 1). 17/31 Linksseitige Alternative Verwerfungsregel Alternative H 1 (, µ 0 ). Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 σ/ n. Verwirf H 0 zugunsten von H 1, falls T (x) z 1 α. p-wert p(x) = Φ(T (x)) = 1 Φ( T (x)). Φ Verteilungsfunktion der Normalverteilung (Tabelle!). 18/31

Linksseitige Alternative Fallzahlplanung für H 1 (, µ 1 ], µ 1 < µ 0. β = Schranke für Fehler 2. Art. Minimale Fallzahl ( ) 2 n = σ 2 z1 β + z 1 α. µ 0 µ 1 19/31 Rechtsseitige Alternative Verwerfungsregel Alternative H 1 (µ 0, ). Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 σ/ n. Verwirf H 0 zugunsten von H 1, falls T (x) z 1 α. p-wert p(x) = Φ( T (x)) = 1 Φ(T (x)). 20/31

Rechtsseitige Alternative Fallzahlplanung für H 1 [µ 1, ), µ 1 > µ 0. β = Schranke für Fehler 2. Art. Minimale Fallzahl ( ) 2 n = σ 2 z1 β + z 1 α. µ 0 µ 1 21/31 Beidseitige Alternative Verwerfungsregel Alternative H 1 R \ {µ 0 }. Stichprobe x 1,..., x n. tatistik T (x) = x µ 0 σ/ n. Verwirf H 0 zugunsten von H 1, falls T (x) z 1 α/2. p-wert p(x) = 2 ( 1 Φ( T (x) ) ). 22/31

Beidseitige Alternative Fallzahlplanung für H 1 {µ : µ µ 0 d} für ein d > 0. β = Schranke für Fehler 2. Art. Minimale Fallzahl ( ) n = σ 2 z1 β + z 2 1 α/2. d 23/31 Beispiel: beidseitig Steinlaus (Petrophaga lorioti) Stichprobe mit n = 10. Test verwirft, falls Gewicht (in µg) normalverteilt mit σ 2 = 25. Lehrmeinung (H 0 ): Mittelwert µ = µ 0 = 80. Unser Verdacht: Das ist falsch! Testen zum Niveau α = 1%. T (x) := x µ 0 σ/ n = x 80 5/ 10 z 1 α/2 = z 0.995 24/31

Quantile der Normalverteilung β = 1 α/2 = 1 1%/2 = 0.995 β z β 0.8 0.84162 0.9 1.28155 0.95 1.64485 0.975 1.95996 0.98 2.05375 0.99 2.32635 β z β 0.995 2.57583 0.9975 2.80703 0.998 2.87816 0.999 3.09023 0.9995 3.29053 25/31 Beispiel: beidseitig Steinlaus (Petrophaga lorioti) Stichprobe mit n = 10. Test verwirft, falls Gewicht (in µg) normalverteilt mit σ 2 = 25. Lehrmeinung (H 0 ): Mittelwert µ = µ 0 = 80. Unser Verdacht: Das ist falsch! Testen zum Niveau α = 1%. T (x) := x µ 0 σ/ n = x 80 5/ 10 z 1 α/2 = z 0.995 = 2.57583. 26/31

Beispiel: beidseitig Daten und Auswertung x = 76.2, also i 1 2 3 4 5 6 7 8 9 10 x i 80 70 82 71 73 75 95 76 68 72 T (x) = x 80 5/ 10 = 2.403 < 2.57583. Fazit Test verwirft H 0 nicht zum Niveau α = 1%. 27/31 Beispiel: beidseitig Daten und Auswertung Wir haben x = 76.2, also T (x) = x 80 5/ 10 = 2.403. p-wert p(x) = 2 ( 1 Φ( T (x) ) ) = 2(1 Φ(2.403)) 28/31

Normalverteilung Φ x 0 1 2 3 4 5 6 7 8 9 1.00.8413.8438.8461.8485.8508.8531.8554.8577.8599.8621 1.10.8643.8665.8686.8708.8729.8749.8770.8790.8810.8830 1.20.8849.8869.8888.8907.8925.8944.8962.8980.8997.9015 1.30.9032.9049.9066.9082.9099.9115.9131.9147.9162.9177 1.40.9192.9207.9222.9236.9251.9265.9279.9292.9306.9319 1.50.9332.9345.9357.9370.9382.9394.9406.9418.9429.9441 1.60.9452.9463.9474.9485.9495.9505.9515.9525.9535.9545 1.70.9554.9564.9573.9582.9591.9599.9608.9616.9625.9633 1.80.9641.9649.9656.9664.9671.9678.9686.9693.9699.9706 1.90.9713.9719.9726.9732.9738.9744.9750.9756.9762.9767 2.00.9773.9778.9783.9788.9793.9798.9803.9808.9812.9817 2.10.9821.9826.9830.9834.9838.9842.9846.9850.9854.9857 2.20.9861.9865.9868.9871.9875.9878.9881.9884.9887.9890 2.30.9893.9896.9898.9901.9904.9906.9909.9911.9913.9916 2.40.9918.9920.9922.9925.9927.9929.9931.9932.9934.9936 2.50.9938.9940.9941.9943.9945.9946.9948.9949.9951.9952 2.60.9953.9955.9956.9957.9959.9960.9961.9962.9963.9964 2.70.9965.9966.9967.9968.9969.9970.9971.9972.9973.9974 2.80.9974.9975.9976.9977.9977.9978.9979.9980.9980.9981 2.90.9981.9982.9983.9983.9984.9984.9985.9985.9986.9986 29/31 Beispiel: beidseitig Daten und Auswertung Wir haben x = 76.2, also T (x) = x 80 5/ 10 = 2.403. p-wert p(x) = 2 ( 1 Φ( T (x) ) ) = 2(1 Φ(2.403)) = 2(1 0.9918) = 0.0164. Der p-wert ist also p(x) = 1.64%. 30/31

Beispiel: beidseitig Fallzahlplanung Niveau α = 1%. σ 2 = 25. Alternative spezifizieren: H 1 = µ < 77 oder µ > 83. Fehler 2. Art maximal β = 5%. Stichprobenumfang ist mindestens (mit d = 3) ) 2 ( n = σ 2 z1 β + z 1 α/2 d ( ) 2 z0.95 + z 0.995 = 25 3 ( ) 2 1.64485 + 2.57583 = 25 = 49.484. 3 31/31