Was bedeutet p<0.05?



Ähnliche Dokumente
Was bedeutet p<0.05?

Was bedeutet p<0,05?

Relatives Risiko (RR; relative risk, riskratio) wie OddsRatio wichtiger Kennwert in klinischer Forschung

Biometrische Planung von Versuchsvorhaben

Test auf einen Anteilswert (Binomialtest) Vergleich zweier Mittelwerte (t-test)

Adaptive Designs für Phase-II-Studien in der Onkologie. Stefan Englert, Meinhard Kieser Institut für Medizinische Biometrie und Informatik.

Auswertung und Lösung

TESTEN VON HYPOTHESEN

GRUNDPRINZIPIEN statistischen Testens

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Medizinische Biometrie (L5)

Biomathematik für Mediziner

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

1.3 Das Testen von Hypothesen am Beispiel des Einstichproben t-tests

Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen. 0 sonst.

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

STOCHASTISCHE UNABHÄNGIGKEIT. Annika Pohlmann Philipp Oel Wilhelm Dück

Satz von der totalen Wahrscheinlichkeit

825 e 290 e 542 e 945 e 528 e 486 e 675 e 618 e 170 e 500 e 443 e 608 e. Zeichnen Sie das Box-Plot. Sind in dieser Stichprobe Ausreißer vorhanden?

Medizinische Entscheidungstheorie

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Statistik für Studenten der Sportwissenschaften SS 2008

Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Ü b u n g s b l a t t 15

Versuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling

Vorlesung - Medizinische Biometrie

Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1

10 Der statistische Test

Epidemiologie / Biometrie

2. Übung Diagnostik. Ein erfundenes Beispiel (H.P.Beck-Bornholt und H.-H.Dubben)

Testen von Hypothesen, Beurteilende Statistik

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

6. Übung Statistische Tests Teil 1 (t-tests)

WB 11 Aufgabe: Hypothesentest 1

Herzlich willkommen zur Vorlesung Statistik

Fallzahlplanung bei unabhängigen Stichproben

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Mathematische und statistische Methoden I

Unabhängigkeit KAPITEL 4

Bedingte Wahrscheinlichkeit und diagnostische Tests

Statistik II. Statistische Tests. Statistik II

After Work Statistics

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Diagnostische Verfahren

Promotionsstudiengang Gesundheits- und Pflegewissenschaften Partizipation als Ziel von Pflege und Therapie Methodenkolloquium

ANalysis Of VAriance (ANOVA) 1/2

Mittelwertvergleiche, Teil I: Zwei Gruppen

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

Methodik der multiplen linearen Regression

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Wie liest man Konfidenzintervalle? Teil I. Premiu m

Fallzahlplanung bei unabhängigen Stichproben

Aufgabe 1. Übung Wahrscheinlichkeitsrechnung Markus Kessler Seite 1 von 8. Die Ereignisse A, B und C erfüllen die Bedingungen

Grundbegriffe. Vereinigungsmenge Schnittmenge sicheres Ereignis disjunkte Mengen komplementäre Ereignisse/ Gegenereignisse/ Alternativereignisse

Bedingte Wahrscheinlichkeiten. Bedingte Wahrscheinlichkeiten

Einführung in die Induktive Statistik: Testen von Hypothesen

Bedingte Wahrscheinlichkeiten

Methode des statistischen Testens

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.

Statistisches Testen

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Für die Wahrscheinlichkeit P A (B) des Eintretens von B unter der Bedingung, dass das Ereignis A eingetreten ist, ist dann gegeben durch P(A B) P(A)

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Schließende Statistik: Hypothesentests (Forts.)

Wie liest man Konfidenzintervalle? Teil II. Premiu m

Primer: Inferenzstatistik 1.0

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Zulassung von Arzneimitteln. Klinische Untersuchungen. Katalin Müllner

Einführung in Planung und Auswertung klinischer Prüfungen: Biometrische Grundlagen

STATISTISCHE KRANKHEITSTESTS. Simon Schimpf und Nico Schmitt

Einführung in die Induktive Statistik: Varianzanalyse

Bayessche Statistik-Denken in Wahrscheinlichkeit

Schließende Statistik

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Vorlesung Statistik, WING, ASW Wahrscheinlichkeit in Laplace Versuchen. Kombinatorische Formeln. Bedingte Wahrscheinlichkeit

Wahrscheinlichkeitstheorie

Fit for Abi & Study Stochastik

Bereiche der Statistik

Der Trainer einer Fußballmannschaft stellt die Spieler seiner Mannschaft auf. Insgesamt besteht der Kader seiner Mannschaft aus 23 Spielern.

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

Lösung Übungsblatt 5

Transkript:

Was bedeutet p<0.05? Oliver Kuß Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Magdeburger Str. 27, 06097 Halle (Saale) Oliver.Kuss@medizin.uni-halle.de Programm: 1. Einleitung 2. Der diagnostische Test 3. Der statistische Test 4. Das Problem 5. Lösungen (?) 6. Fazit/Diskussion

1. Einleitung Was Ihnen erspart bleibt: Thema meines Anschubantrags: (FKZ: 5/08) Regressionsanalyse mit diskreten, nicht-binären Zielgrößen und korrelierten Beobachtungen zur Analyse biometrischer und epidemiologischer Daten π ln π ijr ijr = θ r + φ βx + u r ij ir Modellgleichung für ein Stereotype Regressionsmodell mit gemischten Effekten zur Modellierung von korrelierten diskreten, nicht-binären Zielgrößen

Was Ihnen nicht erspart bleibt: Bedingte Wahrscheinlichkeiten: P(A B): Wahrscheinlichkeit für das Eintreten des Ereignisses A, wenn wir wissen, dass B wahr ist. ( Wahrscheinlichkeit für A gegeben B ) Beispiel: Verdecktes Ziehen einer Karte aus einem Skatblatt (32 Karten) Ereignis A: Karte ist ein Herz P(A) = 8/32 = 1/4 Ereignis B: Karte ist ein As P(B) = 4/32 = 1/8 P(A B): P(B A): Wahrscheinlichkeit für ein Herz, wenn wir wissen, dass die Karte ein As ist P(A B) = 1/4 Wahrscheinlichkeit für ein As, wenn wir wissen, dass die Karte ein Herz ist P(B A) = 1/8 Im allgemeinen gilt: P(A B) P(B A) (und auch P(A B))

2. Der diagnostische Test Krankheit K+ K- Diagnostischer T+ RP FP Test T- FN RN Maßzahlen für die Güte eines diagnostischen Tests: Sensitivität: P(T+ K+) Wahrscheinlichkeit für positives Testergebnis bei einem Kranken Spezifität: P(T- K-) Wahrscheinlichkeit für negatives Testergebnis bei einem Gesunden

Aber: Diese Werte nützen uns am Krankenbett nichts, denn da haben wir nur das Testergebnis (T+ bzw. T-), wollen aber wissen, ob die Krankheit vorliegt (K+ bzw. K-) Von Interesse also: P(K+ T+) bzw. P(K- T-) (Prädiktive Werte) Satz von Bayes: P(K+ T+ ) = = P(T+ K+) P(K+) P(T+ K+) P(K+) + P(T+ K-) P(K-) Sensitivität x Prävalenz Sensitivität x Prävalenz + (1-Spezifität) x (1-Prävalenz) Problem: Prädiktive Werte sind prävalenzabhängig!

Beispiel: Bundesweites Screening auf HIV-Virus (mit ELISA-Test) Sensitivität: P(T+ K+) = 99.5% Spezifität: P(T- K-) = 99.5% Prävalenz: P(K+) = 0.1% Wahrscheinlichkeit, dass jemand mit positivem HIV-Test tatsächlich HIV-positiv ist: P(K+ T+ ) = P(T+ K+) P(K+) P(T+ K+) P(K+) + P(T+ K-) P(K-) 0.995 x 0.001 = = 16.6% 0.995 x 0.001 + 0.005 x 0.999 Von 6 Test-Positiven ist nur einer tatsächlich HIV-positiv!!!

3. Der statistische Test Nullhypothese (Wahrheit) + (H0 richtig) - (H0 falsch) Statist. ST+ (H0 akzeptieren) Fehler 2. Art Test ST- (H0 verwerfen) Fehler 1. Art Fehler 1. Art: α = P(ST- H0+) Wahrscheinlichkeit für Verwerfen von H0, wenn Sie in Wirklichkeit vorliegt Fehler 2. Art: β = P(ST+ H0-) Wahrscheinlichkeit für Annahme von H0, wenn Sie in Wirklichkeit nicht vorliegt

Durchführung eines statistischen Tests: Lege α vor Beginn des Experimentes fest (z.b α = 0.05) Nach der Durchführung des Experiments (Daten: x) berechnen wir eine Teststatistik T(x) und entscheiden: Verwerfe H0, falls P(T > T(x) H0+) < α P(T > T(x) H0+) ist der p-wert. Der p-wert ist die Wahrscheinlichkeit dafür, dass, unter der Annahme dass die Nullhypothese richtig ist, die Teststatistik ein Wert annimmt, der noch extremer als der beobachtete Wert ist.

4. Das Problem Der p-wert macht eine Aussage über die Wahrscheinlichkeit der Daten, nicht über die Wahrscheinlichkeit der Hypothese!!! Wir möchten P(H0 Daten), bekommen aber P(Daten H0)!!! Lösung (analog zum diagnostischen Test): Anwendung des Satz von Bayes: P(H0+ Daten) P(Daten H0+) P(H0+) P(Daten H0+) P(H0+) + P(Daten H0-) P(H0-) Großes Problem: Wie groß ist P(H0+)? (A priori - Wahrscheinlichkeit für die Nullhypothese)

5. Lösungen (?) Beispiel: Randomisierte klinische Studie mit zwei Therapien (Verum/Placebo) und binärer Zielgröße (Heilung ja/nein) Heilung Ja Nein Verum 58 42 100 Placebo 42 58 100 100 100 200 Ergebnis: OR [95%-KI]: 1.91 [1.09; 3.34] χ 2 = 5.12 p-wert = 0.024 Mögliche Lösung: Nullhypothese und Alternative sind gleichwahrscheinlich (P(H0+) = 0.5) Für unsere Beispielstudie gilt dann: P(H0+ Daten) = 0.135

Ist die Annahme P(H0+)=0.5 realistisch? Verband forschender Arzneimittelhersteller (2003): Für ein Medikament, das zugelassen wird, werden 4.7 Substanzen in der Phase I getestet. Unter der Annahme, dass ein Arzneimittel erst in die Phase I kommt, wenn die Firma auch sicher ist, dass es einen Effekt hat, wäre hier: P(H0+) = 0.78 Für unsere Beispielstudie würde dann gelten: P(H0+ Daten) = 0.354 Zur Erinnerung: Der p-wert war 0.024!

Spannende Frage: Wie groß muss P(H0+) sein, damit der p-wert gleich P(H0+ Daten) ist? Antwort (für unser Beispiel): P(H0+) = 13% Berechtigte Frage: Ist es überhaupt ethisch, eine Studie zu machen, wenn man sich zu 87% sicher ist, dass die Therapie einen Effekt hat?

Weitere Lösungen (ohne Angabe von P(H0+)!) Minimum Bayes Factor (Goodman, 1999): exp(-χ 2 /2) P(H0+ Daten) = (1+exp(-χ 2 /2)) In unserem Beispiel: P(H0+ Daten) = 0.071 Calibration of p-values (Sellke/Bayarri/Berger, 1999): Für p-wert < 1/e (= 0.368) gilt: -e*p-wert*log(p-wert) P(H0+ Daten) = (1-e*p-Wert*log(p-Wert)) In unserem Beispiel: P(H0+ Daten) = 0.194

6. Fazit/Diskussion Der p-wert sagt uns nicht das, was wir eigentlich wissen wollen, denn er macht keine Aussage über die Sicherheit der zugrunde liegenden Hypothesen. Die Sicherheit, die uns der p-wert vorgaukelt, ist im allgemeinen zu groß. Wie sollen wir (die klinische Forschung) mit diesem Problem umgehen?

Für s Unter-der-Decke-Halten ist es bereits zu spät: Deutsches Ärzteblatt, 101(13), 26.3.2004, 834-838

Komplettes Abschaffen von p-werten und nur noch Berichten von Konfidenzintervallen? Spricht auch über die Größe des Effektes. Führt den p-wert aber über die Hintertür wieder ein. Kompletter Umstieg in die Bayes sche Statistik? A priori Wahrscheinlichkeiten (P(H0+)) müssen tatsächlich vorher spezifiziert werden! (Vorschlag von Spiegelhalter: Spezifizierung von 3 A priori Wahrscheinlichkeiten: skeptisch, optimistisch, realistisch) Approximative Methoden (Minimum Bayes Factor, Calibration) sind erste Schritte in die richtige Richtung.