Statistische Signifikanz versus Klinische Relevanz der Sch(l)uss von der Studie in die Realität



Ähnliche Dokumente
Wie schreibe ich (m)eine Dissertation???

6. Übung Statistische Tests Teil 1 (t-tests)

Konfidenzintervalle. die anschauliche Alternative zum p-wert...

Test auf einen Anteilswert (Binomialtest) Vergleich zweier Mittelwerte (t-test)

Querschnittsfach Q 1 Medizinische Biometrie und Epidemiologie

Tabelle 1: Mittelwerte der Messwerte aller Probanden je Messzeitpunkt nach Messverfahren. 03:00 Uhr 18,2 ±3,9 mmhg 19,5 ±4,1 mmhg 19,2 ±3,6 mmhg

Studiendesign und Statistik: Interpretation publizierter klinischer Daten

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Exakter Binomialtest als Beispiel

Statistische Tests (Signifikanztests)

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Analytische Statistik II

U N I V E R S I T Ä T S M E D I Z I N B E R L I N. After Work Statistics

Chi Quadrat-Unabhängigkeitstest

2-Stichprobentest für Anteilswerte

Statistische Methoden und Auswertungen Die Statistik in der MEWIP-Studie

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Mögliche Fehler beim Testen

Was bedeutet p<0.05?

Von Wilcoxon bis McNemar es kann nur einen Signifikanztest geben

Institut für Medizinische Biometrie und Epidemiologie

Übung 5 im Fach "Biometrie / Q1" Thema: Wilcoxon, Chi-Quadrat, multiples Testen

PRAXISORIENTIERTE EINFÜHRUNG

2-Stichprobentest für Anteilswerte

U N I V E R S I T Ä T S M E D I Z I N B E R L I N. After Work Statistics

Adaptive Designs für Phase-II-Studien in der Onkologie. Stefan Englert, Meinhard Kieser Institut für Medizinische Biometrie und Informatik.

Bereiche der Statistik

Multiples Testen wer hat schon immer nur eine Fragestellung?

Statistische Methoden in den Umweltwissenschaften

Mögliche Einstiege und Grundprinzip

Fallzahlplanung bei unabhängigen Stichproben

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Allgemeines zu Tests. Statistische Hypothesentests

Einführung in Quantitative Methoden

Einführung in Planung und Auswertung klinischer Prüfungen: Biometrische Grundlagen

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Auswertung und Lösung

LV: Höhere und Angewandte Mathematik Teil: Statistik (Teil: Numerik&Simulation: Prof. Günter)

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Multiples Testen. Wolfgang Mader. 12. Juli Multiples Testen. Wolfgang Mader. Probleme des multiplen Testens. Bonferroni Methode

Grundlagen der schließenden Statistik

GRUNDPRINZIPIEN statistischen Testens

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Methode des statistischen Testens

So berechnen Sie einen Schätzer für einen Punkt

Auswertung und Lösung

After Work Statistics

Statistisches Testen I. De gustibus non est disputandum

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG

Ablaufschema beim Testen

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Bemerkungen bzgl statistichen Tests. (basierend auf Slides von Lukas Meier)

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Fallzahlplanung bei unabhängigen Stichproben

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

1.3 Das Testen von Hypothesen am Beispiel des Einstichproben t-tests

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Bemerkungen zu statistischen Tests

Vergleichende Analyse der Einschätzung kommunikativer und interagierender Parameter aus Sicht von Arzt und Patient in der explorativen Kommunikation

Jost Reinecke. 7. Juni 2005

Diagnose und Prognose: Kurzfassung 4

Bewertung klinischer Relevanz zwischen 0.2 und ärztlichem Urteil

Zur Statistik im neuen Genehmigungsantrag

Dossierbewertung A13-33 Version 1.0 Enzalutamid Nutzenbewertung gemäß 35a SGB V

Grundlagen der Statistik

TESTEN VON HYPOTHESEN

After Work Statistics

Dossierbewertung A13-41 Version 1.0 Afatinib Nutzenbewertung gemäß 35a SGB V

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Mathematische und statistische Methoden II

Testen von Hypothesen

Serie 9, Musterlösung

Antrag auf biometrische und datentechnische Unterstützung von medizinischen Forschungsprojekten

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Nr. Anforderung n.a. Status Bemerkung

Analyse von Experimenten. Stefan Hanenberg (University of Duisburg-Essen)

Mittelwertvergleiche, Teil II: Varianzanalyse

SPSS III Mittelwerte vergleichen

2-Stichprobentest für Anteilswerte

Beurteilende Statistik

Angewandte Statistik 3. Semester

Dossierbewertung A18-80 Version 1.0 Enzalutamid (Prostatakarzinom)

Primer: Inferenzstatistik 1.0

Biometrie für Zahnmediziner WS 2015 / 2016

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007

Biometrische Methodik als Qualitätsindikator in implantologischen Publikationen Vorschlag einer Check-Liste

Fachbereich Humanmedizin

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen

After Work Statistics

Inferenzstatistik Vortrag: Alpha und Beta Fehler

Statistik in der Praxis

Schließende Statistik

Software oder Tabellen (nicht Thema dieser Veranstaltung).

Dossierbewertung A14-28 Version 1.0 Apixaban (neues Anwendungsgebiet) Nutzenbewertung gemäß 35a SGB V

Statistik für Psychologen

Transkript:

Institut für Medizinische Biometrie und Epidemiologie Statistische Signifikanz versus Klinische Relevanz der Sch(l)uss von der Studie in die Realität

Zum Nacharbeiten

Die TonoPen-Studie Dissertationsprojekt Dr. Kathrin Specht: Fragestellung: Abweichung des TGDc-01 TonoPen von Goldmann-Tonometrie als Referenz? Primäre Zielgröße: Abweichung Augeninnendruck [mmhg] Patientengut: 68 rechte Augen von Glaukompatienten

4 2 0-2 -4-6 -8-10 N = Die TonoPen-Studie 68 > 75% aller Patienten Abweichung TGDc - Goldmann [mmhg]

Problem des α-fehlers Zentrale Frage der Schließenden Statistik: Wie sicher kann ein Ergebnis aus einer Studie auf andere Patienten übertragen werden? Realität möglicherweise fehlerhafter Rückschluss Studie

Problem des α-fehlers Zentrale Frage der Schließenden Statistik: Wie sicher kann ein Ergebnis aus einer Studie auf andere Patienten übertragen werden? Grundgesamtheit α-fehler??? Stichprobe

Problem des α-fehlers Zentrale Frage der Schließenden Statistik: Wie sicher kann ein Ergebnis aus einer Studie auf andere Patienten übertragen werden? α Fehler = fälschliches Übertragen eines Unterschiedes aus einer Studie auf andere Patienten (synonym Fehler 1. Art )

Problem des α-fehlers Zentrale Frage der Schließenden Statistik: Wie sicher kann ein Ergebnis aus einer Studie auf andere Patienten übertragen werden? α Fehler = fälschliches Übertragen eines Unterschiedes aus einer Studie auf andere Patienten p-wert = Wahrscheinlichkeit [%], den α-fehler zu begehen auf Basis der vorliegenden Studienergebnisse

Idee des p-wertes p-wert = Wahrscheinlichkeit, den α-fehler zu begehen auf Basis der vorliegenden Studienergebnisse Realität Studie

Idee des p-wertes p-wert = Wahrscheinlichkeit, den α-fehler zu begehen auf Basis der vorliegenden Studienergebnisse Problem: Wann ist ein p-wert klein genug??? Konvention: willkürliche Vorgabe vor Studienbeginn bei uns : 5 % Studien mit unkritischer Versorgung 1 % Studien mit intensiver Versorgung 0.1 % Studien mit riskanter Versorgung ( Signifikanzniveau α )

Idee des p-wertes p-wert = Wahrscheinlichkeit, den α-fehler zu begehen auf Basis der vorliegenden Studienergebnisse Konvention: Vorgabe Signifikanzniveau α vor Studienbeginn damit: p-wert α Studienergebnis übertragbar p-wert > α Studienergebnis nicht übertragbar

statistische Signifikanz p-wert = Wahrscheinlichkeit, den α-fehler zu begehen auf Basis der vorliegenden Studienergebnisse Konvention: Vorgabe Signifikanzniveau α vor Studienbeginn damit: Terminus: p-wert α Studienergebnis übertragbar p-wert > α Studienergebnis nicht übertragbar p-wert α Studienergebnis signifikant p-wert > α Studienergebnis nicht signifikant

Die TonoPen-Studie Ergebnisse: mediane Abweichung um 1 mmhg p-wert = 0.003 = 0.3 % Signifikanzniveau: α = 1 % Schlussfolgerung: p = 0.3 % < 1 % = α statistisch signifikanter Unterschied

4 2 0-2 -4-6 -8-10 N = Die TonoPen-Studie 68 Abweichung TGDc - Goldmann [mmhg]

Ergebnis: Die TonoPen-Studie Zum Niveau 1 % zeigte sich ein statistisch signifikanter Unterschied zwischen den Augeninnendruckmessungen laut TonoPen und Goldmann-Tonometer (p=0.003); im Median zeigte sich eine Unterschätzung um 1 mmhg (0 3 mmhg) der Goldmann- Tonometrie durch das TonoPen.

Realität in Klinischen Studien Schritt 1: Vorgabe im Studienprotokoll zur maximal tolerablen Wahrscheinlichkeit des α-fehlers (= Festlegung des Signifikanzniveaus α) Vorgabe im Studienprotokoll zum mindestens interessierenden Therapie-Unterschied (= Festlegung klinisch relevanter Unterschiede)

Realität in Klinischen Studien Schritt 1: Vorgabe im Studienprotokoll zur maximal tolerablen Wahrscheinlichkeit des α-fehlers (= Festlegung des Signifikanzniveaus α) Vorgabe im Studienprotokoll zum mindestens interessierenden Therapie-Unterschied (= Festlegung klinisch relevanter Unterschiede) TonoPen: α = 1 % medianer Unterschied = 3 mmhg

Realität in Klinischen Studien Schritt 2: Studiendurchführung Schritt 3: Auswertung: Studienergebnis p-wert medianer / prozentualer Unterschied TonoPen: p = 0.3 % < 1 % medianer Unterschied 1 mmhg < 3 mmhg

Realität in Klinischen Studien Schritt 4: beide Entscheidungsregeln umsetzen statistische Signifikanz p-wert α statistisch signifikanter Unterschied p-wert > α kein stat. signifikanter Unterschied klinische Relevanz Untersch. Vorgabe klinisch relevanter Unterschied Untersch. < Vorgabe kein klinisch relevanter Unterschied

Realität in Klinischen Studien Schritt 4: beide Entscheidungsregeln umsetzen statistische Signifikanz p-wert α statistisch signifikanter Unterschied p-wert > α kein stat. signifikanter Unterschied klinische Relevanz Untersch. Vorgabe klinisch relevanter Unterschied Untersch. < Vorgabe kein klinisch relevanter Unterschied TonoPen: p = 0.3 % < 1 % = α statistisch signifikanter Unterschied 1 mmhg < 3 mmhg kein klinisch relevanter Unterschied

Zusammenfassung p-wert [%] α [%] p α Wahrscheinlichkeit, den α-fehler zu begehen aufgrund von Studienergebnissen willkürliche Vorgabe für maximale tolerable Wahrscheinlichkeit des α-fehlers statistisch signifikantes Studienergebnis

Zusammenfassung p-wert [%] α [%] p α Wahrscheinlichkeit, den α-fehler zu begehen aufgrund von Studienergebnissen willkürliche Vorgabe für maximale tolerable Wahrscheinlichkeit des α-fehlers statistisch signifikantes Studienergebnis CAVE: also: signifikant bedeutet statistisch gesichert statistisch signifikant klinisch relevant

Zusammenfassung p-wert [%] α [%] p α Wahrscheinlichkeit, den α-fehler zu begehen aufgrund von Studienergebnissen willkürliche Vorgabe für maximale tolerable Wahrscheinlichkeit des α-fehlers statistisch signifikantes Studienergebnis CAVE: also: signifikant bedeutet statistisch gesichert statistisch signifikant klinisch relevant Kriterien zur Prüfung von Signifikanz und Relevanz: statistische Signifikanz: p-wert klinische Relevanz: medianer / prozentualer Unterschied

Zusammenfassung Kriterien zur Prüfung von Signifikanz und Relevanz: statistische Signifikanz: klinische Relevanz: p-wert medianer / prozentualer Unterschied In Ergebnisdarstellungen immer Beides kommentieren!!! Zum Niveau 1 % zeigte sich ein statistisch signifikanter Unterschied zwischen den Augeninnendruckmessungen laut TonoPen und Goldmann-Tonometer (p=0.003); im Median zeigte sich eine Unterschätzung um 1 mmhg (0 3 mmhg) der Goldmann-Tonometrie durch das TonoPen.

Die Wurzelstift-Studie Dissertationsprojekt Dr. Caroline Neumann: Einjährige Verlustrate nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung

Die Wurzelstift-Studie Dissertationsprojekt Dr. Caroline Neumann: Einjährige Verlustrate nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung Primäre Zielgröße: Zahnverlust bis ein Jahr nach Versorgungsende [ja / nein] Patientengut: 2 x 140 Prämolaren Signifikanzniveau: α = 1 % klinisch relevanter Unterschied: 5 % Unterschied in Verlustraten

Die Wurzelstift-Studie Dissertationsprojekt Dr. Caroline Neumann: Einjährige Verlustrate nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung Verlust kein Verlust konservativ 6 % 94 % Stift-gestützt 13 % 87 % Unterschied zwischen Verlustraten 7 % p-wert 0.062 = 6.2 %

Die Wurzelstift-Studie Dissertationsprojekt Dr. Caroline Neumann: Einjährige Verlustrate nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung Zum Niveau 1 % zeigte sich kein statistisch signifikanter Unterschied zwischen den einjährigen Verlustraten nach konservativer versus Stift-gestützter Endodontie (p=0.062);

Die Wurzelstift-Studie Dissertationsprojekt Dr. Caroline Neumann: Einjährige Verlustrate nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung Zum Niveau 1 % zeigte sich kein statistisch signifikanter Unterschied zwischen den einjährigen Verlustraten nach konservativer versus Stift-gestützter Endodontie (p=0.062); konkret zeigten Prämolaren nach konservativer Versorgung eine einjährige Verlustrate von 6 % gegenüber 13 % nach Stiftgestützter Versorgung.

Problem der α Inflation Dissertationsprojekt Dr. Caroline Neumann: Zwei parallele Zielkriterien: a) Einjährige Verlustrate [ja / nein] nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung b) Dauer bis zum Verlust des Index-Zahnes [Monate]

Problem der α Inflation Dissertationsprojekt Dr. Caroline Neumann: Zwei parallele Zielkriterien: a) Einjährige Verlustrate [ja / nein] nach konservativer versus Wurzelkanalstift-gestützter endodontischer Versorgung b) Dauer bis zum Verlust des Index-Zahnes [Monate] Problem: 2 Entscheidungen, je 1% Irrtumswahrscheinlichkeit a) p 0.01 b) p 0.01 0.02 schlimmstenfalls also Gesamtaussage mit Irrtumswahrscheinlichkeit 2 % zu erwarten!

Bonferroni-Korrektur Idee: jeweils Entscheidung treffen auf Signifikanzniveau 0.5 % a) p 0.01 / 2 = 0.5 % b) p 0.01 / 2 = 0.5 % 1 % Bonferroni-Korrektur: multiple statistische Signifikanz p α / Anzahl der p-werte

Bonferroni-Korrektur Bonferroni-Korrektur: multiple statistische Signifikanz p α / Anzahl der p-werte Anwendung: many one Vergleich Placebo versus 5 Stufen Signifikanzniveau 5 % Stufe 1 p = 0.210 > 5 % Stufe 2 p = 0.175 > 5 % Stufe 3 p = 0.049 < 5 % Stufe 4 p = 0.021 < 5 % Stufe 5 p = 0.002 < 5 %

Bonferroni-Korrektur Bonferroni-Korrektur: multiple statistische Signifikanz p α / Anzahl der p-werte Anwendung: many one : 5 Vergleiche Signifikanz bei p α / 5 = 1 % Stufe 1 p = 0.210 Stufe 2 p = 0.175 Stufe 3 p = 0.049 Stufe 4 p = 0.021 Stufe 5 p = 0.002

Bonferroni-Korrektur Bonferroni-Korrektur: multiple statistische Signifikanz p α / Anzahl der p-werte Anwendung: many one : 5 Vergleiche p α / 5 = 1 % Stufe 1 p = 0.210 > 1 % Stufe 2 p = 0.175 > 1 % Stufe 3 p = 0.049 > 1 % Stufe 4 p = 0.021 > 1 % Stufe 5 p = 0.002 < 1 %

Bonferroni-Korrektur Bonferroni-Korrektur: multiple statistische Signifikanz p α / Anzahl der p-werte Anwendung: many one : 5 Vergleiche Placebo versus 5 Stufen: p α / 5 = 1 % Ab Dosisstufe 5 zeigt sich ein zum multiplen Signifikanzniveau 5 % signifikanter Unterschied gegenüber Placebo.

Bonferroni-Korrektur Bonferroni-Korrektur: multiple statistische Signifikanz p α / Anzahl der p-werte Anwendungen: many one Vergleiche parallele primäre Endpunkte Zwischenauswertung von Studien Beste Alternative: eine klare Fragestellung ein klarer primärer Endpunkt pro Studie nur einen p-wert!!!

Zusammenfassung p-wert [%] α [%] p α Wahrscheinlichkeit, den α-fehler zu begehen aufgrund von Studienergebnissen willkürliche Vorgabe für maximale tolerable Wahrscheinlichkeit des α-fehlers statistisch signifikantes Studienergebnis signifikant = statistisch gesichert statistisch signifikant klinisch relevant keine unnötigen primären Endpunkte oder Studienarme