Diagnostisches Testen. Coniecturalem artem esse medicinam

Ähnliche Dokumente
Medizinische Biometrie (L5)

Pittfalls in der Autoimmundiagnostik. Initiiated and supported by

2. Übung Diagnostik. Ein erfundenes Beispiel (H.P.Beck-Bornholt und H.-H.Dubben)

Sensitivität und Spezifität (95% Konfidenzintervalle)

Vorlesung - Medizinische Biometrie

Statistical Coaching. Thomas Forstner

Prinzipien der klinischen Epidemiologie

Bewertung diagnostischer Tests

Biostatistik, Sommer 2017

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose WS 06/07 Übung 5

Diagnostikstudien. Dr. Dirk Hasenclever IMISE, Leipzig.

MaReCum Klausur in Biomathematik WS 2006 / 2007 Freitag, den 27. Oktober 2006

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Statistische Methoden der Datenanalyse Wintersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Themenblock. Diagnose und Prognose. Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik. Themen im Block Diagnose und Prognose

Epidemiologie 10. Thomas Kohlmann Maresa Buchholz. Institut für Community Medicine Abteilung Methoden Universitätsmedizin Greifswald

Biostatistik, Winter 2011/12

Diagnostische Verfahren

P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.

BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin

Seminar Diagnostik L5

Was bedeutet p<0.05?

Bewertung diagnostischer Tests

Bedingte Wahrscheinlichkeit. Beispiel zur bedingten Wahrscheinlichkeit

Um diese Begriffe (Sensitivität, Spezifität, prädiktive Werte etc.) geht es im Folgenden!

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Nutzen einer diagnostischen Tests in der Praxis: prädiktive Werte

STATISTISCHE KRANKHEITSTESTS. Simon Schimpf und Nico Schmitt

Epidemiologie und HIV-Tests

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Satz 18 (Satz von der totalen Wahrscheinlichkeit)

Epidemiologie 3. Thomas Kohlmann Maresa Buchholz. Institut für Community Medicine Abteilung Methoden Universitätsmedizin Greifswald

Analyse kategorieller Daten

Borrelien-Serologie. Kriterien analytischer Leistungsfähigkeit am Beispiel kommerziell erhältlicher Testsysteme (ELISA)

Satz 16 (Multiplikationssatz)

Bewertung diagnostischer Tests

3.3.1 Referenzwerte für Fruchtwasser-Schätzvolumina ( SSW)

Biomathematik für Mediziner

Mathematik 2 für Naturwissenschaften

Retrospektives Studiendesign

Übung zur Vorlesung Statistik I WS Übungsblatt 12

Ist gut gemeint auch gut gemacht? Chancen und Grenzen von Screening-Programmen

Mathematik EP - Stochastik VIERFELDERTAFEL UND BEDINGTE WKT.

WIE SICHER IST DIE DIAGNOSE?

STOCHASTISCHE UNABHÄNGIGKEIT. Annika Pohlmann Philipp Oel Wilhelm Dück

Medizinische Entscheidungstheorie. Stiftungslehrstuhl Health Economics

Mathematik EP - Stochastik VIERFELDERTAFEL UND BAUMDIAGRAMM

Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001

Bedingte Wahrscheinlichkeit

Satz von der totalen Wahrscheinlichkeit

Individualisierte Therapieentscheidung Aktueller Stand aus klinischer Sicht

Grundlagen der Labormedizin. Die analytische Phase

Südtiroler Akademie für Allgemeinmedizin. Brustschmerzen: ein häufiges Symptom in der Allgemeinpraxis

Wie liest man Konfidenzintervalle? Teil II. Premiu m

Ma 13 - Stochastik Schroedel Neue Wege (CON)

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns

Prüfung nicht bestanden. Die gleiche Tabelle kann man auch mit den entsprechenden Wahrscheinlichkeiten (relative Häufigkeit) erstellen.

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Mathematik IV: Statistik. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Südtiroler Akademie für Allgemeinmedizin. Seminar

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

Lösungen zur Biomathe-Klausur Gruppe B Montag, den 16. Juli 2001

Prüfung aus Statistik 1 für SoziologInnen

Naive Bayes. 5. Dezember Naive Bayes 5. Dezember / 18

Dr. med. Christoph Bobrowski. M.Sc. Dipl.-Psych. Ruth Fahland. Gesamtsterblichkeit im Krankenhaus als Qualitätskennzahl

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics

Medizinische Psychologie. Bewertung wissenschaftlicher Ergebnisse, Evidenzbasierte Medizin, Anwendung statistischer Information

Labordiagnostik bei Tumorerkrankungen

ebm info.at ärzteinformationszentrum

htw saar 1 KAPITEL 4 BEDINGTE WAHRSCHEINLICHKEIT UND STOCHASTISCHE UNABHÄNGIGKEIT Hans-Peter Hafner WS 2016/2017

Diagnostische Tests Über den Umgang mit Risiken

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Diagnose und Prognose: Kurzfassung 3

Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008

5 ZUSAMMENFASSUNG Zusammenfassung

Aufgabe 1. Übung Wahrscheinlichkeitsrechnung Markus Kessler Seite 1 von 8. Die Ereignisse A, B und C erfüllen die Bedingungen

Mathematik für Biologen

Validierung von NT-proBNP Cut-off-Werten für die Risikostratifizierung von Nicht-Hochrisiko Patienten mit akuter Lungenembolie

Chlamydia MIF IgG. Leistungsmerkmale. Produktnummer: IF1250G Rev. J. Nicht für den Vertrieb in den USA

Übersicht. Künstliche Intelligenz: 13. Unsicherheiten Frank Puppe 1

Unabhängigkeit KAPITEL 4

Prüfung aus Statistik 1 für SoziologInnen

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Schriftlicher Test Teilklausur 2

Bis vor einigen Jahren basierte die lokale Bildgebung der Prostata auf dem transrektalen Schall.

Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

3.4.1 Referenzwerte für das fetale Schätzgewicht in der SSW

Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L

Klinisches Institut für Medizinische und Chemische Labordiagnostik (KIMCL) Allgemeines Krankenhaus Wien. Medizinische Universität Wien

Berechnung von Konfidenzintervallen für Impact Numbers aus Fall-Kontroll und Kohorten-Studien

Screeningmaßnahmen - klinische Beispiele

Grundbegriffe. Vereinigungsmenge Schnittmenge sicheres Ereignis disjunkte Mengen komplementäre Ereignisse/ Gegenereignisse/ Alternativereignisse

Eine Einführung zur Wahrheit und Aussagekraft diagnostischer Messwerte in der medizinischen Statistik

Modul 203: Stochastische Unabhängigkeit!

Transkript:

Diagnostisches Testen Coniecturalem artem esse medicinam

Würfelspiel A: ein fairer Würfel zeigt eine gerade Augenzahl B: ein fairer Würfel zeigt mindestens 4 Punkte A: B: A B: P(A=1/2 P(B=1/2 P(A B=2/6 P(A B = 2/6 > 1/4 = 1/2 1/2 = P(A P(B A und B sind nicht unabhängig

Bedingte Wahrscheinlichkeit B: A? Die bedingte WahrscheinlichkeitP(A B von A gegeben B beträgt 2/3, d.h. sie ist größer als die unbedingte Wahrscheinlichkeit P(A=1/2. P(A B = P(A B P(B

Bedingte Wahrscheinlichkeit A B A B= A und B unabhängig P(A B P (A B = = 0 P(B P(A P(B P (A B = = P(A P(B

Blutdruck und Blutfette Ein zufällig ausgewählter erwachsener US-Amerikaner ist A: hypertensiv P(A=0.25 B: hyperlipidämisch P(B=0.20 A B: hypertensiv und hyperlipidämisch P(A B=0.17 P(A B 0.17 P (A B = = = 0.85 > 0.25 = P(B 0.20 P(A

Bayes-Theorem Essay Towards Solving a Problem in the Doctrine of Chances. Thomas Bayes (1702-1761 von Richard Price posthum publiziert in den Philosophical Transactions of the Royal Society of London 1763

Bayes-Theorem Das Theorem von Bayes setzt A-posteriori- Wahrscheinlichkeiten mit A-priori- und bedingten Wahrscheinlichkeiten in Verbindung. P(A B = P(B A P(B P(A Beweis: P(A B = P(A B P(B = P(B A P(A P(A P(B = P(B A P(B P(A

Satz von der totalen Wahrscheinlichkeit B A A c P(B = P(B A P(A P(B A C P(A C

Bayes-Theorem aus dem Satz von der totalen Wahrscheinlichkeit P(A B = P(B A P(B A P(A P(A P(B A C P(A C

Diagnostischer Test Jede Prozedur, die dazu dient, Individuen oder Objekte in Hinblick auf eine festgelegte Eigenschaft zu klassifizieren. www.biology-online.org

HIV-Infektion und ELISA-Test Der ELISA-Test auf HIV-Infektion liefert bei 99.5% aller Infizierten ein positives Ergebnis und bei 99.5% aller nicht Infizierten ein negatives Ergebnis. Mit welcher Wahrscheinlichkeit ist eine positiv getestete Person infiziert, wenn die Prävalenz der HIV-Infektion in der allgemeinen ("Niedrig-Risiko-" Bevölkerung 0.01% beträgt? D: Person ist infiziert D C : Person ist nicht infiziert T : Testergebnis ist positiv T - : Testergebnis ist negativ P (T D = 0.995 C D = 1 P (D = 0.0001 P(D C = 0. 9999 C D = 1 0.995 = 0.005 P(D T D P(D D P(D D = P(D = C C 0.0195

Diagnostischer Test Nomenklatur D: Erkrankung bzw. Prädisposition D C : keine Erkrankung bzw. Prädisposition T : positives Testergebnis T - : negatives Testergebnis testabhängig D: Sensitivität - D C : Spezifität populationsabhängig P(D: Prävalenz testabhängig, populationsabhängig P(D T : positiv prädiktiver Wert (PPW P(D C T - : negativ prädiktiver Wert (NPW

Diagnostischer Test Bayes-Theorem (positiv prädiktiver Wert P(D T D P(D D P(D D C P(D = C D P(D D P(D [1 D = C ] [1 P(D] PPW= Sensitivität Prävalenz Sensitivität Prävalenz(1-Spezifität (1-Prävalenz

P(D D P(D D P(D D T (D P C C C C C = P(D] [1 D P(D D] [1 P(D] [1 D C C = NPW= Spezifität (1-Prävalenz Spezifität (1-Prävalenz(1-Sensitivität Prävalenz Bayes-Theorem (negativ prädiktiver Wert Diagnostischer Test

Hypothetische Population (n=100 NPV: 49/55 = 89% Spezifität: 49/70 = 70% Sensitivität: 24/30 = 80% PPV: 24/45 = 89%

HIV-Infektion und ELISA-Test 1.0 0.8 prädiktiver Wert 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Prävalenz : PPW : NPW

Schizophrenie und Hirnatrophie Etwa 30% aller Schizophreniepatienten leiden an einer Hirnatrophie, verglichen mit nur 2% der nicht betroffenen ("normalen" Bevölkerung. Wenn die Prävalenz der Schizophrenie 1.5% beträgt, mit welcher Wahrscheinlichkeit ist eine atrophe Person schizophren? P (T D = D C = 0.30 0.02 P (D = P(D C = 0.015 0.985 P(D T D P(D D P(D D = P(D = C C 0.186

Schizophrenie und Hirnatrophie 1.0 0.8 prädiktiver Wert 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Prävalenz : PPW : NPW

Likelihoodquotient vergleicht die Wahrscheinlichkeiten eines bestimmten Testergebnisses zwischen Betroffenen und nicht Betroffenen positiver Likelihoodquotient negativer Likelihoodquotient LR = D C D LR = D C D Sensitivität 1 Spezifität 1 Sensitivität Spezifität

Bayes-Theorem Likelihoods und Odds P(D P(D D D = P(D T C C C P(D T Prior- Odds. Likelihoodquotient = Posterior- Odds

Kreatinkinase und Herzinfarkt Kreatinkinase 80 U/l Herzinfarkt ja nein 215 16 gesamt 231 <80 U/l 15 114 gesamt 230 130 129 360 Prior-Odds Likelihoodquotient Posterior-Odds 230 215/230 = 1.77 = 7.60 1.77 7.60 = 13. 130 16/130 45

Diagnostische Studie Ziel Um Aussagen über die Nützlichkeit eines neuen diagnostischen Tests treffen zu können, muss die Qualität des Tests in einer diagnostischen Studie ermittelt werden. Dabei wird geprüft - die Leistungsfähigkeit(d.h. wie sensitiv und spezifisch ist der Test? -die Validität(d.h. wie genau ist der Test? - die Reliabilität(d.h. wie präzise ist der Test?

Diagnostische Studie Qualität http://www.cebm.utoronto.ca/teach/materials/dx.htm Gab es einen unabhängigen, verblindeten Vergleich mit einer Referenzmethode ("Goldstandard" zur Diagnose? Wurde der Goldstandard unabhängig vom Ergebnis des diagnostischen Tests angewandt? Wurde der diagnostische Test in einem angemessenen Patientengutgeprüft (also den Patienten, bei denen er in der Praxis angewandt werden soll? Wurde der Test in einer zweiten, unabhängigen Gruppe von Patienten validiert?

Diagnostischer Test Reliabilitätskriterien Hängt das Testergebnis von klinischen Merkmalen wie Schwere und Verlauf ab? Hängt das Testergebnis von der Pathologie der Krankheit(Ort, Ausmaß ab? Wird das Testergebnis durch das gleichzeitige Auftreten anderer Krankheiten beeinflusst?

Diagnostischer Test praktische Anwendbarkeit http://www.cebm.utoronto.ca/teach/materials/dx.htm Ist der diagnostische Test unter den maßgeblichen Bedingungen sinnvoll, verfügbar und bezahlbar? Können Sie für Ihre Probanden eine sinnvolle Schätzung der A-priori-Wahrscheinlichkeit der Krankheit angeben? Wird die resultierende A-posteriori-Wahrscheinlichkeitden Probanden im Umgang mit der Krankheit beeinflussen? Werden die Konsequenzen des Tests Ihrem Probanden helfen?

Maße der Leistungsfähigkeit von Tests Sensitivität und Spezifität Youden-Index Likelihoodquotient ROC-Kurve populationsabhängig positiv und negativ prädiktiver Wert diagnostische Genauigkeit

Maße der Leistungsfähigkeit von Tests Sensitivität Sensitivität: Wahrscheinlichkeit, mit der eine betroffene (bzw. prädisponierte Person positiv getestet wird Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ Die "SnNOut"Regel: With a test of high Sensitivity, a Negative test result rules Out disease (or predisposition.

Maße der Leistungsfähigkeit von Tests Spezifität Spezifität: Wahrscheinlichkeit, mit der eine nicht betroffene (bzw. prädisponiert Person negativ getestet wird Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ Die "SpPIn"Regel: With a test of high Specificity, a Positive test result rules In disease (or predisposition.

Maße der Leistungsfähigkeit von Tests praktische Kriterien Ziel: hohe Sensitivität falsch Negative sind "teuer" behandelbare Krankheit keine Nebenwirkungen ohne Behandlung fatal starkes Vertrauen in negative Ergebnisse gefordert Beispiel: Guthrie-Test (Phenylketonurie Ziel: hohe Spezifität falsch Positive sind "teuer" nicht behandelbare Krankheit starke Nebenwirkungen ohne Behandlung nicht fatal starkes Vertrauen in positive Ergebnisse gefordert Beispiel: Tumor-Grading vor OP

Maße der Leistungsfähigkeit von Tests Youden-Index Youden-Index: Verbesserung gegenüber zufälliger Diagnosestellung ("Münzwurf" Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ D 1 2 D C 1 2

Maße der Leistungsfähigkeit von Tests diagnostische Genauigkeit diagnostische Genauigkeit: Wahrscheinlichkeit für ein korrektes Testergebnis Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ D P(D D C P(D C

Schizophrenie und Hirnatrophie P (T D = D C 0.30 = 0.02 Sensitivität: 0.30 Spezifität: 0.98 P (D = P(D C = 0.015 0.985 PPW : 0.186 NPW: 0.989 Youden-Index: 0.28 diagnostische Genauigkeit: 0.97

Stetige Testergebnisse Dichotomisierung Stetige Testergebnissewerden oft dichotomisiert(d.h. in "positive" oder "negative" Ergebnisse transformiert, indem man sie mit einem vordefinierten Schwellenwert vergleicht. Die Wahl des Schwellenwerts hängt stark vom Zweck des Tests ab und kann sich stützen auf - ein Gauß'sches Kriterium - festgelegte Sensitivität oder Spezifität - die ROC-Kurve

Schwangerschaftsdiabetes Am Universitätsklinikum Zürich wurde an 520 Schwangeren eine prospektive Studie durchgeführt, um zu ermitteln, ob die Messung des Nüchternblutzuckers eine akzeptable Screening-Methode für den Schwangerschaftsdiabetes darstellt, die den üblichen 50g-Glukose- Suchtest überflüssig machen könnte. Perucchini D et al. (1999 BMJ 319: 812-815. Schwellenwerte für den 100g-Glukose-Toleranztest ("Goldstandard" Zeitpunkt nüchtern 1 Stunde 2 Stunden 3 Stunden Plasmakonzentration 5.3 mmol/l 10.0 mmol/l 8.6 mmol/l 7.8 mmol/l Ein Schwangerschaftsdiabetes wird diagnostiziert, wenn zwei oder mehr Messungen den Schwellenwert überschreiten.

Stetige Testergebnisse Gauß'sches Kriterium Verteilung der Testergebnisse bei nicht betroffenen Kontrollen 95% 95% positiv negativ positiv negativ positiv Probleme: - Nichtbeachten der Sensitivität - mögliches Fehlen einer Normalverteilung - unklare Repräsentativität der Kontrollen

Stetige Testergebnisse festgelegte Sensitivität oder Spezifität Spezifität Sensitivität Spezifität Sensitivität Kontrollen Patienten Spezifität Sensitivität negatives Ergebnis positives Ergebnis

Stetige Testergebnisse ROC-Kurve 1.0 0.8 Sensitivität 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 1-Spezifität

Stetige Testergebnisse ROC-Kurve 1.0 0.8 Sensitivität 0.6 0.4 0.2 maximiert Youden-Index 0.0 0.0 0.2 0.4 0.6 0.8 1.0 1-Spezifität

Schwangerschaftsdiabetes Sensitivität 1-Spezifität

Zusammenfassung - Das Theorem von Bayes stellt eine Verbindung zwischen A- posteriori-wahrscheinlichkeitenund A-priori-sowie bedingten Wahrscheinlichkeitenher. - Diagnostische Tests dienen der Unterscheidung von Gruppen von Individuen auf der Grundlage assoziierter Merkmale. -Die Leistungsfähigkeit eines diagnostischen Tests wird durch dessen Sensitivität und Spezifität gekennzeichnet. -Die Nützlichkeit eines diagnostischen Tests hängt von der Prävalenz der zu diagnostizierenden Krankheit ab und wird durch die beiden (populationsabhängigen prädiktiven Werte gemessen. -Stetige Testergebnissekönnen dichotomisiertwerden, z.b. durch Ermittlung eines Schwellenwertes in der ROC-Kurve.

Anhang Differenzialdiagnostik Ein diagnostischer Marker kann auf mehrere Krankheiten hinweisen. T: Person zeigt den Marker K i : Person ist von der i-ten Krankheit betroffen P(K i T = k j = 1 K K i P(K j i P(K j

Anhang: Differenzialdiagnostik des Lungenkrebses Mutationen in den p53 und K-ras Genen sowie eine Hypermethylierung des p16 INK4a Promoters im Auswurf von Patienten mit Bronchialerkrankungen sind ein Marker für Lungenkrebs und Tumortyp. Kersting M et al. (2000 J Clin Oncol 18: 3221-3229 i K i K i Raucher P(K i P(K i T Nichtraucher P(K i P(K i T 1 NSCLC 0.81 0.6 0.77 0.2 0.37 2 SCLC 0.50 0.1 0.08 0.1 0.11 3 gutartig 0.32 0.3 0.15 0.7 0.52