Diagnostisches Testen Coniecturalem artem esse medicinam
Würfelspiel A: ein fairer Würfel zeigt eine gerade Augenzahl B: ein fairer Würfel zeigt mindestens 4 Punkte A: B: A B: P(A=1/2 P(B=1/2 P(A B=2/6 P(A B = 2/6 > 1/4 = 1/2 1/2 = P(A P(B A und B sind nicht unabhängig
Bedingte Wahrscheinlichkeit B: A? Die bedingte WahrscheinlichkeitP(A B von A gegeben B beträgt 2/3, d.h. sie ist größer als die unbedingte Wahrscheinlichkeit P(A=1/2. P(A B = P(A B P(B
Bedingte Wahrscheinlichkeit A B A B= A und B unabhängig P(A B P (A B = = 0 P(B P(A P(B P (A B = = P(A P(B
Blutdruck und Blutfette Ein zufällig ausgewählter erwachsener US-Amerikaner ist A: hypertensiv P(A=0.25 B: hyperlipidämisch P(B=0.20 A B: hypertensiv und hyperlipidämisch P(A B=0.17 P(A B 0.17 P (A B = = = 0.85 > 0.25 = P(B 0.20 P(A
Bayes-Theorem Essay Towards Solving a Problem in the Doctrine of Chances. Thomas Bayes (1702-1761 von Richard Price posthum publiziert in den Philosophical Transactions of the Royal Society of London 1763
Bayes-Theorem Das Theorem von Bayes setzt A-posteriori- Wahrscheinlichkeiten mit A-priori- und bedingten Wahrscheinlichkeiten in Verbindung. P(A B = P(B A P(B P(A Beweis: P(A B = P(A B P(B = P(B A P(A P(A P(B = P(B A P(B P(A
Satz von der totalen Wahrscheinlichkeit B A A c P(B = P(B A P(A P(B A C P(A C
Bayes-Theorem aus dem Satz von der totalen Wahrscheinlichkeit P(A B = P(B A P(B A P(A P(A P(B A C P(A C
Diagnostischer Test Jede Prozedur, die dazu dient, Individuen oder Objekte in Hinblick auf eine festgelegte Eigenschaft zu klassifizieren. www.biology-online.org
HIV-Infektion und ELISA-Test Der ELISA-Test auf HIV-Infektion liefert bei 99.5% aller Infizierten ein positives Ergebnis und bei 99.5% aller nicht Infizierten ein negatives Ergebnis. Mit welcher Wahrscheinlichkeit ist eine positiv getestete Person infiziert, wenn die Prävalenz der HIV-Infektion in der allgemeinen ("Niedrig-Risiko-" Bevölkerung 0.01% beträgt? D: Person ist infiziert D C : Person ist nicht infiziert T : Testergebnis ist positiv T - : Testergebnis ist negativ P (T D = 0.995 C D = 1 P (D = 0.0001 P(D C = 0. 9999 C D = 1 0.995 = 0.005 P(D T D P(D D P(D D = P(D = C C 0.0195
Diagnostischer Test Nomenklatur D: Erkrankung bzw. Prädisposition D C : keine Erkrankung bzw. Prädisposition T : positives Testergebnis T - : negatives Testergebnis testabhängig D: Sensitivität - D C : Spezifität populationsabhängig P(D: Prävalenz testabhängig, populationsabhängig P(D T : positiv prädiktiver Wert (PPW P(D C T - : negativ prädiktiver Wert (NPW
Diagnostischer Test Bayes-Theorem (positiv prädiktiver Wert P(D T D P(D D P(D D C P(D = C D P(D D P(D [1 D = C ] [1 P(D] PPW= Sensitivität Prävalenz Sensitivität Prävalenz(1-Spezifität (1-Prävalenz
P(D D P(D D P(D D T (D P C C C C C = P(D] [1 D P(D D] [1 P(D] [1 D C C = NPW= Spezifität (1-Prävalenz Spezifität (1-Prävalenz(1-Sensitivität Prävalenz Bayes-Theorem (negativ prädiktiver Wert Diagnostischer Test
Hypothetische Population (n=100 NPV: 49/55 = 89% Spezifität: 49/70 = 70% Sensitivität: 24/30 = 80% PPV: 24/45 = 89%
HIV-Infektion und ELISA-Test 1.0 0.8 prädiktiver Wert 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Prävalenz : PPW : NPW
Schizophrenie und Hirnatrophie Etwa 30% aller Schizophreniepatienten leiden an einer Hirnatrophie, verglichen mit nur 2% der nicht betroffenen ("normalen" Bevölkerung. Wenn die Prävalenz der Schizophrenie 1.5% beträgt, mit welcher Wahrscheinlichkeit ist eine atrophe Person schizophren? P (T D = D C = 0.30 0.02 P (D = P(D C = 0.015 0.985 P(D T D P(D D P(D D = P(D = C C 0.186
Schizophrenie und Hirnatrophie 1.0 0.8 prädiktiver Wert 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Prävalenz : PPW : NPW
Likelihoodquotient vergleicht die Wahrscheinlichkeiten eines bestimmten Testergebnisses zwischen Betroffenen und nicht Betroffenen positiver Likelihoodquotient negativer Likelihoodquotient LR = D C D LR = D C D Sensitivität 1 Spezifität 1 Sensitivität Spezifität
Bayes-Theorem Likelihoods und Odds P(D P(D D D = P(D T C C C P(D T Prior- Odds. Likelihoodquotient = Posterior- Odds
Kreatinkinase und Herzinfarkt Kreatinkinase 80 U/l Herzinfarkt ja nein 215 16 gesamt 231 <80 U/l 15 114 gesamt 230 130 129 360 Prior-Odds Likelihoodquotient Posterior-Odds 230 215/230 = 1.77 = 7.60 1.77 7.60 = 13. 130 16/130 45
Diagnostische Studie Ziel Um Aussagen über die Nützlichkeit eines neuen diagnostischen Tests treffen zu können, muss die Qualität des Tests in einer diagnostischen Studie ermittelt werden. Dabei wird geprüft - die Leistungsfähigkeit(d.h. wie sensitiv und spezifisch ist der Test? -die Validität(d.h. wie genau ist der Test? - die Reliabilität(d.h. wie präzise ist der Test?
Diagnostische Studie Qualität http://www.cebm.utoronto.ca/teach/materials/dx.htm Gab es einen unabhängigen, verblindeten Vergleich mit einer Referenzmethode ("Goldstandard" zur Diagnose? Wurde der Goldstandard unabhängig vom Ergebnis des diagnostischen Tests angewandt? Wurde der diagnostische Test in einem angemessenen Patientengutgeprüft (also den Patienten, bei denen er in der Praxis angewandt werden soll? Wurde der Test in einer zweiten, unabhängigen Gruppe von Patienten validiert?
Diagnostischer Test Reliabilitätskriterien Hängt das Testergebnis von klinischen Merkmalen wie Schwere und Verlauf ab? Hängt das Testergebnis von der Pathologie der Krankheit(Ort, Ausmaß ab? Wird das Testergebnis durch das gleichzeitige Auftreten anderer Krankheiten beeinflusst?
Diagnostischer Test praktische Anwendbarkeit http://www.cebm.utoronto.ca/teach/materials/dx.htm Ist der diagnostische Test unter den maßgeblichen Bedingungen sinnvoll, verfügbar und bezahlbar? Können Sie für Ihre Probanden eine sinnvolle Schätzung der A-priori-Wahrscheinlichkeit der Krankheit angeben? Wird die resultierende A-posteriori-Wahrscheinlichkeitden Probanden im Umgang mit der Krankheit beeinflussen? Werden die Konsequenzen des Tests Ihrem Probanden helfen?
Maße der Leistungsfähigkeit von Tests Sensitivität und Spezifität Youden-Index Likelihoodquotient ROC-Kurve populationsabhängig positiv und negativ prädiktiver Wert diagnostische Genauigkeit
Maße der Leistungsfähigkeit von Tests Sensitivität Sensitivität: Wahrscheinlichkeit, mit der eine betroffene (bzw. prädisponierte Person positiv getestet wird Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ Die "SnNOut"Regel: With a test of high Sensitivity, a Negative test result rules Out disease (or predisposition.
Maße der Leistungsfähigkeit von Tests Spezifität Spezifität: Wahrscheinlichkeit, mit der eine nicht betroffene (bzw. prädisponiert Person negativ getestet wird Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ Die "SpPIn"Regel: With a test of high Specificity, a Positive test result rules In disease (or predisposition.
Maße der Leistungsfähigkeit von Tests praktische Kriterien Ziel: hohe Sensitivität falsch Negative sind "teuer" behandelbare Krankheit keine Nebenwirkungen ohne Behandlung fatal starkes Vertrauen in negative Ergebnisse gefordert Beispiel: Guthrie-Test (Phenylketonurie Ziel: hohe Spezifität falsch Positive sind "teuer" nicht behandelbare Krankheit starke Nebenwirkungen ohne Behandlung nicht fatal starkes Vertrauen in positive Ergebnisse gefordert Beispiel: Tumor-Grading vor OP
Maße der Leistungsfähigkeit von Tests Youden-Index Youden-Index: Verbesserung gegenüber zufälliger Diagnosestellung ("Münzwurf" Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ D 1 2 D C 1 2
Maße der Leistungsfähigkeit von Tests diagnostische Genauigkeit diagnostische Genauigkeit: Wahrscheinlichkeit für ein korrektes Testergebnis Testresultat Krankheit positiv negativ ja nein richtig positiv falsch negativ falsch positiv richtig negativ D P(D D C P(D C
Schizophrenie und Hirnatrophie P (T D = D C 0.30 = 0.02 Sensitivität: 0.30 Spezifität: 0.98 P (D = P(D C = 0.015 0.985 PPW : 0.186 NPW: 0.989 Youden-Index: 0.28 diagnostische Genauigkeit: 0.97
Stetige Testergebnisse Dichotomisierung Stetige Testergebnissewerden oft dichotomisiert(d.h. in "positive" oder "negative" Ergebnisse transformiert, indem man sie mit einem vordefinierten Schwellenwert vergleicht. Die Wahl des Schwellenwerts hängt stark vom Zweck des Tests ab und kann sich stützen auf - ein Gauß'sches Kriterium - festgelegte Sensitivität oder Spezifität - die ROC-Kurve
Schwangerschaftsdiabetes Am Universitätsklinikum Zürich wurde an 520 Schwangeren eine prospektive Studie durchgeführt, um zu ermitteln, ob die Messung des Nüchternblutzuckers eine akzeptable Screening-Methode für den Schwangerschaftsdiabetes darstellt, die den üblichen 50g-Glukose- Suchtest überflüssig machen könnte. Perucchini D et al. (1999 BMJ 319: 812-815. Schwellenwerte für den 100g-Glukose-Toleranztest ("Goldstandard" Zeitpunkt nüchtern 1 Stunde 2 Stunden 3 Stunden Plasmakonzentration 5.3 mmol/l 10.0 mmol/l 8.6 mmol/l 7.8 mmol/l Ein Schwangerschaftsdiabetes wird diagnostiziert, wenn zwei oder mehr Messungen den Schwellenwert überschreiten.
Stetige Testergebnisse Gauß'sches Kriterium Verteilung der Testergebnisse bei nicht betroffenen Kontrollen 95% 95% positiv negativ positiv negativ positiv Probleme: - Nichtbeachten der Sensitivität - mögliches Fehlen einer Normalverteilung - unklare Repräsentativität der Kontrollen
Stetige Testergebnisse festgelegte Sensitivität oder Spezifität Spezifität Sensitivität Spezifität Sensitivität Kontrollen Patienten Spezifität Sensitivität negatives Ergebnis positives Ergebnis
Stetige Testergebnisse ROC-Kurve 1.0 0.8 Sensitivität 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 1-Spezifität
Stetige Testergebnisse ROC-Kurve 1.0 0.8 Sensitivität 0.6 0.4 0.2 maximiert Youden-Index 0.0 0.0 0.2 0.4 0.6 0.8 1.0 1-Spezifität
Schwangerschaftsdiabetes Sensitivität 1-Spezifität
Zusammenfassung - Das Theorem von Bayes stellt eine Verbindung zwischen A- posteriori-wahrscheinlichkeitenund A-priori-sowie bedingten Wahrscheinlichkeitenher. - Diagnostische Tests dienen der Unterscheidung von Gruppen von Individuen auf der Grundlage assoziierter Merkmale. -Die Leistungsfähigkeit eines diagnostischen Tests wird durch dessen Sensitivität und Spezifität gekennzeichnet. -Die Nützlichkeit eines diagnostischen Tests hängt von der Prävalenz der zu diagnostizierenden Krankheit ab und wird durch die beiden (populationsabhängigen prädiktiven Werte gemessen. -Stetige Testergebnissekönnen dichotomisiertwerden, z.b. durch Ermittlung eines Schwellenwertes in der ROC-Kurve.
Anhang Differenzialdiagnostik Ein diagnostischer Marker kann auf mehrere Krankheiten hinweisen. T: Person zeigt den Marker K i : Person ist von der i-ten Krankheit betroffen P(K i T = k j = 1 K K i P(K j i P(K j
Anhang: Differenzialdiagnostik des Lungenkrebses Mutationen in den p53 und K-ras Genen sowie eine Hypermethylierung des p16 INK4a Promoters im Auswurf von Patienten mit Bronchialerkrankungen sind ein Marker für Lungenkrebs und Tumortyp. Kersting M et al. (2000 J Clin Oncol 18: 3221-3229 i K i K i Raucher P(K i P(K i T Nichtraucher P(K i P(K i T 1 NSCLC 0.81 0.6 0.77 0.2 0.37 2 SCLC 0.50 0.1 0.08 0.1 0.11 3 gutartig 0.32 0.3 0.15 0.7 0.52