Bedingte Wahrscheinlichkeit. Beispiel zur bedingten Wahrscheinlichkeit

Ähnliche Dokumente
Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Bedingte Wahrscheinlichkeit

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Bedingte Wahrscheinlichkeiten & Unabhängigkeit

Assoziation & Korrelation

Was bedeutet p<0.05?

Prüfung aus Statistik 1 für SoziologInnen

Assoziation & Korrelation

Satz von der totalen Wahrscheinlichkeit

WIE SICHER IST DIE DIAGNOSE?

Bedingte Wahrscheinlichkeiten

Medizinische Biometrie (L5)

Für die Wahrscheinlichkeit P A (B) des Eintretens von B unter der Bedingung, dass das Ereignis A eingetreten ist, ist dann gegeben durch P(A B) P(A)

Alternative Darstellung des 2-Stcihprobentests für Anteile

Epidemiologie und HIV-Tests

Täuschung und Manipulation mit Zahlen

Täuschung und Manipulation mit Zahlen Teil 1

Epidemiologie 10. Thomas Kohlmann Maresa Buchholz. Institut für Community Medicine Abteilung Methoden Universitätsmedizin Greifswald

P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.

Ma 13 - Stochastik Schroedel Neue Wege (CON)

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

Biostatistik, Winter 2011/12

Prüfung aus Statistik 1 für SoziologInnen. Musterlösung

Biostatistik, Sommer 2017

Prüfung aus Statistik 1 für SoziologInnen

Alternative Darstellung des 2-Stichprobentests für Anteile

Statistik für Ingenieure Vorlesung 2

GRUPPE B Prüfung aus Statistik 1 für SoziologInnen

STOCHASTISCHE UNABHÄNGIGKEIT. Annika Pohlmann Philipp Oel Wilhelm Dück

Statistik I für Betriebswirte Vorlesung 2

Prüfung nicht bestanden. Die gleiche Tabelle kann man auch mit den entsprechenden Wahrscheinlichkeiten (relative Häufigkeit) erstellen.

Statistical Coaching. Thomas Forstner

Wahrscheinlichkeitstheorie

Übungsblätter zu Methoden der Empirischen Sozialforschung III: Inferenzstatistik. Lösungsblatt zu Nr. 1

Sobald bei einem Zufallsexperiment zusätzliche Bedingungen zutreffen ändern sich i.a. die Wahrscheinlichkeiten.

Allgemeine diskrete Wahrscheinlichkeitsräume I

Allgemeine diskrete Wahrscheinlichkeitsräume II

Allgemeine diskrete Wahrscheinlichkeitsräume II. Beispiel II. Beispiel I. Definition 6.3 (Diskreter Wahrscheinlichkeitsraum)

Bitte lesen Sie die folgende Musteraufgabe konzentriert durch. Musteraufgabe I

Da die Fragen unabhängig voneinander und zufällig ausgewählt werden, ist die Wahrscheinlichkeit für eine Frage aus dem Gebiet Sport 1/10.

Unabhängigkeit KAPITEL 4

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics

Mathematik für Biologen

Mathematik 2 für Naturwissenschaften

Einführung. Wahrscheinlichkeit. 1 Wahrscheinlichkeit: Definition und Interpretation. 2 Elementare Wahrscheinlichkeitsrechnung, bedingte

htw saar 1 KAPITEL 4 BEDINGTE WAHRSCHEINLICHKEIT UND STOCHASTISCHE UNABHÄNGIGKEIT Hans-Peter Hafner WS 2016/2017

Aufgaben zur Wahrscheinlichkeitsrechnung: 1. Beispiel aus der Prüfungspraxis des Physikums:

Statistik I für Betriebswirte Vorlesung 2

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit von Ereignissen

Vorlesung Statistik, WING, ASW Wahrscheinlichkeit in Laplace Versuchen. Kombinatorische Formeln. Bedingte Wahrscheinlichkeit

3 Wahrscheinlichkeitstheorie

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Diagnostische Verfahren

Schilddrüsen-Ca- Screening

Biomathematik für Mediziner

Diagnostische Tests Über den Umgang mit Risiken

Alternative Darstellung des 2-Stichprobentests für Anteile

Biomathematik für Mediziner

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayes sches Lernen. Niels Landwehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Thomas Vanck

Übungsrunde 4, Gruppe 2 LVA , Übungsrunde 4, Gruppe 2, Markus Nemetz, TU Wien, 10/2006

Vorlesung - Medizinische Biometrie

2. Übung Diagnostik. Ein erfundenes Beispiel (H.P.Beck-Bornholt und H.-H.Dubben)

Stochastik und Markovketten

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit von Ereignissen

Themenblock. Diagnose und Prognose. Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik. Themen im Block Diagnose und Prognose

Mathematik für Biologen

Zwei kategoriale Merkmale. Homogenität Unabhängigkeit

Zusammenhangsanalyse in Kontingenztabellen

Ziegenproblem, Monty-Hall-Problem, Wahrscheinlichkeitsrechnung. Ziegenproblem, Monty-Hall-Problem, Drei-Türen-Problem

Prüfung aus Statistik 1 für SoziologInnen

Statistik I für Betriebswirte Vorlesung 2

Wie liest man Konfidenzintervalle? Teil II. Premiu m

Stochastische Unabhängigkeit, bedingte Wahrscheinlichkeiten

STATISTISCHE KRANKHEITSTESTS. Simon Schimpf und Nico Schmitt

Grundbegriffe. Vereinigungsmenge Schnittmenge sicheres Ereignis disjunkte Mengen komplementäre Ereignisse/ Gegenereignisse/ Alternativereignisse

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

2 STOCHASTISCHE GRUNDBEGRIFFE

Medizinische Psychologie. Bewertung wissenschaftlicher Ergebnisse, Evidenzbasierte Medizin, Anwendung statistischer Information

Der Hund, der Eier legt

EXPERTEN-MEETING Mammographie-Screening

3 = 93% (a) Berechnen Sie den Anteil der weiblichen Raucher unter den Betriebsangehörigen.

Wahrscheinlichkeiten

Modul 8: Vierfeldertafel und Baumdiagramm (bedingte Wahrscheinlichkeit)

Beispiel: Zufallsvariable

propositionales bildhaftes motorisches

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Welche Axiome sind Grundlage der axiomatischen Wahrscheinlichkeitsdefinition von Kolmogoroff?

Vorlesung: Statistik II für Wirtschaftswissenschaft

Bayes-Statistik F F F

Statistik I für Humanund Sozialwissenschaften

Kapitel ML:IV. IV. Statistische Lernverfahren. Wahrscheinlichkeitsrechnung Bayes-Klassifikation Maximum-a-Posteriori-Hypothesen

Statistik und Wahrscheinlichkeitsrechnung

Bitte lesen Sie die folgende Musteraufgabe konzentriert durch. Musteraufgabe I

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Statistik und Wahrscheinlichkeitsrechnung

Transkript:

Bedingte Wahrscheinlichkeit Das Konzept bedingter Wahrscheinlichkeit erlaubt zu untersuchen, inwieweit sich die Wahrscheinlichkeiten für das Eintreten von Ereignissen durch das Eintreten anderer Ereignisse ändern. Entwicklung anhand eines empirischen Beispiels mit 2 Merkmalen und einer sog. 4-Feldertafel Merkmal: heitszustand mit den Ausprägungen g krank oder gesund Merkmal: Testergebnis mit den Ausprägungen Test positiv oder negativ (T+ bzw. T-) Von Interesse ist hier nicht nur die Wahrscheinlichkeit krank zu sein: P sondern insbesondere die Wahrscheinlichkeit krank zu sein, wenn ein positiver Test vorliegt: P(D+ T+) Beispiel zur bedingten Wahrscheinlichkeit Anhand eines Labortests (Digitalis-Konzentration im Blut) kann das Vorliegen einer bestimmten Herz-Krankheit diagnostiziert werden. 1975 wurde dazu folgende Statistik veröffentlicht: T+...positiver Test T- negativer Test D+...Krankheit D- gesund T+ 25 14 39 T- 18 78 96 Total 43 92 135 Statistik für SoziologInnen 1 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 2 Bedingte Wahrscheinlichkeiten Randverteilungen T+ 0,185 0,104 0,289 T- 0,133 0,578 0,711 Randverteilung eteu g( (marginale ag aeverteilung): eteu P = 0,318 P = 0,682 P(T+) = 0,289 P (T-) = 0,711 Die Randverteilung eines Merkmals ergibt sich jeweils durch Summation über alle Ausprägungen des anderen Merkmals. Bedingte Verteilungen T+ 25 14 39 T- 18 78 96 Total 43 92 135 Wir interessieren ess e e uns nun für die Krankheits- wahrscheinlichkeit gegeben der Test ist positiv Bedingte Verteilung: P(D+ T+) = 25/39 = 0,64 P(D+ T+) = P(D+ T+)/P(T+)= 0,185/0,289 = 0,64 P(D- T+) = 14/39 = 1- P(D+ T+) = 0,36 P(D- T+) = P(D- T+)/P(T+)= 0,104/0,289 = 0,36 Statistik für SoziologInnen 3 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 4 Bedingte Wahrscheinlichkeiten Berechnung von bedingten Wahrscheinlichkeiten Bedingte Verteilung gegeben ein negativer Test liegt vor: P(D- T-) = 0,578 / 0,711= 0,813 P(D+ T-) = 0,133 / 0,711= 0,187 T+ 064 0,64 036 0,36 0,289 T- 0,187 0,813 0,711 In obiger Tabelle sind die bedingten Verteilungen des heitszustandes bei Kenntnis des Testergebnisses ausgewiesen (Zeilenprozent). Interpretation von bedingten Wahrscheinlichkeiten Summary Offensichtlich verändert die Kenntnis des Testergebnisses meine Krankheitswahrscheinlichkeiten: P = 0,318 Bei einem positiven Test gilt P(D+ T+) = 25/39 = 0,64 Bei einem negativen Test gilt P(D+ T-) = 18/96 = 0,187 d.h. der Test ist informativ für das Merkmal heitszustand Lesehinweis: P(A B) Wahrscheinlichkeit, dass ein Ereignis A eintritt, gegeben [oder unter der Bedingung], das Ereignis B ist eingetreten Statistik für SoziologInnen 5 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 6 Bedingte Wahrscheinlichkeiten 1

Berechnung von bedingten Wahrscheinlichkeiten Bedingte Verteilung gegeben D+ (Person ist krank) liegt vor: P(T+ D+) = 25 / 43 = 0,581 P(T+ D-) = 14 / 92 = 0,152 P(T- D+) = 18 / 43 = 0,419 P(T- D-) = 78 / 92 = 0,848 T+ 0,581 0,152 0,289 T- 0,419 0,848 0,711 In obiger Tabelle sind die bedingten Verteilungen des Testergebnisses bei Kenntnis des heitszustandes ausgewiesen (Spaltenprozent). 2 Maßzahlen für die Güte von diagnostischen Tests T+ 0,185 0,104 0,289 T- 0,133 0,578 0,711 P = 0,318 P(T+) = 0,289 Sensitivität des Tests P(T+ D+) = 25/43 = 0,185/0,318=0,581 Spezifität des Tests P(T- D-) = 78/92=0,578 / 0,682= 0,848 Statistik für SoziologInnen 7 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 8 Bedingte Wahrscheinlichkeiten Sensitivität Von einem guten diagnostischen Test wünschen wir uns, dass er möglichst viele Kranke erkennt, das heißt, diese durch ein positives Ergebnis anzeigt. Der Anteil unter allen Kranken, die positiv getestet werden, heißt Sensitivität, da er angibt, wie sensibel der Test auf das Vorliegen der Krankheit reagiert. Sensitivität: P(T+ D+) Wahrscheinlichkeit eines positiven Testergebnisses gegeben der Proband ist krank Spezifität Weiters wünschen wir uns, dass der Test möglichst spezifisch ist, also nur auf das Vorliegen der Krankheit anspricht. Jeder nicht Erkrankte, der trotzdem positiv getestet wird, deutet auf einen Mangel an Spezifität [~ P(T+ D-)] hin. Als Spezifität des Tests bezeichnen wir deshalb den Anteil der korrekt negativ Getesteten unter den nicht Erkrankten. Spezifität: P(T- D-) Wahrscheinlichkeit eines negativen Testergebnisses gegeben der Proband ist gesund Statistik für SoziologInnen 9 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 10 Bedingte Wahrscheinlichkeiten Statistische Qualität Durch die beiden Kriterien Spezifität und Sensitivität kann die statistische Qualität eines diagnostischen Tests charakterisiert werden. Wünschenswert ist es, wenn ein Test in beiden Kriterien möglich nahe an 100% herankommt. Leider ede wird ddeses dieses Idealziel e in der Praxis nicht erreicht. Sowohl Kranke als auch e können positiv oder negativ getestet werden. Deshalb kann aus dem Testergebnis nicht sicher, sondern nur mit einer bestimmten Wahrscheinlichkeit auf das Vorliegen der Krankheit geschlossen werden. Prädikativer Wert Von Interesse sind in der Praxis folgende bedingten Wahrscheinlichkeiten: Der positive prädikative Wert oder auch Voraussagewert eines positiven Testergebnisses, gibt die Wahrscheinlichkeit an, krank zu sein, wenn ein positiver Test vorliegt P(D+ T+) Der negative prädikative Wert oder auch Voraussagewert eines negativen Testergebnisses, gibt die Wahrscheinlichkeit an, gesund zu sein, wenn ein negativer Test vorliegt P(D- T-) Statistik für SoziologInnen 11 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 12 Bedingte Wahrscheinlichkeiten 2

Allgemeine Fragestellung Die Anwendung dieser Überlegungen gehen weit über diagnostische Tests in der Medizin hinaus Beispiele: Alkomat Test auf Alkoholisierung Lügendetektoren Automatische Erkennung von Falschgeld Tests auf Kreditwürdigkeit etc. Letztlich bei jeder binären Entscheidung unter Unsicherheit auf der Basis empirischer Evidenz Bedingte Wahrscheinlichkeit Die bedingte Wahrscheinlichkeit eines Ereignisses A unter der Bedingung, dass das Ereignis B eingetreten ist (wobei P(B)>0 sein muss) ist wie folgt definiert: PAB P ( A ( ) B ) = PB ( ) PA ( B) = PAB ( ) PB ( ) Multiplikationssatz für zwei Ereignisse Statistik für SoziologInnen 13 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 14 Bedingte Wahrscheinlichkeiten Visualisierung des Prinzips der bedingten Wahrscheinlichkeiten A P(A B)~P(A*) Durch die Bedingung kommt es zu einer Einschränkung des Ereignisraumes A B A* B B E E*=B Beispiele Für einen männlichen Österreicher gelten folgende Wahrscheinlichkeiten (Sterbetafel 1980/81): P(Alter 70) = 0,59 P(Alter 80) = 0,28 Wie groß ist die Wahrscheinlichkeit, dass ein Mann, der den 70. Geburtstag feiert, auch den 80. Geburtstag feiern kann? P(Alter 80 Alter 70) = P(Alter 80 Alter 70) / P(Alter 70) = P(Alter 80) / P(Alter 70) = 0,28 / 0,59 = 0,47 Es ist evident, dass Berechnungen über Prämien von Lebensversicherungen oder Rentensystemen auf bedingten Wahrscheinlichkeiten basieren müssen! Statistik für SoziologInnen 15 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 16 Bedingte Wahrscheinlichkeiten Berechnung von marginalen Wahrscheinlichkeiten T+ 0,185 0,104 0,289 T- 0,133 0,578 0,711 P(T+) = P(T+ D+) + P(T+ D-) = 0,185 + 0,104 = 0,289 T+ 0,581 0,152 0,289 T- 0,419 0,848 0,711 Durch Summation der gemeinsamen Wahrscheinlichkeiten Durch gewichtete Summation der bedingten Wahrscheinlichkeiten Totale Wahrscheinlichkeit A=(A B) (A B')... Partition von A auf Basis von B P(A) = P(A B) + P(A B') = P(A B). P(B) + P(A B'). P(B') Beantwortung von Wahrscheinlichkeitsaussagen unter Berücksichtigung verschiedener Szenarien P(T+) = P(T+ D+). P + P(T+ D-). P= = 0,581*0,318 + 0,152*0,682= 0,289 Statistik für SoziologInnen 17 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 18 Bedingte Wahrscheinlichkeiten 3

Beispiel zur bedingten Wahrscheinlichkeit Wir verändern die Zahlen des vorigen Beispiels: T+...positiver Test T- negativer Test D+...Krankheit D- gesund T+ 12 8 20 T- 48 32 80 Total 60 40 100 P(T+) = 0,2 P=0,6 P(D+ T+) = 12/20 = 0,6 P(D+ T-) = 48/80 =0,6 P(D+ T+) = 12/100 = 0,12 = P. P(T+) = 0,2*0,6 STOCHASTISCHE UNABHÄNGIGKEIT Statistik für SoziologInnen 19 Bedingte Wahrscheinlichkeiten Stochastische Unabhängigkeit (Beispiel) In diesem Beispiel verändert die Kenntnis des Testergebnisses meine Krankheitswahrscheinlichkeiten nicht: P = 0,60 Bei einem positiven Test gilt P(D+ T+) = 12/20 = 0,60 Bei einem negativen Test gilt P(D+ T-) = 48/80 = 0,60 T+ 060 0,60 040 0,40 020 0,20 T- 0,60 0,40 0,80 Total 0,60 0,40 1,00 Dieser Test ist nicht informativ für das Merkmal heitszustand. Die bedingten Wahrscheinlichkeiten und die marginale Wahrscheinlichkeit sind gleich. Statistik für SoziologInnen 20 Bedingte Wahrscheinlichkeiten Stochastische Unabhängigkeit (Beispiel) Man beachte im Beispiel: P(D+ T+) = 12/100 = 0,12 P(D+ T+) = P. P(T+ D+) = In diesem Fall P. P(T+) = 0,2*0,6 = 0,12 Die gemeinsame Wahrscheinlichkeit ergibt sich im Fall stochastischer Unabhängigkeit einfach aus dem Produkt der marginalen Wahrscheinlichkeiten. Die gemeinsame absolute Häufigkeit ergibt sich im Fall stochastischer Unabhängigkeit aus dem Produkt der marginalen absoluten Häufigkeiten durch die Gesamtzahl der Beobachtungen. Statistik für SoziologInnen 21 Bedingte Wahrscheinlichkeiten Stochastische Unabhängigkeit (Theorie) Zwei Ereignisse A und B heißen stochastisch unabhängig, wenn gilt: P(A B) = P(A). P(B) Korollar: Wenn zwei Ereignisse unabhängig sind gilt: P(A B) = P(A) bzw. P(B A) = P(B). Statistik für SoziologInnen 22 Bedingte Wahrscheinlichkeiten Beispiel: Assoziation von Produktkäufen Information über 2 Produkte (2 univariate Randverteilungen) Produkt A Kauf 700 70% kein Kauf 300 30% 1000 100% Kauf 600 60% kein Kauf 400 40% 1000 100% Statistik für SoziologInnen 23 Bedingte Wahrscheinlichkeiten Szenario: Keine Assoziation zwischen den Produkten Gesamt Kauf 420 280 700 kein Kauf 180 120 300 Kauf 42% 28% 70% kein Kauf 18% 12% 30% Bei Unabhängigkeit ergeben sich die gemeinsamen Wahrscheinlichkeiten aus dem Produkt der Randverteilungen! Statistik für SoziologInnen 24 Bedingte Wahrscheinlichkeiten 4

Szenario: Keine Assoziation zwischen den Produkten Gesamt Kauf 420 280 700 kein Kauf 180 120 300 Szenario: Positive Assoziation zwischen den Produkten Kauf 550 150 700 kein Kauf 50 250 300 Kauf 60% 40% 100% kein Kauf 60% 40% 100% P(Kauf von B Kauf von A) = 420/700 = 0,60 P(Kauf von B kein Kauf von A) = 180/300 = 0,60 Statistik für SoziologInnen 25 Bedingte Wahrscheinlichkeiten Kauf 79% 21% 100% kein Kauf 17% 83% 100% P(Kauf von B Kauf von A) = 550/700 = 0,79 P(Kauf von B kein Kauf von A) = 50/300 = 0,17 Statistik für SoziologInnen 26 Bedingte Wahrscheinlichkeiten Szenario: Negative Assoziation zwischen den Produkten Kauf 360 340 700 kein Kauf 240 60 300 Szenario: Maximale Positive Assoziation zwischen den Produkten Kauf 600 100 700 kein Kauf 0 300 300 Kauf 51% 49% 100% kein Kauf 80% 20% 100% P(Kauf von B Kauf von A) = 360/700 = 0,51 P(Kauf von B kein Kauf von A) = 240/300 = 0,80 Statistik für SoziologInnen 27 Bedingte Wahrscheinlichkeiten Kauf 86% 14% 100% kein Kauf 0% 100% 100% Statistik für SoziologInnen 28 Bedingte Wahrscheinlichkeiten Szenario: Maximale Negative Assoziation zwischen den Produkten Kauf 300 400 700 kein Kauf 300 0 300 Kauf 43% 57% 100% kein Kauf 100% 0% 100% Maßzahlen der Assoziation Wir betrachten 2 binäre Merkmale A (A1, A2) B (B1, B2) B1 B2 A1 a b a+b A2 c d c+d a+c b+d N Kreuzproduktverhältnis (cross product ratio) cpr = a*d/b*c Wertebereich: 0 bis + Assoziationskoeffizient nach Yule: Q=(cpr-1)/(cpr+1) Wertebereich: -1 bis +1 Statistik für SoziologInnen 29 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 30 Bedingte Wahrscheinlichkeiten 5

Szenario: Keine Assoziation zwischen den Produkten Gesamt Kauf 420 280 700 kein Kauf 180 120 300 Szenario: Positive Assoziation zwischen den Produkten Kauf 550 150 700 kein Kauf 50 250 300 Kauf 60% 40% 100% kein Kauf 60% 40% 100% Kauf 79% 21% 100% kein Kauf 17% 83% 100% cpr=420*120/280*180=1 Q=0 cpr=250*550/150*50=18,33 Q=0,90 Statistik für SoziologInnen 31 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 32 Bedingte Wahrscheinlichkeiten Szenario: Negative Assoziation zwischen den Produkten Kauf 360 340 700 kein Kauf 240 60 300 Szenario: Maximale Positive Assoziation zwischen den Produkten Kauf 600 100 700 kein Kauf 0 300 300 Kauf 51% 49% 100% kein Kauf 80% 20% 100% Kauf 86% 14% 100% kein Kauf 0% 100% 100% cpr=360*60/340*240=0,26 Q=-0,58 cpr=600*300/0*100=+ Q=1 Statistik für SoziologInnen 33 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 34 Bedingte Wahrscheinlichkeiten Szenario: Maximale Negative Assoziation zwischen den Produkten Kauf 300 400 700 kein Kauf 300 0 300 Kauf 43% 57% 100% kein Kauf 100% 0% 100% cpr=300*0/300*400= 0 Q=-1 Zur Interpretation der Cross Product Ratio Das Verhältnis von Chance zu Gegenchance nennt man odds odds:= p/(1-p) z.b. Würfelwurf odds(für einen 6er)=(1/6)/(5/6)=1/5 Man spricht auch die Chancen stehen 1 zu 5 Reziprokwert der Odds ist jene Auszahlung, die zu einer fairen Wette führt Die Cross Product Ratio ist das Verhältnis der odds (odds-ratio) für zwei unterschiedliche Bedingungen Statistik für SoziologInnen 35 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 36 Bedingte Wahrscheinlichkeiten 6

Zur Interpretation der Cross Product Ratio T+ 0,64 0,36 0,289 T- 0,187 0,813 0,711 odds(d+ T+) = 0,64/0,36 = 1,78 odds(d+ T-) = 0,187/0,813= 0,23 odds-ratio = 1,78/0,23 = 7,74 Das relative Risiko einer Erkrankung ist bei Vorliegen eines positiven Testbefundes 7,7 mal so hoch wie bei Vorliegen eines negativen Testbefundes. (25*78)/(14*18)=7,7 Beispiel Aus der Statistik einer Versicherung ist bekannt, dass 10% aller Personen in einem Jahr einen Unfall erleiden. Diskutiere die Wahrscheinlichkeit, dass eine Person in einem Intervall von 2 Jahren unfallfrei ist! Jahr2 Jahr2 Jahr2 Jahr1 Unfall kein Unfall Jahr1 Unfall kein Unfall Jahr1 Unfall kein Unfall Unfall 1 9 10 Unfall 10 0 10 Unfall 0 10 10 kein Unfall 9 81 90 kein Unfall 0 90 90 kein Unfall 10 80 90 10 90 100 10 90 100 10 90 100 Uanbhängigkeit Pechvogel Aus Schaden klug Statistik für SoziologInnen 37 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 38 Bedingte Wahrscheinlichkeiten Beispiele In einer Kleinstadt sind folgende Daten bekannt: Wahrscheinlichkeit, dass ein zufällig ausgewählter Bürger ein Sparbuch besitzt = 0,75. P(S) = 0,75 Wahrscheinlichkeit, dass ein zufällig ausgewählter Bürger Aktien besitzt = 0,25. P(A) = 0,25 Wahrscheinlichkeit, dass ein zufällig ausgewählter Bürger Vermögen hat (Besitz eines Sparbuchs oder von Aktien) = 0,775. P(A S) = 0,775 Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Bürger sowohl Aktien als auch ein Sparbuch besitzt? P(A S) = P(A) + P(S) - P(A S) = 0,25 + 0,75-0,775 = 0,225 Beispiele Sind die Ereignisse Besitz eines Sparbuchs und Besitz von Aktien stochastisch unabhängig? P(A S) =?= P(A). P(S) 0,225 0,75*0,25 ==> Die Ereignisse A und S sind nicht unabhängig Wie groß ist die Wahrscheinlichkeit, dass ein Aktienbesitzer (bzw. ein Nicht-Aktienbesitzer) ein Sparbuch hat? P(S A) = P(S A) / P(A) = 0,225 / 0,25 = 0,9 P(S A') = P(S A') / P(A') = 0,525 / 0,75 = 0,7 P(S A') = P(S) - P(S A) = 0,75-0,225=0,525 Statistik für SoziologInnen 39 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 40 Bedingte Wahrscheinlichkeiten Beispiel: Unabhängige Ereignisse In einem Flugzeug gibt es 2 von einander unabhängige automatische Navigationssysteme A und B. Die Verfügbarkeit für das System A sei 0,99 und für B 0,96. Wie groß ist die Wahrscheinlichkeit, dass der Pilot zu einer manuellen Navigation greifen muss? A... System A funktioniert P(A) = 0,99 B... System B funktioniert P(B) = 0,96 P(A ist defekt) = P(A') = 1-0,99 = 0,01 P(B ist defekt) = P(B') = 1-0,96 = 0,04 P(beide Systeme defekt) = P(A' B') = = 0,01 x 0,04 = 0,0004 Beispiel: Unabhängige Ereignisse Eine Expertenkommission besteht aus 3 Experten A, B, C. Jeder Experte hat eine individuelle Irrtumswahrscheinlichkeit, die wie folgt gegeben ist: P(A irrt) = P(A) = 0,10 P(B irrt) = P(B) = 0,15 P(C irrt) = P(C) = 0,12 Wie groß ist die Wahrscheinlichkeit, dass die Meinung der Mehrheit korrekt ist, wenn die 3 Experten voneinander unabhängig urteilen? P(Mehrheit irrt nicht) = P(A' B' C) + P(A' B C') + P(A B' C') + P(A' B' C') = 0,9 x 0,85 x 0,12 + 0,9 x 0,15 x 0,88 + 0,1 x 0,85 x 0,88 + 0,9 x 0,85 x 0,88 = 0,0918 + 0,1188 + 0,0748 + 0,6732 = 0,9586 Statistik für SoziologInnen 41 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 42 Bedingte Wahrscheinlichkeiten 7

Beispiel: Totale Wahrscheinlichkeit In einer Population mit gleichen Anteilen von Männern und Frauen wurde festgestellt, dass 5% der Männer und 1% der Frauen farbenblind sind. Wie groß ist die Wahrscheinlichkeit, dass eine beliebige Person farbenblind ist? Notation: F...farbenblind N...normalsichtig M...männlich W...weiblich P(F) = P(F M).P(M) + P(F W).P(W)= = 0,05*0,5 + 0,01*0,5=0,03 Beispiel: Theorem von Bayes Daten zur Farbenblindheit a priori Wahrscheinlichkeiten M 0,5 W 0,5 Gesamt 1 Wie verändern sich diese Wahrscheinlichkeiten, gegeben die Person ist farbenblind? Statistik für SoziologInnen 43 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 44 Bedingte Wahrscheinlichkeiten Beispiel: Bedingte Wahrscheinlichkeit Fiktive Population von 1000 Personen: Beispiel: Bedingte Wahrscheinlichkeit Wahrscheinlichkeitstabelle: F N Gesamt F N Gesamt M 25 475 500 W 5 495 500 Gesamt 30 970 1000 M 0,025 M F 0,475 M N 0,500 M W 0005 0,005 0495 0,495 0500 0,500 W F M N W Gesamt 0,030 0,970 1,000 F N Daraus lassen sich folgende Wahrscheinlichkeiten ableiten: P(M F) = P(M F)/P(F) = 25/30 = 0.025/0.03 = 5/6 P(W F) = P(W F)/P(F) = 5/30 = 0.005/0.03 = 1/6 Statistik für SoziologInnen 45 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 46 Bedingte Wahrscheinlichkeiten Theorem von Bayes PB ( A) PA ( B) PAB ( ) PB ( ) PBA ( ) = = = PA ( ) PA ( ) PA ( ) PAB ( ) PB ( ) PBA ( ) = P ( A ) PAB ( ) PB ( ) PBA ( ) = PAB ( ) PB ( ) + PAB ( ') PB ( ') Beispiel: Theorem von Bayes P(M F) = P(F M) x P(M) / P(F) P(F) = P(F M) x P(M) + P(F W) x P(W) = = 0,05 x 0,5 + 0,01 x 0,5 = 0,03 Satz von der totalen Wahrscheinlichkeit P(M F) = 0,05 x 0,5 / 0,03 = 5/6 = 0,833 P(W F) = 1 - P(M F) = 1-5/6 = 1/6 = 0,167 P(M N) = P(N M) x P(M) / P(N) = 0,95 x 0,5 / 0,97 = 0,49 P(W N) = 1- P(M N) = 0,51 Man beachte den unterschiedlichen Informationsgehalt von F/N in bezug auf M/W Statistik für SoziologInnen 47 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 48 Bedingte Wahrscheinlichkeiten 8

Beispiel: Theorem von Bayes Zusammenfassung der Daten zur Farbenblindheit a priori Wahrscheinlichkeiten Posterior gegeben Farbenblind Posterior gegeben Normalsichtig M 0,5 0,833 0,49 W 0,5 0,167 0,51 1 1 1 Beispiel: Theorem von Bayes P(D+ T+) = P(T+ D+) x P / P(T+) P(T+) = 39/135 = 0,289 P(T+ D+) = 25/43 =0,581 P = 43/135 = 0,318 P(D+ T+) = 0,581 x 0,318 / 0,289 = 0,64 Daten: T+ 25 14 39 T- 18 78 96 Total 43 92 135 Statistik für SoziologInnen 49 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 50 Bedingte Wahrscheinlichkeiten Beispiel: Theorem von Bayes Zusammenfassung der Daten a priori Wahrscheinlichkeiten Posterior gegeben positiver Test Posterior gegeben negativer Test D+ 0,318 0,640 0,187 D- 0,682 0,360 0,848 1 1 1 Beispiel: Mammography Die Daten stammen aus Kerlinowske et al. 1996, JAMA Likelihood Ratios for Modern Screening Mammography -Risk of Breast Cancer Based on Age and Mammographic Interpretation Die Wahrscheinlichkeit, dass eine symptomfreie Frau im Alter von 55 Jahren hat, beträgt 0,6% (d.h. die Prävalenz = P = 0,006) Statistik für SoziologInnen 51 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 52 Bedingte Wahrscheinlichkeiten Beispiel Wenn eine symptomfreie Frau im Alter von 55 Jahren hat, dann beträgt die Wahrscheinlichkeit, dass sie einen positiven Mammografie-Befund P(T+) erhält, 94 Prozent. Sensitivität des Tests = 0,94 Wenn eine dieser Frauen jedoch keinen hat, dann beträgt die Wahrscheinlichkeit, dass sie dennoch einen positiven Mammografie-Befund erhält nur 7 Prozent. Spezifität des Tests = 0,93 Zentrale Frage Eine 55-jährige Frau, ohne einschlägige Symptome, ist dem Rat ihres Arztes gefolgt, im Rahmen der früherkennung jedes Jahr eine Mammografie durchführen zu lassen. Bei einer solchen Untersuchung erhält sie einen positiven Befund. Schockiert über das Ergebnis, fragt sie ihren Arzt: «Heißt das, ich habe?» «Nein, das kann man noch nicht sicher sagen.» «Wie hoch ist die Wahrscheinlichkeit, dass ich tatsächlich habe?» Statistik für SoziologInnen 53 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 54 Bedingte Wahrscheinlichkeiten 9

Beispiel Ihre Schätzung für die korrekte Wahrscheinlichkeit, dass die Patientin mit einer positiven Mammographie tatsächlich hat, lautet Schema der Diagnostik A priori Wahrscheinlichkeit einer Erkrankung (Prävalenz) Diagnostischer Test P(T- D-) Spezifität P(T+ D+) Sensitivität Posteriore Wahrscheinlichkeit einer Erkrankung, _ % Falls Test positiv ist P(D+ T+) =??? Falls Test negativ ist P(D- T-) =??? Statistik für SoziologInnen 55 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 56 Bedingte Wahrscheinlichkeiten Beispiel Welche korrekte statistische Angabe kann der Arzt der Patientin geben? Prävalenz = P = 0,006 Sensitivität des Tests P(T+ D+) = 0,94 Spezifität des Tests bzw. 1-Spez P(T- D-) = 0,93 bzw. P(T+ D-) = 0,07 P(D+ T+) =??? Theorem von Bayes a priori Wahrscheinlichkeit Theorem von Bayes posteriore Wahrscheinlichkeit PT ( + D + ) PD ( + ) P( D+ T+ ) = PT ( + ) P( T+ ) = P( T+ D+ ) P( D+ ) + P( T+ D ) P( D ) Sens Pr äv PD ( + T+ ) = Sens Pr äv + (1 Spez) (1 Pr äv) Statistik für SoziologInnen 57 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 58 Bedingte Wahrscheinlichkeiten Anwendung des Bayes Theorem P(T+) = P(T+ D+)*P + P(T+ D-)*P= = 0,94*0,006 + 0,07*0,994 =0,07522 P(D+ T+) = P(T+ D+)*P/P(T+)= = 0,94*0,006/0,07522=0,07498 Die Wahrscheinlichkeit, dass die Patientin mit einer positiven Mammographie tatsächlich hat, beträgt 7,5% In einer amerikanischen Studie lagen 95 von 100 befragten Ärzten in ihrer Schätzung zwischen 70% und 80%. Formulierung in absoluten Zahlen 100.000 10.000 Statistik für SoziologInnen 59 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 60 Bedingte Wahrscheinlichkeiten 10

Formulierung in absoluten Zahlen Formulierung in absoluten Zahlen 564 94,0% <=== Sensitivität 600 99.400 100.000 600 99.400 100.000 0,6% <=== Prävalenz Statistik für SoziologInnen 61 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 62 Bedingte Wahrscheinlichkeiten Formulierung in absoluten Zahlen Formulierung in absoluten Zahlen 564 6.958 7,0% <=== 1 minus Spezifität 564 6.958 36 36 92.442 93,0% <=== Spezifität 600 99.400 100.000 600 99.400 100.000 Statistik für SoziologInnen 63 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 64 Bedingte Wahrscheinlichkeiten Formulierung in absoluten Zahlen Formulierung in absoluten Zahlen 564 6.958 7.522 564 6.958 7.522 36 92.442 92.478 36 92.442 92.478 600 99.400 100.000 600 99.400 100.000 564/7.522= 7,5% Statistik für SoziologInnen 65 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 66 Bedingte Wahrscheinlichkeiten 11

Prävalenzabhängigkeit von Tests Ein ELISA zum Test auf HIV-Antikörper besitze 99.99% Sensitivität und 98% Spezifität. Wir setzen diesen Test nun in zwei Situationen ein. In Population A ( Normalpopulation ) liege die Prävalenz bei 0.01%. Population B ( Risiko-Population ) habe eine Prävalenz von 5%. In beiden Fällen wollen wir wissen, wie sicher wir bei einem positiven Test sein können, dass der Proband tatsächlich HIV-positiv ist. Ergebnis bei A: P(D+ T+) =0,5% Ergebnis bei B: P(D+ T+) =72% Lügendetektoren und das Theorem von Bayes Gastwirth(1978): +...Test ergibt Person lügt -... Test zeigt an Person lügt nicht L... Person lügt in Wirklichkeit W... Person spricht die Wahrheit P(+ L) = 0,88 P(- L) = 0,12 P(- W) = 0,86 P(+ W) = 0,14 a) Routinetest bei Personalselektion P(W) = 0,99 P(L) = 0,01 P(+) = P(+ W)P(W) + P(+ L)P(L) =0,14*0,99+0,88*0,01=0,1474 P(L +) = P(+ L)P(L)/P(+) = 0,88*0,01/0,1474=0,0597 P(W +) = P(+ W)*P(W)/P(+) = 0,14*0,99/0,1474=0,9403 P(W -) = P(- W)*P(W)/P(-) = 0,86*0,99/0,853=0,998 P(L -) = 1 - P(W -) = 0,002 Statistik für SoziologInnen 67 Bedingte Wahrscheinlichkeiten Statistik für SoziologInnen 68 Bedingte Wahrscheinlichkeiten Lügendetektoren und das Theorem von Bayes b) Verändern der subjektiven Wahrscheinlichkeit b1) P(W) = 0,50 P(L) = 0,50 P(+) = P(+ W)P(W) + P(+ L)P(L) =0,14*0,5+0,88*0,5=0,51 P(L +) = P(+ L)P(L)/P(+) = 0,88*0,5/0,51 = 0,863 P(W +) = P(+ W)*P(W)/P(+) = 0,14*0,5/0,51 = 0,137 P(L -) = P(- L)P(L)/P(-) = 0,12*0,5/0,49 = 0,122 P(W -)= 1- P(L -) = 0,878 b2) P(W) = 0,20 P(L) = 0,80 P(+) = P(+ W)P(W) + P(+ L)P(L) =0,14*0,5+0,88*0,5=0,732 P(L +) = P(+ L)P(L)/P(+) = 0,88*0,8/0,732 = 0,96 P(W +) = P(+ W)*P(W)/P(+) = 0,14*0,2/0,732 = 0,04 P(L -) = P(- L)P(L)/P(-) = 0,12*0,8/0,268 = 0,36 P(W -)= 1- P(L -) = 0,64 Statistik für SoziologInnen 69 Bedingte Wahrscheinlichkeiten 12