PU Dipl.-Kfm. Jörg Petermann Unternehmenberatung Benutzerhinweie für den PU Bae-Korrektor V1.0 Trier, 20. Juli 2007
1 Bae' Theorem Die Wahrcheinlichkeitrechnung hält immer wieder Überrachungen bereit. Eine davon hat Thoma Bae (Engl. Mathematiker, ca. 1702 1761) bechrieben. Sein Theorem getattet, zunächt angenommene Wahrcheinlichkeiten im Licht einer neuen Information zu revidieren. Angenommen, ich habe eine Annahme (oder ogar da Wien) um da Auftreten eine betimmten Ereignie. So ei die Wahrcheinlichkeit p (von probabilit), daß jemand AIDS habe in Deutchland p(aids-infiziert) = 49.000 [Infizierte] / 82.000.000 [Bürger] = 0,000 597 561. Die Wahrcheinlichkeit, daß ein willkürlich augewählter Bürger AIDS hat, beträgt demnach alo ca. p(aids-infiziert) = 0,06%. Da ich diee Wahrcheinlichkeit im Vorhinein kenne, nennt man ie Apriori- Wahrcheinlichkeit. (Korrekt eigentlich a priori von lat. vom früheren her ). Entcheidungtheoretich bechreibt diee Apriori-Wahrcheinlichkeit einen Umweltzutand. In der Entcheidungtheorie werden Umweltzutände mit für Szenario benannt. Wir können alo agen: p(1) [Bürger AIDS-infiziert] = 0,000 597 561 p(2) [Bürger nicht AIDS-infiziert] = 1 0,000 597 561 = 0,999 402 439 Nun chicken wir einen willkürlich augewählten Bürger zum AIDS-Tet. Er hat keinen Grund anzunehmen, daß die Wahrcheinlichkeit, daß er AIDS hätte, für ihn geteigert wäre, etwa weil er gebrauchte Spritzen benutzt hätte o.ä. Wir fragen den Arzt, der den Tet machen oll, wie zuverläig dieer Tet ei. Dieer agt: Unter all jenen, die AIDS haben, chlägt der Tet bei 99,5% aller unteruchten poitiv an. Folglich werden 0,5% der AIDS-infizierten durch dieen Tet nicht entdeckt. Außerdem habe der Tet eine gewie Irrtumwahrcheinlichkeit: Unter den NICHT mit AIDS infizierten werden 1% irrtümlich al poitiv augewieen. Die retlichen 99% würden dagegen korrekt al negativ diagnotiziert. Die Beobachtung, die wir machen, wollen wir mit bechreiben. Wir können agen:
1: Der Tet it poitiv 2: Der Tet it negativ Au der Bechreibung de Arzte können wir folgende Wahrcheinlichkeiten formulieren: p ( Tet poitiv unter der Bedingung AIDS-infiziert ) = 99,5% p ( Tet negativ unter der Bedingung AIDS-infiziert ) = 0,5% p ( Tet poitiv unter der Bedingung NICHT AIDS-infiziert ) = 1% p ( Tet negativ unter der Bedingung NICHT AIDS-infiziert ) = 99% Mathematich: (Der Strich liet ich unter der Bedingung ) p(1 1) = 0,995 p(2 1) = 0,005 p(1 2) = 0,01 p(2 2) = 0,99 Al Matrix: 1: Tet poitiv 2: Tet negativ Summe 1: AIDS-infiziert (p = 0,06%) 99,5% 0,5% 100% 2: NICHT AIDS-infiziert (p = 99,94%) 1% 99% 100% Al Entcheidungbaum: 1: Tet poitiv p = 0,995 AIDS-infiziert UND T et poitiv p = 0,000 595 01 1: AIDS-infiziert p = 0,000 598 2: Tet negativ p = 0,005 AIDS-infiziert UND T et negativ p = 0,000 002 99 2: NICHT AIDS-infiziert p = 0,999 402 1: Tet poitiv p = 0,01 NICHT AIDS-infiziert UND T et poitiv p = 0,009 994 02 2: Tet negativ p = 0,99 NICHT AIDS-infiziert UND T et negativ p = 0,989 407 98
Der Tet de von un willkürlich augewählten Bürger it poitiv! Dieer gerät ofort in Panik. Mit 99,5% Wahrcheinlichkeit habe ich AIDS! Da it ja o gut wie icher! Ganz ruhig, agen Sie. Schließlich haben ie den Bae-Korrektor. Wo teckt der Fehler de Bürger? Er hat ich von der Trefficherheit de Tet beeindrucken laen, ohne die Apriori- Wahrcheinlichkeit zu bedenken. Denn die Vorauetzung dafür, daß der Wert von 99,5% timmt it (wie man im Entcheidungbaum ieht), daß der Bürger bereit definitiv mit AIDS infiziert it. Aber genau da wien wir ja noch gar nicht. Und die Wahrcheinlichkeit dafür it mit < 0,06% ehr gering. Un intereiert etwa völlig andere: Nicht: Wie hoch it die Wahrcheinlichkeit, daß der Tet poitiv it, wenn jemand AIDS hat, Sondern genau umgekehrt: Wie hoch it die Wahrcheinlichkeit, daß jemand AIDS hat, wenn der Tet poitiv it. Dazu müen wir wien, wie hoch überhaupt die Wahrcheinlichkeit it, daß der Tet poitiv aufällt. Die entpricht der Summe der gemeinamen Wahrcheinlichkeiten für alle Fälle, in denen der Tet poitiv it, egal ob zutreffend oder nicht. Zwei Fälle kommen in Frage: Tet poitiv UND AIDS-infiziert p = 0,000 595 01 + Tet poitiv UND NICHT AIDS-infiziert p = 0,009 994 02 = Tet poitiv p = 0,010 589 03 Um nun zu ermitteln, wie groß die Wahrcheinlichkeit dafür it, daß uner Bürger tatächlich AIDS-infiziert it, müen wir die Wahrcheinlichkeit für da Szenario: Tet poitiv UND AIDS-infiziert durch die Summe der Wahrcheinlichkeiten dafür teilen, daß der Tet poitiv aufällt, alo: Tet poitiv UND AIDS-infiziert p = 0,000 595 01 / Tet poitiv (.o.) p = 0,010 589 03 = p (AIDS-infiziert Tet poitiv) p = 0,056 191 17
Wir können den Bürger alo beruhigen. Die Wahrcheinlichkeit, daß er tatächlich AIDSinfiziert it, liegt deutlich unter 6%. Überprüfen Sie e mit dem Bae-Korrektor! p( Tet poitiv AIDS-infiziert ) = 0,995 p( AIDS-infiziert Tet poitiv ) = 0,000597 p( AIDS-infiziert ) = 0,0006 p( NICHT Tet poitiv AIDS-infiziert ) = 0,005 p( AIDS-infiziert NICHT Tet poitiv ) = 0,000003 p( Tet poitiv NICHT AIDS-infiziert ) = 0,01 p( NICHT AIDS-infiziert Tet poitiv ) = 0,009994 p( NICHT AIDS-infiziert ) = 0,9994 p( NICHT Tet poitiv NICHT AIDS-infiziert ) = 0,99 p( NICHT AIDS-infiziert NICHT Tet poitiv ) = 0,989406 Aprioriwahrcheinlichkeit Likelihood Gemeiname Wahrcheinlichkeiten p( AIDS-infiziert Tet poitiv ) = 0,056 p( AIDS-infiziert Tet poitiv ) = 0,000597 p( Tet poitiv ) = 0,010591 p( NICHT AIDS-infiziert Tet poitiv ) = 0,944 p( NICHT AIDS-infiziert Tet poitiv ) = 0,009994 p( AIDS-infiziert NICHT Tet poitiv ) = 0 p( AIDS-infiziert NICHT Tet poitiv ) = 0,000003 p( NICHT Tet poitiv ) = 0,989409 p( NICHT AIDS-infiziert NICHT Tet poitiv ) = 1 p( NICHT AIDS-infiziert NICHT Tet poitiv ) = 0,989406 Wahrcheinlichkeit der Beobachtung Apoterioriwahrcheinlichkeit Gemeiname Wahrcheinlichkeiten 2 Mathematiche Seien die Apriori-Wahrcheinlichkeiten p( i ) für mehrere Umweltzutände S bekannt. Erhalten wir nun eine Information Y. E eien ferner die bedingten Wahrcheinlichkeiten ( Likelihood ) für da Beobachten von j bekannt, wenn der Umweltzutand i der wahre Umweltzutand it, p( j i ). Dann laen ich die gemeinamen Wahrcheinlichkeiten errechnen au: p( j i ) = p( i ) * p( j i ) Durch Diviion der gemeinamen Wahrcheinlichkeit p( j i ) durch die Wahrcheinlichkeit de Auftreten von j können wir p( i j ) ermitteln. p( j i ) / p( j ) = p( i j ) p( j ) ergibt ich au der Summe aller Fälle, in denen j beobachtet wird, p( j ) = i p( j i ). p i j = p i j = p p i j i i p i p j i i i
3 Weitere Anwendungfälle 3.1 Lügendetektor Der Täter T wird verdächtigt, ein Verbrechen begangen zu haben. Die Apriori- Wahrcheinlichkeit, daß er e war, chätzt der ermittelnde Beamte auf 0,7 (=70%). Nun wird ein Lügendetektor-Tet durchgeführt. E gelten die Likelihood: p(tet poitiv Schuldig) = 0,9 p(tet poitiv Unchuldig) = 0,2 p(tet negativ Schuldig) = 0,1 p(tet negativ Unchuldig) = 0,8 Die Wahrcheinlichkeit, daß er chuldig it, wenn der Tet poitiv anchlägt, beträgt 91,3%.