Martin-Luther-Universität Halle-Wittenberg - Institut für Soziologie - Dr. Wolfgang Langer 1 Übungsblätter zu Methoden der Empirischen Sozialforschung III: Inferenzstatistik Lösungsblatt zu Nr. 1 1. Die richtigen Lösungen finden Sie auf Seite 30 des Grundkurses Statistik für Historiker Teil II von Herrn Prof. Thome. 2. a) Beim russischen Roulette besteht das Zufallsexperiment darin, daß der tödliche Ausgang, sprich das Auslösen des Schusses, nicht exakt voraussehbar ist. Hat man die 6er-Trommel, in der sich nur eine Patrone befindet, gedreht, so beträgt die Wahrscheinlichkeit, daß unser günstiges Ereignis eintritt, 1 zu 6. Hingegen beläuft sich die Wahrscheinlichkeit für das Komplement Kein Schuß auf 5 zu 6. b) Mit Hilfe des allgemeinen Multiplikationssatzes für beliebige (nicht-disjunkte) Ereignisse hätte <<Sahne>> die Wahrscheinlichkeit berechnen können, drei Versuche ohne weiteres Drehen der Trommel zu überleben. Hierbei ist zu beachten, daß mit jedem Versuch sich die Gesamtzahl der Ereignisse um eines reduziert. Überlebenswahrscheinlichkeit bei drei aufeinander folgenden Versuchen ohne Drehen der Trommel: 1.Versuch: P(A) g n 5 6 2.Versuch: P(B) g n 4 5 3.Versuch: P(C) g n 3 4 Anwendung des allgemeinen Multiplikationssatzes: P(A B C) P(A) P(B A) P(C A B) 5 6 4 5 3 4 60 120 1 2 Für <<Sahne>> hätte die Wahrscheinlichkeit, alle drei Versuche zu überleben, 1 zu 2 betragen.
Martin-Luther-Universität Halle-Wittenberg - Institut für Soziologie - Dr. Wolfgang Langer 2 3. Um diese Aufgabe richtig lösen zu können, muß man davon ausgehen, daß die Befragung unter der gesamten Wohnbevölkerung der Stadt durchgeführt werden soll. a) Wie groß ist die Wahrscheinlichkeit für einen Bürger kein Verkehrsmittels der Gesellschaft U zu benutzen? P(U) 1 P(U) 1 0,40 0,60 Die Wahrscheinlichkeit, kein Verkehrsmittel von U zu benutzen, beträgt 60 Prozent. b) Wie groß ist die Wahrscheinlichkeit, daß ein Bürger ein Verkehrmittel der Gesellschaften S oder T benutzt? Diese Aufgabe läßt sich mit Hilfe des allgemeinen Additionssatzes für nichtdisjunkte Ereignisse lösen: P(S T) P(S) P(T) P(S T) 0,30 0,15 0,05 0,40 Die gesuchte Wahrscheinlichkeit beträgt 40 %. c) Wie groß ist die Wahrscheinlichkeit, als Bürger dieser Stadt kein Verkehrsmittel der drei Gesellschaften zu benutzen? Die Wahrscheinlichkeit kein Verkehrsmittel der drei Gesellschaften zu benutzen stellt das Komplement der Wahrscheinlichkeit dar, ein Verkehrsmittel der drei Gesellschaften zu benutzen. Daher müssen wir zunächst die Wahrscheinlichkeit bestimmen, daß er / sie ein Verkehrsmittel der drei Gesellschaften benutzt. Anschließend können wir dann das entsprechende Komplement bilden. 1) P(U S T) P(U) P(S) P(T) P(U S) P(U T) P(S T) P(U S T) 0,40 0,30 0,15 0,08 0,02 0,05 0,01 0,71 2) P(U S T) 1 P(U S T) 1 0,71 0,29 Die gesuchte Wahrscheinlichkeit beträgt 29 %.
Martin-Luther-Universität Halle-Wittenberg - Institut für Soziologie - Dr. Wolfgang Langer 3 d) Wie groß ist die Wahrscheinlichkeit eines Bürgers, Verkehrsmittel höchstens von zwei der drei Gesellschaften zu benutzen? Wir müssen zur Lösung dieser Aufgabe vier logische Fälle voneinander unterscheiden: 1, Jemand benutzt kein Verkehrsmittel der drei Gesellschaften. 2. Jemand fährt nur mit einer Verkehrsgesellschaft. 3. Jemand benutzt die Verkehrsmittel zweier Gesellschaften. 4. Jemand benutzt die Verkehrsmittel aller drei Gesellschaften. Nach der obigen Aufgabenformulierung müssen wir die Wahrscheinlichkeit berechnen, daß jemand mit keiner oder nur mit einer oder nur mit zwei Gesellschaften fährt. Wir können uns den Lösung sehr vereinfachen, wenn wir daran denken, daß dies das Komplement zum vierten logischen Fall darstellt. P(U S T) 1 P(U S T) 1 0,01 0,99 Die gesuchte Wahrscheinlichkeit beträgt 99 %. e) Wie groß ist die Wahrscheinlichkeit, zwei und mehr Verkehrsgesellschaften zu benutzen? Wir unterscheiden zwei logische Fälle: 1. Die Wahrscheinlichkeit nur zwei Gesellschaften zu benutzen. 2. Die Wahrscheinlichkeit nur alle drei Gesellschaften zu benutzen. 1. Fall: Benutzung zweier Gesellschaften ohne die jeweils dritte: a) P(U S \ U S T) 0,08 0,01 0,07 b) P(U T \ U S T) 0,02 0,01 0,01 c) P(S T \ U S T) 0,05 0,01 0,04 P((U S \ U S T) (U T \ U S T) (S T \ U S T )) 0,07 0,01 0,04 0,12 2. Fall; Benutzung dreier Gesellschaften: P(U S T) 0,01 1. Fall und 2. Fall: P((U S \ U S T) (U T \ U S T) (S T \ U S T) (U S T)) 0,12 0,01 0,13
Martin-Luther-Universität Halle-Wittenberg - Institut für Soziologie - Dr. Wolfgang Langer 4 Die gesuchte Wahrscheinlichkeit beträgt 13 %. 4. Zur Lösung dieser Aufgabe benötigen wir eine Entscheidungstabelle, in der wir die gekannten und gesuchten Wahrscheinlichkeiten eintragen können: Entscheidungstabelle zur Lösung von Aufgabe 4: Nicht krank ( K) Krank (K) Randverteilung für Diagnose Diagnose negativ (D) P( D K) 0,99 P( D K) 0,10 P( D) =? Diagnose positiv (D) P(D K) 0,01 P(K D)=? P(D K) 0,90 P(D) Randverteilung für Erkrankung P( K) 0,90 P(K) 0,10 a) Wie groß ist die Wahrscheinlichkeit, daß ein Patient insgesamt als gesund eingestuft wird? Lösungsweg: Satz der totalen, vollständigen Wahrscheinlichkeit nach Bayes P(D) P(D K) P(K) P(D K) P(K) 0,990,90 0,100,10 0,901 Die Wahrscheinlichkeit insgesamt als gesund eingestuft zu werden, beträgt 90,1 %. b) Wie groß ist die Wahrscheinlichkeit, daß jemand nicht krank ist, obwohl als positiv eingestuft / diagnostiziert wurde? Lösungsweg: Bayesche Satz für a posteriori Wahrscheinlichkeiten: Gesucht: P(K D) P(K D) P(D K) P(K) P(D K) P(K) P(D K) P(K) P(D K) P(K) P(D) 0,01 0,90 0,01 0,90 0,90 0,10 0,009 0,009 0,09 0,091
Martin-Luther-Universität Halle-Wittenberg - Institut für Soziologie - Dr. Wolfgang Langer 5 Die Wahrscheinlichkeit fälschlicherweise eine positive Diagnose zu stellen (.- Fehler) beträgt 9,1 %. e) Wie groß ist die Wahrscheinlichkeit, eine richtige Diagnose zu stellen? Gesucht wird eine zweielementige Ereignismenge: { (K,D), ( K, D) } Anwendung des allgemeinen Multiplikations- und Additionssatzes: P(D K) P(D K) P(K) 0,90 0,10 0,09 P(D K) P(D K) P(K) 0,99 0,90 0,891 P((D K) (D K)) 0,09 0,891 0,981 Die gesuchte Wahrscheinlichkeit beträgt 98,1 %. 5) Um diese Aufgaben lösen zu können, müssen wir die allgemeine Formel für die Berechnung von Kombinationen ohne die Wiederholung von Elementen anwenden. Hierbei haben wir zunächst die Anzahl der bildbaren Kombinationen jeweils getrennt für die Soziologen und Politologen zu bestimmen. Die Gesamtzahl der Kombinationen für den 5er Ausschuß ergibt sich aus dem Produkt der Kombinationen für die beiden Institute. Allgemeine Formel: C n (k) n k n! (n k)!k! a) Anzahl der Kombinationen von jedem Soziologen mit jedem Politologen 5 2 7 3 5! (5 2)!2! 7! (7 3)!3! 12345 12312 1234567 1234123 20 2 210 6 10 35 350 Es gibt 350 mögliche Kombinationen zur Bildung des 5er Ausschusses.
Martin-Luther-Universität Halle-Wittenberg - Institut für Soziologie - Dr. Wolfgang Langer 6 b) Wie in a) gibt es 10 Möglichkeiten aus 5 Soziologen 2 auszuwählen. Wenn jedoch 1 Politologe immer im Ausschluß sitzen muß, können wir nur noch 2 aus 6 Politologen frei wählen. Daher müssen wir nur die Anzahl ihrer möglichen Zweierkombinationen bestimmen und mit der Kombinationsanzahl der Soziologen multiplizieren. 5 2 6 2 10 6! (6 2)! 2! 10 123456 123412 10 30 2 10 15 150 Es verbleiben 150 Kombinationsmöglichkeiten. c) Wenn zwei bestimmte Soziologen vom Ausschuß ausgeschlossen werden sollen, können wir nur noch zwei Fachvertreter aus den restlichen drei auswählen. Hingegen bleiben uns bei den Politologen die bereits ermittelten 35 Kombinationen erhalten. Bestimmung der reduzierten Soziologenauswahl: 3 2 3! (3 2)!2! 123 112 3 1 3 3 35 105 Kombinationen Es ergeben sich unter der Bedingung c) 105 Kombinationsmöglichkeiten.