Zufallsauswahlen aus endlichen Grundgesamtheiten In der statistischen Praxis kommt dem Ziehen von Stichproben größte Bedeutung zu, da in vielen Fällen die Untersuchung der Grundgesamtheit zu teuer oder prinzipiell unmöglich ist. Ziel ist es dabei aus der Analyse der Stichprobe auf die Grundgesamtheit zu schließen Statistik für SoziologInnen 1 Einführung in die Wahrscheinlichkeitsrechnung Stichprobenmodelle Grundgesamtheit mit unterscheidbaren Objekten Stichprobe von n Objekten Ziehen mit Zurücklegen bzw. Ziehen ohne Zurücklegen Berücksichtigung der Anordnung bzw. keine Berücksichtigung der Anordnung Statistik für SoziologInnen 2 Einführung in die Wahrscheinlichkeitsrechnung 1
Überblick über Stichprobenmodelle Mit Zurücklegen Ohne Zurücklegen Mit * = n * = (-1)... (-(n-1)) I II falls n=:! (Permutation) Berücksichtigung der Anordnung (Variationen) Ohne Berücksichtigung der Anordnung (Kombinationen) + n 1 * = (-1)... (-(n-1))/n! * = n * = III n IV Statistik für SoziologInnen 3 Einführung in die Wahrscheinlichkeitsrechnung Modelle mit Berücksichtigung der Anordnung Ziehen mit Zurücklegen (Situation I) Jede Ziehung erfolgt von der ursprünglichen Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst nicht das Ergebnis des nächsten Schrittes; In der Stichprobe können Objekte mehrfach vorkommen Anzahl der möglichen Stichproben: * = n Statistik für SoziologInnen 4 Einführung in die Wahrscheinlichkeitsrechnung 2
Beispiele für Variationen mit Zurücklegen (I) Wie viele verschiedene Zustände kann man mit 8 bit (binäre Informationseinheit 0/1) darstellen? n=8 =2 Ziehen mit Zurücklegen mit Berücksichtigung der Anordnung 2 8 = 256 Statistik für SoziologInnen 5 Einführung in die Wahrscheinlichkeitsrechnung Beispiele für Variationen mit Zurücklegen (I) Wie viele verschiedene Wörter bestehend aus 4- Buchstaben kann man bilden? =26 n=4 Ziehen mit Zurücklegen mit Berücksichtigung der Anordnung 26 4 = 456.976 Wie viele verschiedene sechsstellige Zahlen kann man aus den Ziffern 0 bis 9 bilden? (Joker beim Lotto) =10 n=6 Ziehen mit Zurücklegen mit Berücksichtigung der Anordnung 10 6 = 1.000.000 Statistik für SoziologInnen 6 Einführung in die Wahrscheinlichkeitsrechnung 3
Modelle mit Berücksichtigung der Anordnung Ziehen ohne Zurücklegen (Situation II) Jede einzelne Ziehung erfolgt von einer verringerten Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst das Ergebnis des nächsten Schrittes; In der Stichprobe kann ein Objekt nur maximal einmal vorkommen Anzahl der möglichen Stichproben: * = (-1) (-2)... (-(n-1)) * =! ( n)! Statistik für SoziologInnen 7 Einführung in die Wahrscheinlichkeitsrechnung Beispiele für Variationen ohne Zurücklegen (II) Wie viele Möglichkeiten gibt es 3 Kandidaten aus einer Liste von 5 auszuwählen und zu reihen? =5 n=3 Ziehen ohne Zurücklegen mit Berücksichtigung der Anordnung Situation II 5*4*3 = 60 Statistik für SoziologInnen 8 Einführung in die Wahrscheinlichkeitsrechnung 4
Beispiele für Variationen ohne Zurücklegen (II) Wie viele zweistellige Zahlen, gibt es die aus verschiedenen Ziffern gebildet werden? =10 n=2 Ziehen ohne Zurücklegen mit Berücksichtigung der Anordnung Situation II *=10*9 = 90 Es werden jedoch insgesamt 9 Zahlen (01 bis 09), die mit der Ziffer 0 beginnen hier mitgezählt, obwohl diese eigentlich keine zweistellige Zahl darstellen. Antwort auf die Frage ist daher: *-9 = 90-9=81 Statistik für SoziologInnen 9 Einführung in die Wahrscheinlichkeitsrechnung Permutationen Spezialfall: n= Anzahl von Anordnungen von unterscheidbaren Objekten *=(-1)(-2)...(-(n-1))=(-1)...1=! -Fakultät Beachte: 0!=1 Statistik für SoziologInnen 10 Einführung in die Wahrscheinlichkeitsrechnung 5
Beispiele: Wie viele Möglichkeiten gibt es 3 Kandidaten zu reihen? =3 n=3 Ziehen ohne Zurücklegen mit Berücksichtigung der Anordnung 3! = 6 Permutation Statistik für SoziologInnen 11 Einführung in die Wahrscheinlichkeitsrechnung Modelle ohne Berücksichtigung der Anordnung Ziehen ohne Zurücklegen (Situation IV) Jede einzelne Ziehung erfolgt von einer verringerten Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst das Ergebnis des nächsten Schrittes; In der Stichprobe kann ein Objekt nur maximal einmal vorkommen Vorgang entspricht der Teilmengenbildung Anzahl der möglichen Stichproben: * = (-1) (-2)... (-(n-1))/n! Statistik für SoziologInnen 12 Einführung in die Wahrscheinlichkeitsrechnung 6
Vereinfachte Schreibweise n n! = = = ( 1) ( + 1) n!( n)! n n (n 1) 2 1 Binomialkoeffizient 1 = = = 0 1 1 i= 0 2 i = n Statistik für SoziologInnen 13 Einführung in die Wahrscheinlichkeitsrechnung Beispiele für Kombinationen ohne Zurücklegen (IV) Wie viele Möglichkeiten gibt es 3 Kandidaten aus einer Liste von 5 auszuwählen, wobei Ihre Reihung irrelevant ist? =5 n=3 Ziehen ohne Zurücklegen ohne Berücksichtigung der Anordnung Situation IV 5 5 12 3 45 5 4 10 3! = = = = 23!! 1212 3 12 Statistik für SoziologInnen 14 Einführung in die Wahrscheinlichkeitsrechnung 7
Exkurs: Kardinalität der Potenzmenge Zu einer Menge mit Elementen gibt es 2 Teilmengen. Sei =3: {a, b, c} { } Leere Menge (unechte Teilmenge) {a}, {b}, {c} Ein-elementige Teilmengen {a, b}, {a, c}, {b, c} Zwei-elementige Teilmengen {a, b, c} Menge selbst 1+3+3+1=8 Beweisidee: vollständige Induktion kommt ein (+1)-tes Element dazu, kann ich für jede bestehende Teilmenge die binäre Entscheidung treffen, ob ich das Element aufnehme oder nicht ==> Verdoppelung der Zahl der Teilmengen in jedem Schritt Statistik für SoziologInnen 15 Einführung in die Wahrscheinlichkeitsrechnung Modelle ohne Berücksichtigung der Anordnung Ziehen mit Zurücklegen (Situation III) Jede Ziehung erfolgt von der ursprünglichen Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst nicht das Ergebnis des nächsten Schrittes; In der Stichprobe können Objekte mehrfach vorkommen Anzahl der möglichen Stichproben: + n 1 ( + n 1) ( + n 2) ( + 1) * = = n n (n 1) 2 1 Statistik für SoziologInnen 16 Einführung in die Wahrscheinlichkeitsrechnung 8
Beispiele für Kombinationen mit Zurücklegen (III) In einer Woche ereigneten sich 10 tödliche Verkehrsunfälle. Wie viele unterschiedliche Häufigkeitsverteilungen g der Zahl der Unfälle klassifiziert nach dem Wochentag gibt es? =7 n=10 Ziehen mit Zurücklegen ohne Berücksichtigung der Anordnung Sit. III 7+ 10 1 16 16 16 15 14 13 12 11 = 8008 10 = 10 = = 6 12 3 45 6 Statistik für SoziologInnen 17 Einführung in die Wahrscheinlichkeitsrechnung Überblick über Stichprobenmodelle Mit Zurücklegen Ohne Zurücklegen Mit * = n * = (-1)... (-(n-1)) I II falls n=:! (Permutation) Berücksichtigung der Anordnung (Variationen) Ohne Berücksichtigung der Anordnung (Kombinationen) + n 1 * = (-1)... (-(n-1))/n! * = n * = III n IV Statistik für SoziologInnen 18 Einführung in die Wahrscheinlichkeitsrechnung 9
Diskussion der Formeln * aus Sit. II ist gleich * aus Sit. IV mal n! II unterscheidet sich von IV eben nur dadurch, dass die Reihenfolge relevant ist. Die Formel aus III entspricht, der aus IV nur ist die Zahl der Elemente der Menge aus der wir die Stichprobe ziehen größer: +(n-1) statt Idee: Ab dem zweiten der n Ziehungsschritte vergrößern wir jeweils komparativ die Grundmenge um ein Element Statistik für SoziologInnen 19 Einführung in die Wahrscheinlichkeitsrechnung Beispiele Wie groß ist die Wahrscheinlichkeit, dass bei der Aufteilung von n unterscheidbaren Kugeln auf n Fächer jedes Fach belegt wird? Mögliche Aufteilungen: n n Günstige Aufteilungen: n! Wahrscheinlichkeit: n! / n n Für n=6: 0,01543 Beispiel: i Wahrscheinlichkeit bei 6 Würfelwürfen alle 6 Augenzahlen genau einmal zu würfeln Statistik für SoziologInnen 20 Einführung in die Wahrscheinlichkeitsrechnung 10
Beispiel: Geburtstagsproblem Wie groß ist die Wahrscheinlichkeit, dass unter n Personen zumindest 2 am selben Kalendertag Geburtstag haben (unabhängig gg vom Alter) [X]? P(X) = 1- P(X') X' ist das Ereignis, dass alle Personen an verschiedenen Tagen Geburtstag haben 2 Personen: P(X') = 364/365 3 Personen: P(X') = (364/365)*(363/365) usw. n=30 P(X') = 0,294 P(X) = 0,706 n=50 P(X') = 0,030 P(X) = 0,970 ab n =23 P(X) > 50% Statistik für SoziologInnen 21 Einführung in die Wahrscheinlichkeitsrechnung Formale Lösung P(X )=*(-1)*...*(-(n-1))/ n =365 n=anzahl der Personen P(X)=1 - *(-1)*...*(-(n-1))/ n Statistik für SoziologInnen 22 Einführung in die Wahrscheinlichkeitsrechnung 11
Beispiele Wie groß ist die Wahrscheinlichkeit, dass unter n Personen zumindest 1 am selben Kalendertag (21.10.) Geburtstag haben wie der Vortragende (unabhängig vom Alter) [X]? P(X) = 1- P(X') X' ist das Ereignis, dass alle Personen nicht am Stichtag Geburtstag haben 1 Personen: P(X') = 364/365 2 Personen: P(X') = (364/365)*(364/365) ( ) usw. n=30 P(X') = 0,921 P(X) = 0,079 n=50 P(X') = 0,872 P(X) = 0,128 ab n =253 P(X) > 50% Statistik für SoziologInnen 23 Einführung in die Wahrscheinlichkeitsrechnung Analyse des Lottos 6 aus 45 icht gezogen (39 Zahlen) Gewinnrang Gezogen (6 Zahlen) Anzahl des Vorkommens Wahrscheinlichkeit Chance 1:x 0 1 3.262.623 3.262.623 0,4005646367 2,50 1 6 575.757 3.454.542 0,4241272624 2,36 2 15 82.251 1.233.765 0,1514740223 6,60 3 20 9.139 182.780 0,0224405959 44,56 4 15 741 11.115 0,0013646308 732,80 5 6 39 234 0,0000287291 34.807,95 6 1 1 1 0,0000001228 8.145.060,00 8.145.060 Statistik für SoziologInnen 24 Einführung in die Wahrscheinlichkeitsrechnung 12