Statistik 1 für SoziologInnen Grundlagen der Kombinatorik Univ.Prof. Dr. Marcus Hudec
Zufallsauswahl aus Grundgesamtheiten In der statistischen Praxis kommt dem Ziehen von Stichproben größte Bedeutung zu, da in vielen Fällen die Untersuchung der Grundgesamtheit zu teuer oder prinzipiell unmöglich ist. Ziel ist es dabei aus der Analyse der Stichprobe auf die Grundgesamtheit zu schließen Um Abschätzungen über den Stichprobenfehler treffen zu können, muss der Ziehungsvorgang exakt beschrieben werden Ziehen mit Zurücklegen bzw. Ziehen ohne Zurücklegen Berücksichtigung der Anordnung bzw. keine Berücksichtigung der Anordnung 2 Statistik 1 - Einführung in die
Kombinatorik Wie komme ich zu den relevanten Anzahlen von möglichen und günstigen Fällen? Vollständige Enumeration Mathematische Berechnung Wichtiges Hilfsmittel der Kombinatorik ist jenes Teilgebiet der Mathematik, das sich mit der Bestimmung der Zahl möglicher Anordnungen oder Auswahlen von unterscheidbaren oder nicht unterscheidbaren Objekten mit oder ohne Beachtung der Reihenfolge beschäftigt. 3 Statistik 1 - Einführung in die
Überblick über 4 Stichprobenmodelle Mit Berücksichtigung der Anordnung (Variationen) Mit Zurücklegen N* = Nn I Ohne Zurücklegen N* = N (N-1)... (N-(n-1)) II falls n=n: N! (Permutation) Ohne Berücksichtigung der Anordnung (Kombinationen) N* Nn n III 1 N* = N (N-1)... (N-(n-1))/n! N N* n IV 4 Statistik 1 - Einführung in die
Modelle mit Berücksichtigung der Anordnung Ziehen mit Zurücklegen (Situation I) Jede Ziehung erfolgt von der ursprünglichen Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst nicht das Ergebnis des nächsten Schrittes; In der Stichprobe können Objekte mehrfach vorkommen Anzahl der möglichen Stichproben: N* = N n 5 Statistik 1 - Einführung in die
Beispiele für Variation mit Zurücklegen (I) Wie viele verschiedene Zustände kann man mit 8 binären Informationseinheiten (0/1) [mit 8 Bit] darstellen? N=2 n=8 Ziehen mit Zurücklegen mit Berücksichtigung der Anordnung 2 8 = 256 6 Statistik 1 - Einführung in die
Beispiele für Variationen mit Zurücklegen (I) Wie viele verschiedene Wörter bestehend aus 4- Buchstaben kann man bilden? N=26 n=4 Ziehen mit Zurücklegen mit Berücksichtigung der Anordnung 26 4 = 456.976 Wie viele verschiedene sechsstellige Zahlen kann man aus den Ziffern 0 bis 9 bilden? (vgl. Joker beim Lotto) N=10 n=6 Ziehen mit Zurücklegen mit Berücksichtigung der Anordnung 10 6 = 1.000.000 7 Statistik 1 - Einführung in die
Modelle mit Berücksichtigung der Anordnung Ziehen ohne Zurücklegen (Situation II) Jede einzelne Ziehung erfolgt von einer verringerten Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst das Ergebnis des nächsten Schrittes; In der Stichprobe kann ein Objekt nur maximal einmal vorkommen Anzahl der möglichen Stichproben: N* = N (N-1) (N-2)... (N-(n-1)) N* N! ( Nn)! 8 Statistik 1 - Einführung in die
Beispiele für Variation ohne Zurücklegen (II) Wie viele Möglichkeiten gibt es 3 Kandidaten aus einer Liste von 5 auszuwählen und dabei zu reihen? N=5 n=3 Ziehen ohne Zurücklegen mit Berücksichtigung der Anordnung Situation II 5*4*3 = 60 9 Statistik 1 - Einführung in die
Permutationen Spezialfall: n=n d.h. wir wählen alle Elemente aus Anzahl von Anordnungen von N unterscheidbaren Objekten N*=N(N-1)(N-2)...(N-(n-1))=N(N-1)...1=N! N-Fakultät Beachte: 0!=1 10 Statistik 1 - Einführung in die
Beispiele: Wie viele Möglichkeiten gibt es 3 Kandidaten zu reihen? N=3 n=3 Ziehen ohne Zurücklegen mit Berücksichtigung der Anordnung 3! = 6 Permutation abc acb bac bca cab cba 11 Statistik 1 - Einführung in die
Modelle ohne Berücksichtigung der Anordnung Ziehen ohne Zurücklegen (Situation IV) Jede einzelne Ziehung erfolgt von einer verringerten Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst das Ergebnis des nächsten Schrittes; In der Stichprobe kann ein Objekt nur maximal einmal vorkommen Vorgang entspricht der Teilmengenbildung Anzahl der möglichen Stichproben: N* = N (N-1) (N-2)... (N-(n-1))/n! 12 Statistik 1 - Einführung in die
Vereinfachte Schreibweise N n N! n!( N n)! N N N N N n ( 1) ( 1) n n(n 1) 21 Binomialkoeffizient N 1 0 N i0 N i 2 n N N N N 1 N 1 Excel-Funktion: Kombinationen(n; k) 13 Statistik 1 - Einführung in die
Beispiele für Kombinationen ohne Zurücklegen (IV) Wie viele Möglichkeiten gibt es 3 Kandidaten aus einer Liste von 5 auszuwählen, wobei Ihre Reihung irrelevant ist? N=5 n=3 Ziehen ohne Zurücklegen ohne Berücksichtigung der Anordnung Situation IV 2 1 4 5 2 5 3 5 10 3 2 1 3 4 5 3 2 1 2 1 5 4 3 2 1 2!3! 5! 3 5 14 Statistik 1 - Einführung in die
Beispiele: Wie viele Möglichkeiten gibt es 3 Kandidaten aus einer Liste von 5 (a,b,c,d,e) auszuwählen, wobei Ihre Reihung irrelevant ist? N=5 n=3 Ziehen ohne Zurücklegen ohne Berücksichtigung der Anordnung abc abd abe acd ade bcd bde cde ace bce 10 Möglichkeiten 15 Statistik 1 - Einführung in die
Modelle ohne Berücksichtigung der Anordnung Ziehen mit Zurücklegen (Situation III) Jede Ziehung erfolgt von der ursprünglichen Grundgesamtheit; das Ergebnis eines Ziehungsschrittes beeinflusst nicht das Ergebnis des nächsten Schrittes; In der Stichprobe können Objekte mehrfach vorkommen Anzahl der möglichen Stichproben: N* N n 1 ( Nn1) ( Nn2) ( N1) N n n(n 1) 21 16 Statistik 1 - Einführung in die
Beispiele für Kombinationen mit Zurücklegen (III) In einer Woche ereigneten sich 10 tödliche Verkehrsunfälle. Wie viele unterschiedliche Häufigkeitsverteilungen der Zahl der Unfälle klassifiziert nach dem Wochentag gibt es? N=7 n=10 Ziehen mit Zurücklegen ohne Berücksichtigung der Anordnung Sit. III 7 10 1 16 16 10 10 6 161514131211 123456 8008 entspricht der Frage: Wie viele Mögliche Verteilungen von n Kugeln auf N Fächer gibt es? 17 Statistik 1 - Einführung in die
Überblick über Stichprobenmodelle Mit Berücksichtigung der Anordnung (Variationen) Mit Zurücklegen N* = Nn I Ohne Zurücklegen N* = N (N-1)... (N-(n-1)) II falls n=n: N! (Permutation) Ohne Berücksichtigung der Anordnung (Kombinationen) N* Nn n III 1 N* = N (N-1)... (N-(n-1))/n! N N* n IV
Diskussion der Formeln N* aus Sit. II ist gleich N* aus Sit. IV mal n! II unterscheidet sich von IV eben nur dadurch, dass die Reihenfolge relevant ist. Die Formel aus III entspricht, der aus IV nur ist die Zahl der Elemente der Menge aus der wir die Stichprobe ziehen größer: N+(n-1) statt N Idee: Ab dem zweiten der n Ziehungsschritte vergrößern wir jeweils komparativ die Grundmenge um ein Element 19 Statistik 1 - Einführung in die
Beispiel: Geburtstagsproblem Wie groß ist die Wahrscheinlichkeit, dass unter n Personen zumindest zwei am selben Kalendertag Geburtstag haben (natürlich unabhängig vom Alter/Geburtsjahr)? Wie viele Personen müssen anwesend sein, dass die Wahrscheinlichkeit zumindest ein Personenpaar mit gleichem Geburtstag zu erhalten, größer als 50% ist? 20 Statistik 1 - Einführung in die
Beispiel: Geburtstagsproblem Wie groß ist die Wahrscheinlichkeit, dass unter n Personen zumindest 2 am selben Kalendertag Geburtstag haben (unabhängig vom Alter)? X sei das Ereignis 2 oder mehr haben am selben Tag Geburtstag P(X) = 1- P(X') X' ist das Ereignis, dass alle Personen an verschiedenen Tagen Geburtstag haben 2 Personen: P(X') = 364/365 3 Personen: P(X') = (364/365)*(363/365) usw. n=30 P(X') = 0,294 P(X) = 0,706 n=50 P(X') = 0,030 P(X) = 0,970 ab n =23 P(X) > 50% 21 Statistik 1 - Einführung in die
Beispiele Wie groß ist die Wahrscheinlichkeit, bei 6 Würfelwürfen alle 6 Augenzahlen genau einmal zu würfeln? Mögliche Ergebnisse: n n 6 6 =46.656 Günstige Ergebnisse: n! 6!=720 Wahrscheinlichkeit: n! / n n Für n=6: 0,01543 22 Statistik 1 - Einführung in die
Formale Lösung P(X )=N*(N-1)*...*(N-(n-1))/N n N=365 n=anzahl der Personen P(X)=1 - N*(N-1)*...*(N-(n-1))/N n n p(n ) 10 12.0% 20 41.0% 23 50.7% 30 70.0% 50 97.0% 100 99.99996% 23 Statistik 1 - Einführung in die
Beispiele Wie groß ist die Wahrscheinlichkeit, dass unter n Personen zumindest einer am selben Kalendertag (21.10.) Geburtstag hat, wie der Vortragende (unabhängig vom Alter) [X]? P(X) = 1- P(X') X' ist das Ereignis, dass alle Personen nicht am Stichtag Geburtstag haben 1 Personen: P(X') = 364/365 2 Personen: P(X') = (364/365)*(364/365) usw. n=30 P(X') = 0,921 P(X) = 0,079 n=50 P(X') = 0,872 P(X) = 0,128 ab n =253 P(X) > 50% 24 Statistik 1 - Einführung in die