Kapitel 11 Diskrete Zufallsvariablen 11.1. Wahrscheinlichkeits- und diskret Wahrscheinlichkeitsverteilungen Wahrscheinlichkeitsfunktion von X Nimmt abzählbare Anzahl von Ausprägungen an (z.b. Zählvariablen) die Ausprägungen eines diskreten Merkmals als Ergebnis eines Zufallsvorgangs interpretiert, wird das Merkmal als diskrete Zufallsvariable angesprochen Diskrete Zufallsvariable X, die k-werte x 1,x 2,,x k annimmt (=Trägermenge X) Verhalten von X, wenn jede Realisation x i die Eintrittswahrscheinlichkeit p 1=P(X=x i) bekannt ist Funktion f, die jede Ausprägung x i eine Eintrittswahrscheinlichkeit p i zuordnet Für alle reelle Zahlen x gilt: f(x) = p 1 für x=x i; i=1,2,,k 0 für alles sonstigen x Visualisierung Stab- und Säulendiagramm mit k Stäbchen/Säulen der Länge p 1,p 2,,p k Keine negativen Werte p 1+p 2+ +p k = 1 (Analogie zur relativen Häufigkeitsverteilungen) Theoretische F(x) ist eine monoton wachsende Treppenfunktion mit Sprungstellen in x=x i Diskrete Gleichverteilung mit Parameter p alle Eintrittswahrscheinlichkeiten p i der Wert p = 1/k eingesetzt Beispiel Würfel Alle Augenpaare x 1=1, x 2=2, x 3=3, x 4=4, x 5=5 & x 6=6 haben die gleiche Eintrittswahrscheinlichkeit p= 1/6
Zusammenhänge zwi. Verteilungen diskreter Zufallsvariablen & relativen Haufigkeitsverteilung n= 10 n= 100 Bernoulli - Verteilung Auch Zweiüunkt-Verteilung liegt vor, wenn eine Zufallsvariable X nur zwei Ausprägungen aufweist = binäre Zufallsvariable Definiert wie folgt: Abhängig von Parameter p Eine mit dem Parameter p bernoulli-verteilte Zufallsvariable X bezeichnet man als Be(p)-verteilt und verwendet hierfür die Notation X~Be(p) (lies: X ist bernoulliverteilt mit dem Parameter p)
Bernoulli-Experiment Wird wiederholend durchgeführt Man spricht hier, wenn die Voraussetzung der Unabhängigkeit der Einzelexperimente erfüllt, auch von einer Bernoulli-Kette. 11.2. Kenngrößen diskreter Verteilungen Erwartungswert Bezieht sich auch theoretischer V. μ = x 1 p 1 + x 2 p 2 + + x k p k k μ = x i p i i=1 Varianz σ 2 = (x 1 μ) 2 p 1 + (x 2 μ) 2 p 2 + + (x k μ) 2 p k k σ 2 = (x i μ) 2 p i i=1 Standardabweichung Lineartransformation Standardisierungsformel σ: = σ² Y = ax + b Die Addition von b entspricht einer Verschiebung des Nullpunkts, während die Multiplikation von X mit einem von Null verschiedenen Wert a eine Streckung oder Stauchung der zur Messung verwendeten Skala beinhaltet (im Fall a < 0 kommt noch ein Vorzeichenwechsel hinzu) Bei einer Zufallsvariable x E(X) ist der Mittelwert von z.b. 4 Werten E(X)= 9,5 V(X) = 17,6666667 E(Y)= 33,5 a = 3 V(Y)= 159 b = 5 Bei zwei unabhängiger Variablen x & y Quantil Wir haben zwei Variablen x und y, die summiert werden. Die Korrelation zwischen den beiden Variablen ist 0, d.h. es besteht keine Korrelation. Bei 0 sind die Variablen unabhängig. Gilt auch für n > 2!!! Zur Charakterisierung p-quantil definiert durch: Median x = x 0,5 unteres Quartil = x 0,25 oberes Quartil = x 0,75 F(x p ) = p (0 < p < 1) Zusatzbedingungen!! Bei diskreten Verteilungen nicht eindeutig festgelegt: F(x p ) p
F(x) < p für x<x p 11.3. Binomialverteilung Binärvariablen Indikatorvariable 2 Ausprägungen zum Beispiel.: Münzexperiment, Geschlechterverteilung Auch mehr als zwei Ausprägungen können darauf zurückgeführt werden, wenn man nur zwei Ereignisse unterscheidet Wie häufig treten die Realisationen A oder A auf? X i { 1 bei Eintritt x 1 = A 0 bei Eintritt x 2 = A X Anzahl der Ausgänge mit i=1,2,,n Ausprägungen A Ereignis A Komplmentärereignis von A Null-Eins-Verteilung Kenngrößen Wahrscheinlichkeitsverteilung μ = np σ 2 = np(1 p) f(x) = { (n x ) px (1 p) n x für x = 0,1,, n 0 für alle sonstigen x x F(x) = ( n k ) pk (1 p) n k k=0 11.4. Die hypergeometrische Verteilung Ohne Zurücklegen Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet. Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden n Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable X ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe. X~ H(n;M;N) N = alle Objekte M = Anzahl der Treffer N-M = Anzahl der restlichen Objekte p = M N n wie oft gezogen wurde x Anzahl der Trefferauf die getestet werden soll h(x N, M, n) = (M x )(N M n x ) ( N n ) μ = n M N σ 2 = n M N (1 M N n ) N N 1
Kleinere Varianz, weil beim Ziehen ohne Zurücklegen die N Kugeln sich verringern n=n deterministische Größe mit dem Wert M Wahrscheinlichkeitsfunktion f(x) { ( N n ) für x T ( M x )(N M n x ) 0 für alle sonstigen x F(x) x n x ) = (M x )(N M ( N n ) k=0 n = 1 Nur einmal Ziehen!