Formelsammlung Beschreibende Statistik Univariate Häufigkeitsverteilungen X ist ein diskretes Merkmal, mit k Ausprägungen TR: Mode 2 1 = AC absolute relative Häufigkeit Häufigkeiten Bivariate Häufigkeitsverteilungen 2 diskrete Merkmale X und Y mit a resp. b Ausprägungen (xi;yi) TR: Mode 2 2 = AC relative Häufigkeit absolute kumulierte Häufigkeit bedingte relative Häufigkeit relative kumulierte Häufigkeitsverteilung Verteilungen Relative Häufigkeitsverteilung k x m Häufigkeiten hij und fij empirische empirische Unabhängigkeit Median Lageparameter Mittelwert TR: Shift 1 5 3 = empirische TR: Shift 1 4 2 = empirische Standardabweichung TR: Shift 1 4 3 x² = korrigierte TR: Shift 1 4 3 = korrigierte Stichprobenstandardabweichung Wurzel ziehen aus: TR: Shift 1 4 4 x² = Quantile TR: Shift 1 4 4 = TR: Q0,5 = Shift 1 6 4 = Q0,25 = Shift 1 6 3 = Q0,75= Shift 1 6 5 =
Zusammenhangsmessung Nominal Ordinal Metrisch X²-Koeffizient Rangkorrelationskoeffizient rsp Rangpositionen rg und Rangmittelwerte Phi-Koeffizient bestimmen Werte 1 ; +1 empirische Kovarianz maßstabsabhängig und nicht dimensionslos - Sxy = Cramers V X²max = Spezialfall Vierfeldertafel Wenn kein Rangplatz mehfach besetzt ist: TR: Shift 1 5 3 = (Eingabe der Daten vorab in Rangpositionen und nicht der Originaldaten!) Korrelationskoeffizient Pearson r Maßstabsunabhängig und dimensionslos. Werte 1 ; +1 folgt TR: Shift 1 5 3 = Wahrscheinlichkeitsrechnung und schließende Statistik Die Urne bzw. Formel-Abkürzungen N = alle Kugeln in der Urne (bzw. wie viele Ausprägungen hat mein Gegenstand; Würfel = 6; Münze = 2) n = wie oft ziehe ich? Wie oft wiederhole ich das Experiment? Wie oft werfe ich den Würfel die Münze x = wie viele will ich mind. höchsten genau haben? Um wie viele geht s in der Aufgabe? M = Anzahl der vorhandenen interessierenden Merkmale; z.b. Anzahl der roten blauen Kugeln (hypergeometrische Verteilung; Zum Vergleich: N wäre in diesem Fall = wie viele sind insgesamt drin k = wie viele will ich mind. höchstens genau haben? Um wie viele geht s in der Aufgabe? Kann auch mit x gekennzeichnet sein und bezieht sich auf M, also wenn ich von einer bestimmten Sorte eine bestimmte Anzahl möchte). Experimente Gleiche Eintrittswahrscheinlichkeit z.b. Würfel Laplace die mögliche Anzahl berechnet die Kombinatorik Kombinatorik Art der Stichprobe Ziehen ohne Zurücklegen Ziehen mit Zurücklegen Ziehen mit Berücksichtigung der Reihenfolge Beispiel: Wettrennen, Rangplätze, 1. Preis, 2. Preis und 3. Preis, hypergeometrische Verteilung Taschenrechner: Ziehen ohne Berücksichtigung der Reihenfolge Binomialkoeffizient Kontonummer, Passwörter, Matrikelnummern, Binomialverteilung Fakultät: Zahl Shift x! Zahl Potenz eingeben = Beispiel: Lotto, hypergeometrische Verteilung Roulette, Binomialverteilung Taschenrechner: N Shift ncr n bzw. k Wichtig:
Direkte Zufallsvariablen Wahrscheinlichkeitsfunktion = für ein bestimmtes x = für eine Anzahl von Xen (kumuliert) Gleiche Eintrittswahrscheinlichkeit Wahrscheinlichkeitsfunktion Stetige Zufallsvariablen Dichtefunktion = Intergration der Dichte bis zur Stelle x = Verhalten von X mit Intervall Rechteck bzw. stetige Gleichverteilung Dichtefunktion Erwartungswert Bernoulli-Verteilung (Binär x1 und x2 A und Wahrscheinlichkeitsfunktion z-transformation Erwartungswert Standardnormalverteilung x ist kleiner gleich (höchstens Mehrfaches Durchführen eines Bernoulli-Experiments unabhängig Binomialverteilung Wahrscheinlichkeitsfunktion x ist größer als ) = TR: Mode 4 2 lower(der Wert den x überschreiten soll) = upper (extremen hohen Wert;) = Std.abw. = Erw.Wert = X liegt zwischen Erwartungwert Mehrfaches Durchführen eines Bernoulli-Experiments abhängig Hypergeometrische Verteilung Wahrscheinlichkeitsfunktion TR: Mode 4 2 lower(kleiner Wert) = upper (hoher Wert) = Standardabweichung = Erwatungswert = Normalverteilung X² - Verteilung Variable t: Erwartungswert und t-verteilung Variable Erwartungswert Erwartungswert und F-Verteilung Variable X = X² verteilt mit Variable Y = F-verteilt mit Y ist also
Bivariate Verteilung von Zufallsvariablen egal ob diskret stetig Variablen: X1, X2, X3.werden verdichtet zur Stichprobenfunktion g (X1, X2, X3 ) Stichprobenfunktion: Stichprobenmittelwert Stichprobenfunktion: Stichprobenvarianz Stichprobenfunktion: korrigierte Stichprobenvarianz Variable folgt Normalverteilung: Variable folgt in X²-Verteilung: Variable folgt einer t-verteilung Standardisierung Stichprobenmittelwert Zusammenhangsmessung Kovarianz (linearer Zusammenhang, nicht normiert) Sind X und Y unabhängig, gilt Cov = 0 Korrelationskoeffizient (normiert, Werte [-1;+1]) Sind X und Y unabhängig, gilt p = 0
Schätzung von Parametern Eine Punktschätzung: Für einen unbekannten Parameter den Erwartungwert die anhand von Stichprobendaten gewinnen. Ich suche was und dann erhebe ich Daten Stichprobenfunktion g als Schätzwert. Gütemaß für Schätzer = MSE Für Schätzung eines Erwartungswerts mittels Stichprobenvariablen, verwendet man als Schätzer den Stichprobenmittelwert (unverzerrt!) und Für Schätzung einer mittels Stichprobenvariablen, verwendet man als Schätzer die Stichprobenvarianz S² (verzerrt!) Stichprobenvarianz S*² (unverzerrt!) Für die Schätzung eines Erwartungswerts von Anteilswerten p mittels Stichprobenvariablen, verwendet man als Schätzer den aus den Stichprobenvariablen gebildeten Stichprobenmittelwert Für die Schätzung der von Anteilswerten p mittels Stichprobenvariablen, gilt: Intervallschätzung = anhand von Stichprobenvariablen wird ein Intervall/Bereich bestimmt, der den gesuchten Parameter mit einer W`keit von mindestens 1-alpha enthält. Das Intervall soll eine möglichst geringe Länge aufweisen. Wir bestimmen mit Hilfe unserer n Stichprobenvariablen und einer bekannten ein Intervall, das den Erwartungswert enthält. Berechnung des Konfidenzintervalls: Wir bestimmen mit Hilfe unserer n Stichprobenvariablen und einer unbekannten ein Intervall, das den Erwartungswert enthält. Berechnung des Konfidenzintervalls:
Einstichprobentests! Zweiseitiger Test für den Erwartungwert mit bekannter - Gaußtest Prüstatistik/Prüfvariablenkonstruktion (so sieht meine Variable aus) Intervallkonstruktion: Testentscheidung: H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn Einseitiger Test für den Erwartungwert mit bekannter - Gaußtest Rechtseitiger Test: Testentscheidung = H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn Linksseitiger Test: Testentscheidung = H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn Ergänzung zum Gauß-Test für Erwartungswerte Bewertung der Leistungsfähigkeit des Tests Mit welcher Wahrscheinlichkeit werde ich die H0 ablehnen, wenn müh den Wert x annimmt? 1. Ich stelle mir vor, ein bestimmter Erwartungswert müh gilt. 2. Ich berechne, wie wahrscheinlich es ist, dass ich daraufhin H0 verwerfe Zu 2. Zweiseitig: Rechtsseitig: Linksseitig: Zweiseitiger Test für den Erwartungswert bei unbekannter t-test Prüfstatistik/ Prüfvariablenkonstruktion: Intervallkonstruktion: ; Einseitiger Test für den Erwartungwert bei unbekannter t-test Rechtseitiger Test: Testentscheidung = H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn Linksseitiger Test: Testentscheidung = H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn
Zweiseitiger Test für die - X²-Test Mit der meiner Stichprobenvariablen möchte ich auf die in der Grundgesamtheit schließen. Prüfstatistik/Prüfvariablenkonstruktion Intervallkonstruktion: es folgt bei Gültigkeit H0 mit Einseitiger Test für die X²-Test Rechtsseitiger Test: Testentscheidung: H0 wirt mit Irrtumswahrscheinlichkeit höchstens alpha verworfen, wenn Linksseitiger Test: Testentscheidung: H0 wirt mit Irrtumswahrscheinlichkeit höchstens alpha verworfen, wenn
Zweistichprobentests! Gibt Niveauunterschiede zwischen den Erwartungswerten zweier Stichproben? Zweistichprobentest für Erwartungswerte bei bekannter Gauß-Test Prüfvariablenkonstruktion: Prüfgröße: bei gleichen en Testentscheidung: H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn Zweistichprobentest für Erwartungswerte unbekannter t-test Prüfvariablenkonstruktion: Prüfgröße in zwei Schritten ermitteln: 1. Schritt unbekannte schätzen 2. Schritt: die Prüfgröße Testentscheidung: H0 wird mit Irrtumswahrscheinlichkeit alpha verworfen, wenn Test auf Unabhängigkeit zweier nominalskalierter Merkmal X und Y X²-Koeffizient Testvariable: T = X²-Koeffizient wobei gilt: Testentscheidung: Die H0 wird mit einer Irrtumswahrscheinlichkeit alpha verworfen, wenn