Willkommen zur Vorlesung Statistik (Master)

Ähnliche Dokumente
$ % + 0 sonst. " p für X =1 $

Beispiel Zusammengesetzte Zufallsvariablen

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Variationen Permutationen Kombinationen

Übungen zur Mathematik für Pharmazeuten

Ein möglicher Unterrichtsgang

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG

5. Schließende Statistik Einführung


Statistische Thermodynamik I Lösungen zur Serie 1

Zufallsgrößen. Vorlesung Statistik für KW Helmut Küchenhoff

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Statistik I für Betriebswirte Vorlesung 5

Gesucht: wie viele Mitarbeiter sind max. durch Ziffernfolge unterscheidbar. Lösung: Möglichkeiten; Reihenfolge und MIT Zurücklegen- also = = 6561

Willkommen zur Vorlesung Statistik (Master)

11 Diskrete Zufallsvariablen

Versuch: Zufälliges Ziehen aus der Population

y P (Y = y) 1/6 1/6 1/6 1/6 1/6 1/6

Statistiktraining im Qualitätsmanagement

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur GRUPPE A - BEARBEITER/IN (NAME, VORNAME):

P X =3 = 2 36 P X =5 = 4 P X =6 = 5 36 P X =8 = 5 36 P X =9 = 4 P X =10 = 3 36 P X =11 = 2 36 P X =12 = 1

3.2. Aufgaben zu mehrstufigen Zufallsexperimenten

Sozialwissenschaftliche Methoden und Statistik I

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

3.8 Wahrscheinlichkeitsrechnung III

Übungsaufgaben Wahrscheinlichkeit

R ist freie Software und kann von der Website.

6 Mehrstufige zufällige Vorgänge Lösungshinweise

Willkommen zur Vorlesung Statistik

Grundlagen. Wozu Wahrscheinlichkeitsrechnung? Definition und Begriff der Wahrscheinlichkeit. Berechnung von Laplace-Wahrscheinlichkeiten

Beispiele zur UE Wirtschaftsstatistik 1 bei Nagel

Kursthemen 12. Sitzung. Spezielle Verteilungen: Warteprozesse. Spezielle Verteilungen: Warteprozesse

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Bestimmen der Wahrscheinlichkeiten mithilfe von Zählstrategien

Willkommen zur Vorlesung Statistik

13.5 Der zentrale Grenzwertsatz

Aufgabe 2.1. Ergebnis, Ergebnismenge, Ereignis

Monte-Carlo Simulation

Statistik im Bachelor-Studium der BWL und VWL

3.3. Aufgaben zur Binomialverteilung

Elementare statistische Methoden

Einführung in die schließende Statistik - Von der Wahrscheinlichkeit zur Hypothese mit Beispielen in R und SPSS

Analog definiert man das Nichteintreten eines Ereignisses (Misserfolg) als:

Einführung in die Statistik

Präsenzübungsaufgaben zur Vorlesung Elementare Sachversicherungsmathematik

Coupon Collector's-Problem (Sammelbilderproblem) Name: Walter Wolf Matrikelnr.: Dozent: Dr. W. Kössler

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Abitur 2012 Mathematik GK Stochastik Aufgabe C1

Statistische Verfahren in der Computerlinguistik. Einführung in die Computerlinguistik Sommersemester 2009 Peter Kolb

Statistik im Versicherungs- und Finanzwesen

Analyse von Zeitreihen in der Umweltphysik und Geophysik Stochastische Prozesse

Gewinnchancen und Gewinnerwartung

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

Data Mining: Einige Grundlagen aus der Stochastik

Modul: Stochastik. Zufallsexperimente oder Wahrscheinlichkeit relative Häufigkeit Variation Permutation Kombinationen Binomialverteilung

Einführung in die Geostatistik (2) Fred Hattermann (Vorlesung), Michael Roers (Übung),

Statistik und Wahrscheinlichkeitsrechnung

Klassische Risikomodelle

Beispiel für metrische Daten

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Stichprobenauslegung. für stetige und binäre Datentypen

Jetzt lerne ich Stochastik für die Oberstufe

Einführung in die Stochastik

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Die Binomialverteilung

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Teil I Beschreibende Statistik 29

Varianzanalyse ANOVA

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

Herzlich Willkommen zur Vorlesung Statistik

Grundlagen Wahrscheinlichkeitsrechnung, Statistik

1. Einführung in die Statistik. 2. Wohin geht die Reise? Worum geht es?

Stochastik Wahrscheinlichkeit

Wahrscheinlichkeitsrechnung und Statistik 8.1 Grundbegriffe Laplace-Experiment Ergebnis Elementarereignis Ergebnismenge Ergebnisraum

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE. Markt+Technik

Diskrete Verteilungsmodelle

Business Value Launch 2006

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Klausur: Einführung in die Statistik

Spiegel Link. Oracle 12c -

Klausur Statistik Lösungshinweise

Kontingenzkoeffizient (nach Pearson)

Inhaltsverzeichnis (Stand: 5. Juli 2012)

1 Verteilungen und ihre Darstellung

Statistik II für Betriebswirte Vorlesung 2

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Physica-Lehrbuch. Ein anwendungsorientiertes Lehr- und Arbeitsbuch. von Christine Duller

AUFGABEN AUS DEM ZENTRALABITUR

Monty Hall-Problem. Wochen 3 und 4: Verteilungen von Zufallsvariablen. Lernziele. Diskrete Verteilungen

Genexpression. Expression eines einzelnen Gens. Expressionsmessung. Genexpressionsmessung. Transkription (Vorgang) Genexpression

Forschungsstatistik I

Konfidenzintervalle so einfach wie möglich erklärt

Statistik I für Betriebswirte Vorlesung 11

Transkript:

Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang Ludwig-Mayerhofer Schließende Statistik Universität Siegen

Diskrete Zufallsvariablen 2 / 18

Einführung Zufallsvariablen Unter einer Zufallsvariable versteht man eine Variable, deren Werte bzw. Ausprägungen das Ergebnis eines Zufallsvorgangs sind. Beispiele: Eine Münze wird n mal geworfen wie oft resultiert Kopf? Analogon zur Stichprobenziehung: Aus einer Grundgesamtheit werden n Personen gezogen wie oft resultiert Person mit Eigenschaft A 1 (z. B. arm )? Ein Würfel wird n mal geworfen welche Augenzahl ergibt sich im Durchschnitt? Analogon zur Stichprobenziehung: Aus einer Grundgesamtheit werden n Personen gezogen welches Einkommen haben die Befragten im Durchschnitt? Im ersten Fall gibt es nur eine endliche Zahl von Ausprägungen es handelt sich um eine diskrete Zufallsvariable. 3 / 18

Einführung Charakterisierung einer diskreten Zufallsvariablen Eine diskrete Zufallsvariable wird durch ihre Wahrscheinlichkeitsfunktion charakterisiert: f (x) = { P(X = x i ) = p i für x = x i, i = 1,2,... 0 sonst Die Wahrscheinlichkeitsfunktion gibt also für jede Ausprägung von X an, wie wahrscheinlich sie ist. 4 / 18

Einführung Beispiel: Eine Münze wird viermal geworfen Vier Würfe: {K, K, K, K} {K, K, K, Z} {K, K, Z, K} {K, Z, K, K} {Z, K, K, K} {K, K, Z, Z} {K, Z, K, Z} {Z, K, K, Z} {K, Z, Z, K} {Z, K, Z, K} {Z, Z, K, K} {Z, Z, Z, K} {Z, Z, K, Z} {Z, K, Z, Z} {K, Z, Z, Z} {Z, Z, Z, Z} Wenn wir X als die Häufigkeit des Ereignisses Zahl definieren, gilt folgende Wahrscheinlichkeitsfunktion: 1/16 für X = 0 4/16 = 1/4 für X = 1 6/16 für X = 2 f (x) = 4/16 für X = 3 1/16 für X = 4 0 sonst 5 / 18

Einführung Die Verteilungsfunktion Die Verteilungsfunktion einer Variablen gibt an, wie groß die Wahrscheinlichkeit für einen Wert X x i ist. F (x) = P(X x) = i:x i x f (x i ) Im Beispiel: 1/16 für X = 0 5/16 für X = 1 11/16 für X = 2 F (x) = 15/16 für X = 3 16/16 = 1 für X = 4 0 sonst 6 / 18

Einführung Empirische Verteilung: Beispiel Wahrscheinlichkeitsfunktion und Verteilungsfunktion können wir verstehen in Analogie zu empirischen Verteilungen. Die Prozente entsprechen der Wahrscheinlichkeitsfunktion. Die kumulierten Prozente entsprechen der Verteilungsfunktion: Soundsoviel Prozent haben einen Wert nicht größer als 1, soundsoviel Prozent haben einen Wert nicht größer als 2, usw. 7 / 18

Einführung Erwartungswert einer diskreten Zufallsvariablen Der Erwartungswert E(X ) oder µ ist der theoretisch zu erwartende Mittelwert der Verteilung: n E(X ) = x 1 p 1 +... + x k p k +... = x i p i i 1 Im Beispiel: E(X ) = (0 0,0625) + (1 0,25) + (2 0,375) + (3 0,25) + (4 0,0625) = 0 + 0,25 + 0,75 + 0,75 + 0,25 = 2 Bei vier Münzwürfen erwarten wir also im Durchschnitt zweimal Zahl. 8 / 18

Einführung Varianz einer diskreten Zufallsvariablen Die Varianz einer Zufallsvariablen ist eine Kenngröße für das Ausmaß, in dem die Werte um den Erwartungswert streuen: σ 2 = Var(X ) = (x 1 µ) 2 p 1 +... (x k µ) 2 p k +... = i 1 (x i µ) 2 p i Im Beispiel: Var(X ) = (0 2) 2 0,0625 + (1 2) 2 0,25 + (2 2) 2 0,375 + (3 2) 2 0,25 + (4 2) 2 0,0625 = 0,25 + 0,25 + 0 + 0,25 + 0,25 = 1 9 / 18

Wahrscheinlichkeiten für binäre Merkmale Binäre Merkmale: Der Bernoulli-Vorgang Ein Bernoulli-Experiment oder Bernoulli-Vorgang ist ein einmal durchgeführter Zufallsvorgang mit Ergebnis 0 oder 1 (Nein/Ja; nicht arm/arm;... ). Wir schreiben: P(X = 1) = π; P(X = 0) = 1 π Wird ein Bernoulli-Vorgang (mehrfach) wiederholt, interessieren wir uns für die Häufigkeit, mit der Ereignis 1 auftritt. Zunächst gilt: Die Wahrscheinlichkeit für eine bestimmte Stichprobenrealisierung (z.b. 1 x Ja, 2 x Nein) wird berechnet als (Multiplikationstheorem!): π n1 (1 π) n n 1 mit n = Stichprobenumfang und n 1 = Häufigkeit von 1. 10 / 18

Wahrscheinlichkeiten für binäre Merkmale Beispiele für wiederholte Bernoulli-Vorgänge π n1 (1 π) n n 1 Beispiel 1: Zwei Würfe mit Münze 0,0: 0,5 0 0,5 2 = 0,25 1,0: 0,5 1 0,5 1 = 0,25 0,1: 0,5 1 0,5 1 = 0,25 1,1: 0,5 2 0,5 0 = 0,25 Beispiel 2: Ziehen von As aus Kartenstapel (mit Zurücklegen) 0,0: 1/13 0 12/13 2 = 1 0,852 = 0,852 1,0: 1/13 1 12/13 1 = 0,077 0,923 = 0,071 0,1: 1/13 1 12/13 1 = 0,077 0,923 = 0,071 1,1: 1/13 2 12/13 0 = 0,006 1 = 0,006 11 / 18

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung Die Reihenfolge der Ziehung der Elemente ist (für unsere Zwecke) irrelevant. Die Wahrscheinlichkeit eines Wertes n 1 (Häufigkeit der,günstigen Ereignisse) in Stichprobe mit Umfang n kann berechnet werden nach ( ) n P(X = n 1 ) = π n1 (1 π) n n 1 = n 1 n! (n n 1 )! n 1! πn1 (1 π) n n 1 Bezeichnung: Eine Variable ist B(n, π)-verteilt, kurz X B(n, π) 12 / 18

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung: Beispiel Eine Variable sei B(3, 0,3)-verteilt ( ) 3 P(X = 1) = (0,3) 1 (1 0,3) 3 1 1 = 3! 2!1! 0,31 0,7 2 = 3 2 1 0,3 1 0,7 2 2 = 0,441 Weiter erhalten wir: P(X = 0) = 0,343, P(X = 2) = 0,189 und P(X = 3) = 0,027. 13 / 18

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung: Beispiel 1.4.8.3.6.2.4.1.2 0 X=0 X=1 X=2 X=3 X=0 X=1 X=2 X=3 Wahrscheinlichkeitsfunktion (links) und Verteilungsfunktion (rechts) lassen sich auch graphisch darstellen. 14 / 18

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung: E(X) und Var(X) Im Fall der Binomialverteilung lassen sich der Erwartungswert und die Varianz besonders einfach errechnen: E(X ) = n π Var(X ) = n π (1 π) Wir erhalten in unseren Beispielen: Vier Münzwürfe: E(X) = 4 0,5 = 2, Var(X) = 4 0,5 0,5 = 1 X B(3, 0,3): E(X) = 3 0,3 = 0,9, Var(X) = 3 0,3 0,7 = 0,63 15 / 18

Wahrscheinlichkeiten für binäre Merkmale Die hypergeometrische Verteilung Für Stichproben eines binären Merkmals ohne Zurücklegen verwenden wir die hypergeometrische Verteilung X H(n, N 1, N): f (x) = P(X = n 1 ) = ( N1 n 1 ) ( ) N N1 n n 1 ( ) N n N=Umfang der Grundgesamtheit, N 1 =Anzahl der Elemente mit gesuchter Merkmalsausprägung (= Ausprägung 1), n=gesamtumfang der Stichprobe, n 1 =Teilstichprobe mit Ausprägung 1 16 / 18

Wahrscheinlichkeiten für binäre Merkmale Die hypergeometrische Verteilung: E(X) und Var(X) Für eine Verteilung X H(n, N 1, N) gilt: E(X ) = n N1 N ( Var(X ) = n N1 N 1 N ) 1 N n N N 1 E(X) entspricht also dem Erwartungswert einer B(n, π)-verteilten Zufallsvariablen, die Varianz ist aber um den Faktor (N-n)/(N-1) kleiner. Das liegt auch nahe, da durch das Nicht-Zurücklegen die Variabilität verringert wird. Ist n/n klein, tendiert (N-n)/(N-1) gegen 1, kann also vernachlässigt werden. 17 / 18

Wahrscheinlichkeiten für binäre Merkmale Fazit zur diskreten Verteilungen Wir haben uns hier ausschließlich mit einfachen Fällen befasst, die das Prinzip der Verteilung einer Zufallsvariablen verdeutlichen. Es gibt zahlreiche andere diskrete Verteilungen, etwa für mehrstufige nominalskalierte Variablen, insbesondere die Multinomialverteilung, sowie metrische Variablen, etwa die geometrische oder die Poisson-Verteilung. Dazu findet man in unterschiedlichen Lehrbüchern unterschiedlich detailliert Auskunft. 18 / 18