Willkommen zur Vorlesung Statistik (Master)

Ähnliche Dokumente
P (X = 2) = 1/36, P (X = 3) = 2/36,...

Binomialverteilung. Statistik für SoziologInnen 1 Diskrete Verteilungsmodelle. Marcus Hudec

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Willkommen zur Vorlesung Statistik (Master)

A: Beispiele Beispiel 1: Zwei Zufallsvariablen X und Y besitzen die beiden folgenden Wahrscheinlichkeitsfunktionen:

Zufallsvariablen [random variable]

Willkommen zur Vorlesung Statistik (Master)

Hypergeometrische Verteilung

Wahrscheinlichkeitsrechnung und schließende Statistik

1. Ziehg.: N M. falls nicht-rote K. in 1. Ziehg. gezogen

Weihnachtszettel zur Vorlesung. Stochastik I. Wintersemester 2011/2012

I. Deskriptive Statistik 1

falls rote Kugel im 1. Zug gezogen Die Ziehungen sind daher nicht unabhängig voneinander. Damit liegt kein Bernoulli-Prozess

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Zufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten

Grundlegende Eigenschaften von Punktschätzern

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Einführung in die Wahrscheinlichkeitsrechnung

Basistext - Wahrscheinlichkeitsrechnung

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik. Mögliche Ergebnisse, auch Elementarereignisse bezeichnet

Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?

ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)

$ % + 0 sonst. " p für X =1 $

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Schließende Statistik

3. Kombinatorik und Wahrscheinlichkeit

Tabelle 11.2 zeigt die gemeinsame Wahrscheinlichkeitsfunktion und die Randverteilungen

10. Vorlesung. Grundlagen in Statistik. Seite 291. Martin-Luther-Universität Halle/Wittenberg

Definition 2.1 Der Erwartungswert einer diskreten Zufallsvariablen mit Wahrscheinlichkeitsfunktion

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung

Gemeinsame Wahrscheinlichkeitsverteilungen

Vorwort Zufallsvariable X, Erwartungswert E(X), Varianz V(X) 1.1 Zufallsvariable oder Zufallsgröße Erwartungswert und Varianz...

Informatik II Grundbegriffe der Wahrscheinlichkeitsrechnung

Stochastik und Statistik für Ingenieure Vorlesung 4

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

4 Diskrete Wahrscheinlichkeitsverteilungen

Keine Panik vor Statistik!

Grundbegriffe der Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung für die Mittelstufe

Übungsaufgaben, Statistik 1

Vorlesung 8b. Bedingte Erwartung, bedingte Varianz, bedingte Verteilung, bedingte Wahrscheinlichkeiten

Wahrscheinlichkeitsrechnung und Quantentheorie

Übungsblatt 9. f(x) = e x, für 0 x

Es wird aus einer Urne mit N Kugeln gezogen, die mit den Zahlen 1,..., N durchnummiert sind. (N n)! n! = N! (N n)!n! =

Diskrete Wahrscheinlichkeitsverteilungen

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

1.6 Der Vorzeichentest

3.3 Bedingte Wahrscheinlichkeit

Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen

Lernzusammenfassung für die Klausur. Inhaltsverzeichnis. Stochastik im SS 2001 bei Professor Sturm

Übungsrunde 5, Gruppe 2 LVA , Übungsrunde 5, Gruppe 2, Markus Nemetz, TU Wien, 11/2006

Einführung in die Maximum Likelihood Methodik

Kapitel VI - Lage- und Streuungsparameter

Mathematische und statistische Methoden II

1 Dichte- und Verteilungsfunktion

Beispiel Zusammengesetzte Zufallsvariablen

Statistik II. Statistische Tests. Statistik II

Diskrete Strukturen WiSe 2012/13 in Trier

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Stetige Verteilungen. A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Ü b u n g s b l a t t 10

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Messtechnik und Analytik

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Die Varianz (Streuung) Definition

Kapitel 5. Stochastik

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

Übungsaufgaben zu Statistik II


Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Ziegenproblem, Monty-Hall-Problem, Wahrscheinlichkeitsrechnung. Ziegenproblem, Monty-Hall-Problem, Drei-Türen-Problem

Bitte bearbeite zunächst alle Aufgaben bevor du einen Blick in die Lösungen wirfst.

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

9 Erwartungswert, Varianz und Standardabweichung einer Zufallsgröÿe

Univariates Datenmaterial

Inferenzstatistik (=schließende Statistik)

Ü b u n g s b l a t t 15

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Überblick. Linguistische Anwendungen: æ Spracherkennung æ Textretrival æ probabilistische Grammatiken: z.b. Disambiguierung. Problem: woher Daten?

Mathematik für Biologen

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Nicht-parametrische Statistik Eine kleine Einführung

Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure

Wahrscheinlichkeitsrechnung und schließende Statistik

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen

Mathematik für Biologen

Ü b u n g s b l a t t 13

2 Zufallsvariable, Verteilungen, Erwartungswert

Einführung in die Induktive Statistik: Testen von Hypothesen

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Zufallsgröße: X : Ω R mit X : ω Anzahl der geworfenen K`s

Stochastik Übungsaufgaben (Taschenrechner erlaubt) Binomialverteilung Oberstufe

Inhaltsverzeichnis. Teil I Einführung

Statistik für Ökonomen

Transkript:

Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang Ludwig-Mayerhofer Schließende Statistik Universität Siegen

Thema der nächsten beiden Vorlesungen Die nächsten beiden Vorlesungen beschäftigen sich anhand einfacher Beispiele mit folgender Frage: Wenn aus einer bekannten Grundgesamtheit Zufallsstichproben gezogen werden was können wir aufgrund theoretischer Überlegungen über die Ergebnisse der Stichprobenziehungen sagen? Die Ergebnisse charakterisieren wir auf die gleiche Weise, wie wir empirisch beobachtete Daten kennzeichnen: Beschreibung der Verteilung durch Angabe relativer Häufigkeiten (bzw. Wahrscheinlichkeiten) für die einzelnen Werte Zusammenfassende Kennzeichnung durch Mittelwert und Streuung (Varianz). Achtung der Mittelwert von Zufallsvariablen wird Erwartungswert genannt (es ist der Wert, den wir aufgrund theoretischer Überlegungen im Durchschnitt erwarten). Dies wird im folgenden anhand diskreter und stetiger Zufallsvariablen durchdekliniert. 2 / 19

Einführung Diskrete Zufallsvariablen 3 / 19

Einführung Zufallsvariablen Unter einer Zufallsvariable versteht man eine Variable, deren Werte bzw. Ausprägungen das Ergebnis eines Zufallsvorgangs sind. Beispiele: Eine Münze wird n mal geworfen wie oft resultiert Kopf? Analogon zur Stichprobenziehung: Aus einer Grundgesamtheit werden n Personen gezogen wie oft resultiert Person mit Eigenschaft A 1 (z. B. arm )? Ein Würfel wird n mal geworfen welche Augenzahl ergibt sich im Durchschnitt? Analogon zur Stichprobenziehung: Aus einer Grundgesamtheit werden n Personen gezogen welches Einkommen haben die Befragten im Durchschnitt? Im ersten Fall gibt es nur eine endliche Zahl von Ausprägungen es handelt sich um eine diskrete Zufallsvariable. 4 / 19

Einführung Charakterisierung einer diskreten Zufallsvariablen Eine diskrete Zufallsvariable wird durch ihre Wahrscheinlichkeitsfunktion charakterisiert: f (x) = { P(X = x i ) = p i für x = x i, i = 1,2,... 0 sonst Die Wahrscheinlichkeitsfunktion gibt also für jede Ausprägung von X an, wie wahrscheinlich sie ist. 5 / 19

Einführung Beispiel: Eine Münze wird viermal geworfen Vier Würfe: {K, K, K, K} {K, K, K, Z} {K, K, Z, K} {K, Z, K, K} {Z, K, K, K} {K, K, Z, Z} {K, Z, K, Z} {Z, K, K, Z} {K, Z, Z, K} {Z, K, Z, K} {Z, Z, K, K} {Z, Z, Z, K} {Z, Z, K, Z} {Z, K, Z, Z} {K, Z, Z, Z} {Z, Z, Z, Z} Wenn wir X als die Häufigkeit des Ereignisses Zahl definieren, gilt folgende Wahrscheinlichkeitsfunktion: 1/16 für X = 0 4/16 = 1/4 für X = 1 6/16 für X = 2 f (x) = 4/16 für X = 3 1/16 für X = 4 0 sonst 6 / 19

Einführung Die Verteilungsfunktion Die Verteilungsfunktion einer Variablen gibt an, wie groß die Wahrscheinlichkeit für einen Wert X x i ist. F (x) = P(X x) = i:x i x f (x i ) Im Beispiel: 1/16 für X = 0 5/16 für X = 1 11/16 für X = 2 F (x) = 15/16 für X = 3 16/16 = 1 für X = 4 0 sonst 7 / 19

Einführung Empirische Verteilung: Beispiel Wahrscheinlichkeitsfunktion und Verteilungsfunktion können wir verstehen in Analogie zu empirischen Verteilungen. Die Prozente entsprechen der Wahrscheinlichkeitsfunktion. Die kumulierten Prozente entsprechen der Verteilungsfunktion: Soundsoviel Prozent haben einen Wert nicht größer als 1, soundsoviel Prozent haben einen Wert nicht größer als 2, usw. 8 / 19

Einführung Erwartungswert einer diskreten Zufallsvariablen Der Erwartungswert E(X ) oder µ ist der theoretisch zu erwartende Mittelwert der Verteilung: n E(X ) = x 1 p 1 +... + x k p k +... = x i p i i 1 Im Beispiel: E(X ) = (0 0,0625) + (1 0,25) + (2 0,375) + (3 0,25) + (4 0,0625) = 0 + 0,25 + 0,75 + 0,75 + 0,25 = 2 Bei vier Münzwürfen erwarten wir also im Durchschnitt zweimal Zahl. 9 / 19

Einführung Varianz einer diskreten Zufallsvariablen Die Varianz einer Zufallsvariablen ist eine Kenngröße für das Ausmaß, in dem die Werte um den Erwartungswert streuen: σ 2 = Var(X ) = (x 1 µ) 2 p 1 +... (x k µ) 2 p k +... = i 1 (x i µ) 2 p i Im Beispiel: Var(X ) = (0 2) 2 0,0625 + (1 2) 2 0,25 + (2 2) 2 0,375 + (3 2) 2 0,25 + (4 2) 2 0,0625 = 0,25 + 0,25 + 0 + 0,25 + 0,25 = 1 10 / 19

Wahrscheinlichkeiten für binäre Merkmale Binäre Merkmale: Der Bernoulli-Vorgang Ein Bernoulli-Experiment oder Bernoulli-Vorgang ist ein einmal durchgeführter Zufallsvorgang mit Ergebnis 0 oder 1 (Nein/Ja; nicht arm/arm;... ). Wir schreiben: P(X = 1) = π; P(X = 0) = 1 π Wird ein Bernoulli-Vorgang (mehrfach) wiederholt, interessieren wir uns für die Häufigkeit, mit der Ereignis 1 auftritt. Zunächst gilt: Die Wahrscheinlichkeit für eine bestimmte Stichprobenrealisierung (z.b. 1 0 0) wird berechnet als (Multiplikationstheorem!): π n1 (1 π) n n 1 mit n = Stichprobenumfang und n 1 = Häufigkeit von 1). 11 / 19

Wahrscheinlichkeiten für binäre Merkmale Beispiele für wiederholte Bernoulli-Vorgänge π n1 (1 π) n n 1 Beispiel 1: Zwei Würfe mit Münze 0,0: 0,5 0 0,5 2 = 0,25 1,0: 0,5 1 0,5 1 = 0,25 0,1: 0,5 1 0,5 1 = 0,25 1,1: 0,5 2 0,5 0 = 0,25 Beispiel 2: Ziehen von As aus Kartenstapel (mit Zurücklegen) 0,0: 1/13 0 12/13 2 = 1 0,852 = 0,852 1,0: 1/13 1 12/13 1 = 0,077 0,923 = 0,071 0,1: 1/13 1 12/13 1 = 0,077 0,923 = 0,071 1,1: 1/13 2 12/13 0 = 0,006 1 = 0,006 12 / 19

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung Die Reihenfolge der Ziehung der Elemente ist (für unsere Zwecke) irrelevant. Die Wahrscheinlichkeit eines Wertes n 1 (Häufigkeit der,günstigen Ereignisse) in Stichprobe mit Umfang n kann berechnet werden nach ( ) n P(X = n 1 ) = π n1 (1 π) n n 1 = n 1 n! (n n 1 )! n 1! πn1 (1 π) n n 1 Bezeichnung: Eine Variable ist B(n, π)-verteilt, kurz X B(n, π) 13 / 19

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung: Beispiel Eine Variable sei B(3, 0,3)-verteilt ( ) 3 P(X = 1) = (0,3) 1 (1 0,3) 3 1 1 = 3! 2!1! 0,31 0,7 2 = 3 2 1 0,3 1 0,7 2 2 = 0,441 Weiter erhalten wir: P(X = 0) = 0,343, P(X = 2) = 0,189 und P(X = 3) = 0,027. 14 / 19

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung: Beispiel 1.4.8.3.6.2.4.1.2 0 X=0 X=1 X=2 X=3 X=0 X=1 X=2 X=3 Wahrscheinlichkeitsfunktion (links) und Verteilungsfunktion (rechts) lassen sich auch graphisch darstellen. 15 / 19

Wahrscheinlichkeiten für binäre Merkmale Die Binomialverteilung: E(X) und Var(X) Im Fall der Binomialverteilung lassen sich der Erwartungswert und die Varianz besonders einfach errechnen: E(X ) = n π Var(X ) = n π (1 π) Wir erhalten in unseren Beispielen: Vier Münzwürfe: E(X) = 4 0,5 = 2, Var(X) = 4 0,5 0,5 = 1 X B(3, 0,3): E(X) = 3 0,3 = 0,9, Var(X) = 3 0,3 0,7 = 0,63 16 / 19

Wahrscheinlichkeiten für binäre Merkmale Die hypergeometrische Verteilung Für Stichproben eines binären Merkmals ohne Zurücklegen verwenden wir die hypergeometrische Verteilung X H(n, N 1, N): f (x) = P(X = n 1 ) = ( N1 n 1 ) ( ) N N1 n n 1 ( ) N n N=Umfang der Grundgesamtheit, N 1 =Anzahl der Elemente mit gesuchter Merkmalsausprägung (= Ausprägung 1), n=gesamtumfang der Stichprobe, n 1 =Teilstichprobe mit Ausprägung 1 17 / 19

Wahrscheinlichkeiten für binäre Merkmale Die hypergeometrische Verteilung: E(X) und Var(X) Für eine Verteilung X H(n, N 1, N) gilt: E(X ) = n N1 N ( Var(X ) = n N1 N 1 N ) 1 N n N N 1 E(X) entspricht also dem Erwartungswert einer B(n, π)-verteilten Zufallsvariablen, die Varianz ist aber um den Faktor (N-n)/(N-1) kleiner. Das liegt auch nahe, da durch das Nicht-Zurücklegen die Variabilität verringert wird. Ist n/n klein, tendiert (N-n)/(N-1) gegen 1, kann also vernachlässigt werden. 18 / 19

Wahrscheinlichkeiten für binäre Merkmale Fazit zur diskreten Verteilungen Wir haben uns hier ausschließlich mit einfachen Fällen befasst, die das Prinzip der Verteilung einer Zufallsvariablen verdeutlichen. Es gibt zahlreiche andere diskrete Verteilungen, etwa für mehrstufige nominalskalierte Variablen, insbesondere die Multinomialverteilung, sowie metrische Variablen, etwa die geometrische oder die Poisson-Verteilung. Dazu findet man in unterschiedlichen Lehrbüchern unterschiedlich detailliert Auskunft. 19 / 19