Diskrete Wa.verteilungen: Eine Zooführung. Statistik (Biol./Pharm./HST) FS 2015

Ähnliche Dokumente
Kategorielle Daten. Seminar für Statistik Markus Kalisch

Hypergeometrische Verteilung

Kursthemen 11. Sitzung. Spezielle diskrete Verteilungen: Auswahlexperimente. Spezielle diskrete Verteilungen: Auswahlexperimente

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

A: Beispiele Beispiel 1: Zwei Zufallsvariablen X und Y besitzen die beiden folgenden Wahrscheinlichkeitsfunktionen:

Biostatistik, Winter 2011/12

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Biostatistik, Sommer 2017

Anliegen: Beschreibung von Versuchsergebnissen mit Zahlen, um mit Zahlen bzw. bekannten Funktionen rechnen zu können.

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Logistische Regression

Einführung in Quantitative Methoden

Statistik und Wahrscheinlichkeitsrechnung

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Lösungen ausgewählter Übungsaufgaben zum Buch. Elementare Stochastik (Springer Spektrum, 2012) Teil 3: Aufgaben zu den Kapiteln 5 und 6

TU DORTMUND Sommersemester 2018

7.7 Spezielle diskrete Wahrscheinlichkeitsverteilungen

Wirtschaftsmathematik

Vorlesung 3a. Der Erwartungswert. von diskreten reellwertigen Zufallsvariablen

Prüfungsvorbereitungskurs Höhere Mathematik 3

Übungsrunde 6, Gruppe 2 LVA , Übungsrunde 5, Gruppe 2, Markus Nemetz, TU Wien, 11/2006

Binomialverteilung. Statistik für SoziologInnen 1 Diskrete Verteilungsmodelle. Marcus Hudec

Vorlesung 4b. Die Varianz

Prüfungsvorbereitungskurs Höhere Mathematik 3

2.2 Binomialverteilung, Hypergeometrische Verteilung, Poissonverteilung

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Verteilungen eindimensionaler diskreter Zufallsvariablen Diskrete Verteilungen. Hypergeometrische Verteilung Poissonverteilung

Modelle diskreter Zufallsvariablen

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Statistik für Bachelorund Masterstudenten

Vorlesung 4b. Die Varianz

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Kapitel IV - Spezielle Verteilungen: Diskrete Verteilungen

Fit for Abi & Study Stochastik

4 Diskrete Zufallsvariablen

Wahrscheinlichkeitstheorie und Statistik

Wieviele Frösche sind im Teich?

Vorlesung: Statistik II für Wirtschaftswissenschaft

Eine Zufallsvariable wird als diskret bezeichnet, wenn sie nur endlich viele oder abzählbar unendlich viele Werte annimmt.

Ausgewählte spezielle Verteilungen

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Hauptklausur zur Stochastik für Lehramt

Wahrscheinlichkeitsrechnung Übung Aufgabe 2.b und 3

Theorie Parameterschätzung Ausblick. Schätzung. Raimar Sandner. Studentenseminar "Statistische Methoden in der Physik"

Wahrscheinlichkeit und Statistik BSc D-INFK

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Statistische Inferenz

D-ITET Wahrscheinlichkeitstheorie und Statistik FS 2017 Prof. P. Nolin. Serie 11

Wie sch atzt man effizient?

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum),

Dieses Quiz soll Ihnen helfen, Kapitel besser zu verstehen.

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Wie groß ist die Wahrscheinlichkeit Pr[X > y + x X > x]? Da bei den ersten x Versuchen kein Erfolg eintrat, stellen wir uns vor, dass das

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich SS 2016 Prof. Dr. P. Embrechts August BSc INFK. Nachname. Vorname.

Wichtige Definitionen und Aussagen

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Stellen Sie den Sachverhalt durch eine geeignete Vierfeldertafel mit relativen Häufigkeiten

Statistik für Informatiker, SS Verteilungen mit Dichte

Biostatistik, Winter 2011/12

3 Statistische Schätzungen

Stochastik und Statistik für Ingenieure Vorlesung 4

Statistik für Ingenieure Vorlesung 2

PVK Statistik Carlos Mora

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

Mathematik für Biologen

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master)

Wahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme

Aufgabe Punkte

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Vet. Med. Uni. Budapest 4. Übung Biomathematik 2017

Statistik (für Biol./Pharm. Wiss.) Einführung

7.2 Moment und Varianz

Binomialverteilung Vertrauensbereich für den Anteil

Reelle Zufallsvariablen

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Vorlesung 9b. Bedingte Verteilungen und bedingte Wahrscheinlichkeiten

Kugelschreiber-Aufgabe Bayern LK 1986

Referenten: Gina Spieler, Beatrice Bressau, Laura Uhlmann Veranstaltung: Statistik für das Lehramt Dozent: Martin Tautenhahn

Stochastik für Studierende der Informatik

6 Kombinatorik: Einschluß-Ausschluß Formel. 6.1 Indikatorfunktionen. I A ist eine Zufallsvariable E[I A ] = P (A) IĀ = 1 I A I A B = I A I B

falls rote Kugel im 1. Zug gezogen Die Ziehungen sind daher nicht unabhängig voneinander. Damit liegt kein Bernoulli-Prozess

Wahrscheinlichkeitsrechnung. Sommersemester Kurzskript

Aufgabe 1. Übung Wahrscheinlichkeitsrechnung Markus Kessler Seite 1 von 8. Die Ereignisse A, B und C erfüllen die Bedingungen

Vorwort Zufallsvariable X, Erwartungswert E(X), Varianz V(X) 1.1 Zufallsvariable oder Zufallsgröße Erwartungswert und Varianz...

7.5 Erwartungswert, Varianz

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Vorlesung: Statistik II für Wirtschaftswissenschaft

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Mathematische Statistik Aufgaben zum Üben. Schätzer

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0

Ü b u n g s b l a t t 7

Spezielle Verteilungen

Sammlung alter Klausuraufgaben zur Stochastik keine Abgabe keine Besprechung in den Tutorien

Stochastische Unabhängigkeit, bedingte Wahrscheinlichkeiten

Der Erwartungswert E[g(X)] von g(x) ist definiert. g(x k )w(x = x k ),

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

1. Grundbegri e der Stochastik

Häufigkeitsverteilungen

Transkript:

Diskrete Wa.verteilungen: Eine Zooführung Statistik (Biol./Pharm./HST) FS 2015

Admin: Übungsbetrieb & Quiz Gruppeneinteilung selbstständig via Webseite Eine e-mail mit Link für Einschreibung nur nach Belegung dieser Vorlesung in mystudies Genau eine e-mail mit personalisiertem Link für Einschreibung Link behalten! Eine 2. e-mail mit Link für Übungen nur nach Belegung dieser Vorlesung in mystudies Genau eine e-mail mit personalisiertem Link für Übungen Link behalten! Jede Woche erscheinen auf dieser Seite - Link zur Eingabe der Online Aufgben - Lösungen und Auswertung 2

Warum Wa.verteilungen? George E.P. Box Essentially, all models are wrong, but some are useful. Standard Wa.verteilungen Details dieser Verteilungen in Büchern oder Software festgehalten Viele typische Probleme einfach lösbar

Verteilungs-Zoo: Diskrete Wa.verteilungen Binomialverteilung Uniforme Verteilung Poisson Verteilung Hypergeometrische Verteilung 4

Binomialverteilung Situation: Ziehe n Lose an Losbude; gleiche Gewinnwa. für alle Lose; Lose unabhängig ZV X: Anzahl Gewinne unter n Losen X Bin(n, π) X ist binomial verteilt mit Parametern n und π P X = x = n x πx 1 π n x, x {0,1,, n} E X = n π, Var X = n π 1 π probability mass function (pmf) cumulative mass function (cmf) 5

Quiz: Binomialverteilung Kampf der Departemente Gegeben: X ~ Bin(20,0.1); wie gross ist P(X = 2)? 6

Beispiel: Klinische Studien Giftig? Genau: Wirksam? Nebenwirkungen? Grob: Wirksam? 7

Bsp: Phase 2 Hersteller behauptet: Neues Medikament wirkt in 80% der Fällen In einer Phase 2 Studie mit 100 Patienten werden aber nur 67 gesund Ist das plausibel, wenn die Heilungswa. 80% ist? X: Anzahl geheilter Patienten Falls Hersteller recht hat: X ~ Bin(n = 100, π = 0.8) Wie testen wir die Behauptung π = 0.8? Versuch 1: P X = 67 = 0.0008 Sind Sie überzeugt? 8

Bsp: Phase 2 - Problem X ~ Bin(n = 100, π = 0.8) Angenommen, wir haben genau n π = 80 Genesungen gesehen; wir sollten dem Hersteller also unbedingt glauben n=100 n=1000 n=10 000 n=100 000 P(X = nπ) 0.10 0.03 0.01 0.003 P X = 67 ist keine gute Kennzahl, weil die Wa. für jede beliebige Zahl klein wird, wenn man nur genug Beobachtungen hat! n=100 n=1000 n=10 000 n=100 000 P(X nπ) 0.54 0.51 0.504 0.501 P X 67 ist eine gute Kennzahl; sie ist, unabhängig von der Stichprobengrösse, leichter zu interpretieren. p-wert ( Wa. für Beob. oder etwas noch extremeres ; später mehr dazu ) 9

Bsp: Phase 2 Hersteller behauptet: Neues Medikament wirkt in 80% der Fällen In einer Phase 2 Studie mit 100 Patienten werden aber nur 67 gesund Ist das plausibel, wenn die Heilungswa. 80% ist? X: Anzahl geheilter Patienten Falls Hersteller recht hat: X ~ Bin(n = 100, π = 0.8) Wie testen wir diese Behauptung? Versuch 2: P X 67 = 0.001 Beobachtung und Hypothese passen nicht zusammen; vermutlich wirkt das Medikament schlechter als 80%. 10

Uniforme Verteilung Situation: Ziehe eine Zahle aus {1,2,,n}; alle Zahlen sind gleich wahrscheinlich ZV X: Gezogene Zahl X~Unif n X ist uniform verteilt auf den Zahlen 1 bis n P X = x = 1, x {1,2,, n} n E X = n+1 2, Var X = n+1 n 1 12 pmf cmf 11

Bsp: Sind Geburtstage uniform verteilt? Wochentag Wochenende Ja, in grober Näherung schon 12

Poisson Verteilung Situation: Seltene Ereignisse werden in einem vorgegebenen Zeitraum gezählt ZV X: Anzahl beobachteter Ereignisse X~Pois λ X ist poisson verteilt mit Paramter λ P X = x = λx x! exp λ E X = λ, Var X = λ, x 0,1,, pmf cmf 13

Bsp: Ist die Anzahl Kriege pro Jahr poisson verteilt? (1500-1930, weltweit) 14

Besonderheit der Poissonverteilung Angenommen: - X~Pois λ 1, Y~Pois λ 2 - X, Y sind unabhängig Bilde neue Zufallsvariable: Z = X + Y Dann gilt: Z~Pois(λ 1 + λ 2 ) Das gilt normalerweise nicht! 15

Normalerweise: Summe von zwei Verteilungen gibt neue Verteilung Bsp: X~Unif 1,2,3,4,5,6, Y~Unif 1,2,3,4,5,6 X, Y sind unabhängig Z = X + Y ist nicht uniform verteilt (Augensumme 2 ist selten, Augensumme 7 ist häufig) 16

Hypergeometrische Verteilung Situation: Urne mit N Kugeln; m sind markiert; ziehen n Kugeln ohne Zurücklegen; wie viele markierte Kugeln? ZV X: Anzahl markierter gezogener Kugeln X~Hyper(N, n, m) X ist hypergeometrisch verteilt mit Paramtern N, n und m P X = x = m x E X = n m N N m n x N n günstig möglich x {0,1,, min n, m }, Var X kompliziert; siehe z.b. Wikipedia pmf cmf 17

Bsp: Phase 3 Studie Wirksamer als Placebo? Doppel-blinde, randomisierte Studie Gezogene und markierte Bälle Markierte Bälle (m) Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Gezogene Bälle (n) Bälle in Urne (N) Falls Medikament keine Wirkung hat: Es gibt 24 Personen, bei denen unabhängig von der Gruppenzuteilung fest steht, dass sie gesund werden Urnenmodell Hypergeometrische Verteilung 18

Bsp: Phase 3 Studie Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 ZV X: Anzahl geheilter Patienten in Medikamenten-Gruppe Falls Medikament keine Wirkung hat: X~Hyper(N = 45, m = 24, n = 25) Ist es dann plausibel in der Medikamenten-Gruppe 15 oder mehr geheilte Patienten zu beobachten? P X 15 = 1 P X 14 = 1 0.76 = 0.24 p-wert Falls das Medikament nicht wirkt, ist es durchaus plausibel 15 oder mehr geheilte Patienten in der Medikamentengruppe zu beobachten 19

Momentenmethode, Bsp 1: 100 zufällig ausgewählte Patienten bekommen neues Medikament 54 werden gesund Wie gross ist wohl die Wirkwahrscheinlichkeit in der gesamten Bevölkerung? X: Anzahl Patienten, die gesund wurden X~Bin n = 100, π =? Beobachtung: x = 54 Momentenmethode um π zu schätzen: E X = n π; E X x = 54 x n π π x n = 0.54 Erstes Moment 20

Momentenmethode, Bsp 2: Capture-Recapture Wie gross ist eine Population, von der wir sonst gar nichts weiter wissen? Bsp: Ameisen in Ameisenhaufen; Fische in See Lincoln-Peterson Methode: - Fange m zufällige Tiere, markiere, lasse wieder laufen - Fange n zufällige Tiere - ZV X: Anzahl markierter Tiere im zweiten Fang X~Hyper(N, n, m), wobei N die Grösse der Pop. ist; x markierte Tiere im zweiten Fang Idee: «Erwartungswert Beobachtung» - E X = n m n m x N N x Ungenau, aber OK für richtige Grössenordnung Erstes Moment 21

Maximum-Likelihood Methode 1/3 Bsp: n=600 Personen erhalten neues Medikament; x = 30 haben als Nebenwirkung Kopfschmerzen Wie gross ist der Anteil Personen mit diesen Nebenwirkungen in der Gesamtbevölkerung (>600)? Binomialverteilung: X: Anzahl Personen mit Kopfschmerzen X~Bin(n = 600, π) P X = 30 = 600 30 π30 1 π 570 Maximum-Likelihood Estimate (MLE) π für π, ist der Wert, der P X = 30 maximiert. 22

Maximum-Likelihood Methode 2/3: Computer Berechne P(X = 30) für verschiedene Werte von π mit dem Computer: π 0.03 0.04 0.05 0.06 0.07 P(X = 30) 0.002 0.036 0.075 0.042 0.010 Maximum π 0.05 23

Maximum-Likelihood Methode 3/3: Analytisch P X = x = n x πx 1 π n x =: f(π) likelihood Analysis: Finde π, sodass f π maximal ist (s. Skript S.28) Ergebnis: π = x n = 30 600 = 0.05 Wir erwarten, dass bei etwa 5% der Gesamtbevölkerung Kopfschmerzen als Nebenwirkung auftritt. 24