Mathematik IV: Statistik

Ähnliche Dokumente
Mathematik IV: Statistik. für D-UWIS, D-ERDW, D-USYS und D-HEST SS14

Statistik (für Biol./Pharm. Wiss.) Einführung

Statistik (für Biol./Pharm. Wiss.) Einführung

Zweiseitiger Binomialtest. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Mathematik IV: Statistik

Mathematik IV: Statistik

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Mathematik IV: Statistik

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Mathematik IV: Statistik

Auswertung und Lösung

Auswertung und Lösung

Wahrscheinlichkeit und Statistik BSc D-INFK

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

UE Statistik 1, SS 2015, letztes Update am 5. März Übungsbeispiele

Marek Chudý. Institut für Statistik und Operations Research UE Statistik 1. Sommersemester, 4.

Mathematische und statistische Methoden II

Schließende Statistik: Hypothesentests (Forts.)

Auswertung und Lösung

Statistik für Biologie und Pharmazeutische Wissenschaften. Markus Kalisch, Peter Bühlmann und Hansruedi Künsch Seminar für Statistik ETH Zürich

Statistik II für Betriebswirte Vorlesung 1

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Welche Axiome sind Grundlage der axiomatischen Wahrscheinlichkeitsdefinition von Kolmogoroff?

Statistik Einführung // Wahrscheinlichkeitstheorie 3 p.2/58

Fit for Abi & Study Stochastik

Dieses Quiz soll Ihnen helfen, Kapitel besser zu verstehen.

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Statistik für Biologie und Pharmazeutische Wissenschaften. Markus Kalisch, Peter Bühlmann und Hansruedi Künsch Seminar für Statistik ETH Zürich

Teil VIII Hypothesentests für zwei Stichproben

Bachelorprüfung: Mathematik 4 - Statistik (2 Stunden)

Tests für Erwartungswert & Median

Wichtige Definitionen und Aussagen

Statistik I für Humanund Sozialwissenschaften

Statistik II. Statistische Tests. Statistik II

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Schriftliche Prüfung (90 Minuten)

Zusammenfassung Stochastik

Woche 2: Zufallsvariablen

Statistik II. IV. Hypothesentests. Martin Huber

Kapitel 2. Wahrscheinlichkeit (wird heute behandelt) Kapitel 2. Wahrscheinlichkeit

Lineare Regression 1 Seminar für Statistik

Einführung in die Wahrscheinlichkeitstheorie Lösungsvorschläge zu Übungsblatt 1

Wahrscheinlichkeitstheorie

Tutorial: Anpassungstest

Diskrete Wa.verteilungen: Eine Zooführung. Statistik (Biol./Pharm./HST) FS 2015

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Grundlagen der Stochastik

Stochastik - Kapitel 2

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Teil II. Wahrscheinlichkeitsrechnung

Teil II. Wahrscheinlichkeitsrechnung. Inhaltsverzeichnis (Ausschnitt) Zufallsexperimente (Zufallsvorgänge) Ergebnisse

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Mathematische und statistische Methoden II

Teil VII Hypothesentests für eine Stichprobe

Kapitel 2 Wahrscheinlichkeitsrechnung

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Mathematik für Biologen

Einführung in die Wahrscheinlichkeitsrechnung

Tutorial:Unabhängigkeitstest

Mengenlehre. Diskrete Strukturen. Sommersemester Uta Priss ZeLL, Ostfalia. Hausaufgaben Grundbegriffe Ein Paradox Ausblick

Statistisches Testen

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Rumpfskript. Elementare Wahrscheinlichkeitsrechnung. Prof. Dr. Ralf Runde Statistik und Ökonometrie, Universität Siegen

Einführung in die statistische Testtheorie

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Beurteilende Statistik

Übungen Abgabetermin: Freitag, , 10 Uhr

Wahrscheinlichkeitsrechnung und Statistik

Einführung in die Wahrscheinlichkeitsrechnung

Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

3 Grundlagen statistischer Tests (Kap. 8 IS)

Einführung Statistik Weiterbildungs-Lehrgang Markus Kalisch, Lukas Meier, Peter Bühlmann, Hansruedi Künsch und Alain Hauser

Testen von Hypothesen, Beurteilende Statistik

Bei 10 dieser Würfe wurde gleichzeitig eine 1 gewürfelt. Bei 25 dieser Würfe wurde gleichzeitig eine Augenzahl größer als 2 gewürfelt.

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Kapitel 5 Stochastische Unabhängigkeit

Einführung in die Induktive Statistik: Testen von Hypothesen

Technische Universität München SS 2006 Zentrum Mathematik Blatt 7 Prof. Dr. J. Hartl Dr. Hannes Petermeier Dr. Cornelia Eder Dipl.-Ing.

Statistik II. IV. Hypothesentests. Martin Huber

Übungsscheinklausur,

Wahrscheinlichkeit und Statistik BSc D-INFK

Interaktives Skriptum: Elementare Wahrscheinlichkeitsrechnung

Statistik II Übung 3: Hypothesentests Aktualisiert am

Einführung in die Wahrscheinlichkeitstheorie Lösungsvorschläge zu Übungsblatt 4

Testen von Hypothesen:

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

Wahrscheinlichkeitsrechnung für die Mittelstufe

Organisation der Vorlesung. Wochen 1 und 2: Einführung, Wahrscheinlichkeit. Prüfungen. Kursinhalt

Organisation der Vorlesung. Wochen 1 und 2: Einführung, Wahrscheinlichkeit. Prüfungen. Kursinhalt

Forschungsstatistik I

Übungsaufgaben zum Kapitel Baumdiagramme - Bernoulli

Abiturvorbereitung Alkoholsünder, bedingte Wahrscheinlichkeit, Hypothesentest Aufgabenblatt

Grundwissen. 8. Jahrgangsstufe. Mathematik

Grundbegriffe der Wahrscheinlichkeitsrechnung

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Population und Stichprobe: Wahrscheinlichkeitstheorie

Einführung in die Wahrscheinlichkeitstheorie Lösungsvorschläge zu Übungsblatt 2

Transkript:

für D-UWIS, D-ERDW, D-USYS und D-HEST SS16 Daniel Stekhoven 25.02.2016 1

Hygienische Reiniger Wissenschaftliche Studie 10 000 Reinigungsversuche, 6 Fälle mit mehr als 1 Bakterien Stimmt s jetzt oder was? Binomialtest: Nein! 95%-Vertrauensintervall für W keit ist [0.0002, 0.0013] Daniel Stekhoven 25.02.2016 2

und überhaupt: oder in unserem Fall: Konzentration von Bakterien im menschlichen Speichel [ml -1 ] HTTP://XKCD.COM/1161/ Wirkung von Sagrotan 5 x 10 8 x 0.05 x 0.001 = 25 000 Volumen eines einzelnen Tropfens [ml] Ew. Daniel Stekhoven 25.02.2016 3

Wie genau ist der Barometer am Handgelenk? Bei jeweils 971 mbar in der Uhr wird eine Kontrollmessung gemacht! Gib einen Bereich an, in welchem sich der Mittelwert von sehr vielen Messungen mit 95% W keit befindet. Kontrollmessungen: m 1 =968.35, m 2 =970.10,, m 10 =971.35 t-test: 95%-Vertrauensintervall für Einstellung der Uhr ist [967.20 mbar, 971.89 mbar] Daniel Stekhoven 25.02.2016 4

Regression in der Forschung Vergleiche von Verteilungen lineare Regression Lineare Regression: Ein kleiner P-Wert (P 0.05) gibt einen Zusammenhang der untersuchten Beobachtungen an Daniel Stekhoven 25.02.2016 5

Lernziele der Vorlesung Grundkonzepte der Wahrscheinlichkeit und Statistik Kennenlernen der statistischen Software Mit Ungenauigkeit umgehen können: Punktschätzungen Vertrauensintervalle Hypothesentests Konkret an den Beispielen: Binomialtest t-test Lineare Regression Bedeutung und Missdeutung von Statistik kennen Daniel Stekhoven 25.02.2016 6

Bedeutung der Statistik im Studium Physikalisch-chemisches Praktikum Systemvertiefungen (Atmosphäre und Klima, Ökologie und Evolution, Engineering and Environmental Geophysics, ) Masterarbeit Guidelines for Evaluation and Awarding Marks (USYS): «Have the results been appropriately tested by statistical analyses?» Statistische Beratung an der ETH: beratung@stat.math.ethz.ch Wissenschaftliche Paper Statistische Auswertung = Standard! Anforderungen an die Qualität der Statistik steigen Daniel Stekhoven 25.02.2016 7

Wie läuft die Vorlesung ab Vertiefen: Skript lesen Einführungen und Schwerpunkte in der Vorlesung Verdauen: Übungen / Quiz Anwenden: R Videos / Übungen Lernziele für jedes Kapitel im Skript Daniel Stekhoven 25.02.2016 8

R Aufgaben und Videos (etutor) Vorlesung: Papier Praxis: Computer «Die» Programmiersprache für Statisik: http://cran.r-project.org «Die» Umgebung für R: http://www.rstudio.com etutor? via Homepage und Moodle (nethz Login) Daniel Stekhoven 25.02.2016 9

Übungsserien Ablauf: Online: Di Abend Serie/Lösung letze Woche Vorbesprechung/Abgabe: Mi/Do Verdauen: 1-3 Theorieaufgaben Kann handschriftlich gemacht werden (falls Sie abgeben) Anwenden: 1 R Aufgabe Minimum: R Skript mit Input und Output Empfohlen: Einzelnes PDF/HTML/DOCX mit Input und Output kombiniert (R Markdown) Daniel Stekhoven 25.02.2016 10

R Markdown Daniel Stekhoven 25.02.2016 11

Fangt jetzt mit Literate Programming an! Einhorn Tip 1: Ausprobieren! Tip 2: The truth is out there! Literate Statistical Programming with knitr (25 min): https://www.youtube.com/watch?v=ycjb1hbc-1q R Markdown Cheat Sheet: https://www.rstudio.com/wp-content/uploads/2015/02/rmarkdown-cheatsheet.pdf R Markdown Reference Sheet: https://www.rstudio.com/wp-content/uploads/2015/03/rmarkdown-reference.pdf knitr in a knutshell: http://kbroman.org/knitr_knutshell/ Daniel Stekhoven 25.02.2016 12

25.02.2016 13

EduApp Aktive Mitarbeit: Kurze Quizze und Diskussionen Jederzeit anonymes Feedback an mich Semestersprecher Bringen Sie Ihr Smartphone oder Laptop mit in die VL und installieren/kennen Sie das EduApp http://www.eduapp.ethz.ch/ Daniel Stekhoven 25.02.2016 14

Administratives 1/3 Homepage http://stat.ethz.ch/education/semesters/ss2015/mathiv einfach auf stat.ethz.ch gehen und auf Education Semester Spring Semester 2016 Mathematik IV klicken! Skript befindet sich auf Homepage (Stand: April 2014) Übungen Auf Homepage Kein Testat Lösen der Übungen wird aber wärmstens empfohlen Quiz Einmal pro Woche Sie haben einen Link von Nemesis erhalten um an den Quizzes teilzunehmen Daniel Stekhoven 25.02.2016 15

Administratives 2/3 Prüfung Multiple Choice - «richtig» oder «falsch» 120 Minuten bis zu 10 Seiten handschriftliche Notizen beliebiger Taschenrechner 4 Themenbereiche Binomialtest t-test Regression Vermischtes/R auf Homepage gibt es alte Prüfungen seit So 2014 MC Daniel Stekhoven 25.02.2016 16

Administratives 3/3 Fragen Fragen Sie in der Vorlesung «Sprechstunde» jeweils im Anschluss an die VL im Hörsaal Semesterferien: 1 2 Fragestunden bei Assistenten Semestersprecher pro Studiengang? Bitte in Pause zu mir. Feedback hat gezeigt: Lärm stört VL enorm! Helfen Sie mit, damit alle gut zuhören können! Daniel Stekhoven 25.02.2016 17

Lernziele heute Intuition für Hypothesentest Wahrscheinlichkeitsmodelle Komponenten Axiome Venn Diagramm Wahrscheinlichkeit berechnen Hausaufgaben Skript: Kapitel 1, 2.1 lesen Serie 1 lösen Quiz 1 bearbeiten Daniel Stekhoven 25.02.2016 18

Hypothesentest Ein Beispiel... Daniel Stekhoven 25.02.2016 19

600 Bilder Daniel Stekhoven 25.02.2016 20

Blister Box 7 Stickers 50 Blister = 350 Sticker Daniel Stekhoven 25.02.2016 21

? Daniel Stekhoven 25.02.2016 22

Daniel Stekhoven 25.02.2016 23

Bauchgefühl und Hypothesen Komplette Box wenige doppelte Sticker Einzelne Blister an verschiedenen Kiosks viele doppelte «Null», weil kein System hinter dem Verpacken steckt Nullhypothese: Sticker werden zufällig in Boxen gepackt Alternativhypothese: Sticker werden systematisch in Boxen gepackt, sodass es weniger doppelte gibt Wie könnte man zwischen diesen beiden Hypothesen unterscheiden? Daniel Stekhoven 25.02.2016 24

Hypothesentest Ich habe eine Box mit 500 Stickern gekauft und konnte in ein leeres Album (600 mögliche Bilder) 478 Sticker einkleben. Angenommen die Nullhypothese H 0 stimmt: Ist es plausibel, dass ich dann 478 Bilder einkleben kann? Passen die Nullhypothese H 0 : «zufällig verpackt» und die Beobachtung «478 Bilder eingeklebt» zusammen? Daniel Stekhoven 25.02.2016 25

Problem: Was ist «normal»? Wenn wir viel mehr Bilder als «normal» einkleben konnten, dann wurden die Bilder wohl nicht zufällig verpackt. Angenommen die Nullhypothese stimmt (d.h. H 0 : «die Bilder sind zufällig verpackt worden»): Wie viele Bilder kann man normalerweise einkleben? Signifikanzniveau α : Wie «abnormal» muss eine Beobachtung sein, damit wir der Nullhypothese nicht mehr glauben? z.b. α = 1/1 000 000 wir lehnen H 0 ab, wenn wir etwas beobachten, das weniger wahrscheinlich als 1/1 000 000 ist. Daniel Stekhoven 25.02.2016 26

Lösung: Computersimulation 1 186 2 192 1 Mio 193 Daniel Stekhoven 25.02.2016 27

Resultat der Computersimulation Anzahl Sticker-Alben Anzahl eingeklebte Sticker Daniel Stekhoven 25.02.2016 28

Anzahl Sticker-Alben Anzahl eingeklebte Sticker 478 Daniel Stekhoven 25.02.2016 29

Schlussfolgerung Angenommen, die Sticker werden zufällig verpackt: Die W keit 478 oder mehr Sticker einkleben zu können, wäre kleiner als ein Millionstel! Unsere Beobachtung und die Simulation passen nicht zu einander! Sticker werden zufällig verpackt Daniel Stekhoven 25.02.2016 30

Daniel Stekhoven 25.02.2016 31

Zusammenfassung: Hypothesentest 1. Modell: Ziehe 500 Sticker mit Zurücklegen aus 600 möglichen Stickern 2. Nullhypothese H 0 : «die Sticker sind zufällig verpackt worden» Alternative H A : «systematisch verpackt, sodass weniger Doppelte» 3. Teststatistik: Anzahl der Sticker, die man in ein leeres Album einkleben kann, wenn man eine Box mit 500 Stickern kauft. Verteilung der Teststatistik, wenn die Nullhypothese stimmt: Computersimulation 4. Signifikanzniveau α = 1/1 000 000 5. Verwerfungsbereich der Teststatistik: Computer beobachtet bei 1 Mio. Simulationen nie mehr als 374 eingeklebte Sticker Verwerfungsbereich: K={375, 376,, 500} 6. Testentscheid: Der beobachtete Wert (478) liegt im Verwerfungsbereich der Teststatistik. Daher wird die Nullhypothese auf dem Signifikanzniveau α verworfen. Daniel Stekhoven 25.02.2016 32

Modelle für Zähldaten Wahrscheinlichkeitsmodelle Drei Komponenten: 1. Grundraum Ω Universum, Elementarereignisse ωω ii Atome 2. Ereignisse A, B, C,, Teilmengen von Ω Moleküle 3. Wahrscheinlichkeit für jedes Ereignis P(A), P(B), P(C), Daniel Stekhoven 25.02.2016 33

Mit Ereginissen kann man rechnen Operationen aus der Mengenlehre können direkt angewendet werden: AA BB AA oder BB (hier oder gleich oder/und) AA BB AA und BB AA CC nicht AA Beispiel Ω = {1, 2, 3, 4, 5, 6} ωω ii = 1, ωω 2 = 2,, ωω 6 = 6 Ereignis GG: Eine gerade Zahl geworfen GG = {2, 4, 6} Wahrscheinlichkeit für Ereignis: PP(GG) = 3 6 = 0.5 = 50% Daniel Stekhoven 25.02.2016 34

Axiome für Wahrscheinlichkeiten 1. PP(AA) 0 2. PP(Ω) = 1 3. PP(AA BB) = PP(AA) + PP(BB), falls PP(AA BB) = 0 Daraus folgen dann Dinge wie 1 2. PP(Ω) = PP(AA AA CC ) 3. PP(AA) + PP(AA CC ) PP(AA CC ) = 1 PP(AA) oder einfacher Daniel Stekhoven 25.02.2016 35

Venn Diagramme Wahrscheinlichkeit entspricht einer Fläche P(A) P(Ω) = 1 Ω Ω A ω i P(A B) = P(A) + P(B) P(A B) = P(A) + P(B) P(A B) P(A C ) = 1 P(A) Ω A B Ω A B Ω A Daniel Stekhoven 25.02.2016 36

Knobelaufgabe P(A\B) = Ω A B «A ohne B» 1. P(A) P(B) 2. P(A) + P(B) P(A B) 3. P(A) P(A B) 4. P(A) + P(B) Daniel Stekhoven 25.02.2016 37

Wahrscheinlichkeiten berechnen 1. Summe von Elementarereignissen Beispiel: Lotto PP(GGGGGGGGGGGG 100) = PP(ωω 3 ωω 4 ) 3. PP(ωω 3 ) + PP(ωω 4 ) = 0.05 + 0.05 = 0.1 PP(AA) = ωω AA PP {ωω} Gewinne PP(ωω ii ) ωω 1 = 1 0.8 ωω 2 = 10 0.1 ωω 3 = 100 0.05 ωω 4 = 1000 0.05 Daniel Stekhoven 25.02.2016 38

Wahrscheinlichkeiten berechnen 2. Laplace Modell: Alle Elementarereignisse haben die gleiche Wahrscheinlichkeit PP(AA) = # ggggggggggggggg EEEEEEEEEEEEEEEEEEEE # mmmmmmmmmmmmmm EEEEEEEEEEEEEEEEEEEE Beispiel: Münzwurf mit zwei Münzen Ereignis VV: verschiedene Seiten VV = {ωω 2, ωω 3 } PP(VV) = VV Ω = 2 4 = 0.5 Zahl PP(ωω ii ) ωω 1 = KK ¼ ωω 2 = KZ ¼ ωω 3 = ZK ¼ ωω 4 = ZZ ¼ Daniel Stekhoven 25.02.2016 39

Wahrscheinlichkeiten berechnen 3. Mengenoperationen PP(AA CC ) = 1 PP(AA) Beispiel: Tombola 10 Lose gekauft Ereignis NN: kein Gewinn in 10 Losen Gegeben: PP(NN) = 0.03 Gesucht: PP(mmmmmm. 1 GGGGGGGGGGGG) = PP(NN CC ) PP(NN CC ) = 1 PP(NN) = 1 0.03 = 0.97 Daniel Stekhoven 25.02.2016 40

Zusammenfassung Lernziele Intuition für Hypothesentests Panini Fussballsticker Wahrscheinlichkeitsmodell: 3 Komponenten: Ω, Ereignisse AA, Wahrscheinlichkeiten von Ereignissen PP[AA] 3 Axiome Venn-Diagramme Wahrscheinlichkeiten berechnen Hausaufgaben Skript: Kapitel 1, 2.1 lesen Serie 1 lösen, Übungen beginnen am 24. Februar 2015 Quiz 1 bearbeiten Daniel Stekhoven 25.02.2016 41