Stochastik für die Naturwissenschaften

Ähnliche Dokumente
Stochastik für die Naturwissenschaften

Stochastik für die Naturwissenschaften

Stochastik für die Naturwissenschaften

Stochastik für die Naturwissenschaften

Stochastik für die Naturwissenschaften

Einführung in die Statistik

Klausur zur Wahrscheinlichkeitstheorie für Lehramtsstudierende

Einführung in die Statistik Kapitel 6: Crash-Course in Statistik: Testtheorie

Wahrscheinlichkeitsrechnung und Stochastik

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Willkommen zur Vorlesung Statistik (Master)

Stochastik für die Naturwissenschaften

Willkommen zur Vorlesung Statistik (Master)

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur...

Mehrdimensionale Zufallsvariablen

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Statistik für Ingenieure Vorlesung 4

Wahrscheinlichkeitsverteilungen

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayes sches Lernen. Niels Landwehr

Stochastik für die Naturwissenschaften

Vorwort Zufallsvariable X, Erwartungswert E(X), Varianz V(X) 1.1 Zufallsvariable oder Zufallsgröße Erwartungswert und Varianz...

Berechnung von W für die Elementarereignisse einer Zufallsgröße

Stochastik für Ingenieure

Einführung in die Statistik

Wahrscheinlichkeitsrechnung und schließende Statistik

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Wahrscheinlichkeitstheorie

Erwartungswert, Varianz und Standardabweichung einer Zufallsgröße. Was ist eine Zufallsgröße und was genau deren Verteilung?

Statistik Übungen SS 2018

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Statistische Tests (Signifikanztests)

Mathematik 2 für Naturwissenschaften

Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr

Station 1 Das Galtonbrett, Realmodelle

I. Deskriptive Statistik 1

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

d) Ermitteln Sie ein möglichst kleines, zum Erwartungswert symmetrisches Intervall, in dem mit mehr als 90% die Anzahl der geworfenen Vieren liegt?

Abiturvorbereitung Stochastik. neue friedländer gesamtschule Klasse 12 GB Holger Wuschke B.Sc.

4.4 Punktschätzung. E(X 1 )+ +E(X n ) Var(ˆµ) = 1 n 2 ( Var(X1 )+ +Var(X n ) ) = 1 n 2nσ2 = σ2

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.

Weierstraß-Institut für Angewandte Analysis und Stochastik Universalität der Fluktuationen: Warum ist alles Gauß-verteilt?

Kinga Szűcs

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Klett Wahrscheinlichkeitsrechnung im Griff - Mathematik

Statistik Übungen WS 2017/18

Kapitel VII. Punkt- und Intervallschätzung bei Bernoulli-Versuchen

SozialwissenschaftlerInnen II

Inhaltsverzeichnis. Robert Galata, Sandro Scheid. Deskriptive und Induktive Statistik für Studierende der BWL. Methoden - Beispiele - Anwendungen

Vorlesung: Statistik II für Wirtschaftswissenschaft

Inhaltsverzeichnis Inhaltsverzeichnis VII Erst mal locker bleiben: Es f angt ganz einfach an! Keine Taten ohne Daten!

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Stochastik und Statistik für Ingenieure Vorlesung 4

0 für t < für 1 t < für 2 t < für 3 t < für 4 t < 5 1 für t 5

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Definition 2.1 Der Erwartungswert einer diskreten Zufallsvariablen mit Wahrscheinlichkeitsfunktion

Mathematische und statistische Methoden II

Einführung in die Wahrscheinlichkeitstheorie

Institut für Stochastik, SoSe K L A U S U R , 13:

Zufallsvariablen. Erwartungswert. Median. Perzentilen

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wahrscheinlichkeitstheorie 2

Übungen mit dem Applet Zentraler Grenzwertsatz

5 Binomial- und Poissonverteilung

Motivation. Benötigtes Schulwissen. Übungsaufgaben. Wirtschaftswissenschaftliches Zentrum 10 Universität Basel. Statistik

Ü b u n g s b l a t t 15

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung für die Mittelstufe

Übungen zu Wahrscheinlichkeitstheorie Judith Kloas, Wolfgang Woess, Jonas Ziefle SS 2016

A: Beispiele Beispiel 1: Zwei Zufallsvariablen X und Y besitzen die beiden folgenden Wahrscheinlichkeitsfunktionen:

Wird ein Bernoulli- Versuch, bei dem die Trefferwahrscheinlichkeit p = 0,2 ist, n = 40 mal durchgeführt, dann erwarten wir im Mittel 8 Treffer.

Kapitel 5 Stochastische Unabhängigkeit

Tafel 1: Binomial- und Normalverteilung aus Münzwürfen

Statistik für Psychologen, Pädagogen und Mediziner

Klausur vom

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

3. Kombinatorik und Wahrscheinlichkeit

untersuchen Lage- und Streumaße von Stichproben

Mathematik für Biologen

Forschungsstatistik I

MATHEMATISCHE STATISTIK

1. Einführung in die induktive Statistik

Korollar 116 (Grenzwertsatz von de Moivre)

Angewandte Stochastik

Statistik I für Betriebswirte Vorlesung 14

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

INGENIEUR-STATISTIK DR. JOSEF HEINHOLD DR. KARL-WALTER GAEDE R. OLDENBOURG VERLAG MÜNCHEN WIEN 1979

Statistik für Naturwissenschaftler

Box. Mathematik ZU DEN KERNCURRICULUM-LERNBEREICHEN:

Willkommen zur Vorlesung Statistik (Master)

Lineare Algebra, Optimierung, Wahrscheinlichkeitsrechnung und Statistik

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Überblick. Linguistische Anwendungen: æ Spracherkennung æ Textretrival æ probabilistische Grammatiken: z.b. Disambiguierung. Problem: woher Daten?

Wahrscheinlichkeit und Statistik BSc D-INFK

1 Verteilungsfunktionen, Zufallsvariable etc.

Auswertung von Messungen Teil II

Prof. Dr. Christoph Karg Hochschule Aalen. Klausur zur Vorlesung Wahrscheinlichkeitstheorie und Statistik. Sommersemester 2016

Kinga Szűcs

Grundlagen der Stochastik

Dieser Begriff wurde von Jacob Bernoulli Ars conjectandi geprägt (1773), in dem das erste Gesetz der großen Zahlen bewiesen wurde.

Aufgabe 8. Stochastik (WTR) Originalprüfungsaufgabe. Abitur Mathematik Nordrhein-Westfalen 2013, GK. Nordrhein Westfalen 2013 GK

Transkript:

Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger Intro 1 Motivation zur Wahrscheinlichkeitsrechnung und Statistik Was fällt ein bei den Begriffen Wahrscheinlichkeit und/oder Statistik? Kurz zusammengefasst, sind in der Einführung zu dieser Vorlesung unter anderem auch Begriffe und Fragestellungen der folgenden Art aufgetaucht: Münze (Kopf/Zahl), Würfel; Personen, welche in der Statistik schon ein bisschen geschnuppert haben, kennen Begriffe wie Gesetz der grossen Zahlen, Test von Hypothesen. Den meisten Personen kommt beim Wort Münze auch die Zahl 1/2 in den Sinn - bei einem Würfel die Zahl 1/6. Offenbar neigt der Mensch von sich aus zu solchen (idealen) Wahrscheinlichkeiten. Wenn wir eine Münze (oder einen Würfel) 1 000 mal werfen und die Anzahl Kopf (beim Münzwurf) zählen, so erwarten wir eine Zahl wie 500. Die Mitte (500) kommt den meisten Personen sofort in den Sinn. Warum? Man sagt dann, das ist der Durchschnitt - Personen, welche in der Statistik schon geschnuppert haben, reden vielleicht vom Mittelwert oder Erwartungswert. Oder sie wechseln schnell zur relativen Häufigkeit (teilen durch die Anzahl Würfe) und sagen dann, dass wenn wir immer länger die Münze werfen und die relative Häufigkeit nehmen, so sollte es immer näher an 1/2 kommen. Bleiben wir bei der Anzahl Kopf bei 1 000 Würfen. Wenn wir uns fragen, welche Werte dabei etwa so vorkommen, so kommen neben der Zahl 500 auch Zahlen wie 503, 488, 509, 511, 514, 478, und so weiter in den Sinn. Irgendwann wird wohl klar, dass theoretisch eigentlich jede ganze Zahl aus der Menge {0, 1, 2,..., 998, 999, 1000} 1

als Resultat vorkommen könnte. Wir werden nicht stutzig, wenn jemand sagt, er/sie habe die Münze 1000 mal geworfen und dabei genau 512 mal Kopf erhalten. Wenn jemand aber kommt und sagt, er/sie habe genau 377 mal Kopf erhalten, so fragen wir uns, ob die Münze fair ist oder nicht. Nun kann man sich fragen, wo wir die Grenze ziehen sollten: wo sollten wir Bedenken anmelden, ob die Münze auch wirklich fair ist oder nicht. Bei 400 (und 600 gegen oben (Symmetrie)), bei 450 (550), 490 (510)? Kann man so etwas überhaupt für alle Situationen und Personen verbindlich festschreiben? Dieses Problem lässt sich kurz in einer trivialen Feststellung so zusammenfassen und ist der Grund dafür, dass wir überhaupt durch diese Vorlesung müssen: Es gibt Variabilität in den Daten! Genauer: Selbst bei einer fairen Münze wird es um die 500 herum schwanken. Wie weit darf es aber schwanken, bis wir stutzig werden (sollten)? Dies ist eine zentrale Fragestellung, welche im Statistik-Teil in allen denkbaren Variationen immer wieder auftaucht. Sie wird Ihnen noch in Fleisch und Blut übergehen. 2

2 Inhalt dieser Vorlesung Beschreibende Statistik & Kombinatorik Wenn Sie vor Problemen stehen und früher oder später Entscheidungen dazu treffen müssen, sollten Sie zuallererst eine schonungslose Lageanalyse machen. Dies gilt für Ihr persönliches Leben, Managemententscheidungen und wissenschaftliche Forschung. Wenn Sie dazu Daten gemessen oder erhoben haben, dann sollten Sie versuchen, einen ersten Überblick über das Datenmaterial zu erhalten. Von der Politik wissen wir, dass Statistiken so oder so interpretiert werden können. Die Beispiele dazu sind Legion. Die beschreibende Statistik gibt Ihnen graphische Darstellungsmöglichkeiten und Kennziffern (Mittelwert, Varianz), um einen ersten Überblick über die Daten zu erhalten. Ob Sie dann ehrlich bemüht sind herauszufinden was los ist, oder ob Sie die Daten selektiv / tendenziös einsetzen, ist dabei noch offen. In einem zweiten Schritt wird man mit Methoden aus der Statistik versuchen, die Daten an ein gutes Modell anzupassen und Schlussfolgerungen zu ziehen. Am Schluss muss man dann wieder den Abnehmern von Statistik (Bevölkerung, Kunden etc.) ein möglichst umfassendes Bild der Situation geben. Auch dort kommt die beschreibende Statistik erneut zum Zug (Kapitel 2). Die Kombinatorik ist zwar ein interessantes Teilgebiet der Mathematik - wir werden die Kombinatorik in dieser Vorlesung aber nur als Hilfsmittel einsetzen und wenige Resultate benutzen (Kapitel 1). Wahrscheinlichkeitsrechnung In der Einführung zu dieser Vorlesung haben wir unter anderem auch über den Münzwurf gesprochen. Dabei kam die Zahl 1/2 in s Spiel - eine Wahrscheinlichkeit P. Wir werden uns darüber unterhalten, was dieses P für Eigenschaften hat (Kapitel 3). Wenn wir die Münze 1 000 mal werfen und die Anzahl Kopf zählen (so um die 500 herum), dann ist diese Zahl 500 eine sogenannte Zufallsgrösse X (genauer eine Realisation davon). Auch hier gibt es Gesetze, welche wir besprechen werden (Kapitel 4). Wenn die Zahl 500 schon aufgetreten ist: das ist der Erwartungswert E[X] dieser Zufallsgrösse - so etwas wie ein erwarteter Wert. Leider kommt dieser Wert nicht immer vor: mal haben wir 523, dann 488, 503, 489, 502 und so weiter. Manchmal muss man sehr oft diesen Versuch machen, bis man genau 500 kriegt. Es gibt eben eine Variabilität (dies ist eine zentrale Feststellung für die Statistik). Wir werden die Variabilität 3

um diese 500 mit der sogenannten Varianz V [X] einer Zufallsgrösse beschreiben (Kapitel 5). In Kapitel 6 geben wir eine Übersicht über Die wichtigsten Verteilungen - da ist viel Repetition dabei. Damit haben Sie alle wichtigen Resultate in einem Kapitel zusammengefasst. In Kapitel 7 werden wir kurz das Gesetz der grossen Zahlen Law of Large Numbers und den Zentralen Grenzwertsatz Central Limit Theorem besprechen. Statistik Die Wahrscheinlichkeitsrechnung ist das Fundament, auf dem wir Statistik betreiben können. Bleiben wir dazu beim Münzwurf, den wir 1000 mal wiederholen. Wenn Sie berechtigte Zweifel haben, dass die Münze fair ist (nicht je 1/2 als Wahrscheinlichkeit), dann werden Sie die Wahrscheinlichkeit für Kopf (& Zahl ) schätzen wollen. Dies geschieht in Schätzen von Parametern und Konfidenzintervalle in Kapitel 8. Wenn Sie in obigem Münzwurfspiel eine Zahl wie 438 erhalten - bei einem Geldspiel zu Ihren Ungunsten - dann werden Sie sich (wohl zu Recht) fragen, ob denn diese Münze fair (1/2) war oder nicht. Sie werden sich fragen müssen, wo Sie berechtigte Zweifel anmelden dürfen und wo nicht. Dies sind schwierige und wichtige Fragen, welche wir leider in Kapitel 9 (Testen von Hypothesen) und weiteren zwar ausführlich - aber von der Natur der Sache her nur unvollständig beantworten können ( es könnte ja einfach nur Zufall sein, dass... ). Schätzen von Parametern und Testen von Hypothesen sind die beiden zentralen Kapitel der Statistik, auf denen alles weitere aufbaut. In der Praxis werden oft kompliziertere Modelle notwendig sein, um Daten sinnvoll analysieren zu können. Mit Regression und ANOVA werden in Kapitel 10 die wichtigsten Methoden besprochen. Mit Planung von Experimenten schliesst die Vorlesung mit eher praxisorientierten Hinweisen. Wenn Sie diese Einführung als zu spielerisch (Münze / Würfel) erleben, dann übersetzen wir doch obige Fragestellung gleich in eine medizinische oder biologische Situation: Sie haben 1 000 Mäuse, durchtrennen Nerven und wollen jetzt ein neues Verfahren anwenden, um die Nerven wieder zum Wachsen zu bringen (an der Uni Zürich arbeitet man führend in diesem Gebiet). Bisherige Verfahren haben in 50 % der Fälle ein Wachstum bewirkt. Sie kommen jetzt mit einem neuartigen Verfahren und behaupten, es sei besser als alle alten Verfahren. Das ist abstrakt gesehen genau das gleiche Problem wie beim 4

Münzwurf. Wenn Sie bei genau 520 Mäusen Wachstum erreicht haben, sollten Sie mit diesem Resultat noch kein Paper machen (oder das Journal tut gut daran, das Paper zurückzuweisen): solche Resultate wie 520 kommen problemlos auch bei den bisherigen Verfahren (per Zufall) vor, wenn man 1 000 Mäuse nimmt und die Behandlung führt mit 50 % Wahrscheinlichkeit zum Erfolg. Wieder stellt sich hier übrigens die Frage: wann soll das Journal Ihr Paper ablehnen und ab wann sollten sie es zur Publikation freigeben? 5

3 Geschichte * Für Jahrhunderte haben Menschen statistische Argumente (aus der Testtheorie, mehr in Kapitel 9) benutzt. Dazu ein Beispiel: (Gregor von Tours, 6. Jh.; nach Robert Ineichen) 20 Krieger, die Gott nicht fürchteten, setzten über einen Fluss, um ein Kloster zu plündern und die Mönche zu töten. Auf dem Rückweg kamen alle bis auf einen in den Fluten um: Gregor: Nur einer von ihnen blieb unverletzt, jener, der die anderen wegen ihres Vorhabens getadelt hatte. Wenn jemand denkt, dies sei durch Zufall geschehen, so möge er bedenken, dass ein unschuldiger Mann gerettet wurde, inmitten so vieler Verbrecher. [Hypothesen aufstellen (es gibt keinen Gott), Testen (genau der hat überlebt, welcher an Gott glaubt/unschuldig ist), sog. P-Wert sehr klein (Wahrscheinlichkeit hierfür berechnen unter der Annahme gibt keinen Gott ), also Null-Hypothese ablehnen (also hier: es gibt doch einen Gott - der für Gerechtigkeit sorgt )] * 17. Jahrhundert: Abbruch eines Glückspiels mitten im Spiel (Bullen sind unerwartet aufgetaucht) und man ist in Führung. Wieviel vom denkbaren Gewinn steht einem fairerweise zu? * 19. Jahrhundert: Versuche in der Landwirtschaft, Variabilität im Pflanzenwachstum, Düngemethoden * 20. Jahrhundert: exakte Fundierung der Wahrscheinlichkeitstheorie und Siegeszug durch alle denkbaren (und undenkbaren (Sozial- und Geisteswissenschaften!)) Anwendungsgebiete. Namen: Jakob Bernoulli, Moivre, Laplace, Gauss, Poisson, Tschebyschew, Markov, Kolmogoroff, Fisher und viele weitere mehr. 6

4 Gegenwart und Zukunft Wo wird Statistik eingesetzt, statistische Fragestellungen? * theoretische, mathematische, spielerische Fragen * Biologie / Medizin / Naturwissenschaften * Ingenieur- und Computerwissenschaften * Technik / Physik / Qualitätskontrolle in der Produktion * Soziologie / Demographie / Statistische Ämter * Finanzmathematik * Versicherungsmathematik * 21. Jahrhundert wird das Jahrhundert der Biologie / Medizin (wenn die Mathematik / Statistik die dabei auftretenden Probleme lösen kann (z.b. in der Genetik)). 7