Mathematik für Biologen

Ähnliche Dokumente
Mathematik für Biologen

Mathematik für Biologen

Mathematik für Biologen

10. Die Normalverteilungsannahme

Mathematik für Biologen

3 Grundlagen statistischer Tests (Kap. 8 IS)

Klassifikation von Signifikanztests

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Mathematik für Biologen

Kapitel 3 Schließende Statistik

Statistik II. Statistische Tests. Statistik II

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Biostatistik, Winter 2011/12

Statistik I für Betriebswirte Vorlesung 14

Mathematik für Biologen

Einführung in die Induktive Statistik: Testen von Hypothesen

Testen von Hypothesen:

Mathematik für Biologen

11. Nichtparametrische Tests

Mathematik für Biologen

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Statistische Tests für unbekannte Parameter

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Übungsscheinklausur,

Statistische Tests (Signifikanztests)

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Test auf den Erwartungswert

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Überblick Hypothesentests bei Binomialverteilungen (Ac)

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Hypothesentests mit SPSS. Beispiel für einen t-test

7.3 Chi-Quadrat-Streuungstest und F-Test

Klausur zu Statistik II

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Grundlagen der Statistik

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung


1 Dichte- und Verteilungsfunktion

Statistische Tests zu ausgewählten Problemen

Vergleich von Gruppen I

Klausur zur Mathematik für Biologen

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

Mathematische und statistische Methoden II

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/453

10,24 ; 10,18 ; 10,28 ; 10,25 ; 10,31.

Konkretes Durchführen einer Inferenzstatistik

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Schließende Statistik

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

Lösungen zu den Übungsaufgaben in Kapitel 10

Jost Reinecke. 7. Juni 2005

TECHNISCHE UNIVERSITÄT DORTMUND Wintersemester 2010/2011 FAKULTÄT STATISTIK Dr. H. Hansen

8. Konfidenzintervalle und Hypothesentests

9 Prinzipien der statistischen Hypothesenprüfung

Mathematik für Biologen

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Willkommen zur Vorlesung Statistik (Master)

Chi-Quadrat-Verteilung

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik

Eine Einführung in R: Statistische Tests

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

2. Übung zur Vorlesung Statistik 2

Sitzung 4: Übungsaufgaben für Statistik 1

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

Hypothesentest, ein einfacher Zugang mit Würfeln

DWT 334/460 csusanne Albers

R. Brinkmann Seite

Statistik II für Betriebswirte Vorlesung 1

Übungsaufgaben zu Kapitel 5

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Biomathematik für Mediziner, Klausur WS 2003/2004 Seite 1

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Mathematik für Biologen

Regression und Korrelation

Gesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

2 Aufgaben aus [Teschl, Band 2]

Klausur Stochastik und Statistik 31. Juli 2012

Statistik und Wahrscheinlichkeitsrechnung

Kapitel XI - Operationscharakteristik und Gütefunktion

5. Spezielle stetige Verteilungen

Testen von Hypothesen, Beurteilende Statistik

Schriftliche Prüfung (90 Minuten)

Epidemiologie / Biometrie

Transkript:

Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine Universität Düsseldorf 13. Januar 2010

Termine Letzte Vorlesung am 28.01.2010 Letzte Übung am 27.01.2010, und zwar für alle Anfangsbuchstaben

t-tests für Erwartungswerte X 1,..., X n bezeichnen unabhängig erhobene, gleichartige Messwerte. Verteilungsvoraussetzungen: Alle X j sind normalverteilt mit unbekanntem Erwartungswert µ und unbekannter Varianz σ 2 Ziel: µ soll mit einem festen Referenzwert µ 0 verglichen werden. x j seien Realisierungen der X j Bestimme arithmetisches Mittel und Stichprobenstreuung x = 1 n x j und s x = 1 n (x j x) n n 1 2 j=1 Die Teststatistik ist t = x µ 0 n s x j=1

t-tests, Fortsetzung Das Signifikanzniveau sei α Im Gegensatz zum Gauß-Test müssen nun die Quantile der t-verteilung verwendet werden t n 1, 1 α/2 t n 1, 1 α beim zweiseitigen Test bei einem einseitigen Test Entscheidung: H 0 = {µ = µ 0 }: Die Nullhypothese H 0 wird abgelehnt, wenn t > t n 1, 1 α/2 H 0 = {µ µ 0 }: Die Nullhypothese H 0 wird abgelehnt, wenn t < t n 1, 1 α H 0 = {µ µ 0 }: Die Nullhypothese H 0 wird abgelehnt, wenn t > t n 1, 1 α

Zurück zum Filterbeispiel Sie haben bei einem Händler für Laborartikel eine Partie Filter bestellt. Sie sind nur dann bereit, die Ware abzunehmen, wenn zum Niveau α = 0.05 sicher ist, dass der Mittelwert der Porengröße weniger als 3.6µm beträgt. Sie messen 30 Filter aus und finden folgende Werte Porengröße in µm Anzahl der Beobachtungen 3.0 2 3.2 4 3.4 6 3.6 8 3.7 8 4.0 2 Die Varianz wird durch die empirische Varianz geschätzt.

t-test im Filterbeispiel Empirische Varianz Also s = 0.2496 s 2 x = 1 n 1 n (x j x) 2 = 0.0623 j=1 Der Wert der Teststatistik ist t = x µ 0 s x 30 = 1.756 Das benötigte Quantil ist t 29, 0.95 = 1.699 Wegen t < t 29, 0.95 wird die Nullhypothese auch in diesem Setting abgelehnt.

p-wert Der p-wert für den t-test ist p = 0.045 Der p-wert für den Gauß-Test ist p = 0.040 Der p-wert für den Gauß-Test ist etwas besser, weil der Gauß-Test mit mehr Informationen startet. Tabellen für die t-verteilungen der verschiedenen Freiheitsgrade liegen meist nicht vor. Daher können p-werte für die t-verteilung nur mit entsprechender Software bestimmt werden. (Ich verwende http://www.scipy.org für die Vorlesung.)

Verteilungsannahmen Alle bisherigen Tests verwenden Verteilungsannahmen. Entweder waren alle Zufallsvariablen normalverteilt oder binomialverteilt. In der Praxis ist oft nicht klar, ob diese Voraussetzungen erfüllt sind. Der t-test ist konservativ. Das bedeutet, dass er auch dann noch gute Ergebnisse liefert, wenn die Zufallsvariablen nur annähernd normalverteilt sind.

Q-Q-Plot Mit dem Quantil-Quantil-Plot kann man auf graphischem Wege beurteilen, ob Messwerte Realisierungen einer normalverteilten Zufallsvariablen sind. Man trägt dazu auf der x-achse die Quantile der Standardnormalverteilung und auf der y-achse die Quantile der Beobachtungsdaten auf. Wenn diese Punkte annähernd auf einer Geraden liegen, sind die Daten näherungsweise normalverteilt, ansonsten nicht.

Q-Q-Plot: Beispiel Wir legen Daten aus dem Beispiel Blutdrucksenker zu Grunde 168 184 172 173 150 155 163 164 151 146 Zur Bestimmung der Quantile ordnen wir sie an 146 150 151 155 163 164 168 172 173 184 Wir verteilen n = 10 Punkte gleichmäßig über [0, 1] 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95 Für allgemeines n wählt man in [0, 1] die Punkte j 0.5 n, j = 1,..., n Der erste Datenpunkt hat dann die Koordinaten (q 0.05, 146) = ( 1.645, 146), der zweite (q 0.15, 150) usw.

Q-Q-Plot 185 180 175 170 165 160 155 150 145 140 2.0 1.5 1.0 0.5 0.0 0.5 1.0 1.5 2.0 Der Q-Q-Plot der Blutdruckdaten zeigt, dass die Normalverteilungsannahme gerechtfertigt war.

noch ein Q-Q-Plot 8 7 6 5 4 3 2 1 3 2 1 0 1 2 3 Q-Q-Plot von Daten, bei denen die Normalverteilungsannahme nicht gerechtfertigt ist

Abschnitt 3.4 Parameterfreie Tests

Beispiel: Reaktionszeit unter Alkoholeinfluss Überprüfe, ob die Beeinträchtigung der Reaktionszeit unter Alkoholeinfluss durch Präparat A aufgehoben werden kann. Bestimme dazu die Reaktionszeit von 27 Personen unter Alkoholeinfluss, von denen 15 zusätzlich noch das Präparat genommen haben. Reaktionszeiten sind nicht normalverteilt. Wir benutzen ein Verfahren, das auf Rängen basiert. Seien x 1,..., x 12 die Reaktionszeiten ohne und y 1,..., y 15 mit Präparat A. Wir ordnen alle 27 Daten der Größe nach an, mit dem kleinsten auf Platz 1. Das sind die Ränge.

Beispieldaten ohne Präparat A mit Präparat A Zeit in [ms] Rang Zeit in [ms] Rang 85 4 96 10 106 17 105 16 118 22 104 15 81 2 108 19 138 27 86 5 90 8 84 3 112 21 99 12 119 23 101 13 107 18 78 1 95 9 124 25 88 7 121 24 103 14 97 11 129 26 87 6 109 20

Grafik 140 130 120 110 100 90 80 ohne Präparat mit Präparat 70 0 2 4 6 8 10 12 14 16 Daten des Beispiels Reaktionszeit. Auf der y-achse kann man die Ränge ablesen.

Bindungen Stimmen mehrere Messwerte überein, so spricht man von Bindungen. In diesem Fall wird jedem dieser Messwerte als Rangplatz das arithmetische Mittel der fortlaufend vergebenen Rangplätze zugewiesen. Wir gehen vorerst von dem Fall aus, dass keine Bindungen auftreten.