Bemerkungen zu statistischen Tests

Ähnliche Dokumente
Bemerkungen bzgl statistichen Tests. (basierend auf Slides von Lukas Meier)

Auswertung und Lösung

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Schließende Statistik: Hypothesentests (Forts.)

Nachgefragte Aufgaben über spezifische Themen

Auswertung und Lösung

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Einführung in Quantitative Methoden

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Bachelorprüfung: Statistik (1 Stunde)

Zweiseitiger Binomialtest. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

How To Find Out If A Ball Is In An Urn

Zusammenfassung PVK Statistik

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung.

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Auswertung und Lösung

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm./HST) FS 2014

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistische Tests (Signifikanztests)

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

3 Grundlagen statistischer Tests (Kap. 8 IS)

Serie 9, Musterlösung

Schriftliche Prüfung (90 Minuten)

Wahrscheinlichkeit und Statistik BSc D-INFK

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Statistik II. Weitere Statistische Tests. Statistik II

Statistisches Testen

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Statistik II. Statistische Tests. Statistik II

Stochastik Serie 11. ETH Zürich HS 2018

Schriftliche Prüfung (2 Stunden)

Tests für Erwartungswert & Median

8. Konfidenzintervalle und Hypothesentests

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***

Musterlösung. Kind Blume (beredet) Blume (nicht beredet)

Grundlagen der schließenden Statistik

Wahrscheinlichkeit und Statistik BSc D-INFK

Gepaarter und ungepaarter t-test. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Statistik II. IV. Hypothesentests. Martin Huber

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Tutorial: Anpassungstest

Schriftliche Prüfung (1 Stunde)

Schriftliche Prüfung (90 Minuten)

Experimentelle Methoden der Teilchenphysik Sommersemester 2011/2012 Albert-Ludwigs-Universität Freiburg

Auswertung und Lösung

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Konkretes Durchführen einer Inferenzstatistik

Mathematik für Biologen

Musterlösung zu Serie 8

Stochastik Musterlösung 10

Schriftliche Prüfung (90 Minuten)

Statistik für Naturwissenschaftler

Multiples Testen. Wolfgang Mader. 12. Juli Multiples Testen. Wolfgang Mader. Probleme des multiplen Testens. Bonferroni Methode

Beurteilende Statistik

Auswertung und Lösung

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Forschungsstatistik I

Statistik II. Statistische Tests. Statistik II

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 13. Winterthur, 24. Mai Institut für Datenanalyse und Prozessdesign

Statistik II: Signifikanztests /1

So berechnen Sie einen Schätzer für einen Punkt

Testen von Hypothesen:

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Schriftliche Prüfung (2 Stunden)

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Dr. L. Meier Statistik und Wahrscheinlichkeitsrechnung Sommer Musterlösung

Schriftliche Prüfung (2 Stunden)

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich SS 2016 Prof. Dr. P. Embrechts August BSc INFK. Nachname. Vorname.

D-MATH Wahrscheinlichkeitsrechnung und Statistik FS18 Prof. J. Teichmann. Serie 12

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

das Kleingedruckte...

Tutorial: χ 2 -Test auf vorgegebene Verteilung

Prüfung. Wahrscheinlichkeit und Statistik. ETH Zürich HS 2015 Prof. Dr. P. Embrechts Januar Nachname. Vorname. Legi Nummer

Schriftliche Prüfung (2 Stunden)

Einführung in die statistische Testtheorie

10. Die Normalverteilungsannahme

T-Test für unabhängige Stichproben

Vorlesung: Statistik II für Wirtschaftswissenschaft

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007

Wahrscheinlichkeit und Statistik BSc D-INFK

Aufgaben. d) Seien X und Y Poissonverteilt mit Parameter µ, X, Y P(µ). 2. Dann ist die Summe auch Poissonverteilt mit (X + Y ) P(2µ).

Schriftliche Prüfung (90 Minuten)

1 Dichte- und Verteilungsfunktion

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Macht des statistischen Tests (power)

Mathematik 2 für Naturwissenschaften

Transkript:

Bemerkungen zu statistischen Tests

Einseitige vs. zweiseitige Tests Die Entscheidung für eine einseitige oder zweiseitige Alternative hängt von der Fragestellung ab. Eine einseitige Alternative ist dann angebracht, wenn nur ein Unterschied in eine bestimmte Richtung von Bedeutung / Interesse ist (Bsp. Überschreitung Grenzwert). Der einseitige Test ist auf der einen (irrelevanten) Seite «blind», dafür verwirft er auf der anderen (relevanten) Seite früher als der zweiseitige Test (da der Verwerfungsbereich früher beginnt). Man sagt auch, dass er eine grössere Macht hat in diesem Bereich (siehe später).

p-wert Zur Erinnerung: Test mittels Verwerfungsbereich: Wir legen das Signifikanzniveau im voraus fest. Aus und der Verteilung der Teststatistik unter berechnen wir den Verwerfungsbereich. Je kleiner (grösser), desto kleiner (grösser) ist der Verwerfungsbereich. Beachte: Das Signifikanzniveau und der Verwerfungsbereich sind fix und hängen nicht von den Daten ab. Die Teststatistik hängt von den Daten ab und ist eine Zufallsvariable. Wir verwerfen, falls der realisierte Wert der Teststatistik im Verwerfungsbereich liegt. Alternativ: wir benutzen den p-wert anstelle des Verwerfungsbereichs Definition des p-werts: Der p-wert eines Tests ist die Wahrscheinlichkeit, unter der Nullhypothese einen mindestens so extremen Wert der Teststatistik (bezüglich der Alternative) zu beobachten wie den aktuell beobachteten Wert. Bemerkung: Unter gilt 0,1.

Illustration p-wert beim einseitigen t-test («nach oben») Verteilung der Teststatistik unter der Nullhypothese Realisierter Wert der Teststatistik

Illustration p-wert beim einseitigen t-test («nach unten») Verteilung der Teststatistik unter der Nullhypothese Realisierter Wert der Teststatistik

Illustration p-wert beim zweiseitigen t-test Verteilung der Teststatistik unter der Nullhypothese

p-wert Es gilt immer: Test mittels p-wert: Wir setzen das Signifikanzniveau im voraus fest. Wir berechnen den p-wert. Beachte: Das Signifikanzniveau ist fix und hängt nicht von den Daten ab. Der p-wert hängt von den Daten ab und ist also eine Zufallsvariable. Wir verwerfen, falls. Beachte: der p-wert ist eine Wahrscheinlichkeit, berechnet unter der Annahme, dass stimmt. Er sagt also nichts über die Wahrscheinlichkeit, ob oder stimmt. Insbesondere: 1.

p-wert: Nutzen / Gefahren Der p-wert kann als «standardisierte Teststatistik» verwendet werden. Wir können am p-wert direkt ablesen, ob die Nullhypothese verworfen wird. Einige «Gefahren» des p-werts: Ein kleiner p-wert ist nicht automatisch fachlich relevant, denn der p-wert sagt nichts über die Effektgrösse. Berechne auch das Vertrauensintervall. Multiples Testing / p-value Hacking: Falls gilt, dann erwartet man in 100%der Tests einen signifikanten p-wert (i.e., ). Falls man also genügend viele Tests macht, dann findet man immer einen signifikanten p-wert. Die Garantie 1. gilt nur für einen einzelnen Test! Mache nur einen im voraus genau beschriebenen Test. Oder beschreibe, wieviele Tests gemacht wurden, und benutze multiple testing correction. Interessante Artikel: http://www.nature.com/news/scientific-method-statistical-errors-1.14700 http://www.nature.com/news/statisticians-issue-warning-over-misuse-of-p-values-1.19503

Source: https://xkcd.com/882/

Multiple testing correction Einfachste Methode: Bonferroni correction: Wenn man Tests macht, und man möchte 1. dann kann man jeden einzelnen Test zum Niveau machen. Beweis: 1. 1. 1 1. 1..

Macht Sei und sei 2.. Die Macht eines Tests ist dann P 1 1. Die Macht hängt also von ab.

Macht beim einseitigen -Test ( :, : Dichte von unter Alternative Dichte von unter Der Verwerfungsbereich wird berechnet mittels der Verwerfungsbereich Dichte unter. Die Macht ist die Wahrschein- Dichte von unter Alternative lichkeit des Verwerfungsbereichs unter der Alternative (grüne Fläche). Verwerfungsbereich

Bemerkungen zur Macht Je grösser der Unterschied zwischen und, desto grösser wird die Macht. Je grösser die Stichprobe, desto grösser wird die Macht. Begründung: Weil, konzentrieren die Dichten sich mehr um und. Die Macht ist wichtig zur Ermittlung der nötigen Stichprobengrösse. Sie vermuten z.b. eine bestimmte Abweichung von der Nullhypothese (z.b. 1statt 0). Sie planen ein Experiment und wollen mit einer Wahrscheinlichkeit von 80% die Nullhypothese verwerfen können ( Macht). Man kann dann die nötige Stichprobengrösse berechnen.