Exakter Binomialtest als Beispiel

Ähnliche Dokumente
THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Vorlesung: Statistik II für Wirtschaftswissenschaft

So berechnen Sie einen Schätzer für einen Punkt

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Einführung in Quantitative Methoden

Ablaufschema beim Testen

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Einführung in die Induktive Statistik: Testen von Hypothesen

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Allgemeines zu Tests. Statistische Hypothesentests

Schließende Statistik: Hypothesentests (Forts.)

Statistische Tests (Signifikanztests)

Statistik II für Betriebswirte Vorlesung 1

Bereiche der Statistik

9 Prinzipien der statistischen Hypothesenprüfung

Jost Reinecke. 7. Juni 2005

Je genauer und sicherer, desto größer muss der Stichprobenumfang sein

Auswertung und Lösung

4.1. Nullhypothese, Gegenhypothese und Entscheidung

10 Der statistische Test

Statistik II: Signifikanztests /1

Beurteilende Statistik

Testen von Hypothesen

Statistische Tests Übersicht

Statistik II. Statistische Tests. Statistik II

GRUNDPRINZIPIEN statistischen Testens

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

R. Brinkmann Seite

1,64 1,96 2,56. Statistik. Cusanus-Gymnasium Wittlich Faustregeln

Einführung in Planung und Auswertung klinischer Prüfungen: Biometrische Grundlagen

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

3 Grundlagen statistischer Tests (Kap. 8 IS)

Tutorial: χ 2 -Test auf vorgegebene Verteilung

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Kapitel 13. Grundbegriffe statistischer Tests

Analytische Statistik II

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Methodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik II. Statistische Tests. Statistik II

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Statistisches Testen: Signifikanz und Relevanz Christiane Spiel

R. Brinkmann Seite

Statistische Tests Version 1.2

Testen von Hypothesen

Mögliche Fehler beim Testen

9 Prinzipien der statistischen Hypothesenprüfung

Vorlesung: Statistik II für Wirtschaftswissenschaft

Statistisches Testen

Testen von Hypothesen

Kapitel III: Einführung in die schließende Statistik

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Mathematik für Biologen

Kapitel VIII - Tests zum Niveau α

Statistisches Testen I. De gustibus non est disputandum

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Macht des statistischen Tests (power)

Typ I und Typ II Fehler

Tutorial: Anpassungstest

Einführung in die statistische Testtheorie

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

WB 11 Aufgabe: Hypothesentest 1

Biostatistik, Winter 2011/12

Nachgefragte Aufgaben über spezifische Themen

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Diagnose und Prognose: Kurzfassung 4

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Klassifikation von Signifikanztests

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Testen von Hypothesen, Beurteilende Statistik

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Alternativtest Einführung und Aufgabenbeispiele

Schließende Statistik

Grundlagen der Statistik

Macht des statistischen Tests (power)

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

Testen von Hypothesen

Methode des statistischen Testens

Testen von Hypothesen:

Statistische Tests für unbekannte Parameter

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

Empirische Methoden zur Analyse gesprochener Sprache

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

3.3 Konfidenzintervalle für Regressionskoeffizienten

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik 2 Inferenzstatistik 1

T-Test für den Zweistichprobenfall

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Lösungen zum Aufgabenblatt 14

Statistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Transkript:

Prinzipien des statistischen Testens Entscheidungsfindung Exakter Binomialtest als Beispiel Statistische Tests Nullhypothese Alternativhypothese Fehlentscheidungen

Ausgangspunkt: Forschungshypothese Beispiele:. Klinische Studien: These: Neues Präparat größere therapeutische Wirkung als die herkömmlichen 2. Geburtshypothese: These: mehr Jungen- als Mädchengeburten 2

Überprüfung solcher Fragestellungen anhand empirischer Forschung Beachte: Fragestellungen - Aussagen über Grundgesamtheit (GG) - formuliert über Parameter der GG - nicht vollständig überprüfbar, i.d.r. nur die Konsequenzen - zur empirischen Überprüfung Operationalisierung notwendig, d.h. Festlegung beobachtbarer Variablen, die zur Erfassung der eigentlichen Fragestellung geeignet sind z.b. bessere Heilung bedingt durch neues Medikament, messbar über Veränderung bestimmter Laborparameter 3

Dabei wichtig: Festlegung von Einflussvariable (unabhängig) Verabreichung des Medikaments Zielvariablen (abhängig) Veränderung relevanter Laborparameter Zur empirischen Überprüfung notwendig: - Festlegung eines Prüfplans - Kontrolle von Störvariablen (Confounder) zusätzliche Einflussgrößen auf abh. Variablen und mit interessierender Einflussgröße assoziiert - Einhaltung des Prüfplans - Abweichungen notieren 4

Von Interesse: Ist beobachtetes Phänomen in Stichproben (Heilung unter Medikament) reines Zufallsprodukt oder mit großer Sicherheit auf Medikament zurückzuführen? Dazu notwendig: Formale Entscheidungsregel Statistischer Test 5

Beispiel: Vermutung: Studienplan: Exakter Binomialtest mehr Jungen- als Mädchengeburten Zähle Geburten (keine Mehrlinge) getrennt nach Geschlecht innerhalb von 24 Stunden in einem Krankenhaus Geburten 6

Überlegung: Jungen- und Mädchengeburten gleich wahrscheinlich Was ist bei 6 Jungen und 4 Mädchen? gleich wahrscheinlich? Jedes dieser Ereignisse möglich, auch wenn Anzahl in Wirklichkeit gleich Wahrscheinlichkeiten dafür aber gering mehr Jungen als Mädchen 7

Formale Beschreibung Junge wir geboren Xi= mit P(Xi = ) = π sonst Damit: Aussagen über Verhältnis Jungen- und Mädchengeburten formulierbar über π: π = gleich viele Jungen und Mädchen 2 π > mehr Jungen als Mädchen 2 statistisches Testproblem Nullhypothese vs. Alternativhypothese H : = π vs. (Forschungshypothese) 2 H : π > 2 8

Zur Überprüfung des Testproblems: Verdichtung der Info aus Stichprobe in Prüfgröße bzw. Teststatistik Wichtig: Anhand Teststatistik Entscheidung darüber, ob eher H oder H für Grundgesamtheit zutrifft, d.h. H und H Aussagen über GG und nicht über die Stichprobe Hier: Prüfgröße : Anzahl der Jungen Falls Y > c Y = X i i= für geeigneten kritischen Wert c Entscheidung für H! 9

Aber: Wie ist c zu wählen? Dazu: Annahme gerechtfertigt, dass Geburten unabhängig X ~Binomial(n =, π.5) i = H y 2 3 4 5 P(Y=y)...44.7.25.246

Skizze: B (,.),3,25,2,5,,5 2 3 4 5 6 7 8 9

Außerdem: Unter H erwartet: 5 Jungengeburten d.h. Y > 5 spricht für H Aber wie groß müssen Werte sein, dass ihr Zustandekommen unter H extrem unwahrscheinlich ist? Was ist extrem unwahrscheinlich? üblich:.,.5,. Signifikanzniveau α Konstruktion des sogenannten Ablehnungsbereichs, der alle Werte enthält, - die für H sprechen - deren Wahrscheinlichkeit insgesamt α Simulation mit R 2

Beispiel: n = Da, π =.5, α =., Y ~Bin (,.5) H Ablehnungsbereich enthält alle y-werte, also Anzahl von Jungengeburten, die - größer 5 - zusammengenommen unter H eine Wahrscheinlichkeit von höchstens. besitzen P P P P H H H H ( Jungengeburten) =. + =. + (9 Jungengebu rten) =. =.55 (8 Jungengebu rten) =.44 (7 Jungengebu rten) =.7 >. Ablehnungs bereich C = {8,9,} 3

Interpretation: 8, 9, Jungengeburten sind unter der Annahme, dass Jungenund Mädchengeburten gleich wahrscheinlich sind, nur mit einer Wahrscheinlichkeit von höchstens % möglich so klein, dass Schluss naheliegend: H gilt! Man sagt: H kann zugunsten von H verworfen werden. 4

Damit: Statistischer Test liefert objektive Entscheidung H beibehalten bzw. Beobachtungen liefern stat. nicht signifikantes Ergebnis aber Vorsicht! statistischer Test kann nur entscheiden, ob Ergebnis im statistischen Sinn signifikant, also statistisch bedeutend, aber nicht, ob auch unter substanzwissenschaftlichen Gesichtspunkt H ablehnen bzw. Beobachtungen liefern statistisch signifikantes Ergebnis 5

Also: Stat. Signifikanz nicht immer gleich biologischer Relevanz Bewertung der Biologischen Relevanz eventuell unter Einbeziehung der Nebenkriterien (z.b. positive / negative Nebenwirkungen, Wohlbefinden des Patienten, Allgemeinzustand) Abb. : Statistische Signifikanz und biologische Relevanz Statistische Signifikanz Biologische ja + - Relevanz nein - + ja nein Wichtig: Inhaltliche Interpretierbarkeit der Ergebnisse 6

Beispiel: Biologisch relevante Blutdrucksenkung (BDS), wenn BDS > /5 mmhg bei Patienten mit leichtem bis mittelschwerem Bluthochdruck. Blutdruck vorher Blutdruck nachher ( Baseline ) ( nach Gabe der Mittels ) Y Y H H : µ : µ µ < µ Biolog. Relevanz Stat. Signifikanz bio logisch Relevant, wenn µ µ > /5 mmhg ja ja nein nein ja nein ja nein Y Y Y Y Y Y Y Y > /5 und Ablehnung von H > /5 und Nicht - Ablehnung < /5 und Ablehnung von H < /5 und Nicht - Ablehnung von H 7 von H

Außerdem möglich: Fehlentscheidungen Test entscheidet - mehr Jungen- als Mädchengeburten, obwohl tatsächlich gleich viele - gleich viele Jungen- und Mädchengeburten, obwohl tatsächlich mehr Jungen, d.h. - H wird verworfen, obwohl H wahr Fehler. Art (α-fehler) - H wird beibehalten, obwohl H wahr Fehler 2. Art (β-fehler) 8

Damit sind folgende Ausgänge eines Tests möglich: Abb. 2: Hypothese wahr nicht wahr Test lehnt ab lehnt nicht ab Fehler. Art (α-fehler) richtig richtig Fehler 2. Art (β-fehler) 9

Beachte: stat. Test med. Test bei beiden Fehlentscheidungen möglich Testproblem bei med. Test (Diagnose) H : Patient gesund vs. H : Patient krank Ziel: med. Test mit großer Genauigkeit bei Einstufung von gesundem Patienten als gesund hohe Spezifität geringe Wahrscheinlichkeit für Fehler. Art krankem Patienten als krank hohe Sensitivität geringe Wahrscheinlichkeit für Fehler 2. Art 2

Merke: Konstruktion statistischer Tests so, dass Kontrolle über Wahrscheinlichkeit für Fehler. Art durch kleine vorgegebene obere Schranke Signifikanzniveau α Sicherheitswahrscheinlichkeit - α keine Kontrolle über Wahrscheinlichkeit für Fehler 2. Art Suche nach bestem Test: unter allen Tests zum Niveau α für vorliegendes Testproblem derjenige mit geringster Wahrscheinlichkeit für Fehler 2. Art Fallzahl-Bestimmung durch Festlegung der Power des Tests bei einem bestimmten Wirkunterschied unter Berücksichtigung der Streuung des Hauptzielkriteriums. Power: Funktion, die abhängt vom wahren Wirkunterschied ( µ -µ im BDS-Beispiel) und der Streuung. 2

Damit: Nullhypothese höchstens mit Wahrscheinlichkeit α fälschlicherweise verworfen Wahrscheinlichkeit für den Fehler 2. Art nicht vorgegeben abhängig von gewählter Alternative, je näher wahrer Parameter an (nicht wahrem) Wert aus H, desto größer Wahrscheinlichkeit für Fehler 2. Art Ungleichbehandlung beider Fehlerarten Grund für Formulierung eigentlicher Forschungsfrage als statistische Alternative: Entscheidung für H durch α statistisch abgesichert! 22

Zur Veranschaulichung: Steht Angeklagter vor Gericht, so lautet H : Angeklagter ist unschuldig und H : Angeklagter ist schuldig H und H so formuliert, da Gericht Schuld des Angeklagten beweisen muss, nicht Angeklagter Unschuld Fehler. Art: Unschuldiger wird verurteilt Fehler 2. Art: Schuldiger wird nicht verurteilt 23

Beachte: Wichtig für Auswahl eines besten statistischen Tests: Verteilungsmodell hängt ab vom Skalenniveau und Wertebereich der Ausprägungen der interessierenden Größe 24