2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:



Ähnliche Dokumente
Je genauer und sicherer, desto größer muss der Stichprobenumfang sein

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests; Motivationsbeispiel

Vorlesung: Statistik II für Wirtschaftswissenschaft

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung.

Kapitel 3 Schließende Statistik

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistisches Testen

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Kapitel 13. Grundbegriffe statistischer Tests

Allgemeines zu Tests. Statistische Hypothesentests

Jost Reinecke. 7. Juni 2005

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

So berechnen Sie einen Schätzer für einen Punkt

Statistik II. Statistische Tests. Statistik II

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Statistik II für Studierende der Soziologie und Nebenfachstudierende

R. Brinkmann Seite

Statistik II für Betriebswirte Vorlesung 1

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Ablaufschema beim Testen

R. Brinkmann Seite

Exakter Binomialtest als Beispiel

Kapitel 3 Schließende Statistik

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests; Motivationsbeispiel

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

2.4 Hypothesentests. Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989).

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Statistische Tests Version 1.2

Vorlesung: Statistik II für Wirtschaftswissenschaft

Statistische Tests (Signifikanztests)

8. Konfidenzintervalle und Hypothesentests

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Mathematik 2 Dr. Thomas Zehrt

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Kapitel III: Einführung in die schließende Statistik

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Statistik II. Statistische Tests. Statistik II

Mathematik für Biologen

Einführung in Quantitative Methoden

Empirische Wirtschaftsforschung

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

3 Grundlagen statistischer Tests (Kap. 8 IS)

GRUNDPRINZIPIEN statistischen Testens

Analytische Statistik II

3) Testvariable: T = X µ 0

9 Prinzipien der statistischen Hypothesenprüfung

Klassifikation von Signifikanztests

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Eine Einführung in R: Statistische Tests

Schließende Statistik: Hypothesentests (Forts.)

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Klassifikation von Signifikanztests

Bereiche der Statistik

Beurteilende Statistik

Kapitel XIV - Anpassungstests

5. Seminar Statistik

Biostatistik, Winter 2011/12

2.3 Intervallschätzung

Grundlagen der Statistik

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.

Serie 9, Musterlösung

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistische Tests Übersicht

Klassifikation von Signifikanztests

6. Statistische Hypothesentests

Auswertung und Lösung

Statistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik

Testentscheidungen. Worum geht es in diesem Modul? Kritische Werte p-wert

Test auf den Erwartungswert

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Mehrdimensionale Zufallsvariablen

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Statistik II für Betriebswirte Vorlesung 1

2.3 Intervallschätzung

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Abiturvorbereitung Alkoholsünder, bedingte Wahrscheinlichkeit, Hypothesentest Aufgabenblatt

Mathematik für Biologen

11. Parametrische Tests 11.1 Konzeption von statistischen Tests

Grundlagen der Statistik

Konkretes Durchführen einer Inferenzstatistik

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Prüfung aus Statistik 2 für SoziologInnen

3.Wiederholung: Toleranzbereiche Für EX Geg:

9 Prinzipien der statistischen Hypothesenprüfung

Transkript:

2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer Test: Überprüfung von Hypothesen über die Grundgesamtheit anhand einer Stichprobe Statistische Testtheorie: Schließe von Stichprobe auf Grundgesamtheit Vorgehen: inhaltliche Hypothese aufstellen Operationalisierung inhaltliche Hypothese in statistische Hypothese übersetzen statistischer Test 2 Induktive Statistik 263

Bsp. 2.17. Studie zur Einstellung der Münchner Bevölkerung zu psychisch Kranken (1989). Wir betrachten eine Teilstudie: Kooperationsbereitschaft in der Befragung. 1. Theorie : Aktive Stellung im öffentlichen Leben beeinflusst Kooperationsbereitschaft positiv. Aktiv Altruismus Interesse an öffentlichen Angelegenheiten eher bereit, die Rolle des Befragten einzunehmen 2. Hypothese: Unterscheidet sich die Koorperationsbereitschaft der aktiven Personen vom Rest der Bevölkerung? 3. Operationalisierung: Aktiv im öffentlichen Leben Verbandsmitgliedschaft ja/nein = Variable X 2 Induktive Statistik 264

Kooperationsbereitschaft antwortet freiwillig (Koorperativer)/nur auf sanften Druck (Primärverweigerer) = Variable Y 4. Statistische Hypothesen: Besteht ein Zusammenhang zwischen X und Y? Statistisches Vorgehen: Kann die sog. Nullhypothese Es besteht kein Zusammenhang zwischen X und Y abgelehnt werden? 2 Induktive Statistik 265

Herleitung / Motivation eines geeigneten Prüfverfahrens Gegebene Daten (relative und absolute Häufigkeiten): aktiv ja nein. kooperativ ja nein 0.27 0.05 (95) 0.53 (186) 0.8 (281) (17) 0.15 (54) 0.2 (71) 0.32 (112) 0.68 (240) 1 (352) Vergleiche gegebene Tafel mit der Unabhängigkeitstafel Wie würde denn die Tafel aussehen, wenn kein Zusammenhang bestünde? Genauer: wie würde das Innere der Tabelle aussehen, wenn Unabhängigkeit (und die gleichen Randverteilungen) herrschen würde, also die Nullhypothese zutreffen würde? 2 Induktive Statistik 266

aktiv kooperativ ja nein ja 0.256 0.064 0.32 nein 0.544 0.136 0.68 0.8 0.2 1 Die Häufigkeiten in der Unabhängigkeitstafel weichen von den tatsächlichen Daten ab. Vgl. Statistik I: Je stärker die Abweichung, desto stärker ist der Zusammenhang. 2 Induktive Statistik 267

Kardinalfrage der Testtheorie: Wann ist die Abweichung groß genug, d.h. überzufällig? Testen mit Hilfe des p-wertes (Alternative: Testen mithilfe eines Ablehnbereichs, s.u.) Bestimme eine Zufallsvariable T, die in geeigneter Weise den Unterschied einer zufälligen Stichprobe zur Situation der Nullhypothese misst (hier: der χ 2 -Abstand zwischen einer Stichprobe und der Unabhängigkeitstafel, vgl. Statistik I). Bestimme die Realisation t von T anhand der konkreten Daten (hier: χ 2 =2.11). Berechne die Wahrscheinlichkeit, einen mindestens so extremen Wert von T zu beobachten, falls H 0 richtig ist: p-wert := P (T t H 0 ) (hier: p-wert=0.15). 2 Induktive Statistik 268

Falls p-wert einer aus substanzwissenschaftlichen Überlegungen abgeleiteten, vorgegebenen Schranke α (Signifikanznivea), dann H 0 ablehnen, sonst beibehalten. (hier bei α = 0.05 (üblicher Wert): p-wert zu groß: Die Nullhypothese kann nicht abgelehnt werden.) Der Richtwert α, das sogenannte Signifikanzniveau soll sicherstellen, dass die Nullhypothese nur in α der Fälle fälschlicherweise abgelehnt wird. 2 Induktive Statistik 269

Fehler 1. Art (α-fehler): Die Nullhypothese wird abgelehnt, obwohl sie in Wirklichkeit richtig ist. z.b.: Man behauptet, es bestünde ein Zusammenhang, obwohl in Wirklichkeit kein Zusammenhang besteht. Der Fehler 1. Art soll klein sein (üblich sind 5% oder 10%). Allerdings kann man nicht fordern, dass der Fehler 1. Art bei 0% liegen soll, sonst würde man die Nullhypothese nie ablehnen können. Fehler 2. Art 2 Induktive Statistik 270

Fehler 2. Art (β-fehler): Die Nullhypothese wird beibehalten, obwohl sie in Wirklichkeit falsch ist. Ein guter statistischer Test garantiert bei einem vergegebenen niedrigen Signifikanzniveau (als Schranke für den Fehler 1. Art) auch einen möglichst geringen Fehler 2. Art. 2 Induktive Statistik 271

2.4.2 Konstruktion eines parametrischen statistischen Tests 1. Aufstellen der substanzwissenschaftlichen Hypothese / inhaltliche Fragestellung (z.b. Rot/Grün bekommt die absolute Mehrheit, das Einkommen von Akademikern beträgt mindestens 3000 Euro) 2. Formulieren eines geeigneten statistischen Modells Im Folgenden stets X 1,...,X n i.i.d. Stichprobe sowie parametrisches Modell mit unbekanntem Parameter ϑ. Anteil Rot/Grün: B(1,π) Durchschnittseinkommen: N (μ; σ 2 ). 3. Formulierung der statistischen Hypothesen Umformulieren der substantzwissenschaftlichen Hypothesen als Hypothesen über ϑ. 2 Induktive Statistik 272

Verglichen wird immer eine sog. Nullhypothese (H 0 ) mit einer sog. Alternativhypothese (H 1 ). Bei parametrischen Fragestellungen: a) Einseitige Testprobleme: H 0 : ϑ ϑ 0 gegen H 1 : ϑ>ϑ 0 b) Zweiseitiges Testproblem: H 0 : ϑ ϑ 0 gegen H 1 : ϑ<ϑ 0 H 0 : ϑ = ϑ 0 gegen H 1 : ϑ ϑ 0 ϑ 0 ist ein fester, vorgegebener Wert, der von inhaltlichem Interesse ist; zu unterscheiden von wahrem Wert ϑ. 2 Induktive Statistik 273

4. Festlegung des Signifikanzniveaus α Beim Testen sind folgende Entscheidungen möglich: H 0 : ablehnen oder H 0 : beibehalten Der Begriff einseitig/zweiseitig bezieht sich auf die Alternative, je nachdem ob die Alternative nur aus großen bzw. nur aus kleinen Werten besteht oder ob sowohl große als auch kleine Werte für die Alternative sprechen. Damit sind zwei verschiedene Arten von Fehlern möglich: Aktion Wahrheit H 0 wahr H 0 falsch H 0 beibehalten Fehler 2. Art H 0 ablehnen Fehler 1.Art Man kann nicht beide Fehlerwahrscheinlichkeiten gleichzeitig kontrollieren! (Tradeoff!) 2 Induktive Statistik 274

asymmetrische Vorgehensweise: α =0.1, α =0.05, α =0.01 α =0.001 marginal signifikant signifikant hoch signifikant höchst signifikant 5. Festlegen einer Testgröße und einer kritischen Region Eine Testgröße T ist eine Zufallsgröße T = g(x 1,...,X n ), die empfindlich gegenüber Abweichungen von H 0 ist. Die Kritische Region KR ( Ablehnungsbe- reich ) besteht aus potentiellen Werten von T, die gegen H 0 sprechen. 6. Auswerten der Stichprobe Berechnung der Realisation t der Testgröße T basierend auf der konkret vorliegenden Stichprobe. 7. Testentscheidung Ist t KR, dann H 0 ablehnen, sonst nicht ablehnen. 2 Induktive Statistik 275

Bem. 2.18. Die wesentliche Elemente des Tests (Signifikanzniveau, Testgröße, kritische Region) sind unabhängig von den Daten, also vor der Auswertung zu bestimmen. Da nur die Fehlerwahrscheinlichkeit 1. Art kontrolliert werden kann, kann H 0 nicht mit einer a priori kontrollierten Fehlerwahrscheinlichkeit angenommen, sondern nur abgelehnt oder nicht abgelehnt, werden. Vergleich Popper: Prinzipiell Nichtverifizierbarkeit, aber Falsifizierbarkeit von Allaussagen. Z.B. kann der Nachweis, das Handystrahlen nicht gesundheitsschädlich sind aus prinzipiellen, logischen Überlegungen nicht erbracht werden. Man kann bestenfalls die Hypothese keine schädliche Wirkung nicht verwerfen. Als guter Forscher sollte man deshalb immer das, was man zeigen will, in die Alternativhypothese schreiben. z.b. Forscher will zeigen, dass sein Medikament besser wirkt als ein anderes. Nullhypothese: Es wirkt schlechter oder gleich gut. Alternativhypothese: Es wirkt besser. 2 Induktive Statistik 276

Durch die Kontrolle des Fehlers 1. Art ist gewährleistet, dass die Wahrscheinlichkeit, den Medikament irrtümlich eine bessere Wirkung zuzuschreiben höchstens α ist. Allerdings gibt es nicht immer einen (einfachen) statistischen Test für jede Nullhypothese. z.b. ist es technisch viel einfacher als Nullhypothese θ = θ 0 zu verwenden, als θ θ 0 ( Äquivalenztest ). Verwendet man deshalb einen Test mit H 0 : θ = θ 0,möchte man inhaltlich aber genau dies zeigen, kehren sich die Rollen des Fehlers 1. Art und des Fehlers 2. Art um. Um in diesem Fall einen geringeren Fehler 2. Art zu erzielen, sollte das Signifikanzniveau höher als üblich gewählt werden. 2 Induktive Statistik 277