Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Ähnliche Dokumente
Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Jost Reinecke. 7. Juni 2005

Klausur Wiederholung t-tests. Zusammenfassung. Hypothesentests II. Statistik I. Sommersemester Statistik I Hypothesentests I (1/37)

Hypothesentests II. Statistik I. Sommersemester Klausur Wiederholung t-tests. Zusammenfassung. Statistik I Hypothesentests I (1/37)

Wiederholung. Statistik I. Sommersemester 2009

Zentraler Grenzwertsatz/Konfidenzintervalle

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

3 Grundlagen statistischer Tests (Kap. 8 IS)

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Statistische Tests (Signifikanztests)

Statistik II. IV. Hypothesentests. Martin Huber

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik II. Statistische Tests. Statistik II

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

T-Test für unabhängige Stichproben

Statistisches Testen

9 Prinzipien der statistischen Hypothesenprüfung

Empirische Wirtschaftsforschung

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Allgemeines zu Tests. Statistische Hypothesentests

Statistische Tests für unbekannte Parameter

Analyse von Querschnittsdaten. Signifikanztests I Basics

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistische Tests für unbekannte Parameter

Willkommen zur Vorlesung Statistik (Master)

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Wahrscheinlichkeitsverteilungen

Einführung in Quantitative Methoden

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

SozialwissenschaftlerInnen II

Lösungen zum Aufgabenblatt 14

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Auswertung und Lösung

Bereiche der Statistik

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Grundlagen der schließenden Statistik

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Serie 9, Musterlösung

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

3.3 Konfidenzintervalle für Regressionskoeffizienten

So berechnen Sie einen Schätzer für einen Punkt

Statistik II. IV. Hypothesentests. Martin Huber

Übungsaufgaben zu Statistik II

Schließende Statistik

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Mathematische und statistische Methoden II

5. Seminar Statistik

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Statistische Methoden in den Umweltwissenschaften

Statistische Tests Version 1.2

Methodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Inferenzstatistik (=schließende Statistik)

Konkretes Durchführen einer Inferenzstatistik

9 Prinzipien der statistischen Hypothesenprüfung

Statistik I für Betriebswirte Vorlesung 14

Willkommen zur Vorlesung Statistik (Master)

Konfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Lösungen zu den Übungsaufgaben in Kapitel 10

Testen von Hypothesen:

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Klassifikation von Signifikanztests

Vorlesung: Statistik II für Wirtschaftswissenschaft

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Analyse von Querschnittsdaten. Signifikanztests I Basics

Kapitel 3 Schließende Statistik

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher.

Stichproben Parameterschätzung Konfidenzintervalle:

2.3 Intervallschätzung

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Einführung in die Induktive Statistik: Testen von Hypothesen

2.3 Intervallschätzung

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Analytische Statistik II

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Modul G.1 WS 07/08: Statistik

Bereiche der Statistik

How To Find Out If A Ball Is In An Urn

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistische Methoden in der MMST: Schließende Statistik

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Statistische Methoden in der MMST: Schließende Statistik

Eine Einführung in R: Statistische Tests

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Statistik II für Betriebswirte Vorlesung 1

Vergleich von Parametern zweier Stichproben

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Transkript:

Statistik I Sommersemester 2009 Statistik I I (1/36)

Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36)

Zum Nachlesen Agresti/Finlay: Kapitel 6+7 Gehring/Weins: Kapitel 12 (Schumann: Kapitel 7.3) Statistik I I (3/36)

Grenzwertsatz Konfidenzintervalle Gefälschte Münze Normalverteilung? Zentraler Grenzwertsatz: 1. Komplexe Zufallsvariablen (z. B. Stichprobenmittelwerte), 2. Die additiv aus vielen (> 30) einfachen Zufallsvariablen zusammengesetzt sind 3. Verteilen sich über eine große Zahl von Wiederholungen normal 4. Unabhängig davon, wie die einfachen Zufallsvariablen verteilt sind Statistik I I (4/36)

Grenzwertsatz Konfidenzintervalle Gefälschte Münze Normalverteilung? Zentraler Grenzwertsatz: 1. Komplexe Zufallsvariablen (z. B. Stichprobenmittelwerte), 2. Die additiv aus vielen (> 30) einfachen Zufallsvariablen zusammengesetzt sind 3. Verteilen sich über eine große Zahl von Wiederholungen normal 4. Unabhängig davon, wie die einfachen Zufallsvariablen verteilt sind Eine Serie von Münzen ist gefälscht D. h. p Kopf = 0.95 Grundgesamtheit = theoretische Verteilung Stichprobenziehung mit Umfang n n Münzen gleichzeitig werfen, Anzahl Kopf auszählen Statistik I I (4/36)

Theoretische Verteilung (GG) Grenzwertsatz Konfidenzintervalle 0.0 0.2 0.4 0.6 0.8 Kopf Zahl Statistik I I (5/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=1 0.0 0.2 0.4 0.6 0.8 0 1 Anzahl Kopf in Stichprobe Statistik I I (6/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=3 0.0 0.2 0.4 0.6 0.8 1 2 3 Anzahl Kopf in Stichprobe Statistik I I (6/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=5 0.0 0.2 0.4 0.6 2 3 4 5 Anzahl Kopf in Stichprobe Statistik I I (6/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=10 0.0 0.2 0.4 0.6 5 6 7 8 9 10 Anzahl Kopf in Stichprobe Statistik I I (6/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=20 0.00 0.10 0.20 0.30 14 15 16 17 18 19 20 Anzahl Kopf in Stichprobe Statistik I I (6/36)

Was passiert hier? Wiederholung Grenzwertsatz Konfidenzintervalle Kopf sehr viel wahrscheinlicher ( 0.95 0.05 = 19) als Zahl Wahrscheinlichkeit, in einer Stichprobe vom Umfang n ausschließlich Kopf zu erhalten: 0.95 n Warum? einzelne Münzen sind unabhängig voneinander (konditionale = marginale Wahrscheinlichkeit) Einzelwahrscheinlichkeiten multiplizieren n = 2 0.95 0.95 0.90 n = 4 0.95 0.95 0.95 0.95 0.81 n = 10 0.95 10 0.6 n = 20 0.95 20 0.36 Für große n werden Werte im mittleren Bereich wahrscheinlicher als ausschließlich Kopf Statistik I I (7/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=50 0.00 0.10 0.20 40 42 44 46 48 50 Anzahl Kopf in Stichprobe Statistik I I (8/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=100 0.00 0.05 0.10 0.15 84 86 88 90 92 94 96 98 Anzahl Kopf in Stichprobe Statistik I I (8/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=200 0.00 0.04 0.08 0.12 175 180 184 188 192 196 Anzahl Kopf in Stichprobe Statistik I I (8/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=400 0.00 0.02 0.04 0.06 0.08 360 367 372 377 382 387 392 Anzahl Kopf in Stichprobe Statistik I I (8/36)

10 000 Wiederholungen Wiederholung Grenzwertsatz Konfidenzintervalle Stichprobenumfang n=800 0.00 0.02 0.04 0.06 736 743 750 757 764 771 778 Anzahl Kopf in Stichprobe Statistik I I (8/36)

(Binomialformel) Wiederholung Grenzwertsatz Konfidenzintervalle Exakte Verteilung = Binomialverteilung (für Zusammenwirken binärer Zufallsvariablen) Z. B. Wahrscheinlichkeit, bei einer Stichprobengröße von n = 800 760 mal Kopf zu erhalten ( ) 800 0.95 760 0.05 40 = 760 800 799 761 760 759 1 0.95760 0.05 40 0.065 Statistik I I (9/36)

Grenzwertsatz Konfidenzintervalle Ziehung aus hypothetischer Grundgesamtheit Links-Rechts-Wert in hypothetischer Grundgesamtheit Werte zwischen 1 (links) und 11 (rechts) Verteilung linkssteil/rechtssschief Mittelwert 4.89 Varianz 13.12 Statistik I I (10/36)

Verteilung in GG Wiederholung Grenzwertsatz Konfidenzintervalle 0.00 0.05 0.10 0.15 0.20 1 2 3 4 5 6 7 8 9 10 Statistik I I (11/36)

GG und drei Stichproben (n=400) Grenzwertsatz Konfidenzintervalle 0.00 0.05 0.10 0.15 0.20 1 2 3 4 5 6 7 8 9 10 0 20 40 60 80 100 0 10 30 50 70 0 20 40 60 80 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 x = 4.52 x = 4.85 x = 4.89 Statistik I I (12/36)

Grenzwertsatz reloaded Wiederholung Grenzwertsatz Konfidenzintervalle Was erwarten wir für die Verteilung der Mittelwerte aus vielen (z. B. 1 000) Stichproben? Statistik I I (13/36)

Grenzwertsatz reloaded Wiederholung Grenzwertsatz Konfidenzintervalle Was erwarten wir für die Verteilung der Mittelwerte aus vielen (z. B. 1 000) Stichproben? Normalverteilung Um den wahren Mittelwert von 4.89 Mit einem theoretischen Standardfehler (Standardabweichung) von: 13.12 ˆσ x = 400 = 0.181 Statistik I I (13/36)

Grenzwertsatz Konfidenzintervalle Verteilung Stichprobenmittelwerte Frequency 0 50 100 150 200 4.2 4.4 4.6 4.8 5.0 5.2 5.4 Stichprobenmittelwerte Mittelwert der Stichprobenmittelwerte: 4.89 Standardabweichung der Stichprobenmittelwerte: 0.182 Statistik I I (14/36)

Grenzwertsatz Konfidenzintervalle Wie kommt man vom Grenzwertsatz zum Konfidenzintervall? I Normalverteilung der Stichprobenmittelwerte um wahren Mittelwert in der GG Bekannte Eigenschaften der Normalverteilung Symmetrisch 90% der Fläche (=Wahrscheinlichkeit) ±1.64 Standardabweichungen vom Mittelwert 95% der Fläche (=Wahrscheinlichkeit) ±1.96 Standardabweichungen vom Mittelwert 99% der Fläche (=Wahrscheinlichkeit) ±2.58 Standardabweichungen vom Mittelwert Weitere Integrale aus Tabelle ablesbar Statistik I I (15/36)

Grenzwertsatz Konfidenzintervalle Wie kommt man vom Grenzwertsatz zum Konfidenzintervall? II 95% aller Stichproben nicht mehr als 1.96 Standardabweichungen (=Standardfehler) vom wahren Mittelwert entfernt Standardfehler: ˆσ x = σ 2 n (schätzen) In 95% der Stichproben schließt Intervall von 1.96 Standardfehlern um Stichprobenmittelwert wahren Mittelwert in GG mit ein Wenn Varianz in GG nicht bekannt, Schätzung t-verteilung (mehr extreme Werte) Für große Fallzahlen geht t-verteilung in Normalverteilung über Statistik I I (16/36)

Logik des Was heißt Hypothesenprüfung? Zweites wichtiges Teilgebiet der Inferenzstatistik Wie lassen sich 1. Mit Stichproben 2. Annahmen/Hypothesen über eine (normalerweise unbekannte) Grundgesamtheit überprüfen? Wichtige Testverfahren u. a. Mittelwertunterschiede bei bekannter Streuung () Mittelwertunterschiede für unabhängige/abhängige Stichproben (t-test) χ 2 -Test auf Unabhängigkeit Test Nullhypothese vs. Alternativhypothese Zahlreiche weitere Testverfahren mit identischer Logik Statistik I I (17/36)

Logik des Was ist eine Alternativhypothese? Idealerweise neue, inhaltlich interessante, theoretische begründete Hypothese über Verhältnisse in GG Gerichtet oder ungerichtet Spezifisch oder unspezifisch Beispiele Frauen verdienen im Mittel schlechter als Männer Statistik I I (18/36)

Logik des Was ist eine Alternativhypothese? Idealerweise neue, inhaltlich interessante, theoretische begründete Hypothese über Verhältnisse in GG Gerichtet oder ungerichtet Spezifisch oder unspezifisch Beispiele Frauen verdienen im Mittel schlechter als Männer (gerichtet, unspezifisch) Statistik I I (18/36)

Logik des Was ist eine Alternativhypothese? Idealerweise neue, inhaltlich interessante, theoretische begründete Hypothese über Verhältnisse in GG Gerichtet oder ungerichtet Spezifisch oder unspezifisch Beispiele Frauen verdienen im Mittel schlechter als Männer (gerichtet, unspezifisch) Es besteht ein Zusammenhang zwischen rechtsextremen Einstellungen und Wahl der NPD Statistik I I (18/36)

Logik des Was ist eine Alternativhypothese? Idealerweise neue, inhaltlich interessante, theoretische begründete Hypothese über Verhältnisse in GG Gerichtet oder ungerichtet Spezifisch oder unspezifisch Beispiele Frauen verdienen im Mittel schlechter als Männer (gerichtet, unspezifisch) Es besteht ein Zusammenhang zwischen rechtsextremen Einstellungen und Wahl der NPD (ungerichtet, unspezifisch) Statistik I I (18/36)

Logik des Was ist eine Alternativhypothese? Idealerweise neue, inhaltlich interessante, theoretische begründete Hypothese über Verhältnisse in GG Gerichtet oder ungerichtet Spezifisch oder unspezifisch Beispiele Frauen verdienen im Mittel schlechter als Männer (gerichtet, unspezifisch) Es besteht ein Zusammenhang zwischen rechtsextremen Einstellungen und Wahl der NPD (ungerichtet, unspezifisch) Alternativhypothese wird mit H A bezeichnet Statistik I I (18/36)

Logik des Was ist eine Nullhypothese? H 0 Gegenstück zur Alternativhypothese, negiert diese Frauen verdienen genauso viel oder mehr als Männer Zwischen rechtsextremen Einstellungen und der Wahl der NPD besteht kein Zusammenhang Idealerweise steht H 0 für den etablierten Forschungsstand; H 0 als Grundannahme H 0 und H A schließen sich gegenseitig aus und beschreiben Möglichkeitsraum vollständig, d. h. In der GG gilt entweder H 0 oder (exklusiv) H A Statistik I I (19/36)

Logik des Was ist das Entscheidungsdilemma beim Hypothesentest? Entscheidung auf Grundlage Stichprobe In der GG gilt... H A H 0 H A richtig α-fehler H 0 β-fehler richtig β 1 α! Statistik I I (20/36)

Logik des Was ist das Entscheidungsdilemma beim Hypothesentest? Entscheidung auf Grundlage Stichprobe In der GG gilt... H A H 0 H A richtig α-fehler H 0 β-fehler richtig β 1 α! Statistik I I (20/36)

Logik des Was ist die Irrtumswahrscheinlichkeit? Wahrscheinlichkeit, einen α-fehler (Fehler 1. Ordnung) zu begehen Wahrscheinlichkeit für β-fehler (vs.) Teststärke (Power) bleibt meistens unberücksichtigt Verfahren inhärent konservativ Irrtumswahrscheinlichkeit α wird vorab auf kleinen Wert festgelegt (1%, 5%, 10%) Statistik I I (21/36)

Logik des Was ist die Irrtumswahrscheinlichkeit? Wahrscheinlichkeit, einen α-fehler (Fehler 1. Ordnung) zu begehen Wahrscheinlichkeit für β-fehler (vs.) Teststärke (Power) bleibt meistens unberücksichtigt Verfahren inhärent konservativ Irrtumswahrscheinlichkeit α wird vorab auf kleinen Wert festgelegt (1%, 5%, 10%) Definition α Wahrscheinlichkeit, daß H 0 zu unrecht aufgegeben wird Obwohl sie in GG gilt Statistik I I (21/36)

Logik des Was ist ein Signifikanztest? Alle Tests prüfen statistische Signifikanz Voraussetzung: In GG gilt tatsächlich H 0 Berechnung einer Prüfgröße (Teststatistik) auf Basis der Stichprobe Wenn H 0 in GG gilt, ist Prüfgröße Realisierung einer Zufallsvariablen Mit bekannter Verteilung Verteilung bekannt kritische Werte Werden nur in 1/5/10% aller Stichproben überschritten, wenn H 0 in GG signifikant Unterscheidung zwischen gerichteten und ungerichteten Hypothesen Statistik I I (22/36)

Logik des Statistische vs. praktisch-politische Signifikanz : Ergebnis sehr unwahrscheinlich (1/5/10%), wenn H 0 in GG gilt Deshalb H 0 verwerfen Sehr unwahrscheinlich, dies zu unrecht zu tun Statistik I I (23/36)

Logik des Statistische vs. praktisch-politische Signifikanz : Ergebnis sehr unwahrscheinlich (1/5/10%), wenn H 0 in GG gilt Deshalb H 0 verwerfen Sehr unwahrscheinlich, dies zu unrecht zu tun Aber: Plausibel, daß in GG exakt gar kein Zusammenhang besteht? Statistik I I (23/36)

Logik des Statistische vs. praktisch-politische Signifikanz : Ergebnis sehr unwahrscheinlich (1/5/10%), wenn H 0 in GG gilt Deshalb H 0 verwerfen Sehr unwahrscheinlich, dies zu unrecht zu tun Aber: Plausibel, daß in GG exakt gar kein Zusammenhang besteht? Je größer Stichprobe, desto eher werden triviale Abweichungen von H 0 statistisch signifikant Statistik I I (23/36)

Logik des Statistische vs. praktisch-politische Signifikanz : Ergebnis sehr unwahrscheinlich (1/5/10%), wenn H 0 in GG gilt Deshalb H 0 verwerfen Sehr unwahrscheinlich, dies zu unrecht zu tun Aber: Plausibel, daß in GG exakt gar kein Zusammenhang besteht? Je größer Stichprobe, desto eher werden triviale Abweichungen von H 0 statistisch signifikant vs. inhaltliche Bedeutsamkeit Statistik I I (23/36)

Logik des Statistische vs. praktisch-politische Signifikanz : Ergebnis sehr unwahrscheinlich (1/5/10%), wenn H 0 in GG gilt Deshalb H 0 verwerfen Sehr unwahrscheinlich, dies zu unrecht zu tun Aber: Plausibel, daß in GG exakt gar kein Zusammenhang besteht? Je größer Stichprobe, desto eher werden triviale Abweichungen von H 0 statistisch signifikant vs. inhaltliche Bedeutsamkeit Insignificance of significance testing Statistik I I (23/36)

Logik des Einfacher Test Frage: Kann eine Stichprobe mit einem gewissen Mittelwert Tatsächlich aus einer bekannten GG mit bekanntem Mittelwert/bekannter Streuung stammen? Relativ selten angewendet, aber Modell für komplexere Testverfahren Für große Fallzahlen t-test Statistik I I (24/36)

Logik des Beispiel: Bildungsforschung Land X unterrichtet seit 1982 Mathematik nach festem Plan 10. Klasse: standardisierter Leistungstest GG bekannt: Mittelwert µ = 40 Punkte Standardabweichung σ = 8 Punkte Statistik I I (25/36)

Logik des Beispiel: Bildungsforschung Land X unterrichtet seit 1982 Mathematik nach festem Plan 10. Klasse: standardisierter Leistungstest GG bekannt: Mittelwert µ = 40 Punkte Standardabweichung σ = 8 Punkte Neue, angeblich bessere Unterrichtsmethode, Test an n = 100 zufällig ausgewählten Schülern H A : Die neue Methode ist besser als die alte H 0 : Neue Methode genauso gut oder schlechter Irrtumswahrscheinlichkeit α wird auf 5% festgelegt Einseitiger Test, da Hypothese gerichtet Statistik I I (25/36)

Logik des Beispiel: Bildungsforschung Land X unterrichtet seit 1982 Mathematik nach festem Plan 10. Klasse: standardisierter Leistungstest GG bekannt: Mittelwert µ = 40 Punkte Standardabweichung σ = 8 Punkte Neue, angeblich bessere Unterrichtsmethode, Test an n = 100 zufällig ausgewählten Schülern H A : Die neue Methode ist besser als die alte H 0 : Neue Methode genauso gut oder schlechter Irrtumswahrscheinlichkeit α wird auf 5% festgelegt Einseitiger Test, da Hypothese gerichtet Mittelwert x = 42 Punkte Zufall? Bzw. wie groß ist die Wahrscheinlichkeit, dieses oder ein höheres Ergebnis zu erhalten wenn Stichprobe aus alter GG (µ, σ) stammt? Statistik I I (25/36)

Logik des Vorgehensweise? Richtung der Abweichung von µ stimmt ok Wie wahrscheinlich ist Größenordnung der Abweichung? Hilfsannahme: Was wäre, wenn 1. µ = 0 und 2. Wiederholte Stichprobenziehung und 3. Stichprobenmittelwerte standard-normalverteilt mit σ x = 1? Statistik I I (26/36)

Logik des Vorgehensweise? Richtung der Abweichung von µ stimmt ok Wie wahrscheinlich ist Größenordnung der Abweichung? Hilfsannahme: Was wäre, wenn 1. µ = 0 und 2. Wiederholte Stichprobenziehung und 3. Stichprobenmittelwerte standard-normalverteilt mit σ x = 1? In 95% der Stichproben x < 1.64 In 5% der Stichproben x 1.64 Statistik I I (26/36)

Logik des Standardnormalverteilung 0.4 Dichte 0.3 0.2 1 α = 0.95 0.1 α = 0.05 0 bis 1.64 1.64 bis 4 2 0 2 4 z-werte Statistik I I (27/36)

Logik des Warum 1.64? Dichte 0.4 0.3 0.2 0.1 0 1 α = 0.95 α = 0.05 bis 1.64 1.64 bis 4 2 0 2 4 z-werte Einseitige Hypothese Ablehnungsbereich auf einer (positiver) Seite Welcher Wert trennt rechts 5% (α) der Standardnormalverteilung ab? Nachschauen in kompletter z-tabelle (z. B. Gehring/Weins) Nachschauen in letzter Zeile der t-tabelle Computer Gedächtnis Statistik I I (28/36)

Logik des z-tabelle.0.1.2.3.4.5.6.7.8.9 0.0. 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1. 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2. 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3. 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4. 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5. 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6. 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7. 0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.7852 0.8. 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9. 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0. 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1. 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2. 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3. 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4. 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5. 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6. 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7. 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8. 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706........... Statistik I I (29/36)

Logik des t-tabelle/computer Fläche (1-α) df 0.65 0.7 0.75 0.8 0.85 0.9 0.95 0.975 0.99 0.995 1 0.510 0.727 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.656 2 0.445 0.617 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 3 0.424 0.584 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 4 0.414 0.569 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5 0.408 0.559 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6 0.404 0.553 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 7 0.402 0.549 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 8 0.399 0.546 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 9 0.398 0.543 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250...... 200 0.386 0.525 0.676 0.843 1.039 1.286 1.653 1.972 2.345 2.601 500 0.386 0.525 0.675 0.842 1.038 1.283 1.648 1.965 2.334 2.586 1000 0.385 0.525 0.675 0.842 1.037 1.282 1.646 1.962 2.330 2.581 z-wert 0.385 0.524 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 > qnorm(0.95) [1] 1.644854..... Statistik I I (30/36)

Logik des Bildungsforschung Wie weit ist Stichprobenmittelwert x von Mittelwert GG µ entfernt? Wie wahrscheinlich ist diese/größere Distanz wenn Stichprobe aus GG stammt? µ = 40 0 Differenz betrachten x µ = 42 40 = 2 Alle Normalverteilungen haben selbe Form (5% links von 1.64 etc.) Differenz in Standardabweichungen umrechnen Standardabweichung (=Streuung) Stichprobenmittelwerte um µ = Standardfehler σ x Statistik I I (31/36)

Logik des Standardfehler/Signifikanz Schulexperiment Standardfehler: σ x = σ n = 8 100 = 0.8 Differenz in Standardfehlern ausgedrückt: 2 0.8 = 2.5 = z Mehr als 1.64 signifikant auf 5%-Niveau H 0 (Stichprobe kommt tatsächlich aus alter GG, d. h. neue Methode nicht besser) kann Mit geringer Irrtumswahrscheinlichkeit abgelehnt werden. Statistik I I (32/36)

Logik des Stichprobenmittelwert innerhalb Stichprobenmittelwertverteilung 0.3 Dichte 0.2 0.1 x = 42 0 37 38 39 40 41 42 43 x-werte Statistik I I (33/36)

Logik des Wie groß ist die Irrtumswahrscheinlichkeit genau? z-wert = Quotient aus Mittelwertdifferenz (Effekt) und Standardfehler Standardnormalverteilte Teststatistik Wert von 2.5 in Tabellen/Computer suchen α = 0.006 Statistik I I (34/36)

Logik des Wovon hängt die Irrtumswahrscheinlichkeit ab? Bei konstanten Verhältnissen in der GG (Mittelwert und Streuung)... Von der Stärke des Effektes (hier Mittelwertdifferenz) Und vom Umfang der Stichprobe (über Standardfehler) Mit hinreichend großen Stichproben werden auch triviale Effekte signifikant Gängige Niveaus 1/5/10% sind Konventionen Statistik I I (35/36)

Testverfahren ermöglichen es, mit Hilfe einer Stichprobe Hypothesen über eine GG zu überprüfen Wenn man ein gewisses Irrtumsrisiko in Kauf nimmt, das vorab festgelegt wird Logik: Testgröße berechnen (hier Mittelwertdifferenz/Standardfehler) und mit theoretischer Verteilung vergleichen Irrtumswahrscheinlichkeit kleiner als gewünschtes Niveau von α Alternativhypothese annehmen, sonst Nullhypothese beibehalten Statistik I I (36/36)