Entscheidungsstatistische Verfahren

Ähnliche Dokumente
Stichproben- & Populations- Standardabweichung

Inhaltsverzeichnis. Test nach Cochran. - Stand vom:

Vergleich der Varianzen aus zwei unabhängigen Stichproben: F-Test

t-test für abhängige Stichproben

Statistische Tests (Signifikanztests)

Vergleich der zentralen Tendenz in zwei abhängigen Stichprobenerhebungen

So berechnen Sie einen Schätzer für einen Punkt

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Ablaufschema beim Testen

GRUNDPRINZIPIEN statistischen Testens

Vergleich der zentralen Tendenz in zwei unabhängigen Stichprobenerhebungen

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II

Statistische Tests Version 1.2

Beurteilende Statistik

5. Seminar Statistik

SozialwissenschaftlerInnen II

Konkretes Durchführen einer Inferenzstatistik

Jost Reinecke. 7. Juni 2005

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Statistik-Quiz Wintersemester

T-Test für unabhängige Stichproben

Empirische Methoden zur Analyse gesprochener Sprache

Statistisches Testen

3) Testvariable: T = X µ 0

10 Der statistische Test

Mathematische und statistische Methoden II

Chi-Quadrat Verfahren

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Testen von Hypothesen

Einführung in Quantitative Methoden

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Primer: Inferenzstatistik 1.0

Statistik II für Betriebswirte Vorlesung 1

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Bereiche der Statistik

R. Brinkmann Seite

Kapitel 13. Grundbegriffe statistischer Tests

Analytische Statistik II

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

3 Grundlagen statistischer Tests (Kap. 8 IS)

In welchen Situationen sind nichtparametrische oder verteilungsfreie Verfahren angezeigt?

Mathematische und statistische Methoden II

Exakter Binomialtest als Beispiel

Klausur Statistik 2 RE Statistik für Soziologen Do,

Testen von Hypothesen:

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistik II: Signifikanztests /1

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Mathematische und statistische Methoden II

Thema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population

R. Brinkmann Seite

Grundlagen der Statistik

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesentests mit SPSS. Beispiel für einen t-test

Statistisches Testen: Signifikanz und Relevanz Christiane Spiel

Methodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Statistische Tests Übersicht

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Klassifikation von Signifikanztests

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher.

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Parametrische vs. Non-Parametrische Testverfahren

Klassifikation von Signifikanztests

Statistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Anpassungstests VORGEHENSWEISE

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Multivariate Verfahren

Mathematische und statistische Methoden I

Mathematische und statistische Methoden II

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

SoSe 2014 Klausur zur LV 36654: Einführung in 16. Juli 2014 die Methoden empirischer Forschung. Name: Studiengang: B.A. M.A.

8. Konfidenzintervalle und Hypothesentests

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.

Ein- und Zweistichprobentests

Allgemeines zu Tests. Statistische Hypothesentests

Statistik II. IV. Hypothesentests. Martin Huber

Diagnose und Prognose: Kurzfassung 4

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Chi-Quadrat-Verfahren (ohne Messwiederholung)

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 12. Winterthur, 17. Mai Institut für Datenanalyse und Prozessdesign

Klassifikation von Signifikanztests

Serie 9, Musterlösung

9 Prinzipien der statistischen Hypothesenprüfung

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Mathematik für Biologen

Statistiktutorium (Kurs Frau Jacobsen)

Kapitel III: Einführung in die schließende Statistik

11. Parametrische Tests 11.1 Konzeption von statistischen Tests

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Welche der folgenden Aussagen ist/sind richtig? Kreuzen Sie bitte jede zutreffende Aussage an.

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Transkript:

Inhaltsverzeichnis Entscheidungsstatistische Verfahren... 2 Lernhinweise... 2 Theorie (1-8)... 2 1. Der Ausgangspunkt: Eine inhaltliche Fragestellung... 3 2. Formulierung der Fragestellung so, dass sie statistisch bearbeitet werden kann... 3 3. Welche Grösse soll untersucht werden? Die Prüfgrösse... 4 4. Arbeitshypothese und Alternativhypothese... 4 5. Prüfverteilung und Übertretungswahrschein-lichkeit... 5 6. Beurteilung der Überschreitungswahrschein-lichkeit; Signifikanzniveaus... 7 7. Was bedeutet ein signifikantes Resultat?... 7 8. Zusammenfassung zum Lernschritt... 8 http://mesosworld.ch - Stand vom: 20.1.2010 1

Entscheidungsstatistische Verfahren Lernhinweise Hinweise zur Bearbeitung Wählen Sie in der Inhaltsübersicht ein Stichwort, oder durchlaufen Sie die Lerneinheit mit dem "next"-button chronologisch. Dieser Lernschritt gilt dem Grundprinzip, nach dem alle entscheidungsstatistischen Verfahren aufgebaut sind. Am konkreten Beispiel eines Vergleichs von zwei Stichprobenmittelwerten werden die wesentlichen Begriffe eingeführt und die Arbeitsschritte erläutert, die im Zusammenhang mit jedem entscheidungsstatistischen Verfahren von Bedeutung sind. Geschätzte Bearbeitungszeit Den Studierenden im Grundkurs zur Statistik wird empfohlen, diese Lerneinheit in der vorgegebenen Strukturierung zu bearbeiten. Dies ist in ca. 30 Minuten möglich, wenn Sie die in Irem Curriculum vorgesehene Vorbereitungslektüre durchgearbeitet haben. Theorie (1-8) Inhaltsübersicht 1. Ausgangspunkt 2. Formulierung der Fragestellung 3. Prüfgrösse 4. Arbeitshypothese und Alternativhypothese 5. Prüfverteilung und Übertretungswahrscheinlichkeit 6. Überschreitungswahrscheinlichkeit & Signifikanzniveaus 7. Was bedeutet ein signifikantes Resultat? 8. Zusammenfassung zum Lernschritt http://mesosworld.ch - Stand vom: 20.1.2010 2

1. Der Ausgangspunkt: Eine inhaltliche Fragestellung Beobachtung eines Lehrers. Leo Reinhard unterrichtet an der Unterstufe. Ihm fällt auch dieses Jahr wieder auf, dass seine Schülerinnen der dritten Klasse in der Orthographie (Rechtschreibung) bessere Leistungen erbringen als seine Schüler. Er geht der Sache nach, zeichnet für die Mädchen und für die Knaben seiner Klasse die Verteilungen der Noten in Orthographie auf und bestimmt für beide Gruppen die Notenmittelwerte. 2. Formulierung der Fragestellung so, dass sie statistisch bearbeitet werden kann Leo steht vor einer für die Entscheidungsstatistik klassischen Frage. Wir wollen sie so formulieren, dass sie statistisch bearbeitbar ist. Aus formaler Sicht repräsentieren die Mädchen- und die Knabengruppe aus Leos Klasse je eine Stichprobe von Schülerinnen resp. Schülern der dritten Klasse aus der deutschsprachigen Schweiz. In beiden Stichproben wurde ein Merkmal X erhoben, konkret die Note in Orthographie. Die beiden Stichprobenmittelwerte und im erhobenen Merkmal unterscheiden sich. Hinter den beiden Stichproben steht je eine Population: Die Population aller deutschsprachigen Mädchen der dritten Klasse resp. die Population aller deutsprachigen Knaben der dritten Klasse. Die Verteilungen des interessierenden Merkmals X in diesen Populationen und die Verteilungsparameter sind nicht bekannt. http://mesosworld.ch - Stand vom: 20.1.2010 3

Leos inhaltliche Frage lautete: Darf der zwischen den beiden Stichproben von Mädchen und Knaben festgestellte Leistungsunterschied auf die Populationen von Schülerinnen und Schülern der dritten Klasse generalisiert werden? Wir beantworten diese Frage auf einem kleinen Umweg. Statistisch bearbeitbar ist nur folgende Fragestellung: Stammen die Stichproben von Mädchen und Knaben aus Populationen, in denen das interessierende Merkmal X mit identischen Mittelwerten und verteilt sind? Die folgende Graphik veranschaulicht diese Überlegungen und zeigt, wie Leos inhaltliche Frage beantwortet werden kann. 3. Welche Grösse soll untersucht werden? Die Prüfgrösse Jedes entscheidungsstatistische Verfahren bezieht sich auf eine spezifische Prüfgrösse. Für unser Einführungsbeispiel ist die Sachlage klar: Leo möchte den positiven Unterschied zwischen den Notenmittelwerten seiner Schülerinnen und Schüler auf Generalisierbarkeit prüfen. Prüfgrösse Aktueller Ausprägungsgrad der Prüfgrösse: (4,3-3,9) = 0,4 Nun stellt sich natürlich die Frage, mit welcher Wahrscheinlichkeit dieser Ausprägungsgrad der Prüfgrösse rein zufällig entstanden ist. Diese Frage klären wir anhand der sogenannten Prüfverteilung. Bevor wir auf diese eingehen können, müssen wir die in jedem entscheidungsstatistischen Verfahren relevanten Hypothesen kennenlernen. 4. Arbeitshypothese und Alternativhypothese Neben der Prüfgrösse gehört zu jedem entscheidungsstatistischen Verfahren eine Arbeitshypothese H 0 und eine Alternativhypothese H 1. Die Formulierungen dieser Hypothesen folgen immer demselben Grundprinzip, sie sind aber dem Prüfverfahren und der Fragestellung anzupassen. Die Grundidee ist ganz einfach: http://mesosworld.ch - Stand vom: 20.1.2010 4

1. Wir formulieren zwei sich gegenseitig ausschliessende Hypothesen bezüglich der Verteilung des Merkmals in den hinter den Stichproben stehenden Populationen. Die Arbeitshypothese H 0 postuliert dabei immer Identität dieser Verteilungen bezüglich eines Verteilungsparameters, die Alternativhypothese H 1 hingegen den vermuteten Unterschied. 2. Wir entscheiden auf wahrscheinlichkeitstheoretischer Grundlage (konkret anhand der Prüfverteilung), ob die Arbeitshypothese H 0 beibehalten werden kann oder zu Gunsten der Alternativhypothese H 1 verworfen werden soll. Im Zusammenhang mit konkreten Prüfverfahren werden wir auf verschiedene Formen von Alternativhypothesen eingehen. An dieser Stelle begnügen wir uns mit dem Grundsätzlichen. Anhand der noch zu besprechenden Prüfverteilung werden wir die Arbeitshypothese H 0 annehmen oder zu Gunsten von H 1 verwerfen. Was bedeutet nun aber Annahme resp. Ablehnung von H 0? Wir haben damit die beiden möglichen Resultate unseres Prüfverfahrens vorweggenommen. Was noch fehlt, ist die Entscheidungsgrundlage, anhand derer wir über Annahme oder Ablehnung der Arbeitshypothese H 0 entscheiden. Es ist dies die Prüfverteilung. 5. Prüfverteilung und Übertretungswahrschein-lichkeit Über Annahme oder Ablehnung der Arbeitshypothese H 0 entscheiden wir anhand des konkreten Ausprägungsgrades der Prüfgrösse und der Prüfverteilung. Prüfverteilung. Die Prüfverteilung ist die Verteilung der Prüfgrösse, wenn die Arbeitshypothese H 0 gültig ist. In unserem Einführungsbeispiel ist die Prüfgrösse. Die Prüfverteilung ist die Verteilung dieser Prüfgrösse, wenn die Arbeitshypothese (H 0 : ) gültig ist, wenn also die Stichproben von Mädchen und Knaben aus Populationen mit identischen Mittelwerten im Merkmal Note im Fach Orthographie stammen. Wir wollen uns die Bedeutung der Prüfverteilung in einem Gedankenexperiment für unser Einführungsbeispiel veranschaulichen: http://mesosworld.ch - Stand vom: 20.1.2010 5

Was können wir diesem Gedankenexperiment ganz generell entnehmen? Die Prüfverteilung ist die theoretische Verteilung der Prüfgrösse für den Fall, dass die Arbeitshypothese H0 gültig ist. Was wird für jedes Prüfverfahren einzeln zu besprechen sein? Die Prüfgrösse, die Form der Prüfverteilung und die Art, wie ihre Verteilungsparameter geschätzt werden, ist vom Prüfverfahren abhängig. Bei deren Besprechung werden wir näher darauf eingehen. Im folgenden soll an unserem Einführungsbeispiel gezeigt werden, was der Prüfverteilung und dem konkreten Ausprägungsgrad der Prüfgrösse entnommen werden kann. Die Überschreitungswahrscheinlichkeit p zeigt, mit welcher Wahrscheinlichkeit ein Unterschied in den Stichprobenmittelwerten von 0,4 oder mehr rein zufällig zustande gekommen ist. Wie bestimmen wir im konkreten Fall diese Überschreitungswahrscheinlichkeit? Ist die Prüfverteilung eine Normalverteilung oder eine t-verteilung, so lassen sich die Überschreitungswahrscheinlichkeiten nach einer einfachen Transformation den verfügbaren z- oder t-tabellen entnehmen. Auf diese Transformationen wird bei der Besprechung der einzelnen Prüfverfahren speziell eingegangen. Für F- oder - verteilte Prüfgrössen benutzen wir direkt die entsprechenden Tabellen. Bezüglich der Grösse der Überschreitungswahrscheinlichkeit p ist folgende Idee nun leicht nachvollziehbar: Ist die Überschreitungswahrscheinlichkeit p gross, so ist nicht auszuschliessen, dass der beobachtete Unterschied in den Stichprobenmittelwerten zufällig entstanden sein kann. Wir nehmen die Arbeitshypothese H 0 an. Ist die Überschreitungswahrscheinlichkeit p klein, so ist es sehr unwahrscheinlich, dass der beobachtete Unterschied in den Stichprobenmittelwerten zufällig zustande kam. Wir verwerfen H 0 zu Gunsten der Alternativhypothese H 1. Wie ist nun aber eine konkret vorliegende Überschreitungswahrscheinlichkeit zu beurteilen? http://mesosworld.ch - Stand vom: 20.1.2010 6

6. Beurteilung der Überschreitungswahrschein-lichkeit; Signifikanzniveaus Die Überschreitungswahrscheinlichkeit p gibt uns an, mit welcher Wahrscheinlichkeit der beobachtete Unterschied in den Stichprobenmittelwerten zufällig zustande gekommen ist. Auf Grund der Grösse der Überschreitungswahrscheinlichkeit entscheiden wir über Annahme oder Ablehnung der Arbeitshypothese H 0. Wir beurteilen die Grösse von p anhand von drei in den Sozialwissenschaften üblichen, an sich aber willkürlich gewählten Grenzwerten, den sog. Signifikanzniveaus: dem 5%-, dem 1%- und dem 0,1%-Signifikanzniveau. Die folgende Grafik zeigt die Grenzwerte der drei Signifikanzniveaus für einseitige Überschreitungswahrscheinlichkeiten und die Beurteilung verschiedener Ausprägungsgrade der Prüfgrösse. Fehlerrisiko und Irrtumswahrscheinlichkeit. Lehnen wir H 0 ab, so besteht ein Restrisiko, dass wir dies fälschlicherweise getan haben. Dieses Risiko nennen wir das #-Fehlerrisiko oder die Irrtumswahrscheinlichkeit. Den Ausprägungsgrad der Irrtumswahrscheinlichkeit kennen wir: Er entspricht der Überschreitungswahrscheinlichkeit p, d.h. der Wahrscheinlichkeit, dass der Ausprägungsgrad der Prüfgrösse trotzdem zufällig erreicht oder überschritten wird. H 0 auf dem 5%-Signifikanzniveau abgelehnt: Irrtumswahrscheinlichkeit p # 5% H 0 auf dem 1%-Signifikanzniveau abgelehnt: Irrtumswahrscheinlichkeit p # 1% H 0 auf dem 0,1%-Signifikanzniveau abgelehnt: Irrtumswahrscheinlichkeit p # 0,1% Nehmen wir H 0 an, so besteht natürlich auch ein Risiko, dass wir dies fälschlicherweise getan haben. Dieses Risiko nennen wir #-Fehlerrisiko. Eine Abschätzung der Grösse des #-Fehlerrisikos ist bei unspezifischer Alternativhypothese H 1 nicht möglich, d.h., dass bei Annahme von H 0 bei einer unspezifischen Alternativhypothese H 1 keine Irrtumswahrscheinlichkeit angegeben werden kann. Auf spezifische Alternativhypothesen und die Abschätzung des #-Fehlerrisikos wird im Submodul Zur Konzeption einfachster Untersuchungen noch näher eingegangen werden. 7. Was bedeutet ein signifikantes Resultat? Ist p # 5%, so lehnen wir unsere Arbeitshypothese H 0 mit der Irrtumswahrscheinlichkeit p ab. In unserem Fall - dem Vergleich von zwei Stichprobenmittelwerten - schliessen wir bei der Erklärung des Unterschieds in den Stichprobenmittelwerten den Zufall aus. Worauf der Unterschied tatsächlich zurückzuführen ist, kann mit formalen Mitteln nicht entschieden werden. In der Regel interpretiert man den Unterschied bezüglich des Merkmals, das die Stichproben charakterisiert. Eine kritische Hinterfragung der Interpretation ist aber unerlässlich. http://mesosworld.ch - Stand vom: 20.1.2010 7

In unserem Beispiel unterscheiden sich die Stichproben nach dem Geschlecht der Schüler. Bei p # 5% interpretieren wir die Mittelwertsdifferenz von +0,4 Notenpunkten bezüglich des Merkmals Geschlecht, das die Stichproben unterscheidet: Die um +0,4 Notenpunkte bessere durchschnittliche Leistung der Mädchengruppe ist nicht zufällig zustande gekommen. Nicht nur die Mädchen aus Leos Klasse zeigen bessere Leistungen in Orthographie als die Knaben, dieser Befund darf auf die Populationen der Schülerinnen und Schüler der dritten Klasse verallgemeinert werden. Die Irrtumswahrscheinlichkeit dieser Aussage ist p. Damit haben wir Leos inhaltliche Frage beantwortet. 8. Zusammenfassung zum Lernschritt Dieser Lernschritt betrifft das Grundprinzip, nach dem alle entscheidungsstatistischen Verfahren arbeiten. Am Beispiel eines Vergleichs von zwei Stichprobenmittelwerten haben wir die grundsätzlichen Begriffe und Arbeitsschritte kennengelernt. Sie sollen auf diesen Fall bezogen kurz zusammengefasst werden. Prüfgrösse. Formalisierung der zu prüfenden Grösse. In unserem Beispiel ist die Prüfgrösse die zwischen den Stichproben von Mädchen und Knaben festgestellte Differenz in den Notenmittelwerten im Fach Orthographie :. Arbeitshypothese H 0. Die Arbeitshypothese H 0 postuliert, dass die beiden Stichproben aus Populationen stammen, die im interessierenden Verteilungsparameter identisch sind. H 0 : Alternativhypothese H 1. Auch die Alternativhypothese H 1 wird bezüglich der Populationsparameter formuliert. In unserem Fall postuliert sie, dass die Stichprobe der Mädchen aus einer Population stammt, in der der Notenmittelwert höher ist als in der Population, aus der die Stichprobe der Knaben stammt. (Die Art der Alternativhypothese richtet sich nach der konkreten Frage, die untersucht werden soll.) H 1 : Prüfverteilung. Die Prüfverteilung ist die theoretische Verteilung der Prüfgrösse für den Fall, dass die Arbeitshypothese H 0 gültig ist. In unserem Fall ist die Prüfverteilung die Verteilung der Mittelwertsdifferenzen, wenn diese rein zufällig zustande kommen. Unterschiedliche Prüfverfahren benutzen unterschiedliche Prüfgrössen und unterschiedliche Prüfverteilungen. Auch die Schätzformeln für die Parameter der Prüfverteilung richten sich nach dem Prüfverfahren. berschreitungswahrscheinlichkeit p.ü Ordnet man den konkret beobachteten Ausprägungsgrad der Prüfgrösse in die Prüfverteilung ein, so kann die Überschreitungswahrscheinlichkeit p bestimmt werden. Diese gibt an, mit welcher Wahrscheinlichkeit der beobachtete oder ein grösserer Ausprägungsgrad der Prüfgrösse rein zufällig zustande gekommen ist. Signifikanzniveaus. Anhand von drei üblichen Signifikanzniveaus (5%-, 1%- und 0,1%-Niveau) wird die Überschreitungswahrscheinlichkeit p beurteilt: p > 5%: H 0 wird beibehalten. http://mesosworld.ch - Stand vom: 20.1.2010 8