Inhaltsverzeichnis Entscheidungsstatistische Verfahren... 2 Lernhinweise... 2 Theorie (1-8)... 2 1. Der Ausgangspunkt: Eine inhaltliche Fragestellung... 3 2. Formulierung der Fragestellung so, dass sie statistisch bearbeitet werden kann... 3 3. Welche Grösse soll untersucht werden? Die Prüfgrösse... 4 4. Arbeitshypothese und Alternativhypothese... 4 5. Prüfverteilung und Übertretungswahrschein-lichkeit... 5 6. Beurteilung der Überschreitungswahrschein-lichkeit; Signifikanzniveaus... 7 7. Was bedeutet ein signifikantes Resultat?... 7 8. Zusammenfassung zum Lernschritt... 8 http://mesosworld.ch - Stand vom: 20.1.2010 1
Entscheidungsstatistische Verfahren Lernhinweise Hinweise zur Bearbeitung Wählen Sie in der Inhaltsübersicht ein Stichwort, oder durchlaufen Sie die Lerneinheit mit dem "next"-button chronologisch. Dieser Lernschritt gilt dem Grundprinzip, nach dem alle entscheidungsstatistischen Verfahren aufgebaut sind. Am konkreten Beispiel eines Vergleichs von zwei Stichprobenmittelwerten werden die wesentlichen Begriffe eingeführt und die Arbeitsschritte erläutert, die im Zusammenhang mit jedem entscheidungsstatistischen Verfahren von Bedeutung sind. Geschätzte Bearbeitungszeit Den Studierenden im Grundkurs zur Statistik wird empfohlen, diese Lerneinheit in der vorgegebenen Strukturierung zu bearbeiten. Dies ist in ca. 30 Minuten möglich, wenn Sie die in Irem Curriculum vorgesehene Vorbereitungslektüre durchgearbeitet haben. Theorie (1-8) Inhaltsübersicht 1. Ausgangspunkt 2. Formulierung der Fragestellung 3. Prüfgrösse 4. Arbeitshypothese und Alternativhypothese 5. Prüfverteilung und Übertretungswahrscheinlichkeit 6. Überschreitungswahrscheinlichkeit & Signifikanzniveaus 7. Was bedeutet ein signifikantes Resultat? 8. Zusammenfassung zum Lernschritt http://mesosworld.ch - Stand vom: 20.1.2010 2
1. Der Ausgangspunkt: Eine inhaltliche Fragestellung Beobachtung eines Lehrers. Leo Reinhard unterrichtet an der Unterstufe. Ihm fällt auch dieses Jahr wieder auf, dass seine Schülerinnen der dritten Klasse in der Orthographie (Rechtschreibung) bessere Leistungen erbringen als seine Schüler. Er geht der Sache nach, zeichnet für die Mädchen und für die Knaben seiner Klasse die Verteilungen der Noten in Orthographie auf und bestimmt für beide Gruppen die Notenmittelwerte. 2. Formulierung der Fragestellung so, dass sie statistisch bearbeitet werden kann Leo steht vor einer für die Entscheidungsstatistik klassischen Frage. Wir wollen sie so formulieren, dass sie statistisch bearbeitbar ist. Aus formaler Sicht repräsentieren die Mädchen- und die Knabengruppe aus Leos Klasse je eine Stichprobe von Schülerinnen resp. Schülern der dritten Klasse aus der deutschsprachigen Schweiz. In beiden Stichproben wurde ein Merkmal X erhoben, konkret die Note in Orthographie. Die beiden Stichprobenmittelwerte und im erhobenen Merkmal unterscheiden sich. Hinter den beiden Stichproben steht je eine Population: Die Population aller deutschsprachigen Mädchen der dritten Klasse resp. die Population aller deutsprachigen Knaben der dritten Klasse. Die Verteilungen des interessierenden Merkmals X in diesen Populationen und die Verteilungsparameter sind nicht bekannt. http://mesosworld.ch - Stand vom: 20.1.2010 3
Leos inhaltliche Frage lautete: Darf der zwischen den beiden Stichproben von Mädchen und Knaben festgestellte Leistungsunterschied auf die Populationen von Schülerinnen und Schülern der dritten Klasse generalisiert werden? Wir beantworten diese Frage auf einem kleinen Umweg. Statistisch bearbeitbar ist nur folgende Fragestellung: Stammen die Stichproben von Mädchen und Knaben aus Populationen, in denen das interessierende Merkmal X mit identischen Mittelwerten und verteilt sind? Die folgende Graphik veranschaulicht diese Überlegungen und zeigt, wie Leos inhaltliche Frage beantwortet werden kann. 3. Welche Grösse soll untersucht werden? Die Prüfgrösse Jedes entscheidungsstatistische Verfahren bezieht sich auf eine spezifische Prüfgrösse. Für unser Einführungsbeispiel ist die Sachlage klar: Leo möchte den positiven Unterschied zwischen den Notenmittelwerten seiner Schülerinnen und Schüler auf Generalisierbarkeit prüfen. Prüfgrösse Aktueller Ausprägungsgrad der Prüfgrösse: (4,3-3,9) = 0,4 Nun stellt sich natürlich die Frage, mit welcher Wahrscheinlichkeit dieser Ausprägungsgrad der Prüfgrösse rein zufällig entstanden ist. Diese Frage klären wir anhand der sogenannten Prüfverteilung. Bevor wir auf diese eingehen können, müssen wir die in jedem entscheidungsstatistischen Verfahren relevanten Hypothesen kennenlernen. 4. Arbeitshypothese und Alternativhypothese Neben der Prüfgrösse gehört zu jedem entscheidungsstatistischen Verfahren eine Arbeitshypothese H 0 und eine Alternativhypothese H 1. Die Formulierungen dieser Hypothesen folgen immer demselben Grundprinzip, sie sind aber dem Prüfverfahren und der Fragestellung anzupassen. Die Grundidee ist ganz einfach: http://mesosworld.ch - Stand vom: 20.1.2010 4
1. Wir formulieren zwei sich gegenseitig ausschliessende Hypothesen bezüglich der Verteilung des Merkmals in den hinter den Stichproben stehenden Populationen. Die Arbeitshypothese H 0 postuliert dabei immer Identität dieser Verteilungen bezüglich eines Verteilungsparameters, die Alternativhypothese H 1 hingegen den vermuteten Unterschied. 2. Wir entscheiden auf wahrscheinlichkeitstheoretischer Grundlage (konkret anhand der Prüfverteilung), ob die Arbeitshypothese H 0 beibehalten werden kann oder zu Gunsten der Alternativhypothese H 1 verworfen werden soll. Im Zusammenhang mit konkreten Prüfverfahren werden wir auf verschiedene Formen von Alternativhypothesen eingehen. An dieser Stelle begnügen wir uns mit dem Grundsätzlichen. Anhand der noch zu besprechenden Prüfverteilung werden wir die Arbeitshypothese H 0 annehmen oder zu Gunsten von H 1 verwerfen. Was bedeutet nun aber Annahme resp. Ablehnung von H 0? Wir haben damit die beiden möglichen Resultate unseres Prüfverfahrens vorweggenommen. Was noch fehlt, ist die Entscheidungsgrundlage, anhand derer wir über Annahme oder Ablehnung der Arbeitshypothese H 0 entscheiden. Es ist dies die Prüfverteilung. 5. Prüfverteilung und Übertretungswahrschein-lichkeit Über Annahme oder Ablehnung der Arbeitshypothese H 0 entscheiden wir anhand des konkreten Ausprägungsgrades der Prüfgrösse und der Prüfverteilung. Prüfverteilung. Die Prüfverteilung ist die Verteilung der Prüfgrösse, wenn die Arbeitshypothese H 0 gültig ist. In unserem Einführungsbeispiel ist die Prüfgrösse. Die Prüfverteilung ist die Verteilung dieser Prüfgrösse, wenn die Arbeitshypothese (H 0 : ) gültig ist, wenn also die Stichproben von Mädchen und Knaben aus Populationen mit identischen Mittelwerten im Merkmal Note im Fach Orthographie stammen. Wir wollen uns die Bedeutung der Prüfverteilung in einem Gedankenexperiment für unser Einführungsbeispiel veranschaulichen: http://mesosworld.ch - Stand vom: 20.1.2010 5
Was können wir diesem Gedankenexperiment ganz generell entnehmen? Die Prüfverteilung ist die theoretische Verteilung der Prüfgrösse für den Fall, dass die Arbeitshypothese H0 gültig ist. Was wird für jedes Prüfverfahren einzeln zu besprechen sein? Die Prüfgrösse, die Form der Prüfverteilung und die Art, wie ihre Verteilungsparameter geschätzt werden, ist vom Prüfverfahren abhängig. Bei deren Besprechung werden wir näher darauf eingehen. Im folgenden soll an unserem Einführungsbeispiel gezeigt werden, was der Prüfverteilung und dem konkreten Ausprägungsgrad der Prüfgrösse entnommen werden kann. Die Überschreitungswahrscheinlichkeit p zeigt, mit welcher Wahrscheinlichkeit ein Unterschied in den Stichprobenmittelwerten von 0,4 oder mehr rein zufällig zustande gekommen ist. Wie bestimmen wir im konkreten Fall diese Überschreitungswahrscheinlichkeit? Ist die Prüfverteilung eine Normalverteilung oder eine t-verteilung, so lassen sich die Überschreitungswahrscheinlichkeiten nach einer einfachen Transformation den verfügbaren z- oder t-tabellen entnehmen. Auf diese Transformationen wird bei der Besprechung der einzelnen Prüfverfahren speziell eingegangen. Für F- oder - verteilte Prüfgrössen benutzen wir direkt die entsprechenden Tabellen. Bezüglich der Grösse der Überschreitungswahrscheinlichkeit p ist folgende Idee nun leicht nachvollziehbar: Ist die Überschreitungswahrscheinlichkeit p gross, so ist nicht auszuschliessen, dass der beobachtete Unterschied in den Stichprobenmittelwerten zufällig entstanden sein kann. Wir nehmen die Arbeitshypothese H 0 an. Ist die Überschreitungswahrscheinlichkeit p klein, so ist es sehr unwahrscheinlich, dass der beobachtete Unterschied in den Stichprobenmittelwerten zufällig zustande kam. Wir verwerfen H 0 zu Gunsten der Alternativhypothese H 1. Wie ist nun aber eine konkret vorliegende Überschreitungswahrscheinlichkeit zu beurteilen? http://mesosworld.ch - Stand vom: 20.1.2010 6
6. Beurteilung der Überschreitungswahrschein-lichkeit; Signifikanzniveaus Die Überschreitungswahrscheinlichkeit p gibt uns an, mit welcher Wahrscheinlichkeit der beobachtete Unterschied in den Stichprobenmittelwerten zufällig zustande gekommen ist. Auf Grund der Grösse der Überschreitungswahrscheinlichkeit entscheiden wir über Annahme oder Ablehnung der Arbeitshypothese H 0. Wir beurteilen die Grösse von p anhand von drei in den Sozialwissenschaften üblichen, an sich aber willkürlich gewählten Grenzwerten, den sog. Signifikanzniveaus: dem 5%-, dem 1%- und dem 0,1%-Signifikanzniveau. Die folgende Grafik zeigt die Grenzwerte der drei Signifikanzniveaus für einseitige Überschreitungswahrscheinlichkeiten und die Beurteilung verschiedener Ausprägungsgrade der Prüfgrösse. Fehlerrisiko und Irrtumswahrscheinlichkeit. Lehnen wir H 0 ab, so besteht ein Restrisiko, dass wir dies fälschlicherweise getan haben. Dieses Risiko nennen wir das #-Fehlerrisiko oder die Irrtumswahrscheinlichkeit. Den Ausprägungsgrad der Irrtumswahrscheinlichkeit kennen wir: Er entspricht der Überschreitungswahrscheinlichkeit p, d.h. der Wahrscheinlichkeit, dass der Ausprägungsgrad der Prüfgrösse trotzdem zufällig erreicht oder überschritten wird. H 0 auf dem 5%-Signifikanzniveau abgelehnt: Irrtumswahrscheinlichkeit p # 5% H 0 auf dem 1%-Signifikanzniveau abgelehnt: Irrtumswahrscheinlichkeit p # 1% H 0 auf dem 0,1%-Signifikanzniveau abgelehnt: Irrtumswahrscheinlichkeit p # 0,1% Nehmen wir H 0 an, so besteht natürlich auch ein Risiko, dass wir dies fälschlicherweise getan haben. Dieses Risiko nennen wir #-Fehlerrisiko. Eine Abschätzung der Grösse des #-Fehlerrisikos ist bei unspezifischer Alternativhypothese H 1 nicht möglich, d.h., dass bei Annahme von H 0 bei einer unspezifischen Alternativhypothese H 1 keine Irrtumswahrscheinlichkeit angegeben werden kann. Auf spezifische Alternativhypothesen und die Abschätzung des #-Fehlerrisikos wird im Submodul Zur Konzeption einfachster Untersuchungen noch näher eingegangen werden. 7. Was bedeutet ein signifikantes Resultat? Ist p # 5%, so lehnen wir unsere Arbeitshypothese H 0 mit der Irrtumswahrscheinlichkeit p ab. In unserem Fall - dem Vergleich von zwei Stichprobenmittelwerten - schliessen wir bei der Erklärung des Unterschieds in den Stichprobenmittelwerten den Zufall aus. Worauf der Unterschied tatsächlich zurückzuführen ist, kann mit formalen Mitteln nicht entschieden werden. In der Regel interpretiert man den Unterschied bezüglich des Merkmals, das die Stichproben charakterisiert. Eine kritische Hinterfragung der Interpretation ist aber unerlässlich. http://mesosworld.ch - Stand vom: 20.1.2010 7
In unserem Beispiel unterscheiden sich die Stichproben nach dem Geschlecht der Schüler. Bei p # 5% interpretieren wir die Mittelwertsdifferenz von +0,4 Notenpunkten bezüglich des Merkmals Geschlecht, das die Stichproben unterscheidet: Die um +0,4 Notenpunkte bessere durchschnittliche Leistung der Mädchengruppe ist nicht zufällig zustande gekommen. Nicht nur die Mädchen aus Leos Klasse zeigen bessere Leistungen in Orthographie als die Knaben, dieser Befund darf auf die Populationen der Schülerinnen und Schüler der dritten Klasse verallgemeinert werden. Die Irrtumswahrscheinlichkeit dieser Aussage ist p. Damit haben wir Leos inhaltliche Frage beantwortet. 8. Zusammenfassung zum Lernschritt Dieser Lernschritt betrifft das Grundprinzip, nach dem alle entscheidungsstatistischen Verfahren arbeiten. Am Beispiel eines Vergleichs von zwei Stichprobenmittelwerten haben wir die grundsätzlichen Begriffe und Arbeitsschritte kennengelernt. Sie sollen auf diesen Fall bezogen kurz zusammengefasst werden. Prüfgrösse. Formalisierung der zu prüfenden Grösse. In unserem Beispiel ist die Prüfgrösse die zwischen den Stichproben von Mädchen und Knaben festgestellte Differenz in den Notenmittelwerten im Fach Orthographie :. Arbeitshypothese H 0. Die Arbeitshypothese H 0 postuliert, dass die beiden Stichproben aus Populationen stammen, die im interessierenden Verteilungsparameter identisch sind. H 0 : Alternativhypothese H 1. Auch die Alternativhypothese H 1 wird bezüglich der Populationsparameter formuliert. In unserem Fall postuliert sie, dass die Stichprobe der Mädchen aus einer Population stammt, in der der Notenmittelwert höher ist als in der Population, aus der die Stichprobe der Knaben stammt. (Die Art der Alternativhypothese richtet sich nach der konkreten Frage, die untersucht werden soll.) H 1 : Prüfverteilung. Die Prüfverteilung ist die theoretische Verteilung der Prüfgrösse für den Fall, dass die Arbeitshypothese H 0 gültig ist. In unserem Fall ist die Prüfverteilung die Verteilung der Mittelwertsdifferenzen, wenn diese rein zufällig zustande kommen. Unterschiedliche Prüfverfahren benutzen unterschiedliche Prüfgrössen und unterschiedliche Prüfverteilungen. Auch die Schätzformeln für die Parameter der Prüfverteilung richten sich nach dem Prüfverfahren. berschreitungswahrscheinlichkeit p.ü Ordnet man den konkret beobachteten Ausprägungsgrad der Prüfgrösse in die Prüfverteilung ein, so kann die Überschreitungswahrscheinlichkeit p bestimmt werden. Diese gibt an, mit welcher Wahrscheinlichkeit der beobachtete oder ein grösserer Ausprägungsgrad der Prüfgrösse rein zufällig zustande gekommen ist. Signifikanzniveaus. Anhand von drei üblichen Signifikanzniveaus (5%-, 1%- und 0,1%-Niveau) wird die Überschreitungswahrscheinlichkeit p beurteilt: p > 5%: H 0 wird beibehalten. http://mesosworld.ch - Stand vom: 20.1.2010 8