Mathematische und statistische Methoden II

Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de lordsofthebortz.de/g+ facebook.com/methodenlehre twitter.com/methodenlehre youtube.com/methodenlehre Folie 1 SoSe 2012 Psychologisches Institut Johannes Gutenberg Universität Mainz

Inhalte dieser Sitzung Kennwerte in Theorie und Empirie Das Schätzproblem: von der Stichprobe zur Population Der 1-Stichproben t-test Folie 2

Kennwerte Kennwerte in Theorie & Empirie Numerische Beschreibung: relative Häufigkeit Die Wahrscheinlichkeit für die Realisation i einer Zufallsvariablen X ist p x i Theorie Das Äquivalent bei n empirisch an einer Stichprobe erhobenen Realisationen einer Zufallsvariablen X ist die relative Häufigkeit, berechnet als f x i h x n i Folie 3 Empirie

Kennwerte Kennwerte in Theorie & Empirie Numerische Beschreibung: Mittelwert Der Erwartungswert einer Zufallsvariablen X ist EX ( ) i1 Theorie (diskreter Fall) Das Äquivalent für empirisch an einer Stichprobe erhobene Daten einer Zufallsvariablen X ist der Mittelwert, berechnet als k px i i Folie 4 x 1 n xi n i 1 Empirie

Kennwerte Kennwerte in Theorie & Empirie Numerische Beschreibung: Mittelwert Ausgeschrieben lautet die Formel für den Mittelwert bei n Beobachtungen x 1 x n 1 1 x x x x x n ( 1 2 N) n n i 1 Der Mittelwert ist durch extreme Werte beeinflussbar (ausreißerempfindlich) i Folie 5 Er ist der Schwerpunkt der Beobachtungen, d.h. n i1 x i x 0

Kennwerte Intervalldaten Numerische Beschreibung: Mittelwert Folie 6 Der Mittelwert stimmt häufig mit keiner beobachteten Realisation überein Der Mittelwert ist wie der Erwartungswert äquivariant gegenüber gewissen (z.b. linearen) Transformationen Insbesondere 1. Addition einer Konstanten a zu allen n Beobachtungen x 1 x n x a x a 2. Multiplikation aller n Beobachtungen x 1 x n mit einer Konstanten c a xax

Kennwerte Intervalldaten Numerische Beschreibung: Varianz Die Varianz einer Zufallsvariablen X ist definiert als 2 k 2 i i i1 2 E X E X X p x Theorie (diskreter Fall) Das Äquivalent für empirisch an einer Stichprobe erhobene Daten einer Zufallsvariablen X heißt ebenfalls Varianz und wird berechnet als Folie 7 n 2 1 s x xi x n i 1 2 Empirie

Kennwerte Intervalldaten Numerische Beschreibung: Varianz Die Varianz ist das mittlere Abweichungsquadrat aller n Beobachtungen x 1 x n vom Mittelwert. n 2 1 s x xi x n i 1 2 Folie 8 Erfasst die mittlere Streuung um den Mittelwert Nur falls keine Streuung besteht, ist s² = 0, d.h. alle beobachteten Werte sind gleich. Sonst: s² > 0 Je größer die Streuung um den Mittelwert, desto größer ist die Varianz Ist anfällig gegenüber Ausreißern

Kennwerte Intervalldaten Numerische Beschreibung: Standardabweichung Problem: Auch die empirische Varianz ist nicht äquivariant zu erlaubten Skalentransformationen 2 2 2 s ax a s x ( ) ( ) (mit a = const.) Wie bei der theoretischen Varianz erhält man durch Wurzelziehen die Standardabweichung (SD, standard deviation) n 1 i n i 1 s x s x x x 2 2 Folie 9 Die Standardabweichung ist äquivariant zu den erlaubten Skalentransformationen

Kennwerte Von der Stichprobe zur Population Problem: Beim inferenzstatistischen Test ist immer der Schluss von den Daten einer Stichprobe auf einen Sachverhalt in der Population gefragt. Beispiel: Beim Binomialtest wird anhand von empirisch in einer Stichprobe erhobenen relativen Häufigkeiten auf die Gleichheit oder Ungleichheit von theoretischen Wahrscheinlichkeiten in der Population geschlossen Dies ist der inferenzstatistische Schluss Der inferenzstatistische Schluss steht und fällt mit der Annahme, dass die Verwendung gemessener Kennwerte (z.b. relative Häufigkeit) als Schätzung für den theoretischen Populationskennwert gerechtfertigt ist Folie 10

Kennwerte Von der Stichprobe zur Population Dieses so genannte Schätzproblem lässt sich in einer einzigen Frage zusammenfassen Wann ist eine Schätzung eine gute Schätzung? Das wesentliche statistische Merkmal einer guten Schätzung ist die Erwartungstreue Eine Schätzung ist dann erwartungstreu, wenn bei unendlichen vielen Wiederholungen des Zufallsexperimentes der dabei gemessene Stichprobenkennwert im Mittel gleich dem theoretischen Populationskennwert ist Folie 11

Kennwerte Von der Stichprobe zur Population: p Es zeigt sich, dass die relative Häufigkeit eine erwartungstreue Schätzung für die Wahrscheinlichkeit in der Population ist Es gilt also sprich: dach f x pˆ x p x i i i Stichprobenkennwert (bekannt) Schätzung (bekannt) Populationskennwert (unbekannt) Dieser Zusammenhang wurde bereits im Gesetz der Großen Zahl (law of large numbers) formuliert Folie 12

Kennwerte Von der Stichprobe zur Population: Es zeigt sich, dass der Mittelwert eine erwartungstreue Schätzung für den Erwartungswert in der Population ist Es gilt also x ˆ Stichprobenkennwert (bekannt) Schätzung (bekannt) Populationskennwert (unbekannt) Folie 13 Dieser Zusammenhang berechtigt Wissenschaftler, aus Stichprobendaten einen Erwartungswert für eine Zufallsvariable zu behaupten (z.b. mittlerer IQ = 100)

Kennwerte Von der Stichprobe zur Population: ² Es zeigt sich, dass die Varianz der Stichprobe keine erwartungstreue Schätzung für die Varianz in der Population ist Es ist also 2 2 2 s ˆ Stichprobenkennwert (bekannt) Schätzung (unbekannt) Populationskennwert (unbekannt) Folie 14 Man kann also aus der anhand von Stichprobendaten gemessenen Varianz nicht auf die Varianz der Zufallsvariable in der Population schließen

Kennwerte Von der Stichprobe zur Population: ² Man kann aber beweisen, dass die Stichprobenvarianz die Populationsvarianz systematisch unterschätzt, dass sie also einen Bias (= systematischer Fehler) hat Für diesen Bias gibt es eine einfache Korrektur n s ˆ n 1 Stichprobenkennwert (bekannt) 2 2 2 Schätzung (berechenbar) Populationskennwert (unbekannt) Folie 15 Diese korrigierte Stichprobenvarianz ist eine erwartungstreue Schätzung der Populationsvarianz, so dass man aus Daten behaupten kann, dass z.b. des IQ = 10

Kennwerte Übersicht Wahrscheinlichkeit: Empirisch f x Theoretisch ˆp x f x Mittelwert: x 1 n n i 1 x i ˆ x Varianz: n 2 1 s xi x n i 1 2 n ˆ s n 1 2 2 Folie 16 Standardabweichung: s s 2 2 ˆ n n 1 s

Einführung Prüfgröße Hypothesen Voraussetzungen Mittelwertevergleiche In der empirischen Forschung ist zumeist nicht die Prüfung eines Einzeldatums gefragt, sondern von Mittelwerten bzw. von Unterschieden zwischen solchen in mehreren Gruppen Beispiele: Verbessert sich die Schulleistung von Kindern durch Förderunterricht?, Wirkt VT bei Schizophrenen?, Sind Frauen sprachbegabter als Männer? Für Ordinaldaten haben wir den U-Test sowie den Wilcoxon Vorzeichenrangtest kennen gelernt Folie 17 Für Intervalldaten stehen bessere (i.e. teststärkere) Tests zur Verfügung

Einführung Mittelwertevergleiche Prüfgröße Hypothesen Voraussetzungen Folie 18 Inferenzstatistische Tests für Mittelwerte sollen anhand von Stichprobendaten Aussagen über die Unterschiedlichkeit von Erwartungswerten in der Population treffen. Für einen solchen Test müssen mehrere Dinge bekannt sein: Die Erwartungswerte selbst Ihre Verteilungsform bzw. die Verteilungsform der berechneten Prüfgröße Die Parameter dieser Verteilung All diese sind zunächst unbekannt, so dass genau wie bei den bisher behandelten Tests Schätzungen erforderlich sind

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Grundlagen Der 1-Stichproben t-test beantwortet die Frage, ob ein aus einer Stichprobe geschätzter Erwartungswert mit einem bekannten Erwartungswert übereinstimmt. Keiner der Merkmalsträger darf mehr als einmal in der Stichprobe vertreten sein. Beispiele: Ist der IQ von Psychologiestudierenden im Mittel 100?, Sind Geburtsraten in Deutschland so hoch wie der europäische Durchschnitt?, Erreichen Teilnehmer eines Assessment Centers im Mittel einen bestimmten Cut- Off-Wert? Folie 19

Einführung Der 1-Stichproben t-test Grundlagen Prüfgröße Unbekannte Population Hypothesen Voraussetzungen Bekannte Population Stichprobe (n) x Ist der Erwartungswert der Stichprobe gleich μ: H 0 oder verschieden: H 1 und Folie 20

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Grundlagen Grundfrage: Wie üblich kann man fragen, ob der beobachtete Mittelwert zu extrem ist, um anzunehmen, dass die Stichprobe noch aus einer Population mit dem Erwartungswert μ stammt. Ansatz: Um diese Frage zu beantworten, müssen wir zwei Dinge wissen: 1. Die Wahrscheinlichkeitsverteilung dieser Mittelwerte 2. Die Parameter dieser Verteilung Folie 21

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Grundlagen Problem: Die Wahrscheinlichkeitsverteilung von Mittelwerten ist ein sehr theoretisches Konstrukt Sie ergäbe sich, wenn ein Experiment mit immer neuen Stichprobe aus derselben Population wieder und wieder durchgeführt würde und bei jeder Durchführung der Mittelwert berechnet würde Erkenntnis: Ein Herr Student (aka William Sealy Gossett, Statistiker bei Guinnes) konnte herleiten, dass die Wahrscheinlichkeitsverteilung von Mittelwerten mathematisch sehr gut zu beschreiben ist Folie 22

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Grundlagen Wenn die Zufallsvariable einen Erwartungswert von μ der Differenzen besitzt, so hat der Mittelwert für Stichproben dieser Zufallsvariablen den Erwartungswert x Wenn die Zufallsvariable eine Standardabweichung von σ bzw. eine Varianz von σ² besitzt, so streuen die Mittelwerte mit x n bzw. 2 x 2 n Folie 23

Einführung Der 1-Stichproben t-test Prüfgröße Prüfgröße Hypothesen Student musste nur noch ermitteln, welche Form die Wahrscheinlichkeitsverteilung von Mittelwerten hat Er definierte zunächst eine Prüfgröße Voraussetzungen t x x x Folie 24 für die ja gemäß der bisherigen Erkenntnisse gilt: x und x n

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Prüfgröße Die erste Vermutung, dass t wie üblich normalverteilt sei, bestätigte sich nicht Student konnte zeigen, dass die Prüfgröße die Form einer so genannten t-verteilung hat Die t-verteilung hat nur einen Parameter, nämlich die so genannten Freiheitsgrade df (degrees of freedom) Diese Freiheitsgrade ergeben sich direkt aus der Größe der Stichprobe n, deren Mittelwert getestet wird df n 1 Folie 25

Einführung Die t-verteilung von Student Prüfgröße 0.4 Standard- Normalverteilung Hypothesen 0.3 Voraussetzungen 0.2 0.1 t- Verteilung mit df = 10-3 -2-1 1 2 3 Kritische Werte sind bei der t- Verteilung im Vergleich zur Normalverteilung größer t.99 2.76 z.99 2.33 Folie 26

Einführung Prüfgröße Hypothesen Voraussetzungen Die t-verteilung von Student Standardnormal- und t-verteilung sind sich also offenbar sehr ähnlich, aber nicht identisch Je größer n (und damit auch die Freiheitsgrade), desto mehr gleichen sich die Wahrscheinlichkeitsverteilungen an Da die Standardnormalverteilung einfacher zu tabellieren ist es gibt nur eine wurde früher oft diese verwendet, um die Größe der Prüfgröße zu berechnen. Da die t-verteilung heute sehr einfach bestimmt werden kann, ist dieses approximative Vorgehen nicht mehr notwendig Folie 27 Merke: Für t immer die t-verteilung!

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Ablauf Der t-test folgt nun exakt der üblichen Vorgehensweise des Hypothesentestens 1. Voraussetzungen prüfen 2. Verteilungsannahme treffen: t-verteilt mit den berechneten df 3. Hypothesenrichtung festlegen und statistische Hypothesen formulieren 4. Signifikanzniveau festlegen 5. Prüfgröße t bestimmen 6. Wahrscheinlichkeit für die berechnete Prüfgröße bestimmen und mit dem Signifkanzniveau vergleichen Folie 28

Einführung Prüfgröße Hypothesen Voraussetzungen Der 1-Stichproben t-test Hypothesen Erkenntnis: Jede Stichprobe stammt aus irgendeiner Population mit einem bestimmten, aber unbekannten Erwartungswert μ X Wenn der beobachtete Mittelwert zu extrem ist, dann stammt die Stichprobe offenbar nicht aus der gegebenen Population mit dem Erwartungswert μ Die Bewertung der Prüfgröße läuft also auf den Test hinaus, ob der beobachtete Mittelwert der Stichprobe aus einer Population mit dem bekannten μ oder dem unbekannten μ X stammt Folie 29

Einführung Prüfgröße Der 1-Stichproben t-test Hypothesen Beim t-test sind wie beim z-test potentiell alle drei möglichen Hypothesenrichtungen von Interesse. Hypothesen Voraussetzungen H H H H 0 1 0 1 : x Verwerfen der Verteilungsannahme : x bei zu hohem x : x Verwerfen der Verteilungsannahme : x bei zu niedrigem x Einseitige oder gerichtete Hypothese H H 0 1 : X Verwerfen der Verteilungsannahme : X, X bei einem zu extremen Wert Zweiseitige oder ungerichtete Hypothese Folie 30

Einführung Der 1-Stichproben t-test Hypothesen Prüfgröße Hypothesen Voraussetzungen Folie 31 Man ermittelt nun die Auftretenswahrscheinlichkeit p(t H 0 ) unter der Annahme, dass die angenommene Wahrscheinlichkeitsverteilung gilt. Dazu berechnet man ptt für die H: ptt für die H: pt pt t t und vergleicht p mit dem Signifikanzniveau 0 0 für die H : Das p( ) wird aus der Verteilungsfunktion der t-verteilung berechnet 0 X X X Verwerfen der H 0 bei einem zu positiven Mittelwert Verwerfen der H 0 bei einem zu negativen Mittelwert Verwerfen der H 0 bei einem zu extremen Mittelwert

Einführung Tests für Ordinaldaten Intervalldaten Tests für Der 1-Stichproben t-test Hypothesen Prüfgröße Beobachtung im Experiment: x Hypothesen Voraussetzungen Frage: Stammt die Stichprobe aus einer Population mit? Geht die Größe des Mittelwertes auf einen Stichprobenfehler zurück? (1) Festlegung von Signifikanzniveau α und Gerichtetheit (2) Berechnung der Prüfgröße t Achtung: Vorher immer Prüfung der Voraussetzungen! Folie 32 (3) Berechnung der Wahrscheinlichkeit für dieses oder ein extremeres z: z. B. p(t t) (4) Vergleich von p mit α und Treffen der Signifikanzaussage Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α 100%

Einführung Tests für Ordinaldaten Intervalldaten Tests für Der 1-Stichproben t-test Voraussetzungen Prüfgröße Die Zufallsvariable muss intervallskaliert sein Hypothesen Bei n < 30 sollten die Daten normalverteilt sein Voraussetzungen Folie 33

Relevante Excel Funktionen T.VERT() Folie 34