Mathematische und statistische Methoden II

Ähnliche Dokumente
Forschungsstatistik I

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II

Thema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population

Forschungsstatistik I

Mathematische und statistische Methoden II

Forschungsstatistik I

Forschungsstatistik II

Forschungsstatistik I

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II

Mathematische und statistische Methoden I

Forschungsstatistik I

Forschungsstatistik II

Forschungsstatistik I

Mathematische und statistische Methoden II

Forschungsstatistik I

Forschungsstatistik I

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Chi-Quadrat-Verteilung

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Statistik und Wahrscheinlichkeitsrechnung

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Klassifikation von Signifikanztests

Mathematische und statistische Methoden I

Die Familie der χ 2 (n)-verteilungen

Mathematische und statistische Methoden II

Statistisches Testen

Willkommen zur Vorlesung Statistik (Master)

Wichtige Definitionen und Aussagen

Mathematische und statistische Methoden II

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Mathematische und statistische Methoden I

Willkommen zur Vorlesung Statistik (Master)

Auswertung und Lösung

Forschungsstatistik I

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Mathematische und statistische Methoden II

Statistik für SozialwissenschaftlerInnen II p.85

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Mathematische und statistische Methoden II

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Jost Reinecke. 7. Juni 2005

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Klassifikation von Signifikanztests

Willkommen zur Vorlesung Statistik (Master)

Lösungen zu den Übungsaufgaben in Kapitel 10

5. Seminar Statistik

Konkretes Durchführen einer Inferenzstatistik

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Forschungsstatistik I

3 Grundlagen statistischer Tests (Kap. 8 IS)

Statistik I für Betriebswirte Vorlesung 14

Zentraler Grenzwertsatz/Konfidenzintervalle

Mathematische und statistische Methoden II

Anpassungstests VORGEHENSWEISE

Klausur zur Vorlesung

Wahrscheinlichkeitsrechnung und Statistik

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Mathematische und statistische Methoden I

Tests für Erwartungswert & Median

Anhang: Statistische Tafeln und Funktionen

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Mehrdimensionale Zufallsvariablen

Schließende Statistik

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Mathematische und statistische Methoden II

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Wahrscheinlichkeit und Statistik: Zusammenfassung

Bereiche der Statistik

Modul G.1 WS 07/08: Statistik

Population und Stichprobe Wahrscheinlichkeitstheorie II

Forschungsstatistik I

Statistik II. IV. Hypothesentests. Martin Huber

2.3 Intervallschätzung

Statistik II. Weitere Statistische Tests. Statistik II

Primer: Inferenzstatistik 1.0

Induktive Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Statistik und Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsverteilungen

Einführung in Quantitative Methoden

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Häufigkeitsverteilungen

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistische Tests (Signifikanztests)

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Stichproben Parameterschätzung Konfidenzintervalle:

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Vorlesung: Statistik II für Wirtschaftswissenschaft

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Parametrische vs. Non-Parametrische Testverfahren

SozialwissenschaftlerInnen II

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Transkript:

Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/methods/ SS 2010 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz

Methodenlehre Tests für Ordinaldaten Schätzen und Testen Die Annahme intervallskalierter Daten bzw. intervallskalierter Zufallsvariablen ist in der psychologischen Forschung weit verbreitet. (unabh.) Für intervallskalierte Daten stehen eine Reihe von Testverfahren zur Verfügung. Bekannt ist bereits der z-test für die Prüfung der Zugehörigkeit eines Datums zu einer normalverteilten Population t (abh.) Frage: Woher stammen die im z-test vorausgesetzten Verteilungsparameter bzw. Populationskennwerte? Wir haben in mehreren Tests gesehen, dass bestimmte Populationskennwerte direkt aus den Stichprobenkennwerten geschätzt wurden.

Methodenlehre Tests für Ordinaldaten (unabh.) Beispiel I für die Kennwertschätzung: Binomialtest Die Prüfgröße bei zwei Stichproben der Umfänge n 1 und n 2 lautete: t z Δpˆ pˆ ˆ 1 p2 = = pˆ (1 pˆ ) (1 n + 1 n ) σ Δ pˆ 12 12 1 2 Die Signifikanzaussage betrifft hier die Population, nicht die Stichprobe t (abh.) Dazu wird einfach angenommen, dass die beobachteten Häufigkeiten p gleich den theoretischen Wahrscheinlichkeiten p^ sind Dass diese Annahme erlaubt ist, sagt das Gesetz der Großen Zahl

Methodenlehre Inferenzstatistik Tests für Nominaldaten (unabh.) t (abh.) Beispiel II für die Kennwertschätzung: χ²-test Die Prüfgröße wird aus der k m Kontingenztabelle wie folgt für relative Häufigkeiten i berechnet χ 2 = n ˆ ˆ ˆ 2 ( ) m k pij pi p j 1 1 pˆ pˆ i= j= i j Es wird allgemein die Unabhängigkeit von zwei nominalskalierten Merkmalen in der Population geprüft. Wieder wird einfach angenommen, dass die beobachteten Häufigkeiten p^ gleich den theoretischen Wahrscheinlichkeiten p ist (Gesetz der Großen Zahl).

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Schätzen & Testen Inferenzstatistische Tests sollen also immer Aussagen über Populationen treffen, nicht über die tatsächlich beobachteten Stichprobendaten Die Prüfgrößen inferenzstatistischer Tests beziehen sich daher auf Populationskennwerte, niemals auf Kennwerte aus Stichprobendaten. Aber: Stichprobendaten sind zumeist die einzige Quelle für eine Ermittlung von Populationskennwerten Für den z-test werden der Erwartungswert μ und die Populationsvarianz σ² benötigt. Ziel: Möglichst zutreffende Schätzung von Populationskennwerten aus Stichprobendaten.

Methodenlehre Tests für Ordinaldaten Schätzen & Testen (unabh.) Kennwerte μ 2 σ Population (N) Stichprobe (n) Daten x x x x 1 2 3 n Für n (bzw. gegen den Populationsumfang N) wird der Mittelwert aus den Daten gegen den Erwartungswert μ t (abh.) streben und die Varianz der Daten gegen σ². Dieses Sampling sehr vieler Datenwerte ist nicht die übliche Vorgehensweise in der empirischen Forschung Aussagen über Erwartungswerte sollen aus Stichproben mit n N getroffen werden.

Methodenlehre Tests für Ordinaldaten Schätzen & Testen (unabh.) Kennwerte μ 2 σ Kennwerte Population N Stichprobe (n N) x 2 s t (abh.) a) Welche Verteilung von Kennwerten wird sich ergeben, wenn man den Sampling Vorgang unendlich oft wiederholt, wobei aber n sehr viel kleiner ist als N? b) Sagen uns die Kennwerte, die diese Verteilung wiederum hat, etwas über die Kennwerte der Population?

Methodenlehre Tests für Ordinaldaten Schätzen des Erwartungswertes μ Population Kennwert (Erwartungswert) E{ x} = μ Stichprobe des Umfangs n Wiederhole dies k-mal Verteilung von Stichprobenmittelwerten itt t x ( x x x ) 1 1 k Kennwerteverteilung Erwartungswert: E{ x} = μ Die Kennwerteverteilung des Mittelwertes hat denselben Erwartungswert μ wie die Population, aus der die Stichproben gezogen wurden. Schätzstatistiken, die denselben Erwartungswert haben wie die Population, heißen erwartungstreu.

Methodenlehre Tests für Ordinaldaten Schätzen des Populationserwartungswertes μ Es gilt: E { x } = μ (unabh.) t (abh.) Schätzung: Also: { } ÊE x = x n 1 ˆ μ = x = x n i= 1 Der Erwartungswert des Stichprobenmittelwertes ist gleich dem Erwartungswert der Population Wir wählen den beobachteten Stichprobenmittelwert als beste Schätzung für seinen Erwartungswert. Der Stichprobenmittelwert ist dann eine erwartungstreue Schätzung des Erwartungswerts der Population. i

Methodenlehre Tests für Ordinaldaten Schätzen der Populationsvarianz σ² Population Varianz 2 σ Verteilung von Stichprobenvarianzen ( ) Stichprobe des Umfangs N 2 s 2 s 2 s 2 s Wiederhole dies k - mal 1 2 k Erwartungswert der Stichprobenvarianzen { } E s = n 11 n σ 2 2 1 Bias: E { s 2 } σ 2 = σ 2 n Die Stichprobenvarianz unterschätzt die Populationsvarianz tendenziell. Die Stichprobenvarianz ist also keine erwartungstreue Schätzung der Populationsvarianz. Sie besitzt einen Bias.

Methodenlehre Tests für Ordinaldaten Schätzen der Populationsvarianz σ² n 1 n = = n n 1 2 2 2 2 Es gilt: E{ s } = σ σ = E{ s } (unabh.) t (abh.) Schätzung: { } ÊE s = s 2 2 2 n 2 1 Also: ˆ σ = s = ( x x ) 2 σ = = i n 1 n 1 Der Erwartungswert der Stichprobenvarianz weicht um den Faktor (n-1)/n von der Populationsvarianz ab. n i= 1 Wir wählen die beobachtete Stichprobenvarianz s² als beste Schätzung für ihren Erwartungswert E(s²). Die Stichprobenvarianz, korrigiert um n/(n-1), ist dann eine erwartungstreue Schätzung der Populationsvarianz.

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Zusammenfassung der Populationsschätzungen Für die Schätzung des Erwartungswertes einer Zufallsvariablen in der Population gilt: n 1 ˆ μ = x = x i n = Für die Schätzung der Populationsvarianz gilt: ˆ σ n n 1 = s = x i x n 1 n 1 2 2 i 1 i= 1 ( ) 2 Die Standardabweichung in der Population ist wie üblich die Wurzel daraus. Nun können aus einer Stichprobe die Populationsparameter z.b. für den z-test geschätzt werden.

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Mittelwertevergleiche In der empirischen Forschung ist zumeist nicht die Prüfung eines Einzeldatums gefragt, sondern von Mittelwerten bzw. von Unterschieden zwischen solchen in mehreren Gruppen Beispiele: Verbessert sich die Schulleistung von Kindern durch Förderunterricht?, Wirkt VT bei Schizophrenen?, Sind Frauen sprachbegabter als Männer? Wieder gilt: Die Statistik interessiert sich nicht für die konkret gezogene Stichprobe, sondern möchte immer generalisierte Aussagen über die zugrunde liegende(n) Population(en) treffen

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Mittelwertevergleiche & Schätzen Inferenzstatistische Tests für Mittelwerte aus Stichprobendaten sollen in gleicher Weise eigentlich Aussagen über die Unterschiedlichkeit von Erwartungswerten in der Population treffen. Für einen solchen Test müssen wie üblich mehrere Dinge bekannt sein: Die Erwartungswerte selbst Ihre Verteilungsform bzw. die Verteilungsform der berechneten Prüfgröße Die Parameter dieser Verteilung All diese sind zunächst unbekannt, so dass genau wie bei den bisher behandelten Tests eine Schätzung erforderlich wird

Methodenlehre Tests für Ordinaldaten Der Grundlagen Der beantwortet die Frage, ob ein aus einer Stichprobe geschätzter Erwartungswert mit einem bekannten Erwartungswert übereinstimmt. Beispiele: Ist der IQ von Psychologiestudierenden im (unabh.) Mittel 100?, Sind Geburtsraten in Deutschland so hoch wie der europäische Durchschnitt?, Erreichen Teilnehmer eines Assessment Centers im Mittel einen bestimmten Cut- Off-Wert? t (abh.) Ansatz: Ist bekannt, welcher Wahrscheinlichkeitsverteilung ein aus einer Population gezogener Mittelwert folgt, kann die Auftretenswahrscheinlichkeit eines beobachteten Mittelwerts wie üblich ermittelt und bewertet werden.

Methodenlehre Tests für Ordinaldaten Der Grundlagen Population Verteilung von Stichprobenmittelwerten itt t Kennwerte Stichprobe des Umfangs n Wiederhole dies k-mal x ( x x x ) 1 1 k Kennwerteverteilung Wie lauten μ E{ x} 2 σ Die Verteilung der Stichprobenmittelwerte hat eine bestimmte Verteilungsform, einen Erwartungswert sowie eine Varianz. Frage: Haben diese etwas mit der Verteilung der Zufallsvariablen und deren Parametern μ und σ² zu tun? 2 σ x

Methodenlehre Tests für Ordinaldaten Der Grundlagen (unabh.) Der Mittelwert für Stichprobendaten berechnete sich als 1 n ( ) x = x + 1 x + 2 x n Dies ist prinzipiell eine Summe von Zufallsvariablen (geteilt durch eine Konstante, was aber an der Verteilungsform der Summe nichts ändert. Nimmt man an, dass die Zufallsvariablen unabhängig und t (abh.) gleichartig verteilt ist, muss die Verteilung von Mittelwerten und damit auch des Erwartungswertes eine Normalverteilung sein (Zentraler Grenzwertsatz). Frage: Wie lauten ihre Parameter?

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Der Grundlagen Für die Schätzung des Erwartungswertes der Wahrscheinlichkeitsverteilung von Mittelwerten galt ja: ˆ μ x = ˆ μ = Für die Schätzung der Populationsvarianz der Wahrscheinlichkeitsverteilung von Mittelwerten gilt ˆ σ x 1 1 = ˆ σ = s n n 1 2 2 2 x Daraus ergibt sich unmittelbar für die Schätzung der Standardabweichung Schätzung der Kennwerte der Wahrscheinlichkeitsverteilung von Mittelwerten aus Stichprobendaten. Standardfehler ˆ σ 2 1 ˆ x = σx = s n 1

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Der Datenlage: Gegeben sind ein Populationsparameter c (Erwartungswert) sowie Stichprobendaten x 1 x n Frage: Kann die Stichprobe aus einer Population stammen, in der gilt μ = c Das unbekannte μ muss aus den Stichprobendaten geschätzt werden Es können dann folgende Hypothesen geprüft werden: a) H : ˆ μ = c; H : ˆ μ c 0 1 b) H : ˆ μ c; H : ˆ μ > c 0 1 c) H : ˆ μ c; H : ˆ μ < c 0 1

Methodenlehre Tests für Ordinaldaten Der Wir haben gesehen, dass die Prüfung μ = c gleichbedeutend ist mit ˆ μ x = x = c weil μx = μ (unabh.) Wir fragen uns also, mit welcher Wahrscheinlichkeit ein so extremer Mittelwert wie der beobachtete oder ein noch extremerer aufträte, wenn die Stichprobe in Wahrheit aus einer Population mit dem Erwartungswert c stammt. t (abh.) Die theoretische Wahrscheinlichkeitsverteilung der Mittelwerte ist schätzbar Wenn μ = c, sollte also gelten ( ˆ ˆ ) x ~ NV μ, σ x x x ( ˆ ) ~ NV c, σ x Alle benötigten Parameter können damit aus den Stichprobendaten ermittelt werden

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Der Daraus ließe sich ein dem z-test analoger Test konstruieren. Die Prüfgröße z = ˆ μ c σ ˆ x ist standardnormalverteilt, wenn gilt ˆ μ = ˆx μ = c Aus den Stichprobendaten kann nun folgende Schätzung ermittelt werden: ˆ μ x c x c z = = 1 ˆ σ 1 n s n 1

Methodenlehre Tests für Ordinaldaten Der (unabh.) Aber: Ein Herr Student untersuchte die Wahrscheinlichkeitsverteilung folgender Prüfgröße t ˆ x σ x μ c = Er fand heraus, dass die Wahrscheinlichkeitsverteilung von t nur für Stichproben mit sehr großen Umfängen n gegen die Normalverteilung geht t (abh.) Die tatsächliche Verteilung von t ist eine t-verteilung Die t-verteilung hat genau einen Parameter, die so genannten Freiheitsgrade (df) Dieser ist df = n - 1

Methodenlehre Tests für Ordinaldaten Der Standard- 0.4 Normalverteilung 0.3 (unabh.) t (abh.) 0.2 0.1-3 -2-1 1 2 3 t- Verteilung mit df = 10 Kritische Werte sind bei der t- Verteilung im Vergleich zur Normalverteilung größer t.99 = 2.76 z.99 = 2.33

Methodenlehre Tests für Ordinaldaten (unabh.) t (abh.) Der Zusammenfassung Die Prüfgröße für den eines Stichprobenmittelwertes gegen einen bekannten Erwartungswert c lautet t = ˆ μ ˆ x c μ c x c ˆ σ = 1 = x ˆ σ 1 s n n 1 wobei σ die Populationsvarianz der Daten und s die Standardabweichung der Stichprobendaten ist Die Prüfgröße ist t-verteilt mit df=n-1. Für n 30 muss die Zufallsvariable in der Population normalverteilt sein, damit die Annahme der t-verteilung gehalten werden kann

Methodenlehre Tests für Ordinaldaten Der Beobachtung im Experiment: x Frage: Stammt die Stichprobe aus einer Population mit μ = c? Geht die Größe des Mittelwertes auf einen Stichprobenfehler zurück? (unabh.) t (abh.) (1) Festlegung von Signifikanzniveau α und Gerichtetheit (2) Berechnung der Prüfgröße t (3) Berechnung eec gder Wahrschein- lichkeit für dieses oder ein extremeres z: z. B. p(x t) (4) Vergleich von p mit α und Treffen der Signifikanzaussage Achtung: Vorher immer Prüfung der Voraussetzungen! Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α 100%

Methodenlehre e e Relevante Excel Funktionen STABWN(), VARIANZEN() (für Stichprobenkennwerte) STABW(), VARIANZ() (für Populationsschätzungen aus Stichprobendaten) TVERT()