Mathematische und statistische Methoden I

Ähnliche Dokumente
Mathematische und statistische Methoden II

Aufgaben zu Kapitel 7:

Anwendungsaufgaben. Effektgröße bei df Zähler = df A = 1 und N = 40 (zu berechnen aus df Nenner ): Der aufgedeckte Effekt beträgt also etwa 23 %.

Mathematische und statistische Methoden II

Mathematische und statistische Methoden I

Forschungsstatistik I

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

Aufgaben zu Kapitel 5:

Kapitel 5: Einfaktorielle Varianzanalyse

Mathematische und statistische Methoden I

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

V A R I A N Z A N A L Y S E

Mathematische und statistische Methoden I

Mathematische und statistische Methoden II

Inhaltsverzeichnis. Vorwort

1 Varianzanalyse (ANOVA)

Einfache Varianzanalyse für unabhängige Stichproben

Methodenlehre. Vorlesung 5. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Forschungsstatistik I

8. G*Power. power3/ 8. Stichprobenumfang, Effekt- und Teststärke

1. Es sind einfach zu viele! Varianzanalytische Verfahren.

Kapitel 5: Einfaktorielle Varianzanalyse

Jun. Prof. Dr. Sarah Lukas Prof. Dr. Stefan König. Interventionsstudien. Workshop am Tag der Zentren (PH Weingarten am

Willkommen zur Vorlesung Statistik (Master)

VS PLUS

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Kapitel 7: Varianzanalyse mit Messwiederholung

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab.

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Statistik. Jan Müller

Ein- und Zweistichprobentests

Die ungeliebten Verwandten: nicht-parametrische Alternativen

Einfache Varianzanalyse für abhängige

Ablaufschema beim Testen

Modul G.1 WS 07/08: Statistik

ANalysis Of VAriance (ANOVA) 2/2

Mathematische und statistische Methoden II

Lösungen zu den Übungsaufgaben in Kapitel 10

Anpassungstests VORGEHENSWEISE

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Sitzung 4: Übungsaufgaben für Statistik 1

Angewandte Statistik 3. Semester

Mathematische und statistische Methoden II

Hypothesentests mit SPSS. Beispiel für einen t-test

Modul G.1 WS 07/08: Statistik

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

8. Konfidenzintervalle und Hypothesentests

Varianzanalyse * (1) Varianzanalyse (2)

Analyse von Querschnittsdaten. Signifikanztests I Basics

Chi Quadrat-Unabhängigkeitstest

Mittelwertvergleiche, Teil II: Varianzanalyse

ANalysis Of VAriance (ANOVA) 1/2

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

Inferenzstatistik Vortrag: Alpha und Beta Fehler

Statistik II: Signifikanztests /1

Jost Reinecke. 7. Juni 2005

Überblick über die Verfahren für Ordinaldaten

Statistik. Für Sozialwissenschaftler. Dritte, neu bearbeitete Auflage Mit 71 Abbildungen und 224 Tabellen

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

1.1. Vergleich von Mittelwerten

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Inferenzstatistik Vergleich mehrerer Stichproben - Varianzanalyse

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Lehrbuch der Statistik

Analytische Statistik II

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

Methodik für Linguisten

Lösungen zu den Übungsaufgaben in Kapitel 13

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS (ab V. 11.0)

Chi-Quadrat Verfahren

Test-Finder. Inhalt. Orientierung im Test-Chaos Dipl.-Psych. Dr. Guido Strunk

Prüfen von Mittelwertsunterschieden: t-test

Klausur zu Statistik II

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Kategorielle Daten. Seminar für Statistik Markus Kalisch

Forschungsstatistik I

Statistik und Wahrscheinlichkeitsrechnung

SPSS III Mittelwerte vergleichen

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Schließende Statistik

Lineare Regression II

Statistischer Rückschluss und Testen von Hypothesen

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung

Biostatistik Erne Einfuhrung fur Biowissenschaftler

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

Analyse von Experimenten. Stefan Hanenberg (University of Duisburg-Essen)

Transkript:

Prof. Dr. G. Meinhardt Statistik & Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-06 Dr. Malte Persike persike@uni-mainz.de lordsofthebortz.de twitter.com/methodenlehre tinyurl.com/gplusmethodenlehre Folie 1 WiSe 011/01 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz

(repeated measurements) Ziel: Analyse des Einflusses einer unabhängigen Variablen (UVn) auf eine abhängige Variable (AV) Die AV muss dabei stetig sein (intervallskaliert) die UVn sind i.d.r nominal- oder ordinalskaliert Anders als bei der einfaktoriellen ANOVA werden in der rmanova dieselben Merkmalsträger in allen Treatmentstufen beobachtet ( Messwiederholung ) Folie

(repeated measurements) Vorteil: Die Fehlervarianz wird i.d.r. kleiner, da sich die Unterschiedlichkeit zwischen den Versuchspersonen auf alle Stufenmittelwerte gleich auswirkt schärfere Testung Es braucht also nicht auf Varianzhomogenität zwischen den Versuchspersonen geachtet zu werden. Nachteil: Die rmanova ist durch anspruchsvollere Voraussetzungen gekennzeichnet als die ANOVA Zudem wirkt sich der Ausfall eines Merkmalsträgers auf alle Stufen aus. Folie 3 Wenn anwendbar, ist die rmanova trotzdem zumeist das wünschenswertere Design.

(repeated measurements) Folie 4 Die Beobachtungen müssen abhängig sein Die Fehler innerhalb einer Person sollen normalverteilt sein mit einem Erwartungswert von 0. Die Varianzen der Differenzen zwischen den Treatmentstufen müssen gleich sein Sphärizitätsannahme Vp A 1 A A p 1 3.8 5. 6.9 4.4 6.6 7.7 3 3.9 A 5.4 A 5.8 n 5.1 7.1 7.3 identische Varianzen

(repeated measurements) Die Sphärizitätsannahme ist eine wichtige Voraussetzung Verletzungen führen zu progressiveren Entscheidungen bei der der F-Prüfgröße, d.h. es stellen sich schneller Signifikanzen ein (unerwünscht) Die Sphärizitätsannahme wird mit dem Mauchly Test auf Sphärizität geprüft Ist die Sphärizität verletzt, so ist eine Korrektur der Freiheitsgrade vorzunehmen (aber: es empfiehlt sich, die Freiheitsgradkorrektur immer durchzuführen). Korrekturmethoden sind die Greenhouse-Geisser Korrektur sowie die Huynh-Feldt Korrektur Folie 5

(repeated measurements) QS Total QS Treat QS Fehler Folie 6 QS Treat QS Fehler = Wirkung der Faktorstufen (interessant) = Streuung zwischen Personen (Prüfstreuung)

(repeated measurements) QS Total QS Zwischen QS Innerhalb QS Treat QS Fehler/A e Folie 7 QS Zwischen = Streuung zwischen Personen (uninteressant) QS Innerhalb = Streuung innerhalb von Personen QS Treat = Wirkung der Faktorstufen (interessant) QS Fehler = Streuung innerhalb einer Person (Prüfstreuung)

(repeated measurements) Der einfaktoriellen rmanova liegt ein einfaches lineares Modell zugrunde x a e a e ij j i j i Treatment Fehler I (Zwischen- Person Schwankung) Fehler II (Innerhalb- Person Schwankung) x Messwert von Person i ( i 1... n) in Treatmentstufe j ( j 1... p) ij Populationswert aller n Personen aj Effekt der Treatmentstufe j e Fehler (oder auch "Effekt") der Person i i Folie 8

Folie 9 (repeated measurements) Daraus lässt sich nun die Quadratsummenzerlegung in der ableiten: QS QS QS Tot Zwischen Innerhalb n p n p p n x ij G xi G xij xi i1 j1 i1 j1 i1 j1 Die QS Innerhalb zerfällt in QS QS QS Innerhalb Treat Fehler / Ae n p n p n p xij xi Aj G xij Aj xi G i1 j1 i1 j1 i1 j1 Mittelwert der Person i über alle j Faktorstufen von A

(repeated measurements) Aus den Quadratsummen lassen sich wieder spezielle Varianzen bestimmen, die Populationsvarianzen Dazu werden wieder die Freiheitsgrade (df, degrees of freedom) benötigt. ˆ Folie 10 In der rmanova gilt: df df Tot n p 1 Zwischen df n p 1 df Innerhalb Treat Fehler / Ae n 1 p 1 df ( n 1) p 1

(repeated measurements) Folie 11 Damit werden die Populationsvarianzen berechnet als ˆ ˆ ˆ Tot Zwischen Innerhalb QS df QS df Tot tot Zwischen Zwischen n p i1 j1 i1 j1 n 1 xij x QSInnerhalb i1 j1 df n ( p 1) Innerhalb n n x p ij p G n p 1 x i G i

(repeated measurements) Damit werden die Populationsvarianzen berechnet als ˆ ˆ Treat Fehler / Ae QS df Treat Treat Fehler / Ae n p i1 j1 n A j p 1 p G xij Aj xi G QSFehler / Ae i1 j1 df n p 1 1 Folie 1

(repeated measurements) Hat das Treatment keinen Effekt, so sind Unterschiede zwischen Mittelwerten der Treatmentstufen rein zufällig Die Streuung der Stufenmittelwerte kann dann nur aus der Residualstreuung entstehen. Es muss gelten: ˆ ˆ Treat Fehler Daraus konstruiert man die Prüfgröße F ˆ ˆ Treat Fehler Sie ist F-verteilt mit df Treat = p 1 Zählerfreiheitsgraden und df Fehler = (n-1) (p-1) Nennerfreiheitsgraden. Aus der F-Verteilung kann die Wahrscheinlichkeit p(f) für das Auftreten dieser Prüfgröße ermittelt werden Folie 13

(repeated measurements) Beobachtung im Experiment: ˆ Treat und ˆ Residual Frage: Sind die Varianzen in Wahrheit gleich? Geht die Streuung der Mittelwerte der Treatmentstufen nur auf die Fehlerstreuung zurück? (1) Festlegung eines Signifikanzniveaus α () Berechnung der Prüfgröße: F deren Häufigkeitsverteilung theoretisch bekannt ist (F-Verteilung) (3) Berechnung der Wahrscheinlichkeit für diese Prüfgröße: p(f) Folie 14 (4) Rückschluss: (5) Vergleich von p mit α und Treffen der Signifikanzaussage pf pˆ ˆ ( ) Treat Fehler Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α 100%

(repeated measurements) Man erstellt folgende Ergebnistabelle Faktor QS df Var F p Zwischen 116.800 9 1.978 Innerhalb 870.667 0 43.533 A 58.867 91.433 18.7 0.000 Fehler 87.800 18 15.989 Total 987.467 9 34.051 Dabei wird die zweite Zeile (QS Innerhalb ) manchmal auch weggelassen, v.a. von Statistikprogrammen. Folie 15 Die Fehlervarianz wird auch als Residualvarianz bezeichnet, um den Innerhalb -Fehler in der rmanova vom Zwischen -Fehler in der ANOVA abzugrenzen

Folie 16 (repeated measurements) Zusätzlich ist zu empfehlen, die Varianzaufklärung η² (eta²) für das Model zu bestimmen. Die Varianzaufklärung für QS Zwischen und QS Innerhalb verläuft analog zur ANOVA für unabhängige Daten. QS bzw. QS Innerhalb Innerhalb QS Zwischen Zwischen QSTot Für den Messwiederholungsfaktor wird jedoch die QS Innerhalb als Referenz gewählt. QS bzw. QS Fehler Fehler QS Treat Treat QSInnerhalb Tot Innerhalb

(repeated measurements) Sind die Daten zwischen den Messzeitpunkten perfekt unkorreliert, ergibt sich ein ähnliches (knapp weniger signifikantes) Ergebnis wie für die ANOVA für unabhängige Stichproben. Sind die Daten zwischen den Messzeitpunkten hochkorreliert, ergibt sich extreme Teststärke der rmanova (frühe Signifikanzen). Sind die Daten negativ korreliert, ergibt sich schwächere Teststärke als für die ANOVA für unabhängige Stichproben (späte Signifikanzen) Folie 17

A-Priori Kontraste Scheffé Test Mittelwertevergleiche Prinzip: Die Mittelwertevergleiche in der rmanova folgen demselben Prinzip wie in der unabhängigen ANOVA Frage: Wann ist ein Mittelwertsunterschied zwischen Messzeitpunkten verschieden genug von Null, damit das berechnete D als statistisch signifikant bewertet wird? Berechnung: Es gelten praktisch dieselben Berechnungsformeln wie in er einfaktoriellen ANOVA. Wie auch dort existieren zwei verschiedene Testvarianten: 1. A-Priori Tests zur Prüfung von Hypothesen, die vor der Untersuchung formuliert wurden. Folie 18. A-Posteriori Tests (Post-hoc Tests) zur Prüfung von Hypothesen, die nach Ansehen der Daten gebildet wurden.

Prinzip des Testens A-Priori Kontraste Scheffé Test Beobachtung im Experiment: Mehrere Stufenmittelwerte Frage: Sind (zwei) Mittelwerte in Wahrheit gleich? Ist ihre Differenz D=0? (1) Festlegung eines Signifikanzniveaus α () Berechnung der Prüfgröße: F deren Häufigkeitsverteilung theoretisch bekannt ist (F-Verteilung) (3) Berechnung der Wahrscheinlichkeit für diese Prüfgröße: p(f) A j Folie 19 (4) Rückschluss: pf ( ) p D 0 (5) Vergleich von p mit α und Treffen der Signifikanzaussage Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α 100%

A-Priori Kontraste Scheffé Test A-Priori Kontraste Oft sollen in einer rmanova Mittelwerte von Messzeitpunkten auf Unterschiedlichkeit geprüft werden. Hat a-priori eine Hypothesenbildung stattgefunden, kann dies über Kontraste erreicht werden A 1 A A 3 A1 A A3 verschieden? Folie 0

A-Priori Kontraste A-Priori Kontraste Die Berechnung von a-priori Kontrasten in der rmanova verläuft exakt analog zur unabhängigen ANOVA Scheffé Test Die Prüfgröße ist F = D ˆ D s mit sˆ = sˆ n D Fehler Folie 1 Für die Prüfgröße F gilt: df df Zähler Nenner = 1 = df Fehler

A-Priori Kontraste Scheffé Test A-Posteriori Scheffé Test Oft sollen in einer rmanova Mittelwerte von Messzeitpunkten auf Unterschiedlichkeit geprüft werden. Hat die Hypothesenbildung erst nach dem Experiment (a-posteriori) stattgefunden, kann der Scheffé Test verwendet werden A 1 A A 3 A1 A A3 verschieden? Folie

A-Priori Kontraste A-Posteriori Scheffé Test Die Prüfgröße für paarweise a-posteriori Mittelwertsunterschiede verändert sich wieder nur um den Faktor 1 / (p-1) im Vergleich zum a-priori Kontrast Scheffé Test F corr 1 1 D = F = df df sˆ Zähler Zähler D wieder mit sˆ = sˆ n D Fehler Folie 3 Für die Prüfgröße F corr gilt: df df Zähler Nenner = p -1 = df Fehler

ANOVA Ausblick Weitere wichtige Typen von n Es können in abhängigen und unabhängigen ANOVA Designs beliebig viele Faktoren mit beliebig vielen Stufen miteinander kombiniert werden Auch die Kombination von abhängigen und unabhängigen Faktoren ist möglich (mixed ANOVA) Beispiel: Therapiestudie mit einem Messwiederholungsfaktor, einem Geschlechtsfaktor und einem Faktor Therapieart Messwiederholungsdesigns mit Gruppenfaktoren Folie 4

ANOVA Ausblick Weitere wichtige Typen von n Die Anzahl von Zellen in der ANOVA wird bei multiplen Faktoren mit vielen Stufen sehr schnell sehr groß (kombinatorische Explosion) Wenn der Experimentator nur an den Haupteffekten interessiert ist, kann der Versuchsplan drastisch reduziert werden, indem nur bestimmte Kombinationen von Stufen der Faktoren realisiert werden a1 a a3 b1 c1 c c3 b c c3 c1 b3 c3 c1 c Folie 5 Lateinische Quadrate

ANOVA Ausblick Weitere wichtige Typen von n In einigen Untersuchungsdesigns wird ein zweiter Faktor nur für bestimmte Stufen eines anderen Faktors realisiert Beispiel: Therapiestudie mit Placebogruppe, Medikamentengruppe und VT-Gruppe. Die Medikamentengruppe zerfällt in drei Untergruppen (kleine, mittlere, starke Dosis) Hierarchische ANOVA Designs Folie 6

ANOVA Ausblick Weitere wichtige Typen von n Bei vielen Fragestellungen ist es sinnvoll, verschiedene Treatments an denselben Merkmalsträgern zu testen. Beispiel: Strahlungsstärken in der Krebstherapie, Reizstärken bei Tests auf Schmerzempfindlichkeit, Effektivität verschiedener Düngemittel. Problem: Die einer Treatmentstufe ausgesetzte Stelle ist kontaminiert und für weitere Stufen unbrauchbar. Lösung: Man teilt den Merkmalsträger auf in verschiedene, als eigenschaftsgleich definierte Stücke ( Plots ) und appliziert hier die verschiedenen Stufen des Treatments. Folie 7 Split Plot Designs