ANalysis Of VAriance (ANOVA) 1/2

Ähnliche Dokumente
ANalysis Of VAriance (ANOVA) 2/2

Wiederholung. Seminar für Statistik

Biometrische und Ökonometrische Methoden II Lösungen 2

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Kategorielle Daten. Seminar für Statistik Markus Kalisch

Wahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm./HST) FS 2014

Lineare Regression 1 Seminar für Statistik

Mittelwertsvergleich bei mehr als 2 Stichproben

Versuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling

Einleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse

Mittelwertsvergleich bei mehr als 2 Stichproben. Marcus Hudec

Auswertung und Lösung

Versuchsplanung. Inhalt. Grundlagen. Faktor-Effekt. Allgemeine faktorielle Versuchspläne. Zweiwertige faktorielle Versuchspläne

Auswertung und Lösung

methodenlehre ll ALM und Mehrfaktorielle ANOVA Mehrfaktorielle ANOVA methodenlehre ll ALM und Mehrfaktorielle ANOVA

Mixed Effects Models: Wachstumskurven

Zusammenfassung 11. Sara dos Reis.

Einfaktorielle Varianzanalyse Vergleich mehrerer Mittelwerte

Multiple Vergleiche. Werner Brannath. VO Biostatistik im WS 2006/2007

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Mittelwertvergleiche, Teil II: Varianzanalyse

Einführung in die Statistik zur Tierversuchsplanung

Schriftliche Prüfung (90 Minuten)

Statistische Methoden in den Umweltwissenschaften

Bachelorprüfung: Statistik (1 Stunde)

Multiples Testen. Wolfgang Mader. 12. Juli Multiples Testen. Wolfgang Mader. Probleme des multiplen Testens. Bonferroni Methode

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik

Tests einzelner linearer Hypothesen I

Auswertung und Lösung

Logistische Regression

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Mathematik für Biologen

Schriftliche Prüfung (1 Stunde)

Analyse 2: Hypothesentests

Mehrfaktorielle Varianzanalyse

W-Rechnung und Statistik für Ingenieure Übung 13

Statistisches Testen

Mittelwertvergleiche, Teil I: Zwei Gruppen

Einführung in die Induktive Statistik: Varianzanalyse

Einführung in die Varianzanalyse mit SPSS

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung.

Mathematische und statistische Methoden II

Beispiel: Multiples Modell/Omitted Variable Bias I

Einfaktorielle Varianzanalyse

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

Biostatistik 101 Korrelation - Regressionsanalysen

Vorlesung Wirtschaftsstatistik 2 (FK ) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Gepaarter und ungepaarter t-test. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Schriftliche Prüfung (90 Minuten)

Statistik II für Betriebswirte Vorlesung 4

Statistik II. IV. Hypothesentests. Martin Huber

Auswertung und Lösung

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Multiple Lineare Regression. Statistik (Biol./Pharm./HST) Herbst 2013

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Versuchsplanung. Teil 1 Einführung und Grundlagen. Dr. Tobias Kiesling <kiesling@stat.uni-muenchen.de> Einführung in die Versuchsplanung

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate

Lineare Regression 2: Gute Vorhersagen

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Für diese Beschreibungen sind Grundlagen der Statistik vorteilhaft. Weiterführende und verwandte

Stochastik Praktikum Lineare Modelle

Modul G.1 WS 07/08: Statistik

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten

ANOVA und Transformationen. Statistik II

Liegen 2 Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Schriftliche Prüfung (90 Minuten)

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik

Vorlesung: Multivariate Statistik für Psychologen

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2016

ANOVA und Transformationen

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Multiple Lineare Regression. Statistik (Biol./Pharm.) Herbst 2012

Biostatistik 7. Zweistichproben-t-Test, F-Test

PVK Statistik Tag Carlos Mora

Inferenz im multiplen Regressionsmodell

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen

SozialwissenschaftlerInnen II

Bemerkungen zu statistischen Tests

Prüfungsliteratur: Rudolf & Müller S

Eine Einführung in R: Varianzanalyse

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am Autor: Ludwig Bothmann

Schätzung im multiplen linearen Modell VI

Kovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen

Musterlösung. Kind Blume (beredet) Blume (nicht beredet)

Statistik-Klausur I E SS 2010

Bemerkungen bzgl statistichen Tests. (basierend auf Slides von Lukas Meier)

Transkript:

ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1

ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)? Y ~ X + ε 1-weg ANOVA ANOVA 2: Zwei Medikamente zur Blutdrucksenkung, Placebo (Faktor) und Geschlecht (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich) (evtl. geschlechterspezifisch)? Y ~ X1 + X2 + ε 2-weg ANOVA ((Vorname Nachname)) 16.10.2014 2

ANOVA: Mögliche Missverständnisse ANOVA = «Varianzanalyse» Macht Aussagen über Mittelwerte (analysiert dazu Varianzen) ANOVA = Spezialfall einer Linearen Regression kont. Variable ~ Faktoren + Fehler Verallgemeinerung des t-test (2 Gruppen viele Gruppen) Historisch: Sehr verbreitet; heute: Immer noch extrem verbreitet Markus Kalisch 16.10.2014 3

Wdh: Ungepaarter t-test D: Streuung zwischen MW ( Signal ) σ: Streuung um MW ( Fehler ) t D σ ; falls H 0 stimmt: t t n 1 N(0,1) Senkung Blutdruck [mmhg] -10 0 5 10 D M P Medikament σ Senkung Blutdruck [mmhg] -10-5 0 5 D M P Medikament σ Markus Kalisch 16.10.2014 4

ANOVA: Idee g: Anzahl Gruppen 3 p: Anzahl Beob. pro Gruppe 10 Ann: p in jeder Gruppe gleich Streuung zwischen Gruppen: Between-Sum-of-Squares (SS B ) RSS der Gruppenmittelwerte (rote Kreuze) um den totalen Mittelwert (blaue Linie) SS B = p g i=1 Y i. Y.. 2 Senkung Blutdruck [mmhg] -5 0 5 10 20 Y 2. Y 1. Y.. M1 M2 P Medikament Y 3. Streuung innerhalb Gruppen: Within-Sum-of-Squares (SS W ) RSS der Einzelbeobachtungen (schwarze Kreise) um die einzelnen Mittelwerte (rote Kreuze) SS W = g p i=1 j=1 Y ij Y i. 2 Teststatistik SS B SS W Markus Kalisch 16.10.2014 5

ANOVA: Teststatistik In welchem Bild ist die Teststatistik der ANOVA grösser? Senkung Blutdruck [mmhg] -10 0 5 15 A M1 P Medikament Senkung Blutdruck [mmhg] -10 0 5 15 B M1 P Medikament Markus Kalisch 16.10.2014 6

ANOVA: Modell Y ij = μ + α i + ε ij, ε ij ~ N 0, σ 2 iid g Technische Nebenbedingung: i=1 αi = 0 H 0 : α 1 = α 2 = = α g = 0 Teststatistik: T = Theorie: Falls H 0 stimmt SS B/(g 1) SS W /(g p 1 ) = MS B MS W Degrees of freedom (Df) Analyse der Varianzen Mean Squares T ~ F g 1,g p 1 Damit kann ein Hypothesentest mit den üblichen 6 Schritten durchgeführt werden Markus Kalisch 16.10.2014 7

Exkurs: Verteilungen Angenommen: Z i ~ N 0,1, i = 1, n alle unabhängig A = Chi-Quadrat-Verteilung mit n Freiheitsgraden: A ~ X n Angenommen: A ~ Χ n, B ~ Χ m unabhängig Q = A/n B/m F-Verteilung mit n und m Freiheitsgraden Q ~ F n;m n i=1 Z i 2 Markus Kalisch 16.10.2014 8

Beispiel in R: ANOVA-Tabelle g = 3, p = 10 Senkung Blutdruck [mmhg] -5 0 5 10 20 M1 M2 P Medikament g 1 = 2 g*(p-1)=27 SS B = 872.3 SS W = 642.1 MS B = 872.3 = 436.1 2 MS W = 642.1 27 = 23.8 F = 436.1 23.8 = 18.34 Markus Kalisch 16.10.2014 9

Wo ist der Unterschied? Teil 1: Paarweise Tests Falls ANOVA signifikant: Zwischen welchen Gruppen sind signifikante Unterschiede? t-tests für alle Gruppenpaare Problem: Multiples Testen Bei n Gruppen gibt es n t-tests 2 Bsp: n = 20 190 Tests auf 5%-Niveau Könnten etwa 0.05 190 10 falsch positive Tests haben Lösung: t-test korrigieren (z.b. Bonferroni, ) = n(n 1) 2 Markus Kalisch 16.10.2014 10

Beliebte Alternative bei ANOVA: Tukey s Honestly Significant Difference (HSD) Test Vorteil: - Vertrauensintervalle für Differenzen der Gruppenmittelwerte - Wa., dass alle wahren Differenzen in den Vertrauensintervallen liegen: 95% Alternative zum paarweisen t-test Empfehlung: Tukey HSD verwenden Markus Kalisch 16.10.2014 11

Beispiel in R: TukeyHSD 95% family-wise confidence level M2 ist deutlich wirksamer als M1 P-M2 P-M1 M2-M1-15 -10-5 0 5 10 Differences in mean levels of g Senkung Blutdruck [mmhg] -5 0 5 10 20 M1 und M2 sind deutlich wirksamer als Placebo M1 M2 P Medikament Markus Kalisch 16.10.2014 12

Wo ist der Unterschied? Teil 2: Allgemeine Kontraste Bisher: Differenz von zwei Gruppen Jetzt: Linearkombination von beliebigen Gruppen Bsp: Sind die beiden Medikamente im Mittel besser als das Placebo? Markus Kalisch 16.10.2014 13

Kontraste: Notation Vektor mit wahren Gruppenmittelwerten: μ = Kontraste-Matrix K Parameter-Vektor m Senkung Blutdruck [mmhg] μ M1, μ M2, μ P T -5 0 5 10 20 M1 M2 P Medikament H 0 : K μ = m Praxis: Benutzer definiert K und m; Computer berechnet p-werte für Hypothesen und korrigiert für mult. Testen Markus Kalisch 16.10.2014 14

Konstraste Bsp 1: Paarweise Vergleiche (Alternative zu TukeyHSD) K μ m μ M2 μ M1 = 0 μ P μ M1 = 0 μ P μ M2 = 0 Markus Kalisch 16.10.2014 15

Kontraste Bsp 1: R Funktion glht (General Linear Hypotheses Test) im package multcomp Approx. 95%-VI für Unterschied M1 vs. M2: 5.67 ± 2 2.181 Markus Kalisch 16.10.2014 16

Kontraste Bsp 2: Gruppe der Medikamente vs. Placebo Medikamente vs. Placebo 0.5 μ M1 + 0.5 μ M2 μ P = 0 μ M2 μ M1 = 0 Medikamente untereinander Markus Kalisch 16.10.2014 17

Kontraste Bsp 2: R Die Medikamente sind deutlich wirksamer als Placebo M2 ist deutlich wirksamer als M1 Markus Kalisch 16.10.2014 18

Kontraste Angenommen, es gibt zwei Medikamente (M1, M2) und auch zwei mögliche Formen von Placebo (P1, P2). Folgende Matrix ist dann eine mögliche Kontrastmatrix für die Vergleiche: (M1, M2) vs. (P1, P2) M1 vs. M2 P1 vs. P2 Ja Nein Markus Kalisch 16.10.2014 19

Grundregeln für Kontraste Wenige Kontraste viel Macht Software: Korrektur für multiples Testen innerhalb von einem Funktionsaufruf (aber nicht bei mehreren Funktionsaufrufen mit verschiedenen Kontrasten) Deshalb: Einen Satz von Kontrasten definieren, dann auswerten; anschliessend keinen neuen Satz von Kontrasten mehr untersuchen Markus Kalisch 16.10.2014 20

Residuenanalyse bei ANOVA Y ij = μ + α i + ε ij, ε ij ~ N 0, σ 2 iid 1. Daten in jeder Gruppe normalverteilt 2. Gleiche Varianz in Gruppen 3. Unabhängige Fehler ε ij In R: Funktion plot wie bei Linearer Regression Vorteil: Balanciertes Experiment (gleiche Anzahl pro Gruppe): ANOVA ist robuster gegenabweichungen obiger Annahmen Markus Kalisch 16.10.2014 21