Multivariate Lineare Modelle SS Varianzanalyse. 1. T -Statistiken. 2. ANOVA einfaktoriell. 3. ANOVA zweifaktoriell 4. MANOVA 5.

Größe: px
Ab Seite anzeigen:

Download "Multivariate Lineare Modelle SS Varianzanalyse. 1. T -Statistiken. 2. ANOVA einfaktoriell. 3. ANOVA zweifaktoriell 4. MANOVA 5."

Transkript

1 Multivariate Lineare Modelle SS Varianzanalyse 1. T -Statistiken 2. ANOVA einfaktoriell 3. ANOVA zweifaktoriell 4. MANOVA 5. ANCOVA 1

2 3.1 T -Statistiken Varianzanalyse kategorielle erklärende Variablen Einfachste Situation: nur eine erklärende 0/1 Variable y metrisch, x dichotom Statistische Analyse: Zweistichproben T-Test: Beobachtungen von y zerfallen in zwei Gruppen (u 1,..., u n1 ), (v 1,..., v n2 ), entsprechende Teststatistk T = ū v mit s 2 P = ( Q 1 + Q 2 ) s P n 1 n 2 (n 1 + n 2 2) wobei Q 1 = (u i ū) 2 und Q 2 = (v j v) 2. In beiden Gruppen wurde gleiche Varianz angenommen 2

3 T -Test im Kontext des GLM Theorie aus Kapitel 1 anwendbar für y = Xβ + ε, X = 0 n1 1 n 1 0 n2 1 n2, β = µ u µ v, Beachte dass Design Matrix ohne Intercept, typisch für ANOVA LSQ: ˆβ = (X X) 1 X y = (ū, v) Q e = y y ˆβ X X ˆβ = u 2 i + vj 2 n 1ū 2 n 2 v 2 = Q 1 + Q 2 Hypothese: H 0 : µ u = µ v d.h. Cβ = 0 mit C = (1, 1) ˆβ 0 = ˆβ (X X) 1 C [C(X X) 1 C ] 1 C ˆβ = (n 1ū+n 2 v,n 1 ū+n 2 v) n 1 +n 2 und damit F = (n 1+n 2 2)(Q C 0 Q e) Q e = (ū v)2 s 2 P = T 2 Übung: Führe die fehlenden Rechenschritte durch! 3

4 Hoteling s T 2 Multivariate Verallgemeinerung der T-Verteilung: Seien z N q (0, I), W W q (I, n) unabhängig, dann heißt u = nz W 1 z Hotelling T 2 -verteilt, T 2 (q, n). Es gilt T 2 (q, n) nq n q+1 F q,n q+1 Vergleiche das Resultat für q = 1 mit der vorigen Folie Übung: Beweise, dass für beliebiges Σ gilt x N q (µ, Σ), W W q (Σ, n) n(x µ) W 1 (x µ) T 2 (q, n) Hinweis: Betrachte x = Σ 1/2 (x µ) und W = Σ 1/2 W Σ 1/2 4

5 T -Statistiken mit SAS Es gibt die Prozedur SAS PROC TTEST Einfache übersichtliche Prozedur zum Berechnen von Einstichproben- und Zweistichproben T-Test ansonten natürlich immer PROC GLM möglich Für Hotelling s T 2 gibt es im SAS leider keine eigene Prozedur p-werte für einen entsprechenden Test erhält man mit PROC GLM wie bei MANOVA (Test basiert auf Wilk s Λ) Die eigentliche Teststatistik berechnet sich dann als T 2 = (n 1)( 1 Λ 1) Ein Beispiel folgt im Kapitel MANOVA 5

6 3.2 ANOVA einfaktoriell Zunächst klassische Behandlung der Varianzanalyse y metrisch, x kategoriell mit k Stufen Beispiel: y = Benzinverbrauch (in Liter pro 100 km) x = Automarke Frage: Unterschied des Benzinverbrauchs zwischen Marken? Messe Verbrauch von mehreren Autos pro Typ Modell: y ij = µ i + ε ij µ i... Erwarteter Verbrauch von Marke i ε ij N (0, σ 2 )... Abweichung vom Mittelwert des Verbrauchs bei Auto j von Marke i 6

7 Einfaktorielles Modell: Effektdarstellung Alternatives Modell: y ij = µ + α i + ε ij µ... Gesamtmittelwert, α i... Effekt der MArke i Für jede Marke Messungen j = 1,..., n i Falls für alle Marken i = 1,..., k gilt n i = n so spricht man von balanced Design (PROC ANOVA) Ansonsten kein ausgewogenes Design (PROC GLM) Effektdarstellung: µ und α i lassen sich nicht gleichzeitig schätzen Modell ist nicht identifizierbar (not identifiable) Lösung: zusätzliche Nebenbedingungen, z.bsp. k i=1 α i = 0 Hypothesen: H 0 : α 1 = = α k = 0, H 1 : α i 0 für ein i 7

8 Quadratsummen Klassische Varianzanalyse mit Tabelle (vgl. F -Test bei Regression) SSQ df MSQ F Faktor Q a k 1 Q a /(k 1) F = Q a/(k 1) Q e /(N k) Residual Q e N k Q e /(N k) Total Q t = Q a + Q e N 1 Q a = k i=1 Q e = k Q t = k N = k i=1 j=1 n i (ȳ i. ȳ) 2, n i n i i=1 j=1 n i i=1 SSQ zwischen Gruppen (y ij ȳ i. ) 2, SSQ innerhalb der Gruppen (y ij ȳ) 2, SSQ gesamt Gesamtanzahl der Beobachtungen 8

9 Verteilungen Klassische Varianzanalyse mit Tabelle (vgl. F -Test bei Regression) SSQ df MSQ F Faktor Q a k 1 Q a /(k 1) F = Q a/(k 1) Q e /(N k) Residual Q e N k Q e /(N k) Total Q t = Q a + Q e N 1 Übung: Rechne nach, dass tatsächlich Q t = Q a + Q e Hinweis zur Notation: ȳ i. = 1 n i n i y ij j=1 Unter der Voraussetzungen ε ij N (0, σ 2 ) gilt Q a /(k 1) χ 2 k 1, Q e/(n k) χ 2 N k, beide unabhängig daher ist Teststatistik F -verteilt mit entsprechenden Freiheitsgraden Übung: Verwende Satz von Cochran um Resultat zu beweisen 9

10 ANOVA im Kontext des GLM Modell: y = Xµ + ε, y = (y 11,...,..., y 1n1,..., y k1,..., y knk ) 1 n1 0 n n1 0 n2 1 n n2 X =....,. µ = (µ 1,..., µ k ), 0 nk 0 nk... 1 nk Kodierung verwendet Dummyvariablen x 1,..., x k, d.h. x i = 1 für x = i, ansonsten x i = 0 (vgl. Kapitel T-test) Gesamte Testtheorie des GLM kann so für ANOVA verwendet werden Übung: Kodierung der Effektdarstellung als GLM 10

11 Post Hoc Tests Klassischer F -Test für Overall-Hypothese H 0 : µ 1 = = µ k = µ, H 1 : i s.d. µ i µ Falls H 1 dann Frage für welches i gilt µ i µ Führt auf ( k 2) t Tests Multiples Testproblem Verschiedene Methoden (sowohl für Tests als auch CI) Bonferroni... hier sicherlich zu konservativ Tukey... Methode der Wahl, basiert auf studentized range stud = max(z 1,..., z k ) min(z 1,..., z k ) S Scheffe... Falls zusätzliche lineare Kontraste getestet werden sollen 11

12 Datensatz Auto.dat SAS-Programm: Bsp3.sas Einfaktorielle ANOVA mit SAS Einlesen von ASCII Daten Transformation von Datensatz in Format long PROC BOXPLOT Einfaktorielle ANOVA mit PROC ANOVA und PROC GLM Post Hoc Tests Übung: Beispiel 3a (aus Kim und Timm) F -Test signifikant, aber keiner der üblichen Kontraste Diskutiere die Analysen mit PROC GLM Erkläre speziell die Contrast und Estimate statements! 12

13 3.3 ANOVA zweifaktoriell Zwei erklärende Faktoren (z. Bsp. Automarke und Fahrer) Zunächst wiederum klassisches Modell y ijl = µ + α i + β j + (αβ) ij + ε ijl, Faktor A hat k Stufen: i = 1,..., k, Faktor B hat m Stufen: j = 1,..., m, Der Einfachheit halber betrachten wir balanciertes System, jede Zelle A = i, B = j hat genau n Beobachtungen: l = 1,..., n Somit insgesamt N = k m n Beobachtungen (αβ) ij... Interaktionsterm Modellvoraussetzung: ε ijl N (0, σ 2 ) und unabhängig 13

14 Quadratsummen Klassische Varianzanalyse (ANOVA Tabelle ) SSQ df MSQ F Faktor A Q a k 1 Q a /(k 1) F a = Q a/(k 1) Q e /(N km) Faktor B Q b m 1 Q b /(m 1) F b = Q b/(m 1) WW AB Q ab w = (k 1)(m 1) Q ab /w F ab = Residual Q e km(n 1) Q e /(N km) Total Q t N 1 Q a = mn k (ȳ i.. ȳ) 2, Q b = kn m (ȳ.j. ȳ) 2 i=1 Q ab = n k Q e = k i=1 j=1 m i=1 j=1 l=1 j=1 m (ȳ ij. ȳ i.. ȳ.j. + ȳ) 2, n (y ijl ȳ ij. ) 2, Q t = k m i=1 j=1 l=1 n (y ijl ȳ) 2 Q e /(N km) Q ab /w Q e /(N km) 14

15 Verteilungen Übung: Es gilt wiederum Zerlegung der Quadratsummen Q t = Q a + Q b + Q ab + Q e Verwendung des Satzes von Cochran liefert dass die Quadratsummen unabhängig χ 2 -verteilt mit den entsprechenden Freiheitsgraden, und daher auch die Teststatistiken F -verteilt F a und F b testen Hypothesen für die beiden Hauptfaktoren H 0A : α 1 = = α k = 0, H 1A : i s.d. α i 0 H 0B : β 1 = = β m = 0, H 1B : j s.d. β j 0 F ab testet ob eine Wechselwirkung vorliegt 15

16 Wechselwirkung Keine Wechselwirkung: y ijl = µ + α i + β j + ε ijl i fest µ i (j) = µ + α i + β j Für verschiedene i dann "parallele Streckenzüge" Wechselwirkung: Einfluss der Stufe i von Faktor A wechselt je nach Stufe j vom Faktor B (vgl. Beispiel 4) Klassische Vorgangsweise: Teste zunächst auf Wechselwirkung Falls (αβ) ij = 0 für alle i, j nicht abgelehnt wird, dann vereinfachtes Modell ohne WW Ansonsten Tests für einfache Effekte (siehe unten) Klassische Quadratsummen entsprechen Type 2 SSQ im SAS 16

17 Einfache Effekte bei Wechselwirkung Vergleich von verschiedenen Stufen eines Faktors Unterscheidung zwischen Haupteffekten und einfachen Effekten Haupteffekt (Main effect): Vergleich zwischen Mittelwerten über alle anderen Faktoren, e.g. ȳ 1.. ȳ 2.. Bei vorliegender WW problematisch Einfacher Effekt (Simple effect): Vergleich zwischen Mittelwerten für fixe Levels von anderen Faktoren, e.g. ȳ 1j. ȳ 2j. Entsprechende F -Tests in SAS mit SLICE Option bei LSMEANS Statement 17

18 ANOVA im Kontext des GLM Modell: y = Xµ + ε, y = (y 111,..., y 11n,..., y 1m1,..., y 1mn,...,... y km1,..., y kmn ) Kodierung in Effektdarstellung: ( k = m = 3 ) µ = (µ 0, α 1, α 2, β 1, β 2, αβ 1,1, αβ 1,2, αβ 2,1, αβ 2,2 ) 0 1 n 1 n 0 n 1 n 0 n 1 n 0 n 0 n 0 n 1 n 1 n 0 n 0 n 1 n 0 n 0 n 1 n 0 n 1 n 1 n 0 n 1 n 1 n 1 n 0 n 1 n 0 n 1 X = 1 n 0 n 1 n 1 n 0 n 0 n 1 n 0 n 0 n 1 n 0 n 1 n 0 n 1 n 0 n 0 n 0 n 1 n 1 n 0 n 1 n 1 n 1 n 0 n 1 n 0 n 1 n, 1 n 1 n 1 n 1 n 0 n 1 n 1 n 0 n 0 n 1 n 1 n 1 n 0 n 1 n 0 n 0 n 1 n 1 n 1 n 1 n 1 n 1 n 1 n 1 n 1 n 1 n 1 n C A Übung: Kodierung mit Dummyvariablen (ist einfacher!) 18

19 Zweifaktorielle ANOVA mit SAS Datensatz: Bsp. 1.2 von F.H. (S. 168) SAS-Programm: Bsp4.sas Eingeben von Daten direkt in SAS (datalines) PROC BOXPLOT (gruppierte Boxplots nicht elegant Verweis auf Macros) PROC MEANS (Erstellung von Plots der Mittelwerte PROC ANOVA vs. PROC GLM Post Hoc Tests SLICE Option 19

20 Problem bei Unbalanced Design Übung: Gegeben seien folgende Daten B = 1 B = 2 A = 1 7; 9 5 A = 2 8 4; 6 Vergleiche einerseits die Mittelwerte der Zellen ȳ 1j. mit ȳ 2j. Andererseits die Randmittelwerte ȳ 1.. und ȳ 2.. Basierend auf dem Modell berechne E(ȳ 1.. ) E(ȳ 2.. ) y ijk = µ + α i + β j + ε ijk Schlussfolgerung: Klassische ANOVA testet in diesem Beispiel nicht H 0 : α 1 = α 2 sondern H0 : α 1 + β 1 /3 = α 2 + β 2 /3 20

21 Tests auf einzelne Faktoren Unbalanced Design: Es spielt eine Rolle wie H 0 formuliert wird 1. Ungewichteter Test: H 0 : alle µ i. sind gleich Verwendung: Anzahl der Beobachtungen pro Zelle zufällig 2. Gewichteter Test: H 0 : alle k j=1 n ij ni. µ ij sind gleich Verwendung: Anzahl der Beobachtungen pro Zelle systematisch PROC REG: Explizite Formulierung dieser Nullhypothesen Balanced Design: Kein Unterschied zwischen verschiedenen Formulierungen von H 0 21

22 Restricted Models Modell mit WW: Unrestricted y ijk = µ ij + ε ijk Modell ohne WW: Restricted durch Nebenbedingungen (Q ab = 0) Hypothesentest, dass keine Interaktion: H 0 : µ ij µ i j = µ ij µ i j, i i, j j Beispiel k = 3, m = 2: C = Für Restricted Model gibt C gerade die Restriktion Dummy Codierung Full Rank Model PROC REG Codierung von Restriktion erfolgt explizit Dummy Codierung Less than Full Rank PROC GLM Verschiedene Arten von SSQ (Type 1, Type 3, etc.) 22

23 Auch Sequential Sum of Squares PROC GLM: Type 1 SSQ Zerlegung der erklärten SSQ (Q a bzw. Q b ) entsprechend der Reihenfolge in der Faktoren ins Modell aufgenommen werden. Sei z. Bsp. Q t = Q a + Q b + Q e Type 1 SSQ für A: Q t = SSQ a + error (Einfaktorielles Modell) Type 1 SSQ für B: Was wird zusätzlich durch Faktor B erklärt: SSQ b = Q a + Q b SSQ a hängt von Reihenfolge der Faktoren ab Reduktionsschreibweise: Modell 1 mit p Faktoren x 1,..., x p Modell 2 nur mit den ersten s < p Faktoren Definition: R(β s+1,..., β p β 0,..., β s ) := Q r1 Q r2 Übung: Zeige, dass Q r1 Q r2 = Q e2 Q e1 23

24 Type 1 vs. Type 3 SSQ Modell mit 3 Faktoren: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε Reduktionsschreibweise: Faktor Type 1 Type3 x 1 R(β 1 β 0 ) R(β 1 β 0, β 2, β 3 ) x 2 R(β 2 β 0, β 1 ) R(β 2 β 0, β 1, β 3 ) x 3 R(β 3 β 0, β 1, β 2 ) R(β 3 β 0, β 1, β 2 ) Beispiel der vorvorigen Folie: Type 1 SSQ: R(A µ) für Modell y = a, b, a b Type 1 SSQ: R(B µ) für Modell y = b, a, a b Entsprechen den beiden gewichteten Tests 24

25 Type 1 vs. Type 3 SSQ Modell mit 2 Faktoren: y = β 0 + β 1 x A + β 2 x B + β 3 x AB + ε µ - Modell Schreibweise: y ijl = µ ij + ε ijl Faktor Type 1 Type3 A m n 1j n1. µ 1j = = m B j=1 k i=1 n i1 µ i1 = k m i=1 j=1 j=1 n kj nk. µ kj µ 1. = = µ k. n i1 n ij ni. µ ij,... µ.1 = = µ.m A B µ ij µ i j = µ ij µ i j µ ij µ i j = µ ij µ i j, Type 3 immer leicht interpretierbar Type 1 nur für Effekt A und A B leicht interpretierbar 25

26 Zweifaktorielle ANOVA mit SAS Zusätzlich Beispiele aus dem Buch von Kim und Timm Beispiel 4a (entspricht KT 3_3) Unterscheidung zw. unrestricted und restricted GLM Vergleich von PROC REG und PROC GLM Diskussion von SAS Type 1 error und Type 3 error Übung: Erkläre anhand des SAS Codes welche Tests mit PROC REG durchgeführt wurden, und warum diese mit den entsprechenden Tests der PROC GLM übereinstimmen. Entscheidend ist das Verständnis der Dummycodierung für die PROC REG 26

27 Nested design Zwei Faktoren, die sich in Hierarchie befinden, z. Bsp.: Schule Klasse Kaufhauskette Filiale Übung Gruppe usw. SAS: i.e. model y = a b(a) y ijk = µ + a i + b(a) ij + ε ijk Im wesentlichen funktioniert nested model genau so wie factorial model, allerdings wird faktor b nicht als main effekt geführt Oft von Interesse: Test zwischen Stufen von Faktor a 27

28 Nested Design mit SAS Beispiel 4b (entspricht KT 2_9) Beispiel für Nested Design Diskussion von daraus folgenden Kontrasten (PROC GLM) 28

29 3.4 MANOVA Multivariate Varianzanalyse, zunächst einstufig (Verallgemeinerung von Hotelling T 2 ) y... q metrische Variablen x... kategorielle Variable (Faktor) mit k Stufen Beispiel: y: Benzinverbrauch, Beschleunigung, Abgaswerte x: Automarke Frage: Unterscheiden sich Merkmale zwischen Automarken Messungen aller y-werte von mehreren (n i ) Autos pro Marke Modell: y ij = µ i + ɛ ij y ij = (y ij1,..., y ijq )... Vektor der j-ten Messung zur Stufe i µ i = (µ i1,..., µ iq )... Vektor der Mittelwerte ɛ ij = (ε ij1,..., ε ijq ) N (0, Σ) i.i.d. 29

30 MANOVA im Kontext des GLM Völlig analog zur einfaktoriellen ANOVA: y = Xµ + ε Bilde Design-Matrix wie für ANOVA, allerdings sind y und µ nun keine Vektoren sondern Matrizen laut voriger Folie sind y ij und µ i ja Vektoren der Dimension q y = (y 11,...,..., y 1n1,..., y k1,..., y knk ) X = 1 n1 0 n n1 0 n2 1 n n nk 0 nk... 1 nk, µ = (µ 1,..., µ k ), Verwende Theorie des multivariaten GLM Overall Test mit Wilk s Λ (oder Roy s θ, etc.) an Stelle von F -Test 30

31 Test auf Gleichheit der Effekte (Overall Test) H 0 : die Mittelwerte aller Messungen sind jeweils identisch H 0 : µ 1 = = µ k, H 1 : i, j, r : µ ir µ jr Streumatrizen (SM) als multivariate Verallgemeinerung von SSQ k B( ˆ=Q a )= n i (ȳ i. ȳ)(ȳ i. ȳ) Zwischen-Gruppen SM i=1 k n i W ( ˆ=Q e )= (y ij ȳ i. )(y ij ȳ i. ) Inner-Gruppen SM i=1 j=1 k n i T ( ˆ=Q t )= (ȳ ij ȳ)(y ij ȳ) Gesamt SM i=1 j=1 Wie im eindimensionalen gilt: T = B + W 31

32 Verteilung der SM Voraussetzung: ɛ ij = (ε ij1,..., ε ijq ) N (0, Σ) i.i.d. Unter H 0 sind SM Wishart-verteilt (vgl. Kapitel 1.2) W W q (Σ, N k), B W q (Σ, k 1) wobei W und B unabhängig (vgl. Freiheitsgrade von ANOVA!) Teststatistiken für Overall-Test analog zur Regression: Wilk s Λ: W / B + W Roy s θ : Größter EW von (B + W ) 1 B Lawley - Hotelling trace: etc. U = k λ i i=1 32

33 MANOVA Tabelle SM df Λ bzw. θ Zwischen B k 1 W / B + W = Q (1 + λ j ) 1 Innerhalb W N k θ = λ 1 /(1 + λ 1 ) Total T = B + W N 1 Λ und θ ergeben sich einfach als Spezialfall der allgemeinen linearen Hypothese für multivariate Regression Weitere Themen: Berechnung von allgemeinen Kontrasten wie in Kapitel 1.2, siehe auch Timm (Mult. Ana.): MANOVA im Rahmen der GLM Post Hoc Tests: nicht so standardisiert wie bei ANOVA, auch in SAS nicht implementiert (siehe aber Kim und Timm) Zusammenhang mit Diskriminanzanalyse 33

34 Beispiel MANOVA mit SAS SAS-Programm: Bsp8.sas (Bsp. 9.2 von SAS for Linear Models (Littel, Stroup, Freund) MANOVA mit SAS PROC GLM Speziell MANOVA statement, Contrast für MANOVA (speziell Hotelling s T 2 ) 34

35 3.5 ANCOVA / MANCOVA Analysis of Covariance: Mischung aus Regression und ANOVA y... metrische Variable x, z... k kategorielle und r metrische Faktoren Modell ohne Wechselwirkung: y = Xµ + Zγ + ɛ X... N p - Designmatrix der qualitativen Faktoren Bildung der Designmatrix wie bei ANOVA im GLM Z... N r - Matrix der quantitativen Faktoren (Kovariablen) Voraussetzungen: X und Z jeweils vollen Rang p bzw. r und linear unabhängig ε ij N (0, σi) Einfachster Spezialfall: k = r = 1, y ij = µ i + γz ij + ε ij 35

36 Ziele der ANCOVA - Untersuchung Regressionsanalytische Fragestellungen: 1. Interesse an Homogenität der γ i : y ij = µ i + γ i z ij + ε ij γ i = γ unabhängig von Gruppe keine WW Sollte vor jeder ANCOVA überprüft werden 2. Falls γ = 0 kann Kofaktor vernachlässigen Varianzanalytische Fragestellung: Falls γ i = γ: Gibt es Unterschiede zwischen Gruppen? Kofaktoren dienen im wesentlichen dazu, um Präzision zu erhöhen (Berücksichtigung von Faktoren, die im Versuchsdesign nicht kontrolliert werden konnten) Problem zu Beginn bereits als GLM formuliert Typisch für ANCOVA: zweistufige LS-Schätzung 36

37 Zweistufige LS-Schätzung Motivation: ỹ := y Zγ = Xµ + ε Schritt 1: Schätze ˆµ = (X X) 1 X y (klassische ANOVA) RSS = (y X ˆµ) (y X ˆµ) = y P y Schritt 2: Schätze γ: Ersetze y durch y Zγ und minimiere RSS ˆγ = (Z P Z) 1 Z P y ˆµ = (X X) 1 X (y Zˆγ ) Und die Residuenquadratsumme für das Gesamtmodell lautet Q e = (y Zˆγ ) P (y Zˆγ ) χ 2 (N p r) Vergleich mit RSS zeigt, wie weit Kofaktor Modell verbessert 37

38 Bemerkungen LSMEANS: Adjusted treatment means (aus Modell geschätzt) ˆµ i + ˆγ z = y i. ˆγ ( z i. z) Wie bei ANOVA wiederum die Möglichkeit für PostHoc Tests Speziell Methode von Scheffé MANCOVA: Übliche Vorgangsweise um GLM für multivariates y zu verallgemeinern: Streumatrizen anstelle von Quadratsummen Wilk s Λ an Stelle von F -Test etc. SAS PROC GLM wiederum mit Befehl MANOVA 38

39 Ausblick Mixed Models Bisher hatten kategorielle Variablen immer feste Effekte Im Gegensatz dazu stehen zufällige Effekte: Faktorstufe repräsentiert Auswahl aus größerer Gesamtheit y... metrische Variable x, z... jeweils kategorielle Faktoren Mixed Model: y = Xµ + Zγ + ɛ X... Designmatrix der festen Faktoren Z... Designmatrix der zufälligen Faktoren γ... Vektor der unbekannten zufälligen Effekte im Gegensatz dazu ist µ ein Vektor von festen Zahlen Wesentlich kompliziertere Theorie als GLM SAS PROC MIXED 39

40 ANCOVA mit SAS Datensatz KT_2_10.DAT SAS-Programm: Bsp7.sas Testen auf Wechselwirkung Eigentliche ANCOVA Post Hoc Tests (LSMEANS) MANCOVA mit SAS Zusätzlich Beispiel 5_12_1 aus Kim und Timm: Datensatz KT_5_12.DAT SAS-Programm: Bsp7a.sas 40

ANalysis Of VAriance (ANOVA) 2/2

ANalysis Of VAriance (ANOVA) 2/2 ANalysis Of VAriance (ANOVA) 2/2 Markus Kalisch 22.10.2014 1 Wdh: ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor X). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Prüfungsliteratur: Rudolf & Müller S

Prüfungsliteratur: Rudolf & Müller S 1 Beispiele zur univariaten Varianzanalyse Einfaktorielle Varianzanalyse (Wiederholung!) 3 Allgemeines lineares Modell 4 Zweifaktorielle Varianzanalyse 5 Multivariate Varianzanalyse 6 Varianzanalyse mit

Mehr

Eine Einführung in R: Varianzanalyse

Eine Einführung in R: Varianzanalyse Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2011 Bernd Klaus, Verena Zuber Das

Mehr

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3. Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Lineare Regression 1 Seminar für Statistik

Lineare Regression 1 Seminar für Statistik Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken

Mehr

Einführung in die Varianzanalyse mit SPSS

Einführung in die Varianzanalyse mit SPSS Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen

Mehr

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 6-6) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten 5.1. Einführung Einfaktorielle Varianzanalyse Überprüft die Auswirkung einer gestuften (s), unabhängigen Variable X, auch Faktor

Mehr

ANalysis Of VAriance (ANOVA) 1/2

ANalysis Of VAriance (ANOVA) 1/2 ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?

Mehr

Vergleich von Gruppen I

Vergleich von Gruppen I Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik

Mehr

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen Prof Dr Rainer Dahlhaus Statistik 1 Wintersemester 2016/2017 Vorbereitung auf Übungsblatt (Präsenzübungen) - Lösungen Aufgabe P9 (Prognosen und Konfidenzellipsoide in der linearen Regression) Wir rekapitulieren

Mehr

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten

Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten 5.1. Einführung Einfaktorielle Varianzanalyse Überprüft die Auswirkung einer gestuften (s), unabhängigen Variable X, auch Faktor

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse

Wahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse Wahrscheinlichkeitsrechnung und Statistik für Biologen Faktorielle Varianzanalyse Dirk Metzler & Martin Hutzenthaler 15. Juni 2010 Inhaltsverzeichnis 1 Die einfaktorielle Varianzanalyse und der F -Test

Mehr

THEMA: MAßGESCHNEIDERTE TESTS IN DER VARIANZANALYSE" TORSTEN SCHOLZ

THEMA: MAßGESCHNEIDERTE TESTS IN DER VARIANZANALYSE TORSTEN SCHOLZ WEBINAR@LUNCHTIME THEMA: MAßGESCHNEIDERTE TESTS IN DER VARIANZANALYSE" TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Messwiederholungen und abhängige Messungen

Messwiederholungen und abhängige Messungen Messwiederholungen und abhängige Messungen t Tests und Varianzanalysen für Messwiederholungen Kovarianzanalyse Thomas Schäfer SS 009 1 Messwiederholungen und abhängige Messungen Bei einer Messwiederholung

Mehr

Statistik-Team. Tobias Kley: Übung: Freitag, Uhr, HGA 10 Tutorium (SPSS) - ab

Statistik-Team. Tobias Kley: Übung: Freitag, Uhr, HGA 10 Tutorium (SPSS) - ab Statistik-Team Tobias Kley: tobikley@uni-muenster.de Übung: Freitag, 9.00-10.00 Uhr, HGA 10 Tutorium (SPSS) - ab 26.10.2009 Koordination: Dr. Helge Thiemann Helge.Thiemann-i5m@ruhr-uni-bochum.de 0234/

Mehr

Biometrische und Ökonometrische Methoden II Lösungen 1

Biometrische und Ökonometrische Methoden II Lösungen 1 TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN SS 01 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Biometrische und Ökonometrische Methoden II Lösungen 1 1. a) MTB > name c1 '100 mm'

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten

Mehr

Anwendungsaufgaben. Effektgröße bei df Zähler = df A = 1 und N = 40 (zu berechnen aus df Nenner ): Der aufgedeckte Effekt beträgt also etwa 23 %.

Anwendungsaufgaben. Effektgröße bei df Zähler = df A = 1 und N = 40 (zu berechnen aus df Nenner ): Der aufgedeckte Effekt beträgt also etwa 23 %. Anhang A: Lösungen der Aufgaben 39 beiden Kombinationen sehr hoch ist. (Dieses Ergebnis wäre aber in diesem Beispiel nicht plausibel.) 5. Der Faktor A und die Wechselwirkung werden signifikant: Lärm hat

Mehr

Tests einzelner linearer Hypothesen I

Tests einzelner linearer Hypothesen I 4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben

Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben Es wurden die Körpergrößen von 3 Versuchspersonen, sowie Alter und Geschlecht erhoben. (Jeweils Größen pro Faktorstufenkombination). (a)

Mehr

methodenlehre ll ALM und Mehrfaktorielle ANOVA Mehrfaktorielle ANOVA methodenlehre ll ALM und Mehrfaktorielle ANOVA

methodenlehre ll ALM und Mehrfaktorielle ANOVA Mehrfaktorielle ANOVA methodenlehre ll ALM und Mehrfaktorielle ANOVA 15.04.009 Das Allgemeine lineare Modell Post hoc Tests bei der ANOVA Mehrfatorielle ANOVA Thomas Schäfer SS 009 1 Das Allgemeine lineare Modell (ALM) Varianz als Schlüsselonzept "The main technical function

Mehr

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.

Mehr

Statistische Eigenschaften der OLS-Schätzer, Residuen,

Statistische Eigenschaften der OLS-Schätzer, Residuen, Statistische Eigenschaften der OLS-Schätzer, Residuen, Bestimmtheitsmaß Stichwörter: Interpretation des OLS-Schätzers Momente des OLS-Schätzers Gauss-Markov Theorem Residuen Schätzung von σ 2 Bestimmtheitsmaß

Mehr

Mehrfaktorielle Varianzanalyse

Mehrfaktorielle Varianzanalyse Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mehrfaktorielle Varianzanalyse Überblick Einführung Empirische F-Werte zu einer zweifaktoriellen

Mehr

6.2 Lineare Regression

6.2 Lineare Regression 6.2 Lineare Regression Einfache lineare Regression (vgl. Kap. 4.7) Y i = θ 0 + θ 1 X i + ǫ i ǫ i (0, σ 2 ) ˆθ 1 ˆθ 0 = S XY S 2 X = 1 ( Yi n ˆθ ) 1 Xi als Lösung der Minimumaufgabe n (Y i θ 1 X 1 θ 0 )

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter

Mehr

Statistik II für Betriebswirte Vorlesung 1

Statistik II für Betriebswirte Vorlesung 1 Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version:

Mehr

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 1. Aufgabe: Für 25 der größten Flughäfen wurde die Anzahl der abgefertigten Passagiere in den Jahren 2009 und 2012 erfasst. Aus den Daten (Anzahl

Mehr

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate 31 und 33 Das allgemeine (), Methode der kleinsten Quadrate 31 und (), Methode der Messwiederholungen 1 / 131 Eine grundsätzliche Bemerkung zu Beginn Es bestehen viele Ähnlichkeiten zwischen den bisher

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015 Hypothesentests für Erwartungswert und Median Statistik (Biol./Pharm./HST) FS 2015 Normalverteilung X N μ, σ 2 X ist normalverteilt mit Erwartungswert μ und Varianz σ 2 pdf: pdf cdf:??? cdf 1 Zentraler

Mehr

Einfache Varianzanalyse für unabhängige Stichproben

Einfache Varianzanalyse für unabhängige Stichproben Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe

Mehr

Auswertung und Lösung

Auswertung und Lösung Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr

Aufgaben zu Kapitel 7:

Aufgaben zu Kapitel 7: Aufgaben zu Kapitel 7: Aufgabe 1: In einer Klinik sollen zwei verschiedene Therapiemethoden miteinander verglichen werden. Zur Messung des Therapieerfolges werden die vorhandenen Symptome einmal vor Beginn

Mehr

Zweifache Varianzanalyse

Zweifache Varianzanalyse Zweifache Varianzanalyse Man kann mittels VA auch den (gleichzeitigen) Einfluss mehrerer Faktoren (unabhängige Variablen) auf ein bestimmtes Merkmal (abhängige Variable) analysieren. Die Wirkungen werden

Mehr

Die SAS-Prozedur MIXED

Die SAS-Prozedur MIXED Die SAS-Prozedur MIXED Hans-Peter Altenburg Deutsches Krebsforschungszentrum Heidelberg Inhalt: Prozedur MIXED verwandte SAS-Prozeduren: GLM, VARCOMP, NESTED Schätzverfahren Varianzkomponenten Syntax Beispiele

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536 fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (90 Minuten) Dr. M. Kalisch Probeprüfung Statistik 1 Sommer 2014 Schriftliche Prüfung (90 Minuten) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten!

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Kapitel 6: Zweifaktorielle Varianzanalyse

Kapitel 6: Zweifaktorielle Varianzanalyse Kapitel 6: Zweifaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung 1 Teststärkebestimmung a posteriori 4 Berechnen der Effektgröße f² aus empirischen Daten und Bestimmung

Mehr

6.4 Kointegration Definition

6.4 Kointegration Definition 6.4 Kointegration 6.4.1 Definition Nach Engle und Granger (1987): Wenn zwei oder mehrere Variablen I(1) sind, eine Linearkombination davon jedoch I() ist, dann sind die Variablen kointegriert. Allgemein:

Mehr

OLS-Schätzung: asymptotische Eigenschaften

OLS-Schätzung: asymptotische Eigenschaften OLS-Schätzung: asymptotische Eigenschaften Stichwörter: Konvergenz in Wahrscheinlichkeit Konvergenz in Verteilung Konsistenz asymptotische Verteilungen nicht-normalverteilte Störgrößen zufällige Regressoren

Mehr

Statistik II Übung 3: Hypothesentests

Statistik II Übung 3: Hypothesentests Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Auswertung von Wertprüfungsbonituren (U. Meyer, Bundessortenamt)

Auswertung von Wertprüfungsbonituren (U. Meyer, Bundessortenamt) Auswertung von Wertprüfungsbonituren (U. Meyer, Bundessortenamt) - Ziel - Daten - Modell - Methoden - Ergebnisse - Schlussfolgerungen 1 Referat 111 Ziel Prüfung der Anwendbarkeit verfügbarer Methoden für

Mehr

Einführung in die Induktive Statistik: Varianzanalyse

Einführung in die Induktive Statistik: Varianzanalyse Einführung in die Induktive Statistik: Varianzanalyse Jörg Drechsler LMU München Wintersemester 2011/2012 Varianzanalyse bisher: Vergleich der Erwartungswerte für zwei normalverteilte Variablen durch t-test

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen Vorlesung: Multivariate Statistik für Psychologen 8. Vorlesung: 08.05.003 was man/frau schon immer wissen wollte I Interpolation und Extrapolation Schlussfolgerung auf erwarteten Wert einer Person aufgrund

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Welche(s) Paar(e) ist(sind) denn nun signifikant verschieden?

Welche(s) Paar(e) ist(sind) denn nun signifikant verschieden? Welche(s) Paar(e) ist(sind) denn nun signifikant verschieden? Der F-Test der Varianzanalyse erlaubt lediglich eine Existenzaussage über ein Paar (i,j) mit µ i µ j zum einem Niveau α. In der Praxis interessiert

Mehr

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

4. Verteilungen von Funktionen von Zufallsvariablen

4. Verteilungen von Funktionen von Zufallsvariablen 4. Verteilungen von Funktionen von Zufallsvariablen Allgemeine Problemstellung: Gegeben sei die gemeinsame Verteilung der ZV en X 1,..., X n (d.h. bekannt seien f X1,...,X n bzw. F X1,...,X n ) Wir betrachten

Mehr

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014 Signifikanzprüfung Peter Wilhelm Herbstsemester 2014 1.) Auswahl des passenden Tests 2.) Begründete Festlegung des Alpha- Fehlers nach Abschätzung der Power 3.) Überprüfung der Voraussetzungen 4.) Durchführung

Mehr

Übung Methodenlehre II, SS 2010

Übung Methodenlehre II, SS 2010 nlehre II nlehre II, Anwendungsbeispiel 1 Ruhr-Universität Bochum 15. Juni 2010 1 / 21 Quelle nlehre II Mobbing und Persönlichkeit: Unterschiede in grundlegenden Persönlichkeitsdimensionen zwischen Betroffenen

Mehr

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des. Einfatorielle Varianzanalyse Varianzanalyse untersucht den Einfluss verschiedener Bedingungen ( = nominalsalierte(r) Variable(r)) auf eine metrische Variable. Die Bedingungen heißen auch atoren und ihre

Mehr

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest. Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Metrische und kategoriale Merkmale

Metrische und kategoriale Merkmale Kapitel 6 Metrische und kategoriale Merkmale 6.1 Wie kann man metrische und kategoriale Merkmale numerisch beschreiben? Typischerweise will man geeignete Maßzahlen (beispielsweise Lage- oder Streuungsmaße)

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 6.. Herleitung des OLS-Schätzers

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

1 Diskriminanzanalyse

1 Diskriminanzanalyse Multivariate Lineare Modelle SS 2008 1 Diskriminanzanalyse 1. Entscheidungstheorie 2. DA für normalverteilte Merkmale 3. DA nach Fisher 1 Problemstellungen Jedes Subjekt kann einer von g Gruppen angehören

Mehr

Wiederholung. Seminar für Statistik

Wiederholung. Seminar für Statistik Wiederholung 17.12.2014 1 Prüfung: 2 Kohorten 2 Kohorten alphabetisch nach Nachname sortiert: Kohorte 1: A bis und mit Müller Kohorte 2: Müllhaupt bis und mit Z 17.12.2014 2 Prüfung: 2 Kohorten Kohorte

Mehr