Interaktion unter Berücksichtigung des Skalenniveaus der Prädiktoren Dr. Markus Stöcklin, Universität Basel, Fakultät für Psychologie

Transkript

1 Interaktion unter Berücksichtigung des Skalenniveaus der Prädiktoren Dr. Markus Stöcklin, Universität Basel, Fakultät für Psychologie 1 Einleitung 3 2 Modell mit 0-1 kodierten nominalen Prädiktoren X 1 und X 2 sowie X 1. X Regressionsanalytische Berechnung der ANOVA mit Typ III Quadratsummen Variante mit Kontrastkodierung 10 3 Modell mit 0-1 kodiertem nominalem Prädiktor X 1, intervallskaliertem Prädiktor X 2 sowie X 1. X Regressionsanalytische Berechnung der ANOVA mit Typ III Quadratsummen 14 4 Modell mit intervallskalierten Prädiktoren X 1 und X 2 sowie X 1. X Variablentransformation ohne Einfluss auf den Regressionskoeffizienten der Interaktion 21 6 Statistische Gleichheit von Interaktionen Varianzanalyse Kovarianzanalyse Multiple Regression mit intervallskalierten Prädiktoren 30 1" 2"

2 1 Einleitung Modelle mit Interaktion enthalten Produkte von Prädiktoren. Jeder an einem Produkt beteiligte Prädiktor muss auch einzeln im Modell enthalten sein. Ausgehend vom einfachst möglichen Modell mit den Prädiktoren X 1, X 2 und X 1. X 2 soll untersucht werden, was Interaktionen bedeuten. Modellgleichung: umgeformt: ŷ = B ŷ = B ( ) ŷ = B 0 + ( ) + Die umgeformten Regressionsgleichungen zeigen, dass die Stärke des Einflusses von X 2 linear von X 1 und die Stärke des Einflusses von X 1 linear von X 2 abhängt. 3" Die Darstellung und die Interpretation von Interaktionen hängt vom Skalenniveau der Prädiktoren ab. Die Grafiken zeigen die Bedeutung der Regressionskoeffizienten. Es ist zu beachten, dass diese Bedeutung von der Kodierung der Faktoren abhängt. Die in den folgenden Beispielen verwendeten nominalen Prädiktoren (Faktoren) enthalten nur zwei Stufen, die mit 0 und 1 kodiert sind (Dummy-Kodierung). Varianzanalytische Designs mit mehr als zwei Stufen pro Faktor werden in den Folien "Regressionsanalytische Darstellung von Kontrasten" behandelt. X 1 und X 2 Faktoren mit Stufen (0, 1) X 1 Faktor mit Stufen (0, 1) X 2 intervallskaliert X 1 und X 2 intervallskaliert X 1 : = 0 = 1 X 1 : 0 1 +B 3 Steigung: +B 3 X 1 +B 3 +B 3 Steigung B B 0 + B 0 X 2 X 2 B 0 - /B 3 B 0 + X 1 - / X 2 4"

3 Jeden dieser drei Fälle gehen wir anhand eines Beispieldatensatzes durch. Zuerst werden mit Hilfe der multiplen Regression die Regressionskoeffizienten geschätzt und auf Signifikanz getestet. Die Bedeutung der Regressionskoeffizienten wird anhand des Interaktionsplots illustriert. Um die inhaltsbezogene Interpretation der Effekte intuitiver zu gestalten, geben wir den Variablen nachvollziehbare Bedeutungen. Wenn das Modell nominale Prädiktoren enthält, werden die Effekte in der Praxis häufig varianzanalytisch getestet. Aus diesem Grund rechnen wir für diese Fälle auch eine ANOVA. Der direkte Vergleich der Signifikanztests zeigt, dass die Ergebnisse der Haupteffekte zum Teil nicht übereinstimmen. Dies hängt mit der Kodierung der nominalen Variablen zusammen. Bei intervallskalierten Prädiktoren macht es einen Unterschied, ob sie mittelwertzentriert sind oder nicht. Es lässt sich zeigen, dass sich die Quadratsummen der ANOVA durch geeignete Vergleiche von Regressionsmodellen berechnen lassen. Die ANOVAs werden mit Quadratsummenzerlegung Typ III gerechnet. Bei dieser Variante werden bei der Berechnung der Quadratsumme eines Effektes zuerst alle andern Effekte herauspartialisiert. Interaktionen können sehr verschieden aussehen und trotzdem statisch gleich sein. Wir werden dies an einigen Beispielen illustrieren. Der Vergleich von Interaktionen ist bei dreifaktoriellen ANOVAs wichtig. Wenn die Interaktion zweiter Ordnung signifikant ist, unterscheiden sich gewisse Interaktionen erster Ordnung. Es kann aber auch sein, dass die Interaktion zweiter Ordnung nicht signifikant ist, obwohl die Interaktionen erster Ordnung sehr verschieden aussehen. 5" 6"

4 2 Modell mit 0-1 kodierten nominalen Prädiktoren X 1 und X 2 sowie X 1. X 2 # Datensatz X1 <- rep(c(0,1,0,1), each=8) X2 <- rep(c(0,1), each=16) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data <- data.frame(x1, X2, ) # Signifikanzteststs # Regressionsanalytisch getestete Effekte # Interaktionsterm data$x1.x2 <- data$x1*data$x2 # Multiple Regression m <- lm(~x1+x2+x1.x2, data) summary(m) # Varianzanalyse mit Typ III Quadratsummen data$block <- 1:nrow(data) library(afex) aov_ez(id="block", dv="", data=data, between=c("x1","x2"), return="anova") Hinweis: Der Unterschied in den p-werten für X 1 und X 2 kommt daher, dass bei der Regressionsanalyse der Effekt von X 1 ( ) für Stufe 0 von X 2 und der Effekt von X 2 ( ) für Stufe 0 von X 1 getestet wird, vgl. Folie 8. Bei der ANOVA wird der mittlere Effekt von X 1 über beide Stufen von X 2 und der mittlere Effekt von X 2 über beide Stufen von X 1 getestet. Wenn man für die nominalen Variablen die Kontrastkodierung wählt, stimmen die p-werte überein. Multiple Regression Call: lm(formula = ~ X1 + X2 + X1.X2, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** X X * X1.X * --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 28 degrees of freedom Multiple R-squared: 0.664, Adjusted R-squared: F-statistic: on 3 and 28 DF, p-value: 8.392e-07 Varianzanalyse Anova Table (Type III tests) Response: dv (Intercept) < 2.2e-16 *** X *** X e-06 *** X1:X * Residuals Signif. codes: 0 *** ** 0.01 * " ŷ = B Regressionsanalyse: ŷ = B ( ) Interpretation: X 2 (0=Placebo, 1=Medikament), ŷ = B 0 + ( ) + X 1 (0=Kontroll, 1=Therapie), =Wirkung Regressionsanalyse: Für die Probanden in der Placebobedingung (X 2 =0) beträgt der Unterschied y 11 zwischen den Therapierten und den Nicht-Therapierten 20 =1. Für die Probanden in der Kontrollgruppe (X 1 =0) beträgt der Unterschied zwischen denjenigen mit Medikament und denjenigen mit Placebo =2. Mit B Medikament (X 2 =1) ist der Unterschied zwischen 1 +B 3 B Therapie- und Kontrollbedingung um B X1 3 =3 grösser als in 2 +B der Placebobedingung (X 2 =0). Oder: In der 1 Therapiebedingung (X 1 =1) ist der Unterschied zwischen y Medikament und Placebo um B 3 =3 grösser als als in der 01 Kontrollbedingung (X 1 =0). ANOVA: Die Mittelwerte der Placebo- und der y 10 Medikamentengruppe sind verschieden (QS 16 X2 ). Die Mittelwerte der Kontroll- und der Therapiegruppe sind y verschieden (QS X1 ). Der Unterschied zwischen Placebo- 00 B und Medikamentengruppe ist für die Kontrollgruppe nicht gleich wie für die Therapiegruppe. Oder: Der X2 Unterschied zwischen Kontroll- und Therapiegruppe ist für die Placebogruppe nicht gleich wie für die y 00 = B 0 B 0 = y 00 Medikamentengruppe (QS X1X2 ). y 01 = B 0 + = y 10 y 00 y 10 = B 0 + y 11 = B = y 01 y 00 B 3 = y 11 y 10 y 01 + y 00 8"

5 2.1 Regressionsanalytische Berechnung der ANOVA mit Typ III Quadratsummen Nominale Variablen müssen vom Typ "factor" sein. Nominale Variablen müssen durch Kontrast-Indikatorvariablen ersetzt werden. Der Ausdruck "X1*X2" bedeutet "X1 + X2 + X1:X2", d.h. Haupteffekt "X1" + Haupteffekt "X2" + Interaktion "X1:X2". Die Funktion "dropl" rechnet folgende drei Modelle: (1) lm(~x2 + X1:X2, data) (2) lm(~x1 + X1:X2, data) (3) lm(~x1 + X2, data) Jedes dieser Modelle wird gegen das Gesamtmodell "lm(~x1*x2, data)" getestet. Modell (1) vs. Gesamtmodell ergibt den Test für "X1", Modell (2) vs. Gesamtmodell den Test für "X2" und Modell (3) vs. Gesamtmodell den Test für "X1:X2". data$x1 <- as.factor(data$x1) data$x2 <- as.factor(data$x2) options(contrasts = c("contr.sum","contr.poly")) model <- lm(~x1*x2, data=data) drop1(model,.~., test="f") Regressionsanalytisch berechnet Single term deletions Model: ~ X1 * X2 Df Sum of Sq RSS AIC F value Pr(>F) <none> X *** X e-06 *** X1:X * --- Signif. codes: 0 *** ** 0.01 * Vergleich mit Varianzanalyse (Intercept) < 2.2e-16 *** X *** X e-06 *** X1:X * Residuals " 2.2 Variante mit Kontrastkodierung X 2 (-1=Placebo, 1=Medikament), X 1 (-1=Kontroll, 1=Therapie), =Wirkung # Datensatz X1 <- rep(c(-1,1,-1,1), each=8) X2 <- rep(c(-1,1), each=16) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data <- data.frame(x1, X2, ) # Signifikanzteststs # Regressionsanalytisch getestete Effekte # Interaktionsterm data$x1.x2 <- data$x1*data$x2 # Multiple Regression m <- lm(~x1+x2+x1.x2, data) summary(m) Regressionsanalyse: B 0 =17.25 entspricht dem Gesamtmittelwert, =1.25 der Hälfte des Unterschiedes zwischen Therapie- und Kontrollgruppe und =1.75 der Hälfte des Unterschiedes zwischen Medikamenten- und Placebogruppe. B 3 =0.75 entspricht der Hälfte des Unterschiedes der Nützlichkeit des Medikaments gegenüber Placebo in der Therapiegruppe verglichen mit der Kontrollgruppe. Oder: Die Hälfte des Unterschiedes der Nützlichkeit der Therapiegegenüber der Kontrollbedingung in der Medikamentengruppe verglichen mit der Placebogruppe. Die p-werte stimmen mit denjenigen der ANOVA überein. Multiple Regression Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** X *** X e-06 *** X1.X * 20 Mittelwert Therapie 18 Gesamtmittelwert: B 0 16 Mittelwert Placebo y 1 1 y 1 1 y 1 1 = B 0 y 11 = B 0 + B 3 y 1 1 = B 0 + B 3 y 11 = B X2 y 11 y 11 B 3 Mittelwert Medikament X1 ( ) 4 ( ) 4 ( ) 4 ( ) 4 B 0 = y y 11 + y y 11 = y 1 1 y 11 + y y 11 = y y 11 y y 11 B 3 = y 1 1 y 11 y y 11-1 Mittelwert Kontroll 1 10"

6 3 Modell mit 0-1 kodiertem nominalem Prädiktor X 1, intervallskaliertem Prädiktor X 2 sowie X 1. X 2 Damit und eine sinnvolle Bedeutung haben, sollte man im Rahmen einer Regressionsanalyse mit Interaktionen die intervallskalierten Prädiktoren mittelwertzentrieren. In unserem Beispiel sollte X 2 mittelwertzentriert sein. Ohne Mittelwertzentrierung gibt an, um wie viel ändert, wenn X 1 um 1 zunimmt und X 2 =0 ist, d.h. ist die Stärke des Effektes von X 1 wenn X 2 =0 ist. In den Sozialwissenschaften haben intervallskalierte Prädiktorvariablen häufig keinen sinnvoll interpretierbaren Nullpunkt. In solchen Fällen hat keine praktische Bedeutung. Eine Variable wird mittelwertzentriert, indem man von jedem Messwert den Mittelwert der Variable subtrahiert. Das hat zur Folge, dass der Mittelwert von mittelwertzentrierten Variablen Null ist. Mit Mittelwertzentrierung gibt an, um wie viel ändert, wenn X 1 um 1 zunimmt und X 2 gleich dem Mittelwert von X 2 ist. entspricht dem über alle Werte von X 2 gemittelten Regressionskoeffizienten für den Zusammenhang zwischen X 1 und. Wenn man standardisierte Regressionskoeffizienten berechnen will, muss man die Prädiktoren zuerst standardisieren und für die Interaktionen Variablen mit den Produkten der entsprechenden standardisierten Prädiktoren bilden. Das mit diesen Variablen spezifizierte Modell liefert die korrekten standardisierten Regressionskoeffizienten für die Interaktionsterme. Gewisse Statistikprogramme (z.b. SPSS) geben nebst den unstandardisierten auch die standardisierten Regressionskoeffizienten aus. Für die Berechnung der standardisierten Regressionskoeffizienten wird jeder Prädiktor standardisiert, also auch die aus den Produkten der Originalvariablen gebildeten Interaktionsterme, was jedoch nicht korrekt ist. 11" # Datensatz X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- rep(c(0,1), each=20) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data <- data.frame(x1, X2, ) # Signifikanzteststs # Regressionsanalytisch getestete Effekte # Mittelwertzentrierung von X2 data$x2 <- data$x2-mean(data$x2) # Interaktionsterm data$x1.x2 <- data$x1*data$x2 # Multiple Regression m <- lm(~x1+x2+x1.x2, data) summary(m) # Kovarianzanalyse mit Typ III Quadratsummen data$x1 <- as.factor(data$x1) library(car) Anova(lm(~X1*x2, data=data, contrasts=list(x1=contr.sum)), type=3) Multiple Regression Call: lm(formula = ~ X1 + x2 + X1.x2, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** X e-05 *** x X1.x * --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 36 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 36 DF, p-value: 2.089e-06 Kovarianzanalyse Mit der Funktion aov_ez() lassen sich keine Interaktionen zwischen Faktoren und Kovariablen testen. Deshalb verwenden wir die Funktion Anova(). Hinweis: Anova Table (Type III tests) Da bei der Regressionsanalyse der Response: Effekt von X 2 für Stufe 0 von X 1 (Intercept) < 2.2e-16 *** und bei der ANCOVA der mittlere X e-05 *** Effekt von X 2 über beide Stufen von x *** X X1:x * 1 getestet wird, sind die p-werte Residuals für X 2 verschieden. 12"

7 Interpretation für: X 2 = IQ, X 1 (0=kontroll, 1=treatment), =Leistung Regressionsanalyse: Beim Gesamtmittelwert des IQ (X 2 =0) ist die Leistung der Treatment-Gruppe (X 1 =1) um =4 höher als die Leistung der Kontrollgruppe (X 1 =0). Für die Probanden in der Kontrollgruppe (X 1 = 0 ) b e t r ä g t d e r Regressionskoeffizient für den Zusammenhang zwischen IQ und Leistung =0.04. Bei der Treatment-Gruppe (X 1 =1) ist der Regressionskoeffizient um B 3 =0.12 höher als bei der Kontrollgruppe (X 1 =0). Oder: Der Unterschied zwischen Treatment- und Kontrollgruppe nimmt mit dem IQ zu ( X 2 ). X 1. ANCOVA: Es besteht ein über die beiden Gruppen gemittelter Zusammenhang zischen IQ und Leistung (QS X2 ). Beim Gesamtmittelwert des IQ sind die Mittelwerte der Kontroll- und der Treatment-Gruppe verschieden (QS X1 ). Der Zusammenhang zwischen IQ und Leistung ist für die beiden Gruppe verschieden. Oder: Der Unterschied zwischen den beiden Gruppen hängt vom IQ ab (QS X1X2 ). Regressionsanalyse: ŷ = B ŷ = B ( ) ŷ = B 0 + ( ) X2 X 2 mittelwertzentriert +B 3 Steigung X " 3.1 Regressionsanalytische Berechnung der ANCOVA mit Typ III Quadratsummen Nominale Variablen müssen vom Typ "factor" sein. Nominale Variablen müssen durch Kontrast-Indikatorvariablen ersetzt werden. Der Ausdruck "X1*x2" bedeutet "X1 + x2 + X1:x2", d.h. Haupteffekt "X1" + Haupteffekt "x2" + Interaktion "X1:x2". Die Funktion "dropl" rechnet folgende drei Modelle: (1) lm(~x2 + X1:x2, data) (2) lm(~x1 + X1:x2, data) (3) lm(~x1 + x2, data) Jedes dieser Modelle wird gegen das Gesamtmodell "lm(~x1*x2, data)" getestet. Modell (1) vs. Gesamtmodell ergibt den Test für "X1", Modell (2) vs. Gesamtmodell den Test für "x2" und Modell (3) vs. Gesamtmodell den Test für "X1:x2". options(contrasts = c("contr.sum","contr.poly")) model <- lm(~x1*x2, data=data) drop1(model,.~., test="f") Regressionsanalytisch berechnet Single term deletions Model: ~ X1 * x2 Df Sum of Sq RSS AIC F value Pr(>F) <none> X e-05 *** x *** X1:x * --- Signif. codes: 0 *** ** 0.01 * Vergleich mit Kovarianzanalyse (Intercept) < 2.2e-16 *** X e-05 *** x *** X1:x * Residuals "

8 4 Modell mit intervallskalierten Prädiktoren X 1 und X 2 sowie X 1. X 2 Damit und eine sinnvolle Bedeutung haben, sollte man im Rahmen einer Regressionsanalyse mit Interaktionen die Prädiktoren mittelwertzentrieren. Ohne Mittelwertzentrierung gibt an, um wie viel ändert, wenn X 1 um 1 zunimmt und X 2 =0 ist, d.h. ist die Stärke des Effektes von X 1 wenn X 2 =0 ist. In den Sozialwissenschaften haben intervallskalierte Prädiktorvariablen häufig keinen sinnvoll interpretierbaren Nullpunkt, so dass keine praktische Bedeutung hat. Eine Variable wird mittelwertzentriert, indem man von jedem Messwert den Mittelwert der Variable subtrahiert. Das hat zur Folge, dass der Mittelwert von mittelwertzentrierten Variablen ist Null ist. Für mittelwertzentrierte Prädiktoren ist die Stärke des Effektes von X 1 beim Mittelwert von X 2 oder der mittlere Effekt von X 1 über alle Werte von X 2. Entsprechend für. Diese Interpretation hat eine praktische Bedeutung. Für mittelwertzentrierte Prädiktoren erhält man in der Regel andere Werte für und und auch andere Signifikanztests als für nicht mittelwertzentrierte. Der Regressionskoeffizient und der Signifikanztest der Interaktion höchster Ordnung ändern nicht. Wenn im Modell keine Interaktionen vorhanden sind, muss nicht mittelwertzentriert werden, da beide Varianten - ausser dem Schätzwert für B 0 - übereinstimmen. Wenn man standardisierte Regressionskoeffizienten berechnen will, muss man die Prädiktoren zuerst standardisieren und für die Interaktionen Variablen mit den Produkten der entsprechenden standardisierten Prädiktoren bilden. Das mit diesen Variablen spezifizierte Modell liefert die korrekten standardisierten Regressionskoeffizienten für die Interaktionsterme. Gewisse Statistikprogramme (z.b. SPSS) geben nebst den unstandardisierten auch die standardisierten Regressionskoeffizienten aus. Für die Berechnung der standardisierten Regressionskoeffizienten wird jeder Prädiktor standardisiert, also auch die aus den Produkten der Originalvariablen gebildeten Interaktionsterme, was jedoch nicht korrekt ist. Die Mittelwertzentrierung reduziert Multikollinearitätseffekte. Es wird stark empfohlen, im Fall von Interaktionen mittelwertzentrierte Prädiktoren zu verwenden. 15" # Datensatz X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data <- data.frame(x1, X2, ) # Signifikanzteststs # Mittelwertzentrierte Prädiktoren data$x1 <- data$x1 - mean(data$x1) data$x2 <- data$x2 - mean(data$x2) # Interaktionsterm data$x1.x2 <- data$x1*data$x2 # Multiple Regression summary(lm(~x1+x2+x1.x2, data)) Multiple Regression mit mittelwertzentrierten Prädiktoren Call: lm(formula = ~ x1 + x2 + x1.x2, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** x ** x * x1.x e-08 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: 3.07 on 46 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 46 DF, p-value: 3.199e-10 Interpretation für: X 2 = IQ, X 1 Motivation, =Leistung Beim Mittelwert der Motivation (X 1 =0) beträgt der Regressionskoeffizient für den Zusammenhang zwischen IQ und Leistung = Beim Mittelwert des IQ (X 2 =0) beträgt der Regressionskoeffizient für den Zusammenhang zwischen Motivation und Leistung = Der Regressionskoeffizient für den Zusammenhang zwischen IQ und Leistung nimmt mit der Motivation zu ( X 1 ). X 2. Oder: Der Regressionskoeffizient für den Zusammenhang zwischen Motivation und Leistung nimmt mit dem IQ zu ( X 2 ). X 1. 16"

9 3D-Streudiagramm mit Plot der Regressionsfunktion (mittelwertzentrierte Prädiktoren) Die Linien sind Regressionsgeraden für den Zusammenhang zwischen X 2 und gegeben X 1 und den Zusammenhang zwischen X 1 und gegeben X 2. Zusätzlich sind die Regressionskoeffizienten für X 1 gegeben X 2 und X 2 gegeben X 1 angegeben. +B 3. X 1 +B 3. X 2 +B 3. X 1 +B 3. X 2 X 2 mittelwertzentriert X 1 mittelwertzentriert 17" # Signifikanzteststs # Nicht mittelwertzentrierte Prädiktoren data$x1.x2 <- data$x1*data$x2 summary(lm(~x1+x2+x1.x2, data)) Multiple Regression mit nicht mittelwertzentrierten Prädiktoren Call: lm(formula = ~ X1 + X2 + X1.X2, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-08 *** X e-07 *** X e-07 *** X1.X e-08 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: 3.07 on 46 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 46 DF, p-value: 3.199e-10 18"

10 3D-Streudiagramm mit Plot der Regressionsfunktion (nicht mittelwertzentriert) Die Linien sind Regressionsgeraden für den Zusammenhang zwischen X 2 und gegeben X 1 und den Zusammenhang zwischen X 1 und gegeben X 2. X2 X1 19" 20"

11 5 Variablentransformation ohne Einfluss auf den Regressionskoeffizienten der Interaktion Wenn man die Werte eines Prädiktors um einen konstanten Wert erhöht oder verringert, ändert dies nichts am Regressionskoeffizienten der Interaktion höchster Ordnung. Dies lässt sich anhand der Regressionsgleichung zeigen: ŷ = B (1) Nun generieren wir eine neue Regressionsgleichung, indem wir anstelle von X 1 X 1 +k einsetzen: ŷ = B 0 + ( X 1 + k) + ( X 1 + k) (2) Durch Umformung erhalten wir: ŷ = B 0 + k + + ( k) (3) Aus (3) erhalten wir die neuen Regressionskoeffizienten b 0 =B 0 +. k, b 1 =, b 2 = +B 3. k und b 3 =B 3. ŷ = b 0 + b 1 + b 2 + b 3 (4) Die Regressionskoeffizienten von X 1 und X 1. X 2 haben nicht geändert. Wenn zugleich auch X 2 additiv transformiert wird, ändern die Regressionskoeffizienten von X 1 und X 2, derjenige der Interaktion X 1. X 2 jedoch nicht. Die Mittelwertzentrierung ist ein Beispiel für diese Transformation. 21" 22"

12 6 Statistische Gleichheit von Interaktionen 6.1 Varianzanalyse Interaktionen können zwar auf den ersten Blick sehr verschieden aussehen, statistisch aber gleiche F-Werte und gleiche p-werte haben. Der F- und der p-wert der Interaktion eines ausbalancierten zweifaktoriellen Designs ändert nicht, wenn man die Mittelwerte einer Stufe eines Faktors um einen konstanten Wert erhöht oder verringert. Der Interaktionseffekt (ab) jk für Zelle jk des Designs ergibt sich aus dem Zelleffekt [ab] jk abzüglich der Haupteffekte von für Stufe j von Faktor A und Stufe k von Faktor B. ( ab) jk = [ ab] jk a j b k = ( jk.. ) ( j... ) (.k.. ) = jk j..k +.. Nun schauen wir, wie sich die Interaktionseffekte verhalten, wenn wir zu jedem Zellmittelwert der Stufe k von Faktor B die Konstante C addieren.! B k! B K Randmittel A ! 1k + C! 1K 1. + C A ! 2k + C! 2K 2. + C " " " " " " A j j1 j2! jk + C! jk j. + C " " " " " " A J J1 J1! Jk + C! JK K. + C Randmittel.1.2.k + C.K.. + C ' ( ) jk ( ) ( j. + C).k + C ( ) + (.. + C) = jk j..k +.. = ab ( ) jk Interaktionseffekte: ab = jk + C Daraus folgt: Die Interaktionseffekte ändern nicht. 23" Wir illustrieren diesen Sachverhalt anhand von drei Datensätzen. Zuerst vergleichen wir die Interaktionsplots und anschliessend die varianzanalytischen Ergebnisse. # Datensätze # Datensatz 1 A <- rep(rep(c("a1","a2","a3"), each=6), 2) B <- rep(c("b1","b2"), each=18) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data1 <- data.frame(block=1:36, A, B, ) # Datensatz 2 A <- rep(rep(c("a1","a2","a3"), each=6), 2) B <- rep(c("b1","b2"), each=18) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data2 <- data.frame(block=1:36, A, B, ) # Datensatz 3 A <- rep(rep(c("a1","a2","a3"), each=6), 2) B <- rep(c("b1","b2"), each=18) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data3 <- data.frame(block=1:36, A, B, ) # Zusammengefügter Datensatz data <- rbind(data1, data2, data3) data$block <- 1:nrow(data) C <- rep(c("c1", "C2", "C3"), each=36) data$c <- C 24"

13 Interaktionsplots Obwohl die Interaktionen sehr verschieden aussehen, sind ihre Signifikanztests identisch. Im Plot links ist jeweils rot angedeutet, durch welche Transformation man zum Plot rechts kommt. Bei der ersten Transformation werden die Mittelwerte von Stufe A1 um 2 erhöht. Bei der zweiten Transformation werden die Mittelwerte von um 1.5 erhöht und diejenigen von um 1.5 verringert. Die Transformationen können auch verkettet werden. 6 Datensatz 1 Datensatz 2 Datensatz 3 C1 C2 C3 5 4 B B1 B2 3 2 A1 A2 A3 A1 A2 A3 A1 A2 A3 A 25" Varianzanalysen Die Signifikanztests für die Interaktion sind bei allen zweifaktoriellen ANOVAs identisch. Deshalb ist die Interaktion zweiter Ordnung der dreifaktoriellen ANOVA nicht signifikant: p-wert=1, was auf den ersten Blick erstaunt. # Datensatz 1 library(afex) aov_ez(id="block", dv="", data=data1, between=c("a", "B"), return="anova") # Datensatz 2 aov_ez(id="block", dv="", data=data2, between=c("a", "B"), return="anova") # Datensatz 3 aov_ez(id="block", dv="", data=data3, between=c("a", "B"), return="anova") # Zusammengefügter Datensatz aov_ez(id="block", dv="", data=data, between=c("a", "B", "C"), return="anova") Ergebnisse Datensatz 1 (Intercept) < 2.2e-16 *** A ** ** A:B Residuals Datensatz 2 (Intercept) < 2.2e-16 *** A ** A:B Residuals Datensatz 3 (Intercept) < 2.2e-16 *** A ** A:B Residuals Dreifaktorielle ANOVA (Intercept) < 2.2e-16 *** A * C A: ** A:C * B:C e-06 *** A:B:C Residuals "

14 6.2 Kovarianzanalyse Bei der einfaktoriellen ANCOVA ändert die Interaktion nicht, wenn man die Zellmittelwerte ändert und sonst alles gleich lässt, oder wenn die Regressionskoeffizienten um einen konstanten Wert erhöht oder verringert werden und die Residuen gleich bleiben. Wir illustrieren diesen Sachverhalt anhand von drei Datensätzen. # Datensätze # Datensatz 1 X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- rep(c(0,1), each=20) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data1 <- data.frame(x1, X2, ) # Mittelwertzentrierung von X2 data1$x2 <- data1$x2-mean(data1$x2) # Datensatz 2 X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- rep(c(0,1), each=20) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data2 <- data.frame(x1, X2, ) # Mittelwertzentrierung von X2 data2$x2 <- data2$x2-mean(data2$x2) # Datensatz 3 X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- rep(c(0,1), each=20) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data3 <- data.frame(x1, X2, ) # Mittelwertzentrierung von X2 data3$x2 <- data3$x2-mean(data2$x2) 27" Interaktionsplots Veränderung von Datensatz 1 zu 2: Der Mittelwert der Gruppe X 1 =1 wird auf 20 gesetzt, die Residuen bleiben gleich. Veränderung von Datensatz 2 zu 3: Die beiden Regressionskoeffizienten werden um 0.16 reduziert, die Residuen bleiben gleich. Datensatz 1 Datensatz 2 Datensatz X X X X2 X 2 mittelwertzentriert X 2 mittelwertzentriert X 2 mittelwertzentriert 28"

15 Varianzanalysen # Datensatz 1 data1$x1 <- as.factor(data1$x1) library(car) Anova(lm(~X1*x2, data=data1, contrasts=list(x1=contr.sum)), type=3) # Datensatz 2 data2$x1 <- as.factor(data2$x1) Anova(lm(~X1*x2, data=data2, contrasts=list(x1=contr.sum)), type=3) # Datensatz 3 data3$x1 <- as.factor(data3$x1) Anova(lm(~X1*x2, data=data3, contrasts=list(x1=contr.sum)), type=3) Ergebnisse Datensatz 1 (Intercept) < 2.2e-16 *** X e-05 *** x *** X1:x * Residuals Datensatz 2 (Intercept) < 2.2e-16 *** X x *** X1:x * Residuals Datensatz 3 (Intercept) < 2e-16 *** X x * X1:x * Residuals " 6.3 Multiple Regression mit intervallskalierten Prädiktoren Der Regressionskoeffizient für die Interaktion ändert nicht, wenn entweder +B 3. X 2 und/oder +B 3. X 1 additiv um einen konstanten Wert erhöht oder verringert werden und die Residuen gleich bleiben (vgl. Folie 31). # Datensätze # Datensatz 1 X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data1 <- data.frame(x1, X2, ) # Mittelwertzentrierte Prädiktoren data1$x1 <- data1$x1 - mean(data1$x1) data1$x2 <- data1$x2 - mean(data1$x2) # Interaktionsterm data1$x1.x2 <- data1$x1*data1$x2 # Datensatz 2 X2 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) X1 <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) <- c( , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ) data1 <- data.frame(x1, X2, ) # Mittelwertzentrierte Prädiktoren data2$x1 <- data2$x1 - mean(data2$x1) data2$x2 <- data2$x2 - mean(data2$x2) # Interaktionsterm data2$x1.x2 <- data2$x1*data1$x2 30"

16 Veränderung von Datensatz 1 zu 2: +B 3. X 1 wird um 0.7 verringert, die Residuen bleiben gleich. Die Linien sind Regressionsgeraden für den Zusammenhang zwischen X 2 und gegeben X 1 und den Zusammenhang zwischen X 1 und gegeben X 2. Zusätzlich sind die Regressionskoeffizienten für X 1 gegeben X 2 und X 2 gegeben X 1 angegeben. Datensatz 1 Datensatz 2 +B 3. X 1 +B 3. X 2 +B 3. X 2 X 2 mittelwertzentriert X 2 mittelwertzentriert 31" Multiple Regressionen # Datensatz 1 summary(lm(~x1+x2+x1.x2, data1)) # Datensatz 2 summary(lm(~x1+x2+x1.x2, data2)) Ergebnisse Datensatz 1 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** x ** x * x1.x e-08 *** Datensatz 2 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** x ** x < 2e-16 *** x1.x e-08 *** 32"