Mediator- und Moderatoranalyse per multipler Regression mit SPSS

Größe: px
Ab Seite anzeigen:

Download "Mediator- und Moderatoranalyse per multipler Regression mit SPSS"

Transkript

1 Universität Trier Zentrum für Informations-, Medienund Kommunikationstechnologie (ZIMK) Bernhard Baltes-Götz Mediator- und Moderatoranalyse per multipler Regression mit SPSS 5 (Rev. 576)

2 Herausgeber: Zentrum für Informations-, Medien- und Kommunikationstechnologie (ZIMK) an der Universität Trier Universitätsring 5 D-5486 Trier WWW: zimk.uni-trier.de Tel.: (65) -347, Fax.: (65) 39 Autor: Bernhard Baltes-Götz ( Copyright: ZIMK 5

3 Inhaltsübersicht INHALTSÜBERSICHT 3 VORWORT 5 MEDIATION 6. Einfache Mediation 6.. Modell 6.. Kausalität 7..3 Direkter, indirekter und totaler Effekt von X auf Y Direkter Effekt von X auf Y Indirekter Effekt von X auf Y Totaler Effekt von X auf Y 9..4 Beispiel: Vermutete Medienwirkung als Mediator Modell und Daten Anforderung einer OLS-Regression in SPSS..4.3 Ergebnisse..5 Mediator-Analyse nach Baron & Kenny 5..6 Signifikanztest und Vertrauensintervall für den indirekten Effekt Signifikanztest vom Sobel-Typ Signifikanztest und Vertrauensintervall durch Bootstrapping Monte Carlo - Simulation 8..7 Power beim Signifikanztest für den indirekten Effekt Simulationsstudie zur Power von häufig benutzten Signifikanztests Stichprobenumfangsplanung mit GPower. Makro PROCESS.. Bezug und Installation.. Makro verwenden 3..3 Ergebnisse für das Beispiel mit dem medialen Mediator 5..4 Einseitige Bootstrap-Vertrauensintervalle und -Signifikanztests 7.3 Modelle mit mehreren Mediatoren 8.3. Parallele Mediationspfade Beispiel Schätzen und Testen mit PROCESS 9.3. Mediatoren in Serie 3.4 Kontrollvariablen 37 MODERATION 4. Einleitung 4.. Beispiel 4.. Interaktionseffekte mit metrischen und kategorialen Regressoren 4. Die bilineare Interaktion von zwei metrischen Prädiktoren 43.. Modell 43.. Ergebnisse für das Beispiel Berechnung mit der SPSS-Prozedur REGRESSION Berechnung mit der SPSS-Prozedur UNIANOVA Berechnung mit dem SPSS-Makro PROCESS 48 3

4 ..3 Numerische und graphische Veranschaulichung Bedingte Regressionsgeraden berechnen Bedingte Regressionsgeraden zeichnen Einige Eigenschaften von bedingten Regressionsgeraden Signifikanztests und Vertrauensintervalle Interaktionseffekt Bedingte Effekte Signifikanzregionen Effekt- und Teststärke bei Interaktionseffekten Maße für die Effektstärke Stichprobenumfangsplanung mit GPower Power von Moderator-Hypothesentests in Beobachtungsstudien Haupteffekte Lineare Transformationen der Prädiktoren Haupteffekte in Modellen mit und ohne Interaktion MBE g - Haupteffekt schätzen und testen Zentrieren und Multikollinearität Standardisierte Lösungen 7..9 Kontrollvariablen 7.3 Alternative Interaktionsmodelle 7.3. Linear moderierte quadratische Regression 7.3. Interaktion von kategorialen und metrischen Regressoren Indikatorkodierung Effektkodierung Wechselwirkungen höherer Ordnung (moderierte Moderation) 8.4 Spezielle methodische Aspekte Verpflichtung zu hierarchisch wohlgeformten Modellen Mögliche Verwechslung eines kurvilinearen Haupteffekts mit einem Interaktionseffekt 87 3 KOMBINATION VON MEDIATION UND MODERATION ZUR PROZESSMODELLIERUNG9 LITERATUR 9 4

5 Vorwort In diesem Kurs wird die Modellierung von Mediator- und Moderatoreffekten im Rahmen der linearen Regression behandelt. Auf der Basis einer statistischen Grundausbildung (zu Begriffen wir Parameter, Statistik, Signifikanztest, etc.) und einer gewissen Erfahrung mit der linearen Regressionsanalyse sollten die Erläuterungen nachvollziehbar sein. Als Software kommt IBM SPSS Statistics 3 für Windows zum Einsatz, jedoch können praktisch alle vorgestellten Verfahren auch mit anderen SPSS-Versionen unter Windows, MacOS oder Linux realisiert werden. Die aktuelle Version des Manuskripts ist als PDF-Dokument zusammen mit allen im Kurs benutzen Dateien auf dem Webserver der Universität Trier von der Startseite (http://www.uni-trier.de/) ausgehend folgendermaßen zu finden: IT-Services (ZIMK) > Downloads & Broschüren > Statistik > Mediator- und Moderatoranalyse per multipler Regression mit SPSS Kritik und Verbesserungsvorschläge zum Manuskript werden dankbar entgegen genommen (z.b. unter der Mail-Adresse Trier, im Juli 5 Bernhard Baltes-Götz 5

6 Mediation Bei einer Mediationsanalyse geht es um die Frage, wie eine unabhängige Variable X ihre Wirkung auf eine abhängige Variable Y ausübt, welche vermittelnden Prozesse beteiligt sind. Das folgende Modell mit einem Effekt eines Regressors X auf ein Kriterium Y X (c) Y Y Abbildung : Bivariates Regressionsmodell mit dem totalen Effekt von X auf Y (Populationsparameter und Stichprobenschätzer c) stellt eine Aufforderung dar, den kausalen Prozess aufzuklären, um ein vertieftes Verständnis zu gewinnen und Ansatzpunkte für eine Intervention zu finden. Als Beispiel betrachten wir den medizinischen Forschungsbefund, dass mit dem Alter (X) der Blutdruck (Y) ansteigt (Beispiel gefunden bei Warner 3, S. 646). Es stellt sich sofort die Frage, wie das Alter den Blutdruck steigen lässt. Nicht nur das menschliche Kausalitätsbedürfnis drängt darauf, den Übersetzungsprozess zu verstehen. Das Aufspüren von vermittelnden Variablen erhöht die Chance, den Prozess durch erfolgreiche präventive Maßnahmen zu beeinflussen (Fortsetzung folgt). Für den Effekt von X auf Y in einem Modell ohne Mediatoren (siehe Abschnitt..3.3 über den so genannten totalen Effekt) wird im Manuskript der Parameter verwendet. Der Stichprobenschätzer dieses Populationsparameters wird im Manuskript mit c bezeichnet. Die Suche nach Mediatoren ist eine grundlegende wissenschaftliche Aufgabe, die im aktuellen Forschungsbetrieb auch ernst genommen wird, wie z.b. eine von Hayes (3, S. 89) berichten Inhaltsanalyse von Artikeln in führenden Journalen der Sozialpsychologie zeigt (Rucker et al. ). Mehr als 5% der untersuchten Artikel beschreiben eine Mediationsanalyse. Der Abschnitt des vorliegenden Manuskripts orientiert sich stark am sehr empfehlenswerten Buch von Andrew Hayes (3) über Mediation und Moderation.. Einfache Mediation.. Modell Das einfachste zur Betrachtung eines Mediatoreffekts geeignete Pfadmodell enthält eine exogene Variable X, einen Mediator M, ein Kriterium Y sowie die Residuen zu den beiden beteiligten Regressionsgleichungen. Im folgenden Pfaddiagramm sind neben den Pfaden die Namen der Populationsparameter und (eingeklammert) die in der Literatur üblichen Namen der Stichprobenschätzer notiert: M α (a) M (b) X ' (c') Y Y Abbildung : Einfaches Mediationsmodell mit Bezeichnungen für die Populationsparameter und die Stichprobenschätzer (eingeklammert) an den Pfaden 6

7 Das Pfadmodell enthält die beiden folgenden Regressionsgleichungen: M = i + αx + M () Y = i + 'X +M + Y () Im oben vorgestellten medizinischen Beispiel (Effekt des Alters auf den Blutdruck) kommt das Körpergewicht der Probanden als vermittelnde Variable in Betracht. Aufgrund veränderter metabolischer Prozesse sinkt mit zunehmendem Alter der Kalorienverbrauch, so dass bei vielen Menschen wegen einer unveränderten Kalorienzufuhr das Gewicht ansteigt. Vom Köpergewicht ist wiederum ein steigernder Effekt auf den Blutdruck bekannt. Somit drängt sich die Hypothese auf, dass der Effekt von Alter auf den Blutdruck zumindest teilweise durch das Köpergewicht vermittelt wird. Sofern man im Mediationsmodell (bestehend aus den Gleichungen und ) die Annahme akzeptiert, dass die Residuen M und Y aus den beiden Gleichungen unkorreliert sind, liegt ein rekursives Pfadmodell vor (vgl. Baltes-Götz ). In diesem Fall lassen sich die Parameter durch zwei, für jedes Kriterium (M bzw. Y) separat durchgeführte, OLS-Regressionsanalysen (Ordinary Least Squares) schätzen, was mit praktisch jeder Statistik-Software möglich ist. Wir werden in diesem Manuskript regelmäßig von rekursiven Modellen ausgehen und SPSS zur Schätzung der Parameter verwenden: entweder die lineare Regressionsprozedur oder das von Andrew Hayes frei zur Verfügung gestellte SPSS-Makro PROCESS, das einige spezielle Signifikanztests zur Mediationsanalyse ausführt (siehe Abschnitt.)... Kausalität Im einfachen Mediationsmodell werden kausale Effekte von X auf M und Y sowie von M und X auf Y postuliert. Das methodisch und wisssenschaftsphilosophisch anspruchsvolle der Kausalität kann in diesem Manuskript nicht gründlich behandelt werden (siehe z.b. Hayes 3, S. 5f; Steyer 99), so dass wir den Begriff Kausalität etwas naiv verwenden. Für eine kausale Interpretation muss auf jeden Fall sichergestellt sein, dass die behaupteten Ursachen den Effekten zeitlich vorgeordnet sind. Bei einer experimentellen Manipulation von X steht immerhin außer Frage, dass X den beiden anderen Variablen zeitlich vorgeordnet ist. Außerdem müssen statistische Verteilungs- bzw. Modellparameter notwendige Bedingungen erfüllen. Z.B. muss das Produkt der beiden Regressionskoeffizienten α und von Null verschieden sein, damit ein indirekter Effekt von X auf Y auf den Weg über M behauptet werden kann. Sprechen die zeitliche Anordnung sowie statistische Schätz- und Testergebnisse für ein Kausalmodell, müssen noch Alternativerklärungen ausgeschlossen werden. Dies gelingt besonders überzeugend durch experimentelle Manipulation und randomisierte Gruppeneinteilung. Im Mediationsmodell kommt die Experimentaltechnik jedoch nur beim Regressor X in Frage (siehe Beispiel in Abschnitt..4). Damit ist die kausale Interpretierbarkeit im Sinne einer unverzerrten Parameterschätzung gesichert für den Effekt von X auf M sowie für den totalen Effekt von X auf Y. Beim Effekt von M auf Y muss die Begründung der Kausalität bzw. der Ausschluss von alternativen Erklärungen basieren auf: theoretischen Argumenten und der statistischen Kontrolle von potentiellen Kausalitätskonkurrenten (siehe Abschnitt.4). Soll die Annahme unkorrelierter Residuen geprüft und ggf. eine Fehlerkorrelation in das Modell aufgenommen werden, ist eine Software erforderlich, die nonrekursive Strukturgleichungsmodelle schätzen kann (z.b. Amos, Mplus, R-Paket lavaan). Im aktuell betrachteten einfachen Mediationsmodell führt die Aufnahme der Fehlerkorrelation allerdings zu einem Identifikationsproblem, sofern die Parameter α, und ' alle frei schätzbar sein sollen. 7

8 Beim direkten Effekt von X auf Y kann es auch bei perfekter Exogenität von X (d.h. bei Unkorreliertheit von X und Y ) zu einer verzerrten Effektschätzung kommen, wenn der direkte Effekt von M auf Y verzerrt ist. In der gerade betrachteten Lage (einfaches Mediationsmodell, X unter experimenteller Kontrolle) wird der Effekt von M auf Y genau dann verzerrt geschätzt, wenn die Residuen M und Y aus den beiden Gleichungen korreliert sind, wenn also kein rekursives Pfadmodell vorliegt. Wenn keine experimentelle Manipulation von X stattfindet, und alle Variablen gleichzeitig beobachtet werden, also keine zeitliche Anordnung gesichert ist, dann sind oft viele Kausalsequenzen mit den statistischen Ergebnissen kompatibel (z.b. X M Y, X Y M, Y X M), und theoretische Argumente müssen eine Klärung bringen. Nach der Überzeugung von Hayes (3, S. 89) ist bei der Mediationsanalyse eine kausale Interpretation mit Hilfe theoretischer Argumente und statistischer Kontrollen auch dann möglich, wenn man sich nicht auf versuchsplanerischen Vorkehrungen (experimentelle Manipulation, randomisierte Gruppenzugehörigkeit) berufen kann...3 Direkter, indirekter und totaler Effekt von X auf Y..3. Direkter Effekt von X auf Y In Gleichung () steht ' für den direkten Effekt von X auf Y, d.h. für die erwartete Y-Veränderung bei der folgenden Regressorenkonstellation: Der Wert von X wird um eine Einheit gesteigert. In einem realen empirischen System ist diese Veränderung eventuell durch den Wechsel zu einem Fall mit höherer X-Ausprägung zu realisieren. Wenn X z.b. für das Geschlecht der Beobachtungseinheiten steht, bedeutet die Erhöhung von X um eine Einheit den Wechsel von einer Frau (X-Wert ) zu einem Mann (X-Wert ). Der Wert vom M bleibt gleich. Weil M gemäß Gleichung () auf die X-Wertsteigerung im Mittel mit einer Veränderung um a Einheiten reagiert, muss bei zwei Fällen mit einem X-Wertunterschied von ein kompensierender M - Wertunterschied vorliegen. Der direkte Effekt zeigt, welche Y-Änderung eine X-Steigerung um eine Einheit bei Y bewirkt, wenn der kausale Fluss über M durch einen kompensierenden Einfluss auf M verhindert wird...3. Indirekter Effekt von X auf Y In Gleichung () steht der Parameter α für die erwartete M-Veränderung bei einer X-Wertsteigerung um eine Einheit. In Gleichung () steht der Parameter für den Effekt von M auf Y (vgl. Abschnitt..3.), also für die erwartete Y-Veränderung bei der folgenden Regressorenkonstellation: Der Wert vom X bleibt gleich. Der Wert von M wird um eine Einheit gesteigert. Weil kein kausaler Einfluss von X stattfindet, muss die M-Wertsteigerung auf M zurückgehen. Der indirekte Effekt von X auf Y via M ist definiert durch das Produkt α. Es quantifiziert die Y- Veränderung, die erwartungsgemäß durch eine X-Steigerung um eine Einheit auf dem Kausalpfad via M bewirkt wird. 8

9 ..3.3 Totaler Effekt von X auf Y Der totale Effekt von X auf Y ist definiert durch die Summe aus dem direkten und dem indirekten Effekt: = ' + α (3) Für den Stichprobenschätzer zum totalen Effekt wird in der Literatur häufig das Symbol c verwendet: c = c' + ab (4) Im Modell der einfachen Mediation mit zwei linearen Regressionsgleichungen ist der totale Effekt identisch mit dem Steigungsparameter in der bivariaten Regression von Y auf X: Yˆ = i 3 + X (5) In diesem Fall kann man von einer Zerlegung des totalen Effekts in den direkten und den indirekten Effekt sprechen. Hayes (3, z.b. S. 88, 69) argumentiert strikt gegen die traditionelle, nicht zuletzt durch einen Artikel von Baron & Kenny (986) verbreitete Auffassung, dass sich die Frage, wie X auf Y wirkt erst dann stelle, wenn ein von Null verschiedener totaler Effekt von X auf Y in einer bivariaten Analyse nachgewiesen worden ist (siehe Abschnitt..5). Unterstützung für seine Auffassung findet Hayes bei Bollen (989), der in seinem weithin bekannten Buch Structural Equations with Latent Variables auf Seite 5 markant Stellung bezieht: The old saying that correlation does not prove causation should be complemented by the saying that a lack of correlation does not disprove causation.... Correlation is neither a necessary nor a sufficient condition of causality. Es ist möglich (wenngleich nicht sehr wahrscheinlich), dass der direkte und der indirekte Effekt von X auf Y unterschiedliche Vorzeichen haben und sich gegenseitig aufheben. Hayes (3, S. 7ff) berichtet von einer empirischen Studie, die einen positiven indirekten Effekt und einen negativen direkten Effekt gefunden hat. Während der indirekte Effekt statistisch bedeutsam ist, verfehlt der direkte Effekt die Signifikanzgrenze relativ knapp, und der totale Effekt ist weit von einer Signifikanz entfernt. Auch andere Autoren haben sich mittlerweile der Auffassung angeschlossen, dass ein signifikanter totaler Effekt keine Voraussetzung für eine Mediatoranalyse ist (siehe z.b. Warner 3, S. 65)...4 Beispiel: Vermutete Medienwirkung als Mediator..4. Modell und Daten Nachdem wir uns schon bei der statistischen Theorie zum Modell der einfachen Mediation stark an Hayes (3) orientiert haben, soll auch ein Beispiel aus seinem Buch übernommen werden (S. 93 ff). Bei einem in Israel mit 3 Studierenden durchgeführten Experiment (Tal-Or et al. ) haben alle Probanden einen Zeitungsartikel über eine zu erwartende Zuckerverknappung gelesen. Zwei zufällig gebildete Gruppen erhielten unterschiedliche Informationen über den Erscheinungsort des Artikels: Auf der ersten Seite einer überregionalen Zeitung Im Mittelteil dieser Zeitung Bei allen Personen wurden zwei metrische Merkmalsausprägungen ermittelt: Sind bei einer Mediation nichtlineare Partialmodelle beteiligt (z.b. logistische Regressionsgleichungen), dann lässt sich der totale Effekt nicht so einfach additiv in den direkten und den indirekten Effekt zerlegen. 9

10 Vermutung über die mediale Wirksamkeit des Artikels auf die Öffentlichkeit Absicht zum spontanen Hamstern von Zucker Auf der Webseite zu seinem Buch stellt Hayes (3) die Daten zum Beispiel in der SPSS-Datendatei pmi.sav mit den folgenden Variablennamen zur Verfügung: COND Diese Variable enthält die experimentell manipulierte Bedingung mit folgendermaßen kodierten Instruktionen: Artikel erscheint auf der Titelseite der Zeitung Artikel erscheint im Mittelteil der Zeitung PMI (Presumed Media Influence) Die Probanden wurden nach ihrer Meinung dazu befragt, in welchem Ausmaß die Leser auf den Artikel mit dem Kauf von Zucker reagieren würden. REACTION Die Probanden wurden danach befragt, in welcher Geschwindigkeit und Menge sie den Kauf von Zucker planen. Die Angaben wurden zu einem Index verdichtet. Die Autoren vermuten, dass die experimentelle Manipulation einen Effekt auf die Absicht zur Beschaffung von Zucker hat. Von den Probanden in der Titelseiten-Gruppe wird ein größerer Kaufimpuls erwartet als von den Probanden, die über eine Veröffentlichung des Artikels im Mittelteil der Zeitung informiert wurden. Allerdings beschränken sich die Autoren nicht auf die Behauptung bzw. Beobachtung, dass ein Effekt stattfindet, sondern sie widmen sich auch der Frage, wie dieser Effekt zustande kommt. Dabei spielt die von den Probanden vermutete massenmediale Wirkung des Artikels (Variable PMI) eine wichtige Rolle: Die Titelseiten-Instruktion führt zu einer höheren vermuteten Wirkung des Artikels auf die Öffentlichkeit (zu einem höheren PMI-Wert) als die Mittelteil-Instruktion. COND hat also einen Effekt auf PMI. Je stärker der vermutete Einfluss des Artikels auf die potentiellen Zuckerkonsumenten, desto höher sollte die eigene Motivation der Probanden ausfallen, Zucker in ausreichender Menge und Geschwindigkeit zu beschaffen. Für den Mediator PMI wird ein Effekt auf das Kriterium REACTION angenommen. Insgesamt wird also eine einfache Mediation im Sinne des zu Beginn von Abschnitt. beschriebenen Pfadmodells unterstellt mit PMI in der Rolle der M-Variablen. PMI a PMI b COND c' REACTION RN Abbildung 3: Artikelplatzierung und Hamsterverhalten. Modellstruktur mit der vermuteten Medienwirkung als Mediator SPSS-Variablennamen werden im Manuskript aus typographischen Gründen groß geschrieben.

11 Um die Koeffizienten des Pfadmodells zu schätzen und zu testen, führen wir mit SPSS zwei Regressionsanalysen durch: Regression von PMI auf COND Regression von REACTION auf PMI und COND..4. Anforderung einer OLS-Regression in SPSS Exemplarisch soll die Anforderung der zweiten Regressionsanalyse beschrieben werden. Wir starten mit dem Menübefehl Analysieren > Regression > Linear und benennen im folgenden Dialog die beteiligten Variablen: Nach einem Klick auf den Schalter Statistiken fordern wir über den voreingestellten Ausgabeumfang hinausgehend auch Konfidenzintervalle zu den Regressionskoeffizienten an: Zur Beurteilung der Voraussetzungen der Regressionsanalyse (Linearität, varianzhomogen normalverteilte Residuen; vgl. z.b. Baltes-Götz 4) öffnen wir den Diagramme-Subdialog,

12 und fordern dort an: Histogramm der Residuen Streudiagramm der ausgelassen-studentisierten Residuen (SPSS-interner Variablenname: SDRESID) gegen die standardisierte Modellprognose (SPSS-interner Variablenname: ZPRED) Alle partiellen Regressionsdiagramme Die beschriebene Analyse lässt sich auch mit dem folgenden Kommando anfordern: REGRESSION /STATISTICS COEFF OUTS CI(95) R ANOVA /DEPENDENT reaction /METHOD=ENTER cond pmi /PARTIALPLOT ALL /SCATTERPLOT=(*SDRESID,*ZPRED) /RESIDUALS HISTOGRAM(SDRESID) Ergebnisse Bei der Ergebnispräsentation verzichten wir vorläufig auf eine Diskussion der modelldiagnostischen Ausgaben, um nicht vom Thema der Mediationsanalyse abgelenkt zu werden Regression des Mediators auf den Regressor In der Regression von PMI auf COND zeigt sich ein Regressionsgewicht von,477, das bei zweiseitiger Testung ein p-level von,45 erreicht: Bezogen auf das Pfadmodell der einfachen Mediation wird hier der Koeffizient α geschätzt. Weil sich im dichotomen Regressor COND die beiden Gruppen um den Wert unterscheiden, steht α für den Unterschied zwischen den PMI-Mittelwerten der beiden Gruppen. Den Anteil aufgeklärter Kriteriumsvarianz schätzt das adjustierte R auf relative bescheidene,5%: Im RESIDUALS-Subkommando wird über den internen Variablennamen SDRESID ein Histogramm der ausgelassenstudentisierten Residuen angefordert, während per Dialogbox nur ein Histogramm der theoretisch weniger günstigen (allerdings in der Praxis meist äquivalenten) standardisierten Residuen zu haben ist. Weil eine gerichtete Hypothese vorlag (positiver Effekt von COND auf PMI) ist ein einseitiger Test angemessen. Sein p-level ergibt sich aus dem von SPSS mitgeteilten zweiseitigen p-level durch Halbieren.

13 Regression des Kriteriums auf den Regressor und den Mediator In der Regression von REACTION auf COND und PMI erhalten wir einen signifikanten PMI-Effekt von,56 (zweiseitiges p-level <,) und einen insignifikanten direkten COND-Effekt von,54 (zweiseitiges p-level,3): Bezogen auf das Pfadmodell der einfachen Mediation werden hier die Koeffizienten und ' geschätzt. Von besonderem Interesse ist, dass für COND bei statistischer Kontrolle von PMI kein Effekt mehr nachgewiesen werden kann. Für den Anteil aufgeklärter Kriteriumsvarianz liefert das adjustierte R die Schätzung,93: Anschließend ist das Pfaddiagramm zum Beispiel mit den geschätzten Regressionskoeffizienten zu sehen: PMI PMI,477,56 COND,54 REACTION RN Abbildung 4: Artikelplatzierung und Hamsterverhalten. Geschätztes Modell mit der vermuteten Medienwirkung als Mediator Für den durch PMI vermittelten indirekten Effekt von COND auf REACTION erhalten wir die Schätzung: ab =,477,55 =,4 Zur Beurteilung der Varianzhomogenität der Residuen aus der Regression von REACTION auf COND und OMI wenden wir den Score-Test von Breusch und Pagan an. Damit dies in SPSS per Menüsystem oder 3

14 Syntax möglich ist, müssen die R-Essentials für SPSS Statistics samt einer mit SPSS kompatiblen R- Version installiert werden (siehe z.b. Baltes-Götz 5). Anschließend stehen neben der generellen Option, R-Pakete und -Syntax auf die Variablen in einem SPSS-Datenblatt anzuwenden, etliche mit R implementierte SPSS-Erweiterungskommandos zur Verfügung, die auch in das Menüsystem integriert sind. Das Erweiterungskommando zum Score-Test von Breusch und Pagan ist verfügbar über den Menübefehl Analysieren > Regression > Residuums-Heteroskedastizitätstest und verwendet die Funktion ncv.test aus dem R-Paket car. Im folgenden Dialog wird die Beurteilung der Regression von REACTION auf COND und PMI angefordert: Die Nullhypothese varianzhomogener Residuen wird verworfen: Fordert man im Diagramme-Subdialog der Regressionsprozedur ein Streudiagramm mit den ausgelassenstudentisierten Residuen gegen die standardisierten Modellprognosen an (siehe Abschnitt..4.), dann zeigt sich ein deutlicher Anstieg der Residualvarianz mit dem Prognosewert: Abbildung 5: Heteroskedastische Residuen in der Regression von Hamsterverhalten auf Artikelplatzierung und vermutete Medienwirkung 4

15 In einer solchen Situation sollten bei der Inferenzstatistik (also bei Signifikanztests und Vertrauensintervallen) Heteroskedastizitäts-konsistente Standardfehler verwendet werden (siehe z.b. Baltes-Götz 4). Zum Glück bietet das von Andrew Hayes erstellte SPSS-Makro PROCESS, das wir letztlich zum Schätzen von Mediationsmodellen verwenden, robuste Standardfehler an (siehe Abschnitt..) Totaler Effekt des Regressors auf das Kriterium Der totale Effekt von COND auf REACTION berechnet sich zu: c' ab =,54 +,477,55 =,54 +,4 =,495 Statt den Taschenrechner zu bemühen, kann man auch die einfache Regression von REACTION auf COND schätzen lassen, um den totalen Effekt zu ermitteln. Bis auf Rundungsfehler erhalten wir dasselbe Ergebnis: Vom zweiseitigen Signifikanztest wird die Nullhypothese knapp beibehalten, wovon sich Hayes (3, S. 7) der üblichen Praxis folgend überzeugen lässt. The total effect is c =.496 but just misses statistical significance. Hayes kommt der nicht-signifikante totale Effekt argumentativ gelegen als Beispiel gegen die populäre Signifikanzteststrategie für Mediationshypothesen nach Baron & Kenny (986, siehe Abschnitt..5). Nach der von diesen Autoren vorgeschlagenen Schrittfolge hat bei einer insignifikanten Beurteilung des totalen Effekts (durch eine einfache Regression von Y auf X) die Suche nach einem Mediator zu unterbleiben. Hayes geht hingegen davon aus, dass im Beispiel die vermutete Medienwirkung als Mediator für den Effekt der experimentellen Bedingung auf die Zuckerbeschaffung agiert, obwohl der totale Effekt des Regressors nicht signifikant ist. Allerdings lag eine gerichtete Hypothese vor, und der Effekt fällt in der erwarteten Richtung aus. Folglich ist ein einseitiger Test angemessen, und das dementsprechend halbierte p-level ist so klein (,385 <,5), dass die Nullhypothese bei einem Test zum Niveau 5% verworfen wird. Folglich spricht das Beispiel weder gegen noch für die gleich zu beschreibende Strategie von Baron & Kenny...5 Mediator-Analyse nach Baron & Kenny Ausgangspunkt für einige traditionelle, nunmehr weitgehend überwundene Auffassungen zur Mediator- Analyse war ein einflussreicher Artikel von Baron & Kenny (986), in dem für die einfache Mediation folgende Analyseschritte und Entscheidungsregeln vorgeschlagen werden (siehe z.b. Seite 77):. Führe eine einfache Regression von Y auf X durch (gemäß Modell in Gleichung (5)), um die Schätzung c für den Koeffizienten zu gewinnen und zu testen. Ist c nicht signifikant von verschieden, kann kein totaler Effekt von X auf Y nachgewiesen werden, der potentiell durch die Variable M vermittelt werden könnte, und die Mediatoranalyse ist beendet.. Führe eine einfache Regression von M auf X durch (gemäß Modell in Gleichung ()), um die Schätzung a für den Koeffizienten α zu gewinnen und zu testen. Ist a nicht signifikant von verschieden, kann M kein Mediator für den Effekt von X auf Y sein. 5

16 3. Führe eine multiple Regression von Y auf M und X durch (gemäß Modell in Gleichung ()), um die Schätzungen b und c' für die Koeffizienten und ' zu gewinnen und zu testen. Ist b nicht signifikant von verschieden, kann M nicht als Mediator für den Effekt von X auf Y gelten. 4. Wenn das bisherige Verfahren nicht wegen einer fehlenden Signifikanz gestoppt werden musste, sind c, a und b signifikant von verschieden. Die Entscheidung über die Mediationshypothese hängt nun vom direkten X-Effekt c' in der Regression von Y auf M und X ab: Ist c' nicht signifikant von verschieden, dann liegt eine vollständige Mediation vor. Ist c' signifikant, aber c' < c, dann liegt eine partielle Mediation vor. In der modernen Methodenliteratur wird der beschriebene Ansatz der kausalen Schritte (causal steps approach) nach Baron & Kenny überwiegend kritisch beurteilt. Dass ein signifikanter totaler Effekt keine notwendige Voraussetzung für eine Mediator-Analyse ist, wurde schon in Abschnitt..3.3 begründet. Die bivariate Regression von Y auf X zu betrachten, ist trotzdem sinnvoll, weil z.b. der Vergleich des totalen Effekts mit dem direkten Effekt im Sinne einer Prozessanalyse von Interesse ist. Hayes (3, S. 67f) wendet sich außerdem strikt dagegen, die Mediations-Nullhypothese über das Produkt α H : α = durch Einzeltests zu den beiden Faktoren α und zu prüfen. Er betrachtet den indirekten Effekt von X auf Y auf dem Weg über M als ein eigenständig existierendes Ganzes, nicht als einen abgeleiteten Begriff. Folglich besteht er auf einer eigenständigen inferenzstatistischen Behandlung des indirekten Effekts. Über die Mediationshypothese in einem Signifikanztest zu entscheiden, reduziert nach Hayes (3, S. 68f) das Fehlerrisiko erster und zweiter Art gegenüber einer Serie von Tests, wie sie von Baron & Kenny vorgeschlagen wurde. Im Abschnitt..6 werden Eintestverfahren zur Beurteilung der Mediationshypothese vorgestellt, und in Abschnitt..7 betrachten wir die Power verschiedener Teststrategien...6 Signifikanztest und Vertrauensintervall für den indirekten Effekt Aktuell dominiert in der Methodenliteratur (siehe z.b. Hayes 3; Warner 3) die Auffassung, dass der indirekte Effekt von X auf Y auf dem Pfad über M inferenzstatistisch als untrennbares Produkt α behandelt werden muss, d.h.: Für von X auf dem Pfad über M bei Y erzielte Wirkung ist neben der Punktschätzung ab auch eine Intervallschätzung vorzunehmen, also ein Vertrauensintervall zu berechnen. Der Signifikanztest zur Mediator-Hypothese muss auf einer Prüfverteilung der Stichprobenschätzung ab basieren. Man muss aber bei aller Konzentration auf das Produkt trotzdem auch die Einzelfaktoren beachten. Ansonsten könnte man übersehen, dass beide Parameterschätzungen ein erwartungskonträres Vorzeichen besitzen, was sich im Produkt nicht bemerkbar macht...6. Signifikanztest vom Sobel-Typ Die auf eine Arbeit von Sobel (98) zurückgehenden Versuche, den Standardfehler zur Stichprobenschätzung ab des indirekten Effekts (also zum Produkt von zwei Zufallsvariablen) zu schätzen und darauf einen Signifikanztest mit normalverteilter Prüfgröße zu begründen, werden mittlerweile skeptisch beurteilt. Nach Hayes (3, S. 4f) bestehen zwei gravierende Probleme: 6

17 Die Annahme, das Produkt ab habe eine normale Stichprobenverteilung, ist nicht gerechtfertigt, so dass die berechneten Überschreitungswahrscheinlichkeiten der Tests fehlerhaft sind. Von diesem Argument ist sowohl der ursprüngliche Sobel-Test betroffen wie auch die Varianten mit einer verbesserten Berechnung des Standardfehlers. Simulationsstudien zeigen, dass Signifikanztests vom Sobel-Typ eine schlechte Power besitzen, und die zugehörigen Vertrauensintervall eine geringe Präzision aufweisen (siehe Abschnitt..7.). Wer trotz aller Bedenken einen Sobel-Test durchführen möchte, kann dazu das von Andrew Hayes erstellte SPSS-Makro PROCESS verwenden, auf das wir bei Mediator- und Moderatoranalysen oft zurückgreifen werden (vgl. Abschnitt.). PROCESS verwendet zur Berechnung des Standardfehlers zum Produkt ab die folgende, im Vergleich zum Original von Sobel (98) leicht verbesserte Formel: Darin sind: ˆ ab a ˆ b b ˆ a ˆ ˆ ˆ a Geschätzter Standardfehler zu a (Effekt von X in der Regression von M auf X) ˆ Geschätzter Standardfehler zu b (Effekt von M in der Regression von Y auf X und M) b ˆ Geschätzter Standardfehler zu ab ab a b..6. Signifikanztest und Vertrauensintervall durch Bootstrapping In der amerikanischen Variante der Münchhausen-Geschichte schafft es der Held, sich an den eigenen Stiefelriemen aus dem Sumpf zu ziehen, und dieses Verfahren liefert den Namen für eine prominente statistische Schätz- und Testmethodologie, die erstmals von Efron (98) ausformuliert worden ist. Man behandelt die Stichprobe als Population, ermittelt durch Ziehen mit Zurücklegen zahlreiche Sekundärstichproben (mindestens ) mit derselben Größe wie die Original- bzw. Primärstichprobe, wobei in der Regel etliche Fälle mehrfach in einer Sekundärstichprobe vertreten sind. Aus jeder Sekundärstichprobe wird mit den üblichen Methoden ein Schätzer für den interessierenden Parameter gewonnen, so dass man eine empirische Stichprobenkennwerteverteilung erhält. Diese ersetzt die theoretische Stichprobenkennwerteverteilung, die z.b. auf der Normalverteilungsannahme basiert. Aus der empirischen Stichprobenkennwerteverteilung lassen sich Vertrauensintervalle und Testentscheidungen konstruieren, die nicht von der Normalverteilungsannahme abhängen. Lange war die benötigte Rechenleistung ein Hindernis für die Weiterentwicklung und Anwendung der Bootstrap-Technologie, doch mittlerweile suchen die CPU-Hersteller nach relevanten Anwendungen für ihre Gigahertz- und Multicore-Boliden. In den folgenden Situationen ist die verteilungsvoraussetzungsfreie und sehr generell einsetzbare Ermittlung von Vertrauensintervallen zu Parameterschätzungen durch Bootstrap-Methoden von Interesse: Für manche Parameterschätzer ist die mathematische Herleitung der Stichprobenverteilung und damit die Berechnung des Vertrauensintervalls sehr aufwändig. Beim Produkt ab aus der Mediationsanalyse liegt genau ein solcher Fall vor. Per Bootstrap-Technik ersetzt man die theoretische Stichprobenverteilung durch die oben beschriebene empirische Variante. Oft ist für einen Parameterschätzer bei gültigen Voraussetzungen die Stichprobenverteilung leicht zu ermitteln, doch ist eine grobe Verletzung der Voraussetzungen zu befürchten, die zu fehlerhaften (in der Regel zu kleinen) Vertrauensintervallen führen kann. Mit Hilfe der Bootstrap-Technik erhält man in vielen Fällen realistischere Ergebnisse. Im Fall der Mediatoranalyse ermittelt man aus jeder Sekundärstichprobe einen Schätzwert ab für den indirekten Effekt und gewinnt so durch mindestens -fache Wiederholung eine empirische Stichprobenver- 7

18 teilung für den indirekten Effekt, aus der sich ein Vertrauensintervall ermitteln lässt. In der Regel verwendet man ein Verfahren mit Bias-Korrektur, das die Schiefe der Stichprobenverteilung ausgleicht. Der zugehörige Signifikanztest zum Hypothesenpaar H : α = versus H : α lehnt die Nullhypothese genau dann ab, wenn das Bootstrap-Vertrauensintervall den Wert nicht enthält. Nachteile der Bootstrap-Technik Man benötigt die Originaldaten. Wenn (z.b. aus der Literatur) nur Parameterschätzungen (z.b. zu a und b) und die zugehörigen Standardfehler bekannt sind, kann das Bootstrap-Verfahren nicht angewendet werden. Das Vertrauensintervall ist in geringfügigem Umfang zufallsabhängig. Um dieses Problem zu minimieren, sollte die Anzahl der Sekundärstichproben erhöht werden (z.b. auf ). Außerdem lassen sich die Ergebnisse durch einen festen Startwert des Pseudozufallszahlengenerators kontrollieren Monte Carlo - Simulation Wenn wegen fehlender Originaldaten kein Bootstrapping möglich ist, und den Normalverteilungsabhängigen Tests vom Sobel-Typ nicht vertraut werden soll, kommt eine Monte Carlo - Simulation in Frage (siehe Hayes 3, S. 3). Unter den üblichen Regressionsannahmen ist die Verteilung des Parameterprodukts ab i.a. nicht normal, die Verteilungen der beiden Faktoren a und b bewegen sich jedoch mit wachsendem Stichprobenumfang rasch in Richtung Normalität. Außerdem lässt sich ihre gemeinsame Verteilung aus üblicherweise berichteten Ergebnissen ermitteln. Man benötigt also keine Originaldaten, um zufällige Realisationen der Parameterschätzungen a und b zu ermitteln, daraus das Produkt ab zu berechnen und so eine Stichprobenverteilung von ab zu generieren. Daraus kann man analog zum Bootstrap-Verfahren ein Vertrauensintervall und einen Signifikanztest ableiten. Das Monte Carlo - Verfahren ist laut Hayes (3, S. 4) fast genauso gut wie das Bootstrap-Verfahren. Gemeinsamkeiten der beiden Techniken sind: Man benötigt keine Annahme über die Verteilung von ab. Die Ergebnisse sind in geringfügigem Umfang zufallsabhängig...7 Power beim Signifikanztest für den indirekten Effekt In diesem Abschnitt geht es um die Frage, welche Stichprobengröße benötigt wird, damit im Signifikanztest zur Mediations-Nullhypohypothese H : α = bei einem akzeptierten Risiko erster Art von 5% eine vorgegebene Effektstärke zu einer gewünschten Power (Teststärke) von z.b.,8 führt. 8

19 ..7. Simulationsstudie zur Power von häufig benutzten Signifikanztests In einer Simulationsstudie von Fritz & MacKinnon (7) werden 3 Teststrategien verglichen: Zwei separate t-tests für a und b mit der OLS-Regressionstechnik ( Joint Significance ), wobei die Mediations-Nullhypothese genau dann abgelehnt wird, wenn beide Einzeltests ihre Nullhypothese ablehnen. Im Unterschied zum Ansatz der kausalen Schritte nach Baron & Kenny (986, siehe Abschnitt..5) spielen der totale Effekt c und der direkte Effekt c' keine Rolle. z-test zum Produkt ab unter Verwendung der in Sobel (98) angegebenen Formel zur Berechnung des Standardfehlers von ab Bootstrap-basierter Test zum Produkt ab aufgrund einer mit Bias-Korrektur ermittelten empirischen Stichprobenverteilung Fritz & MacKinnon haben alle Kombinationen mit einem kleinen, mittleren oder großen Effekt für α und betrachtet und jeweils die für eine Power von,8 bei einem zweiseitigen Test zum 5% - Niveau erforderliche Stichprobengröße ermittelt. Bei den Effektgrößen haben sich die Autoren an den Empfehlungen von Cohen (988, S. 43f) für die Beurteilung von (partiellen) Effekten in der multiplen Regression orientiert (vgl. Abschnitt..7.). Übertragen in SPSS-Syntax wurden offenbar Simulationsdaten mit folgenden Anweisungen erzeugt: compute x = normal(). compute m = alpha*x + normal(). compute y = gammas*x + beta*m + normal(). Für α und wurden Regressionskoeffizienten so bestimmt, dass ein kleiner Effekt von,, ein mittlerer Effekt von,3 oder ein großer Effekt von,6 entsteht (Effektstärke quantifiziert durch die quadrierte partielle Korrelation). Dazu wurden bei α bzw. folgende Regressionskoeffizienten gewählt: Kleiner Effekt:,4 Mittlerer Effekt:,39 Großer Effekt:,59 In der folgenden Tabelle sind für die verglichenen Testverfahren unter verschiedenen Effektkonstellationen die erforderlichen Stichprobenumfänge zu sehen. Die Ergebnisse wurden durch Simulationstechniken ermittelt: Testverfahren KK KM KG MK MM MG GK GM GG Joint Significance Sobel Bias-Korrigierter Bootstrap In den Spaltenbeschriftungen steht K für einen kleinen, M für einen mittleren und G für einen großen Effekt. Der erste Buchstabe steht für den Effekt von X auf M (α), und der zweite Buchstabe für den Effekt von M auf Y (). Als wesentliche Ergebnisse haben sich herausgestellt: Der Sobel-Test benötigt unter allen Effektkonstellationen den größten Stichprobenumfang, besitzt also generell die schlechteste Power. Der Bootstrap-basierte Test benötigt unter allen Effektkonstellationen den kleinsten Stichprobenumfang, besitzt also generell die beste Power. Das Verfahren mit separater Testung von a und b benötigt meist annähernd denselben Stichprobenumfang wie das Bootstrap-basierte Verfahren. Wird aus der obigen Tabelle der Stichprobenumfang für eine geplante Studie bestimmt, sind die Eigenschaften der Daten zu bedenken, die dort zur empirischen Bestimmung der Power verwendet wurden: 9

20 Normalverteilung aller Variablen fehlerfreie Messung der Regressoren X und M Bei realen Studien ist u.a. mit einer Minderung der Regressionskoeffizienten durch Messfehler zu rechnen, und der Stichprobenumfang sollte folglich erhöht werden...7. Stichprobenumfangsplanung mit GPower In Abschnitt..7. hat sich gezeigt, dass die Prüfung eines indirekten Effekts durch zwei separate Tests für α und der Bootstrap-basierten Signifikanzprüfung annähernd ebenbürtig ist. Daher kann das Verfahren bei einer Stichprobenumfangsplanung zugrunde gelegt werden, wenn auch bei der späteren statistischen Analyse ein Bootstrap-Verfahren geplant ist: Man kann jede Power-Analyse - Software einsetzen, die lineare Regressionsanalysen unterstützt. Eine leichte konservative Überschätzung des Stichprobenbedarfs ist zu begrüßen, weil so die Powerschädlichen Auswirkungen verletzter Voraussetzungen (z.b. Messfehler in den Regressoren) teilweise kompensiert werden. Wir verwenden anschließend das populäre Programm GPower 3. (Faul et al. 9), um den Stichprobenbedarf für eine einfache Mediationsanalyse zu schätzen. Das Programm ist für MacOS und MS- Windows kostenlos über die folgende Webseite zu beziehen: Auf den Pool-PCs der Universität Trier unter dem Betriebssystem Windows lässt sich GPower 3. über folgende Programmgruppe starten Start > Alle Programme > Wissenschaftliche Programme > GPower Wir verwenden das übliche, z.b. der SPSS-Prozedur REGRESSION zugrunde liegende Modell fixierter Regressoren (vgl. z.b. Baltes-Götz 4) und wählen nach dem GPower-Programmstart den folgenden Aufgabentyp: Test family: t-tests Statistical test: Linear Multiple Regression: Fixed model, single regression coefficient Type of power analysis: A priori Die Effektstärke f j für einen einzelnen Regressor X j im Rahmen eines (multiplen) Regressionsmodells ist nach Cohen (988, S. 4) durch die quadrierte partielle Korrelation Kontrolle der restlichen Regressoren definiert: f j YX j A YX A j YX j A zwischen X j und Y bei Zur Beschreibung der Effektstärke einer Varianzquelle in der multiplen Regression nennt Cohen (988, S. 43f) folgende Orientierungsgrößen für die Verhaltens- und Sozialwissenschaften: Bei einem einzelnen Regressor geht die quadrierte partielle Korrelation über in die quadrierte einfache Korrelation.

21 Effektstärke in der Population erklärter Varianzanteil Effektstärkeindex klein,, mittel,3,5 groß,6,35 f Als Standardwert für die Power (Entdeckungswahrscheinlichkeit) empfiehlt Cohen (988, S. 56) den Wert,8 (-Fehler:,). Weil bei der Einzelteststrategie zur Mediationsbeurteilung zwei Tests ihre falsche Nullhypothese ablehnen müssen, damit ein vorhandener Mediationseffekt signifikant wird, ist für jeden Einzeltest eine Power von ca.,8944 erforderlich, denn:,8944,8 Nimmt man für die Regressionskoeffizienten α und jeweils eine mittlere Effektstärke an, resultiert bei zweiseitigen Tests ein Stichprobenbedarf von 7, der unter dem von Fritz & MacKinnon (7) durch Simulationstechniken ermittelten Wert von 74 liegt (vgl. Abschnitt..7.): Wer sich über das ungeschriebene Gesetz, bei Mediationsprüfungen sowie sonstigen multiplen Regressionsanalysen trotz vorhandener Richtungshypothesen ausschließlich zweiseitige Tests zu verwenden, hinwegsetzt, ermittelt für einseitige Tests einen Stichprobenbedarf von 58 Fällen.

22 Ob die Anzahl der Prädiktoren oder beträgt, spielt bei der aktuellen Power-Analyse keine Rolle. Werden für die beiden Faktoren im Mediationseffekt α verschiedene Effektstärken angenommen, sind zwei GPower-Analysen fällig, und der größte Stichprobenbedarf ist zu anzuwenden. Wird z.b. ein mittlerer Effekt α von X auf M sowie ein schwacher Effekt von M auf Y angenommen, ergeben sich für zweiseitige Tests bei einer Einzeltest-Power von,8944 die Einzeltestumfänge 7 und 58, so dass 58 Fälle benötigt werden.. Makro PROCESS Für SPSS-Anwender besteht ein bequemer Weg zur Prüfung der Mediations-Nullhypothese H : α = mit der laut Abschnitt..7 besonders teststarken Bootstrap-Technologie darin, das von Andrew Hayes angebotene SPSS-Makro PROCESS zu verwenden... Bezug und Installation Von der Webseite kann eine Zip-Datei mit der aktuellen PROCESS-Version heruntergeladen werden (z.b. processv3.zip). Nach dem Auspacken des Zip-Archivs ist u.a. die Datei process.spd vorhanden: Nach einem Doppelklick auf diese Datei startet SPSS Statistics bei Bedarf, und das Makro kann samt Integration in das SPSS-Menüsystem installiert werden: Dabei gelten sehr benutzerfreundliche Regeln: Es genügen normale Benutzerrechte.

23 Das Makro kann bei laufender SPSS-Sitzung installiert und anschließend sofort benutzt werden. Nach dem Installieren sollten Sie eine Quittung wie im folgenden Beispiel erhalten: Solange der hier angegebene Ordner existiert, bleibt das benutzerdefinierte Dialogfeld installiert (über die aktuelle SPSS-Sitzung hinweg). Auf einem Pool-PC an der Universität Trier ist die Installation eines benutzerdefinierten Dialogfelds von räumlich und zeitlich begrenzter Wirkung. Zunächst landet die Installation auf einem einzelnen Pool-PC, kann sich also nicht auf andere Pool-PCs auswirken. Außerdem landet die Installation in einem Teil des Windows-Benutzerprofils, der beim Abmelden gelöscht wird. Zur Lösung des Problems sollten Sie vor der Installation eines benutzerdefinierten SPSS-Dialogfelds eine benutzereigene Windows-Umgebungsvariable definieren über Systemsteuerung > Benutzerkonten > Benutzerkonten > Eigene Umgebungsvariablen ändern Verwenden Sie für diese Umgebungsvariable den Namen SPSS_CDIALOGS_PATH und als Inhalt den Namen eines Ordners auf Ihrem persönlichen Laufwerk U:, das auf jedem Pool- PC verfügbar ist, z.b. U:\Eigene Dateien\SPSS\SPSS_CDIALOGS_PATH Wenn Sie anschließend ein benutzerdefiniertes Dialogfeld installieren, landet es im vereinbarten Ordner und steht dauerhaft auf jedem Pool-PC zur Verfügung... Makro verwenden Nach der beschriebenen Installation lässt sich mit dem Menübefehl die folgende Dialogbox öffnen: Analysieren > Regression > PROCESS Befindet sich der installierende Benutzer in der Gruppe der Administratoren, wählt SPSS einen anderen Installationsordner: 3

24 Wir fordern für das in Abschnitt..4 beschriebene Beispiel mit der vermuteten Medienwirkung (SPSS- Variable PMI) als Mediator für den Effekt der Artikel-Platzierung (SPSS-Variable COND) auf das Hamstern von Zucker (SPSS-Variable REACTION) eine PROCESS-Analyse an: Verwenden Sie REACTION als Outcome-Variable. Verwenden Sie COND als Independent Variable. Verwenden Sie PMI als M Variable (Mediator). Erhöhen Sie die Anzahl der Bootstrap Samples auf. Ansonsten können Sie alle Voreinstellungen übernehmen (z.b. die Model Number 4). Öffnen Sie den Options-Dialog mit dem gleichnamigen Schalter, und fordern Sie die folgenden zusätzlichen Ausgaben an: Heteroscedasticity-consistent SEs Bei der Regression von REACTION auf COND und PMI hat sich eine ausgeprägte Heteroskedastizität der Residuen gezeigt (vgl. Abschnitt..4.3.), so dass bei Signifikanztests und Vertrauensintervallen robuste Standardfehler verwendet werden sollten. Sobel test Total effect model 4

25 Man kann PROCESS auch per Syntax verwenden und damit besonders rationell einsetzen. Allerdings lässt sich die Syntax nicht über den Einfügen-Schalter im benutzerdefinierten Dialog produzieren, sondern muss in einem Syntaxfenster (zu öffnen mit dem Menübefehl Datei > Neu > Syntax) komplett selbst verfasst werden, was aber aufgrund der geschickt entworfenen Syntaxregeln keinen großen Aufwand bedeutet. Als offizielle Dokumentation zur Verwendung des PROCESS-Makros fungiert das Buch von Hayes (3) über Mediations- und Moderationsanalyse, auf das wir auch in diesem Manuskript oft zurückgreifen. Das folgende Kommando führt dieselbe Analyse aus, die wir oben über Dialogboxen angefordert haben: process vars=cond pmi reaction /y=reaction /x=cond /m=pmi /model=4 /total= /normal= /boot= /hc3=. Während das benutzerdefinierte Dialogfeld nach der Installation permanent zur Verfügung steht, muss vor der Verwendung des Kommandos in einer SPSS-Sitzung das Makro PROCESS explizit geladen werden, was auf einem von den folgenden Wegen geschehen kann: Das zugehörige benutzerdefinierte Dialogfeld einmalig verwenden Die SPSS-Syntaxdatei process.sps, die sich im heruntergeladenen Archiv befindet (vgl. Abschnitt..) öffnen und ausführen Erläuterungen zu den im Beispiel verwendeten PROCESS-Subkommandos: Im VARS-Subkommando sind alle Variablen aufzulisten. In den Subkommandos Y, X und M gibt man das Kriterium, den Regressor und den Mediator an. Das MODEL-Subkommando nennt den Analysetyp. Die von PROCESS aktuell (Juli 5) unterstützten 76 Modellen werden in der Datei templates.pdf erläutert, die sich im heruntergeladenen Archiv befindet. Das Subkommando TOTAL fordert Ergebnisse zum totalen Effekt an. Das Subkommando NORMAL fordert den Sobel-Test an. Mit dem Subkommando BOOT kann man die voreingestellte Anzahl von Bootstrap-Sekundärstichproben erhöhen. Mit dem Subkommando HC3 fordert man bei verletzter Varianzhomogenität die Heteroskedastizitäts-konsistenten Standardfehler an..3 Ergebnisse für das Beispiel mit dem medialen Mediator Nachdem der PROCESS-Hauptdialog oder die Syntax abgeschickt wurde, erscheint im Ausgabefenster eine Textausgabe mit den Ergebnissen. Nach einer einleitenden Beschreibung des Modells erfahren wir von einem knapp signifikanten zweiseitigen Test zum Steigungskoeffizienten in der bivariaten Regression von PMI auf COND: Run MATRIX procedure: Model = 4 Y = reaction X = cond M = pmi Sample size 3 5

26 ************************************************************************** Outcome: pmi Model Summary R R-sq MSE F df df p,88,37,76 4,46,,,465 Model coeff se t p LLCI ULCI constant 5,3769,67 3,575, 5,459 5,78 cond,4765,369,5,465,75,9455 ************************************************************************** Wegen unserer Entscheidung für die Verwendung von Heteroskedastizitäts-konsistenten Standardfehlern weichen der Signifikanztest und das Vertrauensintervall leicht von den im Abschnitt und bei Hayes (3, S. 99) berichteten Ergebnissen ab, was auch für die folgenden Tabellen gilt. In der Regression von REACTION auf COND und PMI zeigt sich trotz Heteroskedastizitäts-Korrektur im Wesentlichen dasselbe Bild, das die SPSS-Regressionsprozedur geliefert hat. Während der Mediator PMI als signifikant beurteilt wird, ist der Regressor COND weit von einer Signifikanz entfernt: Outcome: reaction Model Summary R R-sq MSE F df df p,4538,59,944 3,94,,, Model coeff se t p LLCI ULCI constant,569,445,36,95 -,739,377 pmi,564,796 6,3633,,3489,664 cond,544,598,979,396 -,6,7688 Auch beim totalen Effekt von COND auf REACTION hat die Heteroskedastizitäts-Korrektur wenig Einfluss auf das Ergebnisbild: ************************** TOTAL EFFECT MODEL **************************** Outcome: reaction Model Summary R R-sq MSE F df df p,63,57,36 3,746,,,773 Model coeff se t p LLCI ULCI constant 3,5, 6,683,,85 3,648 cond,4957,78,788,773 -,55,465 Der zweiseitige Test kann seine Nullhypothese nicht verwerfen. Halbiert man sein p-level, erhält man das p-level des einseitigen Tests, das die kritische Grenze von,5 unterschreitet, so dass die Nullhypothese des einseitigen Tests (H : ) zu verwerfen ist. Der einseitige Test ist zulässig, wenn die Hypothesenrichtung bereits vor der Datenerhebung festgelegt worden war. Nun kommen wir zu den spannenden Signifikanztests zur Mediationshypothese (H : α = ). Im Sobel- Test (Normal theory test) wird das Signifikanzkriterium zur zweiseitigen Nullhypothese knapp verfehlt: 6

27 ***************** TOTAL, DIRECT, AND INDIRECT EFFECTS ******************** Total effect of X on Y Effect SE t p LLCI ULCI,4957,78,788,773 -,55,465 Direct effect of X on Y Effect SE t p LLCI ULCI,544,598,979,396 -,6,7688 Indirect effect of X on Y Effect Boot SE BootLLCI BootULCI pmi,43,3,83,57 Normal theory tests for indirect effect Effect se Z p,43,7,8968,579 ******************** ANALYSIS NOTES AND WARNINGS ************************* Number of bootstrap samples for bias corrected bootstrap confidence intervals: Level of confidence for all confidence intervals in output: 95, NOTE: All standard errors for continuous outcome models are based on the HC3 estimator END MATRIX Das Bootstrap-Vertrauensintervall liegt komplett auf der positiven Seite, enthält den Wert Null also nicht, sodass der darauf basierende Signifikanztest die Nullhypothese verwirft. Weil im Bootstrap-Verfahren ein Pseudozufallszahlengenerator im Spiele ist, können die Ergebnisse von einem Prozeduraufruf zum nächsten leicht abweichen, was bei knappen Verhältnissen durchaus zu unterschiedlichen Testergebnissen führen kann. Dem PROCESS-Makro kann über das Subkommando SEED ein Startwert für den Pseudozufallszahlengenerator diktiert werden, so dass stets dieselben Pseudozufallszahlen verwendet werden, z.b.: process vars=cond pmi reaction /y=reaction /x=cond /m=pmi /model=4 /total= /normal= /boot= /hc3= /seed=3. Das löst zwar nicht die Abhängigkeit vom Startwert des Zufallszahlengenerators, macht die Ergebnisse aber reproduzierbar. Um den Einfluss des Startwerts zu schwächen (und dabei auch noch die Präzision der Ergebnisse zu steigern), kann man die Anzahl der Sekundärstichproben erhöhen. Für die obige Auswertung wurden daher Sekundärstichproben verwendet. Bei einem PROCESS-Einsatz mit lediglich Bootstrap-Sekundärstichproben resultierte für dieselben Daten das folgende Ergebnis mit einem Konfidenzintervall für ab, das die Null enthält: Indirect effect of X on Y Effect Boot SE BootLLCI BootULCI pmi,43,33 -,88,58..4 Einseitige Bootstrap-Vertrauensintervalle und -Signifikanztests Um mit dem PROCESS-Makro einseitige Signifikanztests mit Bootstrap-Technik anzufordern, setzt man das Konfidenzniveau auf 9%, was im Dialogfeld und per Syntax möglich ist, z.b.: process vars=cond pmi reaction /y=reaction /x=cond /m=pmi /model=4 /total= /normal= /boot= /conf=9 /hc3=. 7

28 Aus dem so erhaltenen zweiseitigen 9% - Vertrauensintervall entsteht ein einseitiges 95% - Vertrauensintervall, indem die rechte Intervallgrenze durch oder die linke Grenze durch - ersetzt wird. Im medialen Beispiel ist aufgrund der Alternativhypothese H : α > die rechte Grenze des von PROCESS ermittelten zweiseitigen 9% - Vertrauensintervalls durch zu ersetzen. Aus der Ausgabe Indirect effect of X on Y Effect Boot SE BootLLCI BootULCI pmi,43,35,54,485 resultiert das folgende einseitige 95% - Vertrauensintervall: [,54; ) Die einseitige Nullhypothese wird genau dann abgelehnt, wenn das einseitige 95% - Vertrauensintervall den Wert nicht enthält..3 Modelle mit mehreren Mediatoren Um ein empirisches System mit akzeptabler Approximation zu beschreiben, ist es oft erforderlich, das bisher betrachtete einfache Mediationsmodell bestehend aus den drei Variablen X, M und Y zu erweitern: Beim Einfluss von X auf Y können mehrere, parallel wirkende Mediatoren M, M,... beteiligt sein. Indem mehrere parallele Mediationspfade in ein Modell einbezogen werden, können die Beiträge der einzelnen Pfade verglichen werden. Es kann sich insbesondere herausstellen, dass ein bestimmter mutmaßlicher Mediator nur scheinbar auf das Kriterium einwirkt. Mehrere Mediatoren können seriell wirken, z.b. mit der Kausalkette X M M Y. Hier hat der Mediator M einen Effekt auf den Mediator M..3. Parallele Mediationspfade.3.. Beispiel Bei der Zerlegung eines totalen Effekts in mehrere parallele indirekte Effekte und einen direkten Effekt beschränkt man sich in der Regel auf relativ wenige Mediatoren, häufig auf. Wir erweitern das in Abschnitt..4 vorgestellte Beispiel aus einer bei Hayes (3) beschriebenen Studie von Tal-Or et al. () um einen zweiten Mediator. Im Beispiel geht es um den Effekt der Platzierung eines Artikels über Zuckerverknappung (COND) auf das Hamsterverhalten (REACTION), wobei bisher die unterstellte mediale Beeinflussung der Öffentlichkeit (PMI) als Mediator untersucht wurde. In der Studie wurden die Probanden zusätzlich gebeten, die Bedeutung der im Artikel beschriebenen Zuckerverknappung einzuschätzen (SPSS- Variable IMPORT). Für diese Variable ist ebenfalls eine Mediatorwirkung anzunehmen: Die beiden Instruktionen über die Platzierung des Artikels (auf der ersten Seite einer überregionalen Zeitung versus im Innenteil dieser Zeitung) sollten sich auf die eingeschätzte Bedeutung des Themas auswirken. Für die eingeschätzte Bedeutung des Themas ist ein positiver Effekt auf die Zuckerbeschaffung anzunehmen. Es könnte sich herausstellen, dass die Variable PMI (vermuteter Einfluss des Artikels auf die Öffentlichkeit) die Rolle eines Mediators nur scheinbar ausübt, weil sie mit dem tatsächlichen, bislang weggelassenen Mediator IMPORT korreliert. Wir erweitern das Pfadmodell um den mutmaßlichen Mediator IMPORT: 8

29 PMI PMI a b COND c' REACTION RN a IMPORT b IMP Abbildung 6: Artikelplatzierung und Hamsterverhalten. Modellstruktur mit zwei Mediatoren in Parallelschaltung Der totale Effekt c von COND auf REACTION lässt sich nun folgendermaßen in den direkten Effekt c' und die beiden spezifischen indirekten Effekte a b und a b zerlegen: c = c' + a b + a b.3.. Schätzen und Testen mit PROCESS Viele Parameterschätzer und Signifikanztests zu den drei beteiligten Regressionsgleichungen für die Kriterien PMI, IMPORT und REACTION können mit der SPSS-Regressionsprozedur ermittelt werden (vgl. Abschnitt..4.). Wir verwenden aber gleich das Makro PROCESS (vgl. Abschnitt.), das ebenfalls die OLS-Schätzer liefert (auf Wunsch mit Heteroskedastizitäts-konsistenten Standardfehlern) und außerdem Mediations-spezifische Zusatzergebnisse (z.b. Bootstrap-basierte Signifikanztests zu den indirekten Effekten). Nach der in Abschnitt.. beschriebenen Installation lässt sich mit dem Menübefehl die folgende Dialogbox öffnen: Analysieren > Regression > PROCESS Spezifizieren Sie folgendermaßen das erweiterte Modell: 9

30 Verwenden Sie REACTION als Outcome-Variable. Verwenden Sie COND als Independent Variable. Verwenden Sie PMI und IMORT als M Variablen (Mediatoren). Erhöhen Sie die Anzahl der Bootstrap Samples auf. Ansonsten können Sie alle Voreinstellungen übernehmen (z.b. die Model Number 4). Öffnen Sie den Options-Dialog mit dem gleichnamigen Schalter, und fordern Sie die folgenden zusätzlichen Ausgaben an: Heteroscedasticity-consistent SEs Auch in der der Regression von REACTION auf COND, PMI und IMPORT spricht der Test von Breusch & Pagan für heterogene Residualvarianzen. Sobel test Total effect model Compare indirect effects Aufgrund dieser Anforderung vergleicht PROCESS paarweise die indirekten Effekte. Das folgende Kommando führt dieselbe Analyse aus, die wir eben über Dialogboxen spezifiziert haben: process vars=cond pmi import reaction /y=reaction /x=cond /m=pmi import /model=4 /total= /normal= /boot= /hc3= /contrast=. Erläuterungen zu den Erweiterungen im Vergleich zur Kommando-Version in Abschnitt..: Die Variable IMPORT wird im VARS- und im M-Subkommando zusätzlich angegeben. Mit dem Wert im Subkommando CONTRAST wird ein Vergleich der indirekten Effekte angefordert. Wir erhalten für COND einen positiven Effekt von,63 auf den Mediator IMPORT, der im zweiseitigen Test auf der Basis eines robusten Standardfehlers knapp signifikant wird (p =,479): Outcome: import Model Summary R R-sq MSE F df df p,89,37,94 3,9938,,,479 Model coeff se t p LLCI ULCI constant 3,977,7 8,88, 3,498 4,374 cond,668,336,9985,479,59,477 3

31 Wegen der für COND gewählten Kodierung ( für die Titelseite, für den Innenteil) zeigt sich also bei der Titelseitengruppe ein um,63 höherer IMPORT-Mittelwert. In der Regression von REACTION auf COND, PMI und IMPORT haben beide Mediatoren ein signifikantes positives Gewicht, während der direkte Effekt von COND die Signifikanzgrenze deutlich verfehlt: Outcome: reaction Model Summary R R-sq MSE F df df p,57,35,668 5,5779 3, 9,, Model coeff se t p LLCI ULCI constant -,498,397 -,3835,7 -,934,638 pmi,3965,786 5,478,,4,55 import,344,753 4,373,,753,4736 cond,34,44,436,676 -,3799,5867 Für die indirekten Effekte (über PMI bzw. IMPORT) werden positive Werte geschätzt. Die auf fragwürdigen Normalverteilungsannahmen basierenden Sobel-Tests können die zweiseitigen Nullhypothesen zu den indirekten Effekten nicht zurückweisen: Normal theory tests for specific indirect effects Effect se Z p pmi,89,8,8377,66 import,33,46,7739,76 Das gelingt hingegen den Bootstrap-basierten Tests, die nach Abschnitt..7. über eine bessere Teststärke verfügen: Indirect effect of X on Y Effect Boot SE BootLLCI BootULCI TOTAL,393,638,94,748 pmi,89,54,3,438 import,33,38,8,484 (C) -,44,458 -,37,664 Beide Vertrauensintervalle befinden sich komplett im positiven Bereich, so dass wir auf signifikant positive indirekte Effekte schließen dürfen. Damit hat PMI seine Mediatorrolle im erweiterten Modell nicht verloren. Auch für den kombinierten indirekten Effekt a b + a b ergibt sich ein signifikant positiver Wert (siehe Ausgabezeile TOTAL). In der Ausgabezeile zum Kontrast (C) wird die folgende Hypothese beurteilt: H : α - α = Der Wert liegt fast in der Mitte des Bootstrap-Vertrauensintervalls, und wir folgern, dass auf den beiden Mediationspfaden ungefähr derselbe Effekt bei REACTION ankommt..3. Mediatoren in Serie In der aktuellen Forschungspraxis wird bei Modellen mit mehreren Mediatoren meist die in Abschnitt.3. beschriebene Parallelschaltung verwendet, wobei Beziehungen zwischen den Mediatoren nicht beachtet werden (Hayes 3, S. 43). Gelegentlich ist aber die Serienschaltung angemessen, wobei kausale Wirkungen auch zwischen Mediatoren angenommen werden. 3

32 Unser Beispiel zum Effekt der Platzierung eines Artikels über Zuckerverknappung (COND) auf das Hamsterverhalten (REACTION) der Probanden enthält seit der letzten Erweiterung (siehe Abschnitt.3..) zwei parallel wirkende Mediatoren: Die unterstellte mediale Beeinflussung anderer Personen (PMI) durch den Artikel Die eingeschätzte Bedeutung der im Artikel beschriebenen Zuckerverknappung (IMPORT) Es scheint plausibel, dass die vermutete mediale Beeinflussung umso größer ausfällt, je bedeutsamer das im Artikel beschriebene Thema wahrgenommen wird. Statistisch sollte sich diese Wirkung dadurch artikulieren, dass die Assoziation von PMI und IMPORT nicht vollständig durch den Einfluss der gemeinsamen Ursache COND erklärt werden kann. Tatsächlich ist die partielle Korrelation von PMI und IMPORT bei Kontrolle von COND signifikant (r (PMI,IMP).COND =,58; p =,4; vgl. Hayes 3, S. 49). In SPSS fordert man die partielle Korrelation nach dem Menübefehl in der folgenden Dialogbox an: Analysieren > Korrelation > Partiell Lässt man die in Abschnitt.3.. beschriebene Modellvariante (reine Parallelschaltung der beiden Mediatoren PMI und IMPORT) mit dem Strukturgleichungsprogramm Amos (siehe Baltes-Götz ) schätzen, fällt die Fehlspezifikation durch eine schlechte Modellbeurteilung auf (z.b. RMSEA =,46). Durch einen signifikanten Modifikationsindikator (Wert > 7) empfiehlt Amos, in das folgende Modell Abbildung 7: Artikelplatzierung und Hamsterverhalten. Durch Amos geschätztes Modell mit zwei Mediatoren in Parallelschaltung 3

33 entweder einen Effekt von PMI auf IMPORT oder einen Effekt von IMPORT auf PMI aufzunehmen: Regression Weights: (Group number - Default model) M.I. Par Change import <--- pmi 7,843,38 pmi <--- import 7,843,9 Unsere Entscheidung für den zweiten Vorschlag wird durch theoretische Überlegungen klar diktiert. Im folgenden Modell ist ein kausaler Einfluss des Mediators IMPORT auf den Mediator PMI enthalten: PMI PMI a b COND d c' REACTION RN a IMPORT b IMP Abbildung 8: Artikelplatzierung und Hamsterverhalten. Modellstruktur mit zwei Mediatoren in Parallel- und Serienschaltung Der totale Effekt c von COND auf REACTION lässt sich nunmehr in den direkten Effekt c' und drei indirekte Effekte zerlegen: c = c' + a b + a b + a d b Wir verwenden das Makro PROCESS (vgl. Abschnitt.), das die OLS-Schätzer zu den drei Regressionsgleichungen liefert (auf Wunsch mit Heteroskedastizitäts-konsistenten Standardfehlern) und außerdem Mediations-spezifische Zusatzausergebnisse (z.b. Bootstrap-basierte Signifikanztests zu den indirekten Effekten). Nach der in Abschnitt.. beschriebenen Installation lässt sich mit dem Menübefehl die folgende Dialogbox öffnen: Analysieren > Regression > PROCESS 33

34 Spezifizieren Sie folgendermaßen das erweiterte Modell: Verwenden Sie REACTION als Outcome-Variable. Verwenden Sie COND als Independent Variable. Verwenden Sie IMORT und PMI (in dieser Reihenfolge!) als M Variablen (Mediatoren). Während die Reihenfolge im Modell mit parallelen Mediationspfaden irrelevant war, definiert sie nun die kausale Anordnung der Mediatoren. Wählen Sie die Model Number 6. Erhöhen Sie die Anzahl der Bootstrap Samples auf. Ansonsten können Sie die Voreinstellungen beibehalten. Öffnen Sie den Options-Dialog mit dem gleichnamigen Schalter, und fordern Sie die folgenden zusätzlichen Ausgaben an: Heteroscedasticity-consistent SEs Auch in der der Regression von REACTION auf COND, PMI und IMPORT spricht der Test von Breusch & Pagan für heterogene Residualvarianzen. Total effect model 34

35 Compare indirect effects Aufgrund dieser Anforderung vergleicht PROCESS paarweise die indirekten Effekte. Die Option Sobel test zu wählen, bleibt bei Modellen mit seriellen Mediation ohne Wirkung, was nach den bisherigen Begründungen und Erfahrungen mit Normalverteilungs-basierten Tests für indirekte Effekte keine nennenswerte Einschränkung darstellt. Das folgende Kommando führt dieselbe Analyse aus, die wir eben durch Dialogboxen angefordert haben: process vars=cond pmi import reaction /y=reaction /x=cond /m=import pmi /model=6 /total= /normal= /boot= /hc3= /contrast=. Im Vergleich zu dem in Abschnitt.3.. für ein Modell mit parallelen Mediationspfaden benutzen Kommando sind folgende Änderungen erforderlich: Durch den MODEL-Wert 6 wird ein Modell mit serieller Mediation angefordert. Die Reihenfolge der M-Variablen wurde geändert (IMPORT vor PMI), weil sie im Model 6 die kausale Anordnung festlegt. Das Subkommando NORMAL ist entfallen. Bei den folgenden Partialmodellen (Regressionsgleichungen) hat sich nichts geändert im Vergleich zum Modell mit parallelen Mediatoren: Regression von IMPORT auf COND Regression von REACTION auf COND, PMI und IMPORT Damit ist insbesondere der direkte Effekt von COND auf REACTION von der letzten Modellveränderung nicht betroffen. In der Regression vom PMI auf COND und IMPORT verfehlt COND die Signifikanzgrenze deutlich (p =,395): Outcome: pmi Model Summary R R-sq MSE F df df p,34,97,67 5,93,,,69 Model coeff se t p LLCI ULCI constant 4,64,3995,544, 3,894 5,44 import,96,799,4559,55,38,3543 cond,3536,377,4874,395 -,7,84 Wenn die subjektive Bedeutung der Zuckerverknappung statistisch konstant gehalten wird, hat COND keinen direkten Effekt mehr auf PMI. Allerdings hat COND noch einen indirekten Effekt auf PMI über IM- PORT. Im folgenden Pfaddiagramm sind die geschätzten Regressionskoeffizienten mit eingeklammerten Überschreitungswahrscheinlichkeiten zu sehen: Um zu diesem speziellen indirekten Effekt von PROCESS einen Bootstrap-basierten Signifikanztest zu erhalten, ist allerdings ein alternatives Kommando erforderlich. 35

36 PMI PMI,35 (,4),4 (,) COND, (,), (,67) REACTION RN,63 (,48) IMPORT,3 (,) IMP Abbildung 9: Artikelplatzierung und Hamsterverhalten. Geschätztes Modell mit zwei Mediatoren in Parallel- und Serienschaltung PROCESS liefert Bootstrap-basierte Signifikanztests, welche die drei indirekten Effekte von COND auf REACTION mit dem Wert sowie untereinander vergleichen: Indirect effect(s) of X on Y Effect Boot SE BootLLCI BootULCI Total:,393,658,87,7386 Ind :,33,48,6,4698 Ind :,488,354,39,53 Ind3 :,4,5 -,338,368 (C),546,988,96,49 (C),63,568 -,38,3896 (C3) -,95,86 -,37,3 Indirect effect key Ind : cond -> import -> reaction Ind : cond -> import -> pmi -> reaction Ind3 : cond -> pmi -> reaction Specific indirect effect contrast definitions (C) Ind minus Ind (C) Ind minus Ind3 (C3) Ind minus Ind3 Die folgenden speziellen indirekten Effekte werden als signifikant beurteilt ( außerhalb des Bootstrap- Vertrauensintervalls): COND IMPORT REACTION COND IMPORT PMI REACTION Wie aufgrund der Einzelstreckenbeurteilungen zu erwarten, wird der indirekte Effekt von COND auf REACTION über PMI nicht signifikant (Vertrauensintervall [-,338;,368]). Im Sinne von Hayes (3) sollte man sich dabei zurückhalten, aufgrund von separaten t-tests für die Einzelstrecken auf einem Mediationspfad Beurteilungen von indirekten Effekten vorzunehmen (vgl. Abschnitt..6). Allerdings befand sich die Einzelstreckenmethode bei den bisherigen Beispielen nie im Widerspruch zur Bootstrap-Bewertung des indirekten Effekts. Von den Kontrasten zwischen den drei indirekten Effekten von COND auf REACTION wird nur (C) signifikant. Auf dem Pfad COND IMPORT REACTION erzielt COND einen stärkeren Effekt auf RACTION als auf dem längeren Pfad COND IMPORT PMI REACTION. 36

37 Bei Modellen mit drei oder mehr seriellen Mediatoren bezieht PROCESS alle möglichen Pfade ein, was zu einer hohen Anzahl von Parametern führt. Wer mehr Flexibilität zur Anforderung eines sparsameren Modells wünscht, kann z.b. das Strukturgleichungsprogramm Amos verwenden (siehe oben), das wie PROCESS auch Bootstrap-basierte Signifikanztests zu den indirekten Effekten liefert..4 Kontrollvariablen Mit einem Mediationsmodell ist ein kausaler Erklärungsanspruch verbunden. Wenn man X experimentell manipuliert und die Fälle zufällig den Bedingungen zuweist, ist die kausale Interpretierbarkeit (Unverzerrtheit) gesichert für: den Effekt von X auf die Mediatoren den totalen Effekt von X auf das Kriterium Bei den Effekten von den Mediatoren auf das Kriterium bleibt man trotz Experimentaltechnik darauf angewiesen, dass alternative Erklärungen unplausibel gemacht werden können. Dies kann geschehen... durch die statistische Kontrolle von Kausalitätskonkurrenten Um Kontrollvariablen in ein Mediationsmodell aufnehmen zu können, muss man sie bei der Studienplanung berücksichtigt und erfasst haben. durch theoretische Argumente Bei einer reinen Beobachtungsstudie müssen auch für die Effekte von X auf die Mediatoren sowie für den direkten Effekt von X auf das Kriterium alternative Deutungen durch statistische oder theoretische Argumente unplausibel gemacht werden. In Abschnitt.3. über parallele Mediationspfade ging es auch um die Frage, wie sich falsche Erklärungen für den totalen Effekt von X auf Y durch scheinbare Mediatoren entlarven, indem alternative Mediatoren in das Modell aufgenommen werden. Im aktuellen Abschnitt geht es um Kontrollvariablen, die keinen Effekt von einer Modellvariablen erhalten, aber potentiell auf das Kriterium und auf Mediatoren einwirken. Kontrollvariablen einzubeziehen, kann auf die primär interessanten Pfadgewichte im Modell zwei Effekte haben: Aufdeckung von Scheineffekten In diesem Fall helfen die Kontrollvariablen, falsche Kausalinterpretationen zu vermeiden. Verbesserte Signifikanzbeurteilung durch die Verringerung der Fehlervarianz In diesem Fall helfen die Kontrollvariablen, die primär interessierenden Effektmuster zu belegen. Durch die Aufnahme vom Kontrollvariablen C, C,..., C k in das einfache Mediationsmodell (vgl. Abschnitt..) gehen die Gleichungen () und () über in: Nach wie vor bezeichnet man... k M = i X C j j M (6) j k Y = i X M C ' j j Y (7) ' als den direkten Effekt von X auf Y α als den von M vermittelten indirekten Effekt von X auf Y und die Summe ' + α als den totalen Effekt von X auf Y. j Unser Standardbeispiel (Einfluss der Platzierung eines Zeitungsartikels über Zuckerknappheit auf die Zuckerbeschaffung) ist zur Demonstration von Kontrollvariablen u.a. wegen der hier realisierten experimen- 37

38 tellen Manipulation des Regressors wenig geeignet. Daher verwenden wir Simulationsdaten, die in der Datei medkon.sav an der im Vorwort genannten Stelle zu finden sind. In der simulierten Welt werden Y, X und M von einer Variablen C beeinflusst, während X weder einen direkten, noch einen von M vermittelten indirekten Effekt auf Y ausübt: M X Y C Abbildung : Scheineffekte von X und M auf Y Lässt man mit PROCESS ein einfaches, also fehlspezifiziertes Mediationsmodell ohne die Kontrollvariable schätzen, erhält man u.a. einen signifikanten indirekten Effekt von X auf Y über M: Indirect effect of X on Y Effect Boot SE BootLLCI BootULCI M,753,348,9,54 Um das Mediationsmodell inklusive Kontrollvariable von PROCESS schätzen und testen zu lassen, öffnen wir mit dem Menübefehl die folgende Dialogbox: Analysieren > Regression > PROCESS Spezifizieren Sie folgendermaßen das erweiterte Modell: 38

39 Verwenden Sie Y als Outcome-Variable, X als Independent Variable, M als M Variable und C als Covariate. Erhöhen Sie die Anzahl der Bootstrap Samples auf. Ansonsten können Sie die Voreinstellungen beibehalten. Das gilt auch für das Optionsfeld im Rahmen Covariate(s) in models of (unten links), wo die Voreinstellung dafür sorgt, dass die Kovariate in die Modelle für den Mediator und das Kriterium aufgenommen wird. Das folgende Kommando führt dieselbe Analyse aus, die wir eben per Dialogbox spezifiziert haben: process vars=y X M C /y=y /x=x /m=m /model=4 /total= /boot=. Mit der Kontrollvariablen in den beiden Regressionsgleichungen werden alle Scheineffekte aufgedeckt, so dass z.b. der indirekte Effekt nicht mehr signifikant ist: Indirect effect of X on Y Effect Boot SE BootLLCI BootULCI M -,4,7 -,63,55 39

40 Moderation. Einleitung Im Modell der multiplen linearen Regressionsanalyse zur Erklärung einer abhängigen Variablen Y (Kriterium) durch die unabhängigen Variablen X,..., X k (Regressoren) Y X X... k X k (8) wird z.b. für den Regressor X behauptet, dass eine Steigerung seiner Ausprägung um den Wert Eins, also der Übergang von einem Fall mit dem X Wert u zu einem Fall mit dem X Wert (u + ), die Erwartung für das Kriterium um den Wert erhöht, wenn alle anderen Regressoren konstant bleiben. Dabei spielt es keine Rolle, auf welchen Werten die anderen Regressoren konstant gehalten werden. Dies zeigt die folgende Darstellung der Prognosen Yˆ X eines Modells mit zwei metrischen Prädiktoren X und X : X Der Modellansatz ist linear und additiv in den Koeffizienten,,..., k, jedoch nicht unbedingt in den ursprünglich gegebenen unabhängigen Variablen. Um den quadratischen Effekt einer X-Variablen auf das Kriterium zu modellieren, muss man lediglich die quadrierte Variante der X-Variablen zusätzlich in das Modell aufnehmen, z.b.: Y X X Auf analoge Weise lassen sich viele scheinbar nicht-lineare Modelle linearisieren. Wie kann man aber im Rahmen der multiplen linearen Regressionsanalyse eine nicht-additive Hypothese über den Interaktionseffekt mehrerer, auch quantitativer Regressoren auf ein quantitatives Kriterium untersuchen? Ein nicht-additives Modell mit einem metrischen Kriterium und zwei metrischen Regressoren besitzt eine verbogene Reaktionsoberfläche als Modellprognose, wie sie z.b. auf dem Deckblatt dieses 4

41 Manuskripts zu sehen ist. Gleich ist zu erfahren, wie man im Rahmen des linearen Modells mit einfachen Mitteln eine solche verbogene Reaktionsoberfläche erzeugt... Beispiel In einem fiktiven Forschungsprojekt (N = 4) soll untersucht werden, wovon das Gehalt der Mitarbeiter eines großen Unternehmens abhängt (SPSS-Variablenname: GEHALT). Als Regressoren sollen in das gesuchte Modell einbezogen werden: Eignung für die ausgeübte Tätigkeit (Variablenname: EIGNUNG) Zur Operationalisierung wird ein bei der Einstellung durchgeführter Eignungstest herangezogen. Dienstalter (Variablenname: DALTER) Wie lange arbeitet die oder der Beschäftigte schon im Unternehmen? Für die Variable EIGNUNG soll Intervallskalenqualität angenommen werden, bei der Variablen DALTER ist diese Voraussetzung (bei hinreichend genauer Messung) zweifellos erfüllt. Es ist davon auszugehen, dass die Leistungsfähigkeit eines Mitarbeiters umso stärker mit der Dienstzeit (Erfahrung) zunimmt, je geeigneter er für seinen Beruf ist. Da im fiktiven Unternehmen die Bezahlung leistungsorientiert erfolgt, sollten also die beiden Regressoren EIGNUNG und DALTER in folgender Weise in Hinblick auf die abhängige Variable GEHALT interagieren: Das Gehalt steigt umso stärker mit dem Dienstalter an, je geeigneter ein Mitarbeiter bei der Einstellung war. Wir haben es mit einem Interaktionseffekt von DALTER und EIGNUNG auf GEHALT zu tun. Man sagt auch: Der Effekt von DALTER auf GEHALT wird durch die Variable EIGNUNG moderiert. Variablen mit solcher Wirkung werden oft als Moderatorvariablen bezeichnet. In einem konzeptionellen Pfaddiagramm im Sinn von Hayes (3, S. 78ff) wird die Situation folgendermaßen dargestellt: Eignung Dienstalter Gehalt Man kann den Sachverhalt aber auch so beschreiben, dass der Effekt von EIGNUNG auf GEHALT durch DALTER moderiert wird. Je nach konkreter Situation drängt sich eine bestimmte Verteilung der Rollen Regressor und Moderator auf die beiden beteiligten Variablen mehr oder weniger auf. Es wird sich jedenfalls zeigen, dass Regressor und Moderator im zu entwickelnden statistischen Modell perfekt symmetrisch agieren. An der im Vorwort vereinbarten Stelle finden Sie die SPSS-Datendatei gehalt.sav mit den simulierten Daten sowie die Datei gehalt.sps mit der generierenden Syntax. Um den terminologischen Aufwand gering zu halten, werden wir in Modellen mit zwei interagierenden Prädiktoren den Begriff Regressor gegenüber dem üblichen Gebrauch eingeengt nur auf diejenige unabhängige Variable anwenden, deren bedingte Effekte für bestimmte Werte des Moderators betrachtet werden. 4

42 .. Interaktionseffekte mit metrischen und kategorialen Regressoren Interaktionseffekte sind keinesfalls exotisch, sondern at the very heart of theory testing in the social sciences (Cohen et al. 3, S. 55). Aguinis () stellt für die Organisationspsychologie fest, dass praktisch jede signifikante Theorie Interaktionseffekte enthält. In der Varianzanalyse werden Interaktionseffekte ganz selbstverständlich und routinemäßig untersucht. Allerdings ist diese Methode am ehesten für diskrete (bevorzugt kategoriale) Faktoren geeignet, die in wenigen Ausprägungen vorliegen. Im folgenden Beispiel geht es um den Effekt von Düngemitteln (kategorialer Regressor mit zwei Ausprägungen) auf das Längenwachstum bei verschiedenen Grassorten (kategorialer Moderator mit zwei Ausprägungen): Während bei der Grassorte Power Grass der Dünger Forte 4 überlegen ist, hat bei Gras der Sorte Evergreen der Dünger WM 4 den besseren Effekt. Es hängt also von der Grassorte ab, welcher Dünger das bessere Längenwachstum bewirkt. In unserem Unternehmensbeispiel besitzen die Prädiktoren hingegen Intervallskalenqualität und sind in zahlreichen Ausprägungen beobachtet worden. In manchen Forschungsprojekten fehlt offenbar die in diesem Kurs vorzustellende Methodologie zur Analyse von Interaktionseffekten mit Beteiligung intervallskalierter Prädiktoren, so dass eine der beiden folgenden suboptimalen Vorgehensweisen gewählt wird (vgl. Aiken & West, 99): Interaktion ignorieren In unserem Beispiel aus Abschnitt.. würde also das folgende, vermutlich falsche, Modell angesetzt: GEHALT = + DALTER + EIGNUNG + Fehler In Abhängigkeit vom Typ der ignorierten Interaktion resultieren auf diese Weise mehr oder weniger sinnlose Effektschätzungen. Künstliche Kategorisierung (z.b. Median-Dichotomisierung) der Regressoren, um eine Varianzanalyse rechnen zu können Diese nach den Beobachtungen von Frazier et al. (4, S. 7) sehr verbreitete Methode ist das etwas kleinere Übel. Man reduziert den Informationsgehalt und handelt sich, je nach Modell unterschiedlich ausgeprägte, Verluste bei der Teststärke ein, indem man: o die Fehlervarianz erhöht 4

43 o und/oder Freiheitsgrade verschwendet. Wir werden uns in Abschnitt. ausführlich damit beschäftigen, wie man eine Interaktion von zwei metrischen Prädiktoren. über einen Produktterm im Modell der multiplen Regression spezifiziert (bilineare Interaktion), testet, graphisch darstellt, durch nachgeschaltete Berechnungen bzw. Tests näher analysiert In Abschnitt.3 werden Alternativen zum bilinearen Modell behandelt, insbesondere auch die Interaktion zwischen metrischen und kategorialen Prädiktoren.. Die bilineare Interaktion von zwei metrischen Prädiktoren.. Modell Die Interaktion von zwei metrischen Prädiktoren kann mit einem sehr einfachen Kniff modelliert werden, der mit jedem Programm zur multiplen Regression realisierbar ist. Es muss lediglich das Produkt der interagierenden Variablen als zusätzlicher Regressor in das Modell aufgenommen werden. In unserem Beispiel mit den beiden interagierenden Regressoren DALTER und EIGNUNG ist also das Produkt DAL- TER EIGNUNG zu bilden und in folgende Gleichung einzubeziehen: GEHALT = + DALTER + EIGNUNG + 3 DALTER EIGNUNG + Fehler (9) Gelegentlich bezeichnen wir zugunsten kompakter Formeln das Kriterium mit Y, den Regressor mit X und den Moderator mit Z, so dass folgendes Modell resultiert: Y = + X + M + 3 XM + () In Abschnitt.. war schon das konzeptionelle Pfaddiagramm zu unserem Modell zu sehen, das hier der Bequemlichkeit halber mit den Kurzbezeichnungen für die Variablen wiederholt wird: M X Y Ein Pfaddiagramm in konventionellen Sinn, das alle beteiligten Variablen zeigt (inklusive Produktterme zur Repräsentation von Wechselwirkungen und Residuen zu den abhängigen Variablen) bezeichnet Hayes (3, S. 78ff) als statistisches Pfaddiagramm. In unserem Modell mit einer einfachen Moderation resultiert: 43

44 X M Y Y XM Durch einfaches Umstellen der rechten Seite von Gleichung (9) erhalten wir die folgende Formulierung: GEHALT = ( + EIGNUNG) + ( + 3 EIGNUNG) DALTER + Fehler () Nach der Reformulierung wird offensichtlich, dass unser Modell für jeden festen Eignungswert m eine bedingte lineare Regression von GEHALT auf DALTER behauptet. Für den bedingten Ordinatenabschnitt ( m) gilt: ( m) m () ( m) Für den (meist wichtigeren) bedingten Steigungskoeffizienten (bedingten Effekt) erhalten wir: ( m) m (3) 3 Weil im Modell () die Koeffizienten der bedingten linearen Regressionen wiederum linear vom Moderator abhängen, wird es als bilinear bezeichnet. Wesentlich für den nun zu präzisierenden Interaktionsbegriff ist der in Gleichung (3) ausgedrückte Effekt des Moderators auf die bedingten Steigungen. Wir wollen genau dann von einer Interaktion der Variablen EIGNUNG und DALTER (in Bezug auf die Variable GEHALT) sprechen und EIGNUNG als Moderator bezeichnen, wenn die EIGNUNGs-bedingten Steigungskoeffizienten ( m) nicht alle gleich sind, nach Formel (3) also genau dann, wenn in Modell (9) das Regressionsgewicht 3 von Null verschieden ist. Gleichung () besagt, welcher Ordinatenabschnitt sich für eine bedingte Regression von GEHALT auf DALTER bei festem Wert von EIGNUNG ergibt. Die bedingten Ordinatenabschnitte unterscheiden sich genau dann, wenn das Regressionsgewicht aus Modell (9) von Null verschieden ist. In diesem Fall wissen wir, dass die bedingten Regressionsgeraden die Y-Achse in verschiedener Höhe passieren. Dies besagt aber nichts über eine Interaktion von DALTER und EIGNUNG, sondern kann in Abwesenheit einer Interaktion als Haupteffekt der Variablen EIGNUNG interpretiert werden. Gleichung () lässt sich offenbar auch aus einem rein additiven Modell (ohne Produktterm) gewinnen... Ergebnisse für das Beispiel... Berechnung mit der SPSS-Prozedur REGRESSION Nun soll die multiple Regression mit einem Produkt- bzw. Interaktionsterm gemäß Gleichung (9) anhand fiktiver Daten demonstriert werden, die Sie an der im Vorwort vereinbarten Stelle in der SPSS Datendatei gehalt.sav finden. Diese Datei enthält unter dem Namen DAEIG auch schon die benötigte Produktvariable DALTER EIGNUNG. In SPSS wird nach dem Öffnen der Datendatei die zuständige Dialogbox mit aufgerufen und so ausgefüllt: Analysieren > Regression > Linear 44

45 In der Statistiken - Subdialogbox verlangen wir über die Voreinstellung hinausgehend noch die Berechnung von Konfidenzintervallen: Es resultieren die folgenden Ergebnisse: 45

46 Das mit,63 recht hohe adjustierte R spricht für eine gelungene Anpassung des folgenden Modells: GEHALT = 84,7-3,4 DALTER - 4,9 EIGNUNG + 4,53 DALTER EIGNUNG + Fehler (4) an die Daten. Mit der numerischen und graphischen Veranschaulichung der Schätzergebnisse beschäftigen wir uns in Abschnitt..3. Vorher wird demonstriert, wie man dieselben Ergebnisse von der SPSS-Prozedur UNIANOVA erhalten kann, ohne eine Variable mit dem Produkt von Regressor und Moderator erstellen zu müssen.... Berechnung mit der SPSS-Prozedur UNIANOVA An Stelle der SPSS-Prozedur REGRESSION kann man auch die Prozedur UNIANOVA benutzen und dabei dem SPSS-System die Berechnung der Produktvariablen aus Regressor und Moderator überlassen. Beide Prozeduren verwenden dieselben regressionsanalytischen Algorithmen. Es bestehen einige Unterschiede bei der Modellspezifikation und den verfügbaren Ausgaben. In der via erreichbaren Dialogbox Analysieren > Allgemeines lineares Modell > Univariat bringen wir die abhängige Variable in Position und verwenden den Regressor und den Moderator als Kovariaten. In der Modell-Subdialogbox 46

47 ist ein angepasstes Modell zu wählen mit dem Regressor und dem Moderator als Haupteffekten und der Wechselwirkung aus den beiden Prädiktoren. In der Optionen-Subdialogbox fordern wir noch Schätzungen der Effektgröße und Parameterschätzer an, so dass in der Ausgabe u.a. die folgende Tabelle mit Regressionsstatistiken erscheint: Abgesehen von der Spalte mit den partiellen Eta-Quadraten ist die Tabelle identisch mit der Koeffizienten-Tabelle, welche die Prozedur REGRESSION geliefert hat. Für die Verwendung der Prozedur UNIA- NOVA sprechen Bequemlichkeitsargumente: 47

48 Man muss die Produktvariable aus Regressor und Moderator nicht explizit erstellen. Man erhält auf einfache Weise die bei Power-Analysen relevanten partiellen Eta-Quadrate (vgl. Abschnitt..5)....3 Berechnung mit dem SPSS-Makro PROCESS Das von Andrew Hayes erstellte SPSS-Makro PROCESS (vgl. Abschnitt.. zum Bezug und zur Installation) unterstützt nicht nur die Mediationsanalyse durch ergänzende Ausgaben auf aktuellem Entwicklungstand der methodologischen Forschung (siehe Abschnitt ), sondern kann auch die Moderatoranalyse erleichtern und bereichern. Nach der in Abschnitt.. beschriebenen Installation lässt sich mit dem Menübefehl die folgende Dialogbox öffnen: Analysieren > Regression > PROCESS Spezifizieren Sie folgendermaßen das Modell: Verwenden Sie GEHALT als Outcome-Variable. Verwenden Sie DALTER als Independent Variable. Verwenden Sie EIGNUNG als M Variable (Moderator). Wählen Sie die Model Number. Die explizite Berechnung der Produktvariablen aus Regressor und Moderator können wir uns beim Makro PROCESS ebenso sparen wie bei der SPSS-Prozedur UNIVARIATE. Das folgende Kommando führt dieselbe Analyse aus, die wir eben per Dialogbox spezifiziert haben: process vars=gehalt dalter eignung /y=gehalt /x=dalter /m=eignung /model=. Erläuterungen zu den im Beispiel verwendeten PROCESS-Subkommandos: Im VARS-Subkommando sind alle Variablen aufzulisten. In den Subkommandos Y, X und M gibt man das Kriterium, den Regressor und den Moderator an. Das MODEL-Subkommando nennt den Analysetyp. 48

49 In der PROCESS-Ausgabe finden sich neben auch von SPSS produzierten Schätzergebnissen u.a. die Steigungskoeffizienten zu den bedingten Regressionen von GEHALT auf DALTER für bestimmte feste Werte von EIGNUNG (Abschnitt: Conditional effect of X on Y at values of the moderator(s)): **************** PROCESS Procedure for SPSS Release.. ************** Written by Andrew F. Hayes, Ph.D. Documentation available in Hayes (3). ************************************************************************** Model = Y = gehalt X = dalter M = eignung Sample size 4 ************************************************************************** Outcome: gehalt Model Summary R R-sq MSE F df df p,7943, ,664 5,674 3, 396,, Model coeff se t p LLCI ULCI constant 84,74 96,9594,534, 994,45 375,3435 eignung -4,944 9,49 -,4448,6567 -,736 4,349 dalter -3,484 7,5338 -,4537,653-8,96,399 int_ 4,59,73 6,4586, 3,56 5,979 Interactions: int_ dalter X eignung R-square increase due to interaction(s): R-chng F df df p int_,389 4,738, 396,, ************************************************************************* Conditional effect of X on Y at values of the moderator(s): eignung Effect se t p LLCI ULCI 7,34 9,33 3,576 9,595, 3,389 35,343,75 4,859,846 9,685, 38, ,54 3,46 56,3883,9953 8,854, 5,4996 6,77 Values for quantitative moderators are the mean and plus/minus one SD from mean. Values for dichotomous moderators are the two values of the moderator. ******************** ANALYSIS NOTES AND WARNINGS ************************* Level of confidence for all confidence intervals in output: 95, Solche bedingten Regressionsgleichungen werden sich im nächsten Abschnitt als sehr nützlich zur Veranschaulichung eines Moderatormodells erweisen. 49

50 ..3 Numerische und graphische Veranschaulichung..3. Bedingte Regressionsgeraden berechnen ( m) Wir stellen die Gleichung (4) analog zu Gleichung () so um, dass die Ordinatenabschnitte b und die ( m) Steigungskoeffizienten b aus den bedingten Regressionen von GEHALT auf DALTER für spezielle, feste Werte von EIGNUNG leicht abzulesen sind: GEHALT = (84,7-4,9 EIGNUNG) + (-3,4 + 4,53 EIGNUNG) DALTER + Fehler (5) Es ist darüber hinaus sinnvoll, die bedingten Regressionsgleichungen für einige repräsentative Eignungswerte konkret auszurechnen. Bei der Auswahl kann man sich an inhaltlichen Kriterien (z.b. schlechte, mittlere, gute Eignung) oder an statistischen Größen (z.b. Mittelwert +/- eine Standardabweichung) orientieren. In unserem Fall kommt die zweite Variante zum Einsatz: EIGNUNG (Abk.: M) Bedingte Regression von GEHALT auf DALTER m ˆ M = 7,3 GEHALT = 54, ,333 DALTER m =,8 GEHALT = 4, ,86 DALTER m ˆ M = 3,5 GEHALT = 9, ,39 DALTER Bei Personen mit dem Eignungswert 7,3 (= m ˆ M ) bewirkt also jedes Dienstjahr im Mittel eine Gehaltserhöhung um 9,33 Euro, bei Personen mit dem Eignungswert 3,5 (= m ˆ M ) schlägt hingegen jedes Dienstjahr mit 56,39 Euro zu Buche. In Abschnitt..4. werden wir uns ausführlich mit der inferenzstatistischen Beurteilung von solchen bedingten Effekten (Steigungskoeffizienten) beschäftigen. In der PROCESS-Ausgabe finden sich die bedingten Effekte von DALTER (im Abschnitt: Conditional effect of X on Y at values of the moderator(s)) samt Signifikanzbeurteilungen und Vertrauensintervallen (vgl. Abschnitt..4.)...3. Bedingte Regressionsgeraden zeichnen Weil ein Bild mehr sagt als Formeln, ist es wünschenswert, ein Diagramm mit den bedingten Regressionen zu erstellen. Um von PROCESS eine wesentliche Vorarbeit auf dem Weg zu diesem Diagramm anzufordern, öffnet man bei interaktiver Arbeitsweise seinen Options-Dialog und markiert dort das Kontrollkästchen Generate data for plotting: Im PROCESS-Kommando verwendet man für denselben Zweck das Subkommando plot=: process vars=gehalt dalter eignung /y=gehalt /x=dalter /m=eignung /model= /plot=. 5

51 Im Ausgabefenster resultiert ein SPSS-Programm, das per DATA LIST - Kommando 9 Fälle einliest: DATA LIST FREE/dalter eignung gehalt. BEGIN DATA. 6,5636 7,34 346,97,4969 7,34 5,93 8,43 7,34 694,9553 6,5636,75 43,777,4969,75 677,4739 8,43,75 93,77 6,5636 3,46 499,448,4969 3,46 834,66 8,43 3,46 368,5849 END DATA. GRAPH/SCATTERPLOT=dalter WITH gehalt BY eignung. Jeder Fall enthält einen Regressor- und einem Moderatorwert sowie den zugehörigen vom Modell prognostizierten Kriteriumswert. Per Voreinstellung verwendet PROCESS bei den beiden Prädiktoren jeweils das arithmetische Mittel sowie den um eine Standardabweichung darüber bzw. darunter liegenden Wert. Lässt man das Programm ausführen, erstellt im Beispiel ein GRAPH-Kommando das folgende Diagramm mit den drei bedingten Regressionsgeraden aus der obigen Tabelle: Im per Doppelklick auf die Grafik zu startenden Diagrammeditor lassen sich Darstellungsvarianten leicht realisieren, z.b.: 5

52 Im Beispiel besteht die wesentliche Modifikation darin, die Markierungen durch Regressionsgeraden zu ersetzen. Dazu muss man lediglich... im Eigenschaftsfenster des Diagrammeditors die Registerkarte Variablen wählen als Elementtyp das Listenelement Interpolationslinie wählen und auf den Schalter Anwenden klicken. Mit einem geeigneten 3D-fähigen Programm (z.b. Gnuplot, Mathematica, R) lässt sich auch die vollständige Reaktionsoberfläche mit den Modellprognosen eines Interaktionsmodells darstellen. Die folgende Abbildung zeigt deutlich den Einfluss des Moderators auf die bedingten Effekte des Regressors: 5

53 Sie wurde mit dem folgenden R-Code erstellt: x <- seq(, 5, length=) y <- seq(,, length=) f <- function(x, y) { *x *y *x*y} z <- outer(x, y, f) persp(x, y, z, zlim=range(5, 45), theta=3, phi=3, col="lightsteelblue", xlab="dienstalter", ylab="eignung", zlab="gehalt", font.lab=, cex.axis=.8, ticktype="detailed", d=5) Im Unterschied zur Version auf dem Titelblatt des Manuskripts wurde die perspektivische Transformation über den Parameter d der R-Funktion persp reduziert. Um diesen Code in einem Skript-Fenster der R- Console für eine eigene Abbildung zu verwenden, müssen Sie lediglich... in den Vektoren x und y per seq()-funktion die darzustellenden Wertebereiche für den Regressor und den Moderator ablegen, in der Definition der Funktion f die Modellparameter ändern und in der persp()-funktion den z-wertebereich und die Achsenbeschriftungen anpassen. Im R-Code steht zur Anpassung an das Grafiksystem von R abweichend von unserer Notation der Vektor y für den Moderator und der Vektor z für das Kriterium. Eine Dokumentation der R-Funktion persp findet sich z.b. hier: 53

54 ..3.3 Einige Eigenschaften von bedingten Regressionsgeraden Dass sich alle bedingten Regressionsgeraden im Punkt schneiden, ist eine Eigenschaft des bilinearen Modells, 3 3 Yˆ = + X + M + 3 XM Man rechnet leicht nach, dass für das angegebene Argument alle bedingten Regressionsfunktionen 3 denselben Wert liefern: ( M ) ( 3M ) 3 3 M M 3 3 M M 3 Wenn sich die bedingten Regressionsgeraden (wie im Beispiel) außerhalb des untersuchten Wertebereichs des Regressors scheiden, liegt eine ordinale Interaktion vor. Im alternativen Fall spricht man von einer disordinalen Interaktion (vgl. Aiken & West 99, S. ) Signifikanztests und Vertrauensintervalle In Abschnitt..4. wird erläutert, wie die Interaktionshypothese geprüft werden kann. Mit der im Fall einer signifikanten Interaktion anschließend sinnvollen Untersuchung der so genannten bedingten bzw. einfachen Effekte beschäftigt sich der Abschnitt..4.. Statt die bedingten Effekte des Regressors auf das Kriterium für bestimmte Werte des Moderators zu prüfen, liefert die Johnson-Neyman - Methode Signifikanzregionen, was in Abschnitt..4.3 erläutert wird...4. Interaktionseffekt Die Nullhypothese zum Interaktionseffekt behauptet die Identität aller bedingten Steigungskoeffizienten ( m) (bzw. bedingten Effekte). Gemäß Gleichung (3): ( m) 3 lässt sich die Nullhypothese folgendermaßen formulieren: XM H : 3 Diese Nullhypothese können wir gegen die Alternativhypothese: XM H : 3 mit dem üblichen t-test für den Regressionskoeffizienten 3 zum Produktterm in Modell (9) prüfen. Die in Abschnitt... berichteten Ergebnisse zeigen einen t-wert von 6,459 (df = N - 3- = 396) mit einer Überschreitungswahrscheinlichkeit nahe Null, so dass wir die Nullhypothese verwerfen. Kann die Interaktionsnullhypothese nicht zurückgewiesen werden, sollte der Produktterm in der Regel aus der Regressionsgleichung entfernt werden, denn: m 54

55 Das additive Modell ist sparsamerer. Bei Abwesenheit einer Interaktion werden partielle Koeffizienten für die beiden Regressoren X und M benötigt, während das Modell mit Produktterm bedingte Koeffizienten für X und M enthält...4. Bedingte Effekte Im Fall eines signifikanten Interaktionseffekts kann man mit einer Untersuchung der so genannten bedingten bzw. einfachen Effekte fortfahren und z.b. untersuchen, ob die bedingten Steigungen für ausgewählte Werte des Moderators von Null verschieden sind. In unserem Beispiel könnten etwa folgende Fragen auftauchen: Steigt das Gehalt auch bei weniger geeigneten Beschäftigten (z.b. M = m ˆ M ) mit dem Dienstalter? Hängt das Einstiegsgehalt (DALTER = ) von der Eignung ab? Das zweite Testproblem resultiert aus einer Betrachtung der in Abschnitt..3. präsentierten bedingten Regressionsgleichungen. Die bedingten Ordinatenabschnitte zeigen, dass an der (empirisch nicht aufgetretenen) Stelle DALTER = das vom Modell vorhergesagte GEHALT mit zunehmender EIGNUNG abnimmt. Dieses Teilergebnis widerspricht der Plausibilitätsannahme identischer Anfangsgehälter. Es ist grundsätzlich unzulässig, eine Extrapolation von Modellaussagen auf nicht analysierte Wertebereiche vorzunehmen. Allerdings befinden wir uns an der Stelle (DALTER = ) wohl noch knapp innerhalb des Modellanwendungsbereichs, und das unplausible Ergebnis für die bedingte Regression von GEHALT auf EIGNUNG bei DAL- TER = stellt vermutlich eine zufällige Stichprobenabweichung vom wahren Wert Null dar, was gleich durch einen Signifikanztest geprüft werden soll. Wenn wir über den bedingten Effekt der EIGNUNG auf einer festen Stufe von DALTER sprechen, sind die Rollen Regressor und Moderator übrigens im Vergleich zur bisher bevorzugten Betrachtungsweise vertauscht. In statistischer Hinsicht agieren die beiden Interaktionspartner vollkommen symmetrisch. ( m) Nach Gleichung (3) gilt für den bedingten (einfachen) Effekt von DALTER auf GEHALT an der festen Stelle EIGNUNG = m: ( m) 3 Wenn die Stelle EIGNUNG = interessiert, vereinfacht sich die letzte Gleichung trivialerweise zu: ( ) m Folglich können wir die Nullhypothese zum bedingten (einfachen) Effekt H (m ) o : ( ) m mit dem t-test für den Regressionskoeffizienten zum Regressor DALTER in Modell (9) prüfen. Um den bedingten (einfachen) Effekt des Regressors an einer Stelle m auf ähnlich einfache Weise mit der SPSS-Prozedur REGRESSION prüfen zu können, wenden wir folgenden Trick an: Wir ersetzen den Moderator EIGNUNG durch: m EIGMM := EIGNUNG - m Das Modell mit der modifizierten Variablen EIGMM lautet: ( m) ( m) GEHALT = + DALTER + EIGMM + 3 DALTER EIGMM (6) Es ist eine zum ursprünglichen Modell äquivalente, reparametrisierte Variante mit denselben Modellprognosen, denn durch einfaches Umstellen erhält man die folgende Identität: 55

56 + X + M + 3 XM = + m + ( + 3 m) X + (M - m) + 3 X(M - m) ( m) ( m) = + X + (M - m) + 3 X(M - m) ( m) Im Ersatzmodell (6) lässt sich der bedingte DALTER-Effekt an der Stelle EIGNUNG = m, also, bequem über den t-test zum Koeffizienten von DALTER prüfen. Außerdem erhalten wir so auch ein Vertrauensintervall zum bedingten Effekt. Unter Verwendung der Datendatei gehalt.sav kann das eben geschilderte Vorgehen für m = 7,3 (= m ˆ M ) in SPSS dialogboxorientiert oder auf Syntaxebene realisiert werden. Hier soll die zweite Methode demonstriert werden: compute eigmm = eignung compute daeigmm = dalter * eigmm. REGRESSION /STATISTICS COEFF OUTS CI R ANOVA /DESCRIPTIVES MEAN STDDEV CORR SIG N /DEPENDENT gehalt /METHOD=ENTER dalter eigmm daeigmm. Wir erhalten u.a. die folgende Ausgabe: Zunächst beobachten wir, dass sich die Beurteilung des (globalen) Wechselwirkungseffekts durch den Übergang von EIGNUNG zu EIGMM nicht geändert hat (siehe Zeile zu DAEIGMM). Das Schätzergebnis ist ebenso gleich geblieben wie seine inferenzstatistische Beurteilung (Standardfehler, t-prüfgröße, p-level und Vertrauensintervall). Die Ergebnisse zu DALTER im modifizierten Modell besagen nach den obigen Überlegungen, dass der bedingte (einfache) Effekt von DALTER für EIGNUNG = 7,3 (= m ˆ M ) signifikant von Null verschieden ist (p <,). Als 95 - prozentiges Vertrauensintervall zum bedingten Effekt erhalten wir: [ 3,3; 35,343]. Wenn der bedingte Effekt von X auf Y nur für den Mittelwert des Moderators sowie für seinen um eine Standardabweichung reduzierten bzw. erhöhten Wert interessiert, liefert das Makro PROCESS die Ergebnisse frei Haus, so dass der Aufwand mit modifizierten Modellen entfällt. Der Bequemlichkeit halber wiederholen wir einen Teil der PROCESS-Ausgabe aus Abschnitt...3. Bis auf Rundungsungenauigkeiten liefern SPSS-REGRESSION und PROCESS identische Ergebnisse: Conditional effect of X on Y at values of the moderator(s): eignung Effect se t p LLCI ULCI 7,34 9,33 3,576 9,595, 3,389 35,343,75 4,859,846 9,685, 38, ,54 3,46 56,3883,9953 8,854, 5,4996 6,77 Values for quantitative moderators are the mean and plus/minus one SD from mean. Wer die bedingten X-Effekte nicht für { m, m ˆ M, m ˆ M }, sondern für die Moderator-Perzentile, 5, 5, 75 und 9 sehen möchte, der öffnet bei interaktiver Arbeitsweise den PROCESS-Subdialog Conditioning und wählt im Rahmen Pick-a-Point die Option Percentiles: 56

57 Wer die Bedienung per Syntax bevorzugt, verwendet das PROCESS-Subkommando quantile=: process vars=gehalt dalter eignung /y=gehalt /x=dalter /m=eignung /model= /plot= /quantile=. Im Beispiel zeigen sich signifikante bedingte X-Effekte für alle betrachteten Moderator-Werte: Conditional effect of X on Y at values of the moderator(s): eignung Effect se t p LLCI ULCI 7, 8,864 3,78 8,95,,487 34,54 8, 3,856,775,, 7,497 38,386, 4,874,93 9,937, 37,566 46,857, 5,936,4945,477, 46,84 55,8368 4, 59,99 3,45 7,6368, 53,339 66,6783 Values for quantitative moderators are th, 5th, 5th, 75th, and 9th percentiles. Wir können analog zum bisherigen Vorgehen auch bedingte EIGNUNGs-Effekte für vorgegebene DAL- TER-Ausprägungen behandeln (vgl. die obigen Symmetrieüberlegungen). Das aus den Stichprobendaten geschätzte Modell impliziert für EIGNUNG bei DALTER = (knapp im Extrapolationsbereich) einen negativen bedingten Effekt. Er kann nach obigen Überlegungen über den Signifikanztest zu beurteilt werden. Mit einem Blick auf die Ausgabe in Abschnitt... stellen wir fest, dass der t-test zu diesem bedingten Effekt die Signifikanzgrenze weit verfehlt (p =,657). Vermutlich ist der wahre bedingte Effekt praktisch gleich Null, d.h. im betrachteten Unternehmen hängt das Einstiegsgehalt nicht vom Eignungstest ab. Im Fall eines akzeptierten Interaktionseffekts stellt sich übrigens bei dem von uns betrachteten bilinearen Modell nicht die Frage, für welche Moderator-Wertepaare sich die bedingten Steigungen signifikant unterscheiden. Ein Blick auf Gleichung (3) ( m) 3 zeigt: Entweder sind die bedingten Steigungen alle gleich ( 3 =, keine Interaktion) oder sie sind alle verschieden ( 3 ). Im restlichen Teil dieses Abschnitts, den anwendungsorientierte Leser(innen) überspringen können, wird gezeigt, dass man die bedingen Steigungskoeffizienten auch ohne den beschriebenen Transformationstrick testen kann. Die Nullhypothese m ( m) : m lässt sich über die folgende Prüfgröße beurteilen: m Ho 3 57

58 ( ) b b3m b b3m t( b m ) mit df ( N - 4) Var( b b m) Var( b ) m Cov( b, b ) m Var( b ) 3 In SPSS fordert man die benötigten Varianzen und Kovarianzen zu den Parameterschätzungen dialogorientiert per Statistik-Subdialogbox oder syntaxorientiert mit der Spezifikation BCOV im PRINT- Subkommando an: 3 3 Im Beispiel erhalten wir die folgende Tabelle: Mit den geschätzten Regressionskoeffizienten b = -3,48 und b 3 = 4,59 (siehe Modellgleichung (4)) resultiert zum EIGNUNGs-Wert m = 7,3 (= m ˆ ) als geschätzte Steigung der bedingten Regression: M ( b m ) b b3m = 9,333 Dieser Wert stimmt ebenso mit dem Schätzer aufgrund der transformierten Eignungsvariablen überein (siehe Abschnitt..4.) wie die Schätzung des zugehörige Standardfehlers im Nenner des t-bruchs: Für die t-statistik erhalten wir: ˆ ( ) b m 56,758-7,3 5,56 7,3,49 3,5 t( ( m) ) b b m Var( b 3 b m) 3 9,333 9,595 3,57 Die zugehörige zweiseitige Überschreitungswahrscheinlichkeit (für df = 396) liegt sehr nah bei Null. Mit dem berechneten Standardfehler und dem,975 - Fraktil der t-verteilung mit 396 Freiheitsgraden (,966) kann man leicht das 95% - Vertrauensintervall zum bedingen Steigungskoeffizienten ermitteln: 58

59 ( m) ( m) b t ˆ ( ) ; t ˆ N4;,975 m b N4;,975 ( m ] [3,3; [ ) b b 35,343]..4.3 Signifikanzregionen Statt für etliche, mehr oder weniger willkürlich ausgewählte Moderatorwerte (z.b. { z, z ˆ Z, z ˆ Z }) einen Signifikanztest durchzuführen, kann man in der folgenden Gleichung zur Berechnung der Prüfgröße (vgl. Abschnitt..4.) auf der linken Seite den kritischen t-wert (z.b. für einen zweiseitigen Test zum Niveau 5%) einsetzen und dann die Gleichung nach m auflösen. ( ) b b3m t( b m ) mit df (N - 4) Var( b ) m Cov( b, b ) m Var( b ) Aus den Lösungen der quadratischen Gleichung kann man eine Lösungsmenge mit denjenigen m-werten bestimmen, die zu einem signifikanten bedingten Effekt führen. Hayes (3, S. 38ff) spricht vom Johnson-Neyman - Verfahren, um die Leistungen der Urheber zu würdigen. In der Literatur wird meist von Signifikanzregionen (engl.: regions of significance) gesprochen. Aus der quadratischen Gleichung für m resultieren im Wertebereich des Moderators, oder Lösungen, und nach Hayes (3, S. 4) ergeben sich folgende Signifikanzregionen: 3 Keine Lösung für m im Wertebereich des Moderators Es gibt keinen Wechsel bei der Signifikanzbeurteilung, so dass die bedingten X-Effekte entweder für alle Moderatorwerte signifikant sind oder für keinen Moderatorwert. Genau eine Lösung L für m im Wertebereich des Moderators Bei G wechselt die Signifikanzbeurteilung, so dass entweder die m-werte kleiner L oder die m- Werte größer L zur Signifikanzregion gehören. Zwei Lösungen L und L für m im Wertebereich des Moderators Die Signifikanzbeurteilung wechselt bei L und L, so dass entweder die m-werte zwischen den beiden Grenzen (L < m < L ) oder die Werte jenseits der Grenzen (m < L oder m > L ) zur Signifikanzregion gehören. Zum Glück kann das von Andrew Hayes erstellte SPSS-Makro PROCESS (vgl. Abschnitt.) die Johnson-Neyman - Grenzwerte berechnen und Bewertungen für spezielle m-werte liefern, aus denen die Lage der Signifikanzregion hervorgeht. Bei interaktiver Arbeitsweise fordert man die Johnson-Neyman - Grenzen über ein Kontrollkästchen im PROCESS-Subdialog Conditioning an: 3 Wer die Bedienung per Syntax bevorzugt, verwendet das PROCESS-Subkommando jn=: 59

60 process vars=gehalt dalter eignung /y=gehalt /x=dalter /m=eignung /model= /plot= /quantile= /jn=. Im Beispiel wird ein Grenzwert gefunden (EIGNUNG = 3,3), und die Signifikanzregion liegt rechts vom Grenzwert: Conditional effect of X on Y at values of the moderator(s): Moderator value(s) defining Johnson-Neyman significance region(s): Value % below % above 3,93,75 99,5 Conditional effect of X on Y at values of the moderator (M) eignung Effect se t p LLCI ULCI, 5,64 6,48,99,3639-6,5584 7,8387,9 9,765 5,685,794,845 -,393,76 3,93,755 5,477,966,5,,53 3,8 3,798 5,49,735,65 3,8785 3,77 4,7 7,869 4,484 3,9865, 9,568 6,684 5,6,9454 3,9433 5,5653, 4,93 9,6978 6,5 6,7 3,4356 7,574, 9,674 3,776 7,4 3,98,9756,49, 4,48 35,948 8,3 34,744,5888 3,9, 9,849 39,639 9, 38,57,3 6,5434, 33,75 4, Effekt- und Teststärke bei Interaktionseffekten..5. Maße für die Effektstärke In unserem Anwendungsbeispiel erreicht ein rein additives Regressionsmodell (mit den Prädiktoren DAL- TER und EIGNUNG) bereits einen stattlichen Determinationskoeffizienten von,59: Trotz hoch signifikanter und auch deskriptiv beeindruckender Interaktion (siehe Abschnitt..3) ergibt sich für das komplette Modell mit Produktterm nur ein bescheidener R -Anstieg im Vergleich zum nachweislich falschen additiven Modell: Damit ist die Interaktion für ca. 3,89 % der Kriteriumsvarianz verantwortlich: (,63 -,59) % Statt den R -Anstieg für die beiden geschachtelten Modelle (mit bzw. ohne Produktterm) zu berechnen, kann man für das Interaktionsmodell die quadrierte semipartielle Korrelation zwischen dem bzgl. seiner Faktoren residualisierten Produktterm und dem Kriterium ermitteln. SPSS bietet die Berechnung von (semi)partiellen Korrelationen für alle Prädiktoren in der Statistiken-Subdialogbox zur Regressionsanalyse an: 6

61 Für die folgende Tabelle wurden aus Platzgründen die Konfidenzintervalle abgeschaltet: Durch Quadrieren der semipartiellen Korrelation zum Produktterm erhält man den oben berechneten individuellen Erklärungsbeitrag:,97,63-,59,39 Bei der Stichprobenumfangsplanung für eine Moderationsstudie ist das partielle Eta-Quadrat relevant, das durch die quadrierte partielle Korrelation des Produktterms mit dem Kriterium geschätzt werden kann:,39,95 Es ist uns schon in der UNIANOVA-Ausgabe zum Moderationsmodell begegnet (vgl. Abschnitt...). In der Effektstärkenschätzung über den R -Anstieg ist ein positiver Bias enthalten, der allerdings mit wachsender Stichprobengröße und gegen Eins strebender Effektstärke an Bedeutung verliert (vgl. Jaccard & Turrisi, 3, S. 8f). Dasselbe gilt für das partielle Eta-Quadrat...5. Stichprobenumfangsplanung mit GPower Eine A-priori - Power-Analyse mit GPower 3. (vgl. Abschnitt..7.) für den folgenden Aufgabentyp Test family: t-tests Statistical test: Linear Multiple Regression: Fixed model, single regression coefficient zeigt, dass bei einem zweiseitigen Test zum Niveau 5% mindestens 77 Fälle benötigt werden, um einen Moderatoreffekt von der in unserer Stichproben geschätzten Stärke (,95) mit einer Wahrscheinlichkeit von,8 entdecken zu können: 6

62 Wer es wagt, entgegen allen Traditionen eine Interaktionshypothese bei vorgegebener und bestätigter Richtungsfestlegung einseitig zu testen, der erreicht schon bei 6 Fällen die gewünschte Teststärke. Wird der Interaktionseffekt nicht durch einen einzelnen Prädiktor im Modell repräsentiert (z.b. bei Verwendung eines kategorialen Regressors oder Moderators mit mehr als Ausprägungen), eignet sich für eine A-priori - Power-Analyse zum Moderatoreffekt mit GPower 3. der folgende Aufgabentyp: Test family: F-Tests Statistical test: Linear Multiple Regression: Fixed model, R increase Bei einem metrischen Regressor X und einem kategorialen Moderator mit 3 Ausprägungen (also zwei Kodiervariablen Z und Z ) enthält das Haupteffektsmodell 3 Prädiktoren (X, Z, Z ) und der zu testende Interaktionseffekt Prädiktoren (XZ, XZ ), so dass im vollständigen Modell 5 Prädiktoren vorhanden sind. Als Beispiel nehmen wir... für das vollständige Modell einen Determinationskoeffizienten von,3 und damit einen unaufgeklärten Fehleranteil von,7 sowie für den Interaktionseffekt einen eigenständigen Erklärungsbeitrag von,5 an. In GPower öffnen wir per Determine das Seitenfenster zur Effektstärkendefinition und nutzen die Option From variances, um die eben vereinbarten Effektstärkenaspekte einzutragen: 6

63 Nach einem Klick auf den Schalter Calculate and transfer to main window zeigt sich: eine quadrierte multiple partielle Korrelation (Partial R ) von,667 und ein korrespondierendes f von,7 In einem Test zum Niveau,5 werden mindestens 38 Fälle benötigt, um einen Interaktionseffekt der angenommenen Stärke mit einer Wahrscheinlichkeit von,8 entdecken zu können. Weil der Interaktionseffekt im Unterschied zum ersten Beispiel durch mehr als einen Prädiktor repräsentiert wird, ist kein einseitiger Hypothesentest möglich Power von Moderator-Hypothesentests in Beobachtungsstudien In Beobachtungsstudien liegt oft eine bescheidene Interaktions-Effektstärke und dementsprechend eine schlechte Power vor. Ein Grund ist in den Reliabilitätsmängeln von Produktvariablen aus fehlerbehafteten Faktoren zu sehen (vgl. Cohen et al. 3, S. 97; Jaccard & Turrisi 3, S. 7f). Ein möglicher Ausweg sind Moderatormodelle für latente Variablen mit mehreren manifesten Indikatoren, doch ist diese Methodologie trotz viel versprechender Ansätze noch mit einigen Problemen belastet (siehe z.b. Baltes-Götz 8; Jaccard & Wan 996). Ist der Regressor oder der Moderator kategorial, erlauben Strukturgleichungsprogramme (wie z.b. Amos) über die Mehrgruppenmodelle eine unproblematische Analyse von Moderatoreffekten unter Beteiligung von latenten Variablen. Insgesamt ist die Teststärke bei Interaktionshypothesen oft ungünstig (siehe Frazier et al 4, S. 8). Als Maßnahmen zur Verbesserung der Chance, eine vorhandene Interaktion zu entdecken, kommen u.a. in Frage: Steigerung der Primärvarianz bei Regressor und Moderator Bemühen um reliable Messungen Aufnahme weiterer Prädiktoren zur Reduktion der Fehlervarianz im Modell (siehe Abschnitt..9) Bei einem kategorialen Regressor oder Moderator sollte in der Planungsphase nach Möglichkeit für gleich große Gruppen gesorgt werden. Eine nachträgliche Angleichung der Gruppenstärken durch Weglassen von Fällen ist jedoch kontraproduktiv. 63

64 ..6 Haupteffekte Wir untersuchen zunächst in Abschnitt..6. die Auswirkungen von linearen Transformationen der Prädiktoren auf das bilineare Interaktionsmodell. Besondere Verwirrungen stiften die Veränderungen bei den Regressionsgewichten zu den einfachen Prädiktoren (im Beispiel: EIGNUNG und DALTER), wenn diese als Haupteffekte interpretiert werden sollen. In Abschnitt..6. werden zwei Haupteffektsdefinitionen diskutiert. Es geht speziell um die Frage, was unter dem Haupteffekt eines Prädiktors zu verstehen ist, der an einer Interaktion beteiligt ist. In Abschnitt..6.3 wird für den Haupteffekt im Sinne eines gewichtet gemittelten bedingten Effekts gezeigt, wie er im bilinearen Interaktionsmodell geschätzt und getestet werden kann...6. Lineare Transformationen der Prädiktoren..6.. Addition einer Konstanten Bei der multiplen Regression ohne Produktvariablen haben Skalenverschiebungen um additive Konstanten keinerlei Effekt auf die Steigungskoeffizienten zu den Prädiktoren. Bei den in Abschnitt behandelten Regressionsmodellen mit Produktvariablen sind die Invarianzverhältnisse aber komplizierter. Im Zusammenhang mit den bedingten bzw. einfachen Effekten (vgl. Abschnitt..4.) haben wir bereits ein numerisches Beispiel für das zu diskutierende Phänomen kennengelernt. Dabei sprachen wir allerdings nicht von einer Komplikation, sondern von einem Trick zur Realisation von Signifikanztestes für bedingte Steigungskoeffizienten. Wir hatten gelernt, dass im ursprünglichen Modell (9) der einfachen ( m) Effekt von DALTER auf GEHALT an der festen Stelle EIGNUNG = gerade identisch ist mit dem Steigungskoeffizienten von DALTER. Zum Testen des bedingten Dienstalterseffektes bei EIGNUNG = 7,3 (= m ˆ M ) haben wir die Konstante 7,3 von der Eignungsvariablen subtrahiert (EIGMM = EIGNUNG - 7,3), anschließend eine neue Produktvariable gebildet (DAEIGMM = DALTER EIGMM) und dann die Regression von GEHALT auf die modifizierten Variablen berechnet. Die beiden Ergebnistabellen zeigen erhebliche Unterschiede: 64

65 a) Regression von GEHALT auf DALTER, EIGNUNG und DALTER EIGNUNG b) Regression von GEHALT auf DALTER, (EIGNUNG-7,3) und DALTER (EIGNUNG-7,3) Während in der Regressionsgleichung a) für DALTER ein nicht-signifikanter, negativer Regressionskoeffizient von -3,4 auftritt, wird für dieselbe Variable in Gleichung b) ein signifikantes, positives Regressionsgewicht von 9,33 mitgeteilt. Diese Unterschiede irritieren, wenn man das Regressionsgewicht zum einfachen Regressor DALTER unvorsichtig als Haupteffekt interpretiert, sie sind jedoch plausibel, wenn man gemäß Abschnitt..4. darin einen bestimmten bedingten Effekt von DALTER für eine feste Ausprägung von EIGNUNG sieht. Völlig analoge Aussagen gelten natürlich auch für die Verschiebung der Variablen DALTER um eine Konstante. Das Regressionsgewicht des Produktterms sowie dessen Signifikanzbeurteilung ändern sich durch die Verschiebungsaktionen nicht. Im restlichen Teil dieses Abschnitts, den anwendungsorientierte Leser(innen) auslassen können, folgen noch einige statistische Erläuterungen zu den Effekten von additiven Konstanten in den Prädiktoren. Die Ergebnisse einer multiplen Regressionsrechnung basieren wesentlich auf der Korrelationsmatrix der beteiligten Variablen. Beim Übergang von EIGNUNG zu EIGMM = EIGNUNG - 7,3 ändern sich die Korrelationen der Eignungsvariablen mit DALTER und GEHALT nicht, sehr wohl aber die Korrelationen der Produktvariablen mit allen Einzelvariablen, wie ein Vergleich der beiden Korrelationsmatrizen zeigt: a) Korrelationen von: GEHALT, DALTER, EIGNUNG und DALTER EIGNUNG gehalt dalter eignung daeig gehalt,,685,478,794 dalter,685,,95,865 eignung,478,95,,66 daeig,794,865,66, 65

66 b) Korrelationen von: GEHALT, DALTER, (EIGNUNG-7,3) und DALTER (EIGNUNG-7,3) gehalt dalter eigmm daeigmm gehalt,,685,478,77 dalter,685,,95,537 eigmm,478,95,,839 daeigmm,77,537,839, Die Abweichungen entstehen, weil DALTER (EIGNUNG-7,3) trotz der harmlosen Transformation der Eignungsvariablen keine lineare Funktion von DALTER EIGNUNG ist. Zwei unterschiedliche Korrelationsmatrizen liefern im Allgemeinen natürlich verschiedene Regressionslösungen. Wir wollen uns noch etwas näher ansehen, wie sich die Verschiebung der Eignungsvariablen um eine Konstante auf die Regressionskoeffizienten auswirkt. Unsere ursprüngliche Modellformulierung lautet: Aus folgt sofort: GEHALT = + DALTER + EIGNUNG + 3 DALTER EIGNUNG + Fehler (9) EIGMM = EIGNUNG - 7,3 EIGNUNG = EIGMM + 7,3 Also lautet unser Modell in Termini von EIGMM folgendermaßen: GEHALT = + DALTER + (EIGMM + 7,3) + 3 DALTER (EIGMM + 7,3) + Fehler (9') Durch einfaches Umstellen ergibt sich: GEHALT = ( + 7,3) + ( + 3 7,3) DALTER + EIGMM + 3 DALTER EIGMM + Fehler Wir stellen u.a. fest: In den Modellen (9) und (9') erhalten wir für den jeweiligen Produktterm dasselbe Regressionsgewicht 3. Dieses Ergebnis bestätigt unsere Beispielrechnungen. Dass auch die Signifikanzbeurteilung gleich bleiben muss, ergibt sich aus der folgenden Überlegung: Der Test für das Regressionsgewicht des Produktterms beruht auf der Reduktion der Fehlerquadratsumme durch Aufnahme des Produktterms in ein reduziertes Modell mit den beiden einfachen Variablen als Prädiktoren. Diese Quadratsummenreduktion ist aber in den Modellen (9) und (9') identisch, weil einerseits die beiden reduzierten Prädiktorenmengen: {DALTER, EIGNUNG} bzw. {DALTER, EIGNUNG - 7,3} sowie andererseits die beiden vollständigen Prädiktorenmengen: {DALTER, EIGNUNG, DALTER EIGNUNG} bzw. {DALTER, EIGNUNG - 7,3, DALTER (EIGNUNG - 7,3)} linear äquivalent sind. Weil man DALTER EIGNUNG leicht aus DALTER (EIGNUNG - 7,3) und DALTER berechnen kann, spannen beide Prädiktorenmengen identische lineare Räume auf. Das Regressionsgewicht zu DALTER ändert sich von auf ( + 3 7,3). Wie wir aus Abschnitt..4. schon wissen, handelt es sich gerade um den bedingten Effekt von DALTER an der Stelle EIGNUNG = 7,3. Der verschobene Prädiktor EIGMM erreicht dasselbe Regressionsgewicht wie EIGNUNG. 66

67 ..6.. Multiplikation mit einer Konstanten Die Multiplikation der Prädiktoren mit einer Konstanten (z.b. durch Wechsel der Maßeinheit) macht bei der multiplen Regression mit Produktvariablen keine Komplikationen. Wenn wir etwa die Prädiktoren X und M durch X X und M M ersetzen, dann ist die neue Produktvariable X X M M = X M XM offenbar eine einfache lineare Funktion der alten Produktvariablen XM. Folglich ändert sich das Korrelationsverhalten der Variablen nicht, und alle regressionsanalytischen Ergebnisse bleiben (bis auf triviale Skalierungsanpassungen) identisch...6. Haupteffekte in Modellen mit und ohne Interaktion In diesem Abschnitt werden wir uns abschließend mit der Bedeutung der Regressionskoeffizienten und zu den einfachen Regressoren DALTER und EIGNUNG im Modell (9) beschäftigen, wobei der etwas unklare Begriff Haupteffekt in die Diskussion einbezogen wird. Seit Abschnitt..4. wissen wir schon, dass gerade den bedingten (einfachen) Effekt von DALTER auf GEHALT an der festen Stelle EIGNUNG = angibt. Folglich ist nicht der Haupteffekt von DALTER, sondern ein spezieller bedingter Effekt an einer Stelle, die vom willkürlichen Nullpunkt der intervallskalierten Variablen EIGNUNG abhängt. Unser Interesse an hängt also wesentlich davon ab, welche Bedeutung die Stelle EIGNUNG = besitzt. Nimmt unsere Eignungsvariable z.b. nur Werte zwischen und an, sind und seine Signifikanzbeurteilung irrelevant., also das Regressionsgewicht zu EIGNUNG, steht analog für den bedingten Effekt von EIG- NUNG an der Stelle DALTER=, die aufgrund der Rationalskalenqualität von DALTER eine feste Bedeutung hat. Offenbar gibt an, wie das Einstiegsgehalt von der EIGNUNG abhängt. Weil sich in der Stichprobe kaum Fälle mit sehr geringer Dienstzeit befanden, liegt der DALTER-Wert Null allerdings fast im Extrapolationsbereich des Modells, so dass keine gesicherten Aussagen möglich sind. Über den Haupteffekt von EIGNUNG besagt jedenfalls nichts. Wir wollen uns zwei alternative Haupteffekts-Definitionen ansehen: a) Haupteffekt als identischer Effekt (auf allen Ausprägungskombinationen anderer Prädiktoren) Ein Haupteffekt in diesem Sinne ist nur dann definiert, wenn keine Interaktionen vorliegen. Dies ist etwa in einem additiven Regressionsmodell von der Gestalt (8) der Fall. Hier ist der Effekt eines Prädiktors X für alle Ausprägungskombinationen anderer Prädiktoren identisch. b) Haupteffekt als mittlerer bedingter Effekt (MBE-Haupteffekt) Hier sind Interaktionen erlaubt, die bekanntlich dazu führen, dass sich die bedingten Effekte eines Regressors unter verschiedenen Ausprägungskombinationen anderer Prädiktoren unterscheiden. Welchen Haupteffekt soll man in einem Modell nach dem Muster von Gleichung (9) einem Regressor zuschreiben, der z.b. sowohl positive als auch negative bedingte Effekte produziert? Wenn schon ein Haupteffekt zugeschrieben werden soll, nimmt man eben den Mittelwert der bedingten Effekte. Im einem Modell nach dem Muster von Gleichung (9) definiert man also den Haupteffekt durch das Mittel der bedingten Steigungskoeffizienten. Die zweite Haupteffektsdefinition ist allgemeiner, weil im Fall identischer bedingter Effekte (keine Interaktion) der dann definierte Haupteffekt gemäß Definition a) mit dem Haupteffekt gemäß Definition b) übereinstimmt. Beim MBE-Haupteffekt muss man nach der verwendeten Methode zum Mitteln der bedingten Effekte noch zwischen der gewichteten (MBE g ) und der ungewichteten Variante (MBE u ) unterscheiden. Bei einem diskreten (z.b. kategorialen) Moderator (vgl. Abschnitt.3.) stehen das gewichtete und das ungewichtete Mittel zu Wahl, während bei einem (quasi)stetigen Moderator in der Regel das gewichtete Mittel bevorzugt wird. Die Abhängigkeit des gewichteten Mittels von der Verteilung des Moderators kann als Vor- oder Nachteil gesehen werden. Es ist zu beachten: 67

68 Um den MBE g -Haupteffekt für eine Population zu schätzen, benötigt man eine Zufallsstichprobe. Für zwei Populationen mit identischen bedingten Effekten des Regressors, aber unterschiedlichen Verteilungen des Moderators, erhält man verschiedene MBE g - Haupteffekte MBE g - Haupteffekt schätzen und testen In diesem Abschnitt wird gezeigt, dass man den Haupteffekt eines Prädiktors (z.b. DALTER) im Sinn des gewichteten Mittels der bedingten Effekte (Abk.: MBE g ) recht bequem ermitteln und testen kann. Zur Vereinfachung der Darstellung gehen wir im Folgenden davon aus, dass der zweite Prädiktor diskrete Werte annimmt, so dass sein Erwartungs(bzw. Mittel-)wert per Summation definiert ist. Analoge Ergebnisse erhält man auch für kontinuierliche Prädiktoren, wobei die Darstellung durch Integrale etwas erschwert wird. Der bequemen Bezeichnung wegen betrachten wir den MBE g des Regressors. ( m) Wenn mit der bedingte Effekt des Regressors für den Moderatorwert m, mit P(m) die Wahrscheinlichkeit dieser Moderatorausprägung und mit E(M) der Erwartungswert von M bezeichnet wird, dann ist der Haupteffekt des Regressors X im Sinn des gewichteten Mittels der bedingten Effekte im bilinearen Modell folgendermaßen zu bestimmen: MBE ( X ) g z z P( m) P( m)( z P( m) 3 ( m) E( M ) m) 3 3 z P( m) m Folglich ist der MBE g von X gerade identisch mit dem bedingten X-Effekt für den Erwartungswert des Moderators. Beachten Sie, dass zur Herleitung dieser Identität die Gleichung (3) verwendet wird, so dass die Aussage nur für Modelle der Bauart (9) bewiesen ist. In dieser Situation lässt sich jedenfalls eine Schätzung des MBE g - Haupteffekts leicht ermitteln durch Verwendung von m anstelle von E(M). Wer auch testen möchte, ob der MBE g - Haupteffekt von Null verschieden ist, kann das in Abschnitt..4. beschriebene Verfahren einsetzen, wobei als interessierende Stelle m der Erwartungswert des Moderators zu wählen ist. Dabei tritt allerdings eine kleine Komplikation auf: Normalerweise ist der Erwartungswert des Moderators nicht bekannt und muss aus der Stichprobe geschätzt werden. Das in Abschnitt..4. beschrieben Verfahren gilt jedoch nur für bekannte, d.h. vor dem Experiment schon numerisch fixierte Ausprägungen des Moderators. Infolgedessen ist der t-test für den MBE g -Haupteffekt zu liberal, d.h. sein -Fehlerrisiko ist erhöht. Die Verzerrung ist umso stärker, je kleiner die Stichprobe ist (vgl. Aiken & West 99, S. f). Das folgende SPSS-Programm führt für unser Beispiel unter Verwendung der SPSS-Datendatei gehalt.sav die Moderatoranalyse mit zentrierten Varianten der Regressoren EIGNUNG und DALTER durch: compute mdalter = dalter compute meignung = eignung -.8. compute mdaeig = mdalter * meignung. REGRESSION /STATISTICS COEFF OUTS CI R ANOVA /DESCRIPTIVES MEAN STDDEV CORR SIG N /DEPENDENT gehalt /METHOD=ENTER mdalter meignung mdaeig. Wir erhalten: 68

69 Mit dem Makro PROCESS (vgl. Abschnitt.) von Andrew Hayes kann man diese Ergebnistabelle auch ohne explizite Datentransformation anfordern. Bei interaktiver Arbeitsweise öffnet man den PROCESS- Subdialog Options und markiert das Kontrollkästchen Mean center for products: Wer die Bedienung per Syntax bevorzugt, verwendet das PROCESS-Subkommando center=: process vars=gehalt dalter eignung /y=gehalt /x=dalter /m=eignung /model= /center= Neben den von allen Transformationen unbeeindruckten Ergebnissen zur Produktvariablen erhalten wir diesmal verwertbare Haupteffektsbeurteilungen. Bei gewichteter Mittelung über alle EIGNUNGS-Werte steigt z.b. mit jedem Dienstjahr das Gehalt um durchschnittlich 4,86 Euro an. Dieser Haupteffekt ist deutlich signifikant. Es soll noch einmal daran erinnert werden, dass die Interpretation von Haupteffekten bei Anwesenheit einer Interaktion nicht unbedingt sinnvoll ist, weil wesentliche Teile der vorhandenen Information ignoriert werden. Man sollte auf jeden Fall, wie in Abschnitt..3 demonstriert, die bedingten Effekte numerisch und graphisch darstellen...7 Zentrieren und Multikollinearität Viele anerkannte Bücher zur Regressionsanalyse (z.b. Cohen et al. 3) und auch die Vorversion dieses Manuskripts empfehlen das Zentrieren von metrischen Interaktionspartnern zur Vermeidung von schädlichen Effekten der naturgemäß hohen Korrelationen zwischen einem Produkt und seinen Faktoren (Multikollinearität). Hayes (3, S. 8ff) belegt, dass mit Ausnahme von extremen Fällen (z.b. Produkt aus mehreren hoch korrelierten Regressoren als Interaktionsterm) das Zentrieren als Maßnahme gegen die Multikollinearität überflüssig und wirkungslos ist. Unbestreitbar ist das Produkt aus zwei metrischen Regressoren mehr oder weniger hoch mit seinen Faktoren korreliert. Infolgedessen liegt bei den Regressoren in einem 69

70 Moderatormodell der Anteil der eigenständigen, von den anderen Regressoren nicht erklärbaren Varianz (die so genannte Toleranz) oft unter der kritischen Grenze von,. Das passiert auch in unserem Beispiel: Ebenso unbestreitbar ist die drastische Reduktion der Korrelation zwischen dem Produkt und seinen Faktoren durch das Zentrieren der Faktoren. Weil die Toleranz (bzw. ihr als Varianzinflationierungsfaktor bezeichneter Kehrwert) den Standardfehler eines Regressors wesentlich beeinflussen, sollte das Zentrieren von großem Nutzen für die Inferenzstatistik zum Produktterm in einem Moderatormodell sein. Weil das Zentrieren aber auch die Varianz des Produkts reduziert, und sich die beiden Wirkungen aufheben, ändert sich nichts bei der Inferenzstatistik zum Produktterm. Die Änderungen bei der Inferenzstatistik zu den Faktoren resultiert aus ihrer veränderten Bedeutung und stehen in keinem Zusammenhang mit Multikollinearität. In aller Regel wird sich also das Zentrieren der Prädiktoren nicht auf das Regressionsgewicht des Produktterms und auf dessen Signifikanzbeurteilung auswirken (vgl. Abschnitt..6..), so dass die Interpretationsvereinfachung als einziges Motiv für das Zentrieren verbleibt...8 Standardisierte Lösungen Die Varianzen von Kriterien und Prädiktoren, welche wiederum u.a. von den letztlich willkürlichen Maßeinheiten der Variablen abhängen, haben bekanntlich einen erheblichen Einfluss auf die bisher diskutierten unstandardisierten Regressionskoeffizienten. Zur Erleichterung der Interpretation liefern Statistikprogrammpakete regelmäßig auch die aus den standardisierten Variablen berechneten Beta-Gewichte: Bei vielen Variablen (z.b. EIGNUNG) ist die Maßeinheit unklar, und man bezieht sich gerne ersatzweise auf statistische Begriffe. Man möchte z.b. die Aussage Bei einer um Testpunkte höheren Eignung... ersetzten durch Bei einer um zwei Standardabweichungen höheren Eignung.... Wenn alle Prädiktoren einer Regressionsgleichung standardisiert sind, kann man ihre Gewichte (Effekte) besser vergleichen. Zur Berechnung der Beta-Gewichte werden alle Prädiktoren einer Gleichung sowie das Kriterium vor der eigentlichen Regressionsanalyse standardisiert. Mit Z Y, Z X, Z M und Z XM seien die standardisierten Varianten von Y, X, M und XM bezeichnet, auf denen die unaufgefordert von SPSS für ein Regressionsmodell mit Produktterm berechneten Beta-Koeffizienten beruhen. Leider stellen wir schnell fest, dass die Regressionsgleichung: ˆ ZY Z X ZM 3 nicht mehr zu der gewünschten Modellklasse gemäß Formel (9) gehört, weil Z XM im Allgemeinen nicht das Produkt von Z X und Z M ist. Daher sollte eine standardisierte Lösung folgendermaßen ermittelt werden (vgl. Aiken & West, 99, S. 43f): Man erstellt die standardisierten Varianten Z Y, Z X und Z M zum Kriterium Y sowie zu den Prädiktoren X und M. Bei einem kategorialen Regressor sollte man allerdings auf das Standardisieren verzichten. ~ Man erstellt die Produktvariable Z XM : Z X ZM. Z XM 7

71 Man rechnet eine Regressionsanalyse mit dem Kriterium Z Y und den Prädiktoren Z X, Z M und Z ~ XM. Die dabei erzielten unstandardisierten Regressionsgewichte liefern gerade die angemessene standardisierte Lösung. Für unser Beispiel wird diese Strategie durch folgendes SPSS-Programm realisiert: compute sgehalt = (gehalt )/ compute sdalter = (dalter -.497)/ compute seignung = (eignung -.8)/.987. compute sdaeig = sdalter * seignung. REGRESSION /STATISTICS COEFF OUTS CI R ANOVA /DESCRIPTIVES MEAN STDDEV CORR SIG N /DEPENDENT sgehalt /METHOD=ENTER sdalter seignung sdaeig. Es liefert das Ergebnis: Bei Variablen mit natürlicher Maßeinheit ist der Nutzen des Standardisierens durchaus zweifelhaft. Aus dem zentrierten Modell in Abschnitt..6.3 konnten wir z.b. lernen, dass mit jedem Jahr der Betriebszugehörigkeit das Gehalt im Mittel um 4,86 steigt (gewichtet gemittelter bedingter Effekt von DALTER). Nach dem Standardisieren ist zu erfahren, dass bei Zunahme des Dienstalters um eine Standardabweichung das Gehalt im Mittel um,6 Standardabweichungen steigt...9 Kontrollvariablen Wird ein Modell mit dem Kriterium Y, dem Regressor X und dem Moderator M um zusätzliche Prädiktoren (Kontrollvariablen, Kovariaten) W,, W k ohne Beteiligung an der (X M) Interaktion erweitert, so ändern sich zwar im Allgemeinen die geschätzten Regressionskoeffizienten, doch die oben beschriebenen Interpretationsregeln und Verfahren zum Interaktionseffekt, zu den bedingten Effekten und zu den Haupteffekten (im Sinne von gemittelten bedingten Effekten) bleiben gültig. Aus der Regressionsgleichung Yˆ = + X+ M + 3 XM + W + + k W k gewinnt man leicht eine Formulierung mit der vertrauten Darstellung für die bedingten Effekte des Regressors bei festen Ausprägungen des Moderators (vgl. Gleichung (3)): Yˆ = ( + M + W + + k W k ) + ( + 3 M) X Wie bei den oben betrachteten Modellen wird die (X M) Interaktion über den Signifikanztest zu 3 inferenzstatistisch beurteilt. Nach wie vor ist identisch mit dem bedingten X-Effekt für M =, so dass sich Tests und Vertrauensintervalle für bedingte Effekte zu speziellen Moderatorausprägungen gemäß Abschnitt..4. sowie Signifikanzregionen gemäß Abschnitt..4.3 konstruieren lassen. Ist M zentriert, 7

72 dann ist identisch mit dem bedingten X-Effekt für den Erwartungswert von M, der nach den Überlegungen von Abschnitt..6.3 gerade mit dem MBE g - Haupteffekt von X, also mit dem gewichteten Mittel der bedingten X-Effekte übereinstimmt. Bei der Moderatoranalyse mit der SPSS-Prozedur REGRESSION werden Kontrollvariablen als weitere unabhängige Variablen aufgenommen. Beim Makro PROCESS werden Kontrollvariablen in Moderatormodelle genauso einbezogen wie in Mediatormodelle (siehe Abschnitt.4)..3 Alternative Interaktionsmodelle Das bisher behandelte bilineare Interaktionsmodell lässt sich auf vielfältige Weise verallgemeinern, und im Abschnitt.3 wird eine kleine Auswahl der möglichen Modelle vorgestellt: In Abschnitt.3. betrachten wir eine quadratische Regression von Y auf X, deren Parameter durch einen metrischen Moderator beeinflusst werden. In Abschnitt.3. geht es um Modelle mit einem kategorialen Moderator. In Abschnitt.3.3 wird ein Modell mit einer Dreifachinteraktion vorgestellt. Aus Zeitgründen kann das ebenfalls wichtige Modell mit zwei oder mehr additiv auf die Regression von Y auf X einwirkenden Moderatoren nicht behandelt werden (siehe z.b. Hayes 3, S. S. 3ff). Bei zwei additiv agierenden Moderatoren ergibt sich das folgende konzeptionelle Pfaddiagramm: M W X Y.3. Linear moderierte quadratische Regression In diesem Abschnitt betrachten wir den Fall einer linear moderierten quadratischen Regression. Dabei hat die bedingte Regression eines Kriteriums Y auf einen Regressor X für feste Werte eines Moderators M eine quadratische Form, wobei die drei Koeffizienten jeweils im linearen Sinn vom Moderator abhängen: Y X X M MX MX ( M ) ( M ) X ( M ) X 3 In der Datei modquad.sav, die an der im Vorwort genannten Stelle zu finden ist, sind simulierte Stichprobendaten (N = 4) aus einer Population mit einem Modell des beschriebenen Typs enthalten: Y X X MX MX Der Regressor X variiert von -3 bis 3, und der Moderator M nimmt Werte von bis an. Mit dem Wert des Moderators wächst die Krümmung in den bedingten Regressionen von Y auf X: In der folgenden Abbildung sind die bedingten Regressionen für die Moderatorwerte (blau, unten), (grün, Mitte) und (rot, oben) zu sehen: 5 5 Bei diesem Modell agieren X und M übrigens nicht symmetrisch. 7

73 Beeindruckender und aussagekräftiger fällt der mit R erstellte 3D-Plot mit der Reaktionsoberfläche der Modellprognosen aus: Zur Beurteilung der Interaktion führt man eine hierarchische Regressionsanalyse durch und vergleicht per F- Test die Erklärungsleistungen der beiden folgenden Modelle: Y Y X X X X M 3 M MX MX Für die statistische Analyse benötigen wir neben den Ausgangsvariablen Y, X und M auch Neubildungen für X, MX und MX, die man in SPSS z.b. mit den folgenden COMPUTE-Kommandos erstellen kann: compute XX = X*X. compute XZ = Z*X. compute XXZ = Z*XX

74 Zur Anforderung der hierarchischen Regression per Dialogbox wählt man in SPSS zunächst die Variablen des eingeschränkten Modells und klickt dann in Block-Rahmen auf Nächste, um als zweiten Block die Produktterme als unabhängige Variablen aufzunehmen: In der Statistiken - Subdialogbox verlangt man über die Voreinstellung hinausgehend noch die statistische Beschreibung und Beurteilung der R -Änderung bei der Modellerweiterung: Im Beispiel resultiert ein R -Zuwachs von ca. % mit einem signifikanten F-Test: 74

75 Die geschätzten Regressionsgewichte liegen nahe bei den bekannten Werten der konstruierten Population: Hinweise zur Detailanalyse einer linear moderierten quadratischen Regression finden sich in Aiken & West (99, S. 6ff)..3. Interaktion von kategorialen und metrischen Regressoren.3.. Indikatorkodierung In diesem Abschnitt betrachten wir einen kategorialen Moderator mit zwei Ausprägungen, welcher den linearen Effekt eines metrischen Regressors X auf ein Kriterium Y beeinflusst. Weil der kategoriale Moderator nur zwei Stufen hat und folglich nur eine Kodiervariable G benötigt, hat das Modell exakt die Struktur von Gleichung (9): Y X G 3GX (7) G) ( G) X ( 3 Wird für G die so genannte Indikator- bzw. Dummy-Kodierung verwendet (mit den Werten und für die beiden Gruppen), dann gilt für die bedingten Regressionen in den beiden Gruppen: G : Y ( G : Y ) ( ) X X Hier steht 3 für den Gruppenunterschied zwischen den bedingten Steigungen und damit für die Interaktion. Ein qualitativer Moderator mit k Stufen wird durch (k - ) Kodiervariablen G, G,, G k- im Design repräsentiert. Für die Interaktion mit dem metrischen Regressor X werden ebenso viele Produktvariablen G X, G X,, G k- X benötigt (siehe z.b. Cohen et al. 3, S. 75ff). In der Datei modqual.sav, die an der im Vorwort genannten Stelle zu finden ist, sind simulierte Stichprobendaten (N = 5) aus einer Population mit einem Modell von der in Gleichung (7) beschriebenen Bauart (mit Dummy-Kodierung für G) enthalten, wobei der Einfachheit halber einige Koeffizienten auf Null gesetzt wurden: Y GX 3 75

76 Häufigkeit Häufigkeit Mediator- und Moderatoranalyse per multipler Regression mit SPSS Damit wird z.b. festgelegt, dass X in der Gruppe mit G = keinen Effekt hat. In der folgenden Abbildung ist das gruppierte Streudiagramm mit den beiden G-bedingten Regressionsgeraden zu sehen: Beide Prädiktoren besitzen eine ausgeprägt asymmetrische Verteilung, und der metrische Prädiktor X nimmt nur fünf verschiedene Ausprägungen an: X G X G Bei der Regression von Y auf X, G und das Produkt XG resultiert ein signifikanter Interaktionseffekt, der für einen eigenständigen Erklärungsbeitrag von,44 (quadrierte semipartielle Korrelation) verantwortlich ist: 76

77 Zur Interpretation der Regressionskoeffizienten: Der Koeffizient für X (also b ) steht für den geschätzten bedingten X-Effekt in der Gruppe mit G = und ist erwartungsgemäß nicht signifikant. Um einen Test für die bedingte Steigung in der anderen Gruppe zu erhalten, wendet man die in Abschnitt..4. beschriebene Transformationstechnik an, vertauscht also die Kodierungen der beiden Gruppen. Im Beispiel resultiert dann ein signifikanter bedingter Effekt: Der Koeffizient für G (also b ) steht für den geschätzten bedingten G-Effekt (Gruppenunterschied) für X = und ist konform mit Modell und Streudiagramm nicht signifikant. Der Koeffizient zum Produkt GX (also b 3 ) schätzt die Steigungsdifferenz zwischen den beiden Gruppen und ist erwartungsgemäß signifikant. Die Tatsache, dass der bedingte Effekt nur in einer Gruppe signifikant von Null verschieden ist, darf übrigens nicht als Beleg für eine signifikante Interaktion gedeutet werden. Entscheidend ist, ob sich die beiden bedingten Steigungen signifikant voneinander unterscheiden, und diese Frage wird über den Signifikanztest zur Produktvariablen geprüft. Zentriert man der üblichen Praxis folgend den metrischen Regressor X, dann resultiert für G ein Regressionsgewicht mit alternativer Bedeutung und Signifikanzbeurteilung: Nach den Überlegungen aus Abschnitt..6.3 kann man von einem Haupteffekt von G im Sinn des gewichteten Mittels der X-bedingten Effekte sprechen. Wie man mit etwas Fleiß nachrechnen kann, ist 4,69 gerade das gewichtete Mittel der vom Modell geschätzten bedingten G-Effekte für die fünf X-Ausprägungen. Aufgrund der Indikatorkodierung von G ist unter einem X-bedingten G-Effekt der vom Modell geschätzte Gruppenunterschied an der betrachteten X-Stelle zu verstehen. Die Ergebnisse aus einem Modell mit Interaktion zwischen einem metrischen Regressor und einem kategorialen Moderator werden meist in der zuletzt behandelten Form präsentiert: Indikatorkodierung des kategorialen Prädiktors Sind (k > ) Gruppen vorhanden und folglich k - Kodiervariablen G, G,, G k- und ebenso viele Produktvariablen G X, G X,, G k- X im Design, dann beurteilt man den globalen Interaktionseffekt über eine hierarchische Regressionsanalyse (vgl. Abschnitt.3.). Entscheidend ist der R -Zuwachs durch die simultane Aufnahme der Produktvariablen G X, G X,, G k- X. Der Regressionskoeffizient b m zur Produktvariablen G m X steht für die Steigungsdifferenz zwischen der Gruppe m und einer 77

78 fest gewählten Referenzgruppe, die bei allen Kodiervariablen den Wert Null besitzt. Sollen die bedingten X-Effekte paarweise verglichen werden, kann man im Sinn von Abschnitt..4. mit unterschiedlichen Dummy-Kodierungen arbeiten, wobei sich die Wahl der Referenzgruppe ändert (siehe Jaccard & Turrisi 3, S. 39ff). (Gewichtete) Zentrierung des metrischen Prädiktors durch Subtraktion des Stichprobenmittels Ist dem metrischen Prädiktor die Moderatorrolle zugedacht, interessieren bei einer signifikanten Wechselwirkung die bedingten G-Effekte für bestimmte X-Ausprägungen (vgl. Abschnitt..4.). Speziell bei einem kontinuierlichen Moderator (mit vielen Ausprägungen) besteht eine moderne Alternative zur letztlich willkürlichen Auswahl von Einzelwerten darin, die Signifikanzregion zu bestimmen, was besonders bequem mit dem Makro PROCESS geschehen kann (vgl. Abschnitt..4.3). Obwohl die Variable X in unserem Beispiel nur 5 Ausprägungen hat, soll doch mit dem folgenden PROCESS-Kommando die Berechnung der Signifikanzregion angefordert werden: process vars=y x g /y=y /x=g /m=x /model= /plot= /jn=. Es wird ein Grenzwert gefunden (X =,35), und die Signifikanzregion liegt rechts vom Grenzwert: ********************* JOHNSON-NEYMAN TECHNIQUE ************************** Moderator value(s) defining Johnson-Neyman significance region(s): Value % below % above,35 46, 54, Conditional effect of X on Y at values of the moderator (M) X Effect se t p LLCI ULCI,,55,434,8,8 -,86 4,3866,,5,33,684,77 -,47 4,7,35,473,54,9763,5, 4,946,4,698,7,7,8,98 5,35,6 3,73,55,8384,5,9935 5,549,8 3,8443,48 3,477,8,63 6,674, 4,474,367 3,886,,79 6,664, 4,995,87 4,4,,6445 7,3365,4 5,5636,7 4,3768, 3,53 8, Mit Ausnahme von X = sind die bedingten G-Effekte (Gruppenunterschiede) überall signifikant von Null verschieden. Allerdings ist für die größeren X-Werte die Gruppe G = so schwach besetzt, dass bei echten Daten eine vorsichtige Interpretation angemessen wäre (siehe obiges Streudiagramm). Auf die weiteren, teilweise mühsamen Ausführungen im Abschnitt.3. kann verzichten, wer an (gewichteten und ungewichteten) Haupteffekten von X und G weniger interessiert ist..3.. Effektkodierung Soll im Beispiel von Abschnitt.3. auch für den metrischen Regressor X ein MBE g -Haupteffekt bestimmt werden, benutzt man bei G die so genannte gewichtete Effektkodierung (vgl. Cohen et al. 3, S. 38ff): Indikatorkodierung gewichtete Effektkodierung n n n und n stehen für die Häufigkeiten in den beiden Gruppen, wobei die Indizes mit den Indikatorkodierungswerten übereinstimmen. Als gewichtetes Mittel der so definierten G-Ausprägungen ergibt sich Null: 78

79 79 ) ( n n n n n n Nun gilt für die bedingten Regressionen von Y auf X in den beiden Gruppen: X n n n n Y n n G X Y G ) ( ) ( : ) ( ) ( : 3 3 Als gewichtetes Mittel der beiden bedingten Steigungen erhalten wir, das Regressionsgewicht zu X: ) ( ) ( ) ( ) ( n n n n n n n n n n n n Also kann bei Verwendung der gewichteten Effektkodierung für G als MBE g - Haupteffekt von X interpretiert werden. Im Beispiel erhalten wir kein signifikantes Ergebnis, weil die G-Gruppe mit X-Effekt deutlich schwächer vertreten ist (siehe obiges Histogramm): Mit der geänderten Kodierung erhalten wir auch für G einen alternativen Regressionskoeffizienten bei unveränderter Signifikanzbeurteilung. Bei zentriertem Prädiktor X ist es der MBE g - Haupteffekt von G, das gewichtete Mittel der X-bedingten G-Effekte. Aufgrund der gewichteten Effektkodierung ist unter einem X-bedingten G-Effekt nun die Abweichung der mit Eins kodierten Gruppe vom gewichteten Mittel der beiden Gruppen an der betrachteten X-Stelle zu verstehen. Die letzte Aussage soll mit einigen optionalen (d.h. risikofrei zu überspringenden) Formeln erläutert werden. Wir befördern G durch einfaches Umordnen der Modellterme in die Rolle des Regressors G X X Y ) ( ) ( 3 und betrachten unter dieser Perspektive erneut die obigen Formeln mit den vom Modell für spezielle (G, X) - Kombinationen behaupteten Y-Erwartungswerten: 3 3 ) ( ) ( : ) ( ) ( : n n X X Y n n G X X Y G Wir bestimmen das gewichtete Mittel der Erwartungswerte für die beiden G-Ausprägungen bei festem X, wobei die Gewichte aus der Randverteilung von G stammen:

80 n [( X ) ( ( n n)( X ) n ( n n X X )] n [( 3 n n X ) ( 3X ) n ( n n X ) 3 n 3X ) ] n In der Gruppe mit G = findet sich ein um ( + 3 X) höherer Erwartungswert, und diese Differenz tritt im Modell als X-bedingter G-Effekt auf. Bei X = ist das gewichtete Mittel für die beiden G-Ausprägungen gleich, und die mit Eins kodierte Gruppe weicht um von diesem Wert ab. Also ist der MBE g - Haupteffekt von G erwartungsgemäß gleich dem bedingten G-Effekt für den Mittelwert von X (= aufgrund der Zentrierung). Bei gewichteter Effektkodierung fällt der MBE g - Haupteffekt mit 3,53 kleiner als bei Indikatorkodierung (4,69). Im Beispiel sind die beiden Werte relativ ähnlich, weil die Gruppe mit dem kleineren Erwartungswert erheblich stärker besetzt ist und damit das gewichtete Mittel dominiert. Nachdem bisher Haupteffekte im Sinn von gewichtet gemittelten bedingten Effekten diskutiert worden sind, soll am aktuellen Beispiel endlich einmal die ungewichtete Variante vorgestellt werden. Dazu wenden wir bei G die so genannte ungewichtete Effektkodierung an (siehe z.b. Cohen et al 3, S. 3ff): Indikatorkodierung gewichtete Effektkodierung ungewichtete Effektkodierung n n - Nun ist offenbar das ungewichtete Mittel der beiden G-Ausprägungen gleich Null. Für die bedingten Regressionen von Y auf X gilt in den beiden Gruppen: G G : : Y ( Y ( ) ( 3) X ) ( ) X 3 und ist folglich das ungewichtete Mittel der beiden G-bedingten Effekte von X: ( 3 3 ) ( Über die Beurteilung des Regressionskoeffizienten b stehen also Schätz- und Testergebnisse zum Haupteffekt von X im Sinn eines ungewichteten Mittels der bedingten Effekte (Abk.: MBE u ) zur Verfügung: Um auch für G einen MBE u - Haupteffekt zu erhalten, wird der metrische Regressor X ungewichtet zentriert: Dieses Vorgehen ist bei metrischen Prädiktoren ungewöhnlich und nur dann sinnvoll, wenn keine schwach besetzten Ausprägungen vorliegen. Mit dieser Rekodierung liefert unser Modell (7) die folgenden X- bedingten G-Effekte: ) 8

81 X X-bedingtes Regressionsgewicht von G + 3 X Offenbar ist das ungewichtete Mittel der X-bedingten G-Effekte, also der MBE u Haupteffekt von G. Wegen der ungewichteten Effektkodierung von G ist unter einem X-bedingten G-Effekt die Abweichung der mit Eins kodierten Gruppe vom ungewichteten Mittel beider Gruppen an der betrachteten X-Stelle zu verstehen, was durch eine weitere optionale Rechnung illustriert werden soll. Das Modell Y X ) ( X ) G ( 3 behauptet für spezielle (G, X)-Kombinationen folgende Y-Erwartungswerte: G : G : Y ( Y ( X ) ( X ) ( 3X ) X ) Zu einer festen X-Ausprägung erhalten wir als ungewichtetes Mittel der Erwartungswerte für die beiden Gruppen: X und der X-bedingte G-Effekt ( + 3 X) hat die oben genannte Interpretation. Er ist damit identisch mit der Hälfte des vom Modell für eine feste X-Ausprägung behaupteten Gruppenunterschieds, also gleich dem halben X-bedingten G-Effekt bei Indikatorkodierung von G. Im Beispiel finden wir für X einen signifikanten MBE u - Haupteffekt in gut geschätzter Höhe (wahre G- bedingte Effekte: und ): 3 Der MBE u Haupteffekt von G wird ebenfalls gut geschätzt (wahre X-bedingte Effekte:,, 4, 6 und 8) und zu Recht als signifikant beurteilt..3.3 Wechselwirkungen höherer Ordnung (moderierte Moderation) Gelegentlich wird für den Effekt eines Regressors X auf ein Kriterium Y unterstellt, dass zwei Moderatoren (M und W) Einfluss auf die Ausprägung nehmen. Bei der Verallgemeinerung des bilinearen Modell in Gleichung (9) gelangt man zum folgenden Ansatz, der alle -fach-produkte der Prädiktoren (XZ, XW und ZW) sowie das 3-fach-Produkt XZW enthält: Y = + X + M + 3 W + 4 XM + 5 XW + 6 MW + 7 XMW + (8) 8

82 Für die bedingte Regression von Y auf X für bestimmte Wertekombinationen der beiden Moderatoren M und W resultiert durch einfaches Umstellen: Y = ( + M + 3 W + 6 MW) + ( + 4 M + 5 W + 7 MW) X + ( mw) ( mw) Wir erhalten wiederum eine einfache lineare Regression, wobei deren Koeffizienten und im Sinne einer moderierten Moderation zustande kommen (Hayes 3, S. 37ff). So wird z.b. der Einfluss ( W) M von M auf den einfachen Effekt von X seinerseits durch die Ausprägung von W moderiert. Diese Sichtweise wird im folgenden konzeptionellen Pfaddiagramm dargestellt: W M X Y Zur Veranschaulichung sollen Simulationsdaten aus einer Population mit dem folgenden wahren Modell dienen: Y = +,3 X +,5 M,5 W +,4 XM +, XW + MW +, XMW + Sie finden eine Stichprobe mit 4 Fällen in der SPSS-Datendatei mod3reg.sav an der im Vorwort vereinbarten Stelle. Die drei Prädiktoren haben (auf Populationsebene) den Erwartungswert Null, und in der relativ großen Stichprobe liegen die Mittelwerte sehr nahe beim Erwartungswert, so dass wir auf ein Zentrieren der Stichprobendaten verzichten können: 8

83 Die multiple Regression liefert folgende Ergebnisse: Für die 3-fach-Interaktion findet sich ein hochsignifikantes Regressionsgewicht (p <,) sowie eine Effektstärke von,4 (Quadrat der semipartiellen Korrelation). Die übrigen Regressionskoeffizienten sind analog zu Abschnitt..4. als bedingte Effekte für spezielle Moderator-Wertkombinationen zu deuten, z.b.: Der Regressionskoeffizient zu X steht für den einfachen X-Effekt bei M = W =. Der Regressionskoeffizient zu XM steht für die bedingte -fach-wechselwirkung von X und M bei W =. Analog zu Abschnitt..4. gewinnt man Signifikanztests und Vertrauensintervalle für bedingte -fach- Interaktionen und bedingte Effekte zu anderen Moderator-Wertkombinationen durch geeignete Transformationen der Moderatoren. Z.B. liefert die Regressionsanalyse mit Modell (8) nach der Transformation W W (-) für den Koeffizienten zu XM ein insignifikantes Ergebnis (p =,56). Dass für diese W-Ausprägung keine Moderation des X-Effektes durch M stattfindet, zeigt auch die folgende Abbildung. Der Regressor X bleibt bei beliebigen M-Ausprägungen praktisch ohne Effekt: 83

84 Y Y Mediator- und Moderatoranalyse per multipler Regression mit SPSS 6 W = - 4 M = M = Demgegenüber variiert bei W = in Abhängigkeit von M der bedingte X-Effekt von einem ausgeprägten negativen bis zu einem stark positiven Wert: X 3 6 W = 4 M = - - M = X Das von Andrew Hayes erstellte SPSS-Makro PROCESS beherrscht neben vielen anderen speziellen Modellen auch die moderierte Moderation bzw. Dreifachwechselwirkung, wobei hier insbesondere die Tests zu bedingten Effekten sowie die Unterstützung bei der graphischen Darstellung von Interesse sind. Nach der in Abschnitt.. beschriebenen Installation lässt sich mit dem Menübefehl die folgende Dialogbox öffnen: Analysieren > Regression > PROCESS 84

85 Spezifizieren Sie hier folgendermaßen das Modell mit Dreifachwechselwirkung: Verwenden Sie Y als Outcome-Variable. Verwenden Sie X als Independent Variable. Verwenden Sie M als M Variable (primären Moderator). Verwenden Sie W als Proposed Moderator W (sekundären Moderator). Wählen Sie die Model Number 3. Von der Möglichkeit, Kovariaten in das Modell aufzunehmen, machen wir keinen Gebrauch. Öffnen Sie den Options-Dialog, um das Generieren von Plot-Daten anzufordern: Öffnen Sie den Conditioning-Dialog, um Signifikanzregionennach der Johnson-Neyman - Methode anzufordern: 85

86 Das folgende Kommando führt dieselbe Analyse aus, die wir eben per Dialogbox spezifiziert haben: process vars=y X M W /Y=Y /X=X /M=M /W=W /model=3 /jn= /plot=. In der PROCESS-Ausgabe finden sich neben auch von SPSS produzierten Schätzergebnissen u.a. die Signifikanzregionen für die bedingte -fach-wechselwirkung von X und M in Abhängigkeit vom der W- Ausprägung: Moderator value(s) defining Johnson-Neyman significance region(s): Value % below % above -,896,5 99,75 -,545 4,75 95,5 Conditional effect of X*M on Y at values of the moderator (W) W Effect se t p LLCI ULCI -3, -,93,47 -,774,384 -,569 -,57 -,896 -,677,36 -,966,5 -,5354, -,7 -,35,8 -,7458,86 -,475,8 -,4 -,547,55 -,3395,8 -,387,74 -, -,859,3 -,837,455 -,886,69 -,8 -,7,9 -,874,854 -,96,69 -,5,58,793,653,546 -,4,78 -,,6,68,7667,78 -,36,547 -,545,3,666,966,5,,6 -,9,894,58 3,69,,75,336 -,6,58,494 5,43,,6,3554 -,3,37,43 7,569,,4,4,,3958,46 9,768,,36,4756,3,4647,4,33,,388,5475,6,5335,476,4,,4399,67,9,63,557,83,,498,78,,67,656,365,,54,8,5,7399,765 9,6767,,5896,89,8,887,88 9,868,,6357,988,,8775, 8,776,,689,74,4,9464,3 8,45,,755,67,7,5,48 8,34,,7698,66 3,,84,375 7,8844,,837,3543 Im relevanten Wertebereich des sekundären Moderators W finden sich zwei Lösungen für die Johnson- Neyman - Gleichung (vgl. Abschnitt..4.3), und aus den als Interpretationshilfe gelieferten speziellen Werten ergibt sich, dass die -fach-wechselwirkung von X und M... signifikant negativ ist im Bereich w < -,896, wo sich allerdings nur ein Fall befindet, nicht signifikant ist im Bereich -,896 w -,545, signifikant positiv ist für w > -,545 In der von PROCESS produzierten SPSS-Syntax zur graphischen Veranstaltung der Dreifachinteraktion werden für den primären und den sekundären Moderator jeweils der Stichprobenmittelwert und der um 86

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Tutorial. Mediationsanalyse mit PROCESS. stefan.pfattheicher@uni-ulm.de. Das Konzept Mediation

Tutorial. Mediationsanalyse mit PROCESS. stefan.pfattheicher@uni-ulm.de. Das Konzept Mediation Tutorial Mediationsanalyse mit PROCESS stefan.pfattheicher@uni-ulm.de Das Konzept Mediation Ein Mediator (folgend M) erklärt den Zusammenhang zwischen unabhängiger Variable (folgend X) und einer abhängigen

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Mediatioranalyse & Moderatoranalyse How to do

Mediatioranalyse & Moderatoranalyse How to do Mediatioranalyse & Moderatoranalyse How to do Die folgende Zusammenfassung zeigt beispielhaft, wie eine Mediatoranalyse bzw. eine Moderatoranalyse mit SPSS durchgeführt wird und wie die Ergebnisse in einem

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

12.1 Wie funktioniert ein Signifikanztest?

12.1 Wie funktioniert ein Signifikanztest? Sedlmeier & Renkewitz Kapitel 12 Signifikanztests 12.1 Wie funktioniert ein Signifikanztest? Zentrales Ergebnis eine Signifikanztests: Wie wahrscheinlich war es unter der Bedingung dass H0 gilt, diesen

Mehr

E ektgrößen Metaanalysen. Zusammenhänge und Unterschiede quantifizieren E ektgrößen

E ektgrößen Metaanalysen. Zusammenhänge und Unterschiede quantifizieren E ektgrößen DAS THEMA: EFFEKTGRÖßEN UND METAANALYSE E ektgrößen Metaanalysen Zusammenhänge und Unterschiede quantifizieren E ektgrößen Was ist ein E ekt? Was sind E ektgrößen? Berechnung von E ektgrößen Interpretation

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Analyse von Tabellen und kategorialen Daten

Analyse von Tabellen und kategorialen Daten Hans-Jürgen Andreß Jacques A. Hagenaars Steffen Kühnel Analyse von Tabellen und kategorialen Daten Log-lineare Modelle, latente Klassenanalyse, logistische Regression und GSK-Ansatz Mit 32 Abbildungen

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Fragen und Antworten zu Kapitel 18

Fragen und Antworten zu Kapitel 18 Fragen und Antworten zu Kapitel 18 (1) Nennen Sie verschiedene Zielsetzungen, die man mit der Anwendung der multiplen Regressionsanalyse verfolgt. Die multiple Regressionsanalyse dient der Kontrolle von

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0

Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0 Auswertung von kritischen Daten Vorgehensweise anhand eines Beispiels Visual-XSel 10.0??? Curt Ronniger 2007 Bei Neueinstieg in das Programm, sollte zunächst die Dokumentation XSelDoE10.pdf gelesen werden.

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Mediator-Effekte in der Regressionsanalyse (direkte, indirekte und totale Effekte)

Mediator-Effekte in der Regressionsanalyse (direkte, indirekte und totale Effekte) Version 1.3; Januar 007 Mediator-Effekte in der Regressionsanalyse (direkte, indirekte und totale Effekte) von Dieter Urban und Jochen Mayerl 1 Zum Inhalt: In dieser Ergänzung werden auf praxisorientierte

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Statistische Versuchsplanung - zuverlässiger und schneller zu Ergebnissen" Dr. Uwe Waschatz

Statistische Versuchsplanung - zuverlässiger und schneller zu Ergebnissen Dr. Uwe Waschatz Statistische Versuchsplanung - zuverlässiger und schneller zu Ergebnissen" Dr. Uwe Waschatz Inhalt Problembeschreibung Multiple lineare Regressionsanalyse Statistische Versuchsplanung / Design of Experiments

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Pfadanalyse Bacher, SoSe2007 1. Grundlegende Verfahren Explorative Pfadanalyse: Kausale Beziehungen zwischen Variablen werden aufgedeckt, erforderlich ist eine kausale Anordnung der Variablen. Konfirmatorische

Mehr

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17)

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) R.Niketta Multiple Regressionsanalyse Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) Daten: Selbstdarstellung und Kontaktsuche in studi.vz (POK VIII, AG 3) Fragestellung:

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Die Auswertung dyadischer Daten anhand des Partner-Effekt-Modells

Die Auswertung dyadischer Daten anhand des Partner-Effekt-Modells Die Auswertung dyadischer Daten anhand des Partner-Effekt-Modells Dorothea E. Dette-Hagenmeyer Was sind dyadische Daten? Dyadische Daten sind Daten von zwei oder mehreren Personen, die etwas miteinander

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

DOE am Beispiel Laserpointer

DOE am Beispiel Laserpointer DOE am Beispiel Laserpointer Swen Günther Ein wesentliches Ziel im Rahmen der Neuproduktentwicklung ist die aus Kundesicht bestmögliche, d.h. nutzenmaximale Konzeption des Produktes zu bestimmen (vgl.

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke

Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten Frank Konietschke Abteilung für Medizinische Statistik Universität Göttingen 1 Übersicht Beispiele CGI (repeated measures) γ-gt

Mehr

3. Der t-test. Der t-test

3. Der t-test. Der t-test Der t-test 3 3. Der t-test Dieses Kapitel beschäftigt sich mit einem grundlegenden statistischen Verfahren zur Auswertung erhobener Daten: dem t-test. Der t-test untersucht, ob sich zwei empirisch gefundene

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

SPSS an der Universität Osnabrück

SPSS an der Universität Osnabrück SPSS an der Universität Osnabrück Installation und Konfiguration einer Netzwerk-Lizenz Stand: Dienstag, 9. September 2014 Version: 1.0 Autor(en): Frank.Elsner@uni-osnabrueck.de, Rechenzentrum [FE] 2014

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen einer Population anhand eines Merkmals mit zwei oder mehr

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Parametrische Statistik

Parametrische Statistik Statistik und ihre Anwendungen Parametrische Statistik Verteilungen, maximum likelihood und GLM in R Bearbeitet von Carsten F. Dormann 1. Auflage 2013. Taschenbuch. xxii, 350 S. Paperback ISBN 978 3 642

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr