Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben. Dann kann es losgehen: Durch ein Streudiagramm (engl.»scatter«) können Sie den Zusammenhang zwischen zwei Variablen visualisieren. Folgendes Diagramm zeigt den Zusammenhang zwischen dem Alter und der Zeit, die für den TUG-Test benötigt wird, zum Zeitpunkt 0. Diagramme > Veraltete Dialogfelder > Streu/Punktdiagramm > einfaches Streudiagramm > definieren Wir haben das Alter auf die x-achse gesetzt und den TUG-Test auf die y-achse (das können Sie natürlich auch andersherum machen). Es gibt noch viele Optionen, welche die Grafik»schöner«machen würden. Hier reicht uns aber erst einmal die einfache Variante. So sieht die Grafik dann aus:
Arbeitsblatt SPSS Kapitel 8 Seite 2 Tendenziell ist zu erkennen, dass ältere Patienten mehr Zeit für den TUG-Test benötigen, also langsamer sind. Nun kommen wir zu einem einfachen Beispiel einer Korrelation zwischen zwei intervallskalierten Variablen: Pearsons Produkt-Moment-Korrelation Wir wollen untersuchen, ob es einen Zusammenhang gibt zwischen dem Alter der Probanden und den Ausgangswerten des»timed Up and Go» Tests (tug0). Da alle Voraussetzungen erfüllt sind (s. Buch) und das Streudiagramm auf einen positiven Zusammenhang hindeutet (s. oben), können wir den Test durchführen. Analysieren > Korrelation > Bivariat Die Variablen»tug0» und»alter«klicken Sie in das Variablenfenster. Bei den Korrelationskoeffizienten klicken Sie auf»pearson».
Arbeitsblatt SPSS Kapitel 8 Seite 3 Der Ausdruck zeigt eine Korrelation von r=0.492 mit einer Signifikanz von p=0.000. Die Messwerte der Variablen»alter«und»tug0» weisen somit einen moderaten, aber höchstsignifikanten positiven Zusammenhang auf. Je älter die Probanden sind, desto länger brauchen sie für den TUG-Test. Korrelationen Time up to go Test Zeitpunkt 0 Alter in Jahren Time up to go Test Zeitpunkt 0 Korrelation nach Pearson Signifikanz (2-seitig) N,492**,000 Korrelation nach Pearson,492** Alter in Jahren Signifikanz (2-seitig),000 N ** Die Korrelation ist auf dem Niveau von 0,0 (2-seitig) signifikant.
Arbeitsblatt SPSS Kapitel 8 Seite 4 Rangkorrelation nach Spearman Um Zusammenhänge von ordinalskalierten Messwerten zweier Variablen X und Y oder auch nicht-lineare, aber monotone Zusammenhänge zu untersuchen, verwenden wir nicht-parametrische Verfahren. Ein häufig verwendetes Verfahren ist die Rangkorrelation nach Spearman. Hier unser Beispiel aus dem Buch: Wir wollen untersuchen, ob es einen Zusammenhang zwischen der sportlichen Aktivität der Probanden vor dem Schlaganfall (Variable»sport«) und der Verbesserung der Unabhängigkeit in den Aktivitäten des täglichen Lebens (Variable»bartdif«) gibt. Beide Variablen»sport«und»bartdif«sind ordinalskaliert. Das Streudiagramm sieht wie folgt aus: Diagramme > Veraltete Dialogfelder > Streu/Punktdiagramm > einfaches Streudiagramm > definieren Für die x-achse definieren wir»bartdif«und für die y-achse»sport«. Der Unterschied zum Streudiagramm zweier intervallskalierter Variablen (z. B. tug0/alter) ist offensichtlich. Eine Erklärung des Streudiagramms finden Sie im Buch. In einem solchen Fall verwenden wir statt des Pearson-Tests die sog. Rangkorrelation nach Spearman. Das Vorgehen ist sehr einfach und entspricht dem Vorgehen beim Pearson-Test. Sie müssen das Häkchen nur bei»spearman«setzen:
Arbeitsblatt SPSS Kapitel 8 Seite 5 Analysieren > Korrelation > Bivariat Hier wiederum das Ergebnis: Korrelationen Differenz im Barthelindex sportliche Betätigung Spearman-Rho Differenz im Barthelindex sportliche Betätigung Korrelationskoeffizient Sig. (2-seitig) N Korrelationskoeffizient Sig. (2-seitig) N,000.,66**,000,66**,000,000. ** Die Korrelation ist auf dem 0,0 Niveau signifikant (zweiseitig). Sie sehen: Es gibt einen höchstsignifikanten starken positiven Zusammenhang zwischen der sportlichen Aktivität vor dem Schlaganfall und der Verbesserung der Unabhängigkeit in den Aktivitäten des täglichen Lebens mit r s = 0,66, n=, p = 0.000. Je häufiger sich die Probanden vor dem Schlaganfall sportlich betätigt haben, desto stärker war ihre Verbesserung in den ADL nach der Intervention.
Arbeitsblatt SPSS Kapitel 8 Seite 6 Korrelationskoeffizient für nominalskalierten Variablen: Cramers V Der Chi 2 -Test, den Sie schon in Kap. 7 kennengelernt haben, wird auch verwendet, um Zusammenhangshypothesen zu testen, und heißt dann Chi 2 -Unabhängigkeitstest. Es wird getestet, ob zwei Variablen nicht miteinander zusammenhängen, also unabhängig voneinander sind (Eid et al. 203). Die Berechnung der Prüfgröße Chi 2 erfolgt analog zum dem in Kap. 7 dargestellten Vorgehen. Aus der Prüfgröße Chi 2 wird das Zusammenhangsmaß Cramers V berechnet. Die Fragestellung aus dem Buch: Wir wollen untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht eines Probanden und dem Vorhandensein einer Aphasie vor Beginn der Intervention gibt. Dazu prüfen wir zunächst die Voraussetzungen für die Berechnung des Chi 2 -Wertes (s. Buch). In SPSS kann man das ganz einfach über die Kreuztabellen testen: Analysieren > Deskriptive Statistiken > Kreuztabellen
Arbeitsblatt SPSS Kapitel 8 Seite 7 Bei»Statistiken«klicken wir»chi-quadrat«und»phi und Cramer V«an Hier wiederum das Ergebnis: Geschlecht * Aphasie zum Zeitpunkt 0 Kreuztabelle Aphasie zum Zeitpunkt 0 Gesamt keine Aphasie Aphasie Geschlecht Gesamt weiblich männlich Anzahl Erwartete Anzahl % innerhalb von Aphasie zum Zeitpunkt 0 Anzahl Erwartete Anzahl % innerhalb von Aphasie zum Zeitpunkt 0 Anzahl Erwartete Anzahl % innerhalb von Aphasie zum Zeitpunkt 0 6 6,2 57,% 2,8 42,9% 28 28,0 00,0% 4 3,8 58,3% 0 0,2 4,7% 24 24,0 00,0% 30 30,0 57,7% 22 22,0 42,3%,0 00,0%
Arbeitsblatt SPSS Kapitel 8 Seite 8 Chi-Quadrat-Tests Wert df Asymptotische Signifikanz (2-seitig) Exakte Signifikanz (2-seitig) Exakte Signifikanz (-seitig) Chi-Quadrat nach Pearson Kontinuitätskorrektur b,008 a,000,93,000 Likelihood-Quotient,008,93 Exakter Test nach Fisher,000,578 Zusammenhang linear-mit-,007,932 linear Anzahl der gültigen Fälle a 0 Zellen (0,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 0,5. b Wird nur für eine 2x2-Tabelle berechnet Symmetrische Maße Wert Nominal-bzgl. Nominalmaß Phi -,02,02 Cramer-V Anzahl der gültigen Fälle Näherungsweis e Signifikanz,93,93 In der unteren Zeile der Kreuztabelle (erste Tabelle) sind jeweils die erwarteten Häufigkeiten angezeigt (vgl. Buch). Sie sehen: Sowohl der Chi-Quadrat als auch Cramers V zeigen, dass es zum Zeitpunkt 0 keinen signifikanten Zusammenhang zwischen dem Vorliegen einer Aphasie und dem Geschlecht gibt (Cramer-V = -0.02, p=0.93).
Arbeitsblatt SPSS Kapitel 8 Seite 9 Korrelation von metrisch skalierten mit dichotomen Variablen (der punktbiseriale und der biseriale Korrelationskoeffizient) Sehen wir uns unser Beispiel aus dem Buch genauer an: Es soll die Frage untersucht werden, ob es einen Zusammenhang zwischen dem Alter der Probanden und dem Auftreten einer Aphasie zum Zeitpunkt T0 gibt. Die Messwerte der Variablen Alter sind metrisch skaliert, die der Variablen Aphasie vor der Intervention nominal mit zwei Ausprägungen. Es handelt es sich bei der Variablen aph0 also um ein dichotomes (hier: binäres) Merkmal. Der punktbiseriale Korrelationskoeffizient wird berechnet, wenn Sie eine von sich aus dichotome Variable mit einer metrischen Variablen korrelieren möchten. SPSS bietet leider keine Möglichkeit, den punktbiserialen Korrelationskoeffizienten zu berechnen. Allerdings gilt: Wenn die beiden Merkmalsausprägungen der dichotomen Variablen mit 0 und kodiert sind, dann (nur dann!) ist der punktbiseriale Korrelationskoeffizient identisch mit Pearsons r. Wir können unsere Frage also mit Hilfe des Pearson r beantworten. In SPSS gehen wir dazu wie folgt vor: Analysieren > Korrelation > Bivariat Bringen Sie die metrische Variable (alter) und die mit 0 und kodierte dichotome Variable (aph0) jeweils in das Feld»Variablen«und klicken schließlich unter»korrelationskoeffizientenpearson«an. Hier der Output: Korrelationen Alter in Jahren Aphasie zum Zeitpunkt 0 Alter in Jahren Aphasie zum Zeitpunkt 0 Korrelation nach Pearson Signifikanz (2-seitig) N Korrelation nach Pearson Signifikanz (2-seitig) N,204,48,204,48
Arbeitsblatt SPSS Kapitel 8 Seite 0 Sie sehen: Zwischen den Messwerten der Variablen»alter«und»aph0«gibt es einen moderaten, positiven Zusammenhang mit r = 0,204. Der Zusammenhang ist jedoch nicht signifikant (p=0,48). Kommen wir nun zum biserialen Korrelationskoeffizienten: Der biseriale Korrelationskoeffizient wird berechnet, wenn Sie eine nachträglich dichotomisierte Variable, die ursprünglich metrisch und normalverteilt war, mit einer metrischen Variable korrelieren wollen. Leider bietet SPSS auch keine Möglichkeit, den biserialen Korrelationskoeffizienten direkt zu berechnen. Alternativen sind das Richtungsmaß»Eta«und das»somers d«. Das»Eta«kann berechnet werden, wenn Sie eine nominale, ordinale oder klassifizierte metrische Variable mit einer metrisch skalierten Variablen korrelieren wollen. Wenn dabei die nominale, ordinale oder klassifizierte metrische Variable (also die Gruppierungsvariable) dichotom oder dichotomisiert ist, entspricht das Richtungsmaß»Eta«dem biserialen Korrelationskoeffizienten. Für die Größe des Zusammenhangs gibt Cohen (988) folgende»faustregel«: Eta < 0,0 = kein Zusammenhang; Eta zwischen 0,0 und 0,04 = geringer Zusammenhang; Eta zwischen 0,04 und 0,6 = mittlerer Zusammenhang; Eta > 0,6 = großer Zusammenhang. Eine weitere Alternative ist das Somers d. Den Zusammenhang zwischen der biserialen Korrelation und»somers d«hat Newson (2008) beschrieben. Das Eta und das Somers d werden in SPSS unter Analysieren --> Deskriptive Statistiken --> Kreuztabellen --> Statistik angeboten.
Arbeitsblatt SPSS Kapitel 8 Seite
Arbeitsblatt SPSS Kapitel 8 Seite 2 Hier der Output der Richtungsmaße: Richtungsmaße Ordinal-bzgl. Ordinalmaß Nominal-bzgl. Intervallmaß Somersd Eta Symmetrisch Alter in Jahren abhängig Aphasie zum Zeitpunkt 0 abhängig Alter in Jahren abhängig Aphasie zum Zeitpunkt 0 abhängig Wert,53,223,7,204,728 Asymptotischer Näherungsweises Näherungsweise Standardfehler a T b Signifikanz,07,56,08,432,432,432,,, a. Die Null-Hypothese wird nicht angenommen. b. Unter Annahme der Null-Hypothese wird der asymptotische Standardfehler verwendet. Sie sehen: Die Richtungsmaße Somers d und Eta zeigen einen starken (Somers d=0,223, Eta=0,204), aber nicht-signifikanten Zusammenhang (p=0.) zwischen dem Alter der Probanden und der Aphasie zum Zeitpunkt 0. Literatur: Cohen J (988) Statistical Power Analysis for the Behavioral Sciences, 2. Aufl. Lawrence Erlbaum, Hillsdale Eid M, Gollwitzer M, Schmitt M (203) Statistik und Forschungsmethoden, 3. Aufl. Beltz, Weinheim Newson R (2008) Identity of Somers' D and the rank biserial correlation coefficient. http://www.imperial.ac.uk/nhli/r.newson/miscdocs/ranksum.pdf. Zugegriffen: 23. Februar 205