Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Ähnliche Dokumente
Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Parametrische vs. Non-Parametrische Testverfahren

Master: Quantitative Methoden

Aufgaben zu Kapitel 4

Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau

Aufgaben zu Kapitel 8

Hypothesentests mit SPSS

Kreuztabellen mit Häufigkeiten und Prozenten

5. Lektion: Einfache Signifikanztests

Statistische Methoden in den Umweltwissenschaften

Kapitel 4: Merkmalszusammenhänge

Einfache statistische Auswertungen mit dem Programm SPSS

Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 12 Prof. Dr. Christian Heumann WS 2015/16

1. Datei Informationen

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Grundlagen der empirischen Sozialforschung

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

Online Statistik-Coaching

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Aufgaben zu Kapitel 8

11. Zusammenhangsmaße für nominale Variablen

Aufgaben zu Kapitel 9

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Aufgaben zu Kapitel 5:

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

UE Wahlfach - Praktische Anwendung statistischer Auswertungsmethoden Termin 1 WH und Erstellung von Auswertungsplänen

Aufgaben zu Kapitel 3

Einführung in die Korrelationsrechnung

2. Zusammenhangsmaße

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

Einführung in die Statistik

Ergebnisse VitA und VitVM

Aufgaben zu Kapitel 9

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

Statistische Datenanalyse

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko

Einstieg in SPSS. Man kann auch für jede Ausprägung einer Variablen ein Wertelabel vergeben.

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Aufgaben zu Kapitel 4

Kapitel 8: Verfahren für Rangdaten

Weitere Korrelationskoeffizienten (1)

Statistik. Jan Müller

Geschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3

Kapitel 9: Verfahren für Nominaldaten

Statistik für Psychologen und Sozialwissenschaftler. Pearson. Markus Bühner Matthias Ziegler. 2., aktualisierte und erweiterte Auflage

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Eigene MC-Fragen SPSS

Kapitel 4: Merkmalszusammenhänge

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

2. Deskriptive Datenanalyse

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Kapitel 4: Merkmalszusammenhänge

Aufgaben zu Kapitel 9

B.Heger / R. Prust WS 2010/11 Master Modul 1.3: Quantitative Methoden der empirischen Sozialforschung

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Korrelation, Regression und diagnostische Tests

Übung 3 im Fach "Biometrie / Q1"

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Karl Entacher. FH-Salzburg

Statistik II Übung 3: Hypothesentests

Bivariate Kreuztabellen

Aufgaben zu Kapitel 7:

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Hypothesentests mit SPSS

Der χ 2 -Test (Chiquadrat-Test)

Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für Gesundheitsfachberufe (2015) ISBN

Inhalt. Vorwort Univariate Verteilungen Verteilungen Die Normalverteilung... 47

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Statistisches Testen

Aufgaben zu Kapitel 7:

Hypothesentests mit SPSS

Unterschiedshypothesen bei nominalskalierten Messwerten

Inhaltsverzeichnis. II. Statistische Modelle und sozialwissenschaftliche Meßniveaus 16

Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen

JOHANNES GUTENBERG-UNIVERSITÄT MAINZ Psychologisches Institut Abteilung Methodenlehre & Statistik

6.4 Der Kruskal-Wallis Test

Transkript:

Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben. Dann kann es losgehen: Durch ein Streudiagramm (engl.»scatter«) können Sie den Zusammenhang zwischen zwei Variablen visualisieren. Folgendes Diagramm zeigt den Zusammenhang zwischen dem Alter und der Zeit, die für den TUG-Test benötigt wird, zum Zeitpunkt 0. Diagramme > Veraltete Dialogfelder > Streu/Punktdiagramm > einfaches Streudiagramm > definieren Wir haben das Alter auf die x-achse gesetzt und den TUG-Test auf die y-achse (das können Sie natürlich auch andersherum machen). Es gibt noch viele Optionen, welche die Grafik»schöner«machen würden. Hier reicht uns aber erst einmal die einfache Variante. So sieht die Grafik dann aus:

Arbeitsblatt SPSS Kapitel 8 Seite 2 Tendenziell ist zu erkennen, dass ältere Patienten mehr Zeit für den TUG-Test benötigen, also langsamer sind. Nun kommen wir zu einem einfachen Beispiel einer Korrelation zwischen zwei intervallskalierten Variablen: Pearsons Produkt-Moment-Korrelation Wir wollen untersuchen, ob es einen Zusammenhang gibt zwischen dem Alter der Probanden und den Ausgangswerten des»timed Up and Go» Tests (tug0). Da alle Voraussetzungen erfüllt sind (s. Buch) und das Streudiagramm auf einen positiven Zusammenhang hindeutet (s. oben), können wir den Test durchführen. Analysieren > Korrelation > Bivariat Die Variablen»tug0» und»alter«klicken Sie in das Variablenfenster. Bei den Korrelationskoeffizienten klicken Sie auf»pearson».

Arbeitsblatt SPSS Kapitel 8 Seite 3 Der Ausdruck zeigt eine Korrelation von r=0.492 mit einer Signifikanz von p=0.000. Die Messwerte der Variablen»alter«und»tug0» weisen somit einen moderaten, aber höchstsignifikanten positiven Zusammenhang auf. Je älter die Probanden sind, desto länger brauchen sie für den TUG-Test. Korrelationen Time up to go Test Zeitpunkt 0 Alter in Jahren Time up to go Test Zeitpunkt 0 Korrelation nach Pearson Signifikanz (2-seitig) N,492**,000 Korrelation nach Pearson,492** Alter in Jahren Signifikanz (2-seitig),000 N ** Die Korrelation ist auf dem Niveau von 0,0 (2-seitig) signifikant.

Arbeitsblatt SPSS Kapitel 8 Seite 4 Rangkorrelation nach Spearman Um Zusammenhänge von ordinalskalierten Messwerten zweier Variablen X und Y oder auch nicht-lineare, aber monotone Zusammenhänge zu untersuchen, verwenden wir nicht-parametrische Verfahren. Ein häufig verwendetes Verfahren ist die Rangkorrelation nach Spearman. Hier unser Beispiel aus dem Buch: Wir wollen untersuchen, ob es einen Zusammenhang zwischen der sportlichen Aktivität der Probanden vor dem Schlaganfall (Variable»sport«) und der Verbesserung der Unabhängigkeit in den Aktivitäten des täglichen Lebens (Variable»bartdif«) gibt. Beide Variablen»sport«und»bartdif«sind ordinalskaliert. Das Streudiagramm sieht wie folgt aus: Diagramme > Veraltete Dialogfelder > Streu/Punktdiagramm > einfaches Streudiagramm > definieren Für die x-achse definieren wir»bartdif«und für die y-achse»sport«. Der Unterschied zum Streudiagramm zweier intervallskalierter Variablen (z. B. tug0/alter) ist offensichtlich. Eine Erklärung des Streudiagramms finden Sie im Buch. In einem solchen Fall verwenden wir statt des Pearson-Tests die sog. Rangkorrelation nach Spearman. Das Vorgehen ist sehr einfach und entspricht dem Vorgehen beim Pearson-Test. Sie müssen das Häkchen nur bei»spearman«setzen:

Arbeitsblatt SPSS Kapitel 8 Seite 5 Analysieren > Korrelation > Bivariat Hier wiederum das Ergebnis: Korrelationen Differenz im Barthelindex sportliche Betätigung Spearman-Rho Differenz im Barthelindex sportliche Betätigung Korrelationskoeffizient Sig. (2-seitig) N Korrelationskoeffizient Sig. (2-seitig) N,000.,66**,000,66**,000,000. ** Die Korrelation ist auf dem 0,0 Niveau signifikant (zweiseitig). Sie sehen: Es gibt einen höchstsignifikanten starken positiven Zusammenhang zwischen der sportlichen Aktivität vor dem Schlaganfall und der Verbesserung der Unabhängigkeit in den Aktivitäten des täglichen Lebens mit r s = 0,66, n=, p = 0.000. Je häufiger sich die Probanden vor dem Schlaganfall sportlich betätigt haben, desto stärker war ihre Verbesserung in den ADL nach der Intervention.

Arbeitsblatt SPSS Kapitel 8 Seite 6 Korrelationskoeffizient für nominalskalierten Variablen: Cramers V Der Chi 2 -Test, den Sie schon in Kap. 7 kennengelernt haben, wird auch verwendet, um Zusammenhangshypothesen zu testen, und heißt dann Chi 2 -Unabhängigkeitstest. Es wird getestet, ob zwei Variablen nicht miteinander zusammenhängen, also unabhängig voneinander sind (Eid et al. 203). Die Berechnung der Prüfgröße Chi 2 erfolgt analog zum dem in Kap. 7 dargestellten Vorgehen. Aus der Prüfgröße Chi 2 wird das Zusammenhangsmaß Cramers V berechnet. Die Fragestellung aus dem Buch: Wir wollen untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht eines Probanden und dem Vorhandensein einer Aphasie vor Beginn der Intervention gibt. Dazu prüfen wir zunächst die Voraussetzungen für die Berechnung des Chi 2 -Wertes (s. Buch). In SPSS kann man das ganz einfach über die Kreuztabellen testen: Analysieren > Deskriptive Statistiken > Kreuztabellen

Arbeitsblatt SPSS Kapitel 8 Seite 7 Bei»Statistiken«klicken wir»chi-quadrat«und»phi und Cramer V«an Hier wiederum das Ergebnis: Geschlecht * Aphasie zum Zeitpunkt 0 Kreuztabelle Aphasie zum Zeitpunkt 0 Gesamt keine Aphasie Aphasie Geschlecht Gesamt weiblich männlich Anzahl Erwartete Anzahl % innerhalb von Aphasie zum Zeitpunkt 0 Anzahl Erwartete Anzahl % innerhalb von Aphasie zum Zeitpunkt 0 Anzahl Erwartete Anzahl % innerhalb von Aphasie zum Zeitpunkt 0 6 6,2 57,% 2,8 42,9% 28 28,0 00,0% 4 3,8 58,3% 0 0,2 4,7% 24 24,0 00,0% 30 30,0 57,7% 22 22,0 42,3%,0 00,0%

Arbeitsblatt SPSS Kapitel 8 Seite 8 Chi-Quadrat-Tests Wert df Asymptotische Signifikanz (2-seitig) Exakte Signifikanz (2-seitig) Exakte Signifikanz (-seitig) Chi-Quadrat nach Pearson Kontinuitätskorrektur b,008 a,000,93,000 Likelihood-Quotient,008,93 Exakter Test nach Fisher,000,578 Zusammenhang linear-mit-,007,932 linear Anzahl der gültigen Fälle a 0 Zellen (0,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 0,5. b Wird nur für eine 2x2-Tabelle berechnet Symmetrische Maße Wert Nominal-bzgl. Nominalmaß Phi -,02,02 Cramer-V Anzahl der gültigen Fälle Näherungsweis e Signifikanz,93,93 In der unteren Zeile der Kreuztabelle (erste Tabelle) sind jeweils die erwarteten Häufigkeiten angezeigt (vgl. Buch). Sie sehen: Sowohl der Chi-Quadrat als auch Cramers V zeigen, dass es zum Zeitpunkt 0 keinen signifikanten Zusammenhang zwischen dem Vorliegen einer Aphasie und dem Geschlecht gibt (Cramer-V = -0.02, p=0.93).

Arbeitsblatt SPSS Kapitel 8 Seite 9 Korrelation von metrisch skalierten mit dichotomen Variablen (der punktbiseriale und der biseriale Korrelationskoeffizient) Sehen wir uns unser Beispiel aus dem Buch genauer an: Es soll die Frage untersucht werden, ob es einen Zusammenhang zwischen dem Alter der Probanden und dem Auftreten einer Aphasie zum Zeitpunkt T0 gibt. Die Messwerte der Variablen Alter sind metrisch skaliert, die der Variablen Aphasie vor der Intervention nominal mit zwei Ausprägungen. Es handelt es sich bei der Variablen aph0 also um ein dichotomes (hier: binäres) Merkmal. Der punktbiseriale Korrelationskoeffizient wird berechnet, wenn Sie eine von sich aus dichotome Variable mit einer metrischen Variablen korrelieren möchten. SPSS bietet leider keine Möglichkeit, den punktbiserialen Korrelationskoeffizienten zu berechnen. Allerdings gilt: Wenn die beiden Merkmalsausprägungen der dichotomen Variablen mit 0 und kodiert sind, dann (nur dann!) ist der punktbiseriale Korrelationskoeffizient identisch mit Pearsons r. Wir können unsere Frage also mit Hilfe des Pearson r beantworten. In SPSS gehen wir dazu wie folgt vor: Analysieren > Korrelation > Bivariat Bringen Sie die metrische Variable (alter) und die mit 0 und kodierte dichotome Variable (aph0) jeweils in das Feld»Variablen«und klicken schließlich unter»korrelationskoeffizientenpearson«an. Hier der Output: Korrelationen Alter in Jahren Aphasie zum Zeitpunkt 0 Alter in Jahren Aphasie zum Zeitpunkt 0 Korrelation nach Pearson Signifikanz (2-seitig) N Korrelation nach Pearson Signifikanz (2-seitig) N,204,48,204,48

Arbeitsblatt SPSS Kapitel 8 Seite 0 Sie sehen: Zwischen den Messwerten der Variablen»alter«und»aph0«gibt es einen moderaten, positiven Zusammenhang mit r = 0,204. Der Zusammenhang ist jedoch nicht signifikant (p=0,48). Kommen wir nun zum biserialen Korrelationskoeffizienten: Der biseriale Korrelationskoeffizient wird berechnet, wenn Sie eine nachträglich dichotomisierte Variable, die ursprünglich metrisch und normalverteilt war, mit einer metrischen Variable korrelieren wollen. Leider bietet SPSS auch keine Möglichkeit, den biserialen Korrelationskoeffizienten direkt zu berechnen. Alternativen sind das Richtungsmaß»Eta«und das»somers d«. Das»Eta«kann berechnet werden, wenn Sie eine nominale, ordinale oder klassifizierte metrische Variable mit einer metrisch skalierten Variablen korrelieren wollen. Wenn dabei die nominale, ordinale oder klassifizierte metrische Variable (also die Gruppierungsvariable) dichotom oder dichotomisiert ist, entspricht das Richtungsmaß»Eta«dem biserialen Korrelationskoeffizienten. Für die Größe des Zusammenhangs gibt Cohen (988) folgende»faustregel«: Eta < 0,0 = kein Zusammenhang; Eta zwischen 0,0 und 0,04 = geringer Zusammenhang; Eta zwischen 0,04 und 0,6 = mittlerer Zusammenhang; Eta > 0,6 = großer Zusammenhang. Eine weitere Alternative ist das Somers d. Den Zusammenhang zwischen der biserialen Korrelation und»somers d«hat Newson (2008) beschrieben. Das Eta und das Somers d werden in SPSS unter Analysieren --> Deskriptive Statistiken --> Kreuztabellen --> Statistik angeboten.

Arbeitsblatt SPSS Kapitel 8 Seite

Arbeitsblatt SPSS Kapitel 8 Seite 2 Hier der Output der Richtungsmaße: Richtungsmaße Ordinal-bzgl. Ordinalmaß Nominal-bzgl. Intervallmaß Somersd Eta Symmetrisch Alter in Jahren abhängig Aphasie zum Zeitpunkt 0 abhängig Alter in Jahren abhängig Aphasie zum Zeitpunkt 0 abhängig Wert,53,223,7,204,728 Asymptotischer Näherungsweises Näherungsweise Standardfehler a T b Signifikanz,07,56,08,432,432,432,,, a. Die Null-Hypothese wird nicht angenommen. b. Unter Annahme der Null-Hypothese wird der asymptotische Standardfehler verwendet. Sie sehen: Die Richtungsmaße Somers d und Eta zeigen einen starken (Somers d=0,223, Eta=0,204), aber nicht-signifikanten Zusammenhang (p=0.) zwischen dem Alter der Probanden und der Aphasie zum Zeitpunkt 0. Literatur: Cohen J (988) Statistical Power Analysis for the Behavioral Sciences, 2. Aufl. Lawrence Erlbaum, Hillsdale Eid M, Gollwitzer M, Schmitt M (203) Statistik und Forschungsmethoden, 3. Aufl. Beltz, Weinheim Newson R (2008) Identity of Somers' D and the rank biserial correlation coefficient. http://www.imperial.ac.uk/nhli/r.newson/miscdocs/ranksum.pdf. Zugegriffen: 23. Februar 205