Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht des und dem Geschlecht der Befragten. Es besteht ein gegengeschlechtlicher Bias, d.h. Männer haben mehr Frauen und Frauen mehr Männer interviewt. 1. Schritt: Überprüfung der Zellensetzungen Zuerst sollten die Zellenbesetzungen überprüft werden. Denn eine Kreuztabellenanalyse mit unbesetzten Zellen oder zu vielen Zellen mit einer erwarteten Häufigkeit unter 5 ist nicht sinnvoll. Nachdem Sie "Kreuztabellen" aufgerufen haben, fügen Sie die unabhängige Variable "intersex" in das Spaltenfeld und die abhängige Variable f22 (Geschlecht der Befragten) in das Zeilenfeld. Anschließend klicken Sie auf "OK". Beispiel_chisq-test-V02.doc - 1 -
f22 Geschlecht * Kreuztabelle f22 Geschlecht Gesamt 1 weiblich 2 männlich 2.00 1.00 weiblich männlich Gesamt 32 28 60 24 13 37 56 41 97 Wie die Tabelle zeigt, sind die Zellenbesetzungen in Ordnung. Die grundlegenden Voraussetzungen für die Durchführung des chi-test sind erfüllt. 2. Schritt: Inferenzstatistische Prüfung der Hypothese 2.1 Annahmen: Messniveau: Zwei Nominalskalen, beide Variablen sind kategoriale Variablen. Modell: Unabhängige Zufallsstichproben, d.h., eine Person ist nur in einer Zelle vorhanden, es gibt keine wiederholte Messung. Nullhypothese (H 0 ): Keine Unterschiede zwischen den Geschlechtern der Interviewer in Bezug auf das befragte Geschlecht. 2.2 Signifikanzniveau: 5 % 2.3 Stichprobenkennwerteverteilung: χ² - Verteilung Es wird also der chi²-test für zwei unabhängige Stichproben gerechnet. 2.4. Berechnung der Test-Statistik Beispiel_chisq-test-V02.doc - 2 -
Zusätzlich zu den Zellenhäufigkeiten werden Statistik- und Zelleninformationen angefordert: An Statistiken werden der chi²-test, die Assoziationskoeffizienten phi und Cramers V sowie der PRE-Koeffizient lambda angefordert. Es sollen die beobachteten Werte, die spaltenweisen Prozente sowie die standardisierten Residuen (es lassen sich gut die Diskrepanzen zwischen den erwarteten und den beobachteten Häufigkeiten als z-werte erkennen) ausgeben werden. Die nicht ganzzahligen Gewichtungen spielen hier keine Rolle, sie sind bei Populationsschätzungen wichtig, wenn z.b. disproportionale Stichproben gezogen wurden. In beiden Fällen muss auf Weiter geklickt werden, dann kann im Kreuztabellenfenster auf OK gedrückt werden. Es empfiehlt sich übrigens, auf Einfügen zu klicken. Der zugrunde liegende Befehl wird dann im Syntax-Fenster angezeigt und kann auch von dort gestartet werden. Auf diese Weise wird auch die Berechnung dokumentiert. CROSSTABS /TABLES=f22 BY intersex /FORMAT= AVALUE TABLES /STATISTIC=CHISQ PHI LAMBDA /CELLS= COUNT COLUMN SRESID /COUNT ROUND CELL. Beispiel_chisq-test-V02.doc - 3 -
2.5 Entscheidung: Die Freiheitsgrade hängen von der Zahl der Zellen ab. Allgemein: df = (Spalten - 1) * (Zeilen - 1). Im vorliegenden Falle also (2-1) * (2-1) = 1. Der kritische Wert liegt bei df = 1 und 5 % Irrtumswahrscheinlichkeit bei 3.814. Quelle: http://www.stat.tamu.edu/~west/applets/chisqdemo.html Der empirische chi²-wert liegt bei 1.247. Damit liegt der empirische Wert unter dem kritischen Wert. Die Nullhypothese muss also beibehalten werden: Es gibt keinen Zusammenhang zwischen Geschlecht von Interviewten und Interviewern. Der beobachtete Zusammenhang (s. Häufigkeitstabelle) ist nur zufällig. Chi-Quadrat nach Pearson der gültigen Fälle Chi-Quadrat-Tests Wert 1.247 b 1.264 97 df Asymptotische Signifikanz (2-seitig) b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 15.64. In der SPSS-Ausgabe ist nur die erste Zeile von Interesse. Die SPSS-Tabelle gibt die genaue Wahrscheinlichkeit an: 0.264. Ich habe nur eine Irrtumswahrscheinlichkeit von 0.05 festgelegt, d.h. wenn meine Stichprobe aus einer Stichprobenkennwerteverteilung stammt, in der beide Variablen voneinander unabhängig sind, so akzeptiere ich nur, dass eine derartige Stichprobe, wie ich sie gezogen haben, in 5 von 100 Untersuchungen also sehr selten - auftritt. Im vorliegenden Fall tritt dieses Ergeb- Beispiel_chisq-test-V02.doc - 4 -
nis in 26 von 100 Stichprobenziehungen auf. Meine Stichprobe stammt also aus einer Verteilung, in der die Nullhypothese gilt. Auch die Assoziationskoeffizienten sind niedrig und von Null nicht verschieden. Symmetrische Maße Nominal- bzgl. Nominalmaß der gültigen Fälle Phi Cramer-V a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Näherungsweise Wert Signifikanz -.113.264.113.264 97 Der PRE-Koeffizient lambda ist Null. Richtungsmaße Nominal- bzgl. Nominalmaß Lambda Goodman-und-Kruskal- Tau Symmetrisch f22 Geschlecht abhängig abhängig f22 Geschlecht abhängig abhängig Wert.000.000.000.013.013 Beispiel_chisq-test-V02.doc - 5 -
f22 Geschlecht * Kreuztabelle f22 Geschlecht Gesamt 1 weiblich 2 männlich % von intersex Geschlecht des Standardisierte Residuen % von intersex Geschlecht des Standardisierte Residuen % von intersex Geschlecht des 2.00 1.00 weiblich männlich Gesamt 32 28 60 57.1% 68.3% 61.9% -.4.5 24 13 37 42.9% 31.7% 38.1%.6 -.7 56 41 97 100.0% 100.0% 100.0% Die Prozente deuten zwar einen Zusammenhang an, Frauen wurden von 57 % der Interviewerinnen, aber von 68 % der Interviewer befragt, auf die Männer kamen 43 % der Interviewerinnen, aber nur 32 % Inteviewer. Diese prozentualen Unterschiede sind aber nur zufällig und nicht systematisch. Dies deuten auch die Abweichungen (Standardisierte Residuen) an, bedeutsame Abweichungen in den jweiligen Zellen müssten über 2.0 sein. Bei einem statistisch signifikanten Ergebniss können die Ergebnisse grafisch über ein Balkendiagramm dargestellt werden. Günstig ist hierbei ein auf den prozentualen Vergleich aufbauendes Balkendiagramm. Leider kann über die "Kreuztabellen"- Prozedur bei SPSS nur ein Balkendiagramm mit absoluten Häufigkeiten angefordert werden. 3. Schritt: Diskussion Wenn die Nullhypothese beibehalten werden muss, dann können - die Alternativhypothese, also die theoretische Annahme falsch sein - die Operationalisierungen, die Durchführung oder sogar das statistische Modell falsch sein. Es ist also nicht eindeutig entscheidbar. Die Hypothese eines heterosexuellen Bias konnte also nicht bestätigt werden. Es kann also sein, dass sich Interviewer geschlechtsneutral verhalten. Andererseits kann davon ausgegangen werden, dass solche Personen angepeilt wurden, von denen man sich unabhängig von Geschlecht eine Auskunft erhoffte. Es spielen also andere Variablen wie vermutete Freundlichkeit oder auch die äußere Erscheinung eine Rolle. Beispiel_chisq-test-V02.doc - 6 -