Kapitel 16 Kreuztabellen

Transkript

1 Kapitel 16 Kreuztabellen Eine Kreuztabelle dient dazu, die kombinierte Häufigkeitsverteilung zweier Variablen darzustellen. Sie bildet somit das Pendant zu einer Häufigkeitstabelle für den 2-Variablen-Fall. Erstellen Sie beispielsweise eine Häufigkeitstabelle für die Variable Geschlecht, gibt Ihnen die Tabelle an, wie viele Frauen und wie viele Männer in der betrachteten Stichprobe enthalten sind. Ebenso können Sie eine Häufigkeitstabelle für eine Variable Familienstand erstellen, aus der hervorgeht, wie viele der Personen aus der Stichprobe jeweils ledig, verheiratet, geschieden etc. sind. Wenn Sie nun eine Kreuztabelle für die beiden Variablen Geschlecht und Familienstand erstellen, gibt diese Tabelle die der ledigen Frauen, der ledigen Männer, der verheirateten Frauen, der verheirateten Männer etc. an. Es werden also Fallgruppen - in diesem Beispiel Personengruppen - betrachtet, die durch die Kombination der Merkmale aus den beiden Variablen Geschlecht und Familienstand definiert sind. Die Prozedur KREUZTABELLEN beschränkt sich jedoch nicht nur darauf, die gemeinsame Verteilung zweier Variablen in einer Tabelle darzustellen, sondern sie bietet auch statistische Tests an, mit denen untersucht werden kann, ob möglicherweise ein Zusammenhang zwischen den beiden Variablen besteht. Wenn sich beispielsweise zeigt, daß in einer bestimmten Stichprobe ein Großteil der Männer entweder ledig oder geschieden ist, während ein Großteil der Frauen verheiratet ist, läßt dies unter Umständen den Schluß zu, daß in der entsprechenden Grundgesamtheit ein Zusammenhang zwischen dem Familienstand und dem Geschlecht einer Person besteht. Um die Prozedur KREUZTABELLEN aufzurufen, wählen Sie den Befehl STATISTIK ZUSAMMENFASSEN KREUZTABELLEN... Mit dieser Prozedur lassen sich drei unterschiedliche Arten von Output erstellen: ¾ Kreuztabellen: In einer Kreuztabelle wird die gemeinsame Häufigkeitsverteilung zweier Variablen angegeben. Wie bei der Häufigkeitstabelle, in der die Häufigkeitsverteilung einer einzelnen Variablen dargestellt wird, können auch bei der Kreuztabelle nicht nur die absoluten Häufigkeiten, sondern auch ver-

2 396 Kapitel 16 Kreuztabellen schiedene relative Häufigkeiten und zudem sogenannte erwartete Häufigkeiten ausgegeben werden. Die Idee von erwarteten Häufigkeiten bildet die Grundlage für einen Signifikanztest zur Untersuchung eines möglichen Zusammenhangs zwischen den Variablen. Durch das Einbeziehen mehrerer Dimensionen in eine Kreuztabelle bzw. durch die Kombination mehrerer Tabellen läßt sich auch die gemeinsame Häufigkeitsverteilung von mehr als zwei Variablen darstellen. ¾ Chi-Quadrat-Test: Der χ 2 -Test überprüft, ob zwei Variablen vollkommen unabhängig voneinander verteilt sind oder ob ein Zusammenhang zwischen den Variablen besteht. Bei der Prozedur werden χ 2 -Tests nach unterschiedlichen Methoden berechnet. ¾ Zusammenhangsmaße: Zusammenhangsmaße versuchen, durch eine Maßzahl die Stärke eines Zusammenhangs zwischen zwei Variablen zum Ausdruck zu bringen. Während Kreuztabellen und der χ 2 -Test im wesentlichen für nominal- und ordinalskalierte Variablen sinnvoll angewandt werden können, stehen Zusammenhangsmaße auch für intervallskalierte Variablen zur Verfügung Kreuztabellen auswerten Das Beispiel: Demokratisches System und Wirtschaftslage in Deutschland In der 1996 durchgeführten Allbus-Bevölkerungsbefragung wurden die Befragten unter anderem um eine Bewertung des demokratischen Systems in Deutschland gebeten. Abbildung 16.1 zeigt die Frage sowie die vorgegebenen Antwortkategorien, mit denen diese Einschätzung abgefragt wurde. Alles in allem gesehen, was denken Sie, wie gut oder schlecht funktioniert das demokratische System in Deutschland heute? (Bitte nur ein Kästchen ankreuzen!) Es funktioniert gut und muß nicht verändert werden. Es funktioniert im großen und ganzen gut, muß aber in einigen Punkten verändert werden. Es funktioniert nicht gut und muß in vielen Punkten verändert werden. Es funktioniert überhaupt nicht gut und muß völlig verändert werden. Kann ich nicht sagen. Abbildung 16.1: Fragetext und Antwortkategorien für die Variable v408

3 16.1 Kreuztabellen auswerten 397 Die Antworten auf diese Frage sind in der Datendatei allbus.sav von der Begleit- CD in der Variablen v408 enthalten. Die Antwort Kann ich nicht sagen wurde in dieser Variablen durch den Wert 8 codiert, der als fehlender Wert definiert ist. 179 Die Frage nach der Einschätzung des demokratischen Systems ist recht allgemein formuliert und überläßt es den Befragten zu entscheiden, welche Anforderungen an ein demokratisches System zu stellen sind. So mag es sein, daß einige Befragte von einem demokratischen System verlangen, daß die Entscheidungsprozesse in einem Kollektiv wie beispielsweise der Gesamtbevölkerung Deutschlands auf bestimmte Weise ablaufen und somit gewährleistet ist, daß die Präferenzen der einzelnen (zur Teilnahme am Abstimmungsprozeß berechtigten) Mitglieder in geeigneter Weise zur einer Kollektiventscheidung aggregiert werden. Ist ein solcher Entscheidungsprozeß sichergestellt, könnte demnach unabhängig von dem Ergebnis dieses Entscheidungsprozesses von einem gut funktionierendem demokratischen System gesprochen werden. Denkbar ist jedoch auch, daß nicht nur der Entscheidungsprozeß, sondern auch dessen Ergebnis als relevant für die Bewertung des demokratischen Systems angesehen werden. Möglicherweise orientieren sich die Befragten bei der Beantwortung derselben Frage also an unterschiedlichen Kriterien. Neben einer Bewertung des demokratischen Systems sollten die Befragten auch eine Bewertung der allgemeinen wirtschaftlichen Lage in Deutschland vornehmen. Abbildung 16.2 zeigt den dabei verwendeten Fragetext sowie die vorgegebenen Antwortkategorien. In der Datendatei allbus.sav sind die zu dieser Frage gehörenden Antworten in der Variablen v113 enthalten. 180 Wie beurteilen Sie ganz allgemein die heutige wirtschaftliche Lage in Deutschland? Sehr gut Gut Teils gut / teils schlecht Schlecht Sehr schlecht Abbildung 16.2: Fragetext und Antwortkategorien für die Variable v113 Die allgemeine Wirtschaftslage kann als eines der wesentlichen Merkmale für den Zustand eines Landes angesehen werden. Ist die Wirtschaftslage nicht zufriedenstellend, werden häufig grundlegende Strukturen in der Organisation eines Landes in Frage gestellt. Dies betrifft auch das demokratische System als Ganzes, dessen 179 Für Befragte, die keines der Kästchen angekreuzt haben, also auch nicht die Antwort Kann ich nicht sagen, ist in der Variablen der Wert 9 eingetragen, der ebenfalls als fehlender Wert gekennzeichnet ist. Zudem gibt es Befragte, denen nicht der gesamte Fragebogen, sondern nur ein Teil des Fragenkatalogs vorgelegt wurde. Der Teil, der diesen Befragten nicht präsentiert wurde und den sie daher auch nicht beantwortet haben, schließt auch die Variable v408 ein. Die Befragten, für die aus diesem Grund keine Einschätzung des demokratischen Systems vorliegt, weisen in der Variablen v408 die Codierung 0 auf. Auch dies ist ein benutzerdefinierte fehlender Wert. Für die Variable wurden somit insgesamt drei Werte als systemdefinierte fehlende Werte gekennzeichnet: 0, 8 und Diese Variable wurde bereits in Kapitel 16, Häufigkeitstabellen, betrachtet.

4 398 Kapitel 16 Kreuztabellen Funktionsfähigkeit und Effizienz oftmals - bewußt oder unbewußt - nicht unabhängig von der Wirtschaftslage bewertet wird, denn diese stellt unter anderem das Resultat der im Rahmen des demokratischen Systems ablaufenden Entscheidungsprozesse dar. Aus diesem Grund soll im folgenden zunächst die gemeinsame Wahrscheinlichkeitsverteilung der Variablen v408 und v113 in einer Kreuztabelle dargestellt und anschließend auf einen möglichen Zusammenhang zwischen den Variablen untersucht werden Verteilungsangaben in der Kreuztabelle Tabelle erstellen Die in Abbildung 16.3 wiedergegebene Kreuztabelle für die Variablen v408 und v113 wurde mit den folgenden Schritten und Dialogfeldeinstellungen der Prozedur KREUZTABELLEN erzeugt: ¾ Fälle gewichten: Im folgenden sollen die Antworten der Befragten aus den neuen und den alten Bundesländern gemeinsam untersucht werden. In der Datendatei sind Personen aus den neuen Bundesländern jedoch überproportional häufig vertreten. 181 Wenn sich Befragte aus den beiden Bundesgebieten in ihren Antworten nun systematisch voneinander unterscheiden, würde die gemeinsame Auswertung der beiden Personengruppen ohne eine vorherige Korrektur der disproportionalen Stichprobenziehung zu falschen Ergebnisse führen. Die Überrepräsentation der Befragten aus den neuen Bundesländern kann dadurch korrigiert werden, daß die Fälle für Personen aus den alten Ländern entsprechend höher gewichtet werden. Hierzu enthält die Datendatei bereits eine Variable mit geeigneten Gewichten, dies ist v434. Verwenden Sie zur Gewichtung der Fälle den Befehl DATEN, FÄLLE GEWICHTEN, wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle gewichten mit, und fügen Sie die Variable v434 in das entsprechende Feld ein, bevor Sie das Dialogfeld wieder mit OK schließen. ¾ Variablen für die Kreuztabelle: Fügen Sie in dem Dialogfeld der Prozedur KREUZTABELLEN die Variable v113 in das Feld Zeilen und v408 in das Feld Spalten ein. ¾ Zellen: Wählen Sie in dem Dialogfeld der Schaltfläche Zellen die beiden Optionen Beobachtet (Gruppe Häufigkeiten) und Spaltenweise (Gruppe Prozentwerte). Bei allen übrigen Optionen der Dialogfelder werden die Voreinstellungen unverändert übernommen. 181 Ein solches Oversample wurde bei der Datenerhebung bewußt vorgenommen, damit eine hinreichend große an Personen aus den neuen Bundesländern befragt werden konnte, um fundierte Aussagen speziell für die neuen Länder aus den Umfrageergebnissen ableiten zu können.

5 16.1 Kreuztabellen auswerten 399 Inhalte der einzelnen Felder Die Kreuztabelle bildet aus den Wertekombinationen der beiden kreuztabellierten Variablen insgesamt 20 Felder. Die in den Feldern enthaltenen Angaben wurden beim Ausführen der Prozedur in dem Dialogfeld der Schaltfläche Zellen bestimmt, so daß sie von Tabelle zu Tabelle variieren können. In der hier dargestellten Tabelle werden die absoluten Häufigkeiten der verschiedenen Wertekombinationen sowie deren Anteile an der jeweiligen Spalte (Spaltenprozente) angegeben. V113 * V408 Kreuztabelle V113 Gesamt SEHR GUT GUT TEILS TEILS SCHLECHT SEHR SCHLECHT % von V408 % von V408 % von V408 % von V408 % von V408 % von V408 ES FUNKTIONIERT ETWAS ZU V408 VIELES ZU VOELLIG ZU GUT VERAENDERN VERAENDERN VERAENDERN Gesamt ,1%,9%,7% ,4% 14,0% 6,2% 4,8% 13,4% ,5% 52,0% 44,1% 9,5% 49,4% ,6% 28,5% 37,9% 47,6% 29,8% ,4% 4,6% 11,8% 38,1% 6,7% ,0% 100,0% 100,0% 100,0% 100,0% Abbildung 16.3: Kreuztabelle für die Variablen v113 (Bewertung der Wirtschaftslage) und v408 (Bewertung des demokratischen Systems) Das Feld in der dritten Zeile und der zweiten Spalte gibt an, daß 349 der Befragten Personen der Auffassung sind, an dem demokratischen System sei etwas zu verändern und die allgemeine Wirtschaftslage sei teils gut / teils schlecht. 182 Dies sind 52% aller Personen, die durch die zweite Spalte repräsentiert werden (Spaltenprozent = Prozent innerhalb der Variablen v408). Inhaltlich besagt dies, daß etwa die Hälfte aller Personen, die am demokratischen System etwas verändern würden, die aktuelle Wirtschaftslage als teils gut / teils schlecht einschätzen. Aus der Gruppe der Personen, die am demokratischen System vieles zu verändern wünschen, beträgt der Anteil der Leute, nach deren Auffassung die Wirtschaftslage teils gut / teils schlecht ist, nur 44,1%. Als absolute Zahl sind dies 86 Personen. 182 Beachten Sie hierbei, daß die Tabelle auf gewichteten Fällen basiert. Die Aussage 349 Personen seien der Auffassung... ist daher genaugenommen unpräzise oder sogar falsch, denn die Zahl 349 kommt zustande, indem die jeweiligen Gewichte auf die einzelnen Personen, die diesem Tabellenfeld zuzuordnen sind, angewandt werden. Die tatsächliche Personenanzahl wird daher mehr oder weniger stark von dem Wert 349 abweichen, die Gewichte sind allerdings so gewählt, daß die tatsächliche Personenzahl von der gewichteten im allgemeinen - und dies ist auch bei der hier betrachteten Tabelle der Fall - nicht sehr stark abweicht. Im folgenden wird trotz der sprachlichen Ungenauigkeit weiter von Personen und nicht von gewichteten Fällen gesprochen, wobei wir die Tatsache, daß Gewichte verwendet wurden, im Hinterkopf behalten sollten.

6 400 Kapitel 16 Kreuztabellen Randverteilung der Kreuztabelle Die der insgesamt durch eine Spalte repräsentierten Personen wird in der untersten Zeile mit der Beschriftung Gesamt angegeben. Für die erste Spalte findet sich dort der Wert 91. Dies ist somit die Gesamtanzahl der Personen, nach deren Meinung das demokratische System gut funktioniert der Befragten sind der Auffassung, es gäbe am demokratischen System etwas zu verändern, 195 Personen würden vieles und 21 Befragte das gesamte System völlig verändern. Die unterste Zeile gibt somit die einfache Häufigkeitsverteilung der Variablen v408 an, die auch aus einer einfachen Häufigkeitstabelle für diese Variable hervorgehen würde. 184 Entsprechend gibt die letzte Spalte der Tabelle die einfache Häufigkeitsverteilung der Variablen v113 an. Dort ist zum Beispiel abzulesen, daß 66 Befragte die aktuelle Wirtschaftslage in Deutschland im Jahr 1996 als sehr schlecht eingestuft haben. Da sich die Tabelle insgesamt auf 978 Personen bezieht, war dies ein Anteil von 66 / 978 = 0,0674 = 6,74%. Dieser Anteil wird in der Tabelle als Spaltenprozent ausgewiesen. Die einfachen Häufigkeitsverteilungen der beiden Variablen in der untersten Zeile und der letzten Spalte werden als Randverteilungen der Kreuztabelle bezeichnet. An der Randverteilung für die Variable v113 ist zu erkennen, daß die Personen mit einer negativen Bewertung der allgemeinen Wirtschaftslage die Befragten mit positiven Einschätzung deutlich überwogen. In bezug auf das demokratische System will dagegen der weitaus überwiegende Teil der Befragten das System im wesentlichen beibehalten Möglicher Zusammenhang zwischen den Variablen Vergleich der relativen Häufigkeiten 29,8% der Befragten waren der Auffassung, die allgemeine Wirtschaftslage Deutschlands im Jahr 1996 sei schlecht gewesen. In den Gruppen der Personen, die eine eher positive Einschätzung von dem Funktionieren des demokratischen Systems vertraten (erste und zweite Spalte), war dieser Anteil mit 17,6% bzw. 28,5% jedoch etwas geringer, während der entsprechende Anteil unter den Personen, die für umfangreiche Änderungen am demokratischen System plädierten, deutlich über 30% lag. Ähnlich sieht die Verteilung der Werte aus der Variablen v408 innerhalb der untersten Zeile aus, also innerhalb der Gruppe der Personen, die die Wirtschaftslage für sehr schlecht befunden haben. Dagegen kehren sich die Verhältnisse in den drei oberen Zeilen um. In den durch diese drei Zeilen reprä- 183 Der Wert 100% in der untersten Zeile gibt formal an, daß die 91 Personen genau 100% der durch die erste Spalte dargestellten Personen bilden. Der entsprechende Anteil beträgt natürlich in jeder Spalten 100%. 184 Wenn Sie allerdings eine Häufigkeitstabelle für die Variable v408 erstellen, wird diese zum Teil andere Werte ausweisen als die unterste Zeile der Kreuztabelle. Dies liegt daran, daß von der Kreuztabelle alle Fälle ausgeschlossen wurden, die in mindestens einer der Variablen v408 und v113 einen fehlenden Werte enthalten. Aus der einfachen Häufigkeitstabelle würden dagegen nur die Fälle mit einem fehlenden Wert in v408 ausgeschlossen, so daß sich diese wahrscheinlich auf eine größere von Fällen beziehen würde.

7 16.1 Kreuztabellen auswerten 401 sentierten Personengruppen sind die Spaltenprozente in den Gruppen der Personen mit eher positiver Einstellung zum derzeitigen demokratischen System jeweils größer als bei den Personen, die mit dem derzeitigen System eher unzufrieden sind. Stark vereinfachend läßt sich diese Beobachtung auf folgende Aussage reduzieren: Personen, die die aktuelle Wirtschaftslage tendenziell positiv bewertet haben, sind zu einem größeren Anteil auch mit dem Funktionieren des demokratischen Systems zufrieden. Umgekehrt möchten Befragte, die die Wirtschaftslage eher negativ bewerteten, in der Tendenz auch weitreichendere Änderungen am demokratischen System vornehmen. Aus dieser Beobachtung sollten jedoch keine zu weitreichenden Schlüsse gezogen werden. Der beschriebene Zusammenhang gilt eindeutig für die Personen aus der Stichprobe. Daraus läßt sich jedoch weder auf einen kausalen Zusammenhang zwischen den beiden Variablen schließen, noch kann ohne weiteres gefolgert werden, daß dieser Zusammenhang auch in der Grundgesamtheit gilt. Es ist möglich, daß die Verteilung der Werte aus der Variablen v408 innerhalb jeder Gruppe der Variablen v113 in der Grundgesamtheit identisch ist, daß also die Spaltenprozente der einzelnen Felder innerhalb einer Spalte alle identisch sind. Dies müßte der Fall sein, wenn überhaupt kein Zusammenhang zwischen den beiden Variablen besteht. 185 Ob aus dem in der Stichprobe beobachteten Zusammenhang zwischen den Variablen auf einen entsprechenden Zusammenhang in der Grundgesamtheit geschlossen werden kann, wird unten mit Hilfe eines Signifikanztests, dem χ 2 -Test, überprüft. Erwartete Häufigkeiten Wenn die beiden Variablen vollkommen unabhängig voneinander verteilt sind, dürften die Verteilungen der einen Variablen innerhalb der verschiedenen Kategorien der jeweils anderen Variablen nicht wesentlich voneinander abweichen und müßten somit auch der Gesamtverteilung der Variablen entsprechen. Da 29,8% aller Befragten die allgemeine Wirtschaftslage als schlecht eingestuft haben, müßte dies bei unabhängiger Verteilung der beiden Variablen somit auch für die Teilgruppe der Personen gelten, die das demokratische System als gut funktionierend bewertet haben. Dies waren insgesamt 91 Personen. 29,8% von diesen 91 Personen wären 0, Personen. Dieser Wert von 27 Personen wird als erwartete Häufigkeit bezeichnet. Es ist der Wert, der bei gegebener Randverteilung der beiden Variablen unter der Annahme, daß die Variablen unabhängig voneinander verteilt sind, zu erwarten ist. Anders formuliert gilt: Wenn 291 von insgesamt 978 Personen die Wirtschaftslage als schlecht bewerten und 91 der 978 Personen von einem guten Funktionieren des demokratischen Systems ausgehen, 185 Statt der Spaltenprozente könnten auch stets die Zeilenprozente (prozentualer Anteil der durch ein Feld repräsentierten Personen an den in der gesamten Zeile enthaltenen Personen) betrachtet werden. Sind die beiden Variablen vollkommen unabhängig voneinander verteilt, müßten alle Zeilenprozente der einzelnen Felder innerhalb einer Zeile (weitgehend) übereinstimmen. Auch die Zeilenprozente können mit dem Prozedur KREUZTABELLEN ausgewiesen werden.

8 402 Kapitel 16 Kreuztabellen dann müßten, wenn die Bewertung des demokratischen Systems unabhängig von der Einschätzung des Wirtschaftslage erfolgt, 27 Personen gleichzeitig die Wirtschaftslage als schlecht und das demokratische System als gut funktionierend bewerten. Wenn die tatsächlich beobachteten Häufigkeiten deutlich von den erwarteten Häufigkeiten abweichen, deutet dies darauf hin, daß die Variablen möglicherweise nicht unabhängig voneinander verteilt sind. Die Betrachtung der erwarteten Häufigkeiten stellt lediglich eine andere Perspektive des oben angestellten Vergleichs der relativen Häufigkeiten dar. Für das Feld in der ersten Spalte und der vierten Zeile beträgt die erwartete Häufigkeit wie berechnet 27, beobachtet wurde dagegen eine von 46 Personen. Zumindest in diesem Feld liegt offenbar eine starke Abweichung zwischen beobachteter und erwarteter Häufigkeit vor. Für das Feld in der zweiten Spalte und der dritten Zeile beträgt die erwartete Häufigkeit Auch hier weicht die beobachtete Häufigkeit von 349 etwas von der erwarteten Häufigkeit ab. Um einen umfassenden Vergleich der erwarteten mit den beobachteten Häufigkeiten vorzunehmen, können beide Häufigkeitswerte in den Kreuztabellen von SPSS ausgewiesen werden (s.u.). Auch der im folgenden durchgeführte χ 2 -Test basiert auf einem Vergleich der erwarteten mit den beobachteten Häufigkeiten Chi-Quadrat-Test Anpassen der Daten Damit der χ 2 -Test durchgeführt werden kann, müssen bestimmte Anforderungen von den Daten erfüllt werden. 186 Eine dieser Anforderungen besteht darin, daß die erwarteten Häufigkeiten in den einzelnen Tabellenfeldern nicht zu gering sein dürfen. Als Mindestanforderung sollte die erwartete Häufigkeit in keinem Feld kleiner als fünf sein. In der Tabelle aus Abbildung 16.3 wird dieser Wert jedoch in mehreren Feldern unterschritten. So beträgt die erwartete Häufigkeit für das Feld in der fünften Zeile und der vierten Spalte , Auch für andere Felder ergeben sich ähnlich geringe erwartete Häufigkeiten, so daß der χ 2 -Test für diese Tabelle nicht zuverlässig durchgeführt werden kann. Aus diesem Grund werden zunächst in jeder der beiden Variablen einzelne Kategorien zusammengefaßt. Für die Variable v408 (Funktionieren des demokratischen Sy- 186 Siehe hierzu im einzelnen Abschnitt , Voraussetzungen des χ2-tests, S. 406.

9 16.2 Chi-Quadrat-Test 403 stems) werden die beiden ersten Spalten (Es funktioniert gut und Etwas zu verändern) zu einer Kategorie (Eher gut) und die beiden letzten Spalten zu der Kategorie Eher schlecht zusammengefaßt. In der Variablen v113 werden jeweils die beiden ersten (Sehr gut und gut) sowie die beiden letzten Zeilen (Schlecht und Sehr schlecht) vereint. Die neuen Codierungen sind in den Variablen v113_2 und v408_2 enthalten. Abbildung 16.4 gibt die Kreuztabelle für diese beiden Variablen mit den beobachteten und den erwarteten Häufigkeiten wieder. 187 V113_2 * V408_2 Kreuztabelle V113_2 Gesamt Gut Teils / Teils Schlecht Erwartete Erwartete Erwartete Erwartete V408_2 Eher Eher gut schlecht Gesamt ,5 30,5 138, ,1 106,9 484, ,4 78,6 356, ,0 216,0 978,0 Abbildung 16.4: Kreuztabelle mit erwarteten und beobachteten Häufigkeiten für die umcodierten Variablen v113_2 und v408_2 In dieser Tabelle beträgt die geringste erwartete Häufigkeit eines Feldes 30,5, so daß die Voraussetzungen für den χ 2 -Test erfüllt sind. Der Preis, der hierfür zu zahlen ist, besteht in einem Verzicht an Information. Die Tabelle aus Abbildung 16.4 ist weniger differenziert als die aus Abbildung Während in der neuen Tabelle nur zwischen zwei bzw. drei Kategorien unterschieden wird, liegen in den Ursprungsdaten Informationen über vier bzw. fünf unterschiedliche Kategorien der beiden Variablen vor. Auf diesen höheren Grad an Differenzierung muß jedoch verzichtet werden, um den Signifikanztest zuverlässig anwenden zu können. Auch in dieser Tabelle weichen die beobachteten Häufigkeiten deutlich und systematisch von den erwarteten Häufigkeiten ab. Wiederum haben die Personen, die eine positive Einschätzung der Wirtschaftslage vorgenommen haben, dem demokratischen System häufiger ein gutes Funktionieren attestiert, als es den erwarteten Häufigkeiten entsprochen hätte. Daraus folgt unmittelbar, daß dieselbe Personengruppe im Vergleich zu den erwarteten Häufigkeiten seltener zu dem Ergebnis gekommen ist, das demokratische System funktioniere schlecht. Entsprechend ergeben sich auch in den anderen beiden Zeilen sowie in den Spalten der Tabelle Abweichungen zwischen erwarteten und beobachteten Häufigkeiten. 187 Zum Erstellen dieser Tabelle wurde die Variable v408_2 als Spaltenvariable und v113_2 als Zeilenvariable angegeben. In dem Dialogfeld der Schaltfläche Zellen wurden nur die beiden Optionen Beobachtet und Erwartet aus der Gruppe Häufigkeiten angekreuzt.

10 404 Kapitel 16 Kreuztabellen Berechnung des χ 2 Zur Durchführung des Signifikanztests wird das Prüfmaß Chi-Quadrat berechnet. Für eine Tabelle mit n Zeilen und m Spalten erfolgt die Berechnung dieses Prüfmaßes nach folgender Formel: χ 2 = n m i= 1j= 1 ( n nˆ ) Dabei bezeichnet n ij die beobachtete Häufigkeit in dem Feld aus Zeile i und Spalte j. nˆ ij ist die entsprechende erwartete Häufigkeit. Bei der Berechnung werden für jedes Feld der Tabelle die quadrierten Abweichungen der erwarteten von den tatsächlichen Häufigkeiten durch die erwarteten Häufigkeiten dividiert. Die Summe dieser Quotienten über alle Felder der Kreuztabelle bildet den χ 2 -Wert. Durch das Quadrieren der Differenzen wird erreicht, daß negative und positive Abweichungen gleichermaßen in das Maß eingehen und sich nicht gegenseitig aufheben. Die Division durch die erwarteten Häufigkeiten ist erforderlich, da sich andernfalls bei insgesamt vielen Beobachtungen auch mehr Abweichungen ergeben würden. Bei Beobachtungen wird die Summe der (quadrierten) Abweichungen unter sonst gleichen Umständen größer sein als bei 100 Beobachtungen. Je größer die Abweichung in einem Feld der Tabelle ist, desto größer wird auch der χ 2 -Wert ausfallen. Ein großer χ 2 -Wert ist also mit großen Abweichungen verbunden und deutet auf einen Zusammenhang zwischen den beiden Variablen hin. Es ist jedoch auch möglich, daß sich die beobachteten Abweichungen zwischen zwei Variablen nur zufällig in der jeweils betrachteten Stichprobe ergeben haben, obwohl in der Grundgesamtheit aller Fälle kein Zusammenhang zwischen den Variablen besteht. Aus wahrscheinlichkeitstheoretischen Überlegungen läßt sich eine Verteilung für das Prüfmaß χ 2 herleiten, die in Abhängigkeit von der der Zeilen und Spalten der Kreuztabelle angibt, mit welcher Wahrscheinlichkeit sich ein bestimmter χ 2 -Wert auch dann ergeben kann, wenn die Variablen in der Grundgesamtheit unabhängig voneinander verteilt sind. Der Zusammenhang wird mit Hilfe der Freiheitsgrade der Kreuztabelle dargestellt: Aus der Zeilen- und Spaltenanzahl wird die der Felder ermittelt, denen bei gegebener Randverteilung beliebige Häufigkeiten zugeordnet werden können. Handelt es sich zum Beispiel um eine Tabelle mit 2 2 Feldern, so ergeben sich aus der Häufigkeit in einem der Felder bei gegebener Randverteilung unmittelbar die Häufigkeiten aller übrigen Felder. Weist das Feld links oben in der Tabelle die Häufigkeit 3 auf und ist die Gesamthäufigkeit der oberen Zeile durch die Randverteilung mit 7 angegeben, so muß das rechte obere Feld eine Häufigkeit von 4 aufweisen. Auf die gleiche Weise sind auch die Häufigkeiten der beiden anderen Felder festgelegt. In einer 2 2-Tabelle kann also nur die Häufigkeit eines Feldes frei gewählt werden. Die Tabelle hat daher einen Freiheitsgrad. Allgemein ergibt sich die Zahl der Freiheitsgrade einer Kreuztabelle als Freiheitsgrade = (Zeilenanzahl - 1) (Spaltenanzahl - 1). ij nˆ ij 2 ij

11 16.2 Chi-Quadrat-Test 405 Die Kreuztabelle aus Abbildung 16.4 mit zwei Spalten und drei Zeilen besitzt somit (2-1) (3-1) = 2 Freiheitsgrade. Mit Hilfe des Wertes χ 2 und der der Freiheitsgrade läßt sich die Wahrscheinlichkeit bestimmen, mit der sich die vorliegende Abweichung zwischen beobachteten und erwarteten Häufigkeiten bei gegebener an Freiheitsgraden auch dann ergeben kann, wenn zwischen den Variablen in der Grundgesamtheit kein Zusammenhang besteht. Dabei gilt, daß bei gegebenem Zusammenhang zwischen den Variablen die Möglichkeit einer guten statistischen Absicherung des Ergebnisses mit wachsender Felderzahl und damit größeren Freiheitsgraden abnimmt. Das Zusammenfassen einzelner Werte einer Variablen kann daher auch dann sinnvoll sein, wenn die erwartete Häufigkeiten in jedem Tabellenfeld ohnehin größer als fünf ist Interpretation des χ 2 -Tests Abbildung 16.5 zeigt das Ergebnis des χ 2 -Tests für die Kreuztabelle aus Abbildung Der Test wird in den Dialogfeldern der Prozedur KREUZTABELLE mit der Option Chi-Quadrat aus dem Dialogfeld der Schaltfläche Statistik angefordert. Chi-Quadrat-Tests Wert df Asymptotische Signifikanz (2-seitig) Chi-Quadrat nach Pearson 37,136 a 2,000 Likelihood-Quotient 38,186 2,000 Zusammenhang linear-mit-linear 36,409 1,000 der gültigen Fälle 978 a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 30,48. Abbildung 16.5: χ 2 -Test für die umcodierten Variablen v113_2 und v408_2 Neben dem üblichen Pearson schen χ 2 -Test wurden automatisch zwei weitere Tests durchgeführt. Der Likelihood-Test basiert auf der Maximum-Likelihood- Theorie und liefert bei großen Stichproben das gleiche Ergebnis wie Pearsons χ 2 - Test. Der als Zusammenhang linear-mit-linear ausgewiesene Test mißt den linearen Zusammenhang zwischen den Variablen und ist damit nur für Variablen geeignet, die mindestens Ordinalskalenniveau besitzen. Dieser Test ist auch als Mantel-Haenszel-Test bekannt. Für den Pearson schen Test wird ein χ 2 -Wert von 37,136 ausgewiesen. Für diesen Wert ergibt sich bei den vorliegenden zwei Freiheitsgraden eine Signifikanz von 0,000 (bzw. 0,0%). Wenn kein Zusammenhang zwischen den beiden getesteten Variablen besteht, kann sich ein χ 2 -Wert der Größe 37,136 also mit einer Wahr-

12 406 Kapitel 16 Kreuztabellen scheinlichkeit von 0,0% ergeben. 188 Diese Wahrscheinlichkeit ist so gering, daß eine Unabhängigkeit der beiden Variablen sehr unwahrscheinlich ist. Man sagt, die Nullhypothese, derzufolge kein Zusammenhang zwischen den Variablen besteht, kann zurückgewiesen werden. Wenn man nun diese Nullhypothese zurückweist und davon ausgeht, es bestehe ein Zusammenhang zwischen den Variablen, begeht man mit einer sehr geringen Wahrscheinlichkeit von 0, % einen Irrtum. Diese Wahrscheinlichkeit wird häufig auch als Irrtumswahrscheinlichkeit bezeichnet. Je geringer diese Irrtumswahrscheinlichkeit, desto größer ist umgekehrt die Wahrscheinlichkeit, daß in der Grundgesamtheit ein Zusammenhang zwischen den Variablen besteht. Im Rahmen einer Stichprobenbetrachtung kann jedoch auch mit Hilfe eines Signifikanztests nie mit Sicherheit geklärt werden, ob ein solcher Zusammenhang vorliegt oder nicht. Oft wird als Richtwert angegeben, daß bei einer Irrtumswahrscheinlichkeit von 5% und weniger das Vorliegen eines Zusammenhangs angenommen werden kann. Dieser Grenzwert besitzt jedoch keine allgemeine Gültigkeit, sondern ist stets vor dem Hintergrund der untersuchten Fragestellungen sowie der jeweiligen Datenlage zu bewerten. Wenn mit einem fehlerhaften Zurückweisen der Nullhypothese gravierende negative Konsequenzen verbunden sind, wie dies zum Beispiel beim Testen von Medikamenten auf Nebenwirkungen der Fall sein kann, wird man einen wesentlich geringeren Signifikanzwert fordern. Ggf. wird man die Nullhypothese nur bei einer Irrtumswahrscheinlichkeit von 0,1% oder erst bei unter 0,01% zurückweisen. Deutet der Signifikanztest darauf hin, daß ein Zusammenhang zwischen den betrachteten Variablen besteht, läßt dies keine Rückschlüsse auf eine Kausalität zu. Es besagt lediglich, daß bestimmte Werte der einen Variablen tendenziell gemeinsam mit bestimmten Werten der jeweils anderen Variablen auftreten. Die Ursache davon kann allein mit statistischen Verfahren nicht ermittelt werden. Vielmehr sind hierzu entsprechende theoretische Überlegungen erforderlich, die der statistischen Analyse im allgemeinen vorausgehen. Führen diese Überlegungen zu der Hypothese, es bestehe ein Zusammenhang zwischen den Variablen, kann die Vereinbarkeit dieser Hypothese mit der empirischen Beobachtung durch statistische Verfahren - wie hier mit dem χ 2 -Test - untersucht werden Voraussetzungen des χ 2 -Tests Der χ 2 -Test liefert nicht unter allen Bedingungen zuverlässige Ergebnisse. Die folgenden Einschränkungen sind bei der Anwendung des Tests zu beachten: ¾ Die erwartete Häufigkeit sollte in jedem Feld der Kreuztabelle mindestens fünf betragen. Andernfalls ist das Testergebnis nicht mehr zuverlässig. Zum Teil wird diese Forderung abgeschwächt formuliert. Es wird dann gefordert, daß nicht mehr als 20% der Felder eine erwartete Häufigkeit unter fünf haben dürf- 188 Der Wert 0,000 ist ein gerundeter Wert, den man sich im Ausgabenavigator genauer anzeigen lassen kann. Er wird dort mit 8, e-009 ausgewiesen. Ein χ 2 -Wert von 37,136 ergibt sich bei zwei Freiheitsgraden also mit einer Wahrscheinlichkeit von 0, %, wenn in der Grundgesamtheit kein Zusammenhang zwischen den Variablen besteht.

13 16.3 Kontrollvariable verwenden 407 en. Bei der Berechnung eines χ 2 -Tests wird in den Ergebnissen von SPSS stets die kleinste in der Tabelle vorkommende erwartete Häufigkeit angegeben. Bei dem zuletzt durchgeführten Test beträgt diese 30,48. Zusätzlich wird die der Felder ausgewiesen, in denen die erwartete Häufigkeit kleiner als fünf ist. ¾ Nach Möglichkeit sollten die Tabellen mehr als fünf Felder umfassen. Bei 2 2-Tabellen mit geringer Fallzahl können sich Einschränkungen in der Zuverlässigkeit des Tests ergeben. Beinhaltet eine 2 2-Tabelle ein Feld mit erwarteter Häufigkeit unter fünf, berechnet SPSS zusätzlich Fisher s exakten Test. Dieser basiert auf einer hypergeometrischen Verteilung und ist für kleine Stichproben mit geringen erwarteten Häufigkeiten der genaueste Test. Für alle 2 2-Tabellen wird zum Pearson schen Test zusätzlich Yates Korrektur ausgewiesen. Die Korrektur besteht darin, daß bei der Berechnung des χ 2 -Wertes vor dem Quadrieren die absoluten Abweichungen der beobachteten von den erwarteten Häufigkeiten um 0,5 verringert werden. Dadurch ergibt sich ein kleineres χ 2 und somit ein schlechteres Signifikanzniveau. Diese Korrektur ist jedoch umstritten. ¾ Der χ 2 -Test bietet sich insbesondere für Variablen mit Nominalskalenniveau an. Er ist zwar auch für höhere Skalenniveaus durchführbar, für diese stehen jedoch auch wesentlich leistungsfähigere Tests zur Verfügung, die dem χ 2 - Test im allgemeinen überlegen sind Kontrollvariable verwenden Bisher wurde die Frage, ob ein Zusammenhang zwischen der Einschätzung der Wirtschaftslage und der Bewertung des demokratischen Systems besteht, für alle Befragten aus der Stichprobe gemeinsam untersucht. Dabei hat sich gezeigt, daß offenbar ein solcher Zusammenhang angenommen werden kann. Im folgenden soll überprüft werden, ob sich die Befragten aus den neuen Bundesländern in dieser Hinsicht von den Befragten aus den alten Bundesländern unterscheiden. Sowohl bei der Bewertung der Wirtschaftslage als auch in bezug auf die Einschätzung des demokratischen Systems wäre es plausibel, wenn sich Befragte aus den alten Bundesländern an anderen Kriterien orientieren als Personen aus den neuen Ländern. Um dies zu untersuchen, werden die bisher verwendeten Dialogfeldeinstellungen der Prozedur KREUZTABELLEN weitgehend unverändert übernommen. Es wird lediglich zusätzlich die Variable v3, die das Erhebungsgebiet für jeden Fall angibt, im Hauptdialogfeld der Prozedur in das Feld Schicht eingefügt. Beachten Sie, daß auch hier nicht die Variablen v113 und v408, sondern die umcodierten Variablen v113_2 und v408_2 verwendet werden. Abbildung 16.5 zeigt die mit diesen Einstellungen erzeugt Kreuztabelle. Der obere Teil der Tabelle bezieht sich auf das alte Bundesgebiet, der untere Tabellenteil auf die neuen Bundesländer. Es zeigt sich, daß in jedem der beiden Gebiete Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten aufgetreten sind. Im übrigen wäre es auch sehr ungewöhnlich, wenn die beobach-

14 408 Kapitel 16 Kreuztabellen teten Häufigkeiten mit den erwarteten vollkommen übereinstimmten. Zusätzlich ist aber zu erkennen, daß die Abweichungen auch das bereits oben beobachtete Muster aufweisen: Personen, die mit der Wirtschaftslage zufrieden sind, bestätigen zu einem überproportional hohen Anteil auch dem demokratischen System ein gutes Funktionieren. Umgekehrt äußern Personen mit negativer Bewertung der Wirtschaftslage besonders häufig auch Kritik am demokratischen System. Dieses Muster ist sowohl in den neuen als auch in den alten Bundesländern zu beobachten. Die Abweichungen zwischen beobachteten und erwarteten Häufigkeiten sind in den neuen Bundesländern zwar absolut geringer, jedoch liegen für die neuen Länder auch insgesamt weniger Beobachtungen vor, so daß sich aus den geringeren absoluten Abweichungen nicht unmittelbar auf einen geringeren Zusammenhang zwischen den Variablen schließen läßt. V113_2 * V408_2 * V3 Kreuztabelle V3 ALTE BUNDESLAENDER NEUE BUNDESLAENDER V113_2 Gesamt V113_2 Gesamt Gut Teils / Teils Schlecht Gut Teils / Teils Schlecht % von V408_2 % von V408_2 % von V408_2 % von V408_2 % von V408_2 % von V408_2 % von V408_2 % von V408_2 V408_2 Eher Eher gut schlecht Gesamt ,0% 5,8% 15,0% ,2% 40,9% 49,4% ,9% 53,3% 35,6% ,0% 100,0% 100,0% ,4% 6,3% 10,6% ,5% 41,8% 50,0% ,1% 51,9% 39,4% ,0% 100,0% 100,0% Abbildung 16.5: Kreuztabelle für die Variablen v113_2 und v408_2, kontrolliert für die Variable v3 (Erhebungsgebiet) Nicht nur die Kreuztabelle, sondern auch der χ 2 -Test wurde getrennt für die neuen und die alten Bundesländer durchgeführt. Abbildung 16.6 zeigt die Ergebnisse dieses Tests. Für die alten Bundesländer wird der Signifikanzwert wieder mit 0,000 ausgewiesen. Läßt man sich im Ausgabenavigator den genauen Wert anzeigen, ist allerdings zu erkennen, daß die Irrtumswahrscheinlichkeit mit 0, bzw. 0,0002% größer ist als der oben für das gesamte Bundesgebiet berechnete Wert. Dabei ist die Irrtumswahrscheinlichkeit jedoch noch immer derart gering, daß man die Hypothese, es bestehe kein Zusammenhang zwischen den Variablen, eindeutig zurückweisen wird. Auch in den neuen Bundesländern ist der ausgewiesene Signifikanzwert größer als der des gesamten Bundesgebiets, hier ist der Anstieg sogar noch wesentlich stär-

15 16.3 Kontrollvariable verwenden 409 ker ausgefallen. Die Irrtumswahrscheinlichkeit beträgt hier 0,01. Es besteht somit eine Wahrscheinlichkeit von 1%, beim Zurückweisen der Hypothese, es bestehe kein Zusammenhang zwischen den Variablen, einen Fehler zu begehen. V3 ALTE BUNDESLAENDER NEUE BUNDESLAENDER Chi-Quadrat-Tests Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear der gültigen Fälle Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear der gültigen Fälle Wert 26,236 a 2,000 27,130 2,000 25,711 1, ,264 b 2,010 9,341 2,009 8,830 1,003 a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 20,55. b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 8, df Asymptotische Signifikanz (2-seitig) Abbildung 16.6: χ 2 -Tests für die Variablen v113_2 und v408_2, kontrolliert für die Variable v3 (Erhebungsgebiet) Die Tatsache, daß die Signifikanzwerte in den beiden Teilgebieten größer sind als im gesamten Gebiet, könnte beispielsweise so interpretiert werden, daß ein Teil des für das gesamte Gebiet beobachteten Zusammenhangs zwischen den beiden Variablen in Wirklichkeit auf das unterschiedliche Erhebungsgebiet zurückzuführen ist. Personen des einen Gebiets mögen sowohl in bezug auf das demokratische System als auch bezüglich der Wirtschaftslage eine tendenziell negative Bewertung vornehmen, während die Bewertungen beider Größen in dem anderen Gebiet in der Tendenz positiver ausfallen. Ein derartiger Effekt kann so weit gehen, daß innerhalb jedes Gebiets kein Zusammenhang zwischen den Variablen besteht, bei einem Zusammenfassen der beiden Gebiete jedoch ein positiver (oder negativer) Zusammenhang vorzuliegen scheint. In Wirklichkeit spiegelt dies jedoch nur zum Teil einen Zusammenhang zwischen den beiden betrachteten Variablen wider und ist zum anderen auf unterschiedliche Erfahrungen oder Bewertungen in den beiden Teilgebieten zurückzuführen. Es sei jedoch auch darauf hingewiesen, daß sich die beiden Tests bei der getrennten Analyse der zwei Teilgebiete jeweils auf eine geringere Fallzahl stützen als die Analyse des gesamten Gebiets. Selbst wenn der Zusammenhang zwischen den Variablen in beiden Teilgebieten ein gleich starkes Ausmaß hat, wird die Irrtumswahrscheinlichkeit für das gesamte Bundesgebiet geringer sein als für die Teilgebiete, da das gesamte Gebiet eine größere Stichprobe darstellt und damit zuverlässigere Aussagen erlaubt. Dies ist auch sehr gut vereinbar mit der Beobachtung, daß die Irrtumswahrscheinlichkeit für die neuen Bundesländer höher ist als für das

16 410 Kapitel 16 Kreuztabellen alte Bundesgebiet, da für die neuen Bundesländer eine geringere von Beobachtungen vorliegt Zusammenhangsmaße Zusammenhangsmaße dienen dem Zweck, die Stärke eines Zusammenhangs zweier Variablen zu messen und durch die Berechnung einer Maßzahl zu quantifizieren. Dabei gibt es jedoch kein allgemein anwendbares Maß, das für alle Arten von Daten geeignet wäre. Insbesondere hängt die Anwendbarkeit eines Zusammenhangsmaßes von dem Skalenniveau der betrachteten Variablen ab. Für die unterschiedlichen Skalenniveaus stehen verschiedene Maße zur Verfügung: ¾ Nominalskala: Für nominalskalierte Variablen sind bei SPSS zwei Arten von Zusammenhangsmaßen verfügbar. Die eine Gruppe beruht auf dem χ 2 - Konzept (Phi, Cramers V und Kontingenzkoeffizient), die andere auf dem Konzept der proportionalen Fehlerreduktion (Lambda und Goodman & Kruskals Tau). ¾ Ordinalskala: Die Maßzahlen für Ordinalskalen bei SPSS basieren auf dem Konzept der Rangkorrelation. Sie können die Maße Gamma, Somers d, Kendall s tau-b und Kendall s tau-c berechnen. ¾ Intervallskala: Für intervallskalierte Variablen können Sie den Pearson schen Korrelationskoeffizienten sowie das Maß Eta berechnen Zusammenhangsmaße für Nominalskalen χ 2 -basierte Maße Für nominalskalierte Variablen kann mit einem χ 2 -Test geprüft werden, ob ein Zusammenhang zwischen zwei Variablen besteht. Kommt man zu dem Ergebnis, daß ein solcher Zusammenhang vorliegt, ist es jedoch nicht möglich, aus der Höhe der Irrtumswahrscheinlichkeit oder aus dem χ 2 -Wert selbst auf die Stärke des Zusammenhangs zu schließen. Dies ist schon deshalb nicht möglich, weil sich bei gegebenem Zusammenhang zwischen den Variablen in der Grundgesamtheit mit steigender Stichprobengröße auch ein größerer χ 2 -Wert und damit eine geringere Signifikanz ergibt. In der Kreuztabelle für die neuen Bundesländer beträgt beispielsweise die beobachtete Häufigkeit im linken oberen Feld 16 und die erwartete Häufigkeit 12,6. Damit liefert dieses Feld bei der Berechnung des χ 2 -Wertes einen Beitrag von: ( 16 12,6) 12,6 2 = 0,917 Wäre nun die Stichprobe bei unveränderten Relationen doppelt so groß gewesen, würde die beobachtete Häufigkeit 32 und die erwartete Häufigkeit 25,2 betragen.

17 16.4 Zusammenhangsmaße 411 Damit würde das linke obere Feld auch einen doppelt so großen Beitrag zum χ 2 - Wert leisten: ( 32 25,2) = 1,83 25,2 Durch Verdoppelung der Stichprobengröße verdoppelt sich (im theoretischen Ideal) also auch der χ 2 -Wert. Da sich die Signifikanz bei gegebenem χ 2 nur noch nach der der Freiheitsgrade und damit nach der der Zeilen und Spalten in der Kreuztabelle richtet, verbessert sich mit steigender Stichprobengröße unter sonst gleichen Umständen also die Signifikanz, ohne daß sich der Zusammenhang der Variablen in der Grundgesamtheit verbessert. Er läßt sich aufgrund der größeren Stichprobe lediglich mit höherer Sicherheit identifizieren. Ein großer χ 2 -Wert kann sich also auch für schwache (aber durchaus vorhandene) Zusammenhänge ergeben, wenn die Stichprobe ausreichend groß ist. Dennoch basieren einige Zusammenhangsmaße auf dem Wert χ 2. Dabei wird versucht, den Wert so zu normieren, daß er gegenüber der Stichprobengröße unempfindlich wird. In der Art der Normierung liegt der einzige Unterschied zwischen den verschiedenen χ 2 -basierten Maßen. ¾ Kontingenzkoeffizient C: Dieser Koeffizient wurde von Pearson entwickelt. Er ist so normiert, daß er zwischen den Werten 0 und 1 liegt, wobei der maximal erreichbare Wert innerhalb des Bereichs zwischen 0 und 1 in Abhängigkeit von der Felderzahl der Kreuztabelle variiert. Der Wert berechnet sich als 2 C = χ 2 χ 2 + N Dabei bezeichnet N den Umfang der Stichprobe. Da der maximal erreichbare Wert von C mit der Felderzahl der Tabelle variiert, sind die Werte für Tabellen mit unterschiedlicher Felderzahl nur bedingt miteinander vergleichbar. ¾ Phi: Dieser Koeffizient normiert den χ 2 -Wert, indem er ihn durch den Umfang der Stichprobe dividiert und aus dem Quotienten die Wurzel zieht: φ = 2 χ N Für 2 2-Tabellen liegt der Wert zwischen 0 und 1, und sein Betrag ist mit dem Korrelationskoeffizienten von Pearson identisch. Für größere Tabellen ist der Wert dagegen eher ungeeignet, da er Werte über 1 annehmen kann und nicht mehr normiert ist, so daß Interpretationsschwierigkeiten auftreten können.

18 412 Kapitel 16 Kreuztabellen ¾ Cramers V: Cramers V liegt zwischen 0 und 1, wobei der Wert 1 auch bei allen Tabellen unabhängig von ihrer Größe erreicht werden kann. Der Wert berechnet sich nach der Formel: V = χ N k 2 ( 1) Enthält die Tabelle weniger Zeilen als Spalten, bezeichnet k die der Zeilen, andernfalls die der Spalten. Für eine 3 4-Tabelle beträgt k somit 3. Für Tabellen, bei denen k den Wert 2 annimmt, also zum Beispiel bei 2 3-Tabellen, sind Cramers V und φ identisch. Für die Kreuztabelle, die sich auf das gesamte Bundesgebiet bezieht, ergeben sich die in Abbildung 16.7 dargestellten χ 2 -basierten Zusammenhangsmaße. Dabei wurden die neu codierten Variablen v113_2 und v408_2 verwendet.. Nominal- bzgl. Nominalmaß der gültigen Fälle Symmetrische Maße Phi Cramer-V Kontingenzkoeffizient a. Die Null-Hyphothese wird nicht angenommen. Näherungsweise Wert Signifikanz,195,000,195,000,191, b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Abbildung 16.7: χ 2 -basierte Zusammenhangsmaße für Nominalskalen, hier für die Variablen v113_2 und v408_2 Cramers V und Phi sind für die hier betrachtete Tabelle identisch, da diese nur zwei Spalten enthält und damit k bei der Berechnung von Cramers V einen Wert von 2 hat. Auch der Kontingenzkoeffizient liegt nahe bei dem Wert der beiden anderen Maße. Da die Zusammenhangsmaße mit einem Wert von 0,195 deutlich unterhalb von 1 liegen, scheint der Zusammenhang zwischen den beiden betrachteten Variablen nicht sehr stark zu sein. Allerdings ist zu beachten, daß ein Wert in der Nähe von 1 auch nur sehr selten erreicht wird. Eine präzise Aussage über die Stärke des Zusammenhangs ist auch anhand der Zusammenhangsmaße nicht möglich. Diese Maße sind vor allem dazu geeignet, eine Einschätzung von der Stärke des Zusammenhangs auf der Basis von Erfahrungswerten über ähnliche Sachverhalte sowie durch den direkten Vergleich mit inhaltlich verwandten Tabellen vorzunehmen. Maße auf der Basis proportionaler Fehlerreduktion Neben den auf χ 2 basierenden Zusammenhangsmaßen können mit SPSS für nominalskalierte Variablen auch Koeffizienten nach dem Konzept der proportionalen Fehlerreduktion berechnet werden. All diese Maße beruhen auf dem gleichen

19 16.4 Zusammenhangsmaße 413 Prinzip: Es wird betrachtet, mit welcher Fehlerwahrscheinlichkeit eine Vorhersage für die Werte der abhängigen Variablen getroffen werden kann, wenn als Grundlage der Vorhersage lediglich die Informationen über die betreffende Variable verwendet werden. Anschließend wird die Genauigkeit einer Vorhersage für den Fall untersucht, daß Informationen über beide kreuztabellierten Variablen einbezogen werden. Aus einem Vergleich der Fehlerwahrscheinlichkeiten beider Vorgehensweisen wird ein Maß für den Zusammenhang zwischen den Variablen berechnet. In dem Maße, in dem sich durch die erklärende Variable eine Verbesserung der Prognose ergibt, wird auf einen entsprechend starken Zusammenhang zwischen den Variablen geschlossen. Lambda Abbildung 16.8 stellt noch einmal die Kreuztabelle für das gesamte Bundesgebiet mit den umcodierten Werten (Variablen v113_2 und v408_) dar. Diese Tabelle wurde bereits in Abbildung 16.4, S. 403 wiedergegeben, allerdings werden in Abbildung 16.7 neben den beobachteten Häufigkeiten die prozentualen Anteile eines Feldes an der gesamten Tabelle mitgeteilt. V113_2 * V408_2 Kreuztabelle V113_2 Gesamt Gut Teils / Teils Schlecht % der Gesamtzahl % der Gesamtzahl % der Gesamtzahl % der Gesamtzahl V408_2 Eher Eher gut schlecht Gesamt ,8% 1,3% 14,1% ,4% 9,1% 49,5% ,7% 11,7% 36,4% ,9% 22,1% 100,0% Abbildung 16.8: Kreuztabelle für das gesamte Bundesgebiet auf der Basis umcodierter Werte mit beobachteten Häufigkeiten und prozentualen Anteilen an der gesamten Tabelle Soll für eine beliebige Person, deren Einschätzung der Wirtschaftslage unbekannt ist, eine Prognose ihrer Einschätzung vorgenommen werden, wobei sich die Prognose allein auf die vorhandenen Informationen über die Variable v113_2 stützen kann, wird man für diese Person die Einschätzung teils / teils prognostizieren, denn dies ist die am häufigsten gewählte Kategorie. Mit einer Wahrscheinlichkeit von 49,5% wird eine Person, über die keine weiteren Informationen vorliegen, diese Einschätzung vertreten. Dies bedeutet jedoch auch, daß 50,5% der Personen eine andere Einschätzung vorgenommen haben, so daß die Prognose mit dieser Wahrscheinlichkeit falsch ist. Ohne weitere Informationen ist eine Verbesserung der Prognose jedoch nicht möglich. In der Kreuztabelle liegen aber nicht nur Informationen über die einfache Verteilung der Variablen v113_2 vor, sondern es läßt sich auch die gemeinsame Verteilung der Variablen v113_2 und v408_2 ablesen. Bezieht man diese Informationen in die Prognose mit ein, läßt sich die Vorhersage möglicherweise verbessern und

20 414 Kapitel 16 Kreuztabellen damit die Fehlerwahrscheinlichkeit verringern. Dies ist jedoch nur möglich, wenn ein Zusammenhang zwischen den Variablen besteht. Sind die beiden Variablen dagegen vollkommen unabhängig voneinander verteilt, kann durch die Berücksichtigung der Variablen v408_2 keine Verbesserung der Prognose erreicht werden. Ist bereits bekannt, daß eine Person das derzeitige demokratische System als reformbedürftig (eher schlecht) einstuft, wird man für die Bewertung der Wirtschaftslage die Einschätzung Schlecht prognostizieren, dann dies ist die innerhalb der rechten Spalte am häufigsten vertretene Position. Für 114 der insgesamt 216 Personen aus dieser Spalte wäre die Vorhersage richtig gewesen. Dies ist ein Anteil von 52,7%. Für Personen mit positiver Bewertung des demokratischen Systems (linke Spalte) würde man in bezug auf die Wirtschaftslage nach wie vor die Einschätzung teils / teils vorhersagen, dabei nun aber 395 von 762 Personen und damit 51,8% richtig einstufen. Insgesamt wären bei der differenzierten Vorgehensweise = 469 von insgesamt 978 Personen falsch eingestuft worden. Dies entspricht einer Fehlerwahrscheinlichkeit von 469 / 978 = 47,9%. Ohne Berücksichtigung der zweiten Variablen betrug die Fehlerwahrscheinlichkeit bei der bestmöglichen Prognose 50,5%. Die Fehlerwahrscheinlichkeit konnte damit durch Einbeziehung der zweiten Variablen um 50,5% 47,9% = 5,1% 50,5% verringert werden. Dieser Grad an Fehlerreduktion stellt das Zusammenhangsmaß λ dar. Allgemein berechnet sich der Wert als Fehler bei Prognose1- Fehler bei Prognose 2 λ =. Fehler bei Prognose1 Da der Nenner nicht größer als der Zähler sein kann und beide Werte stets positiv sind, liegt λ immer zwischen 0 und 1. Je näher die Fehlerwahrscheinlichkeiten beider Prognosen beieinanderliegen, desto weniger hilfreich ist die zweite Variable für die Prognose und desto geringer wird λ. Bewirkt die Berücksichtigung der zweiten Variablen überhaupt keine Verbesserung der Prognose, hat der Zähler und damit auch λ den Wert 0. Besteht dagegen ein perfekter Zusammenhang zwischen den Variablen, dann ist durch Einbeziehung der zweiten Variablen eine fehlerfreie Prognose möglich, und es ergibt sich ein λ von 1. Goodman und Kruskals Tau Goodman und Kruskals τ beruht auf dem gleichen Prinzip wie λ, auch hier wird die Güte der Vorhersage ohne Berücksichtigung der zweiten Variablen mit der Vorhersagegüte bei Einbeziehung der zweiten Variablen verglichen. Der Unterschied zu λ besteht darin, daß die Prognosen hier auf andere Art vorgenommen werden.