Bivariate Statistik: Kreuztabelle Beispiel 1: Im ALLBUS wurde u.a. nach dem Nationalstolz und nach dem Gefühl der Überfremdung gefragt: Würden Sie sagen, dass Sie sehr stolz, ziemlich stolz, nicht sehr stolz oder überhaupt nicht stolz darauf sind, ein(e) Deutsche(r) zu sein? Durch die vielen Ausländer in Deutschland fühlt man sich zunehmend als fremder im eigenen Land. a) Univariate Verteilungen v Gültig Fehlend 1 SEHR STOLZ ZIEMLICH STOLZ NICHT SEHR STOLZ GAR NICHT STOLZ TNZ: NICHT DEUTSCH 9 KEINE ANGABE Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 7 19,,, 17,9 1, 7,1 1,, 9,7 19,7, 1, 7 9,9 1,,7 117, 1,1 1 1, v FREMDER IM EIGENEN LAND DURCH AUSLAENDER Gültig Fehlend 1 STIMME GAR NICHT ZU 7 STIMME VOELLIG ZU TNZ: NICHT DEUTSCH 99 KEINE ANGABE Gültige Kumulierte Häufigkeit Prozent Prozente Prozente 7, 7, 7, 7 1,9 1,, 1, 11,1,7 1 1, 1,1, 9,7 1, 77,, 9,1, 1,7 1,7 1, 17 9,7 1,,7 1, 9 7, 1 1, 1
Frage: Gibt es zwischen den beiden Variablen einen Zusammenhang? Sind vielleicht diejenigen besonders stolz, die sich auch besonders wohl und eben nicht als Fremde im eigenen Land fühlen? Oder fühlen sich die besonders Deutsch-Stolzen vielleicht auch besonders heftig durch die vielen Ausländer gestört? Oder hat das eine möglicherweise mit dem anderen überhaupt nichts zu tun? b) Bivariate Verteilung: Häufigkeiten FREMDER IM EIGENEN LAND DURCH AUSLAENDER * v Kreuztabe Anzahl v FREMDER IM EIGENEN LAND DURCH AUSLAENDER 1 STIMME GAR NICHT ZU 7 STIMME VOELLIG ZU v 1 SEHR ZIEMLICH NICHT GAR NICHT STOLZ STOLZ SEHR STOLZ STOLZ 177 17 7 9 11 19 79 71 1 19 9 77 19 7 1 1 17 7 7 19 19 1 Zusatzfrage : Wenn es einen Zusammenhang gibt... könnte man dann eine der beiden Variablen als Ursache (= unabhängige Variable ) und die andere als Wirkung (= abhängige Variable ) ansehen? oder beeinflussen sich die beiden Variablen möglicherweise gegenseitig (= Wechselwirkung )? oder hängen die beiden Variablen vielleicht von einer dritten ab (= Scheinkontingenz )? Bisweilen hängt die Antwort auf diese Frage auch vom Blickwinkel der Forscherin ab. Wir nehmen im vorliegenden Fall einmal an, die Forscherin interessiere sich für die Nebenwirkungen des deutschen Nationalstolzes. In diesem wäre der Nationalstolz die unabhängige und die Überfremdungsangst die abhängige Variable.
Konsequenzen der Antwort auf die Zusatzfrage : Um die Wirkung der unabhängigen Variable auf die abhängige Variable zu analysieren, teilt man die Stichprobe anhand der unabhängigen Variable in Gruppen auf und untersucht in jeder dieser Gruppen die Verteilung der abhängigen Variable. Im Beispiel: Schätzen die sehr stolzen Deutschen die Überfremdungsgefahr anders ein als die ziemlich stolzen, die nicht sehr stolzen und die überhaupt nicht stolzen Deutschen? Um diese Frage zu beantworten, berechnet man für jede (durch die unabhängige Variable bestimmte) Gruppe die prozentuale Verteilung der abhängigen Variable. c) Bivariate Verteilung: Gruppenvergleich Um diese Frage zu beantworten, berechnet man für jede (durch die unabhängige Variable bestimmte) Gruppe die prozentuale Verteilung der abhängigen Variable. FREMDER IM EIGENEN LAND DURCH AUSLAENDER * v Kreuztabe % von v v 1 SEHR STOLZ ZIEMLICH STOLZ NICHT SEHR STOLZ GAR NICHT STOLZ v FREMDER 1 STIMME GAR NICHT ZU,%,% 9,%,% 7,% IM EIGENEN,9% 1,% 1,% 1,% 1,% LAND DURCH 9,% 1,% 1,% 1,% 11,% AUSLAENDER 11,7% 1,9% 11,% 1,% 1,% 9,% 1,% 9,%,% 1,7% 11,%,9% 9,%,% 9,% 7 STIMME VOELLIG ZU,% 11,% 11,% 1,% 1,% 1,% 1,% 1,% 1,% 1,% Dann untersucht man, ob einzelne Ausprägungen der unabhängigen Variable in bestimmten Gruppen besonders oft und in anderen besonders selten vorkommen. Im Beispiel: Völlig frei von Überfremdungsängsten ( stimme gar nicht zu ) sind von den sehr stolzen Deutschen,%, von den ziemlich stolzen,%, von den nicht sehr stolzen 9,% und von den gar nicht stolzen,%. Umgekehrt finden sich besonders große Überfremdungsängste ( stimme völlig zu ) vor allem unter den sehr stolzen Deutschen (,%) und weit seltener in den anderen Gruppen. Die folgende Grafik veranschaulicht die einzelnen Zeilen der Tabelle in Form von Balkengraphiken.
d) Bivariate Verteilung: graphische Veranschaulichung V=1 1 V= 1 1 1 V= 1 V= 1 1 1
1 V= 1 1 V= 1 V=7 1 1
Übung: Interpretation einer Kreuztabelle v FREMDER IM EIGENEN LAND DURCH AUSLAENDER * v79kl PROZENTUALER AUSLAENDERANTEIL IN KLASSEN v79kl PROZENTUALER AUSLAENDERANTEIL v FREMDER IM EIGENEN LAND DURCH AUSLAENDER 1 STIMME GAR NICHT ZU 7 STIMME VOELLIG ZU 1 BIS UNTER % % BIS UN- TER 1% 1% BIS UNTER % Anzahl 1 1 7 Zeilen% 9,%,%,% 1,% Spalten% 7,7% 7,% 7,% 7,% Anzahl 199 17 1 7 Zeilen% 1,9%,%,% 1,% Spalten% 1,1% 1,7% 1,% 1,% Anzahl 11 117 Zeilen%,9%,%,9% 1,% Spalten% 1,% 1,1% 1,% 11,1% Anzahl 1 1 1 1 Zeilen%,1% 9,%,% 1,% Spalten% 1,% 1,1% 1,% 1,1% Anzahl 11 1 Zeilen%,% 9,%,% 1,% Spalten% 9,% 11,% 11,% 1,% Anzahl 17 117 Zeilen% 7,%,%,% 1,% Spalten%,7% 1,1%,% 9,1% Anzahl 17 11 1 Zeilen% 9,%,%,% 1,% Spalten% 1,% 1,% 1,% 1,7% Anzahl 1 11 71 17 Zeilen%,9%,%,% 1,% Spalten% 1,% 1,% 1,% 1,%
Interpretation einer Kreuztabelle oder: Antworten auf die Frage Ist das ein großer Unterschied? a) Noch einmal und vereinfacht: Kreuztabelle vkl Nationalstolz in Klassen * vkl Fremd im eigenen Land ( Klassen) Kreuztabelle Anzahl vkl Nationalstolz in Klassen 1 sehr/ziemlich stolz nicht sehr/gar nicht stolz vkl Fremd im eigenen Land ( Klassen) 1 Nein (1-) Ja (-7) 1 799 9 1 7 1 1 1 vkl Nationalstolz in Klassen * vkl Fremd im eigenen Land ( Klassen) Kreuztabelle % von vkl Nationalstolz in Klassen vkl Nationalstolz in Klassen 1 sehr/ziemlich stolz nicht sehr/gar nicht stolz vkl Fremd im eigenen Land ( Klassen) 1 Nein (1-) Ja (-7),%,77% 1,% 7,7% 7,9% 1,%,%,% 1,% b) Graphische Darstellung der Antwort "Ja" 1 sehr/ziemlich stolz nicht sehr/gar nicht stolz Nationalstolz in Klassen 7
c) Signifikanztest 1. Überlegung: Wie müsste die Tabelle aussehen, wenn sich die Stolzen und die Nicht- Stolzen in ihrer Überfremdungsangst nicht unterscheiden würden? Zeilenprozente Überfremdungsangst 1 Nein Ja Stolz 1 sehr/ziemlich,%,% 1,% nicht sehr /nicht,%,% 1,%,%,% 1,% Anzahl ( Erwartete Häufigkeiten [E]) Überfremdungsangst 1 Nein Ja Stolz 1 sehr/ziemlich 1, 71,7, nicht sehr /nicht,7 7, 7, 1, 1, 1,. Überlegung: Wie groß ist der Unterschied zwischen dieser erwarteten Verteilung und der beobachteten Verteilung? Differenzen: Beobachtete Häufigkeiten [F] Erwartete Häufigkeiten [E] Überfremdungsangst 1 Nein Ja Stolz 1 sehr/ziemlich 7, 7,, nicht sehr /nicht 7, 7,,,,,
Quadrierte Differenzen: (F E) Überfremdungsangst Dr. Bardo Heger / Dr. Renate Prust 1 Nein Ja Stolz 1 sehr/ziemlich 7, 7, 7, nicht sehr /nicht 7, 7, 7, 7, 7, 99, Gewichtete quadrierte Differenzen: (F E) / E Überfremdungsangst 1 Nein Ja Stolz 1 sehr/ziemlich 1,1,9,9 nicht sehr /nicht,, 1,1,9 11, 1,1 (F E) χ = Σ E = 1,1 9