B.Heger / R. Prust WS 2010/11 Master Modul 1.3: Quantitative Methoden der empirischen Sozialforschung Übung 2 (mit SPSS-Ausgabe) 1. In der Variablen V253a ist der Schul des s bzw. der in abgelegt. Untersuchen Sie auf Basis einer Kreuztabelle und eines geeigneten Zusammenhangsmaßes, ob zwischen den Variablen V175a und V253a ein Zusammenhang besteht! CROSSTABS /TABLES=v175a BY v253a /FORMAT=AVALUE TABLES /STATISTICS=GAMMA D BTAU /CELLS=COUNT ROW COLUMN /COUNT ROUND CELL. Kreuztabellen Verarbeitete Fälle Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent * v253a Schul 2018 59,0% 1403 41,0% 3421 100,0% * Kreuztabelle 1 ohne Abschluss 2 Volks- /Hauptschule 3 Mittlere Reife 4 Fachhochschulreife 5 Hochschulreife Gesamt 1 ohne Abschluss Anzahl 10 21 1 0 2 34 29,4% 61,8% 2,9%,0% 5,9% 100,0% 31,3% 2,4%,1%,0%,6% 1,7% 2 Volks-/Hauptschule Anzahl 16 579 158 20 25 798 2,0% 72,6% 19,8% 2,5% 3,1% 100,0% 50,0% 66,3% 23,2% 17,5% 7,8% 39,5% 3 Mittlere Reife Anzahl 5 211 363 43 89 711,7% 29,7% 51,1% 6,0% 12,5% 100,0% 15,6% 24,2% 53,4% 37,7% 27,9% 35,2% 4 Fachhochschulreife Anzahl 1 26 50 25 18 120,8% 21,7% 41,7% 20,8% 15,0% 100,0% 3,1% 3,0% 7,4% 21,9% 5,6% 5,9% 5 Hochschulreife Anzahl 0 36 108 26 185 355,0% 10,1% 30,4% 7,3% 52,1% 100,0%,0% 4,1% 15,9% 22,8% 58,0% 17,6% Gesamt Anzahl 32 873 680 114 319 2018 1,6% 43,3% 33,7% 5,6% 15,8% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Richtungsmaße Näherungsweise Näherungsweise s T b Signifikanz Somers-d Symmetrisch,516,016 31,354,000 abhängig abhängig,522,016 31,354,000,511,016 31,354,000 Symmetrische Maße Näherungsweise Näherungsweise s T b Signifikanz Kendall-Tau-b,516,016 31,354,000 Gamma,696,018 31,354,000 Anzahl der gültigen Fälle 2018 Warum enthält die Kreuztabelle nur noch etwa zwei Drittel der Stichprobe? Weil alle Befragten ohne die Frage zu V253 nicht beantworten konnten. (Antwortmöglichkeit: trifft nicht zu) 2. Nutzen Sie die Variable V27a um zu überprüfen, ob sich der in Aufgabe 1 untersuchte Zusammenhang in den beiden Altersgruppen unterscheidet! SORT CASES BY v27a. SPLIT FILE LAYERED BY v27a. CROSSTABS /TABLES=v175a BY v253a /FORMAT=NOTABLES /STATISTICS=GAMMA D BTAU /COUNT ROUND CELL.
Kreuztabellen Verarbeitete Fälle v27a Alter in zwei Klassen Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent 1 18 bis 49 Jahre * v253a Schul 2 50 und älter * v253a Schul 882 50,2% 874 49,8% 1756 100,0% 1132 68,3% 525 31,7% 1657 100,0% Richtungsmaße v27a Alter in zwei Klassen Näherungswei Näherungsweise ses T b Signifikanz 1 18 bis 49 Jahre Somers-d Symmetrisch,488,025 18,466,000 abhängig abhängig,483,025 18,466,000,492,025 18,466,000 2 50 und älter Somers-d Symmetrisch,506,022 21,659,000 abhängig abhängig,514,022 21,659,000,498,022 21,659,000 Symmetrische Maße v27a Alter in zwei Klassen Näherungsweise Näherungsweise s T b Signifikanz 1 18 bis 49 Jahre Kendall-Tau-b,488,025 18,466,000 Gamma,661,030 18,466,000 Anzahl der gültigen Fälle 882 2 50 und älter Kendall-Tau-b,506,022 21,659,000 Gamma,702,024 21,659,000 Anzahl der gültigen Fälle 1132
3. Außer den Variablen V175a und V253a gibt es dievariablen V297a, V371a und V372a mit den Angaben zu den Schulabschlüssen der (in), des und der der Befragten. Analysieren Sie die bivariaten Zusammenhänge aller Schulvariablen untereinander mithilfe eines geeigneten Zusammenhangsmaßes! SPLIT FILE OFF. NONPAR CORR /VARIABLES=v175a v253a V297a v371a v372a /PRINT=KENDALL TWOTAIL NOSIG /MISSING=PAIRWISE. Nichtparametrische Korrelationen Korrelationen v175a v253a V297a v371a v372a Schul Schul Schul Schul Schul V297a Schul v371a Schul v372a Schul Kendall-Tau-b 1,000,516 **,521 **,414 **,385 ** Sig. (2-seitig).,000,000,000,000 N 3377 2018 432 3089 3171 Kendall-Tau-b,516 ** 1,000.,320 **,303 ** N 2018 2021 0 1864 1911 Kendall-Tau-b,521 **. 1,000,346 **,327 ** N 432 0 435 399 412 Kendall-Tau-b,414 **,320 **,346 ** 1,000,656 ** Sig. (2-seitig),000,000,000.,000 N 3089 1864 399 3124 3080 Kendall-Tau-b,385 **,303 **,327 **,656 ** 1,000 Sig. (2-seitig),000,000,000,000. N 3171 1911 412 3080 3207 **. Die Korrelation ist auf dem 0,01 Niveau signifikant (zweiseitig). 4. Unterscheiden sich die in Aufgabe 3 untersuchten Zusammenhänge in West- und Ostdeutschland? SORT CASES BY v27a. SPLIT FILE LAYERED BY v27a. NONPAR CORR /VARIABLES=v175a v253a V297a v371a v372a /PRINT=KENDALL TWOTAIL NOSIG /MISSING=PAIRWISE. Nichtparametrische Korrelationen
Korrelationen v175a Schul- v253a Schul- V297a Schul- v371a Schul- v372a Schul- 1 West V297a Schul v371a Schul Kendall-Tau-b 1,000,506 **,528 **,426 **,385 ** Sig. (2-seitig).,000,000,000,000 N 2266 1390 267 2077 2117 Kendall-Tau-b,506 ** 1,000.,326 **,302 ** N 1390 1393 0 1286 1313 Kendall-Tau-b,528 **. 1,000,336 **,314 ** N 267 0 270 251 255 Kendall-Tau-b,426 **,326 **,336 ** 1,000,623 ** Sig. (2-seitig),000,000,000.,000 N 2077 1286 251 2104 2064 v372a Schul 2 Ost V297a Schul v371a Schul Kendall-Tau-b,385 **,302 **,314 **,623 ** 1,000 Sig. (2-seitig),000,000,000,000. N 2117 1313 255 2064 2144 Kendall-Tau-b 1,000,514 **,488 **,379 **,376 ** Sig. (2-seitig).,000,000,000,000 N 1111 628 165 1012 1054 Kendall-Tau-b,514 ** 1,000.,290 **,273 ** N 628 628 0 578 598 Kendall-Tau-b,488 **. 1,000,349 **,330 ** N 165 0 165 148 157 Kendall-Tau-b,379 **,290 **,349 ** 1,000,711 ** Sig. (2-seitig),000,000,000.,000 N 1012 578 148 1020 1016 v372a Schul Kendall-Tau-b,376 **,273 **,330 **,711 ** 1,000 Sig. (2-seitig),000,000,000,000. N 1054 598 157 1016 1063 **. Die Korrelation ist auf dem 0,01 Niveau signifikant (zweiseitig).
5. Erstellen Sie eine Häufigkeitstabelle für V386 und bestimmen Sie alle zulässigen univariaten Maßzahlen! (Sehen Sie im Datensatz oder im Datenhandbuch nach, wofür diese Variable steht!) SPLIT FILE OFF. FREQUENCIES VARIABLES=V386. Statistiken v386 ANZAHL DER HAUSHALTSPERSONEN N Gültig 3391 Fehlend 30 v386 ANZAHL DER HAUSHALTSPERSONEN Häufigkeit Prozent Gültige Prozente Kumulierte Prozente Gültig 1 1 PERSON 702 20,5 20,7 20,7 2 2 PERSONEN 1343 39,3 39,6 60,3 3 3 PERSONEN 605 17,7 17,8 78,1 4 4 PERSONEN 513 15,0 15,1 93,3 5 5 PERSONEN 164 4,8 4,8 98,1 6 6 PERSONEN 42 1,2 1,2 99,4 7 7 PERSONEN 17,5,5 99,9 8 8 PERSONEN 4,1,1 100,0 9 9 PERSONEN 1,0,0 100,0 Gesamt 3391 99,1 100,0 Fehlend 99 KEINE ANGABE 30,9 Gesamt 3421 100,0
Da die oberen Kategorien der Variablen schwach besetzt sind, sollen Sie eine neue Variable bilden, bei der die oberen 5 Kategorien zusammengefasst sind. RECODE v386 (5 thru 9=5) (ELSE=COPY) INTO v386neu. VARIABLE LABELS v386neu 'Haushaltspersonen neu'. EXECUTE. Anschließend erfolgt im Datenfenster in der Variablenansicht die Eingabe der elabels und die Änderung der Dezimalstellen. FREQUENCIES VARIABLES=v386neu. v386neu Haushaltspersonen neu Häufigkeit Prozent Gültige Prozente Kumulierte Prozente Gültig 1 702 20,5 20,5 20,5 2 1343 39,3 39,3 59,8 3 605 17,7 17,7 77,5 4 513 15,0 15,0 92,5 5 5 bis 9 Personen 228 6,7 6,7 99,1 99 30,9,9 100,0 Gesamt 3421 100,0 100,0 Sie sehen, dass die 30 Fälle mit dem früheren "missing value" 99 nun gültige Fälle sind. Sie können nun den 99 nachträglich im Datenfenster als "Fehlenden " angeben. Möglich ist aber auch folgendes: RECODE v386 (5 thru 9=5) (MISSING=SYSMIS) (ELSE=COPY) INTO v386neu. VARIABLE LABELS v386neu 'Haushaltspersonen neu'. EXECUTE. FREQUENCIES VARIABLES=v386neu. v386neu Haushaltspersonen neu Häufigkeit Prozent Gültige Prozente Kumulierte Prozente Gültig 1 702 20,5 20,7 20,7 2 1343 39,3 39,6 60,3 3 605 17,7 17,8 78,1 4 513 15,0 15,1 93,3 5 5 bis 9 Personen 228 6,7 6,7 100,0 Gesamt 3391 99,1 100,0 Fehlend System 30,9 Gesamt 3421 100,0