Statistikübungen für die Pflegewissenschaften II Beispiellösungen

Transkript

1 Statistikübungen für die Pflegewissenschaften II Beispiellösungen INHALTSVERZEICHNIS BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL (autorisiert durch Reinhard Raml und Doris Gretzl) Enrica Denk Nedeljko Radojicic Christine Schuster Sarah Zaussinger

2 Beispiel 18 Überprüfen Sie die Hypothese, ob auch der Alkoholkonsum mit der sozialen Akzeptanz zusammenhängt. Wählen Sie die Altersgruppe der 15-Jährigen aus. Erstellen Sie eine Kreuztabelle aus den Variablen alk_rec (Alkoholkonsum) und f13_rec ("meine MitschülerInnen akzeptieren mich"). Geben sie die unabhängige Variable in die Zeilen und die abhängige Variable in die Spalten. Wählen Sie die Zeilenprozentwerte und berechnen Sie auch den Chi-Quadrat-Test Besteht ein signifikanter Zusammenhang? Interpretieren Sie kurz die wichtigsten Ergebnisse aus den Prozentwerten Erstellen Sie nun weitere Tabellen indem Sie die Kontrollvariable Geschlecht einsetzen. Welcher Fragestellung wird hier nachgegangen? Besteht ein Geschlechtsunterschied? Wenn ja, inwiefern? F13_REC Student * ALK_REC Alkoholkonsum höchstens Kreuztabelle F13_REC Student Gesamt 1 Always/Often 2 Sometimes 3 Rarely/Never Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student ALK_REC Alkoholkonsum höchstens 0 kein 1 nur 2 jeden 3 Alkohol seltener Monat wöchentl./tägl. Gesamt ,4% 38,1% 14,1% 19,5% 100,0% -1,0 -,1,7, ,1% 39,3% 13,4% 17,1% 100,0%,5,6 -,2-1, ,9% 36,6% 10,9% 17,5% 100,0% 2,3 -,5-1,6 -, ,2% 38,1% 13,7% 19,0% 100,0% Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat-Tests Wert 12,794 a 6,046 12,736 6,047 8,977 1, df Asymptotisch e Signifikanz (2-seitig) a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 65,09. 2

3 Ad 18.1.: Besteht ein signifikanter Zusammenhang? Interpretieren Sie kurz die wichtigsten Ergebnisse aus den Prozentwerten. UV / AV nicht eindeutig Begründen Sie Ihre Entscheidung bzw. überlegen Sie sich Wirkungsmöglichkeiten in beide Richtungen. Der Zusammenhang ist signifikant (Irrtumswahrscheinlichkeit ist 4,6 %), jedoch scheint die Stärke des Zusammenhangs sehr gering (std. Residuen); Ergebnis sollte kritisch betrachtet werden; Die Voraussetzung für den Chi-2-Test ist erfüllt In keinen Zellen beträgt die erwartete Häufigkeit weniger als 5. Die Unterschiede in den Prozentwerten sind eher gering, es lässt sich jedoch folgende Tendenz erkennen: Je seltener MitschülerInnen von anderen akzeptiert werden, desto häufiger geben sie an, keinen Alkohol zu konsumieren. Widerspricht das Ihrer Intuition? Hätten wir angenommen, dass weniger Akzeptierte häufiger zum Alkohol greifen? Oder: Je stärker sie akzeptiert werden, desto öfter wird gemeinsam getrunken bzw. hängt die Akzeptanz davon an, dass man mittrinkt (Gruppendruck denken Sie ans Rauchen!). H1 wird angenommen (Es besteht ein signifikanter Zusammenhang zwischen dem Alkoholkonsum und der Akzeptanz unter MitschülerInnen in der Grundgesamtheit.) Der Zusammenhang ist schwach überprüfen Sie das auch mit geeigneten Zusammenhangsmaßen. Sie können jene Maße für Ordinalskalen nehmen, da beide Variablen ordinal sind (Achtung: Pearson-R) ist nicht zu interpretieren! Sowohl Gamma als auch Spearmann weisen auf einen äußerst geringen Zusammenhang hin. Gesamtbewertung: Kreuztabelle kaum signifikante Über-/Unterbesetzungen der Zellen (Verteilung vergleichen mit Randverteilung, standardisierte Residuen), Chi-2 knapp signifikant, Zusammenhangsmaße sehr niedrig. Fazit: De facto kein relevanter Zusammenhang, wenngleich knapp signifikant (Schluss auf die Grundgesamtheit). Ordinal- bzgl. Ordinalmaß Intervall- bzgl. Anzahl der gültigen Fälle Gamma Korrelation nach Spearman Pearson-R a. Die Null-Hyphothese wird nicht angenommen. Symmetrische Maße Asymptoti scher Näherung Standardf Näherung sweise Wert ehler a sweises T b Signifikanz -,071,024-3,027,002 -,042,014-3,035,002 c -,041,014-2,998,003 c 5276 b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. c. Basierend auf normaler Näherung 3

4 Ad 18.2.: Erstellen Sie nun weitere Tabellen indem Sie die Kontrollvariable Geschlecht einsetzen. Welcher Fragestellung wird hier nachgegangen? Besteht ein Geschlechtsunterschied? Wenn ja, inwiefern? F13_REC Student * ALK_REC Alkoholkonsum höchstens * C1 Sex Kreuztabelle C1 Sex 1 Boy 2 Girl F13_REC Student Gesamt F13_REC Student Gesamt 1 Always/Often 2 Sometimes 3 Rarely/Never 1 Always/Often 2 Sometimes 3 Rarely/Never Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student ALK_REC Alkoholkonsum höchstens 0 kein 1 nur 2 jeden 3 Alkohol seltener Monat wöchentl./tägl. Gesamt ,7% 33,8% 16,4% 26,2% 100,0% -1,4 -,2,9, ,7% 34,6% 13,4% 23,3% 100,0% 1,4,2-1,1 -, ,3% 35,0% 12,2% 20,5% 100,0% 2,3,3-1,4-1, ,2% 34,0% 15,6% 25,2% 100,0% ,7% 42,9% 11,5% 11,9% 100,0%,0,2 -,2 -, ,6% 43,9% 13,4% 11,1% 100,0% -,8,4 1,0 -, ,0% 38,5% 9,5% 14,0% 100,0% 1,1-1,0 -,9, ,8% 42,7% 11,6% 11,9% 100,0% C1 Sex 1 Boy 2 Girl Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat-Tests Wert 16,486 a 6,011 16,374 6,012 13,837 1, ,835 b 6,442 5,799 6,446,000 1, df Asymptotisch e Signifikanz (2-seitig) a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 39,57. b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 25,65. Hierbei wird der Frage nachgegangen, ob der signifikante Zusammenhang zwischen dem Alkoholkonsum und der Akzeptanz der MitschülerInnen unabhängig vom Geschlecht der Befragten besteht. Bei Mädchen ist der Zusammenhang nicht signifikant, d.h. das der Alkoholkonsum nicht von der Akzeptanz der MitschülerInnen abhängt. Bei den Buben ist er signifikant, bleibt aber schwach, wenngleich Tendenzen schon klarer erkennbar. 4

5 Beispiel 19 (Datensatz hbsc-94-uebung.sav) Testen Sie mittels t-test, ob sich das Taschengeld (c11) nach Geschlecht signifikant unterscheidet. Formulieren Sie die Nullhypothese und die Alternativhypothese. Markieren Sie die relevanten Test-Signifikanzen. Zu welcher Entscheidung kommen Sie aufgrund der Testergebnisse. Was bedeutet das Ergebnis inhaltlich? Nullhypothese: Es besteht kein Unterschied zwischen der durchschnittlichen Höhe des Taschengeldes bei Buben und Mädchen. Alternativhypothese: Die durchschnittliche Höhe des Taschengeldes bei Buben und Mädchen unterscheidet sich. Gruppenstatistiken C11 Pocket money C1 Sex 1 Boy 2 Girl Standardfe Standardab hler des N Mittelwert weichung Mittelwertes ,42 187,741 3, ,07 145,723 2,991 Test bei unabhängigen Stichproben C11 Pocket money Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit F Signifikanz T df Sig. (2-seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz 95% Konfidenzintervall Standardfehle der Differenz r der Differenz Untere Obere 60,6,000 6, ,000 31,35 4,770 21,996 40,698 6, ,042,000 31,35 4,697 22,139 40,555 Überlegen: Gerichtete / Ungerichtete Hypothesen formulieren?! Oben angeführte Hypothesen sind ungerichtet. Wenn diese signifikant sind, dann sind es auch die gerichteten. Buben erhalten signifikant mehr Taschengeld, nämlich durchschnittlich Mädchen erhalten signifikant weniger Taschengeld, nämlich durchschnittlich 114.-, das sind um rund 30.- weniger. Der t-test untersucht, ob sich die beiden Mittelwerte der Höhe des Taschengeldes signifikant unterscheiden. Ist dies der Fall, so darf angenommen werden, dass dieses Ergebnis aus der Stichprobe mit sehr großer Wahrscheinlichkeit auch in der Grundgesamtheit zutrifft (alle österreichischen SchülerInnen zwischen 11 und 15 Jahren). Sollte tatsächlich (heißt: in der GG) die H0 gelten, so irren wir uns bei unserer Entscheidung, die H0 zu verwerfen, mit einer Wahrscheinlichkeit von nahezu (!!) 0 Prozent. Niemals: 0 % - das wäre ein sicheres Ereignis und das gibt es beim Hypothesentesten nicht. 5

6 Beispiel 20 (Datensatz hbsc-94-uebung.sav) Untersuchen Sie, ob sich der Zigarettenkonsum signifikant nach Alter und Geschlecht unterscheidet. Teilen Sie den Datensatz nach Altersgruppen auf, und vergleichen Sie die Variable c14 (Anzahl der Zigaretten in der Woche) nach Geschlecht. Ringeln Sie die für die Testung zu interpretierenden Signifikanzen ein. In welcher Altersgruppe besteht ein signifikanter Geschlechtsunterschied und in welcher nicht? Interpretieren Sie das Ergebnis unter Berücksichtigung der Mittelwerte pro Altersgruppe. Gruppenstatistiken AGE_GRP Altersgruppen 1 11jährige (bis 11,9) 2 13jährige (12 bis 13.9) 3 15jährige (ab 14) C14 No. of cigarettes per week C14 No. of cigarettes per week C14 No. of cigarettes per week C1 Sex 1 Boy 2 Girl 1 Boy 2 Girl 1 Boy 2 Girl Standardfe Standardab hler des N Mittelwert weichung Mittelwertes 728,19 1,306, ,03,463, ,90 21,513, ,54 11,282, ,79 31,682, ,37 28,354 1,051 Test bei unabhängigen Stichproben AGE_GRP Altersgruppe n 1 11jährige (bis 11,9) 2 13jährige (12 bis 13.9) 3 15jährige (ab 14) C14 No. of cigarettes per week C14 No. of cigarettes per week C14 No. of cigarettes per week Varianzen sind gleich Varianzen sind nicht gleich Varianzen sind gleich Varianzen sind nicht gleich Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit F Signifikanz T df Sig. (2-seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz 95% Konfidenzintervall Standardfehle der Differenz r der Differenz Untere Obere 36,15,000 3, ,002,15,049,057,249 3, ,075,003,15,051,053,254,551,458, ,654,36,806-1,220 1,942, ,84,661,36,823-1,253 1,976 3,320,069, ,323 1,42 1,434-1,394 4,231 1, ,47,310 1,42 1,397-1,321 4,158 Hypothesen aufstellen nicht vergessen! Ein signifikanter Geschlechtsunterschied in der durchschnittlichen Anzahl der konsumierten Zigaretten pro Woche besteht lediglich bei den 11-Jährigen. Dieser Unterschied ist zwar signifikant, jedoch praktisch kaum bedeutsam, da er sich lediglich auf 0,1 Zigaretten pro Woche beläuft (11-Jährige Buben rauchen durchschnittlich 0,2 Zigaretten pro Woche (rund 1 Zigarette im Monat), 11-Jährige Mädchen fast keine). Sind die Mittelwerte eigentlich aussagekräftig? Nein! Warum nicht? (Verteilung!). Die Signifikanz begründet sich auf einen größeren Anteil an gelegentlichen Rauchern bei den Buben in dieser Altersgruppe, der in etwa 6 Prozentpunkte höher liegt als bei den Mädchen was durchaus nicht unwesentlich ist. Buben sind also schon früher anfällig für das Rauchen. In den Altersgruppen ab 13 Jahren besteht kein signifikanter Unterschied mehr zwischen Mädchen und Buben im durchschnittlichen Zigarettenkonsum. Die 13-Jährigen konsumieren durchschnittlich knapp 2 Zigaretten in der Woche, die 15- Jährigen konsumieren durchschnittlich rund Zigaretten in der Woche, das sind 6

7 immerhin bereits 2 Zigaretten am Tag. Voraussetzung für den t-test: NV des Zigarettenkonsums! Ist nicht gegeben. Merkmal ist linkssteil verteilt, Mittelwerte und Standardabweichungen sind kaum aussagekräftig. Man könnte die Nichtraucher selektieren (diese Frage eigens untersuchen) und die Menge gerauchter Zigaretten bei den Rauchern der jeweiligen Altersgruppen vergleichen; NV- Verteilung müsste wieder überprüft werden. Besser ist es, einen U-Test durchzuführen, der übrigens zu denselben Signifikanzaussagen führt. Überprüfen Sie es selbst. Die Irrtumswahrscheinlichkeiten sind: de facto 0 %, 10,6 % und 49,3 % (aufsteigende Altersgruppen). 7

8 Beispiel 21 (Datensatz hbsc-94-uebung.sav) Suchen Sie aus dem Datensatz eine ordinal-skalierte Variable heraus, von der Sie annehmen, dass sich deren Verteilungen signifikant nach Geschlecht unterscheiden. Testen Sie mittels U-Test, ob Ihre Vermutung zutrifft oder nicht. Formulieren Sie die Hypothesen und interpretieren Sie das Ergebnis. Hat sich Ihre Vermutung bestätigt? Was für eine Erklärung haben Sie dafür? Es ist ein U-Test erforderlich; Als Variable haben wir uns für Sports time per week entschieden. Ranks C21 Sports - times per week C1 Sex 1 Boy 2 Girl Total N Mean Rank Sum of Ranks , , , , Mann-Whitney U Wilcoxon W Z Test Statistics a Asymp. Sig. (2-tailed) C21 Sports - times per week , ,000 a. Grouping Variable: C1 Sex -15,149,000 H0: Es besteht kein Unterschied in der Häufigkeit der sportlichen Betätigung zwischen Mädchen und Buben in der Grundgesamtheit. H1: Es besteht ein Unterschied in der Häufigkeit der sportlichen Betätigung zwischen Mädchen und Buben in der Grundgesamtheit. Die Vermutung, dass Buben angeben mehr Sport zu betreiben als Mädchen kann bestätigt werden, da der Test zeigt, dass der Unterschied signifikant ist (die Rangsumme bei Buben ist niedriger; auf Kodierung achten!!). Die Erklärung hierfür findet sich vielleicht in der unterschiedlichen Sozialisation Buben werden häufiger zum Sport animiert als Mädchen. 8

9 Beispiel 23 (Datensatz hbsc-94-uebung.sav) In Beispiel 21 haben Sie untersucht, ob sich das Taschengeld signifikant nach Geschlecht unterscheidet. Schauen Sie nun getrennt für Burschen und Mädchen weiter, ob sich das Taschengeld (C11) zwischen den verschiedenen Schichten (scht) unterscheidet. Wo gibt es Unterschiede, wo nicht. Überrascht Sie das Ergebnis? Was für Gründe fallen Ihnen zur Erklärung ein und wie würden Sie diese in einer eigenen Umfrage untersuchen? Descriptives c11 Pocket money c1 Sex 1 Boy 2 Girl 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht Total 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht Total 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum ,35 172,090 6, ,39 150, ,04 186,615 6, ,24 156, ,86 186,494 6, ,70 150, ,78 220,536 13, ,90 217, ,18 187,166 3, ,09 152, ,83 146,275 6, ,79 126, ,68 150,291 5, ,46 123, ,07 136,540 5, ,03 120, ,30 154,149 9, ,06 143, ,99 145,684 2, ,11 119, Test of Homogeneity of Variances c11 Pocket money c1 Sex 1 Boy 2 Girl Levene Statistic df1 df2 Sig. 6, ,000, ,748 ANOVA c11 Pocket money c1 Sex 1 Boy 2 Girl Between Groups Within Groups Total Between Groups Within Groups Total Sum of Squares df Mean Square F Sig , ,506 6,105, , , , , ,500,595, , , ,

10 Multiple Comparisons Dependent Variable: c11 Pocket money Bonferroni c1 Sex 1 Boy 2 Girl (I) scht Schichtindex 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht (J) scht Schichtindex 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -7,693 9,348 1,000-32,38 16,99,494 9,809 1,000-25,41 26,39-53,426* 13,590,001-89,31-17,55 7,693 9,348 1,000-16,99 32,38 8,187 9,010 1,000-15,60 31,97-45,733* 13,024,003-80,12-11,35 -,494 9,809 1,000-26,39 25,41-8,187 9,010 1,000-31,97 15,60-53,920* 13,359,000-89,19-18,65 53,426* 13,590,001 17,55 89,31 45,733* 13,024,003 11,35 80,12 53,920* 13,359,000 18,65 89,19 1,150 7,919 1,000-19,76 22,06 4,753 8,188 1,000-16,87 26,37-9,475 11,070 1,000-38,70 19,75-1,150 7,919 1,000-22,06 19,76 3,603 7,433 1,000-16,02 23,23-10,625 10,523 1,000-38,41 17,16-4,753 8,188 1,000-26,37 16,87-3,603 7,433 1,000-23,23 16,02-14,228 10,727 1,000-42,55 14,10 9,475 11,070 1,000-19,75 38,70 10,625 10,523 1,000-17,16 38,41 14,228 10,727 1,000-14,10 42,55 Schritt 1: Mittelwerte betrachten: das durchschnittlichen Taschengeld steigt anscheinend nicht stetig mit einer höheren subjektiven Statuszuordnung. Untere Mittelschicht bekommt mehr als obere Mittelschicht woran könnte das liegen? Ist es hier nur zufällig so oder besteht ein signifikanter Unterschied? Schritt 2: Test auf Homogenität der Varianzen: Voraussetzung für die Varianzanalyse ist, dass die Varianzen homogen/ gleich sind. H 0 : Die Varianzen sind gleich H 1 : Die Varianzen unterscheiden sich. Bei den Buben ist das Ergebnis signifikant, also gilt H 1, deswegen sollte die ANOVA und der Bonferroni-Test nicht interpretiert bzw. nur unter Vorbehalt interpretiert werden. Das ist insofern auch wichtig, als gerade bei den Buben die ANOVA ein signifikantes Ergebnis ausweist (mit Kruskal-Wallis absichern! siehe unten). Bei den Mädchen ist das Ergebnis nicht signifikant, also wird H 0 beibehalten, die ANOVA darf interpretiert werden. Schritt 3: ANOVA für die Mädchen wird interpretiert: H 0 : Es gibt keine Unterschiede beim durchschnittlichen Taschengeld der 10

11 verschiedenen Schichten H 1 : Es gibt Unterschiede beim durchschnittlichen Taschengeld der verschiedenen Schichten Die ANOVA ist bei den Mädchen nicht signifikant, es bleibt also bei der Annahme der H 0. Die Post-hoc-Tests spielen bei den Mädchen also keine Rolle mehr. Wenn bei diesen eine signifikante Abweichungen zwischen 2 Gruppen auftauchen würde, ist diese nicht aussagekräftig. Warum ist das Ergebnis bei den Mädchen nicht signifikant? Welche Variabel hat vielleicht eher einen Einfluss auf das Taschengeld? Schritt 4: Da wir bei den Buben die ANOVA nicht interpretieren dürfen, führen wir einen nichtparametrischen Test für mehrere unabhängige Stichproben durch (Kruskal-Wallis-Test), da dieser nicht voraussetzt, dass die Varianzen gleich sind. Weiters lassen wir uns bei der Varianzanalyse bei den Post-Hoc-Tests statt dem Bonferroni-Test einen Test ausgeben, wo keine Varianzgleichheit vorausgesetzt wird, nämlich den Tamhane-T2-Test. Die U-Test bei beiden Geschlechtern gelangen zu demselben Ergebnis wie die einfaktorielle ANOVA. Diese ist i.a. robust gegenüber Verletzungen der Homogenitäts-Voraussetzung. Ränge Sex Schichtindex N Mittlerer Rang Boy Pocket money Unterschicht ,44 unt.mittelsch ,15 obere Mittelsch ,04 Oberschicht ,96 Gesamt 2678 Girl Pocket money Unterschicht ,28 unt.mittelsch ,16 obere Mittelsch ,20 Oberschicht ,44 Gesamt 2366 Sex Boy Girl Statistik für Test a,b Chi-Quadrat df Asymptotische Signifikanz Chi-Quadrat df Asymptotische Signifikanz Pocket money 25,038 3,000 5,831 3,120 a. Kruskal-Wallis-Test b. Gruppenvariable: Schichtindex Schritt 5: Interpretation des Kruskal-Walis-Tests: H 0 : Es gibt keine Unterschiede beim durchschnittlichen Taschengeld der 11

12 verschiedenen Schichten H 1 : Es gibt Unterschiede beim durchschnittlichen Taschengeld der verschiedenen Schichten Das Ergebnis für die Buben ist signifikant, es darf die H 1 angenommen werden. Wir können uns nun das Ergebnis vom Mehrfachvergleich anschauen: es gibt nur signifikante Unterschiede beim Taschengeld, von den Buben, die sich der Oberschicht zurechnen mit den drei anderen Schichten (Unterschicht, untere Mittelschicht, obere Mittelschicht). Wieso bekommt diese Gruppe soviel mehr Taschengeld als alle anderen? Wieso ist dieser Unterschied nicht auch bei den Mädchen erkennbar? Was könnten mögliche Gründe sein? Abhängige Variable: Pocket money Tamhane Mehrfachvergleiche Sex Boy Girl (I) Schichtindex Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht (J) Schichtindex Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht *. Die mittlere Differenz ist auf der Stufe.05 signifikant. 95%-Konfidenzintervall Mittlere Differenz (I-J) Standardfehler Signifikanz Untergrenze Obergrenze -7,69 8,928,948-31,21 15,83,49 9,407 1,000-24,29 25,28-53,43* 15,162,003-93,52-13,33 7,69 8,928,948-15,83 31,21 8,19 9,005,933-15,54 31,91-45,73* 14,917,014-85,19-6,27 -,49 9,407 1,000-25,28 24,29-8,19 9,005,933-31,91 15,54-53,92* 15,208,003-94,14-13,70 53,43* 15,162,003 13,33 93,52 45,73* 14,917,014 6,27 85,19 53,92* 15,208,003 13,70 94,14 1,15 8,039 1,000-20,03 22,33 4,75 7,980,992-16,28 25,79-9,47 11,531,959-39,95 21,00-1,15 8,039 1,000-22,33 20,03 3,60 7,296,997-15,62 22,82-10,62 11,069,916-39,89 18,64-4,75 7,980,992-25,79 16,28-3,60 7,296,997-22,82 15,62-14,23 11,026,733-43,39 14,93 9,47 11,531,959-21,00 39,95 10,62 11,069,916-18,64 39,89 14,23 11,026,733-14,93 43,39 12

13 Beispiel 25 (Datensatz hbsc-94-uebung.sav) Untersuchen Sie folgende korrelative Zusammenhänge bei 15- jährigen Schülerinnen: f13 "meine MitschülerInnen akzeptieren mich", f14 "wurde verspottet', f15 "habe verspottet', f23 "Reden mit Vater', f24 "Reden mit Mutter', f39 "Selbstbewusstsein" und f34 "Bewertung des eigenen Aussehens" Beschreiben Sie anhand der Stärke der Korrelationen die Einflussfaktoren auf die Akzeptanz durch die Mitschülerinnen. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"- Thematik! 25.2 Beschreiben Sie an hand der Stärke der Korrelationen die Einflussfaktoren auf das Selbstbewusstsein. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation- Kausalitäts"-Thematik! 25.3 Zeigt das Reden-Können mit Vater bzw. Mutter unterschiedlich starke Auswirkungen, wenn ja, inwiefern? 25.4 Welche weitere Variable könnte einen Zusammenhang mit dem Selbstbewusstsein aufweisen? Überprüfen Sie Ihre Vermutung anhand einer bivariaten Korrelation. Besteht ein Zusammenhang? Wenn ja, wie stark ist er und wie ist er zu interpretieren? F13 Student rel: accept me F14 Been bullied F15 Have bullied F23 Easy to talk to father F24 Easy to talk to mother F39 Feel confident F34 Think about look Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N **. Die Korrelation ist auf dem 0,01 Niveau signifikant (zweiseitig). *. Die Korrelation ist auf dem 0,05 Niveau signifikant (zweiseitig). Korrelationen F13 Student F14 Been F15 Have F23 Easy to F24 Easy to F39 Feel F34 Think bullied bullied talk to father talk to mother confident about look 1,000,315** -,007,121**,089**,230**,249**.,000,747,000,000,000, ,315** 1,000,200**,070**,046*,142**,119**,000.,000,003,048,000, ,007,200** 1,000 -,002,039 -,085** -,075**,747,000.,928,093,000, ,121**,070** -,002 1,000,461**,226**,169**,000,003,928.,000,000, ,089**,046*,039,461** 1,000,154**,133**,000,048,093,000.,000, ,230**,142** -,085**,226**,154** 1,000,298**,000,000,000,000,000., ,249**,119** -,075**,169**,133**,298** 1,000,000,000,001,000,000, Ad 25.1.: Beschreiben Sie anhand der Stärke der Korrelationen die Einflussfaktoren auf die Akzeptanz durch die Mitschülerinnen. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"- Thematik! Verspottet zu werden korreliert am stärksten mit der Akzeptanz durch die MitschülerInnen (0,315). Im Gegensatz dazu gehen das Verspotten und das Akzeptiert-werden nicht Hand in Hand. (nicht signifikante Korrelation von -0,007). 13

14 Selbstbewusstsein und die Bewertung des eigenen Aussehens zeigen mittlere Zusammenhänge mit der Akzeptanz durch die MitschülerInnen (0,249 und 0,230). Das Reden mit Vater bzw. Mutter hängt weniger zusammen mit der Akzeptanz. Ad 25.2.: Beschreiben Sie an hand der Stärke der Korrelationen die Einflussfaktoren auf das Selbstbewusstsein. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"-Thematik! Das Selbstbewusstsein korreliert am stärksten mit der Bewertung des eigenen Aussehens (0,298). Weiters zeigen auch die Beziehung zum Vater (0,226) sowie die Akzeptanz durch die MitschülerInnen (0,230) mittlere Zusammenhänge mit dem Selbstbewusstsein. Verspottet werden (0,142) oder haben ((-0,085) sowie die Beziehung zur Mutter (0,154) zeigen wiederum die geringsten Zusammenhänge mit dem Selbstbewusstsein. Ad 25.3.: Zeigt das Reden-Können mit Vater bzw. Mutter unterschiedlich starke Auswirkungen, wenn ja, inwiefern? Grundsätzlich ist feststellbar, dass das Reden mit dem Vater stärke Korrelationen mit den ausgewählten Variablen aufweist als das Reden mit der Mutter. Besonders deutlich wird dies beim Selbstbewußtsein. Es ist zu vermuten, dass auch bei der Akzeptanz durch die MitschülerInnen hier die männlichen Schulkollegen mehr soziale Definitinsmacht ausüben können. Bei einer weiteren Befragung könnte hier zwischen der Akeptanz von männlichen und weiblichen MitschülerInnen differenziert werden. Ad 25.4.: Welche weitere Variable könnte einen Zusammenhang mit dem Selbstbewusstsein aufweisen? Überprüfen Sie Ihre Vermutung anhand einer bivariaten Korrelation. Besteht ein Zusammenhang? Wenn ja, wie stark ist er und wie ist er zu interpretieren? Correlations Spearman's rho F37 Easy to make friends F39 Feel confident Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). F37 Easy to F39 Feel make friends confident 1,000,272**., ,272** 1,000, Es besteht eine mittelstarke positive Korrelation (0,272). D.h. je selbstbewusster jemand ist, desto leichter findet sie/er Freunde und umgekehrt (kausaler Zusammenhangs nicht ersichtlich) 14

15 Beispiel 26 Selektieren Sie Beamte und Beamtinnen (mithilfe der Variable beruf1) aus der Gesamtstichprobe. Erstellen Sie ein Streudiagramm, das die Beziehung zwischen Einkommen (EINK2003) als unabhängige Variable und dem Traditionellen Familienbild (famtrad) als abhängige Variable für Frauen und Männer darstellt. Legen Sie die entsprechenden Regressionsgeraden in die Grafik und lassen Sie sich das Bestimmtheitsmaß R² anzeigen Inwiefern unterscheidet sich die Regressionsgerade der Beamten von jener der Beamtinnen? Welchen Wert nimmt jeweils das Bestimmtheitsmaß (R²) an und was bedeutet er? 26.2 Welche Personen verzerren möglicherweise den Zusammenhang zwischen dem Einkommen und dem Traditionellen Familienbild bei BeamtInnen? In welcher Weise? Identifizieren Sie die Fälle anhand der Paginiernummer. Entscheiden Sie sich für zwei Ausreißer, deren Ausschluss einen Zuwachs an Erklärungsbeitrag für das Traditionelle Familienbild erbringen könnte. Markieren Sie diese auf dem Streudiagramm und begründen Sie deren Ausschluss. Führen Sie die Analyse mit der selektierten Stichprobe noch einmal durch! Haben sich Ihre Ergebnisse in der erwarteten Weise verbessert? Welche Probleme könnten sich ergeben, wenn Sie zu viele Fälle ausschließen (als Extremwerte bezeichnen)? Ad 26.1.: Inwiefern unterscheidet sich die Regressionsgerade der Beamten von jener der Beamtinnen? Welchen Wert nimmt jeweils das Bestimmtheitsmaß (R²) an und was bedeutet er? Traditionelles Familienbild Geschlecht weiblich R-Qu. = 0,0295 männlich R-Qu. = 0, Persönliches Netto-Einkommen Fälle gewichtet nach GEWICHT 15

16 Achtung: im aktuellen Datensatz von der HP weist die Variable beruf1 einen Codierungsfehler auf! (Kategorie 3! Sind die Angestellten, net die BeamtInnen) Für Männer und Frauen gilt grundsätzlich: Je höher das Netto-Einkommen, umso geringer ist das traditionelle Familienbild (schwacher negativer Zusammenhang). Beamtinnen: Die Regressionsgerade verläuft fast parallel unter jener der Männer, Geraden gehen nur geringfügig auseinander. Grundsätzlich haben Beamtinnen ein niedrigeres traditionelles Familienbild, keine Beamtin verdient mehr als ca ,- Euro Beamte: Grundsätzlich ein höheres traditionelles Familienbild sowie einzelne Fälle mit hohem Gehalt. Bestimmtheitsmaß: Bei den Frauen können knapp 3% und bei den Männern 3,4% der Variation (der Varianz, des Zustandekommens o.ä.) des traditionellen Familienbildes durch das Einkommen erklärt werden. Also sehr, sehr wenig!!!!! Ad 26.2.: Welche Personen verzerren möglicherweise den Zusammenhang zwischen dem Einkommen und dem Traditionellen Familienbild bei BeamtInnen? In welcher Weise? Identifizieren Sie die Fälle anhand der Paginiernummer. Entscheiden Sie sich für zwei Ausreißer, deren Ausschluss einen Zuwachs an Erklärungsbeitrag für das Traditionelle Familienbild erbringen könnte. Markieren Sie diese auf dem Streudiagramm und begründen Sie deren Ausschluss. Führen Sie die Analyse mit der selektierten Stichprobe noch einmal durch! Haben sich Ihre Ergebnisse in der erwarteten Weise verbessert? Welche Probleme könnten sich ergeben, wenn Sie zu viele Fälle ausschließen (als Extremwerte bezeichnen)? 70 Traditionelles Familienbild Geschlecht weiblich R-Qu. = 0,1678 männlich R-Qu. = 0, Persönliches Netto-Einkommen Fälle gewichtet nach GEWICHT Beispielsweise: 16

17 Ausschluss von Frau Nr. 983: Sie hat ein untypisch hohes traditionelles Familienbild und zieht die Gerade nach oben. Ausschluss von Mann Nr. 1443: Er hat auch ein relativ hohes traditionelles Familienbild, befindet sich etwas außerhalb der Punktwolke und zieht Gerade ebenfalls nach oben. Bestimmtheitsmaß der Frauen hat sich deutlich verbessert, jenes der Männer nur unwesentlich. Probleme, wenn zu viele Fälle ausgeschlossen werden: z.b. es wird ein künstlicher Zusammenhang modelliert, zu geringe Fallzahlen u.ä. Ausschluss von Mann Nr (so wie im nächsten Schritt empfohlen) 17

18 Beispiel 28 Selektieren Sie Beamte und Beamtinnen (mithilfe der Variable beruf1) aus der Gesamtstichprobe; schließen Sie zusätzlich die Ausreißer mit der Paginiernummer 983 und 1664 von der Analyse aus. Berechnen Sie eine weitere Regressionsanalyse mit dem Traditionellen Familienbild (famtrad) als abhängige Variable. Als unabhängige Variablen verwenden Sie wieder das Einkommen (EINK93) sowie die Dummy-Variable MANN, die wir in den Übungen gebildet haben (siehe Seite 67). Wählen Sie bei der Berechnung der Regressionsanalyse die Methode Einschluss. Speichern Sie wieder die standardisierten Residuen und lassen Sie sich ein Histogramm der Residuen ausdrucken Beschreiben Sie ausführlich die Vorgehensweise bei der Bewertung des Modells. Welche Werte ziehen Sie für Ihre Bewertung heran und was bedeuten diese? 28.2 Wie lautet die Regressionsgleichung des Modells? Interpretieren Sie die Bedeutung der einzelnen Variablen für das Gesamtmodell? Welche Variable hat den größten Einfluss auf das Traditionelle Familienbild? Anhand welcher Werte lesen Sie das ab? 28.3 Führen Sie eine graphische Analyse der Residuen durch, indem Sie zumindest drei Scatterplots erstellen: Auf der y-achse tragen Sie die standardisierten Residuen, auf der x- Achse die Variablen, von denen Sie glauben, dass sie einen weiteren Erklärungsbeitrag liefern können, auf. Welche der graphisch analysierten Variablen könnten Ihrer Meinung nach zur Verbesserung des Regressionsmodells beitragen? Warum? Model 1 Variables Entered/Removed b Variables Variables Entered Removed Method mann, eink2003 Persönliches Netto-Einkommen a. Enter a. All requested variables entered. b. Dependent Variable: famtrad Traditionelles Familienbild Model 1 Model Summary b Adjusted Std. Error of R R Square R Square the Estimate,622 a,387,365 11,36365 a. Predictors: (Constant), mann, eink2003 Persönliches Netto-Einkommen b. Dependent Variable: famtrad Traditionelles Familienbild 18

19 Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 4482, ,158 17,356,000 a 7098, , , a. Predictors: (Constant), mann, eink2003 Persönliches Netto-Einkommen b. Dependent Variable: famtrad Traditionelles Familienbild Model 1 (Constant) eink2003 Persönliches Netto-Einkommen mann Coefficients a a. Dependent Variable: famtrad Traditionelles Familienbild Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. 33,801 4,407 7,670,000 -,006,003 -,256-2,310,025 18,565 3,165,650 5,865,000 Predicted Value Residual Std. Predicted Value Std. Residual Residuals Statistics a Minimum Maximum Mean Std. Deviation N 19, , ,4307 8, , ,97744, , ,734 1,386,000 1, ,038 3,166,000, a. Dependent Variable: famtrad Traditionelles Familienbild Histogram Dependent Variable: Traditionelles Familienbild Frequency Mean = -1,21E-15 Std. Dev. = 0,982 N = 58 Regression Standardized Residual Cases weighted by Gewichtungsfaktor 19

20 Ad 28.1.: Beschreiben Sie ausführlich die Vorgehensweise bei der Bewertung des Modells. Welche Werte ziehen Sie für Ihre Bewertung heran und was bedeuten diese? Auf den ersten Blick ist ersichtlich, dass beide unabhängigen Variablen ins Modell aufgenommen wurden, was bei der Methode Einschluss jedoch keine weitere Aussagekraft hat, da alle Variablen aufgenommen werden, unabhängig von ihrem Einfluss auf die abhängige Variable. Der zweite Blick gilt der ANOVA-Tabelle, aus der ersichtlich wird, dass das Modell insgesamt signifikant ist (p (von F) <= 0,05). In der obigen Tabelle Modellzusammenfassung lesen wir ab, dass rund 38% der Gesamtvarianz des traditionellen Familienbildes durch die beiden Variablen Einkommen und Mann erklärt werden konnten. Für diesen Zuwachs an Erklärungsbeitrag im Vergleich zum vorigen Beispiel, wo ein Bestimmtheitsmaß für die Männer von 4% und für die Frauen von 17% erreicht werden konnte, liegt an der Hinzunahme der Variable Mann. Aus der Koeffiziententabelle wird sichtbar, dass beide Variablen (mann und Einkommen) einen signifikanten Einfluss auf das traditionelle Familienbild ausüben (Vergleich der Signifikanzen, Vergleich der Beta-Koeffizienten). Weiters ist anhand des Histogramms der Residuen ersichtlich, dass die Verteilung bereits deutlich symmetrischer bzw. normalverteilter ist, als es die beiden Verteilungen der Residuen getrennt nach Geschlecht ohne der Variable Mann waren. Doch ist die Verteilung noch immer nicht normalverteilt, weshalb es sich empfiehlt, weitere Variablen für das Modell zu bestimmen. Ad 28.2.: Wie lautet die Regressionsgleichung des Modells? Interpretieren Sie die Bedeutung der einzelnen Variablen für das Gesamtmodell? Welche Variable hat den größten Einfluss auf das Traditionelle Familienbild? Anhand welcher Werte lesen Sie das ab? FAMTRAD = 33,8 0,006 x EINK ,6 x mann Aus der Koeffiziententabelle wird sichtbar, dass die Variable mann einen wesentlich stärkeren Einfluss auf das traditionelle Familienbild ausübt als das Einkommen (Vergleich der Beta-Koeffizienten: auch wenn das Einkommen hoch ist, wird das Produkt nicht so groß wie der Mann-Bonus). Beide Variablen leisten jedoch wie gesagt - einen signifikanten Einfluss für das gesamte Vorhersagemodell. Das Einkommen leistet einen negativen Einfluss: Je höher das Einkommen, desto geringer das traditionelle Familienbild. Die Eigenschaft Mann hat positiven Einfluss: Männer erreichen beim geschätzten traditionellen Familienbild höhere Werte als Frauen. Ad Führen Sie eine graphische Analyse der Residuen durch, indem Sie zumindest drei Scatterplots erstellen: Auf der y-achse tragen Sie die standardisierten Residuen, auf der x- Achse die Variablen, von denen Sie glauben, dass sie einen weiteren Erklärungsbeitrag liefern können, auf. Welche der graphisch analysierten Variablen könnten Ihrer Meinung nach zur Verbesserung des Regressionsmodells beitragen? Warum? Erste Variable: alter03: Kein Einfluss nur 1,4% der Varianz der Residuen wird erklärt. 20

21 4 2 Geschlecht männlich weiblich Fit line for Total Fit line for männlich Fit line for weiblich Standardized Residual 0-2 R Sq Linear = 6,694E-4 R Sq Linear = 0,032-4 R Sq Linear = 0, Alter des Befragten Cases weighted by Gewichtungsfaktor Zweite Variable: g106: Hausarbeitszeit: kein Einfluss: 1,5% der Varianz der Residuen wird erklärt. 4 3 Geschlecht männlich weiblich Fit line for Total Fit line for männlich Fit line for weiblich Standardized Residual R Sq Linear = 0,062 R Sq Linear = 0,004-2 R Sq Linear = 0, Hausarbeitszeit pro Woche in Stunden Cases weighted by Gewichtungsfaktor 40 Auf der Suche nach weiteren Variablen wird man nicht wirklich fündig, ich habe dann Variable e84 Kontrolle im Leben (Skala 1 (überhaupt keine Freiheit) bis 10 (sehr große Freiheit)) ausprobiert, und einen deutlichen Einfluss auf die Residuen messen können: 21

22 Dritte Variable: e84: Kontrolle im Leben: 15% der Varianz der Residuen wird erklärt (= Korrelation mit den Residuen: 0,38). 4 Geschlecht männlich weiblich Fit line for Total Fit line for männlich 2 Fit line for weiblich Standardized Residual 0 Nur für die Männer gilt dieser -2 R Sq Linear = 0,008 Zusammenhang. R Sq Linear = 0,364-4 R Sq Linear = 0, Kontrolle im Leben Cases weighted by Gewichtungsfaktor 22

23 Beispiel 29 Berechnen Sie eine Regressionsanalyse analog dem vorigen Beispiel, in der Sie die von Ihnen ausgewählte/gebildete Variable zusätzlich zu den in Beispiel 26 bereits einbezogenen hinzuziehen. Wählen Sie diesmal die Methode Schrittweise. Welche Variablen werden in das Regressionsmodell aufgenommen, welche nicht? Hat sich durch Ihre Variable das Regressionsmodell verbessert? Die Variable e84 Kontrolle im Leben zeigte einen deutlichen Einfluss auf die Residuen der vorigen Regressionsanalyse, weshalb diese Variable nun in ein weiteres Modell mit schrittweiser Methode aufgenommen wird. Model Variables Entered/Removed a Variables Entered Method mann Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). e84 Kontrolle im Leben Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). eink2003 Persönliches Netto-Einkommen a. Dependent Variable: famtrad Traditionelles Familienbild Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). Model Model Summary d Adjusted Std. Error of the R R Square R Square Estimate,572 a,328,316 11,79556,645 b,417,395 11,08704,695 c,483,454 10,53559 a. Predictors: (Constant), mann b. Predictors: (Constant), mann, e84 Kontrolle im Leben c. Predictors: (Constant), mann, e84 Kontrolle im Leben, eink2003 Persönliches Netto-Einkommen d. Dependent Variable: famtrad Traditionelles Familienbild 23

24 Model Regression Residual Total Regression Residual Total Regression Residual Total ANOVA d Sum of Squares df Mean Square F Sig. 3793, ,303 27,263,000 a 7787, , , , ,844 19,621,000 b 6757, , , , ,388 16,787,000 c 5990, , , a. Predictors: (Constant), mann b. Predictors: (Constant), mann, e84 Kontrolle im Leben c. Predictors: (Constant), mann, e84 Kontrolle im Leben, eink2003 Persönliches Netto-Einkommen d. Dependent Variable: famtrad Traditionelles Familienbild Model (Constant) mann (Constant) mann e84 Kontrolle im Leben (Constant) mann e84 Kontrolle im Leben eink2003 Persönliches Netto-Einkommen Coefficients a a. Dependent Variable: famtrad Traditionelles Familienbild Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. 25,089 2,367 10,6,000 16,346 3,131,572 5,221,000,656 8,727,075,940 18,510 3,036,648 6,097,000 2,994 1,034,308 2,895,005 8,927 8,870 1,006,319 20,934 3,029,733 6,912,000 3,107,983,319 3,159,003 -,006,002 -,270-2,63,011 Model 1 2 eink2003 Persönliches Netto-Einkommen e84 Kontrolle im Leben eink2003 Persönliches Netto-Einkommen a. Predictors in the Model: (Constant), mann Excluded Variables c b. Predictors in the Model: (Constant), mann, e84 Kontrolle im Leben c. Dependent Variable: famtrad Traditionelles Familienbild Collinearity Partial Statistics Beta In t Sig. Correlation Tolerance -,256 a -2,310,025 -,297,908,308 a 2,895,005,364,939 -,270 b -2,628,011 -,337,906 Alle gewählten Variablen, darunter auch die Variable e84 Kontrolle im Leben, werden in das Modell aufgenommen. Den stärksten Einfluss hat die Variable mann (Vergleich Beta- Koeffizienten und Signifikanzen der Koeffizienten) und wird als erstes ins Modell aufgenommen. Männliches Geschlecht bewirkt einen höheren Schätzwert beim traditionellen Familienbild. Im zweiten Schritt wird die Variable e84 Kontrolle im Leben ins Modell 24

25 aufgenommen (die Korrelation mit den Residuen beträgt laut Tabelle Ausgeschlossene Variablen 0,36). Inhaltlich bedeutet dies: Je mehr Freiheit jemand genießt, desto höher das vorhergesagte traditionelle Familienbild (Dies gilt aber eben bei genauerer Betrachtungsweise nur für die Männer). Und schließlich wird im dritten Schritt auch noch das Einkommen, mit dem geringsten, aber signifikanten negativen Einfluss ins Modell aufgenommen. Das erreicht insgesamt 48% an erklärter Gesamtvarianz des traditionellen Familienbildes bei den BeamtInnen. Allerdings wird auch deutlich, dass die Konstante ab dem zweiten Schritt nicht mehr signifikant ist (Koeffiziententabelle), weshalb sie in der Schätzfunktion nicht verwendet werden dürfte. Die Residuen sind nach dieser Analyse bereits annähernd normalverteilt, was aus dem Histogramm ersichtlich wird. Histogram Dependent Variable: Traditionelles Familienbild Frequency Mean = 2,01E-16 Std. Dev. = 0,973 N = 58 Regression Standardized Residual Cases weighted by Gewichtungsfaktor 25