Statistikübungen für die Pflegewissenschaften II Beispiellösungen

Ähnliche Dokumente
Statistische Auswertung:

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Angewandte Statistik 3. Semester

Hypothesentests mit SPSS. Beispiel für einen t-test

Einfache statistische Auswertungen mit dem Programm SPSS

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Statistik II Übung 2: Multivariate lineare Regression

VS PLUS

Korrelation - Regression. Berghold, IMI

Kapitel 4: Merkmalszusammenhänge

Kapitel 5: Einfaktorielle Varianzanalyse

Tutorial: Rangkorrelation

Standardab er des. Testwert = % Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere

Statistik. Jan Müller

Chi-Quadrat Verfahren

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Log-lineare Analyse I

Tutorial: Regression Output von R

Jost Reinecke. 7. Juni 2005

Inferenzstatistik Vergleich mehrerer Stichproben - Varianzanalyse

Übungen zur Veranstaltung Statistik 2 mit SPSS

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Teil II: Einführung in die Statistik

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

Anhang A: Fragebögen und sonstige Unterlagen

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Überblick über die Verfahren für Ordinaldaten

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

SPSS III Mittelwerte vergleichen

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav.

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Fortgeschrittene Statistik Logistische Regression

Lineare Modelle in R: Einweg-Varianzanalyse

Kapitel 4: Merkmalszusammenhänge

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

Kommentierter SPSS-Ausdruck zur logistischen Regression

Lage- und Streuungsparameter

Willkommen zur Vorlesung Statistik (Master)

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

2. Korrelation, lineare Regression und multiple Regression

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Test auf Varianzgleichheit (F-Test) (einseitiger Test!!)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Beurteilende Statistik

Lösungen zum SPSS-Buch zweiter Teil Einführung in das quantitativ orientierte Forschen

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops

Bivariate Kreuztabellen

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

Datenanalyse mit Excel. Wintersemester 2013/14

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende

Webergänzung zu Kapitel 10

8. Konfidenzintervalle und Hypothesentests

Auswertung mit dem Statistikprogramm SPSS:

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Datenanalyse mit Excel und Gretl

Varianzanalyse ANOVA

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab.

Varianzanalyse * (1) Varianzanalyse (2)

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester Juli 2005

Inhaltsverzeichnis. Regressionsanalyse. - Stand vom:

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Analytische Statistik II

Transkript:

Statistikübungen für die Pflegewissenschaften II Beispiellösungen INHALTSVERZEICHNIS BEISPIEL 18...2 BEISPIEL 19...5 BEISPIEL 20...6 BEISPIEL 21...8 BEISPIEL 23...9 BEISPIEL 25...13 BEISPIEL 26...15 BEISPIEL 28...18 BEISPIEL 29...23 (autorisiert durch Reinhard Raml und Doris Gretzl) Enrica Denk Nedeljko Radojicic Christine Schuster Sarah Zaussinger

Beispiel 18 Überprüfen Sie die Hypothese, ob auch der Alkoholkonsum mit der sozialen Akzeptanz zusammenhängt. Wählen Sie die Altersgruppe der 15-Jährigen aus. Erstellen Sie eine Kreuztabelle aus den Variablen alk_rec (Alkoholkonsum) und f13_rec ("meine MitschülerInnen akzeptieren mich"). Geben sie die unabhängige Variable in die Zeilen und die abhängige Variable in die Spalten. Wählen Sie die Zeilenprozentwerte und berechnen Sie auch den Chi-Quadrat-Test. 18.1 Besteht ein signifikanter Zusammenhang? Interpretieren Sie kurz die wichtigsten Ergebnisse aus den Prozentwerten. 18.2 Erstellen Sie nun weitere Tabellen indem Sie die Kontrollvariable Geschlecht einsetzen. Welcher Fragestellung wird hier nachgegangen? Besteht ein Geschlechtsunterschied? Wenn ja, inwiefern? F13_REC Student * ALK_REC Alkoholkonsum höchstens Kreuztabelle F13_REC Student Gesamt 1 Always/Often 2 Sometimes 3 Rarely/Never Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student ALK_REC Alkoholkonsum höchstens 0 kein 1 nur 2 jeden 3 Alkohol seltener Monat wöchentl./tägl. Gesamt 1140 1529 566 783 4018 28,4% 38,1% 14,1% 19,5% 100,0% -1,0 -,1,7,8 236 308 105 134 783 30,1% 39,3% 13,4% 17,1% 100,0%,5,6 -,2-1,2 166 174 52 83 475 34,9% 36,6% 10,9% 17,5% 100,0% 2,3 -,5-1,6 -,7 1542 2011 723 1000 5276 29,2% 38,1% 13,7% 19,0% 100,0% Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat-Tests Wert 12,794 a 6,046 12,736 6,047 8,977 1,003 5276 df Asymptotisch e Signifikanz (2-seitig) a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 65,09. 2

Ad 18.1.: Besteht ein signifikanter Zusammenhang? Interpretieren Sie kurz die wichtigsten Ergebnisse aus den Prozentwerten. UV / AV nicht eindeutig Begründen Sie Ihre Entscheidung bzw. überlegen Sie sich Wirkungsmöglichkeiten in beide Richtungen. Der Zusammenhang ist signifikant (Irrtumswahrscheinlichkeit ist 4,6 %), jedoch scheint die Stärke des Zusammenhangs sehr gering (std. Residuen); Ergebnis sollte kritisch betrachtet werden; Die Voraussetzung für den Chi-2-Test ist erfüllt In keinen Zellen beträgt die erwartete Häufigkeit weniger als 5. Die Unterschiede in den Prozentwerten sind eher gering, es lässt sich jedoch folgende Tendenz erkennen: Je seltener MitschülerInnen von anderen akzeptiert werden, desto häufiger geben sie an, keinen Alkohol zu konsumieren. Widerspricht das Ihrer Intuition? Hätten wir angenommen, dass weniger Akzeptierte häufiger zum Alkohol greifen? Oder: Je stärker sie akzeptiert werden, desto öfter wird gemeinsam getrunken bzw. hängt die Akzeptanz davon an, dass man mittrinkt (Gruppendruck denken Sie ans Rauchen!). H1 wird angenommen (Es besteht ein signifikanter Zusammenhang zwischen dem Alkoholkonsum und der Akzeptanz unter MitschülerInnen in der Grundgesamtheit.) Der Zusammenhang ist schwach überprüfen Sie das auch mit geeigneten Zusammenhangsmaßen. Sie können jene Maße für Ordinalskalen nehmen, da beide Variablen ordinal sind (Achtung: Pearson-R) ist nicht zu interpretieren! Sowohl Gamma als auch Spearmann weisen auf einen äußerst geringen Zusammenhang hin. Gesamtbewertung: Kreuztabelle kaum signifikante Über-/Unterbesetzungen der Zellen (Verteilung vergleichen mit Randverteilung, standardisierte Residuen), Chi-2 knapp signifikant, Zusammenhangsmaße sehr niedrig. Fazit: De facto kein relevanter Zusammenhang, wenngleich knapp signifikant (Schluss auf die Grundgesamtheit). Ordinal- bzgl. Ordinalmaß Intervall- bzgl. Anzahl der gültigen Fälle Gamma Korrelation nach Spearman Pearson-R a. Die Null-Hyphothese wird nicht angenommen. Symmetrische Maße Asymptoti scher Näherung Standardf Näherung sweise Wert ehler a sweises T b Signifikanz -,071,024-3,027,002 -,042,014-3,035,002 c -,041,014-2,998,003 c 5276 b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. c. Basierend auf normaler Näherung 3

Ad 18.2.: Erstellen Sie nun weitere Tabellen indem Sie die Kontrollvariable Geschlecht einsetzen. Welcher Fragestellung wird hier nachgegangen? Besteht ein Geschlechtsunterschied? Wenn ja, inwiefern? F13_REC Student * ALK_REC Alkoholkonsum höchstens * C1 Sex Kreuztabelle C1 Sex 1 Boy 2 Girl F13_REC Student Gesamt F13_REC Student Gesamt 1 Always/Often 2 Sometimes 3 Rarely/Never 1 Always/Often 2 Sometimes 3 Rarely/Never Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student ALK_REC Alkoholkonsum höchstens 0 kein 1 nur 2 jeden 3 Alkohol seltener Monat wöchentl./tägl. Gesamt 508 725 351 561 2145 23,7% 33,8% 16,4% 26,2% 100,0% -1,4 -,2,9,8 111 134 52 90 387 28,7% 34,6% 13,4% 23,3% 100,0% 1,4,2-1,1 -,8 82 89 31 52 254 32,3% 35,0% 12,2% 20,5% 100,0% 2,3,3-1,4-1,5 701 948 434 703 2786 25,2% 34,0% 15,6% 25,2% 100,0% 632 804 215 222 1873 33,7% 42,9% 11,5% 11,9% 100,0%,0,2 -,2 -,1 125 174 53 44 396 31,6% 43,9% 13,4% 11,1% 100,0% -,8,4 1,0 -,5 84 85 21 31 221 38,0% 38,5% 9,5% 14,0% 100,0% 1,1-1,0 -,9,9 841 1063 289 297 2490 33,8% 42,7% 11,6% 11,9% 100,0% C1 Sex 1 Boy 2 Girl Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat-Tests Wert 16,486 a 6,011 16,374 6,012 13,837 1,000 2786 5,835 b 6,442 5,799 6,446,000 1,996 2490 df Asymptotisch e Signifikanz (2-seitig) a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 39,57. b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 25,65. Hierbei wird der Frage nachgegangen, ob der signifikante Zusammenhang zwischen dem Alkoholkonsum und der Akzeptanz der MitschülerInnen unabhängig vom Geschlecht der Befragten besteht. Bei Mädchen ist der Zusammenhang nicht signifikant, d.h. das der Alkoholkonsum nicht von der Akzeptanz der MitschülerInnen abhängt. Bei den Buben ist er signifikant, bleibt aber schwach, wenngleich Tendenzen schon klarer erkennbar. 4

Beispiel 19 (Datensatz hbsc-94-uebung.sav) Testen Sie mittels t-test, ob sich das Taschengeld (c11) nach Geschlecht signifikant unterscheidet. Formulieren Sie die Nullhypothese und die Alternativhypothese. Markieren Sie die relevanten Test-Signifikanzen. Zu welcher Entscheidung kommen Sie aufgrund der Testergebnisse. Was bedeutet das Ergebnis inhaltlich? Nullhypothese: Es besteht kein Unterschied zwischen der durchschnittlichen Höhe des Taschengeldes bei Buben und Mädchen. Alternativhypothese: Die durchschnittliche Höhe des Taschengeldes bei Buben und Mädchen unterscheidet sich. Gruppenstatistiken C11 Pocket money C1 Sex 1 Boy 2 Girl Standardfe Standardab hler des N Mittelwert weichung Mittelwertes 2688 145,42 187,741 3,621 2373 114,07 145,723 2,991 Test bei unabhängigen Stichproben C11 Pocket money Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit F Signifikanz T df Sig. (2-seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz 95% Konfidenzintervall Standardfehle der Differenz r der Differenz Untere Obere 60,6,000 6,572 5059,000 31,35 4,770 21,996 40,698 6,674 4979,042,000 31,35 4,697 22,139 40,555 Überlegen: Gerichtete / Ungerichtete Hypothesen formulieren?! Oben angeführte Hypothesen sind ungerichtet. Wenn diese signifikant sind, dann sind es auch die gerichteten. Buben erhalten signifikant mehr Taschengeld, nämlich durchschnittlich 145.-. Mädchen erhalten signifikant weniger Taschengeld, nämlich durchschnittlich 114.-, das sind um rund 30.- weniger. Der t-test untersucht, ob sich die beiden Mittelwerte der Höhe des Taschengeldes signifikant unterscheiden. Ist dies der Fall, so darf angenommen werden, dass dieses Ergebnis aus der Stichprobe mit sehr großer Wahrscheinlichkeit auch in der Grundgesamtheit zutrifft (alle österreichischen SchülerInnen zwischen 11 und 15 Jahren). Sollte tatsächlich (heißt: in der GG) die H0 gelten, so irren wir uns bei unserer Entscheidung, die H0 zu verwerfen, mit einer Wahrscheinlichkeit von nahezu (!!) 0 Prozent. Niemals: 0 % - das wäre ein sicheres Ereignis und das gibt es beim Hypothesentesten nicht. 5

Beispiel 20 (Datensatz hbsc-94-uebung.sav) Untersuchen Sie, ob sich der Zigarettenkonsum signifikant nach Alter und Geschlecht unterscheidet. Teilen Sie den Datensatz nach Altersgruppen auf, und vergleichen Sie die Variable c14 (Anzahl der Zigaretten in der Woche) nach Geschlecht. Ringeln Sie die für die Testung zu interpretierenden Signifikanzen ein. In welcher Altersgruppe besteht ein signifikanter Geschlechtsunterschied und in welcher nicht? Interpretieren Sie das Ergebnis unter Berücksichtigung der Mittelwerte pro Altersgruppe. Gruppenstatistiken AGE_GRP Altersgruppen 1 11jährige (bis 11,9) 2 13jährige (12 bis 13.9) 3 15jährige (ab 14) C14 No. of cigarettes per week C14 No. of cigarettes per week C14 No. of cigarettes per week C1 Sex 1 Boy 2 Girl 1 Boy 2 Girl 1 Boy 2 Girl Standardfe Standardab hler des N Mittelwert weichung Mittelwertes 728,19 1,306,048 810,03,463,016 858 1,90 21,513,734 923 1,54 11,282,371 1186 13,79 31,682,920 728 12,37 28,354 1,051 Test bei unabhängigen Stichproben AGE_GRP Altersgruppe n 1 11jährige (bis 11,9) 2 13jährige (12 bis 13.9) 3 15jährige (ab 14) C14 No. of cigarettes per week C14 No. of cigarettes per week C14 No. of cigarettes per week Varianzen sind gleich Varianzen sind nicht gleich Varianzen sind gleich Varianzen sind nicht gleich Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit F Signifikanz T df Sig. (2-seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz 95% Konfidenzintervall Standardfehle der Differenz r der Differenz Untere Obere 36,15,000 3,130 1536,002,15,049,057,249 3,003 890,075,003,15,051,053,254,551,458,448 1779,654,36,806-1,220 1,942,439 1273,84,661,36,823-1,253 1,976 3,320,069,989 1912,323 1,42 1,434-1,394 4,231 1,016 1667,47,310 1,42 1,397-1,321 4,158 Hypothesen aufstellen nicht vergessen! Ein signifikanter Geschlechtsunterschied in der durchschnittlichen Anzahl der konsumierten Zigaretten pro Woche besteht lediglich bei den 11-Jährigen. Dieser Unterschied ist zwar signifikant, jedoch praktisch kaum bedeutsam, da er sich lediglich auf 0,1 Zigaretten pro Woche beläuft (11-Jährige Buben rauchen durchschnittlich 0,2 Zigaretten pro Woche (rund 1 Zigarette im Monat), 11-Jährige Mädchen fast keine). Sind die Mittelwerte eigentlich aussagekräftig? Nein! Warum nicht? (Verteilung!). Die Signifikanz begründet sich auf einen größeren Anteil an gelegentlichen Rauchern bei den Buben in dieser Altersgruppe, der in etwa 6 Prozentpunkte höher liegt als bei den Mädchen was durchaus nicht unwesentlich ist. Buben sind also schon früher anfällig für das Rauchen. In den Altersgruppen ab 13 Jahren besteht kein signifikanter Unterschied mehr zwischen Mädchen und Buben im durchschnittlichen Zigarettenkonsum. Die 13-Jährigen konsumieren durchschnittlich knapp 2 Zigaretten in der Woche, die 15- Jährigen konsumieren durchschnittlich rund 12-14 Zigaretten in der Woche, das sind 6

immerhin bereits 2 Zigaretten am Tag. Voraussetzung für den t-test: NV des Zigarettenkonsums! Ist nicht gegeben. Merkmal ist linkssteil verteilt, Mittelwerte und Standardabweichungen sind kaum aussagekräftig. Man könnte die Nichtraucher selektieren (diese Frage eigens untersuchen) und die Menge gerauchter Zigaretten bei den Rauchern der jeweiligen Altersgruppen vergleichen; NV- Verteilung müsste wieder überprüft werden. Besser ist es, einen U-Test durchzuführen, der übrigens zu denselben Signifikanzaussagen führt. Überprüfen Sie es selbst. Die Irrtumswahrscheinlichkeiten sind: de facto 0 %, 10,6 % und 49,3 % (aufsteigende Altersgruppen). 7

Beispiel 21 (Datensatz hbsc-94-uebung.sav) Suchen Sie aus dem Datensatz eine ordinal-skalierte Variable heraus, von der Sie annehmen, dass sich deren Verteilungen signifikant nach Geschlecht unterscheiden. Testen Sie mittels U-Test, ob Ihre Vermutung zutrifft oder nicht. Formulieren Sie die Hypothesen und interpretieren Sie das Ergebnis. Hat sich Ihre Vermutung bestätigt? Was für eine Erklärung haben Sie dafür? Es ist ein U-Test erforderlich; Als Variable haben wir uns für Sports time per week entschieden. Ranks C21 Sports - times per week C1 Sex 1 Boy 2 Girl Total N Mean Rank Sum of Ranks 2834 2380,11 6745232,00 2501 2994,22 7488548,00 5335 Mann-Whitney U Wilcoxon W Z Test Statistics a Asymp. Sig. (2-tailed) C21 Sports - times per week 2728037,000 6745232,000 a. Grouping Variable: C1 Sex -15,149,000 H0: Es besteht kein Unterschied in der Häufigkeit der sportlichen Betätigung zwischen Mädchen und Buben in der Grundgesamtheit. H1: Es besteht ein Unterschied in der Häufigkeit der sportlichen Betätigung zwischen Mädchen und Buben in der Grundgesamtheit. Die Vermutung, dass Buben angeben mehr Sport zu betreiben als Mädchen kann bestätigt werden, da der Test zeigt, dass der Unterschied signifikant ist (die Rangsumme bei Buben ist niedriger; auf Kodierung achten!!). Die Erklärung hierfür findet sich vielleicht in der unterschiedlichen Sozialisation Buben werden häufiger zum Sport animiert als Mädchen. 8

Beispiel 23 (Datensatz hbsc-94-uebung.sav) In Beispiel 21 haben Sie untersucht, ob sich das Taschengeld signifikant nach Geschlecht unterscheidet. Schauen Sie nun getrennt für Burschen und Mädchen weiter, ob sich das Taschengeld (C11) zwischen den verschiedenen Schichten (scht) unterscheidet. Wo gibt es Unterschiede, wo nicht. Überrascht Sie das Ergebnis? Was für Gründe fallen Ihnen zur Erklärung ein und wie würden Sie diese in einer eigenen Umfrage untersuchen? Descriptives c11 Pocket money c1 Sex 1 Boy 2 Girl 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht Total 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht Total 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 680 137,35 172,090 6,599 124,39 150,31 0 999 963 145,04 186,615 6,014 133,24 156,85 0 999 774 136,86 186,494 6,703 123,70 150,02 0 999 261 190,78 220,536 13,651 163,90 217,66 0 999 2678 145,18 187,166 3,617 138,09 152,27 0 999 570 114,83 146,275 6,127 102,79 126,86 0 999 834 113,68 150,291 5,204 103,46 123,89 0 999 713 110,07 136,540 5,113 100,03 120,11 0 999 249 124,30 154,149 9,769 105,06 143,54 0 999 2366 113,99 145,684 2,995 108,11 119,86 0 999 Test of Homogeneity of Variances c11 Pocket money c1 Sex 1 Boy 2 Girl Levene Statistic df1 df2 Sig. 6,716 3 2674,000,407 3 2362,748 ANOVA c11 Pocket money c1 Sex 1 Boy 2 Girl Between Groups Within Groups Total Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 637957,517 3 212652,506 6,105,000 93140735,557 2674 34831,988 93778693,074 2677 37894,499 3 12631,500,595,618 50156693,012 2362 21234,840 50194587,511 2365 9

Multiple Comparisons Dependent Variable: c11 Pocket money Bonferroni c1 Sex 1 Boy 2 Girl (I) scht Schichtindex 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht (J) scht Schichtindex 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -7,693 9,348 1,000-32,38 16,99,494 9,809 1,000-25,41 26,39-53,426* 13,590,001-89,31-17,55 7,693 9,348 1,000-16,99 32,38 8,187 9,010 1,000-15,60 31,97-45,733* 13,024,003-80,12-11,35 -,494 9,809 1,000-26,39 25,41-8,187 9,010 1,000-31,97 15,60-53,920* 13,359,000-89,19-18,65 53,426* 13,590,001 17,55 89,31 45,733* 13,024,003 11,35 80,12 53,920* 13,359,000 18,65 89,19 1,150 7,919 1,000-19,76 22,06 4,753 8,188 1,000-16,87 26,37-9,475 11,070 1,000-38,70 19,75-1,150 7,919 1,000-22,06 19,76 3,603 7,433 1,000-16,02 23,23-10,625 10,523 1,000-38,41 17,16-4,753 8,188 1,000-26,37 16,87-3,603 7,433 1,000-23,23 16,02-14,228 10,727 1,000-42,55 14,10 9,475 11,070 1,000-19,75 38,70 10,625 10,523 1,000-17,16 38,41 14,228 10,727 1,000-14,10 42,55 Schritt 1: Mittelwerte betrachten: das durchschnittlichen Taschengeld steigt anscheinend nicht stetig mit einer höheren subjektiven Statuszuordnung. Untere Mittelschicht bekommt mehr als obere Mittelschicht woran könnte das liegen? Ist es hier nur zufällig so oder besteht ein signifikanter Unterschied? Schritt 2: Test auf Homogenität der Varianzen: Voraussetzung für die Varianzanalyse ist, dass die Varianzen homogen/ gleich sind. H 0 : Die Varianzen sind gleich H 1 : Die Varianzen unterscheiden sich. Bei den Buben ist das Ergebnis signifikant, also gilt H 1, deswegen sollte die ANOVA und der Bonferroni-Test nicht interpretiert bzw. nur unter Vorbehalt interpretiert werden. Das ist insofern auch wichtig, als gerade bei den Buben die ANOVA ein signifikantes Ergebnis ausweist (mit Kruskal-Wallis absichern! siehe unten). Bei den Mädchen ist das Ergebnis nicht signifikant, also wird H 0 beibehalten, die ANOVA darf interpretiert werden. Schritt 3: ANOVA für die Mädchen wird interpretiert: H 0 : Es gibt keine Unterschiede beim durchschnittlichen Taschengeld der 10

verschiedenen Schichten H 1 : Es gibt Unterschiede beim durchschnittlichen Taschengeld der verschiedenen Schichten Die ANOVA ist bei den Mädchen nicht signifikant, es bleibt also bei der Annahme der H 0. Die Post-hoc-Tests spielen bei den Mädchen also keine Rolle mehr. Wenn bei diesen eine signifikante Abweichungen zwischen 2 Gruppen auftauchen würde, ist diese nicht aussagekräftig. Warum ist das Ergebnis bei den Mädchen nicht signifikant? Welche Variabel hat vielleicht eher einen Einfluss auf das Taschengeld? Schritt 4: Da wir bei den Buben die ANOVA nicht interpretieren dürfen, führen wir einen nichtparametrischen Test für mehrere unabhängige Stichproben durch (Kruskal-Wallis-Test), da dieser nicht voraussetzt, dass die Varianzen gleich sind. Weiters lassen wir uns bei der Varianzanalyse bei den Post-Hoc-Tests statt dem Bonferroni-Test einen Test ausgeben, wo keine Varianzgleichheit vorausgesetzt wird, nämlich den Tamhane-T2-Test. Die U-Test bei beiden Geschlechtern gelangen zu demselben Ergebnis wie die einfaktorielle ANOVA. Diese ist i.a. robust gegenüber Verletzungen der Homogenitäts-Voraussetzung. Ränge Sex Schichtindex N Mittlerer Rang Boy Pocket money Unterschicht 680 1316,44 unt.mittelsch. 963 1341,15 obere Mittelsch. 774 1285,04 Oberschicht 261 1554,96 Gesamt 2678 Girl Pocket money Unterschicht 570 1193,28 unt.mittelsch. 834 1164,16 obere Mittelsch. 713 1166,20 Oberschicht 249 1275,44 Gesamt 2366 Sex Boy Girl Statistik für Test a,b Chi-Quadrat df Asymptotische Signifikanz Chi-Quadrat df Asymptotische Signifikanz Pocket money 25,038 3,000 5,831 3,120 a. Kruskal-Wallis-Test b. Gruppenvariable: Schichtindex Schritt 5: Interpretation des Kruskal-Walis-Tests: H 0 : Es gibt keine Unterschiede beim durchschnittlichen Taschengeld der 11

verschiedenen Schichten H 1 : Es gibt Unterschiede beim durchschnittlichen Taschengeld der verschiedenen Schichten Das Ergebnis für die Buben ist signifikant, es darf die H 1 angenommen werden. Wir können uns nun das Ergebnis vom Mehrfachvergleich anschauen: es gibt nur signifikante Unterschiede beim Taschengeld, von den Buben, die sich der Oberschicht zurechnen mit den drei anderen Schichten (Unterschicht, untere Mittelschicht, obere Mittelschicht). Wieso bekommt diese Gruppe soviel mehr Taschengeld als alle anderen? Wieso ist dieser Unterschied nicht auch bei den Mädchen erkennbar? Was könnten mögliche Gründe sein? Abhängige Variable: Pocket money Tamhane Mehrfachvergleiche Sex Boy Girl (I) Schichtindex Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht (J) Schichtindex Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht *. Die mittlere Differenz ist auf der Stufe.05 signifikant. 95%-Konfidenzintervall Mittlere Differenz (I-J) Standardfehler Signifikanz Untergrenze Obergrenze -7,69 8,928,948-31,21 15,83,49 9,407 1,000-24,29 25,28-53,43* 15,162,003-93,52-13,33 7,69 8,928,948-15,83 31,21 8,19 9,005,933-15,54 31,91-45,73* 14,917,014-85,19-6,27 -,49 9,407 1,000-25,28 24,29-8,19 9,005,933-31,91 15,54-53,92* 15,208,003-94,14-13,70 53,43* 15,162,003 13,33 93,52 45,73* 14,917,014 6,27 85,19 53,92* 15,208,003 13,70 94,14 1,15 8,039 1,000-20,03 22,33 4,75 7,980,992-16,28 25,79-9,47 11,531,959-39,95 21,00-1,15 8,039 1,000-22,33 20,03 3,60 7,296,997-15,62 22,82-10,62 11,069,916-39,89 18,64-4,75 7,980,992-25,79 16,28-3,60 7,296,997-22,82 15,62-14,23 11,026,733-43,39 14,93 9,47 11,531,959-21,00 39,95 10,62 11,069,916-18,64 39,89 14,23 11,026,733-14,93 43,39 12

Beispiel 25 (Datensatz hbsc-94-uebung.sav) Untersuchen Sie folgende korrelative Zusammenhänge bei 15- jährigen Schülerinnen: f13 "meine MitschülerInnen akzeptieren mich", f14 "wurde verspottet', f15 "habe verspottet', f23 "Reden mit Vater', f24 "Reden mit Mutter', f39 "Selbstbewusstsein" und f34 "Bewertung des eigenen Aussehens". 25.1 Beschreiben Sie anhand der Stärke der Korrelationen die Einflussfaktoren auf die Akzeptanz durch die Mitschülerinnen. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"- Thematik! 25.2 Beschreiben Sie an hand der Stärke der Korrelationen die Einflussfaktoren auf das Selbstbewusstsein. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation- Kausalitäts"-Thematik! 25.3 Zeigt das Reden-Können mit Vater bzw. Mutter unterschiedlich starke Auswirkungen, wenn ja, inwiefern? 25.4 Welche weitere Variable könnte einen Zusammenhang mit dem Selbstbewusstsein aufweisen? Überprüfen Sie Ihre Vermutung anhand einer bivariaten Korrelation. Besteht ein Zusammenhang? Wenn ja, wie stark ist er und wie ist er zu interpretieren? F13 Student rel: accept me F14 Been bullied F15 Have bullied F23 Easy to talk to father F24 Easy to talk to mother F39 Feel confident F34 Think about look Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N **. Die Korrelation ist auf dem 0,01 Niveau signifikant (zweiseitig). *. Die Korrelation ist auf dem 0,05 Niveau signifikant (zweiseitig). Korrelationen F13 Student F14 Been F15 Have F23 Easy to F24 Easy to F39 Feel F34 Think bullied bullied talk to father talk to mother confident about look 1,000,315** -,007,121**,089**,230**,249**.,000,747,000,000,000,000 1953 1939 1941 1812 1888 1945 1782,315** 1,000,200**,070**,046*,142**,119**,000.,000,003,048,000,000 1939 1959 1953 1815 1889 1947 1791 -,007,200** 1,000 -,002,039 -,085** -,075**,747,000.,928,093,000,001 1941 1953 1961 1817 1891 1948 1791,121**,070** -,002 1,000,461**,226**,169**,000,003,928.,000,000,000 1812 1815 1817 1830 1801 1818 1675,089**,046*,039,461** 1,000,154**,133**,000,048,093,000.,000,000 1888 1889 1891 1801 1905 1892 1743,230**,142** -,085**,226**,154** 1,000,298**,000,000,000,000,000.,000 1945 1947 1948 1818 1892 1961 1791,249**,119** -,075**,169**,133**,298** 1,000,000,000,001,000,000,000. 1782 1791 1791 1675 1743 1791 1804 Ad 25.1.: Beschreiben Sie anhand der Stärke der Korrelationen die Einflussfaktoren auf die Akzeptanz durch die Mitschülerinnen. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"- Thematik! Verspottet zu werden korreliert am stärksten mit der Akzeptanz durch die MitschülerInnen (0,315). Im Gegensatz dazu gehen das Verspotten und das Akzeptiert-werden nicht Hand in Hand. (nicht signifikante Korrelation von -0,007). 13

Selbstbewusstsein und die Bewertung des eigenen Aussehens zeigen mittlere Zusammenhänge mit der Akzeptanz durch die MitschülerInnen (0,249 und 0,230). Das Reden mit Vater bzw. Mutter hängt weniger zusammen mit der Akzeptanz. Ad 25.2.: Beschreiben Sie an hand der Stärke der Korrelationen die Einflussfaktoren auf das Selbstbewusstsein. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"-Thematik! Das Selbstbewusstsein korreliert am stärksten mit der Bewertung des eigenen Aussehens (0,298). Weiters zeigen auch die Beziehung zum Vater (0,226) sowie die Akzeptanz durch die MitschülerInnen (0,230) mittlere Zusammenhänge mit dem Selbstbewusstsein. Verspottet werden (0,142) oder haben ((-0,085) sowie die Beziehung zur Mutter (0,154) zeigen wiederum die geringsten Zusammenhänge mit dem Selbstbewusstsein. Ad 25.3.: Zeigt das Reden-Können mit Vater bzw. Mutter unterschiedlich starke Auswirkungen, wenn ja, inwiefern? Grundsätzlich ist feststellbar, dass das Reden mit dem Vater stärke Korrelationen mit den ausgewählten Variablen aufweist als das Reden mit der Mutter. Besonders deutlich wird dies beim Selbstbewußtsein. Es ist zu vermuten, dass auch bei der Akzeptanz durch die MitschülerInnen hier die männlichen Schulkollegen mehr soziale Definitinsmacht ausüben können. Bei einer weiteren Befragung könnte hier zwischen der Akeptanz von männlichen und weiblichen MitschülerInnen differenziert werden. Ad 25.4.: Welche weitere Variable könnte einen Zusammenhang mit dem Selbstbewusstsein aufweisen? Überprüfen Sie Ihre Vermutung anhand einer bivariaten Korrelation. Besteht ein Zusammenhang? Wenn ja, wie stark ist er und wie ist er zu interpretieren? Correlations Spearman's rho F37 Easy to make friends F39 Feel confident Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). F37 Easy to F39 Feel make friends confident 1,000,272**.,000 5283 5245,272** 1,000,000. 5245 5304 Es besteht eine mittelstarke positive Korrelation (0,272). D.h. je selbstbewusster jemand ist, desto leichter findet sie/er Freunde und umgekehrt (kausaler Zusammenhangs nicht ersichtlich) 14

Beispiel 26 Selektieren Sie Beamte und Beamtinnen (mithilfe der Variable beruf1) aus der Gesamtstichprobe. Erstellen Sie ein Streudiagramm, das die Beziehung zwischen Einkommen (EINK2003) als unabhängige Variable und dem Traditionellen Familienbild (famtrad) als abhängige Variable für Frauen und Männer darstellt. Legen Sie die entsprechenden Regressionsgeraden in die Grafik und lassen Sie sich das Bestimmtheitsmaß R² anzeigen. 26.1 Inwiefern unterscheidet sich die Regressionsgerade der Beamten von jener der Beamtinnen? Welchen Wert nimmt jeweils das Bestimmtheitsmaß (R²) an und was bedeutet er? 26.2 Welche Personen verzerren möglicherweise den Zusammenhang zwischen dem Einkommen und dem Traditionellen Familienbild bei BeamtInnen? In welcher Weise? Identifizieren Sie die Fälle anhand der Paginiernummer. Entscheiden Sie sich für zwei Ausreißer, deren Ausschluss einen Zuwachs an Erklärungsbeitrag für das Traditionelle Familienbild erbringen könnte. Markieren Sie diese auf dem Streudiagramm und begründen Sie deren Ausschluss. Führen Sie die Analyse mit der selektierten Stichprobe noch einmal durch! Haben sich Ihre Ergebnisse in der erwarteten Weise verbessert? Welche Probleme könnten sich ergeben, wenn Sie zu viele Fälle ausschließen (als Extremwerte bezeichnen)? Ad 26.1.: Inwiefern unterscheidet sich die Regressionsgerade der Beamten von jener der Beamtinnen? Welchen Wert nimmt jeweils das Bestimmtheitsmaß (R²) an und was bedeutet er? 100 983 80 1443 Traditionelles Familienbild 60 40 20 0 0 1192 20 699 942 936 227 1772 792 1721331 576 1980 817 1696 1528 1187 793 19 273 1824 11651307 11341827 1333 139 573 1491 902 297 678 1306 495 333 250 1978 1652 1532 1625 1784 72 934 168 1922 47 444 10141573 884 1759 218 217 1076 1052761 1659 353 845 1618 1770 370 1664 1172 123 1000 2000 3000 Geschlecht weiblich R-Qu. = 0,0295 männlich R-Qu. = 0,0335 4000 Persönliches Netto-Einkommen Fälle gewichtet nach GEWICHT 15

Achtung: im aktuellen Datensatz von der HP weist die Variable beruf1 einen Codierungsfehler auf! (Kategorie 3! Sind die Angestellten, net die BeamtInnen) Für Männer und Frauen gilt grundsätzlich: Je höher das Netto-Einkommen, umso geringer ist das traditionelle Familienbild (schwacher negativer Zusammenhang). Beamtinnen: Die Regressionsgerade verläuft fast parallel unter jener der Männer, Geraden gehen nur geringfügig auseinander. Grundsätzlich haben Beamtinnen ein niedrigeres traditionelles Familienbild, keine Beamtin verdient mehr als ca. 2.800,- Euro Beamte: Grundsätzlich ein höheres traditionelles Familienbild sowie einzelne Fälle mit hohem Gehalt. Bestimmtheitsmaß: Bei den Frauen können knapp 3% und bei den Männern 3,4% der Variation (der Varianz, des Zustandekommens o.ä.) des traditionellen Familienbildes durch das Einkommen erklärt werden. Also sehr, sehr wenig!!!!! Ad 26.2.: Welche Personen verzerren möglicherweise den Zusammenhang zwischen dem Einkommen und dem Traditionellen Familienbild bei BeamtInnen? In welcher Weise? Identifizieren Sie die Fälle anhand der Paginiernummer. Entscheiden Sie sich für zwei Ausreißer, deren Ausschluss einen Zuwachs an Erklärungsbeitrag für das Traditionelle Familienbild erbringen könnte. Markieren Sie diese auf dem Streudiagramm und begründen Sie deren Ausschluss. Führen Sie die Analyse mit der selektierten Stichprobe noch einmal durch! Haben sich Ihre Ergebnisse in der erwarteten Weise verbessert? Welche Probleme könnten sich ergeben, wenn Sie zu viele Fälle ausschließen (als Extremwerte bezeichnen)? 70 Traditionelles Familienbild 60 50 40 30 20 10 0 0 1192 699 942 936 227 1772 792 172 1331 576 1980 817 1696 1528 1187 793 19 1824 1165 1333 573 1827 273 1307 1134 139 1491 902 297 678 1306 495 333 250 1978 1652 1532 1625 1784 72 934 168 1922 47 444 10141573 884 1759 218 217 1076 1052761 1659 353 845 1618 1770 370 1664 1172 123 1000 20 2000 3000 Geschlecht weiblich R-Qu. = 0,1678 männlich R-Qu. = 0,0424 4000 Persönliches Netto-Einkommen Fälle gewichtet nach GEWICHT Beispielsweise: 16

Ausschluss von Frau Nr. 983: Sie hat ein untypisch hohes traditionelles Familienbild und zieht die Gerade nach oben. Ausschluss von Mann Nr. 1443: Er hat auch ein relativ hohes traditionelles Familienbild, befindet sich etwas außerhalb der Punktwolke und zieht Gerade ebenfalls nach oben. Bestimmtheitsmaß der Frauen hat sich deutlich verbessert, jenes der Männer nur unwesentlich. Probleme, wenn zu viele Fälle ausgeschlossen werden: z.b. es wird ein künstlicher Zusammenhang modelliert, zu geringe Fallzahlen u.ä. Ausschluss von Mann Nr. 1664 (so wie im nächsten Schritt empfohlen) 17

Beispiel 28 Selektieren Sie Beamte und Beamtinnen (mithilfe der Variable beruf1) aus der Gesamtstichprobe; schließen Sie zusätzlich die Ausreißer mit der Paginiernummer 983 und 1664 von der Analyse aus. Berechnen Sie eine weitere Regressionsanalyse mit dem Traditionellen Familienbild (famtrad) als abhängige Variable. Als unabhängige Variablen verwenden Sie wieder das Einkommen (EINK93) sowie die Dummy-Variable MANN, die wir in den Übungen gebildet haben (siehe Seite 67). Wählen Sie bei der Berechnung der Regressionsanalyse die Methode Einschluss. Speichern Sie wieder die standardisierten Residuen und lassen Sie sich ein Histogramm der Residuen ausdrucken. 28.1 Beschreiben Sie ausführlich die Vorgehensweise bei der Bewertung des Modells. Welche Werte ziehen Sie für Ihre Bewertung heran und was bedeuten diese? 28.2 Wie lautet die Regressionsgleichung des Modells? Interpretieren Sie die Bedeutung der einzelnen Variablen für das Gesamtmodell? Welche Variable hat den größten Einfluss auf das Traditionelle Familienbild? Anhand welcher Werte lesen Sie das ab? 28.3 Führen Sie eine graphische Analyse der Residuen durch, indem Sie zumindest drei Scatterplots erstellen: Auf der y-achse tragen Sie die standardisierten Residuen, auf der x- Achse die Variablen, von denen Sie glauben, dass sie einen weiteren Erklärungsbeitrag liefern können, auf. Welche der graphisch analysierten Variablen könnten Ihrer Meinung nach zur Verbesserung des Regressionsmodells beitragen? Warum? Model 1 Variables Entered/Removed b Variables Variables Entered Removed Method mann, eink2003 Persönliches Netto-Einkommen a. Enter a. All requested variables entered. b. Dependent Variable: famtrad Traditionelles Familienbild Model 1 Model Summary b Adjusted Std. Error of R R Square R Square the Estimate,622 a,387,365 11,36365 a. Predictors: (Constant), mann, eink2003 Persönliches Netto-Einkommen b. Dependent Variable: famtrad Traditionelles Familienbild 18

Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 4482,316 2 2241,158 17,356,000 a 7098,668 55 129,132 11580,984 57 a. Predictors: (Constant), mann, eink2003 Persönliches Netto-Einkommen b. Dependent Variable: famtrad Traditionelles Familienbild Model 1 (Constant) eink2003 Persönliches Netto-Einkommen mann Coefficients a a. Dependent Variable: famtrad Traditionelles Familienbild Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. 33,801 4,407 7,670,000 -,006,003 -,256-2,310,025 18,565 3,165,650 5,865,000 Predicted Value Residual Std. Predicted Value Std. Residual Residuals Statistics a Minimum Maximum Mean Std. Deviation N 19,0545 46,7273 34,4307 8,86994 58-23,15511 35,97744,00000 11,16240 58-1,734 1,386,000 1,000 58-2,038 3,166,000,982 58 a. Dependent Variable: famtrad Traditionelles Familienbild Histogram Dependent Variable: Traditionelles Familienbild 25 20 Frequency 15 10 5 0-3 -2-1 0 1 2 3 4 Mean = -1,21E-15 Std. Dev. = 0,982 N = 58 Regression Standardized Residual Cases weighted by Gewichtungsfaktor 19

Ad 28.1.: Beschreiben Sie ausführlich die Vorgehensweise bei der Bewertung des Modells. Welche Werte ziehen Sie für Ihre Bewertung heran und was bedeuten diese? Auf den ersten Blick ist ersichtlich, dass beide unabhängigen Variablen ins Modell aufgenommen wurden, was bei der Methode Einschluss jedoch keine weitere Aussagekraft hat, da alle Variablen aufgenommen werden, unabhängig von ihrem Einfluss auf die abhängige Variable. Der zweite Blick gilt der ANOVA-Tabelle, aus der ersichtlich wird, dass das Modell insgesamt signifikant ist (p (von F) <= 0,05). In der obigen Tabelle Modellzusammenfassung lesen wir ab, dass rund 38% der Gesamtvarianz des traditionellen Familienbildes durch die beiden Variablen Einkommen und Mann erklärt werden konnten. Für diesen Zuwachs an Erklärungsbeitrag im Vergleich zum vorigen Beispiel, wo ein Bestimmtheitsmaß für die Männer von 4% und für die Frauen von 17% erreicht werden konnte, liegt an der Hinzunahme der Variable Mann. Aus der Koeffiziententabelle wird sichtbar, dass beide Variablen (mann und Einkommen) einen signifikanten Einfluss auf das traditionelle Familienbild ausüben (Vergleich der Signifikanzen, Vergleich der Beta-Koeffizienten). Weiters ist anhand des Histogramms der Residuen ersichtlich, dass die Verteilung bereits deutlich symmetrischer bzw. normalverteilter ist, als es die beiden Verteilungen der Residuen getrennt nach Geschlecht ohne der Variable Mann waren. Doch ist die Verteilung noch immer nicht normalverteilt, weshalb es sich empfiehlt, weitere Variablen für das Modell zu bestimmen. Ad 28.2.: Wie lautet die Regressionsgleichung des Modells? Interpretieren Sie die Bedeutung der einzelnen Variablen für das Gesamtmodell? Welche Variable hat den größten Einfluss auf das Traditionelle Familienbild? Anhand welcher Werte lesen Sie das ab? FAMTRAD = 33,8 0,006 x EINK2003 + 18,6 x mann Aus der Koeffiziententabelle wird sichtbar, dass die Variable mann einen wesentlich stärkeren Einfluss auf das traditionelle Familienbild ausübt als das Einkommen (Vergleich der Beta-Koeffizienten: auch wenn das Einkommen hoch ist, wird das Produkt nicht so groß wie der Mann-Bonus). Beide Variablen leisten jedoch wie gesagt - einen signifikanten Einfluss für das gesamte Vorhersagemodell. Das Einkommen leistet einen negativen Einfluss: Je höher das Einkommen, desto geringer das traditionelle Familienbild. Die Eigenschaft Mann hat positiven Einfluss: Männer erreichen beim geschätzten traditionellen Familienbild höhere Werte als Frauen. Ad 28.3.. Führen Sie eine graphische Analyse der Residuen durch, indem Sie zumindest drei Scatterplots erstellen: Auf der y-achse tragen Sie die standardisierten Residuen, auf der x- Achse die Variablen, von denen Sie glauben, dass sie einen weiteren Erklärungsbeitrag liefern können, auf. Welche der graphisch analysierten Variablen könnten Ihrer Meinung nach zur Verbesserung des Regressionsmodells beitragen? Warum? Erste Variable: alter03: Kein Einfluss nur 1,4% der Varianz der Residuen wird erklärt. 20

4 2 Geschlecht männlich weiblich Fit line for Total Fit line for männlich Fit line for weiblich Standardized Residual 0-2 R Sq Linear = 6,694E-4 R Sq Linear = 0,032-4 R Sq Linear = 0,014 30 40 50 60 70 Alter des Befragten Cases weighted by Gewichtungsfaktor Zweite Variable: g106: Hausarbeitszeit: kein Einfluss: 1,5% der Varianz der Residuen wird erklärt. 4 3 Geschlecht männlich weiblich Fit line for Total Fit line for männlich Fit line for weiblich Standardized Residual 2 1 0-1 R Sq Linear = 0,062 R Sq Linear = 0,004-2 R Sq Linear = 0,015 0 10 20 30 Hausarbeitszeit pro Woche in Stunden Cases weighted by Gewichtungsfaktor 40 Auf der Suche nach weiteren Variablen wird man nicht wirklich fündig, ich habe dann Variable e84 Kontrolle im Leben (Skala 1 (überhaupt keine Freiheit) bis 10 (sehr große Freiheit)) ausprobiert, und einen deutlichen Einfluss auf die Residuen messen können: 21

Dritte Variable: e84: Kontrolle im Leben: 15% der Varianz der Residuen wird erklärt (= Korrelation mit den Residuen: 0,38). 4 Geschlecht männlich weiblich Fit line for Total Fit line for männlich 2 Fit line for weiblich Standardized Residual 0 Nur für die Männer gilt dieser -2 R Sq Linear = 0,008 Zusammenhang. R Sq Linear = 0,364-4 R Sq Linear = 0,146 4 5 6 7 8 9 10 Kontrolle im Leben Cases weighted by Gewichtungsfaktor 22

Beispiel 29 Berechnen Sie eine Regressionsanalyse analog dem vorigen Beispiel, in der Sie die von Ihnen ausgewählte/gebildete Variable zusätzlich zu den in Beispiel 26 bereits einbezogenen hinzuziehen. Wählen Sie diesmal die Methode Schrittweise. Welche Variablen werden in das Regressionsmodell aufgenommen, welche nicht? Hat sich durch Ihre Variable das Regressionsmodell verbessert? Die Variable e84 Kontrolle im Leben zeigte einen deutlichen Einfluss auf die Residuen der vorigen Regressionsanalyse, weshalb diese Variable nun in ein weiteres Modell mit schrittweiser Methode aufgenommen wird. Model 1 2 3 Variables Entered/Removed a Variables Entered Method mann Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). e84 Kontrolle im Leben Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). eink2003 Persönliches Netto-Einkommen a. Dependent Variable: famtrad Traditionelles Familienbild Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). Model 1 2 3 Model Summary d Adjusted Std. Error of the R R Square R Square Estimate,572 a,328,316 11,79556,645 b,417,395 11,08704,695 c,483,454 10,53559 a. Predictors: (Constant), mann b. Predictors: (Constant), mann, e84 Kontrolle im Leben c. Predictors: (Constant), mann, e84 Kontrolle im Leben, eink2003 Persönliches Netto-Einkommen d. Dependent Variable: famtrad Traditionelles Familienbild 23

Model 1 2 3 Regression Residual Total Regression Residual Total Regression Residual Total ANOVA d Sum of Squares df Mean Square F Sig. 3793,303 1 3793,303 27,263,000 a 7787,681 56 139,135 11580,984 57 4823,689 2 2411,844 19,621,000 b 6757,296 55 122,922 11580,984 57 5590,164 3 1863,388 16,787,000 c 5990,821 54 110,999 11580,984 57 a. Predictors: (Constant), mann b. Predictors: (Constant), mann, e84 Kontrolle im Leben c. Predictors: (Constant), mann, e84 Kontrolle im Leben, eink2003 Persönliches Netto-Einkommen d. Dependent Variable: famtrad Traditionelles Familienbild Model 1 2 3 (Constant) mann (Constant) mann e84 Kontrolle im Leben (Constant) mann e84 Kontrolle im Leben eink2003 Persönliches Netto-Einkommen Coefficients a a. Dependent Variable: famtrad Traditionelles Familienbild Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. 25,089 2,367 10,6,000 16,346 3,131,572 5,221,000,656 8,727,075,940 18,510 3,036,648 6,097,000 2,994 1,034,308 2,895,005 8,927 8,870 1,006,319 20,934 3,029,733 6,912,000 3,107,983,319 3,159,003 -,006,002 -,270-2,63,011 Model 1 2 eink2003 Persönliches Netto-Einkommen e84 Kontrolle im Leben eink2003 Persönliches Netto-Einkommen a. Predictors in the Model: (Constant), mann Excluded Variables c b. Predictors in the Model: (Constant), mann, e84 Kontrolle im Leben c. Dependent Variable: famtrad Traditionelles Familienbild Collinearity Partial Statistics Beta In t Sig. Correlation Tolerance -,256 a -2,310,025 -,297,908,308 a 2,895,005,364,939 -,270 b -2,628,011 -,337,906 Alle gewählten Variablen, darunter auch die Variable e84 Kontrolle im Leben, werden in das Modell aufgenommen. Den stärksten Einfluss hat die Variable mann (Vergleich Beta- Koeffizienten und Signifikanzen der Koeffizienten) und wird als erstes ins Modell aufgenommen. Männliches Geschlecht bewirkt einen höheren Schätzwert beim traditionellen Familienbild. Im zweiten Schritt wird die Variable e84 Kontrolle im Leben ins Modell 24

aufgenommen (die Korrelation mit den Residuen beträgt laut Tabelle Ausgeschlossene Variablen 0,36). Inhaltlich bedeutet dies: Je mehr Freiheit jemand genießt, desto höher das vorhergesagte traditionelle Familienbild (Dies gilt aber eben bei genauerer Betrachtungsweise nur für die Männer). Und schließlich wird im dritten Schritt auch noch das Einkommen, mit dem geringsten, aber signifikanten negativen Einfluss ins Modell aufgenommen. Das erreicht insgesamt 48% an erklärter Gesamtvarianz des traditionellen Familienbildes bei den BeamtInnen. Allerdings wird auch deutlich, dass die Konstante ab dem zweiten Schritt nicht mehr signifikant ist (Koeffiziententabelle), weshalb sie in der Schätzfunktion nicht verwendet werden dürfte. Die Residuen sind nach dieser Analyse bereits annähernd normalverteilt, was aus dem Histogramm ersichtlich wird. Histogram Dependent Variable: Traditionelles Familienbild 12 10 Frequency 8 6 4 2 0-2 -1 0 1 2 3 Mean = 2,01E-16 Std. Dev. = 0,973 N = 58 Regression Standardized Residual Cases weighted by Gewichtungsfaktor 25