Statistikübungen für die Pflegewissenschaften II Beispiellösungen

Größe: px
Ab Seite anzeigen:

Download "Statistikübungen für die Pflegewissenschaften II Beispiellösungen"

Transkript

1 Statistikübungen für die Pflegewissenschaften II Beispiellösungen INHALTSVERZEICHNIS BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL BEISPIEL (autorisiert durch Reinhard Raml und Doris Gretzl) Enrica Denk Nedeljko Radojicic Christine Schuster Sarah Zaussinger

2 Beispiel 18 Überprüfen Sie die Hypothese, ob auch der Alkoholkonsum mit der sozialen Akzeptanz zusammenhängt. Wählen Sie die Altersgruppe der 15-Jährigen aus. Erstellen Sie eine Kreuztabelle aus den Variablen alk_rec (Alkoholkonsum) und f13_rec ("meine MitschülerInnen akzeptieren mich"). Geben sie die unabhängige Variable in die Zeilen und die abhängige Variable in die Spalten. Wählen Sie die Zeilenprozentwerte und berechnen Sie auch den Chi-Quadrat-Test Besteht ein signifikanter Zusammenhang? Interpretieren Sie kurz die wichtigsten Ergebnisse aus den Prozentwerten Erstellen Sie nun weitere Tabellen indem Sie die Kontrollvariable Geschlecht einsetzen. Welcher Fragestellung wird hier nachgegangen? Besteht ein Geschlechtsunterschied? Wenn ja, inwiefern? F13_REC Student * ALK_REC Alkoholkonsum höchstens Kreuztabelle F13_REC Student Gesamt 1 Always/Often 2 Sometimes 3 Rarely/Never Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student ALK_REC Alkoholkonsum höchstens 0 kein 1 nur 2 jeden 3 Alkohol seltener Monat wöchentl./tägl. Gesamt ,4% 38,1% 14,1% 19,5% 100,0% -1,0 -,1,7, ,1% 39,3% 13,4% 17,1% 100,0%,5,6 -,2-1, ,9% 36,6% 10,9% 17,5% 100,0% 2,3 -,5-1,6 -, ,2% 38,1% 13,7% 19,0% 100,0% Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat-Tests Wert 12,794 a 6,046 12,736 6,047 8,977 1, df Asymptotisch e Signifikanz (2-seitig) a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 65,09. 2

3 Ad 18.1.: Besteht ein signifikanter Zusammenhang? Interpretieren Sie kurz die wichtigsten Ergebnisse aus den Prozentwerten. UV / AV nicht eindeutig Begründen Sie Ihre Entscheidung bzw. überlegen Sie sich Wirkungsmöglichkeiten in beide Richtungen. Der Zusammenhang ist signifikant (Irrtumswahrscheinlichkeit ist 4,6 %), jedoch scheint die Stärke des Zusammenhangs sehr gering (std. Residuen); Ergebnis sollte kritisch betrachtet werden; Die Voraussetzung für den Chi-2-Test ist erfüllt In keinen Zellen beträgt die erwartete Häufigkeit weniger als 5. Die Unterschiede in den Prozentwerten sind eher gering, es lässt sich jedoch folgende Tendenz erkennen: Je seltener MitschülerInnen von anderen akzeptiert werden, desto häufiger geben sie an, keinen Alkohol zu konsumieren. Widerspricht das Ihrer Intuition? Hätten wir angenommen, dass weniger Akzeptierte häufiger zum Alkohol greifen? Oder: Je stärker sie akzeptiert werden, desto öfter wird gemeinsam getrunken bzw. hängt die Akzeptanz davon an, dass man mittrinkt (Gruppendruck denken Sie ans Rauchen!). H1 wird angenommen (Es besteht ein signifikanter Zusammenhang zwischen dem Alkoholkonsum und der Akzeptanz unter MitschülerInnen in der Grundgesamtheit.) Der Zusammenhang ist schwach überprüfen Sie das auch mit geeigneten Zusammenhangsmaßen. Sie können jene Maße für Ordinalskalen nehmen, da beide Variablen ordinal sind (Achtung: Pearson-R) ist nicht zu interpretieren! Sowohl Gamma als auch Spearmann weisen auf einen äußerst geringen Zusammenhang hin. Gesamtbewertung: Kreuztabelle kaum signifikante Über-/Unterbesetzungen der Zellen (Verteilung vergleichen mit Randverteilung, standardisierte Residuen), Chi-2 knapp signifikant, Zusammenhangsmaße sehr niedrig. Fazit: De facto kein relevanter Zusammenhang, wenngleich knapp signifikant (Schluss auf die Grundgesamtheit). Ordinal- bzgl. Ordinalmaß Intervall- bzgl. Anzahl der gültigen Fälle Gamma Korrelation nach Spearman Pearson-R a. Die Null-Hyphothese wird nicht angenommen. Symmetrische Maße Asymptoti scher Näherung Standardf Näherung sweise Wert ehler a sweises T b Signifikanz -,071,024-3,027,002 -,042,014-3,035,002 c -,041,014-2,998,003 c 5276 b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. c. Basierend auf normaler Näherung 3

4 Ad 18.2.: Erstellen Sie nun weitere Tabellen indem Sie die Kontrollvariable Geschlecht einsetzen. Welcher Fragestellung wird hier nachgegangen? Besteht ein Geschlechtsunterschied? Wenn ja, inwiefern? F13_REC Student * ALK_REC Alkoholkonsum höchstens * C1 Sex Kreuztabelle C1 Sex 1 Boy 2 Girl F13_REC Student Gesamt F13_REC Student Gesamt 1 Always/Often 2 Sometimes 3 Rarely/Never 1 Always/Often 2 Sometimes 3 Rarely/Never Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student Standardisierte Residuen Anzahl % von F13_REC Student ALK_REC Alkoholkonsum höchstens 0 kein 1 nur 2 jeden 3 Alkohol seltener Monat wöchentl./tägl. Gesamt ,7% 33,8% 16,4% 26,2% 100,0% -1,4 -,2,9, ,7% 34,6% 13,4% 23,3% 100,0% 1,4,2-1,1 -, ,3% 35,0% 12,2% 20,5% 100,0% 2,3,3-1,4-1, ,2% 34,0% 15,6% 25,2% 100,0% ,7% 42,9% 11,5% 11,9% 100,0%,0,2 -,2 -, ,6% 43,9% 13,4% 11,1% 100,0% -,8,4 1,0 -, ,0% 38,5% 9,5% 14,0% 100,0% 1,1-1,0 -,9, ,8% 42,7% 11,6% 11,9% 100,0% C1 Sex 1 Boy 2 Girl Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Chi-Quadrat-Tests Wert 16,486 a 6,011 16,374 6,012 13,837 1, ,835 b 6,442 5,799 6,446,000 1, df Asymptotisch e Signifikanz (2-seitig) a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 39,57. b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 25,65. Hierbei wird der Frage nachgegangen, ob der signifikante Zusammenhang zwischen dem Alkoholkonsum und der Akzeptanz der MitschülerInnen unabhängig vom Geschlecht der Befragten besteht. Bei Mädchen ist der Zusammenhang nicht signifikant, d.h. das der Alkoholkonsum nicht von der Akzeptanz der MitschülerInnen abhängt. Bei den Buben ist er signifikant, bleibt aber schwach, wenngleich Tendenzen schon klarer erkennbar. 4

5 Beispiel 19 (Datensatz hbsc-94-uebung.sav) Testen Sie mittels t-test, ob sich das Taschengeld (c11) nach Geschlecht signifikant unterscheidet. Formulieren Sie die Nullhypothese und die Alternativhypothese. Markieren Sie die relevanten Test-Signifikanzen. Zu welcher Entscheidung kommen Sie aufgrund der Testergebnisse. Was bedeutet das Ergebnis inhaltlich? Nullhypothese: Es besteht kein Unterschied zwischen der durchschnittlichen Höhe des Taschengeldes bei Buben und Mädchen. Alternativhypothese: Die durchschnittliche Höhe des Taschengeldes bei Buben und Mädchen unterscheidet sich. Gruppenstatistiken C11 Pocket money C1 Sex 1 Boy 2 Girl Standardfe Standardab hler des N Mittelwert weichung Mittelwertes ,42 187,741 3, ,07 145,723 2,991 Test bei unabhängigen Stichproben C11 Pocket money Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit F Signifikanz T df Sig. (2-seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz 95% Konfidenzintervall Standardfehle der Differenz r der Differenz Untere Obere 60,6,000 6, ,000 31,35 4,770 21,996 40,698 6, ,042,000 31,35 4,697 22,139 40,555 Überlegen: Gerichtete / Ungerichtete Hypothesen formulieren?! Oben angeführte Hypothesen sind ungerichtet. Wenn diese signifikant sind, dann sind es auch die gerichteten. Buben erhalten signifikant mehr Taschengeld, nämlich durchschnittlich Mädchen erhalten signifikant weniger Taschengeld, nämlich durchschnittlich 114.-, das sind um rund 30.- weniger. Der t-test untersucht, ob sich die beiden Mittelwerte der Höhe des Taschengeldes signifikant unterscheiden. Ist dies der Fall, so darf angenommen werden, dass dieses Ergebnis aus der Stichprobe mit sehr großer Wahrscheinlichkeit auch in der Grundgesamtheit zutrifft (alle österreichischen SchülerInnen zwischen 11 und 15 Jahren). Sollte tatsächlich (heißt: in der GG) die H0 gelten, so irren wir uns bei unserer Entscheidung, die H0 zu verwerfen, mit einer Wahrscheinlichkeit von nahezu (!!) 0 Prozent. Niemals: 0 % - das wäre ein sicheres Ereignis und das gibt es beim Hypothesentesten nicht. 5

6 Beispiel 20 (Datensatz hbsc-94-uebung.sav) Untersuchen Sie, ob sich der Zigarettenkonsum signifikant nach Alter und Geschlecht unterscheidet. Teilen Sie den Datensatz nach Altersgruppen auf, und vergleichen Sie die Variable c14 (Anzahl der Zigaretten in der Woche) nach Geschlecht. Ringeln Sie die für die Testung zu interpretierenden Signifikanzen ein. In welcher Altersgruppe besteht ein signifikanter Geschlechtsunterschied und in welcher nicht? Interpretieren Sie das Ergebnis unter Berücksichtigung der Mittelwerte pro Altersgruppe. Gruppenstatistiken AGE_GRP Altersgruppen 1 11jährige (bis 11,9) 2 13jährige (12 bis 13.9) 3 15jährige (ab 14) C14 No. of cigarettes per week C14 No. of cigarettes per week C14 No. of cigarettes per week C1 Sex 1 Boy 2 Girl 1 Boy 2 Girl 1 Boy 2 Girl Standardfe Standardab hler des N Mittelwert weichung Mittelwertes 728,19 1,306, ,03,463, ,90 21,513, ,54 11,282, ,79 31,682, ,37 28,354 1,051 Test bei unabhängigen Stichproben AGE_GRP Altersgruppe n 1 11jährige (bis 11,9) 2 13jährige (12 bis 13.9) 3 15jährige (ab 14) C14 No. of cigarettes per week C14 No. of cigarettes per week C14 No. of cigarettes per week Varianzen sind gleich Varianzen sind nicht gleich Varianzen sind gleich Varianzen sind nicht gleich Varianzen sind gleich Varianzen sind nicht gleich Levene-Test der Varianzgleichheit F Signifikanz T df Sig. (2-seitig) T-Test für die Mittelwertgleichheit Mittlere Differenz 95% Konfidenzintervall Standardfehle der Differenz r der Differenz Untere Obere 36,15,000 3, ,002,15,049,057,249 3, ,075,003,15,051,053,254,551,458, ,654,36,806-1,220 1,942, ,84,661,36,823-1,253 1,976 3,320,069, ,323 1,42 1,434-1,394 4,231 1, ,47,310 1,42 1,397-1,321 4,158 Hypothesen aufstellen nicht vergessen! Ein signifikanter Geschlechtsunterschied in der durchschnittlichen Anzahl der konsumierten Zigaretten pro Woche besteht lediglich bei den 11-Jährigen. Dieser Unterschied ist zwar signifikant, jedoch praktisch kaum bedeutsam, da er sich lediglich auf 0,1 Zigaretten pro Woche beläuft (11-Jährige Buben rauchen durchschnittlich 0,2 Zigaretten pro Woche (rund 1 Zigarette im Monat), 11-Jährige Mädchen fast keine). Sind die Mittelwerte eigentlich aussagekräftig? Nein! Warum nicht? (Verteilung!). Die Signifikanz begründet sich auf einen größeren Anteil an gelegentlichen Rauchern bei den Buben in dieser Altersgruppe, der in etwa 6 Prozentpunkte höher liegt als bei den Mädchen was durchaus nicht unwesentlich ist. Buben sind also schon früher anfällig für das Rauchen. In den Altersgruppen ab 13 Jahren besteht kein signifikanter Unterschied mehr zwischen Mädchen und Buben im durchschnittlichen Zigarettenkonsum. Die 13-Jährigen konsumieren durchschnittlich knapp 2 Zigaretten in der Woche, die 15- Jährigen konsumieren durchschnittlich rund Zigaretten in der Woche, das sind 6

7 immerhin bereits 2 Zigaretten am Tag. Voraussetzung für den t-test: NV des Zigarettenkonsums! Ist nicht gegeben. Merkmal ist linkssteil verteilt, Mittelwerte und Standardabweichungen sind kaum aussagekräftig. Man könnte die Nichtraucher selektieren (diese Frage eigens untersuchen) und die Menge gerauchter Zigaretten bei den Rauchern der jeweiligen Altersgruppen vergleichen; NV- Verteilung müsste wieder überprüft werden. Besser ist es, einen U-Test durchzuführen, der übrigens zu denselben Signifikanzaussagen führt. Überprüfen Sie es selbst. Die Irrtumswahrscheinlichkeiten sind: de facto 0 %, 10,6 % und 49,3 % (aufsteigende Altersgruppen). 7

8 Beispiel 21 (Datensatz hbsc-94-uebung.sav) Suchen Sie aus dem Datensatz eine ordinal-skalierte Variable heraus, von der Sie annehmen, dass sich deren Verteilungen signifikant nach Geschlecht unterscheiden. Testen Sie mittels U-Test, ob Ihre Vermutung zutrifft oder nicht. Formulieren Sie die Hypothesen und interpretieren Sie das Ergebnis. Hat sich Ihre Vermutung bestätigt? Was für eine Erklärung haben Sie dafür? Es ist ein U-Test erforderlich; Als Variable haben wir uns für Sports time per week entschieden. Ranks C21 Sports - times per week C1 Sex 1 Boy 2 Girl Total N Mean Rank Sum of Ranks , , , , Mann-Whitney U Wilcoxon W Z Test Statistics a Asymp. Sig. (2-tailed) C21 Sports - times per week , ,000 a. Grouping Variable: C1 Sex -15,149,000 H0: Es besteht kein Unterschied in der Häufigkeit der sportlichen Betätigung zwischen Mädchen und Buben in der Grundgesamtheit. H1: Es besteht ein Unterschied in der Häufigkeit der sportlichen Betätigung zwischen Mädchen und Buben in der Grundgesamtheit. Die Vermutung, dass Buben angeben mehr Sport zu betreiben als Mädchen kann bestätigt werden, da der Test zeigt, dass der Unterschied signifikant ist (die Rangsumme bei Buben ist niedriger; auf Kodierung achten!!). Die Erklärung hierfür findet sich vielleicht in der unterschiedlichen Sozialisation Buben werden häufiger zum Sport animiert als Mädchen. 8

9 Beispiel 23 (Datensatz hbsc-94-uebung.sav) In Beispiel 21 haben Sie untersucht, ob sich das Taschengeld signifikant nach Geschlecht unterscheidet. Schauen Sie nun getrennt für Burschen und Mädchen weiter, ob sich das Taschengeld (C11) zwischen den verschiedenen Schichten (scht) unterscheidet. Wo gibt es Unterschiede, wo nicht. Überrascht Sie das Ergebnis? Was für Gründe fallen Ihnen zur Erklärung ein und wie würden Sie diese in einer eigenen Umfrage untersuchen? Descriptives c11 Pocket money c1 Sex 1 Boy 2 Girl 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht Total 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht Total 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum ,35 172,090 6, ,39 150, ,04 186,615 6, ,24 156, ,86 186,494 6, ,70 150, ,78 220,536 13, ,90 217, ,18 187,166 3, ,09 152, ,83 146,275 6, ,79 126, ,68 150,291 5, ,46 123, ,07 136,540 5, ,03 120, ,30 154,149 9, ,06 143, ,99 145,684 2, ,11 119, Test of Homogeneity of Variances c11 Pocket money c1 Sex 1 Boy 2 Girl Levene Statistic df1 df2 Sig. 6, ,000, ,748 ANOVA c11 Pocket money c1 Sex 1 Boy 2 Girl Between Groups Within Groups Total Between Groups Within Groups Total Sum of Squares df Mean Square F Sig , ,506 6,105, , , , , ,500,595, , , ,

10 Multiple Comparisons Dependent Variable: c11 Pocket money Bonferroni c1 Sex 1 Boy 2 Girl (I) scht Schichtindex 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht (J) scht Schichtindex 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. 2 unt.mittelsch. 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 3 obere Mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 4 Oberschicht 1 Unterschicht 2 unt.mittelsch. 3 obere Mittelsch. *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -7,693 9,348 1,000-32,38 16,99,494 9,809 1,000-25,41 26,39-53,426* 13,590,001-89,31-17,55 7,693 9,348 1,000-16,99 32,38 8,187 9,010 1,000-15,60 31,97-45,733* 13,024,003-80,12-11,35 -,494 9,809 1,000-26,39 25,41-8,187 9,010 1,000-31,97 15,60-53,920* 13,359,000-89,19-18,65 53,426* 13,590,001 17,55 89,31 45,733* 13,024,003 11,35 80,12 53,920* 13,359,000 18,65 89,19 1,150 7,919 1,000-19,76 22,06 4,753 8,188 1,000-16,87 26,37-9,475 11,070 1,000-38,70 19,75-1,150 7,919 1,000-22,06 19,76 3,603 7,433 1,000-16,02 23,23-10,625 10,523 1,000-38,41 17,16-4,753 8,188 1,000-26,37 16,87-3,603 7,433 1,000-23,23 16,02-14,228 10,727 1,000-42,55 14,10 9,475 11,070 1,000-19,75 38,70 10,625 10,523 1,000-17,16 38,41 14,228 10,727 1,000-14,10 42,55 Schritt 1: Mittelwerte betrachten: das durchschnittlichen Taschengeld steigt anscheinend nicht stetig mit einer höheren subjektiven Statuszuordnung. Untere Mittelschicht bekommt mehr als obere Mittelschicht woran könnte das liegen? Ist es hier nur zufällig so oder besteht ein signifikanter Unterschied? Schritt 2: Test auf Homogenität der Varianzen: Voraussetzung für die Varianzanalyse ist, dass die Varianzen homogen/ gleich sind. H 0 : Die Varianzen sind gleich H 1 : Die Varianzen unterscheiden sich. Bei den Buben ist das Ergebnis signifikant, also gilt H 1, deswegen sollte die ANOVA und der Bonferroni-Test nicht interpretiert bzw. nur unter Vorbehalt interpretiert werden. Das ist insofern auch wichtig, als gerade bei den Buben die ANOVA ein signifikantes Ergebnis ausweist (mit Kruskal-Wallis absichern! siehe unten). Bei den Mädchen ist das Ergebnis nicht signifikant, also wird H 0 beibehalten, die ANOVA darf interpretiert werden. Schritt 3: ANOVA für die Mädchen wird interpretiert: H 0 : Es gibt keine Unterschiede beim durchschnittlichen Taschengeld der 10

11 verschiedenen Schichten H 1 : Es gibt Unterschiede beim durchschnittlichen Taschengeld der verschiedenen Schichten Die ANOVA ist bei den Mädchen nicht signifikant, es bleibt also bei der Annahme der H 0. Die Post-hoc-Tests spielen bei den Mädchen also keine Rolle mehr. Wenn bei diesen eine signifikante Abweichungen zwischen 2 Gruppen auftauchen würde, ist diese nicht aussagekräftig. Warum ist das Ergebnis bei den Mädchen nicht signifikant? Welche Variabel hat vielleicht eher einen Einfluss auf das Taschengeld? Schritt 4: Da wir bei den Buben die ANOVA nicht interpretieren dürfen, führen wir einen nichtparametrischen Test für mehrere unabhängige Stichproben durch (Kruskal-Wallis-Test), da dieser nicht voraussetzt, dass die Varianzen gleich sind. Weiters lassen wir uns bei der Varianzanalyse bei den Post-Hoc-Tests statt dem Bonferroni-Test einen Test ausgeben, wo keine Varianzgleichheit vorausgesetzt wird, nämlich den Tamhane-T2-Test. Die U-Test bei beiden Geschlechtern gelangen zu demselben Ergebnis wie die einfaktorielle ANOVA. Diese ist i.a. robust gegenüber Verletzungen der Homogenitäts-Voraussetzung. Ränge Sex Schichtindex N Mittlerer Rang Boy Pocket money Unterschicht ,44 unt.mittelsch ,15 obere Mittelsch ,04 Oberschicht ,96 Gesamt 2678 Girl Pocket money Unterschicht ,28 unt.mittelsch ,16 obere Mittelsch ,20 Oberschicht ,44 Gesamt 2366 Sex Boy Girl Statistik für Test a,b Chi-Quadrat df Asymptotische Signifikanz Chi-Quadrat df Asymptotische Signifikanz Pocket money 25,038 3,000 5,831 3,120 a. Kruskal-Wallis-Test b. Gruppenvariable: Schichtindex Schritt 5: Interpretation des Kruskal-Walis-Tests: H 0 : Es gibt keine Unterschiede beim durchschnittlichen Taschengeld der 11

12 verschiedenen Schichten H 1 : Es gibt Unterschiede beim durchschnittlichen Taschengeld der verschiedenen Schichten Das Ergebnis für die Buben ist signifikant, es darf die H 1 angenommen werden. Wir können uns nun das Ergebnis vom Mehrfachvergleich anschauen: es gibt nur signifikante Unterschiede beim Taschengeld, von den Buben, die sich der Oberschicht zurechnen mit den drei anderen Schichten (Unterschicht, untere Mittelschicht, obere Mittelschicht). Wieso bekommt diese Gruppe soviel mehr Taschengeld als alle anderen? Wieso ist dieser Unterschied nicht auch bei den Mädchen erkennbar? Was könnten mögliche Gründe sein? Abhängige Variable: Pocket money Tamhane Mehrfachvergleiche Sex Boy Girl (I) Schichtindex Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht (J) Schichtindex Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht Unterschicht unt.mittelsch. obere Mittelsch. Oberschicht *. Die mittlere Differenz ist auf der Stufe.05 signifikant. 95%-Konfidenzintervall Mittlere Differenz (I-J) Standardfehler Signifikanz Untergrenze Obergrenze -7,69 8,928,948-31,21 15,83,49 9,407 1,000-24,29 25,28-53,43* 15,162,003-93,52-13,33 7,69 8,928,948-15,83 31,21 8,19 9,005,933-15,54 31,91-45,73* 14,917,014-85,19-6,27 -,49 9,407 1,000-25,28 24,29-8,19 9,005,933-31,91 15,54-53,92* 15,208,003-94,14-13,70 53,43* 15,162,003 13,33 93,52 45,73* 14,917,014 6,27 85,19 53,92* 15,208,003 13,70 94,14 1,15 8,039 1,000-20,03 22,33 4,75 7,980,992-16,28 25,79-9,47 11,531,959-39,95 21,00-1,15 8,039 1,000-22,33 20,03 3,60 7,296,997-15,62 22,82-10,62 11,069,916-39,89 18,64-4,75 7,980,992-25,79 16,28-3,60 7,296,997-22,82 15,62-14,23 11,026,733-43,39 14,93 9,47 11,531,959-21,00 39,95 10,62 11,069,916-18,64 39,89 14,23 11,026,733-14,93 43,39 12

13 Beispiel 25 (Datensatz hbsc-94-uebung.sav) Untersuchen Sie folgende korrelative Zusammenhänge bei 15- jährigen Schülerinnen: f13 "meine MitschülerInnen akzeptieren mich", f14 "wurde verspottet', f15 "habe verspottet', f23 "Reden mit Vater', f24 "Reden mit Mutter', f39 "Selbstbewusstsein" und f34 "Bewertung des eigenen Aussehens" Beschreiben Sie anhand der Stärke der Korrelationen die Einflussfaktoren auf die Akzeptanz durch die Mitschülerinnen. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"- Thematik! 25.2 Beschreiben Sie an hand der Stärke der Korrelationen die Einflussfaktoren auf das Selbstbewusstsein. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation- Kausalitäts"-Thematik! 25.3 Zeigt das Reden-Können mit Vater bzw. Mutter unterschiedlich starke Auswirkungen, wenn ja, inwiefern? 25.4 Welche weitere Variable könnte einen Zusammenhang mit dem Selbstbewusstsein aufweisen? Überprüfen Sie Ihre Vermutung anhand einer bivariaten Korrelation. Besteht ein Zusammenhang? Wenn ja, wie stark ist er und wie ist er zu interpretieren? F13 Student rel: accept me F14 Been bullied F15 Have bullied F23 Easy to talk to father F24 Easy to talk to mother F39 Feel confident F34 Think about look Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N Spearman-Rho Sig. (2-seitig) N **. Die Korrelation ist auf dem 0,01 Niveau signifikant (zweiseitig). *. Die Korrelation ist auf dem 0,05 Niveau signifikant (zweiseitig). Korrelationen F13 Student F14 Been F15 Have F23 Easy to F24 Easy to F39 Feel F34 Think bullied bullied talk to father talk to mother confident about look 1,000,315** -,007,121**,089**,230**,249**.,000,747,000,000,000, ,315** 1,000,200**,070**,046*,142**,119**,000.,000,003,048,000, ,007,200** 1,000 -,002,039 -,085** -,075**,747,000.,928,093,000, ,121**,070** -,002 1,000,461**,226**,169**,000,003,928.,000,000, ,089**,046*,039,461** 1,000,154**,133**,000,048,093,000.,000, ,230**,142** -,085**,226**,154** 1,000,298**,000,000,000,000,000., ,249**,119** -,075**,169**,133**,298** 1,000,000,000,001,000,000, Ad 25.1.: Beschreiben Sie anhand der Stärke der Korrelationen die Einflussfaktoren auf die Akzeptanz durch die Mitschülerinnen. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"- Thematik! Verspottet zu werden korreliert am stärksten mit der Akzeptanz durch die MitschülerInnen (0,315). Im Gegensatz dazu gehen das Verspotten und das Akzeptiert-werden nicht Hand in Hand. (nicht signifikante Korrelation von -0,007). 13

14 Selbstbewusstsein und die Bewertung des eigenen Aussehens zeigen mittlere Zusammenhänge mit der Akzeptanz durch die MitschülerInnen (0,249 und 0,230). Das Reden mit Vater bzw. Mutter hängt weniger zusammen mit der Akzeptanz. Ad 25.2.: Beschreiben Sie an hand der Stärke der Korrelationen die Einflussfaktoren auf das Selbstbewusstsein. Diskutieren Sie die Ergebnisse auch vor dem Hintergrund der "Korrelation-Kausalitäts"-Thematik! Das Selbstbewusstsein korreliert am stärksten mit der Bewertung des eigenen Aussehens (0,298). Weiters zeigen auch die Beziehung zum Vater (0,226) sowie die Akzeptanz durch die MitschülerInnen (0,230) mittlere Zusammenhänge mit dem Selbstbewusstsein. Verspottet werden (0,142) oder haben ((-0,085) sowie die Beziehung zur Mutter (0,154) zeigen wiederum die geringsten Zusammenhänge mit dem Selbstbewusstsein. Ad 25.3.: Zeigt das Reden-Können mit Vater bzw. Mutter unterschiedlich starke Auswirkungen, wenn ja, inwiefern? Grundsätzlich ist feststellbar, dass das Reden mit dem Vater stärke Korrelationen mit den ausgewählten Variablen aufweist als das Reden mit der Mutter. Besonders deutlich wird dies beim Selbstbewußtsein. Es ist zu vermuten, dass auch bei der Akzeptanz durch die MitschülerInnen hier die männlichen Schulkollegen mehr soziale Definitinsmacht ausüben können. Bei einer weiteren Befragung könnte hier zwischen der Akeptanz von männlichen und weiblichen MitschülerInnen differenziert werden. Ad 25.4.: Welche weitere Variable könnte einen Zusammenhang mit dem Selbstbewusstsein aufweisen? Überprüfen Sie Ihre Vermutung anhand einer bivariaten Korrelation. Besteht ein Zusammenhang? Wenn ja, wie stark ist er und wie ist er zu interpretieren? Correlations Spearman's rho F37 Easy to make friends F39 Feel confident Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). F37 Easy to F39 Feel make friends confident 1,000,272**., ,272** 1,000, Es besteht eine mittelstarke positive Korrelation (0,272). D.h. je selbstbewusster jemand ist, desto leichter findet sie/er Freunde und umgekehrt (kausaler Zusammenhangs nicht ersichtlich) 14

15 Beispiel 26 Selektieren Sie Beamte und Beamtinnen (mithilfe der Variable beruf1) aus der Gesamtstichprobe. Erstellen Sie ein Streudiagramm, das die Beziehung zwischen Einkommen (EINK2003) als unabhängige Variable und dem Traditionellen Familienbild (famtrad) als abhängige Variable für Frauen und Männer darstellt. Legen Sie die entsprechenden Regressionsgeraden in die Grafik und lassen Sie sich das Bestimmtheitsmaß R² anzeigen Inwiefern unterscheidet sich die Regressionsgerade der Beamten von jener der Beamtinnen? Welchen Wert nimmt jeweils das Bestimmtheitsmaß (R²) an und was bedeutet er? 26.2 Welche Personen verzerren möglicherweise den Zusammenhang zwischen dem Einkommen und dem Traditionellen Familienbild bei BeamtInnen? In welcher Weise? Identifizieren Sie die Fälle anhand der Paginiernummer. Entscheiden Sie sich für zwei Ausreißer, deren Ausschluss einen Zuwachs an Erklärungsbeitrag für das Traditionelle Familienbild erbringen könnte. Markieren Sie diese auf dem Streudiagramm und begründen Sie deren Ausschluss. Führen Sie die Analyse mit der selektierten Stichprobe noch einmal durch! Haben sich Ihre Ergebnisse in der erwarteten Weise verbessert? Welche Probleme könnten sich ergeben, wenn Sie zu viele Fälle ausschließen (als Extremwerte bezeichnen)? Ad 26.1.: Inwiefern unterscheidet sich die Regressionsgerade der Beamten von jener der Beamtinnen? Welchen Wert nimmt jeweils das Bestimmtheitsmaß (R²) an und was bedeutet er? Traditionelles Familienbild Geschlecht weiblich R-Qu. = 0,0295 männlich R-Qu. = 0, Persönliches Netto-Einkommen Fälle gewichtet nach GEWICHT 15

16 Achtung: im aktuellen Datensatz von der HP weist die Variable beruf1 einen Codierungsfehler auf! (Kategorie 3! Sind die Angestellten, net die BeamtInnen) Für Männer und Frauen gilt grundsätzlich: Je höher das Netto-Einkommen, umso geringer ist das traditionelle Familienbild (schwacher negativer Zusammenhang). Beamtinnen: Die Regressionsgerade verläuft fast parallel unter jener der Männer, Geraden gehen nur geringfügig auseinander. Grundsätzlich haben Beamtinnen ein niedrigeres traditionelles Familienbild, keine Beamtin verdient mehr als ca ,- Euro Beamte: Grundsätzlich ein höheres traditionelles Familienbild sowie einzelne Fälle mit hohem Gehalt. Bestimmtheitsmaß: Bei den Frauen können knapp 3% und bei den Männern 3,4% der Variation (der Varianz, des Zustandekommens o.ä.) des traditionellen Familienbildes durch das Einkommen erklärt werden. Also sehr, sehr wenig!!!!! Ad 26.2.: Welche Personen verzerren möglicherweise den Zusammenhang zwischen dem Einkommen und dem Traditionellen Familienbild bei BeamtInnen? In welcher Weise? Identifizieren Sie die Fälle anhand der Paginiernummer. Entscheiden Sie sich für zwei Ausreißer, deren Ausschluss einen Zuwachs an Erklärungsbeitrag für das Traditionelle Familienbild erbringen könnte. Markieren Sie diese auf dem Streudiagramm und begründen Sie deren Ausschluss. Führen Sie die Analyse mit der selektierten Stichprobe noch einmal durch! Haben sich Ihre Ergebnisse in der erwarteten Weise verbessert? Welche Probleme könnten sich ergeben, wenn Sie zu viele Fälle ausschließen (als Extremwerte bezeichnen)? 70 Traditionelles Familienbild Geschlecht weiblich R-Qu. = 0,1678 männlich R-Qu. = 0, Persönliches Netto-Einkommen Fälle gewichtet nach GEWICHT Beispielsweise: 16

17 Ausschluss von Frau Nr. 983: Sie hat ein untypisch hohes traditionelles Familienbild und zieht die Gerade nach oben. Ausschluss von Mann Nr. 1443: Er hat auch ein relativ hohes traditionelles Familienbild, befindet sich etwas außerhalb der Punktwolke und zieht Gerade ebenfalls nach oben. Bestimmtheitsmaß der Frauen hat sich deutlich verbessert, jenes der Männer nur unwesentlich. Probleme, wenn zu viele Fälle ausgeschlossen werden: z.b. es wird ein künstlicher Zusammenhang modelliert, zu geringe Fallzahlen u.ä. Ausschluss von Mann Nr (so wie im nächsten Schritt empfohlen) 17

18 Beispiel 28 Selektieren Sie Beamte und Beamtinnen (mithilfe der Variable beruf1) aus der Gesamtstichprobe; schließen Sie zusätzlich die Ausreißer mit der Paginiernummer 983 und 1664 von der Analyse aus. Berechnen Sie eine weitere Regressionsanalyse mit dem Traditionellen Familienbild (famtrad) als abhängige Variable. Als unabhängige Variablen verwenden Sie wieder das Einkommen (EINK93) sowie die Dummy-Variable MANN, die wir in den Übungen gebildet haben (siehe Seite 67). Wählen Sie bei der Berechnung der Regressionsanalyse die Methode Einschluss. Speichern Sie wieder die standardisierten Residuen und lassen Sie sich ein Histogramm der Residuen ausdrucken Beschreiben Sie ausführlich die Vorgehensweise bei der Bewertung des Modells. Welche Werte ziehen Sie für Ihre Bewertung heran und was bedeuten diese? 28.2 Wie lautet die Regressionsgleichung des Modells? Interpretieren Sie die Bedeutung der einzelnen Variablen für das Gesamtmodell? Welche Variable hat den größten Einfluss auf das Traditionelle Familienbild? Anhand welcher Werte lesen Sie das ab? 28.3 Führen Sie eine graphische Analyse der Residuen durch, indem Sie zumindest drei Scatterplots erstellen: Auf der y-achse tragen Sie die standardisierten Residuen, auf der x- Achse die Variablen, von denen Sie glauben, dass sie einen weiteren Erklärungsbeitrag liefern können, auf. Welche der graphisch analysierten Variablen könnten Ihrer Meinung nach zur Verbesserung des Regressionsmodells beitragen? Warum? Model 1 Variables Entered/Removed b Variables Variables Entered Removed Method mann, eink2003 Persönliches Netto-Einkommen a. Enter a. All requested variables entered. b. Dependent Variable: famtrad Traditionelles Familienbild Model 1 Model Summary b Adjusted Std. Error of R R Square R Square the Estimate,622 a,387,365 11,36365 a. Predictors: (Constant), mann, eink2003 Persönliches Netto-Einkommen b. Dependent Variable: famtrad Traditionelles Familienbild 18

19 Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 4482, ,158 17,356,000 a 7098, , , a. Predictors: (Constant), mann, eink2003 Persönliches Netto-Einkommen b. Dependent Variable: famtrad Traditionelles Familienbild Model 1 (Constant) eink2003 Persönliches Netto-Einkommen mann Coefficients a a. Dependent Variable: famtrad Traditionelles Familienbild Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. 33,801 4,407 7,670,000 -,006,003 -,256-2,310,025 18,565 3,165,650 5,865,000 Predicted Value Residual Std. Predicted Value Std. Residual Residuals Statistics a Minimum Maximum Mean Std. Deviation N 19, , ,4307 8, , ,97744, , ,734 1,386,000 1, ,038 3,166,000, a. Dependent Variable: famtrad Traditionelles Familienbild Histogram Dependent Variable: Traditionelles Familienbild Frequency Mean = -1,21E-15 Std. Dev. = 0,982 N = 58 Regression Standardized Residual Cases weighted by Gewichtungsfaktor 19

20 Ad 28.1.: Beschreiben Sie ausführlich die Vorgehensweise bei der Bewertung des Modells. Welche Werte ziehen Sie für Ihre Bewertung heran und was bedeuten diese? Auf den ersten Blick ist ersichtlich, dass beide unabhängigen Variablen ins Modell aufgenommen wurden, was bei der Methode Einschluss jedoch keine weitere Aussagekraft hat, da alle Variablen aufgenommen werden, unabhängig von ihrem Einfluss auf die abhängige Variable. Der zweite Blick gilt der ANOVA-Tabelle, aus der ersichtlich wird, dass das Modell insgesamt signifikant ist (p (von F) <= 0,05). In der obigen Tabelle Modellzusammenfassung lesen wir ab, dass rund 38% der Gesamtvarianz des traditionellen Familienbildes durch die beiden Variablen Einkommen und Mann erklärt werden konnten. Für diesen Zuwachs an Erklärungsbeitrag im Vergleich zum vorigen Beispiel, wo ein Bestimmtheitsmaß für die Männer von 4% und für die Frauen von 17% erreicht werden konnte, liegt an der Hinzunahme der Variable Mann. Aus der Koeffiziententabelle wird sichtbar, dass beide Variablen (mann und Einkommen) einen signifikanten Einfluss auf das traditionelle Familienbild ausüben (Vergleich der Signifikanzen, Vergleich der Beta-Koeffizienten). Weiters ist anhand des Histogramms der Residuen ersichtlich, dass die Verteilung bereits deutlich symmetrischer bzw. normalverteilter ist, als es die beiden Verteilungen der Residuen getrennt nach Geschlecht ohne der Variable Mann waren. Doch ist die Verteilung noch immer nicht normalverteilt, weshalb es sich empfiehlt, weitere Variablen für das Modell zu bestimmen. Ad 28.2.: Wie lautet die Regressionsgleichung des Modells? Interpretieren Sie die Bedeutung der einzelnen Variablen für das Gesamtmodell? Welche Variable hat den größten Einfluss auf das Traditionelle Familienbild? Anhand welcher Werte lesen Sie das ab? FAMTRAD = 33,8 0,006 x EINK ,6 x mann Aus der Koeffiziententabelle wird sichtbar, dass die Variable mann einen wesentlich stärkeren Einfluss auf das traditionelle Familienbild ausübt als das Einkommen (Vergleich der Beta-Koeffizienten: auch wenn das Einkommen hoch ist, wird das Produkt nicht so groß wie der Mann-Bonus). Beide Variablen leisten jedoch wie gesagt - einen signifikanten Einfluss für das gesamte Vorhersagemodell. Das Einkommen leistet einen negativen Einfluss: Je höher das Einkommen, desto geringer das traditionelle Familienbild. Die Eigenschaft Mann hat positiven Einfluss: Männer erreichen beim geschätzten traditionellen Familienbild höhere Werte als Frauen. Ad Führen Sie eine graphische Analyse der Residuen durch, indem Sie zumindest drei Scatterplots erstellen: Auf der y-achse tragen Sie die standardisierten Residuen, auf der x- Achse die Variablen, von denen Sie glauben, dass sie einen weiteren Erklärungsbeitrag liefern können, auf. Welche der graphisch analysierten Variablen könnten Ihrer Meinung nach zur Verbesserung des Regressionsmodells beitragen? Warum? Erste Variable: alter03: Kein Einfluss nur 1,4% der Varianz der Residuen wird erklärt. 20

21 4 2 Geschlecht männlich weiblich Fit line for Total Fit line for männlich Fit line for weiblich Standardized Residual 0-2 R Sq Linear = 6,694E-4 R Sq Linear = 0,032-4 R Sq Linear = 0, Alter des Befragten Cases weighted by Gewichtungsfaktor Zweite Variable: g106: Hausarbeitszeit: kein Einfluss: 1,5% der Varianz der Residuen wird erklärt. 4 3 Geschlecht männlich weiblich Fit line for Total Fit line for männlich Fit line for weiblich Standardized Residual R Sq Linear = 0,062 R Sq Linear = 0,004-2 R Sq Linear = 0, Hausarbeitszeit pro Woche in Stunden Cases weighted by Gewichtungsfaktor 40 Auf der Suche nach weiteren Variablen wird man nicht wirklich fündig, ich habe dann Variable e84 Kontrolle im Leben (Skala 1 (überhaupt keine Freiheit) bis 10 (sehr große Freiheit)) ausprobiert, und einen deutlichen Einfluss auf die Residuen messen können: 21

22 Dritte Variable: e84: Kontrolle im Leben: 15% der Varianz der Residuen wird erklärt (= Korrelation mit den Residuen: 0,38). 4 Geschlecht männlich weiblich Fit line for Total Fit line for männlich 2 Fit line for weiblich Standardized Residual 0 Nur für die Männer gilt dieser -2 R Sq Linear = 0,008 Zusammenhang. R Sq Linear = 0,364-4 R Sq Linear = 0, Kontrolle im Leben Cases weighted by Gewichtungsfaktor 22

23 Beispiel 29 Berechnen Sie eine Regressionsanalyse analog dem vorigen Beispiel, in der Sie die von Ihnen ausgewählte/gebildete Variable zusätzlich zu den in Beispiel 26 bereits einbezogenen hinzuziehen. Wählen Sie diesmal die Methode Schrittweise. Welche Variablen werden in das Regressionsmodell aufgenommen, welche nicht? Hat sich durch Ihre Variable das Regressionsmodell verbessert? Die Variable e84 Kontrolle im Leben zeigte einen deutlichen Einfluss auf die Residuen der vorigen Regressionsanalyse, weshalb diese Variable nun in ein weiteres Modell mit schrittweiser Methode aufgenommen wird. Model Variables Entered/Removed a Variables Entered Method mann Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). e84 Kontrolle im Leben Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). eink2003 Persönliches Netto-Einkommen a. Dependent Variable: famtrad Traditionelles Familienbild Stepwise (Criteria: Probability-of-F-to-enter <=,050, Probability-of-F-to-remove >=,100). Model Model Summary d Adjusted Std. Error of the R R Square R Square Estimate,572 a,328,316 11,79556,645 b,417,395 11,08704,695 c,483,454 10,53559 a. Predictors: (Constant), mann b. Predictors: (Constant), mann, e84 Kontrolle im Leben c. Predictors: (Constant), mann, e84 Kontrolle im Leben, eink2003 Persönliches Netto-Einkommen d. Dependent Variable: famtrad Traditionelles Familienbild 23

24 Model Regression Residual Total Regression Residual Total Regression Residual Total ANOVA d Sum of Squares df Mean Square F Sig. 3793, ,303 27,263,000 a 7787, , , , ,844 19,621,000 b 6757, , , , ,388 16,787,000 c 5990, , , a. Predictors: (Constant), mann b. Predictors: (Constant), mann, e84 Kontrolle im Leben c. Predictors: (Constant), mann, e84 Kontrolle im Leben, eink2003 Persönliches Netto-Einkommen d. Dependent Variable: famtrad Traditionelles Familienbild Model (Constant) mann (Constant) mann e84 Kontrolle im Leben (Constant) mann e84 Kontrolle im Leben eink2003 Persönliches Netto-Einkommen Coefficients a a. Dependent Variable: famtrad Traditionelles Familienbild Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. 25,089 2,367 10,6,000 16,346 3,131,572 5,221,000,656 8,727,075,940 18,510 3,036,648 6,097,000 2,994 1,034,308 2,895,005 8,927 8,870 1,006,319 20,934 3,029,733 6,912,000 3,107,983,319 3,159,003 -,006,002 -,270-2,63,011 Model 1 2 eink2003 Persönliches Netto-Einkommen e84 Kontrolle im Leben eink2003 Persönliches Netto-Einkommen a. Predictors in the Model: (Constant), mann Excluded Variables c b. Predictors in the Model: (Constant), mann, e84 Kontrolle im Leben c. Dependent Variable: famtrad Traditionelles Familienbild Collinearity Partial Statistics Beta In t Sig. Correlation Tolerance -,256 a -2,310,025 -,297,908,308 a 2,895,005,364,939 -,270 b -2,628,011 -,337,906 Alle gewählten Variablen, darunter auch die Variable e84 Kontrolle im Leben, werden in das Modell aufgenommen. Den stärksten Einfluss hat die Variable mann (Vergleich Beta- Koeffizienten und Signifikanzen der Koeffizienten) und wird als erstes ins Modell aufgenommen. Männliches Geschlecht bewirkt einen höheren Schätzwert beim traditionellen Familienbild. Im zweiten Schritt wird die Variable e84 Kontrolle im Leben ins Modell 24

25 aufgenommen (die Korrelation mit den Residuen beträgt laut Tabelle Ausgeschlossene Variablen 0,36). Inhaltlich bedeutet dies: Je mehr Freiheit jemand genießt, desto höher das vorhergesagte traditionelle Familienbild (Dies gilt aber eben bei genauerer Betrachtungsweise nur für die Männer). Und schließlich wird im dritten Schritt auch noch das Einkommen, mit dem geringsten, aber signifikanten negativen Einfluss ins Modell aufgenommen. Das erreicht insgesamt 48% an erklärter Gesamtvarianz des traditionellen Familienbildes bei den BeamtInnen. Allerdings wird auch deutlich, dass die Konstante ab dem zweiten Schritt nicht mehr signifikant ist (Koeffiziententabelle), weshalb sie in der Schätzfunktion nicht verwendet werden dürfte. Die Residuen sind nach dieser Analyse bereits annähernd normalverteilt, was aus dem Histogramm ersichtlich wird. Histogram Dependent Variable: Traditionelles Familienbild Frequency Mean = 2,01E-16 Std. Dev. = 0,973 N = 58 Regression Standardized Residual Cases weighted by Gewichtungsfaktor 25

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil? AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

VS PLUS

VS PLUS VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Kapitel 4: Merkmalszusammenhänge

Kapitel 4: Merkmalszusammenhänge Kapitel 4: Merkmalszusammenhänge Streudiagramme SPSS bietet die Möglichkeit, verschiedene Arten von Streudiagrammen zu zeichnen. Gehen Sie auf Grafiken Streu-/Punkt-Diagramm und wählen Sie die Option Einfaches

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Kapitel 5: Einfaktorielle Varianzanalyse Durchführung einer einfaktoriellen Varianzanalyse ohne Messwiederholung Dieser Abschnitt zeigt die Durchführung der in Kapitel 5 vorgestellten einfaktoriellen Varianzanalyse

Mehr

Tutorial: Rangkorrelation

Tutorial: Rangkorrelation Tutorial: Rangkorrelation In vielen Sportarten gibt es mehr oder weniger ausgefeilte Methoden, nicht nur die momentanen Leistungen (der jetzige Wettkampf, das jetzige Rennen, das jetzige Spiel,..) der

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1- SPSSinteraktiv Signifikanztests (Teil ) - - Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil - t-test bei einer Stichprobe - SPSS-Output Der t-test bei einer Stichprobe wird

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Tutorial: Regression Output von R

Tutorial: Regression Output von R Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

Inferenzstatistik Vergleich mehrerer Stichproben - Varianzanalyse

Inferenzstatistik Vergleich mehrerer Stichproben - Varianzanalyse Vergleich mehrerer Stichproben - Varianzanalyse Zweifache VA mit hierarchischen Faktoren Voraussetzungen zwei unabhängige Variablen (Faktoren), die unabhängige Gruppen definiert zweite Faktor ist innerhalb

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:

Mehr

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08 Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06 Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06 Hiermit versichere ich, dass ich an der Universität Freiburg mit dem Hauptfach Psychologie eingeschrieben bin. Name: Mat.Nr.: Unterschrift: Bearbeitungshinweise:

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des. Einfatorielle Varianzanalyse Varianzanalyse untersucht den Einfluss verschiedener Bedingungen ( = nominalsalierte(r) Variable(r)) auf eine metrische Variable. Die Bedingungen heißen auch atoren und ihre

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

SPSS III Mittelwerte vergleichen

SPSS III Mittelwerte vergleichen SPSS III Mittelwerte vergleichen A Zwei Gruppen ------------ Zwei-Stichproben t-test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen

Mehr

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav.

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav. Kapitel 5 FRAGESTELLUNG 1 Öffne die Datei alctobac.sav. Zuerst werden wir ein Streudiagramm erstellen, um einen grafischen Überblick von diesem Datensatz zu erhalten. Gehe dazu auf Grafiken / Streudiagramm

Mehr

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen - nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Kapitel 4: Merkmalszusammenhänge

Kapitel 4: Merkmalszusammenhänge Kapitel 4: Merkmalszusammenhänge Streudiagramme 1 Korrelationen 3 Lineare Regression 6 Zusammenhang zwischen Korrelation, Regression und t-test 8 Streudiagramme SPSS bietet die Möglichkeit, verschiedene

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II 1.1 Durch welche Elemente lässt sich laut der Formel für die multiple Regression der Wert einer Person auf einer bestimmten abhängigen Variable Y vorhersagen? a)

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Aufgabe 1: Von den Patienten einer Klinik geben 70% an, Masern gehabt zu haben, und 60% erinnerten sich an eine Windpockeninfektion. An mindestens einer

Mehr

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der

Mehr

Test auf Varianzgleichheit (F-Test) (einseitiger Test!!)

Test auf Varianzgleichheit (F-Test) (einseitiger Test!!) T-Tests in Excel T-Tests in Excel Test auf Varianzgleichheit (F-Test) (einseitiger Test!!)! Annahmen:! Unabhängige Stichproben! Normalverteilte Grundgesamtheiten H0 : σx = σ y; H0 : σx > σ y Sx σ x F =

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie! Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies

Mehr

Beurteilende Statistik

Beurteilende Statistik Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten

Mehr

Lösungen zum SPSS-Buch zweiter Teil Einführung in das quantitativ orientierte Forschen

Lösungen zum SPSS-Buch zweiter Teil Einführung in das quantitativ orientierte Forschen 1 Lösungen zum SPSS-Buch zweiter Teil Einführung in das quantitativ orientierte Forschen 2. Auflage Allgemeine Anmerkung Die Interpretationen zur Signifikanz erfolgen auf dem 5%-Nieveau. Kapitel 8 Studienaufgabe

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36) Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7

Mehr

Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops

Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops Auswertung: Irina Zamfirescu Auftraggeber: Mag. Klaus Brehm Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops Fragestellung: Wirkt sich

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167 Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese: 2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende im Sommersemester 2012 Prof. Dr. H. Küchenhoff, J. Brandt, G. Schollmeyer, G. Walter Aufgabe 1 Betrachten

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 1 Maßzahlen für den Zusammenhang zwischen Merkmalen Kontingenztabelle:

Mehr

Datenanalyse mit Excel und Gretl

Datenanalyse mit Excel und Gretl Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154 Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch

Mehr

SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab.

SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab. SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests A parametrisch -- ANOVA Beispieldatei: Seegräser_ANOVA H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab. µ

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Biostatistik Erne Einfuhrung fur Biowissenschaftler Matthias Rudolf Wiltrud Kuhlisch Biostatistik Erne Einfuhrung fur Biowissenschaftler PEARSON Studium Inhaltsverzeichnis Vorwort xi Kapitel 1 Einfiihrung 1 1.1 Biostatistik als Bestandteil biowissenschafllicher

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr