Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II

Größe: px
Ab Seite anzeigen:

Download "Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II"

Transkript

1 Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II

2 Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2

3 Programm Wiederholung der Parameterinterpretation in der logistischen Regression Berechnung von konkreten vorhergesagten Wahrscheinlichkeiten aus der logistischen Regression Wiederholung Interpretation lineare Regression Übungsaufgabe Literatur # 3

4 Beispiel Modellschätzung mit SPSS In der letzten Sitzung wurde untersucht ob das Alter und die sportliche Betätigung einen Einfluss auf die Wahrscheinlichkeit zu rauchen haben. Heute wollen wir untersuchen ob darüber hinaus die Tatsache, dass mindestens ein Kind im Haushalt lebt die Rauchwahrscheinlichkeit beeinflusst. Es werden also folgende unabhängige Variablen in das Modell aufgenommen: Alter (zentriert um den Mittelwert 40,045) Stunden Sport pro Monat (zentriert um den Mittelwert 1,01) Kind im Haushalt (Dummyvariable für Kind im Haushalt = 1; für kein Kind = 0) # 4

5 Beispiel Modellschätzung mit SPSS Vorbereiten der abhängigen Variable: recode v24 (1 2=1) (3=0) into rauch. val lab rauch 0 'Nein' 1 'Ja'. var lab rauch 'Raucher?'. Vorbereiten der unabhängigen Variablen: Alter in Jahrzehnten bilden compute alter10=(2015-v56)/10. var lab alter10 'Alter in Jahrzehnten'. Stunden Sport pro Monat bilden if v19>-77 spomo=v19*4. if v20>-77 spomo=v20. if v17=1 and v18=1spomo=0. var lab spomo "Sport pro Monat in Stunden". missing values spomo ( ). Kind im Haushalt kodieren compute kinder=v35-1. var lab kinder "Kinder im Haushalt". # 5

6 Beispiel Modellschätzung mit SPSS Vorbereiten der unabhängigen Variablen: Mittelwert für Zentrierung ermitteln: zunächst beschränken auf die Fälle, die auch in die Regression eingehen. Dann Mittelwerte für Alter und Sport pto Monat ausgeben lassen. temp. select if alter10 < 100 & rauch < 2 & spomo < 220 & Kinder < 2. mean alter10 spomo. Zentrieren compute alter10_z = alter compute spomo_z = spomo Durchführen der Regression: logistic regression rauch /method=enter alter10_z spomo_z kinder /save pred. # 6

7 Beispiel Modellschätzung mit SPSS Omnibus-Tests der Modellkoeffizienten Chi-Quadrat df Sig. Schritt 1 Schritt 22,325 3,000 Block 22,325 3,000 Modell 22,325 3,000 Modellübersicht -2 Log- Likelihood R-Quadrat nach Cox & Snell R-Quadrat nach Nagelkerke 855,670 0,032,044 a. Schätzung beendet bei Iteration Nummer 4, weil die Parameterschätzungen sich um weniger als,001 änderten. LR-Chi²-Test: Unabhängige Variablen tragen zur Erklärung der abhängigen Variable bei. Das Modell mit Einflussvariablen ist höchstsignifikant besser als das Nullmodell. Die beiden alternativen R²- Werte deuten auf sehr niedrige Modellgüte hin. # 7

8 Beispiel Modellschätzung mit SPSS Vorzeicheninterpretation (Spalte B): Variablen in der Gleichung B Standardfehler Wald df Sig. Exp(B) Schritt 1 a alter10_z,105,070 2,298 1,130 1,111 spomo_z,031,007 17,673 1,000 1,032 kinder,193,168 1,319 1,251 1,213 Konstante -,933,122 58,085 1,000,393 a. In Schritt 1 eingegebene Variable(n): alter10_z, spomo_z, kinder. Ältere Personen sind mit höherer Wahrscheinlichkeit Raucher als jüngere Personen. Dieser Effekt ist nicht signifikant Je höher die sportliche Betätigung umso größer ist die Wahrscheinlichkeit zu Rauchen. Dieser Effekt ist höchst signifikant Menschen mit Kindern im Haushalt rauchen mit höherer Wahrscheinlichkeit. Dieser Effekt ist nicht signifikant # 8

9 Beispiel Modellschätzung mit SPSS Variablen in der Gleichung B Standardfehler Wald df Sig. Exp(B) Schritt 1 a alter10_z,105,070 2,298 1,130 1,111 spomo_z,031,007 17,673 1,000 1,032 kinder,193,168 1,319 1,251 1,213 Konstante -,933,122 58,085 1,000,393 a. In Schritt 1 eingegebene Variable(n): alter10_z, spomo_z, kinder. Interpretation der Odds-Ratios (Spalte Exp(B)): Steigt das Alter um 10 Jahre, so ist die Chance Raucher zu sein 1,11 mal so groß. Jemand, der eine Stunde mehr Sport pro Monat macht, hat eine 1,03mal so große Chance Raucher zu sein. Menschen mit Kindern im Haushalt haben eine um 21,3% höhere Chance Raucher zu sein. Formel: (exp(b) - 1) * 100% = (1,213-1) * 100% = 21,3% # 9

10 Berechnen von konkreten Wahrscheinlichkeiten Ziel: Berechnen einer konkreten Wahrscheinlichkeit für eine bestimmte Kombination von Merkmalen Hierzu werden analog zur multiplen (OLS) Regression die Koeffizienten multipliziert mit der Ausprägung aufsummiert, danach aber gemäß der logistischen Funktion transformiert. P i 1 e 1 ( 0 1Xi1... m X im ) 1 1 e z i # 10

11 Beispiel: Berechnen von konkreten Wahrscheinlichkeiten Die Summe des Logits für eine Person ohne Kinder im Haushalt sowie mit durchschnittlichem Alter und durchschnittlicher sportlicher Betätigung ist B alter10_z, spomo_z, Kinder, Konstante -, , *0, *0, *0, = -0, Die Wahrscheinlichkeit, zu rauchen, ist dann: 1 0,393 ( 0,933) also ca. 39,0% 1 e Achtung: Wenn wenige Nachkommastellen berücksichtigt werden, kann die errechnete Wahrscheinlichkeit leicht deutlich kleiner oder größer werden! (Dies ist hier jedoch nicht der Fall). # 11

12 Berechnen von konkreten Wahrscheinlichkeiten Dieselbe Person, aber mit Kindern im Haushalt: -0, *0, *0, *0, = -0,740. B alter10_z, spomo_z, Kinder, Konstante -, Die Wahrscheinlichkeit, Raucher zu sein, ist dann: 1 e 1 ( 0,740) 0,323 also ca. 32,3%. Vorsicht: Das Vorzeichen für die Summe der Logits dreht sich gemäß Formel um! 1 y 1 e x # 12

13 Berechnen von konkreten Wahrscheinlichkeiten B alter10_z, spomo_z, Kinder, Konstante -, Die Summe des Logits für jemanden der 10 Jahre älter als der Durchschnitt ist, eine Stunde pro Monat mehr Sport als der Durchschnitt macht und mit Kindern im Haushalt lebt ist -0, *0, *0, *0, = -0,603. Die Wahrscheinlichkeit, zu rauchen, ist dann: 1 e 1 ( 0,603) 0,354 also ca. 35,4% # 13

14 Berechnen von konkreten Wahrscheinlichkeiten B alter10_z, spomo_z, Kinder, Konstante -, Die Summe des Logits für jemanden der 30 Jahre älter als der Durchschnitt ist, 10 Stunden pro Monat weniger Sport als der Durchschnitt macht und mit Kindern im Haushalt lebt ist -0, *0, *0, *0, = -0,735. Die Wahrscheinlichkeit, zu rauchen, ist dann: 1 e 1 ( 0,735) 0,324 also ca. 32,4% # 14

15 Wiederholung Interpretation lineare Regression Zentrierung Das Haushaltseinkommen soll durch das Alter, die Arbeitszeit und das Geschlecht erklärt werden. Das Modell basiert auf folgender Syntax: *Vorbereiten der UV Arbeitszeit, Geschlecht und Alter. compute alter10_z1=((2015-v56) )/10. var lab alter10_z1 'Alter in Jahrzehnten zentriert'. compute arbz=v51. if v50=2 arbz=0. compute arbz_z=arbz var lab arbz_z 'Arbeitszeit zentriert'. recode v55 (1=0) (2=1) into frau. var lab frau Frau. *Modell. regression /dependent eink_imputiert /method=enter alter10_z1 frau arbz_z. *AV Einkommen vorbereiten. comp eink_imputiert=v53. if v54=2 eink_imputiert=375. if v54=4 eink_imputiert=875. if v54=8 eink_imputiert=2125. if v54=9 eink_imputiert=2375. if v54=10 eink_imputiert=2625. if v54=11 eink_imputiert=2875. if v54=14 eink_imputiert=4250. if v54=15 eink_imputiert=4750. if v54=19 eink_imputiert=0. # 15

16 Wiederholung Interpretation lineare Regression Zentrierung 9,8 Prozent der Varianz des individuellen Einkommens werden durch die unabhängigen Variablen erklärt. R- Angepasstes Standardfehler R Quadrat R-Quadrat der Schätzung,313 a,098, ,149 Nicht standardisierte Standardisierte Koeffizienten Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2605,878 91,417 28,505,000 Alter in Jahrzehnten zentriert 132,079 46,892,103 2,817,005 Frau 105, ,670,033,878,380 Arbeitszeit zentriert 26,303 3,112,315 8,451,000 Um 10 Jahre ältere Personen haben ein um 132 Euro Höheres Haushaltseinkommen. Dieser Effekt ist mit p=0,005 hoch signifikant. Männer haben im Schnitt ein um 106 Euro monatlich geringeres Haushaltseinkommen als Frauen. Dieser Effekt ist mit p=0,380 nicht signifikant. Personen die wöchentlich eine Stunde mehr arbeiten erhalten 26 Euro monatlich mehr Haushaltseinkommen. Dieser Effekt ist mit p=0,000 höchst signifikant. Der betragsmäßig größte Koeffizient in der Spalte Beta gibt den stärksten Effekt an. Hier hat die Arbeitszeit mit Beta=0,315 den stärksten Effekt. # 16

17 Wiederholung Interpretation lineare Regression Zentrierung Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2605,878 91,417 28,505,000 Alter in Jahrzehnten zentriert 132,079 46,892,103 2,817,005 Frau 105, ,670,033,878,380 Arbeitszeit zentriert 26,303 3,112,315 8,451,000 Interpretation der Konstanten: Männer, mit durchschnittlichem Alter und durchschnittlicher Arbeitszeit, haben im Mittel ein Haushaltseinkommen von 2605,9 Euro. Die Konstante lässt sich dank der Zentrierung als Ausprägung der abhängigen Variable für durchschnittliche Ausprägungen der zentrierten unabhängigen Variablen für Personen die der Referenzkategorie angehören interpretieren. Wenn nicht zentriert wäre, enthielte die Konstante Informationen über 0 Jahre alte Personen die 0 Stunden Erwerbsarbeit verrichten! # 17

18 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Modell mit Quadratischem Alterseffekt Compute alter10_z_quad=alter10_z1*alter10_z1. Regression /dependent eink_imputiert /method=enter alter10_z1 alter10_z_quad frau arbz_z. Modellübersicht Angepasstes Standardfehler Modell R R-Quadrat R-Quadrat der Schätzung 1,333 a,111, ,22280 Das Modell ist nur wenig besser als das vorige Modell. Der Wert des korrigierten r 2 verändert sich von 0,094 auf 0,106. # 18

19 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2766, ,208 26,801,000 Alter in Jahrzehnten zentriert 193,016 50,177,150 3,847,000 Alter in Jahrzehnten zentriert quadriert -104,568 30,015 -,130-3,266,001 Frau 97, ,897,031,817,414 Arbeitszeit zentriert 23,665 3,195,283 7,406,000 Da der quadratische Effekt ein negatives Vorzeichen hat, ist der Alterseffekt umgekehrt U-förmig. Der lineare Effekt ist mit p=0,000 höchst signifikant Der quadratische Effekt ist mit p=0,001 hoch signifikant # 19

20 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2766, ,208 26,801,000 Alter in Jahrzehnten zentriert 193,016 50,177,150 3,847,000 Alter in Jahrzehnten zentriert quadriert -104,568 30,015 -,130-3,266,001 Frau 97, ,897,031,817,414 Arbeitszeit zentriert 23,665 3,195,283 7,406,000 Um herauszufinden, bei welchem Alter das Haushaltseinkommen am größten ist, muss die erste Ableitung nach dem Alter gleich Null gesetzt werden: β 1 Alter + β 2 Alter 2 Erste Ableitung nach Alter: β β 2 Alter = 0 2 β 2 Alter = β 1 Alter = β 1 2 β 2 = 193,016 2 ( 104,568) = 0,923 Personen, die 9,2 Jahre älter als der Durschnitt (40,9 Jahre) sind haben das höchste Haushaltseinkommen. # 20

21 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2766, ,208 26,801,000 Alter in Jahrzehnten zentriert 193,016 50,177,150 3,847,000 Alter in Jahrzehnten zentriert quadriert -104,568 30,015 -,130-3,266,001 Frau 97, ,897,031,817,414 Arbeitszeit zentriert 23,665 3,195,283 7,406,000 Interpretation der Konstanten Männer mit durchschnittlichem Alter und durchschnittlicher Arbeitszeit haben ein Haushaltseinkommen von 2766 Euro im Monat. # 21

22 Organisatorisches Klausur und Tutorientermine Die Klausur findet am um 10 Uhr ausschließlich im Hörsaal A 140 im Hauptgebäude statt. Die Klausur findet nicht in der Oettingenstraße statt! Bringen Sie zur Klausur sowie zu den Übungen und Tutorien einen Taschenrechner mit! 22

23 Übungsaufgabe Haben ältere, verheiratete und höher gebildete Personen eher Kinder? Replizieren Sie das Übungsbeispiel zur Wahrscheinlichkeit Kinder zu haben von letzter Woche und rechnen Sie eine Regression mit den Einflussvariablen Alter, hohe Bildung und dem Familienstand (verheiratet). Berechnen Sie die Wahrscheinlichkeit, dass jemand, der 25 Jahre alt, höher gebildet und nicht verheiratet ist, Kinder hat. Berechnen Sie die Wahrscheinlichkeit, dass jemand, der 40 Jahre alt, nicht höher gebildet und verheiratet ist, Kinder hat. # 23

24 Literatur Backhaus, Klaus u.a. (2005): Multivariate Analysemethoden, 11. Aufl. Berlin u.a.: Springer, Kapitel 7. Bühl, Achim (2006): SPSS 14. Einührung in die moderne Datenanalyse, 10. Aufl. München: Pearson, S. 372ff. Greene, William (1993): Ecomometric Analysis. 2nd ed., New York, Kap. 21. Long, Scott und Jeremy Freese (2006): Regression Models for Categorial Dependent Variables, College Station, Texas: Stata Press, Kapitel 4. # 24

25 Alter N Mittelwert Gültig 775 Fehlend 87 Standardfehler des Mittelwertes Median Modus Standardabweichung Varianz Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Spannweite Minimum Maximum Summe 40,8645, , ,00 12, ,952,494,088 -,317,175 57,00 19,00 76, ,00 # 25

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Logistische Regression

Logistische Regression Logistische Regression Teil 2: Beispiel Dirk Enzmann Fortgeschrittene quantitative Methoden der Kriminologie 29.04.206 Universität Hamburg Dirk Enzmann (Hamburg) Logistische Regression UHH, 29.04.206 /

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt

Mehr

Übung zur Logistischen Regression Juli 2011

Übung zur Logistischen Regression Juli 2011 Lehrveranstaltung Empirische Forschung und Politikberatung Sommersemester 2011 Übung zur Logistischen Regression - - - - - 1.Juli 2011 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2: Qualifikation,

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz. Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil? AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei

Mehr

Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell

Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS 2002/2003-1 Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell von XENOPHOB auf V247 und POSTMAT, MATERIAL Für unsere

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen

Mehr

Kreuzvalidierung. 1. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS:

Kreuzvalidierung. 1. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS: Kreuzvalidierung. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS: SPSS erzeugt eine neue Variable Filter_$. Die herausgefilterten Fälle werden im Datenfenster angezeigt

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Statistik II Übung 3: Hypothesentests

Statistik II Übung 3: Hypothesentests Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

VS PLUS

VS PLUS VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21

Mehr

Regressionsanalysen mit Stata

Regressionsanalysen mit Stata Regressionsanalysen mit Stata Wiederholung: Deskriptive Analysen - Univariate deskriptive Analysen (Häufigkeitsauszählungen einer Variablen) - Multivariate deskriptive Analysen (Untersuchung gemeinsamer

Mehr

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt. Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.

Mehr

Geschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3

Geschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3 Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3 Geschlecht + Anfangsgehalt 14000 399 403 7000 12000 335 Anfangsgehalt 10000 8000 6000 4000 2000 N = 28 63 185 291 227 52 215 158 88 284 193

Mehr

Name Vorname Matrikelnummer Unterschrift

Name Vorname Matrikelnummer Unterschrift Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe

Mehr

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode? Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2

Mehr

Aufgaben zu Kapitel 8

Aufgaben zu Kapitel 8 Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.

Mehr

Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1

Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1 2.1 Beispiele 2.2 Odds Ratio 2.3 Modell der logistischen Regression 2.3.1 Modellgleichung 2.3.2 Voraussetzungen 2.4 Schätzungen, Tests und Modellgüte 2.4.1 Schätzung der logistischen Regressionskoeffizienten

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis

1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis 1. Inhaltsverzeichnis 1. Inhaltsverzeichnis... 1 2. Abbildungsverzeichnis... 1 3. Einleitung... 2 4. Beschreibung der Datenquelle...2 5. Allgemeine Auswertungen...3 6. Detaillierte Auswertungen... 7 Zusammenhang

Mehr

Ergebnisse VitA und VitVM

Ergebnisse VitA und VitVM Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15

Mehr

B. Regressionsanalyse [progdat.sav]

B. Regressionsanalyse [progdat.sav] SPSS-PC-ÜBUNG Seite 9 B. Regressionsanalyse [progdat.sav] Ein Unternehmen möchte den zukünftigen Absatz in Abhängigkeit von den Werbeausgaben und der Anzahl der Filialen prognostizieren. Dazu wurden über

Mehr

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Inhaltsverzeichnis. Über die Autoren Einleitung... 21 Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Multivariate Analyse: Einführung in das COX-Modell

Multivariate Analyse: Einführung in das COX-Modell Auswertung Multivariate Analyse: Einführung in das COX-Modell Deskriptive Statistik Häufigkeiten, Univariate Statistiken, Explorative Datenanalyse, Kreuztabellen) Induktive Statistik, Vergleich von Mittelwerten

Mehr

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall.. Kapitel : Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall.. Mittelwert = Summe aller Einzelwerte / n = durchschnittliche Ausprägung, wenn alle gleich viel hätten. Streuung =

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Übung 1: Wiederholung Wahrscheinlichkeitstheorie Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable

Mehr

Statistik II Übung 3: Hypothesentests Aktualisiert am

Statistik II Übung 3: Hypothesentests Aktualisiert am Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier

Mehr

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit 2. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle In vielen Untersuchungen soll eine komplexere Beziehungsstruktur untersucht werden.

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Statistische Modellierung Merkblatt

Statistische Modellierung Merkblatt Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC

Mehr

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 6 Seite 1 Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische

Mehr

Das multiple lineare Regressionsmodell

Das multiple lineare Regressionsmodell Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?

Mehr

Marketing III - Angewandte Marktforschung (SS 2016)

Marketing III - Angewandte Marktforschung (SS 2016) TECHNISCHE UNIVERSITÄT ILMENAU Fakultät für Wirtschaftswissenschaften und Medien Fachgebiet Marketing Univ.-Prof. Dr. rer. pol. habil. Anja Geigenmüller Marketing III - Angewandte Marktforschung (SS 2016)

Mehr

Analyse von Querschnittsdaten. Signifikanztests II Advanced Stuff

Analyse von Querschnittsdaten. Signifikanztests II Advanced Stuff Analyse von Querschnittsdaten Signifikanztests II Advanced Stuff Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum..4..4 7..4..4..4 7..4 4..4..4

Mehr

Korrelation, Regression und Signifikanz

Korrelation, Regression und Signifikanz Professur Forschungsmethodik und Evaluation in der Psychologie Übung Methodenlehre I, und Daten einlesen in SPSS Datei Textdaten lesen... https://d3njjcbhbojbot.cloudfront.net/api/utilities/v1/imageproxy/https://d15cw65ipcts

Mehr

Logistische Regression (in SPSS)

Logistische Regression (in SPSS) Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Logistische Regression (in SPSS) Stand: April 2015 (V2.0) Inhaltsverzeichnis 1. Grundlagen 3 2. Logit-Funktion

Mehr

Das lineare Regressionsmodell

Das lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Prof. Dr. Werner Smolny Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Institutsdirektor Das ökonomische

Mehr

1.1. Zusammenhänge und Vorhersagen

1.1. Zusammenhänge und Vorhersagen 1.1. Zusammenhänge und Vorhersagen In diesem Kapitel dreht sich alles um Zusammenhänge und Vorhersagen. Anstatt uns zu fragen Was ist größer / mehr / ausgeprägter?, versuchen wir Aussagen zu treffen wie

Mehr

Logistische Regression

Logistische Regression Grundideen Logistische Regression Exkurs Logistische Regression Auch nachzulesen bei: http://www.psychologie.uniwuerzburg.de/methoden/lehre/skripten/hs_meth_evaluation/hs_evaluation_logistisch eregression.pdf

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Arbeitsbuch zur deskriptiven und induktiven Statistik Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen

Mehr

Literatur: Rudolf & Müller, S Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung Einführung SEM Folie Nr. 1

Literatur: Rudolf & Müller, S Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung Einführung SEM Folie Nr. 1 1 Korrelation und Kausalität 2 Grundsätzliches 3 Pfaddiagramme und lineare Strukturgleichungen 4 Struktur- und Messmodell 5 Modellspezifikation 6 Parameterschätzungen 7 Beurteilung der Schätzergebnisse

Mehr

Wiederholungsübungen zu den Kapiteln 7 bis 11

Wiederholungsübungen zu den Kapiteln 7 bis 11 Mittelwert-Tests Übung Wiederholungsübungen zu den Kapiteln 7 bis 11 In dieser Übung wird der Datensatz 4 verwendet. In dem (fiktiven) Datensatz sind für 50 Personen vier Variablen erfasst: das Geschlecht,

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression

Ergänzung der Aufgabe Mindestlöhne zu einer multiplen Regression Prof. Dr. Peter von der Lippe ( Übungsblatt E) Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression Das Beispiel "Mindestlöhne" zur einfachen multiplen Regression ergab die folgenden Parameter

Mehr

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008 L. Fahrmeir, G. Walter Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 7. Februar 8 Hinweise:. Überprüfen

Mehr

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1 SPSS-Ausgabe : Univariate Varianzanalyse [DatenSet] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav Tests der Zwischensubjekteffekte Abhängige Variable: Einkommen Quelle Korrigiertes Modell Konstanter

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test)

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test) Test von Hyothesen: Signifikanz des Zusammenhangs (F-Test) Die Schätzung der Regressionsfunktion basiert auf Daten einer Stichrobe Inwiefern können die Ergebnisse dieser Schätzung auf die Grundgesamtheit

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a)

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a) LÖSUNG 7 a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Aufrufen der Varianzanalyse: "Analysieren", "Mittelwerte vergleichen", "Einfaktorielle ANOVA ", "Abhängige Variablen:" TVHOURS;

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle

Mehr

Univariate Kennwerte mit SPSS

Univariate Kennwerte mit SPSS Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der

Mehr

Lösungen zur Klausur zur Statistik Übung am

Lösungen zur Klausur zur Statistik Übung am Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

Sonderanhang: Manuelle Berechnungen der Statistikaufgaben

Sonderanhang: Manuelle Berechnungen der Statistikaufgaben Albert/Marx 0: Empirisches Arbeiten Sonderanhang: Manuelle Berechnungen der Statistikaufgaben Kaum jemand führt heutzutage statistische Berechnungen noch von Hand durch, weil es sehr viele Computerprogramme

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr