Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II
|
|
- Franka Kaufman
- vor 7 Jahren
- Abrufe
Transkript
1 Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II
2 Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2
3 Programm Wiederholung der Parameterinterpretation in der logistischen Regression Berechnung von konkreten vorhergesagten Wahrscheinlichkeiten aus der logistischen Regression Wiederholung Interpretation lineare Regression Übungsaufgabe Literatur # 3
4 Beispiel Modellschätzung mit SPSS In der letzten Sitzung wurde untersucht ob das Alter und die sportliche Betätigung einen Einfluss auf die Wahrscheinlichkeit zu rauchen haben. Heute wollen wir untersuchen ob darüber hinaus die Tatsache, dass mindestens ein Kind im Haushalt lebt die Rauchwahrscheinlichkeit beeinflusst. Es werden also folgende unabhängige Variablen in das Modell aufgenommen: Alter (zentriert um den Mittelwert 40,045) Stunden Sport pro Monat (zentriert um den Mittelwert 1,01) Kind im Haushalt (Dummyvariable für Kind im Haushalt = 1; für kein Kind = 0) # 4
5 Beispiel Modellschätzung mit SPSS Vorbereiten der abhängigen Variable: recode v24 (1 2=1) (3=0) into rauch. val lab rauch 0 'Nein' 1 'Ja'. var lab rauch 'Raucher?'. Vorbereiten der unabhängigen Variablen: Alter in Jahrzehnten bilden compute alter10=(2015-v56)/10. var lab alter10 'Alter in Jahrzehnten'. Stunden Sport pro Monat bilden if v19>-77 spomo=v19*4. if v20>-77 spomo=v20. if v17=1 and v18=1spomo=0. var lab spomo "Sport pro Monat in Stunden". missing values spomo ( ). Kind im Haushalt kodieren compute kinder=v35-1. var lab kinder "Kinder im Haushalt". # 5
6 Beispiel Modellschätzung mit SPSS Vorbereiten der unabhängigen Variablen: Mittelwert für Zentrierung ermitteln: zunächst beschränken auf die Fälle, die auch in die Regression eingehen. Dann Mittelwerte für Alter und Sport pto Monat ausgeben lassen. temp. select if alter10 < 100 & rauch < 2 & spomo < 220 & Kinder < 2. mean alter10 spomo. Zentrieren compute alter10_z = alter compute spomo_z = spomo Durchführen der Regression: logistic regression rauch /method=enter alter10_z spomo_z kinder /save pred. # 6
7 Beispiel Modellschätzung mit SPSS Omnibus-Tests der Modellkoeffizienten Chi-Quadrat df Sig. Schritt 1 Schritt 22,325 3,000 Block 22,325 3,000 Modell 22,325 3,000 Modellübersicht -2 Log- Likelihood R-Quadrat nach Cox & Snell R-Quadrat nach Nagelkerke 855,670 0,032,044 a. Schätzung beendet bei Iteration Nummer 4, weil die Parameterschätzungen sich um weniger als,001 änderten. LR-Chi²-Test: Unabhängige Variablen tragen zur Erklärung der abhängigen Variable bei. Das Modell mit Einflussvariablen ist höchstsignifikant besser als das Nullmodell. Die beiden alternativen R²- Werte deuten auf sehr niedrige Modellgüte hin. # 7
8 Beispiel Modellschätzung mit SPSS Vorzeicheninterpretation (Spalte B): Variablen in der Gleichung B Standardfehler Wald df Sig. Exp(B) Schritt 1 a alter10_z,105,070 2,298 1,130 1,111 spomo_z,031,007 17,673 1,000 1,032 kinder,193,168 1,319 1,251 1,213 Konstante -,933,122 58,085 1,000,393 a. In Schritt 1 eingegebene Variable(n): alter10_z, spomo_z, kinder. Ältere Personen sind mit höherer Wahrscheinlichkeit Raucher als jüngere Personen. Dieser Effekt ist nicht signifikant Je höher die sportliche Betätigung umso größer ist die Wahrscheinlichkeit zu Rauchen. Dieser Effekt ist höchst signifikant Menschen mit Kindern im Haushalt rauchen mit höherer Wahrscheinlichkeit. Dieser Effekt ist nicht signifikant # 8
9 Beispiel Modellschätzung mit SPSS Variablen in der Gleichung B Standardfehler Wald df Sig. Exp(B) Schritt 1 a alter10_z,105,070 2,298 1,130 1,111 spomo_z,031,007 17,673 1,000 1,032 kinder,193,168 1,319 1,251 1,213 Konstante -,933,122 58,085 1,000,393 a. In Schritt 1 eingegebene Variable(n): alter10_z, spomo_z, kinder. Interpretation der Odds-Ratios (Spalte Exp(B)): Steigt das Alter um 10 Jahre, so ist die Chance Raucher zu sein 1,11 mal so groß. Jemand, der eine Stunde mehr Sport pro Monat macht, hat eine 1,03mal so große Chance Raucher zu sein. Menschen mit Kindern im Haushalt haben eine um 21,3% höhere Chance Raucher zu sein. Formel: (exp(b) - 1) * 100% = (1,213-1) * 100% = 21,3% # 9
10 Berechnen von konkreten Wahrscheinlichkeiten Ziel: Berechnen einer konkreten Wahrscheinlichkeit für eine bestimmte Kombination von Merkmalen Hierzu werden analog zur multiplen (OLS) Regression die Koeffizienten multipliziert mit der Ausprägung aufsummiert, danach aber gemäß der logistischen Funktion transformiert. P i 1 e 1 ( 0 1Xi1... m X im ) 1 1 e z i # 10
11 Beispiel: Berechnen von konkreten Wahrscheinlichkeiten Die Summe des Logits für eine Person ohne Kinder im Haushalt sowie mit durchschnittlichem Alter und durchschnittlicher sportlicher Betätigung ist B alter10_z, spomo_z, Kinder, Konstante -, , *0, *0, *0, = -0, Die Wahrscheinlichkeit, zu rauchen, ist dann: 1 0,393 ( 0,933) also ca. 39,0% 1 e Achtung: Wenn wenige Nachkommastellen berücksichtigt werden, kann die errechnete Wahrscheinlichkeit leicht deutlich kleiner oder größer werden! (Dies ist hier jedoch nicht der Fall). # 11
12 Berechnen von konkreten Wahrscheinlichkeiten Dieselbe Person, aber mit Kindern im Haushalt: -0, *0, *0, *0, = -0,740. B alter10_z, spomo_z, Kinder, Konstante -, Die Wahrscheinlichkeit, Raucher zu sein, ist dann: 1 e 1 ( 0,740) 0,323 also ca. 32,3%. Vorsicht: Das Vorzeichen für die Summe der Logits dreht sich gemäß Formel um! 1 y 1 e x # 12
13 Berechnen von konkreten Wahrscheinlichkeiten B alter10_z, spomo_z, Kinder, Konstante -, Die Summe des Logits für jemanden der 10 Jahre älter als der Durchschnitt ist, eine Stunde pro Monat mehr Sport als der Durchschnitt macht und mit Kindern im Haushalt lebt ist -0, *0, *0, *0, = -0,603. Die Wahrscheinlichkeit, zu rauchen, ist dann: 1 e 1 ( 0,603) 0,354 also ca. 35,4% # 13
14 Berechnen von konkreten Wahrscheinlichkeiten B alter10_z, spomo_z, Kinder, Konstante -, Die Summe des Logits für jemanden der 30 Jahre älter als der Durchschnitt ist, 10 Stunden pro Monat weniger Sport als der Durchschnitt macht und mit Kindern im Haushalt lebt ist -0, *0, *0, *0, = -0,735. Die Wahrscheinlichkeit, zu rauchen, ist dann: 1 e 1 ( 0,735) 0,324 also ca. 32,4% # 14
15 Wiederholung Interpretation lineare Regression Zentrierung Das Haushaltseinkommen soll durch das Alter, die Arbeitszeit und das Geschlecht erklärt werden. Das Modell basiert auf folgender Syntax: *Vorbereiten der UV Arbeitszeit, Geschlecht und Alter. compute alter10_z1=((2015-v56) )/10. var lab alter10_z1 'Alter in Jahrzehnten zentriert'. compute arbz=v51. if v50=2 arbz=0. compute arbz_z=arbz var lab arbz_z 'Arbeitszeit zentriert'. recode v55 (1=0) (2=1) into frau. var lab frau Frau. *Modell. regression /dependent eink_imputiert /method=enter alter10_z1 frau arbz_z. *AV Einkommen vorbereiten. comp eink_imputiert=v53. if v54=2 eink_imputiert=375. if v54=4 eink_imputiert=875. if v54=8 eink_imputiert=2125. if v54=9 eink_imputiert=2375. if v54=10 eink_imputiert=2625. if v54=11 eink_imputiert=2875. if v54=14 eink_imputiert=4250. if v54=15 eink_imputiert=4750. if v54=19 eink_imputiert=0. # 15
16 Wiederholung Interpretation lineare Regression Zentrierung 9,8 Prozent der Varianz des individuellen Einkommens werden durch die unabhängigen Variablen erklärt. R- Angepasstes Standardfehler R Quadrat R-Quadrat der Schätzung,313 a,098, ,149 Nicht standardisierte Standardisierte Koeffizienten Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2605,878 91,417 28,505,000 Alter in Jahrzehnten zentriert 132,079 46,892,103 2,817,005 Frau 105, ,670,033,878,380 Arbeitszeit zentriert 26,303 3,112,315 8,451,000 Um 10 Jahre ältere Personen haben ein um 132 Euro Höheres Haushaltseinkommen. Dieser Effekt ist mit p=0,005 hoch signifikant. Männer haben im Schnitt ein um 106 Euro monatlich geringeres Haushaltseinkommen als Frauen. Dieser Effekt ist mit p=0,380 nicht signifikant. Personen die wöchentlich eine Stunde mehr arbeiten erhalten 26 Euro monatlich mehr Haushaltseinkommen. Dieser Effekt ist mit p=0,000 höchst signifikant. Der betragsmäßig größte Koeffizient in der Spalte Beta gibt den stärksten Effekt an. Hier hat die Arbeitszeit mit Beta=0,315 den stärksten Effekt. # 16
17 Wiederholung Interpretation lineare Regression Zentrierung Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2605,878 91,417 28,505,000 Alter in Jahrzehnten zentriert 132,079 46,892,103 2,817,005 Frau 105, ,670,033,878,380 Arbeitszeit zentriert 26,303 3,112,315 8,451,000 Interpretation der Konstanten: Männer, mit durchschnittlichem Alter und durchschnittlicher Arbeitszeit, haben im Mittel ein Haushaltseinkommen von 2605,9 Euro. Die Konstante lässt sich dank der Zentrierung als Ausprägung der abhängigen Variable für durchschnittliche Ausprägungen der zentrierten unabhängigen Variablen für Personen die der Referenzkategorie angehören interpretieren. Wenn nicht zentriert wäre, enthielte die Konstante Informationen über 0 Jahre alte Personen die 0 Stunden Erwerbsarbeit verrichten! # 17
18 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Modell mit Quadratischem Alterseffekt Compute alter10_z_quad=alter10_z1*alter10_z1. Regression /dependent eink_imputiert /method=enter alter10_z1 alter10_z_quad frau arbz_z. Modellübersicht Angepasstes Standardfehler Modell R R-Quadrat R-Quadrat der Schätzung 1,333 a,111, ,22280 Das Modell ist nur wenig besser als das vorige Modell. Der Wert des korrigierten r 2 verändert sich von 0,094 auf 0,106. # 18
19 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2766, ,208 26,801,000 Alter in Jahrzehnten zentriert 193,016 50,177,150 3,847,000 Alter in Jahrzehnten zentriert quadriert -104,568 30,015 -,130-3,266,001 Frau 97, ,897,031,817,414 Arbeitszeit zentriert 23,665 3,195,283 7,406,000 Da der quadratische Effekt ein negatives Vorzeichen hat, ist der Alterseffekt umgekehrt U-förmig. Der lineare Effekt ist mit p=0,000 höchst signifikant Der quadratische Effekt ist mit p=0,001 hoch signifikant # 19
20 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2766, ,208 26,801,000 Alter in Jahrzehnten zentriert 193,016 50,177,150 3,847,000 Alter in Jahrzehnten zentriert quadriert -104,568 30,015 -,130-3,266,001 Frau 97, ,897,031,817,414 Arbeitszeit zentriert 23,665 3,195,283 7,406,000 Um herauszufinden, bei welchem Alter das Haushaltseinkommen am größten ist, muss die erste Ableitung nach dem Alter gleich Null gesetzt werden: β 1 Alter + β 2 Alter 2 Erste Ableitung nach Alter: β β 2 Alter = 0 2 β 2 Alter = β 1 Alter = β 1 2 β 2 = 193,016 2 ( 104,568) = 0,923 Personen, die 9,2 Jahre älter als der Durschnitt (40,9 Jahre) sind haben das höchste Haushaltseinkommen. # 20
21 Wiederholung Interpretation lineare Regression Nichtlinearer Effekt Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta t Sig. (Konstante) 2766, ,208 26,801,000 Alter in Jahrzehnten zentriert 193,016 50,177,150 3,847,000 Alter in Jahrzehnten zentriert quadriert -104,568 30,015 -,130-3,266,001 Frau 97, ,897,031,817,414 Arbeitszeit zentriert 23,665 3,195,283 7,406,000 Interpretation der Konstanten Männer mit durchschnittlichem Alter und durchschnittlicher Arbeitszeit haben ein Haushaltseinkommen von 2766 Euro im Monat. # 21
22 Organisatorisches Klausur und Tutorientermine Die Klausur findet am um 10 Uhr ausschließlich im Hörsaal A 140 im Hauptgebäude statt. Die Klausur findet nicht in der Oettingenstraße statt! Bringen Sie zur Klausur sowie zu den Übungen und Tutorien einen Taschenrechner mit! 22
23 Übungsaufgabe Haben ältere, verheiratete und höher gebildete Personen eher Kinder? Replizieren Sie das Übungsbeispiel zur Wahrscheinlichkeit Kinder zu haben von letzter Woche und rechnen Sie eine Regression mit den Einflussvariablen Alter, hohe Bildung und dem Familienstand (verheiratet). Berechnen Sie die Wahrscheinlichkeit, dass jemand, der 25 Jahre alt, höher gebildet und nicht verheiratet ist, Kinder hat. Berechnen Sie die Wahrscheinlichkeit, dass jemand, der 40 Jahre alt, nicht höher gebildet und verheiratet ist, Kinder hat. # 23
24 Literatur Backhaus, Klaus u.a. (2005): Multivariate Analysemethoden, 11. Aufl. Berlin u.a.: Springer, Kapitel 7. Bühl, Achim (2006): SPSS 14. Einührung in die moderne Datenanalyse, 10. Aufl. München: Pearson, S. 372ff. Greene, William (1993): Ecomometric Analysis. 2nd ed., New York, Kap. 21. Long, Scott und Jeremy Freese (2006): Regression Models for Categorial Dependent Variables, College Station, Texas: Stata Press, Kapitel 4. # 24
25 Alter N Mittelwert Gültig 775 Fehlend 87 Standardfehler des Mittelwertes Median Modus Standardabweichung Varianz Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Spannweite Minimum Maximum Summe 40,8645, , ,00 12, ,952,494,088 -,317,175 57,00 19,00 76, ,00 # 25
Empirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrInstitut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I
Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion
Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit
MehrInstitut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression
Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen
MehrKommentierter SPSS-Ausdruck zur logistischen Regression
Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrLogistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios
Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrLogistische Regression
Logistische Regression Teil 2: Beispiel Dirk Enzmann Fortgeschrittene quantitative Methoden der Kriminologie 29.04.206 Universität Hamburg Dirk Enzmann (Hamburg) Logistische Regression UHH, 29.04.206 /
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrZiel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.
Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt
MehrÜbung zur Logistischen Regression Juli 2011
Lehrveranstaltung Empirische Forschung und Politikberatung Sommersemester 2011 Übung zur Logistischen Regression - - - - - 1.Juli 2011 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2: Qualifikation,
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrFortgeschrittene Statistik Logistische Regression
Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den
MehrHäufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
Mehr2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.
Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrProjekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?
AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei
MehrDie Anwendung des globalen und partiellen F-Tests beim Regressionsmodell
Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS 2002/2003-1 Die Anwendung des globalen und partiellen F-Tests beim Regressionsmodell von XENOPHOB auf V247 und POSTMAT, MATERIAL Für unsere
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse
Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen
MehrKreuzvalidierung. 1. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS:
Kreuzvalidierung. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS: SPSS erzeugt eine neue Variable Filter_$. Die herausgefilterten Fälle werden im Datenfenster angezeigt
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrMultivariate Analyseverfahren
Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
MehrRegressionsanalysen mit Stata
Regressionsanalysen mit Stata Wiederholung: Deskriptive Analysen - Univariate deskriptive Analysen (Häufigkeitsauszählungen einer Variablen) - Multivariate deskriptive Analysen (Untersuchung gemeinsamer
MehrSyntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.
Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.
MehrGeschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3
Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3 Geschlecht + Anfangsgehalt 14000 399 403 7000 12000 335 Anfangsgehalt 10000 8000 6000 4000 2000 N = 28 63 185 291 227 52 215 158 88 284 193
MehrName Vorname Matrikelnummer Unterschrift
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe
MehrX =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?
Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2
MehrAufgaben zu Kapitel 8
Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.
MehrDr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1
2.1 Beispiele 2.2 Odds Ratio 2.3 Modell der logistischen Regression 2.3.1 Modellgleichung 2.3.2 Voraussetzungen 2.4 Schätzungen, Tests und Modellgüte 2.4.1 Schätzung der logistischen Regressionskoeffizienten
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
Mehr1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis
1. Inhaltsverzeichnis 1. Inhaltsverzeichnis... 1 2. Abbildungsverzeichnis... 1 3. Einleitung... 2 4. Beschreibung der Datenquelle...2 5. Allgemeine Auswertungen...3 6. Detaillierte Auswertungen... 7 Zusammenhang
MehrErgebnisse VitA und VitVM
Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15
MehrB. Regressionsanalyse [progdat.sav]
SPSS-PC-ÜBUNG Seite 9 B. Regressionsanalyse [progdat.sav] Ein Unternehmen möchte den zukünftigen Absatz in Abhängigkeit von den Werbeausgaben und der Anzahl der Filialen prognostizieren. Dazu wurden über
MehrInhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrKategoriale abhängige Variablen:
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II
MehrMultivariate Analyse: Einführung in das COX-Modell
Auswertung Multivariate Analyse: Einführung in das COX-Modell Deskriptive Statistik Häufigkeiten, Univariate Statistiken, Explorative Datenanalyse, Kreuztabellen) Induktive Statistik, Vergleich von Mittelwerten
Mehr= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..
Kapitel : Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall.. Mittelwert = Summe aller Einzelwerte / n = durchschnittliche Ausprägung, wenn alle gleich viel hätten. Streuung =
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
MehrÜbung 1: Wiederholung Wahrscheinlichkeitstheorie
Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable
MehrStatistik II Übung 3: Hypothesentests Aktualisiert am
Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier
MehrForschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle
Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit 2. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle In vielen Untersuchungen soll eine komplexere Beziehungsstruktur untersucht werden.
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
MehrKapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
MehrStatistische Modellierung Merkblatt
Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC
MehrUnterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 6 Seite 1 Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische
MehrDas multiple lineare Regressionsmodell
Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?
MehrMarketing III - Angewandte Marktforschung (SS 2016)
TECHNISCHE UNIVERSITÄT ILMENAU Fakultät für Wirtschaftswissenschaften und Medien Fachgebiet Marketing Univ.-Prof. Dr. rer. pol. habil. Anja Geigenmüller Marketing III - Angewandte Marktforschung (SS 2016)
MehrAnalyse von Querschnittsdaten. Signifikanztests II Advanced Stuff
Analyse von Querschnittsdaten Signifikanztests II Advanced Stuff Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum..4..4 7..4..4..4 7..4 4..4..4
MehrKorrelation, Regression und Signifikanz
Professur Forschungsmethodik und Evaluation in der Psychologie Übung Methodenlehre I, und Daten einlesen in SPSS Datei Textdaten lesen... https://d3njjcbhbojbot.cloudfront.net/api/utilities/v1/imageproxy/https://d15cw65ipcts
MehrLogistische Regression (in SPSS)
Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Logistische Regression (in SPSS) Stand: April 2015 (V2.0) Inhaltsverzeichnis 1. Grundlagen 3 2. Logit-Funktion
MehrDas lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Prof. Dr. Werner Smolny Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Institutsdirektor Das ökonomische
Mehr1.1. Zusammenhänge und Vorhersagen
1.1. Zusammenhänge und Vorhersagen In diesem Kapitel dreht sich alles um Zusammenhänge und Vorhersagen. Anstatt uns zu fragen Was ist größer / mehr / ausgeprägter?, versuchen wir Aussagen zu treffen wie
MehrLogistische Regression
Grundideen Logistische Regression Exkurs Logistische Regression Auch nachzulesen bei: http://www.psychologie.uniwuerzburg.de/methoden/lehre/skripten/hs_meth_evaluation/hs_evaluation_logistisch eregression.pdf
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrLiteratur: Rudolf & Müller, S Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung Einführung SEM Folie Nr. 1
1 Korrelation und Kausalität 2 Grundsätzliches 3 Pfaddiagramme und lineare Strukturgleichungen 4 Struktur- und Messmodell 5 Modellspezifikation 6 Parameterschätzungen 7 Beurteilung der Schätzergebnisse
MehrWiederholungsübungen zu den Kapiteln 7 bis 11
Mittelwert-Tests Übung Wiederholungsübungen zu den Kapiteln 7 bis 11 In dieser Übung wird der Datensatz 4 verwendet. In dem (fiktiven) Datensatz sind für 50 Personen vier Variablen erfasst: das Geschlecht,
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrErgänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression
Prof. Dr. Peter von der Lippe ( Übungsblatt E) Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression Das Beispiel "Mindestlöhne" zur einfachen multiplen Regression ergab die folgenden Parameter
MehrÜbungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg
Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten
MehrKlausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008
L. Fahrmeir, G. Walter Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 7. Februar 8 Hinweise:. Überprüfen
MehrSPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1
SPSS-Ausgabe : Univariate Varianzanalyse [DatenSet] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav Tests der Zwischensubjekteffekte Abhängige Variable: Einkommen Quelle Korrigiertes Modell Konstanter
MehrMultiple Regressionsanalyse - Kurzabriss
Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen
MehrTest von Hypothesen: Signifikanz des Zusammenhangs (F-Test)
Test von Hyothesen: Signifikanz des Zusammenhangs (F-Test) Die Schätzung der Regressionsfunktion basiert auf Daten einer Stichrobe Inwiefern können die Ergebnisse dieser Schätzung auf die Grundgesamtheit
MehrEine computergestützte Einführung mit
Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a)
LÖSUNG 7 a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Aufrufen der Varianzanalyse: "Analysieren", "Mittelwerte vergleichen", "Einfaktorielle ANOVA ", "Abhängige Variablen:" TVHOURS;
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrUnivariate Kennwerte mit SPSS
Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der
MehrLösungen zur Klausur zur Statistik Übung am
Lösungen zur Klausur zur Statistik Übung am 28.06.2013 Fabian Kleine Staatswissenschaftliche Fakultät Aufgabe 1 Gegeben sei die folgende geordneten Urliste des Merkmals Y. 30 Punkte Y : 5 5 5 5 10 10 10
MehrPROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
MehrSonderanhang: Manuelle Berechnungen der Statistikaufgaben
Albert/Marx 0: Empirisches Arbeiten Sonderanhang: Manuelle Berechnungen der Statistikaufgaben Kaum jemand führt heutzutage statistische Berechnungen noch von Hand durch, weil es sehr viele Computerprogramme
Mehr8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.
L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:
Mehr