Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung

Größe: px
Ab Seite anzeigen:

Download "Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung"

Transkript

1 Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Eine Einführung für Anwender - Marcel Erlinghagen - Gelsenkirchen, Oktober 2003 Gliederung 1 Was heißt Regression? 2 Das Regressionsprinzip am Beispiel der linearen Einfachregression 3 Warum logistische Regression? 4 Datenvoraussetzungen und Datenvorbereitung für die logistische Regression 5 Interpretation der Regressionsergebnisse 6 Die Regressionsanalyse als iteratives Verfahren 7 Odd Ratios eine weitere Darstellungsform der Schätzergebnisse 8 Ausblick 1

2 1 Was heißt Regression? Ziel von Wissenschaft: Klärung von Zusammenhängen zwischen unterschiedlichen Sachverhalten 2

3 Es gibt zwei Arten von Zusammenhängen: a) exakte Zusammenhänge (bspw. Naturgesetze ) mathematisch darstellbar als Funktionsgleichung; bspw.: y = f(x) b) zufallsabhängige ( stochastische ) Zusammenhänge mathematisch darstellbar als Regressionsgleichung; bspw.: y = bx + a Regression (engl. regression = Zurückentwicklung, Rückbildung) Inwiefern lässt sich die Ausprägung einer abhängigen Variable auf die Ausprägung einer unabhängigen Variable zurückführen ( regressieren )? 2 Das Regressionsprinzip am Beispiel der linearen Einfachregression 3

4 Beispiel 1 Wie hängt das Einkommen einer Personen mit der Dauer des Schulbesuches zusammen? 1. Schritt: Modellbildung Das Einkommen einer Person steigt proportional zur Schulbesuchsdauer (linearer Zusammenhang) oder auch geschätzte Einkommenshöhe = unbekannter Faktor multipliziert mit der Schulbesuchsdauer zuzüglich einer unbekannten Störgröße oder auch y = bx + a 2. Schritt: Beobachtungsdaten gewinnen Person Schuljahre Einkommen Herr Müller Frau Meier Herr Schulz Herr Schmidt Frau Mustermann Herr Kleinknecht Frau Dorfner Herr Beier Herr Dudenhofen

5 3. Schritt: Regressionsparameter schätzen Unter der Modellvoraussetzung y = bx + a Wie groß ist a und b? Es gilt eine Gleichung zu finden, mit deren Hilfe die Werte der abhängigen Variablen [...] aufgrund der Werte der explikativen Variablen [...] so geschätzt werden können, dass die Schätzfehler minimal sind (Kromrey 2000: 474) Einkommen Schuljahre Die Regressionsparameter a (Störfaktor; Achsenabschnitt) und b (Regressionskoeffizient; Steigung) werden aus den Beobachtungswerten mittels der Methode der kleinsten Quadrate (Ordinary-Least-Square- oder OLS- Regression) geschätzt. In unserem Beispiel ergibt sich dabei: y = 82,639x + 974, y = 82,639x + 974,07 R 2 = 0,5443 Einkommen Schuljahre 5

6 3 Warum logistische Regression? Beispiel 2 Wie hängt die Besetzung einer betrieblichen Führungsposition mit der Dauer des Schulbesuches einer Person zusammen? 1. Schritt: Modellbildung Die Wahrscheinlichkeit, dass eine Person eine betriebliche Führungsposition inne hat, steigt mit der Dauer des Schulbesuchs. (linearer Zusammenhang????) 6

7 2. Schritt: Beobachtungsdaten gewinnen Person Schuljahre Führungsposition Herr Müller 8 nein Frau Meier 10 ja Herr Schulz 13 ja Herr Schmidt 9 ja Frau Mustermann 10 nein Herr Kleinknecht 15 nein Frau Dorfner 13 ja Herr Beier 8 nein Herr Dudenhofen 10 ja binäre Kodierung: nein = 0 / ja = 1 3. Schritt: Regressionsparameter schätzen 1. Versuch: lineare Regression y = bx + a y = 0,0347x + 0,1852 R 2 = 0,026 1,2 1,0 0,8 0,6 0,4 0,2 0, ,2 7

8 Zur Analyse kategorialer Daten (hier: Führungsposition ja/nein) ist die lineare Regression nicht brauchbar Binäre Logistische Regression Vorteile: Schätzwerte können nie > 1 oder < 0 werden Die Regressionsgleichung simmuliert eine allmähliche Annäherung an die Extremwerte 0 und 1 (kein linearer Zusammenhang) ( Maximum-Likelihood-Schätzung ) Lineare Reg.gleichung: logistische Reg.gleichung: y = bx + a e 1+ e β0 + β1x π = 1 β + β x 0 1 Besonders wichtig! Bei der linearen Regression wird der Einfluss der erklärenden Variablen auf die abhängige Variable direkt geschätzt. Bei der logistischen Regression wird der Einfluss der erklärenden Variablen auf die Wahrscheinlichkeit geschätzt, dass die abhängige Variable den Wert 1 annimmt. 8

9 Lineare und Logistische Regression im Vergleich 1,2 1,0 0,8 0,6 0,4 0,2 y = 0,0347x + 0,1852 e 1 + e 0, , 223 x y = 0, , 223 x 0, ,2 Die Beziehung zwischen abhängiger (y) und erklärender Variable (x) als Wahrscheinlichkeitswert 1,2 1,0 0,8 0,6 0,4 0,2 0,

10 Die Logitische Regression wird in der Praxis nicht in Zwei-Variablen-Fällen wie dem Beispiel angewendet. Der Vorteil des Verfahrens besteht vielmehr darin, dass die Einflüsse mehrerer erklärender Variablen auf eine abhängige Variable gleichzeitig untersucht werden können. Das Verfahren bietet die Möglichkeit, die jeweils nicht interessierenden Variablen zu kontrollieren. 4 Datenvoraussetzungen und Datenvorbereitung für die logistische Regression 10

11 Datenvoraussetzungen Die abhängige Variable muss als dichotome Dummy-Variable zerlegbar sein typische ja/nein Fragestellung (Kodierung 0/1) Die unabhängigen (erklärenden) Variablen können jedwedes Messniveau besitzen. Sowohl metrische als auch nominal skalierte Daten können einfließen Die Abhängige Variable Beispielfragestellung: Welche Faktoren beeinflussen die Wahrscheinlichkeit, zwischen 1992 und 1996 ehrenamtlich aktiv zu werden? (Quelle der Beispieldaten: SOEP) Kodierung der abhängigen Variable EHRE: 0 = nicht ehrenamtlich aktiv geworden 1 = ehrenamtlich aktiv geworden ACHTUNG: Es dürfen nur solche Fälle (Personen) in die Untersuchung aufgenommen werden, die prinzipiell im Risiko sind ehrenamtlich aktiv zu werden. Das heißt, dass Personen, die bereits zum Beginn des Untersuchungszeitraums ehrenamtlich aktiv sind, aus der Untersuchung ausgeschlossen werden müssen. 11

12 Die erklärenden Variablen Welche erklärenden Variablen in die Untersuchung einbezogen werden, hängt vom Modell (oder von unserer Theorie) ab. Hier: Wir nehmen an, dass folgende Variablen die Ehrenamts-Aufnahme-Wahrscheinlichkeit beeinflussen: Geschlecht Erwerbsstatus Alter Haushaltskontext Qualifikation Vorbereitung der Ursprungsdaten für die Regressionsschätzung metrische Variablen müssen nicht verändert werden dichotome Variablen (bspw. Geschlecht) müssen nicht verändert werden (wenn Kodierung 0/1) kategoriale Variablen mit mehr als 2 Ausprägungen müssen in dichotome Dummy-Variablen zerlegt werden 12

13 Beispiel für die Variablenzerlegung Höchster Schulabschluss (SCHULE) mit den Ursprungswerten 1 = Hauptschule, 2 = Realschule und 3 = Gymnasium wird zerlegt in 3 Einzelvariablen SCHULE1 (Hauptschule ja/nein): 1 wenn Hauptschulabschluss; alle anderen 0 SCHULE2 (Realschule ja/nein): 1 wenn Realschulabschluss; alle anderen 0 SCHULE3 (Abitur ja/nein): 1 wenn Abitur; alle anderen 0 ACHTUNG: Missing-Werte müssen in einer eigenen Dummy-Variable in die Schätzung einbezogen werden, also wenn SCHULE=missing, dann SCHULMIS=1 wenn kein Schulabschluss bekannt; alle anderen 0!!! Variablenzerlegung im Beispieldatensatz Dummy Dummy Kodierung Kodierung Geschlecht Erwerbsstatus Mann* 0 voll erwerbstätig* R_ES1 0/1 R_SEX Frau 1 unregelm./teilzeit erwerbst. R_ES2 0/1 Alter arbeitslos R_ES3 0/ Jahre R_AGE1 0/1 Rentner R_ES4 0/ Jahre R_AGE2 0/1 sonst. Nicht-Erwerbstätige R_ES5 0/ Jahre* R_AGE3 0/1 Schulabschluss älter als 60 Jahre R_AGE4 0/1 missing R_SCH1 0/1 Haushalt kein Abschluss R_SCH2 0/1 alleinstehend R_HH1 0/1 Hauptschulabschluss R_SCH3 0/1 Paar ohne Kind* R_HH2 0/1 Realschulabschluss* R_SCH4 0/1 alleinerziehend R_HH3 0/1 (Fach-)Hochschulreife R_SCH5 0/1 Paar + 1 Kind R_HH4 0/1 Abschluss verbessert R_SCH5 0/1 Paar + 2 Kinder R_HH5 0/1 Paar + 3 o. mehr Kinder R_HH6 0/1 sonstige R_HH7 0/1 * Referenzgruppe 13

14 ACHTUNG 1: Referenzkategorie auswählen Nicht alle erklärenden Variablen werden in die Rechnung einbezogen. Um die späteren Schätzergebnisse interpretieren zu können, muss in jedem Variablenblock eine Referenzkategorie ausgewählt werden. Alle Ergebnisse sind nur im Hinblick auf diese Referenzkategorie zu interpretieren Auswahlkriterien: die bestbesetzte Kategorie Interpretatorische Gründe ACHTUNG 2: Strukturelle Nullen vermeiden Es sind sogenannte Strukturelle Nullen zu vermeiden. Strukturelle Nullen entstehen dann, wenn einzelne Kategorien der erklärenden Variablen sich logisch ausschließen. Bsp.: Kategorie Alter mit einer Ausprägung jünger als 16 Jahre und Kategorie Berufsabschluss mit einer Ausprägung Hochschulabschluss. Solche Effekte sind nicht immer zu vermeiden, sollten aber auf jeden Fall bewußt sein und bei der Interpretation berücksichtigt werden. Außerdem empfiehlt sich ein Kreuztabellentest zwischen jeder einzelnen kategorialen erklärenden Variable und der abhängigen Variable. 14

15 Checkliste Nur Fälle einbeziehen, die im Risiko sind abhängige Variable als dichotome Dummy-Variable Je nach Meßniveau und Modellannahmen sind die erklärenden Variablen aufzubereiten Nicht zuviele erklärende Variablen einführen. Faustregel: Pro 100 Analysefälle eine erklärende Variable. In unserem Beispielfall: ca Personen im Analysedatensatz, d.h. es sollten nicht mehr als maximal 60 erklärende Variablen einbezogen werden (wir haben 23 ausgewählt) Sensible Auswahl der Referenzkategorie Strukturelle Nullen vermeiden 5 Interpretation der Regressionsergebnisse 15

16 Koeffizient Signifikanz Geschlecht Männer RG Frauen -0,278*** 0,000 Erwerbsstatus regelm. Vollzeit RG unregelm./teilzeit 0,189 0,132 arbeitslos -0,199 0,218 Rentner -0,051 0,713 sonst. nicht-erwerbstätige 0,358*** 0,003 Alter Jahre -0,006 0, Jahre 0,033 0, Jahre RG älter als 60 Jahre -0,374*** 0,008 Haushaltstyp Ein-Personen-Haushalt -0,314** 0,011 Paar ohne Kinder RG Alleinerziehend -0,214 0,225 Paar mit einem Kind -0,026 0,801 Paar mit zwei Kindern 0,284*** 0,006 Paar mit drei Kindern + 0,379*** 0,010 sonst. Haushalte -0,273 0,139 Schulabschluss missing 0,317 0,338 kein Abschluss -0,588** 0,016 Hauptschulabschluss -0,116 0,161 Realschulabschluss RG (Fach-)Hochschulreife 0,057 0,589 Abschluss verbessert 0,357 0,142 Konstante -1,291*** 0,000 n 6012 Pseudo R 2 0,043 RG = Referenzgruppe Signifikanz ***: p <= 0,01 **: 0,01 < p <= 0,05 *: 0,05 < p <= 0,1 Abhängige Variable: Ehrenamt aufgenommen Haushaltstyp Ein-Personen-Haushalt -0,314** Paar ohne Kinder RG Alleinerziehend -0,214 Paar mit einem Kind -0,026 Paar mit zwei Kindern 0,284*** Paar mit drei Kindern + 0,379*** sonst. Haushalte -0,273 Schulabschluss missing 0,317 kein Abschluss -0,588** Hauptschulabschluss -0,116 Realschulabschluss RG (Fach-)Hochschulreife 0,057 Abschluss verbessert 0,357 16

17 Checkliste Wichtig sind insbesondere zwei Werte: Die Koeffizienten (SPSS: Regressionskoeffizient B ) und das Signivikanzniveau (SPSS: Sig. ). Negative (positive) Koeffizienten bedeuten einen negativen (positiven) Zusammenhang Bei kategorialen Dummies: Wenn Ausprägung zutrifft, reduziert (erhöht) sich die Wahrscheinlichkeit, dass die abhäbngige Variable den Wert 1 annimmt. Bei metrischen Variablen: Wenn sich die unabhängige Variable um eine Einheit erhöht, dann erhöht (verringert) sich die Wahrscheinlichkeit, dass die abhängige Variable den Wert 1 annimmt. Checkliste (Fortsetzung) Koeffizienten sind nur in der Richtung des Zusammenhangs zu interpretieren ( eine Variabel erhöht/vermindert die Wahrscheinlichkeit, dass... ) Koeffizienten sind nur in Bezug auf die jeweilige Referenzgruppe zu interpretieren. Es können nur statistisch signifikante Ergebnisse interpretiert werden. Ab welchem Signifikanzniveau Zusammenhänge als bestätigt gelten, ist Definitionssache (allerdings Signifikanzgrenze > 0,1 in der Forschungsliteratur unüblich). 17

18 6 Die Regressionsanalyse als iteratives Verfahren 1. Empfehlung Es empfiehlt sich, nicht nur ein einziges Modell zu schätzen, sondern iterativ vorzugehen, in dem man nach und nach einzelne Variablenblöcke in die Schätzungen einbezieht. Dabei ist darauf zu achten: a) Wie verändern sich die Koeffizienten (Vorzeichenwechsel)? b) Wie verändert sich die Signifikanz? 18

19 Schätzung 1 Schätzung 2 Schätzung 3 Schätzung 4 Geschlecht Männer RG RG RG RG Frauen -0,292*** -0,320*** -0,285*** -0,278*** Erwerbsstatus regelm. Vollzeit RG RG RG RG unregelm./teilzeit 0,220* 0,262** 0,203 0,189 arbeitslos -0,202-0,193-0,208-0,199 Rentner -0,497*** -0,057-0,067-0,051 sonst. Nicht-erwerbstät. 0,454*** 0,459*** 0,400*** 0,358*** Alter Jahre 0,067 0,074-0, Jahre 0,114 0,054 0, Jahre RG RG RG älter als 60 Jahre -0,507*** -0,384*** -0,374*** Haushaltstyp Ein-Personen-Haushalt -0,302** -0,314** Paar ohne Kinder RG RG Alleinerziehend -0,224-0,214 Paar mit einem Kind -0,020-0,026 Paar mit zwei Kindern 0,308*** 0,284*** Paar mit drei Kindern + 0,383*** 0,379*** sonst. Haushalte -0,273-0,273 Schulabschluss missing 0,317 kein Abschluss -0,588** Hauptschulabschluss -0,116 Realschulabschluss RG (Fach-)Hochschulreife 0,057 Abschluss verbessert 0,357 Konstante -1,293*** -1,322*** -1,358*** -1,291*** n Pseudo R 2 0,024 0,029 0,039 0,043 RG = Referenzgruppe 2. Empfehlung Es empfiehlt sich, nach der Schätzung eines Gesamtmodells u.u. weitere differenziertere Schätzungen vorzunehmen. Beispielsweise bietet es sich in unserem Beispiel an, alle Modelle jeweils nochmals getrennt für Männer und Frauen zu berechnen. Begründung: Durch die gemeinsame Schätzung können gegenläufige Einflüsse sich gegenseitig aufheben und daher nicht erkannt werden. ACHTUNG: Auf Fallzahlen achten! 19

20 Männer Frauen Erwerbsstatus regelm. Vollzeit RG RG unregelm./teilzeit 0,481 0,192 arbeitslos -0,174-0,210 Rentner -0,219 0,076 sonst. nicht-erwerbstätige 0,214 0,443*** Alter Jahre 0,017-0, Jahre 0,016 0, Jahre RG RG älter als 60 Jahre -0,330-0,345* Haushaltstyp Ein-Personen-Haushalt -0,183-0,447*** Paar ohne Kinder RG RG Alleinerziehend -0,211-0,181 Paar mit einem Kind -0,079 0,029 Paar mit zwei Kindern 0,217 0,334** Paar mit drei Kindern + 0,318 0,432** sonst. Haushalte -0,112-0,463* Schulabschluss missing 0,776* -0,273 kein Abschluss -0,342-0,858** Hauptschulabschluss -0,044-0,203* Realschulabschluss RG RG (Fach-)Hochschulreife -0,156 0,321** Abschluss verbessert 0,356 0,440 Konstante -1,258*** -1,603*** n Pseudo R 2 0,026 0,057 RG = Referenzgruppe 7 Odd Ratios eine weitere Darstellungsformen der Schätzergebnisse 20

21 Problem Durch die Schätzung der Koeffizienten können wir zwar die Signifikanz und die Richtung des Zusammenhangs zwischen abhängiger und unabhängiger Variable bestimmen, aber es sind keine Aussagen über die Stärke des Zusammenhangs möglich! Alternative: Berechnung von Odd Ratios Exkurs: Was sind Odd Ratios und wie werden sie interpretiert? Beispiel (a) zur Berechnung und Interpretation von Odd Ratios A B C D E F G sonstige Todesursache Hirntumor n Wahrscheinlichkeit d. Todes durch HT (in %) Gegenwahrscheinlichkeit sonst. Tod (in %) Odds (Tod durch HT/sonst. Gründe) 1 Männer , , , Frauen (RG) , , , Prozentsatzdifferenz Männer- Frauen 0, Differenz der beiden Odds 0, Odd Ratio Mann/Frau (RG) 2, "Wahrscheinlichkeits-Ratio" 2, Diff. Zw. Odd & Wahrscheinlichkeits-Ratio 0, Die Wahrscheinlichkeit von Männern, an einem Gehirntumor zu sterben, ist rund 2,4mal so groß wie die Wahrscheinlichkeit von Frauen, an einem Gehirntumor zu sterben 21

22 Beispiel (b) zur Berechnung und Interpretation von Odd Ratios A B C D E F G sonstige Todesursache Hirntumor n Wahrscheinlichkeit d. Todes durch HT (in %) Gegenwahrscheinlichkeit sonst. Tod (in %) Odds (Tod durch HT/sonst. Gründe) 1 Männer , , , Frauen (RG) , , , Prozentsatzdifferenz Männer- Frauen 1, Differenz der beiden Odds 0, Odd Ratio Mann/Frau (RG) 3, "Wahrscheinlichkeits-Ratio" 3, Diff. Zw. Odd & Wahrscheinlichkeits-Ratio 0, Die Wahrscheinlichkeit von Männern, an einem Gehirntumor zu sterben, ist rund 3,6mal so groß wie die Wahrscheinlichkeit von Frauen, an einem Gehirntumor zu sterben Beispiel (c) zur Berechnung und Interpretation von Odd Ratios A B C D E F G sonstige Todesursache Hirntumor n Wahrscheinlichkeit d. Todes durch HT (in %) Gegenwahrscheinlichkeit sonst. Tod (in %) Odds (Tod durch HT/sonst. Gründe) 1 Männer , , , Frauen (RG) , , , Prozentsatzdifferenz Männer- Frauen -1, Differenz der beiden Odds -0, Odd Ratio Mann/Frau (RG) 0, "Wahrscheinlichkeits-Ratio" 0, Diff. Zw. Odd & Wahrscheinlichkeits-Ratio -0, Die Wahrscheinlichkeit von Männern, an einem Gehirntumor zu sterben, ist rund 0,6mal so groß wie die Wahrscheinlichkeit von Frauen, an einem Gehirntumor zu sterben 22

23 Wie sind Odd Ratios im Regressionsmodell zu interpretieren? Die Werte von Odd Ratios (OR) liegen theoretisch zwischen 0 und unendlich. OR < 1 bedeutet für die Analysegruppe eine geringere Wahrscheinlichkeit, dass die abhängige Variable 1 ergibt, als die Referenzgruppe. OR > 1 bedeutet für die Analysegruppe eine höhere Wahrscheinlichkeit, dass die abhängige Variable 1 ergibt, als die Referenzgruppe. Was ist bei der Interpretation von Odd Ratios im Regressionsmodell zu beachten? a) Der einfache Fall: OR > 1 ORs mit einem Wert > 1 sind relativ einfach zu interpretieren. Bsp.: Frau: Referenzgruppe / Mann: OR= 1,432*** Abhängige Variable: Ehrenamtsaufnahme Männer haben (unter Kontrolle aller anderen Variablen im Modell) gegenüber Frauen eine um 43,2 % erhöhte Wahrscheinlichkeit, ein Ehrenamt aufzunehmen. 23

24 b) Der knifflige Fall: OR < 1 ORs mit einem Wert < 1 sind schwieriger zu interpretieren. Bsp.: Frau: Referenzgruppe / Mann: OR= 0,650*** Abhängige Variable: Ehrenamtsaufnahme Männer haben (unter Kontrolle aller anderen Variablen im Modell) gegenüber Frauen eine 0,650mal so große Wahrscheinlichkeit, ein Ehrenamt aufzunehmen. ACHTUNG: Das heißt NICHT, dass Männer eine um 35 % verringerte Wahrscheinlichkeit der Ehrenamtsaufnahme gegenüber Frauen aufweisen (also nicht 1-0,650 = 0,350)!!! Interpretationsbeispiele bei OR < 1 P = (1 / 0,95)-1= 0,0526 OR 1-OR (Falsch!) % 0,95 5,00 5,26 0,90 10,00 11,11 0,85 15,00 17,65 0,80 20,00 25,00 0,75 25,00 33,33 0,70 30,00 42,86 0,65 35,00 53,85 0,60 40,00 66,67 0,55 45,00 81,82 0,50 50,00 100,00 0,45 55,00 122,22 0,40 60,00 150,00 0,35 65,00 185,71 0,30 70,00 233,33 P = (1 / 0,70)-1= 0,4286 P = (1 / 0,50)-1= 1! VORSICHT!??? A hat eine um 100 % verringerte Wahrscheinlichkeit als B??? 24

25 Der noch kniffligere Fall: OR <= 0,5 Interpretationsbeispiele Bei OR Werten <= 0,5 bietet sich eine umgekehrte Interpretation an. OR 1-OR (Falsch!) % 0,95 5,00 5,26 0,90 10,00 11,11 0,85 15,00 17,65 0,80 20,00 25,00 0,75 25,00 33,33 0,70 30,00 42,86 0,65 35,00 53,85 0,60 40,00 66,67 0,55 45,00 81,82 0,50 50,00 100,00 0,45 55,00 122,22 0,40 60,00 150,00 0,35 65,00 185,71 0,30 70,00 233,33 Die Referenzgruppe hat eine doppelt so hohe Wahrscheinlichkeit wie die Analysegruppe Die Referenzgruppe hat eine um 122 % erhöhte Wahrscheinlichkeit gegenüber der Analysegruppe 8 Ausblick 25

26 Die weiteren Sitzungen 3. Sitzung (Praxis) Donnerstag, , Uhr Kurze Wiederholung der wichtigen methodischen Punkte Gemeinsame Begutachtung der Übungs-Rohdaten und Plan zur Aufbereitung der Daten für die logistische Regression 4. Sitzung (Praxis) Donnerstag, , Uhr Einführung in STATA Aufbereitung der Daten in STATA 5. Sitzung (Praxis) Donnerstag, , Uhr Anwendung der eigentlichen Logistischen Regression in STATA Diskussion und Interpretation der Schätzergebnisse 6. Sitzung (Praxis) (optional) Donnerstag, , Uhr Bei Bedarf: Gemeinsamer Einstieg in eine neue Analyse mit anderer Fragestellung und anderen Daten 7. Sitzung (Theorie) Donnerstag, , Uhr Ausblick: Weitere multivariate Analyseverfahren (bspw. multiple Logistische Regression, Übergangsratenmodelle etc.); Gemeinsamkeiten und Unterschiede zur Binären Logistischen Regression Schlussbemerkung Trotz der Vorzüge und Möglichkeiten multivariater Analyseinstrumente insbesondere für die sozialwissenschaftliche Forschung sollten scheinbar einfache deskriptive Verfahren nicht vernachlässigt und deren Nutzen nicht unterschätzt werden: Generally, descriptive studies are thus much more relevant for sociology as an explanatory enterprise than current journals and university curricula would have us belief. (Wippler/Lindenberg 1987: 159) 26

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation Einführung in die Logistische Regression Fortbildung zur 9.Informationstagung Tumordokumentation Bernd Schicke, Tumorzentrum Berlin FB Bayreuth, 29.März 20 Gliederung Einleitung Schätzen von Maßzahlen

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

6.1 Grundbegriffe und historischer Hintergrund

6.1 Grundbegriffe und historischer Hintergrund Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Kreuztabellenanalyse -Zusammenhangsmaße

Kreuztabellenanalyse -Zusammenhangsmaße Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse -Zusammenhangsmaße 14. Dezember 2007 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2:

Mehr

Logistische Regression - - - - - 24. Juni 2011

Logistische Regression - - - - - 24. Juni 2011 Lehrveranstaltung Empirische Forschung und Politikberatung Sommersemester 2011 Logistische Regression - - - - - 24. Juni 2011 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2: Qualifikation, berufliche

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Notiz zur logistischen Regression

Notiz zur logistischen Regression Kapitel 1 Notiz zur logistischen Regression 1.1 Grundlagen Bei dichotomen abhängigen Variablen ergeben sich bei einer normalen linearen Regression Probleme. Während man die Ausprägungen einer dichotomen

Mehr

Logistische Regression

Logistische Regression TU Chemnitz SoSe 2012 Seminar: Multivariate Analysemethoden 26.06.2012 Dozent: Dr. Thomas Schäfer Logistische Regression Ein Verfahren zum Schätzen von Wahrscheinlichkeiten Referentinnen: B. Sc. Psych.

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Master of Science in Pflege

Master of Science in Pflege Master of Science in Pflege Modul: Statistik Einfache und multiple Regressionsanalyse / Logistische Regressionsanalyse November 2012 Prof. Dr. Jürg Schwarz Folie 2 Programm 28. November 2012: Vormittag

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Modellierung des Stornos nach Beitragsanpassung in der PKV

Modellierung des Stornos nach Beitragsanpassung in der PKV ierung des Stornos nach Beitragsanpassung in der PKV 02.07.2013 Alexander Küpper Central Krankenversicherung AG Inhaltsverzeichnis Einführung Gesetzlicher Rahmen Stornomodell Anwendung Ausblick und Weiterentwicklung

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart. No. 3 / 2010

SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart. No. 3 / 2010 SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart No. 3 / 2010 Binär-logistische Regressionsanalyse. Grundlagen und Anwendung für Sozialwissenschaftler Jochen Mayerl

Mehr

2 Definitionen und Rahmenbedingungen für die Messung von Familieneinfluss 13

2 Definitionen und Rahmenbedingungen für die Messung von Familieneinfluss 13 Inhaltsverzeichnis xv_ INHALTSVERZEICHNIS /. Geleitwort vii 2. Geleitwort ix VORWORT ABKÜRZUNGSVERZEICHNIS SYMBOLVERZEICHNIS. TABELLENVERZEICHNIS ABBILDUNGSVERZEICHNIS FORMELVERZEICHNIS xi xxi xxv xxvii

Mehr

Leben und Arbeiten in Baden-Württemberg. Ergebnisse des Mikrozensus 2013

Leben und Arbeiten in Baden-Württemberg. Ergebnisse des Mikrozensus 2013 2014 Leben und Arbeiten in Baden-Württemberg Ergebnisse des Mikrozensus 2013 So erreichen Sie uns: Statistisches Landesamt Baden-Württemberg Böblinger Straße 68 70199 Stuttgart Telefon 0711/ 641-0 Telefax

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Binäre logistische Regressionsanalyse

Binäre logistische Regressionsanalyse Binäre logistische Regressionsanalyse Eine Einführung für Sozialwissenschaftler mit SPSS für Windows Sabine Fromm Bamberger Beiträge zur empirischen Sozialforschung Nr. 11, 2005 Herausgeber: Gerhard Schulze

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

ALM. Allgemeines lineares Modell. Teil 1. Regressionsanalyse Varianzanalyse Kovarianzanalyse Diskriminanzanalyse. Kurt Holm

ALM. Allgemeines lineares Modell. Teil 1. Regressionsanalyse Varianzanalyse Kovarianzanalyse Diskriminanzanalyse. Kurt Holm ALM Allgemeines lineares Modell Teil 1 Regressionsanalyse Varianzanalyse Kovarianzanalyse Diskriminanzanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

BASS. Die Lage der Personen vor und nach Erreichen. ordentlichen Rentenalters

BASS. Die Lage der Personen vor und nach Erreichen. ordentlichen Rentenalters Lage der Personen vor und nach Erreichen des ordentlichen Rentenalters Jürg Guggisberg und Kilian Künzi - Büro für arbeits- und sozialpolitische Studien (2005): Lage der Personen vor und nach Erreichen

Mehr

Zeitverwendung und Geschlecht empirische Erkenntnisse

Zeitverwendung und Geschlecht empirische Erkenntnisse Zeitverwendung und Geschlecht empirische Erkenntnisse Astrid Libuda-Köster, IPSE Institut für Projektevaluation und sozialwissenschaftliche Datenerhebung und Brigitte Sellach + Uta Enders-Dragässer von

Mehr

Einführung in die Logistische Regression mit SPSS

Einführung in die Logistische Regression mit SPSS Einführung in die Logistische Regression mit SPSS Felix Bittmann V. 1.0 www.felix-bittmann.de 2015 Für Eilige Daten herunterladen und vorbereiten: S. 6 Durchführung in SPSS: S. 13 Interpretation: S. 15

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Dr. Tilly Lex (DJI) Wege ins Ausbildungs- und. Direkteinstiege, Umwege und. AID:A-Befunde. Aufwachsen in Deutschland

Dr. Tilly Lex (DJI) Wege ins Ausbildungs- und. Direkteinstiege, Umwege und. AID:A-Befunde. Aufwachsen in Deutschland Dr. Tilly Lex (DJI) Wege ins Ausbildungs- und Beschäftigungssystem: e, Umwege und Zwischenschritte h itt AID:A-Befunde Aufwachsen in Deutschland 3 Gliederung I. Wer schafft den direkten Einstieg in eine

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

6.1.2 Die Interaktionseffekte von Dummy- und zentrierten metrischen Variablen

6.1.2 Die Interaktionseffekte von Dummy- und zentrierten metrischen Variablen Dr. Wolfgang Langer - Integrierte Veranstaltung Methoden IV WS 2002/2003-1 6.1.2 Die Interaktionseffekte von Dummy- und zentrierten metrischen Variablen Bei der Zentrierung handelt es sich um eine lineare

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse Phasen des Forschungsprozesses Auswahl des Forschungsproblems Theoriebildung Theoretische Phase Konzeptspezifikation / Operationalisierung

Mehr

Mediator-Effekte in der Regressionsanalyse (direkte, indirekte und totale Effekte)

Mediator-Effekte in der Regressionsanalyse (direkte, indirekte und totale Effekte) Version 1.3; Januar 007 Mediator-Effekte in der Regressionsanalyse (direkte, indirekte und totale Effekte) von Dieter Urban und Jochen Mayerl 1 Zum Inhalt: In dieser Ergänzung werden auf praxisorientierte

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Belastung durch chronischen Stress

Belastung durch chronischen Stress Gesundheit Mobilität Bildung Belastung durch chronischen Stress Sonderauswertung der Befragung der DAK-Gesundheit im Rahmen des Schwerpunktthemas 2014 Rushhour des Lebens Die Ergebnisse gelten für die

Mehr

Multivariate Analyse: Einführung in das COX-Modell

Multivariate Analyse: Einführung in das COX-Modell Auswertung Multivariate Analyse: Einführung in das COX-Modell Deskriptive Statistik Häufigkeiten, Univariate Statistiken, Explorative Datenanalyse, Kreuztabellen) Induktive Statistik, Vergleich von Mittelwerten

Mehr

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav Beispiel für eine multivariate Varianzanalyse () Daten: POKIV_Terror_V12.sav Es soll überprüft werden, inwieweit das ATB-Syndrom (Angst vor mit den drei Subskalen affektive Angst von, Terrorpersistenz,

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Wahlfach Mathematik: Funktionen

Wahlfach Mathematik: Funktionen Wahlfach Mathematik: Funktionen In der Mathematik ist eine Funktion oder Abbildung eine Beziehung zwischen zwei Mengen, die jedem Element der einen Menge (Funktionsargument, unabhängige Variable, x-wert)

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Entscheidungsbaumverfahren

Entscheidungsbaumverfahren Entscheidungsbaumverfahren Allgemeine Beschreibung Der Entscheidungsbaum ist die Darstellung einer Entscheidungsregel, anhand derer Objekte in Klassen eingeteilt werden. Die Klassifizierung erfolgt durch

Mehr

Technische Informatik - Eine Einführung

Technische Informatik - Eine Einführung Martin-Luther-Universität Halle-Wittenberg Fachbereich Mathematik und Informatik Lehrstuhl für Technische Informatik Prof. P. Molitor Ausgabe: 2005-02-21 Abgabe: 2005-02-21 Technische Informatik - Eine

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

Erwerbsbiografische Einflüsse auf das Gründungsverhalten eine genderspezifische Analyse

Erwerbsbiografische Einflüsse auf das Gründungsverhalten eine genderspezifische Analyse Erwerbsbiografische Einflüsse auf das Gründungsverhalten eine genderspezifische Analyse Frühjahrstagung des Arbeitskreises Die Arbeit der Selbstständigen Berlin, 21. März 2015 Dr. Rosemarie Kay, Olga Suprinovič,

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

V A R I A N Z A N A L Y S E

V A R I A N Z A N A L Y S E V A R I A N Z A N A L Y S E Ziel / Funktion: statistische Beurteilung des Einflusses von nominal skalierten (kategorialen) Faktoren auf intervallskalierte abhängige Variablen Vorteil: die Wirkung von mehreren,

Mehr

Einkommensmobilität befristet Beschäftigter im deutsch-britischen Vergleich

Einkommensmobilität befristet Beschäftigter im deutsch-britischen Vergleich Einkommensmobilität befristet Beschäftigter im deutsch-britischen Vergleich Johannes Giesecke und Martin Groß Institut für Sozialwissenschaften Lehrbereich Empirische Sozialforschung Humboldt Universität

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Zur Verfügung gestellt in Kooperation mit / provided in cooperation with: GESIS - Leibniz-Institut für Sozialwissenschaften

Zur Verfügung gestellt in Kooperation mit / provided in cooperation with: GESIS - Leibniz-Institut für Sozialwissenschaften www.ssoar.info Teilnehmen oder Boykottieren : ein Anwendungsbeispiel der binären logistischen Regression mit SPSSx Kühnel, Steffen M.; Jagodzinski, Wolfgang; Terwey, Michael Veröffentlichungsversion /

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Fragen und Antworten zu Kapitel 18

Fragen und Antworten zu Kapitel 18 Fragen und Antworten zu Kapitel 18 (1) Nennen Sie verschiedene Zielsetzungen, die man mit der Anwendung der multiplen Regressionsanalyse verfolgt. Die multiple Regressionsanalyse dient der Kontrolle von

Mehr

Die Auswertung dyadischer Daten anhand des Partner-Effekt-Modells

Die Auswertung dyadischer Daten anhand des Partner-Effekt-Modells Die Auswertung dyadischer Daten anhand des Partner-Effekt-Modells Dorothea E. Dette-Hagenmeyer Was sind dyadische Daten? Dyadische Daten sind Daten von zwei oder mehreren Personen, die etwas miteinander

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17

Computer Vision: 3D-Geometrie. D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Computer Vision: 3D-Geometrie D. Schlesinger () Computer Vision: 3D-Geometrie 1 / 17 Lochkamera Modell C Projektionszentrum, Optische Achse, Bildebene, P Hauptpunkt (optische Achse kreuzt die Bildebene),

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Fallbeispiel: Kreditscoring

Fallbeispiel: Kreditscoring Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden:

Mehr

Statistik für die Sozialwissenschaften

Statistik für die Sozialwissenschaften Leseprobe aus: Steffen-M. Kühnel, Dagmar Krebs Statistik für die Sozialwissenschaften Mehr Informationen zum Buch finden Sie auf rowohlt.de. Copyright 2012 by Rowohlt Verlag GmbH, Reinbek bei Hamburg 1

Mehr