Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung

Größe: px
Ab Seite anzeigen:

Download "Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung"

Transkript

1 Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Eine Einführung für Anwender - Marcel Erlinghagen - Gelsenkirchen, Oktober 2003 Gliederung 1 Was heißt Regression? 2 Das Regressionsprinzip am Beispiel der linearen Einfachregression 3 Warum logistische Regression? 4 Datenvoraussetzungen und Datenvorbereitung für die logistische Regression 5 Interpretation der Regressionsergebnisse 6 Die Regressionsanalyse als iteratives Verfahren 7 Odd Ratios eine weitere Darstellungsform der Schätzergebnisse 8 Ausblick 1

2 1 Was heißt Regression? Ziel von Wissenschaft: Klärung von Zusammenhängen zwischen unterschiedlichen Sachverhalten 2

3 Es gibt zwei Arten von Zusammenhängen: a) exakte Zusammenhänge (bspw. Naturgesetze ) mathematisch darstellbar als Funktionsgleichung; bspw.: y = f(x) b) zufallsabhängige ( stochastische ) Zusammenhänge mathematisch darstellbar als Regressionsgleichung; bspw.: y = bx + a Regression (engl. regression = Zurückentwicklung, Rückbildung) Inwiefern lässt sich die Ausprägung einer abhängigen Variable auf die Ausprägung einer unabhängigen Variable zurückführen ( regressieren )? 2 Das Regressionsprinzip am Beispiel der linearen Einfachregression 3

4 Beispiel 1 Wie hängt das Einkommen einer Personen mit der Dauer des Schulbesuches zusammen? 1. Schritt: Modellbildung Das Einkommen einer Person steigt proportional zur Schulbesuchsdauer (linearer Zusammenhang) oder auch geschätzte Einkommenshöhe = unbekannter Faktor multipliziert mit der Schulbesuchsdauer zuzüglich einer unbekannten Störgröße oder auch y = bx + a 2. Schritt: Beobachtungsdaten gewinnen Person Schuljahre Einkommen Herr Müller Frau Meier Herr Schulz Herr Schmidt Frau Mustermann Herr Kleinknecht Frau Dorfner Herr Beier Herr Dudenhofen

5 3. Schritt: Regressionsparameter schätzen Unter der Modellvoraussetzung y = bx + a Wie groß ist a und b? Es gilt eine Gleichung zu finden, mit deren Hilfe die Werte der abhängigen Variablen [...] aufgrund der Werte der explikativen Variablen [...] so geschätzt werden können, dass die Schätzfehler minimal sind (Kromrey 2000: 474) Einkommen Schuljahre Die Regressionsparameter a (Störfaktor; Achsenabschnitt) und b (Regressionskoeffizient; Steigung) werden aus den Beobachtungswerten mittels der Methode der kleinsten Quadrate (Ordinary-Least-Square- oder OLS- Regression) geschätzt. In unserem Beispiel ergibt sich dabei: y = 82,639x + 974, y = 82,639x + 974,07 R 2 = 0,5443 Einkommen Schuljahre 5

6 3 Warum logistische Regression? Beispiel 2 Wie hängt die Besetzung einer betrieblichen Führungsposition mit der Dauer des Schulbesuches einer Person zusammen? 1. Schritt: Modellbildung Die Wahrscheinlichkeit, dass eine Person eine betriebliche Führungsposition inne hat, steigt mit der Dauer des Schulbesuchs. (linearer Zusammenhang????) 6

7 2. Schritt: Beobachtungsdaten gewinnen Person Schuljahre Führungsposition Herr Müller 8 nein Frau Meier 10 ja Herr Schulz 13 ja Herr Schmidt 9 ja Frau Mustermann 10 nein Herr Kleinknecht 15 nein Frau Dorfner 13 ja Herr Beier 8 nein Herr Dudenhofen 10 ja binäre Kodierung: nein = 0 / ja = 1 3. Schritt: Regressionsparameter schätzen 1. Versuch: lineare Regression y = bx + a y = 0,0347x + 0,1852 R 2 = 0,026 1,2 1,0 0,8 0,6 0,4 0,2 0, ,2 7

8 Zur Analyse kategorialer Daten (hier: Führungsposition ja/nein) ist die lineare Regression nicht brauchbar Binäre Logistische Regression Vorteile: Schätzwerte können nie > 1 oder < 0 werden Die Regressionsgleichung simmuliert eine allmähliche Annäherung an die Extremwerte 0 und 1 (kein linearer Zusammenhang) ( Maximum-Likelihood-Schätzung ) Lineare Reg.gleichung: logistische Reg.gleichung: y = bx + a e 1+ e β0 + β1x π = 1 β + β x 0 1 Besonders wichtig! Bei der linearen Regression wird der Einfluss der erklärenden Variablen auf die abhängige Variable direkt geschätzt. Bei der logistischen Regression wird der Einfluss der erklärenden Variablen auf die Wahrscheinlichkeit geschätzt, dass die abhängige Variable den Wert 1 annimmt. 8

9 Lineare und Logistische Regression im Vergleich 1,2 1,0 0,8 0,6 0,4 0,2 y = 0,0347x + 0,1852 e 1 + e 0, , 223 x y = 0, , 223 x 0, ,2 Die Beziehung zwischen abhängiger (y) und erklärender Variable (x) als Wahrscheinlichkeitswert 1,2 1,0 0,8 0,6 0,4 0,2 0,

10 Die Logitische Regression wird in der Praxis nicht in Zwei-Variablen-Fällen wie dem Beispiel angewendet. Der Vorteil des Verfahrens besteht vielmehr darin, dass die Einflüsse mehrerer erklärender Variablen auf eine abhängige Variable gleichzeitig untersucht werden können. Das Verfahren bietet die Möglichkeit, die jeweils nicht interessierenden Variablen zu kontrollieren. 4 Datenvoraussetzungen und Datenvorbereitung für die logistische Regression 10

11 Datenvoraussetzungen Die abhängige Variable muss als dichotome Dummy-Variable zerlegbar sein typische ja/nein Fragestellung (Kodierung 0/1) Die unabhängigen (erklärenden) Variablen können jedwedes Messniveau besitzen. Sowohl metrische als auch nominal skalierte Daten können einfließen Die Abhängige Variable Beispielfragestellung: Welche Faktoren beeinflussen die Wahrscheinlichkeit, zwischen 1992 und 1996 ehrenamtlich aktiv zu werden? (Quelle der Beispieldaten: SOEP) Kodierung der abhängigen Variable EHRE: 0 = nicht ehrenamtlich aktiv geworden 1 = ehrenamtlich aktiv geworden ACHTUNG: Es dürfen nur solche Fälle (Personen) in die Untersuchung aufgenommen werden, die prinzipiell im Risiko sind ehrenamtlich aktiv zu werden. Das heißt, dass Personen, die bereits zum Beginn des Untersuchungszeitraums ehrenamtlich aktiv sind, aus der Untersuchung ausgeschlossen werden müssen. 11

12 Die erklärenden Variablen Welche erklärenden Variablen in die Untersuchung einbezogen werden, hängt vom Modell (oder von unserer Theorie) ab. Hier: Wir nehmen an, dass folgende Variablen die Ehrenamts-Aufnahme-Wahrscheinlichkeit beeinflussen: Geschlecht Erwerbsstatus Alter Haushaltskontext Qualifikation Vorbereitung der Ursprungsdaten für die Regressionsschätzung metrische Variablen müssen nicht verändert werden dichotome Variablen (bspw. Geschlecht) müssen nicht verändert werden (wenn Kodierung 0/1) kategoriale Variablen mit mehr als 2 Ausprägungen müssen in dichotome Dummy-Variablen zerlegt werden 12

13 Beispiel für die Variablenzerlegung Höchster Schulabschluss (SCHULE) mit den Ursprungswerten 1 = Hauptschule, 2 = Realschule und 3 = Gymnasium wird zerlegt in 3 Einzelvariablen SCHULE1 (Hauptschule ja/nein): 1 wenn Hauptschulabschluss; alle anderen 0 SCHULE2 (Realschule ja/nein): 1 wenn Realschulabschluss; alle anderen 0 SCHULE3 (Abitur ja/nein): 1 wenn Abitur; alle anderen 0 ACHTUNG: Missing-Werte müssen in einer eigenen Dummy-Variable in die Schätzung einbezogen werden, also wenn SCHULE=missing, dann SCHULMIS=1 wenn kein Schulabschluss bekannt; alle anderen 0!!! Variablenzerlegung im Beispieldatensatz Dummy Dummy Kodierung Kodierung Geschlecht Erwerbsstatus Mann* 0 voll erwerbstätig* R_ES1 0/1 R_SEX Frau 1 unregelm./teilzeit erwerbst. R_ES2 0/1 Alter arbeitslos R_ES3 0/ Jahre R_AGE1 0/1 Rentner R_ES4 0/ Jahre R_AGE2 0/1 sonst. Nicht-Erwerbstätige R_ES5 0/ Jahre* R_AGE3 0/1 Schulabschluss älter als 60 Jahre R_AGE4 0/1 missing R_SCH1 0/1 Haushalt kein Abschluss R_SCH2 0/1 alleinstehend R_HH1 0/1 Hauptschulabschluss R_SCH3 0/1 Paar ohne Kind* R_HH2 0/1 Realschulabschluss* R_SCH4 0/1 alleinerziehend R_HH3 0/1 (Fach-)Hochschulreife R_SCH5 0/1 Paar + 1 Kind R_HH4 0/1 Abschluss verbessert R_SCH5 0/1 Paar + 2 Kinder R_HH5 0/1 Paar + 3 o. mehr Kinder R_HH6 0/1 sonstige R_HH7 0/1 * Referenzgruppe 13

14 ACHTUNG 1: Referenzkategorie auswählen Nicht alle erklärenden Variablen werden in die Rechnung einbezogen. Um die späteren Schätzergebnisse interpretieren zu können, muss in jedem Variablenblock eine Referenzkategorie ausgewählt werden. Alle Ergebnisse sind nur im Hinblick auf diese Referenzkategorie zu interpretieren Auswahlkriterien: die bestbesetzte Kategorie Interpretatorische Gründe ACHTUNG 2: Strukturelle Nullen vermeiden Es sind sogenannte Strukturelle Nullen zu vermeiden. Strukturelle Nullen entstehen dann, wenn einzelne Kategorien der erklärenden Variablen sich logisch ausschließen. Bsp.: Kategorie Alter mit einer Ausprägung jünger als 16 Jahre und Kategorie Berufsabschluss mit einer Ausprägung Hochschulabschluss. Solche Effekte sind nicht immer zu vermeiden, sollten aber auf jeden Fall bewußt sein und bei der Interpretation berücksichtigt werden. Außerdem empfiehlt sich ein Kreuztabellentest zwischen jeder einzelnen kategorialen erklärenden Variable und der abhängigen Variable. 14

15 Checkliste Nur Fälle einbeziehen, die im Risiko sind abhängige Variable als dichotome Dummy-Variable Je nach Meßniveau und Modellannahmen sind die erklärenden Variablen aufzubereiten Nicht zuviele erklärende Variablen einführen. Faustregel: Pro 100 Analysefälle eine erklärende Variable. In unserem Beispielfall: ca Personen im Analysedatensatz, d.h. es sollten nicht mehr als maximal 60 erklärende Variablen einbezogen werden (wir haben 23 ausgewählt) Sensible Auswahl der Referenzkategorie Strukturelle Nullen vermeiden 5 Interpretation der Regressionsergebnisse 15

16 Koeffizient Signifikanz Geschlecht Männer RG Frauen -0,278*** 0,000 Erwerbsstatus regelm. Vollzeit RG unregelm./teilzeit 0,189 0,132 arbeitslos -0,199 0,218 Rentner -0,051 0,713 sonst. nicht-erwerbstätige 0,358*** 0,003 Alter Jahre -0,006 0, Jahre 0,033 0, Jahre RG älter als 60 Jahre -0,374*** 0,008 Haushaltstyp Ein-Personen-Haushalt -0,314** 0,011 Paar ohne Kinder RG Alleinerziehend -0,214 0,225 Paar mit einem Kind -0,026 0,801 Paar mit zwei Kindern 0,284*** 0,006 Paar mit drei Kindern + 0,379*** 0,010 sonst. Haushalte -0,273 0,139 Schulabschluss missing 0,317 0,338 kein Abschluss -0,588** 0,016 Hauptschulabschluss -0,116 0,161 Realschulabschluss RG (Fach-)Hochschulreife 0,057 0,589 Abschluss verbessert 0,357 0,142 Konstante -1,291*** 0,000 n 6012 Pseudo R 2 0,043 RG = Referenzgruppe Signifikanz ***: p <= 0,01 **: 0,01 < p <= 0,05 *: 0,05 < p <= 0,1 Abhängige Variable: Ehrenamt aufgenommen Haushaltstyp Ein-Personen-Haushalt -0,314** Paar ohne Kinder RG Alleinerziehend -0,214 Paar mit einem Kind -0,026 Paar mit zwei Kindern 0,284*** Paar mit drei Kindern + 0,379*** sonst. Haushalte -0,273 Schulabschluss missing 0,317 kein Abschluss -0,588** Hauptschulabschluss -0,116 Realschulabschluss RG (Fach-)Hochschulreife 0,057 Abschluss verbessert 0,357 16

17 Checkliste Wichtig sind insbesondere zwei Werte: Die Koeffizienten (SPSS: Regressionskoeffizient B ) und das Signivikanzniveau (SPSS: Sig. ). Negative (positive) Koeffizienten bedeuten einen negativen (positiven) Zusammenhang Bei kategorialen Dummies: Wenn Ausprägung zutrifft, reduziert (erhöht) sich die Wahrscheinlichkeit, dass die abhäbngige Variable den Wert 1 annimmt. Bei metrischen Variablen: Wenn sich die unabhängige Variable um eine Einheit erhöht, dann erhöht (verringert) sich die Wahrscheinlichkeit, dass die abhängige Variable den Wert 1 annimmt. Checkliste (Fortsetzung) Koeffizienten sind nur in der Richtung des Zusammenhangs zu interpretieren ( eine Variabel erhöht/vermindert die Wahrscheinlichkeit, dass... ) Koeffizienten sind nur in Bezug auf die jeweilige Referenzgruppe zu interpretieren. Es können nur statistisch signifikante Ergebnisse interpretiert werden. Ab welchem Signifikanzniveau Zusammenhänge als bestätigt gelten, ist Definitionssache (allerdings Signifikanzgrenze > 0,1 in der Forschungsliteratur unüblich). 17

18 6 Die Regressionsanalyse als iteratives Verfahren 1. Empfehlung Es empfiehlt sich, nicht nur ein einziges Modell zu schätzen, sondern iterativ vorzugehen, in dem man nach und nach einzelne Variablenblöcke in die Schätzungen einbezieht. Dabei ist darauf zu achten: a) Wie verändern sich die Koeffizienten (Vorzeichenwechsel)? b) Wie verändert sich die Signifikanz? 18

19 Schätzung 1 Schätzung 2 Schätzung 3 Schätzung 4 Geschlecht Männer RG RG RG RG Frauen -0,292*** -0,320*** -0,285*** -0,278*** Erwerbsstatus regelm. Vollzeit RG RG RG RG unregelm./teilzeit 0,220* 0,262** 0,203 0,189 arbeitslos -0,202-0,193-0,208-0,199 Rentner -0,497*** -0,057-0,067-0,051 sonst. Nicht-erwerbstät. 0,454*** 0,459*** 0,400*** 0,358*** Alter Jahre 0,067 0,074-0, Jahre 0,114 0,054 0, Jahre RG RG RG älter als 60 Jahre -0,507*** -0,384*** -0,374*** Haushaltstyp Ein-Personen-Haushalt -0,302** -0,314** Paar ohne Kinder RG RG Alleinerziehend -0,224-0,214 Paar mit einem Kind -0,020-0,026 Paar mit zwei Kindern 0,308*** 0,284*** Paar mit drei Kindern + 0,383*** 0,379*** sonst. Haushalte -0,273-0,273 Schulabschluss missing 0,317 kein Abschluss -0,588** Hauptschulabschluss -0,116 Realschulabschluss RG (Fach-)Hochschulreife 0,057 Abschluss verbessert 0,357 Konstante -1,293*** -1,322*** -1,358*** -1,291*** n Pseudo R 2 0,024 0,029 0,039 0,043 RG = Referenzgruppe 2. Empfehlung Es empfiehlt sich, nach der Schätzung eines Gesamtmodells u.u. weitere differenziertere Schätzungen vorzunehmen. Beispielsweise bietet es sich in unserem Beispiel an, alle Modelle jeweils nochmals getrennt für Männer und Frauen zu berechnen. Begründung: Durch die gemeinsame Schätzung können gegenläufige Einflüsse sich gegenseitig aufheben und daher nicht erkannt werden. ACHTUNG: Auf Fallzahlen achten! 19

20 Männer Frauen Erwerbsstatus regelm. Vollzeit RG RG unregelm./teilzeit 0,481 0,192 arbeitslos -0,174-0,210 Rentner -0,219 0,076 sonst. nicht-erwerbstätige 0,214 0,443*** Alter Jahre 0,017-0, Jahre 0,016 0, Jahre RG RG älter als 60 Jahre -0,330-0,345* Haushaltstyp Ein-Personen-Haushalt -0,183-0,447*** Paar ohne Kinder RG RG Alleinerziehend -0,211-0,181 Paar mit einem Kind -0,079 0,029 Paar mit zwei Kindern 0,217 0,334** Paar mit drei Kindern + 0,318 0,432** sonst. Haushalte -0,112-0,463* Schulabschluss missing 0,776* -0,273 kein Abschluss -0,342-0,858** Hauptschulabschluss -0,044-0,203* Realschulabschluss RG RG (Fach-)Hochschulreife -0,156 0,321** Abschluss verbessert 0,356 0,440 Konstante -1,258*** -1,603*** n Pseudo R 2 0,026 0,057 RG = Referenzgruppe 7 Odd Ratios eine weitere Darstellungsformen der Schätzergebnisse 20

21 Problem Durch die Schätzung der Koeffizienten können wir zwar die Signifikanz und die Richtung des Zusammenhangs zwischen abhängiger und unabhängiger Variable bestimmen, aber es sind keine Aussagen über die Stärke des Zusammenhangs möglich! Alternative: Berechnung von Odd Ratios Exkurs: Was sind Odd Ratios und wie werden sie interpretiert? Beispiel (a) zur Berechnung und Interpretation von Odd Ratios A B C D E F G sonstige Todesursache Hirntumor n Wahrscheinlichkeit d. Todes durch HT (in %) Gegenwahrscheinlichkeit sonst. Tod (in %) Odds (Tod durch HT/sonst. Gründe) 1 Männer , , , Frauen (RG) , , , Prozentsatzdifferenz Männer- Frauen 0, Differenz der beiden Odds 0, Odd Ratio Mann/Frau (RG) 2, "Wahrscheinlichkeits-Ratio" 2, Diff. Zw. Odd & Wahrscheinlichkeits-Ratio 0, Die Wahrscheinlichkeit von Männern, an einem Gehirntumor zu sterben, ist rund 2,4mal so groß wie die Wahrscheinlichkeit von Frauen, an einem Gehirntumor zu sterben 21

22 Beispiel (b) zur Berechnung und Interpretation von Odd Ratios A B C D E F G sonstige Todesursache Hirntumor n Wahrscheinlichkeit d. Todes durch HT (in %) Gegenwahrscheinlichkeit sonst. Tod (in %) Odds (Tod durch HT/sonst. Gründe) 1 Männer , , , Frauen (RG) , , , Prozentsatzdifferenz Männer- Frauen 1, Differenz der beiden Odds 0, Odd Ratio Mann/Frau (RG) 3, "Wahrscheinlichkeits-Ratio" 3, Diff. Zw. Odd & Wahrscheinlichkeits-Ratio 0, Die Wahrscheinlichkeit von Männern, an einem Gehirntumor zu sterben, ist rund 3,6mal so groß wie die Wahrscheinlichkeit von Frauen, an einem Gehirntumor zu sterben Beispiel (c) zur Berechnung und Interpretation von Odd Ratios A B C D E F G sonstige Todesursache Hirntumor n Wahrscheinlichkeit d. Todes durch HT (in %) Gegenwahrscheinlichkeit sonst. Tod (in %) Odds (Tod durch HT/sonst. Gründe) 1 Männer , , , Frauen (RG) , , , Prozentsatzdifferenz Männer- Frauen -1, Differenz der beiden Odds -0, Odd Ratio Mann/Frau (RG) 0, "Wahrscheinlichkeits-Ratio" 0, Diff. Zw. Odd & Wahrscheinlichkeits-Ratio -0, Die Wahrscheinlichkeit von Männern, an einem Gehirntumor zu sterben, ist rund 0,6mal so groß wie die Wahrscheinlichkeit von Frauen, an einem Gehirntumor zu sterben 22

23 Wie sind Odd Ratios im Regressionsmodell zu interpretieren? Die Werte von Odd Ratios (OR) liegen theoretisch zwischen 0 und unendlich. OR < 1 bedeutet für die Analysegruppe eine geringere Wahrscheinlichkeit, dass die abhängige Variable 1 ergibt, als die Referenzgruppe. OR > 1 bedeutet für die Analysegruppe eine höhere Wahrscheinlichkeit, dass die abhängige Variable 1 ergibt, als die Referenzgruppe. Was ist bei der Interpretation von Odd Ratios im Regressionsmodell zu beachten? a) Der einfache Fall: OR > 1 ORs mit einem Wert > 1 sind relativ einfach zu interpretieren. Bsp.: Frau: Referenzgruppe / Mann: OR= 1,432*** Abhängige Variable: Ehrenamtsaufnahme Männer haben (unter Kontrolle aller anderen Variablen im Modell) gegenüber Frauen eine um 43,2 % erhöhte Wahrscheinlichkeit, ein Ehrenamt aufzunehmen. 23

24 b) Der knifflige Fall: OR < 1 ORs mit einem Wert < 1 sind schwieriger zu interpretieren. Bsp.: Frau: Referenzgruppe / Mann: OR= 0,650*** Abhängige Variable: Ehrenamtsaufnahme Männer haben (unter Kontrolle aller anderen Variablen im Modell) gegenüber Frauen eine 0,650mal so große Wahrscheinlichkeit, ein Ehrenamt aufzunehmen. ACHTUNG: Das heißt NICHT, dass Männer eine um 35 % verringerte Wahrscheinlichkeit der Ehrenamtsaufnahme gegenüber Frauen aufweisen (also nicht 1-0,650 = 0,350)!!! Interpretationsbeispiele bei OR < 1 P = (1 / 0,95)-1= 0,0526 OR 1-OR (Falsch!) % 0,95 5,00 5,26 0,90 10,00 11,11 0,85 15,00 17,65 0,80 20,00 25,00 0,75 25,00 33,33 0,70 30,00 42,86 0,65 35,00 53,85 0,60 40,00 66,67 0,55 45,00 81,82 0,50 50,00 100,00 0,45 55,00 122,22 0,40 60,00 150,00 0,35 65,00 185,71 0,30 70,00 233,33 P = (1 / 0,70)-1= 0,4286 P = (1 / 0,50)-1= 1! VORSICHT!??? A hat eine um 100 % verringerte Wahrscheinlichkeit als B??? 24

25 Der noch kniffligere Fall: OR <= 0,5 Interpretationsbeispiele Bei OR Werten <= 0,5 bietet sich eine umgekehrte Interpretation an. OR 1-OR (Falsch!) % 0,95 5,00 5,26 0,90 10,00 11,11 0,85 15,00 17,65 0,80 20,00 25,00 0,75 25,00 33,33 0,70 30,00 42,86 0,65 35,00 53,85 0,60 40,00 66,67 0,55 45,00 81,82 0,50 50,00 100,00 0,45 55,00 122,22 0,40 60,00 150,00 0,35 65,00 185,71 0,30 70,00 233,33 Die Referenzgruppe hat eine doppelt so hohe Wahrscheinlichkeit wie die Analysegruppe Die Referenzgruppe hat eine um 122 % erhöhte Wahrscheinlichkeit gegenüber der Analysegruppe 8 Ausblick 25

26 Die weiteren Sitzungen 3. Sitzung (Praxis) Donnerstag, , Uhr Kurze Wiederholung der wichtigen methodischen Punkte Gemeinsame Begutachtung der Übungs-Rohdaten und Plan zur Aufbereitung der Daten für die logistische Regression 4. Sitzung (Praxis) Donnerstag, , Uhr Einführung in STATA Aufbereitung der Daten in STATA 5. Sitzung (Praxis) Donnerstag, , Uhr Anwendung der eigentlichen Logistischen Regression in STATA Diskussion und Interpretation der Schätzergebnisse 6. Sitzung (Praxis) (optional) Donnerstag, , Uhr Bei Bedarf: Gemeinsamer Einstieg in eine neue Analyse mit anderer Fragestellung und anderen Daten 7. Sitzung (Theorie) Donnerstag, , Uhr Ausblick: Weitere multivariate Analyseverfahren (bspw. multiple Logistische Regression, Übergangsratenmodelle etc.); Gemeinsamkeiten und Unterschiede zur Binären Logistischen Regression Schlussbemerkung Trotz der Vorzüge und Möglichkeiten multivariater Analyseinstrumente insbesondere für die sozialwissenschaftliche Forschung sollten scheinbar einfache deskriptive Verfahren nicht vernachlässigt und deren Nutzen nicht unterschätzt werden: Generally, descriptive studies are thus much more relevant for sociology as an explanatory enterprise than current journals and university curricula would have us belief. (Wippler/Lindenberg 1987: 159) 26

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation Einführung in die Logistische Regression Fortbildung zur 9.Informationstagung Tumordokumentation Bernd Schicke, Tumorzentrum Berlin FB Bayreuth, 29.März 20 Gliederung Einleitung Schätzen von Maßzahlen

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent?

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Anwendungen PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Ulrike Braisch, Rainer Muche Institut für Epidemiologie und Medizinische Biometrie Universität Ulm Schwabstraße

Mehr

Anmerkung: Die Lösungen enthalten nur einige ausgewählte Antworten; weitere Lösungen sind möglich.

Anmerkung: Die Lösungen enthalten nur einige ausgewählte Antworten; weitere Lösungen sind möglich. Übungsaufgaben zur Weiterbildung Anmerkung: Die Lösungen enthalten nur einige ausgewählte Antworten; weitere Lösungen sind möglich. 1. Was ist unter formeller und informeller Weiterbildung zu verstehen?

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Willkommen zur Vorlesung Empirische Methoden I

Willkommen zur Vorlesung Empirische Methoden I Willkommen zur Vorlesung Empirische Methoden I 12. Sitzung: (Quantitative) Datenauswertung Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

6.1 Grundbegriffe und historischer Hintergrund

6.1 Grundbegriffe und historischer Hintergrund Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

BIOL, HST HS 2014 Dr. M. Kalisch. MC-Quiz 1. Einsendeschluss: Dienstag, der :59 Uhr

BIOL, HST HS 2014 Dr. M. Kalisch. MC-Quiz 1. Einsendeschluss: Dienstag, der :59 Uhr BIOL, HST HS 2014 Dr. M. Kalisch MC-Quiz 1 Einsendeschluss: Dienstag, der 23.09.2014 23:59 Uhr Dieses Quiz soll Ihnen helfen, die Regression mit Faktoren und Wechselwirkungen besser zu verstehen. Zum Teil

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Logistische Regression

Logistische Regression TU Chemnitz SoSe 2012 Seminar: Multivariate Analysemethoden 26.06.2012 Dozent: Dr. Thomas Schäfer Logistische Regression Ein Verfahren zum Schätzen von Wahrscheinlichkeiten Referentinnen: B. Sc. Psych.

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Notiz zur logistischen Regression

Notiz zur logistischen Regression Kapitel 1 Notiz zur logistischen Regression 1.1 Grundlagen Bei dichotomen abhängigen Variablen ergeben sich bei einer normalen linearen Regression Probleme. Während man die Ausprägungen einer dichotomen

Mehr

Analyse von Tabellen und kategorialen Daten

Analyse von Tabellen und kategorialen Daten Hans-Jürgen Andreß Jacques A. Hagenaars Steffen Kühnel Analyse von Tabellen und kategorialen Daten Log-lineare Modelle, latente Klassenanalyse, logistische Regression und GSK-Ansatz Mit 32 Abbildungen

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Effekte der Dauer und der Qualität berufspraktischer Vorerfahrungen auf den Studienerfolg beruflich Qualifizierter (BQ)

Effekte der Dauer und der Qualität berufspraktischer Vorerfahrungen auf den Studienerfolg beruflich Qualifizierter (BQ) Effekte der Dauer und der Qualität berufspraktischer Vorerfahrungen auf den Studienerfolg beruflich Qualifizierter (BQ) Tagung: Studium ohne Abitur: Studium und Beruf nicht-traditioneller Studierender,

Mehr

Basis (=100%) zusätzlichen Schulabschluss an. Befragungszeitraum: 29.11.-10.12.2011

Basis (=100%) zusätzlichen Schulabschluss an. Befragungszeitraum: 29.11.-10.12.2011 Tabelle 1: Interesse an höherem Schulabschluss Streben Sie nach Beendigung der Schule, die Sie momentan besuchen, noch einen weiteren oder höheren Schulabschluss an? Seite 1 Selektion: Schüler die nicht

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Pfadanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Pfadanalyse Bacher, SoSe2007 1. Grundlegende Verfahren Explorative Pfadanalyse: Kausale Beziehungen zwischen Variablen werden aufgedeckt, erforderlich ist eine kausale Anordnung der Variablen. Konfirmatorische

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Einflussfaktoren der Studienfachwahl im Zeitverlauf: Stabil oder variabel?

Einflussfaktoren der Studienfachwahl im Zeitverlauf: Stabil oder variabel? Einflussfaktoren der Studienfachwahl im Zeitverlauf: Stabil oder variabel? 6. Jahrestagung der Gesellschaft für Hochschulforschung Wettbewerb und Hochschulen Kerstin Burck, Katharina Heil und Tatjana Rudi

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung

Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Universität Augsburg Wirtschaftswissenschaftliche Fakultät Lehrstuhl für Finanz und Bankwirtschaft Matrikelnummer Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Prof. Dr. Marco Wilkens

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Master of Science in Pflege

Master of Science in Pflege Master of Science in Pflege Modul: Statistik Einfache und multiple Regressionsanalyse / Logistische Regressionsanalyse November 2012 Prof. Dr. Jürg Schwarz Folie 2 Programm 28. November 2012: Vormittag

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Logistische Regression

Logistische Regression Grundideen Logistische Regression Exkurs Logistische Regression Auch nachzulesen bei: http://www.psychologie.uniwuerzburg.de/methoden/lehre/skripten/hs_meth_evaluation/hs_evaluation_logistisch eregression.pdf

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

2 Definitionen und Rahmenbedingungen für die Messung von Familieneinfluss 13

2 Definitionen und Rahmenbedingungen für die Messung von Familieneinfluss 13 Inhaltsverzeichnis xv_ INHALTSVERZEICHNIS /. Geleitwort vii 2. Geleitwort ix VORWORT ABKÜRZUNGSVERZEICHNIS SYMBOLVERZEICHNIS. TABELLENVERZEICHNIS ABBILDUNGSVERZEICHNIS FORMELVERZEICHNIS xi xxi xxv xxvii

Mehr

Bildungsverhalten, individuelle Lebensführung und gesellschaftliche Teilhabe Ein Überblick. Stefan Kühne

Bildungsverhalten, individuelle Lebensführung und gesellschaftliche Teilhabe Ein Überblick. Stefan Kühne Bildungsverhalten, individuelle Lebensführung und gesellschaftliche Teilhabe Ein Überblick Stefan Kühne Inhalt I. Überblick Gesellschaftliche Teilhabe im Spiegel der nationalen Bildungsberichterstattung

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

DOE am Beispiel Laserpointer

DOE am Beispiel Laserpointer DOE am Beispiel Laserpointer Swen Günther Ein wesentliches Ziel im Rahmen der Neuproduktentwicklung ist die aus Kundesicht bestmögliche, d.h. nutzenmaximale Konzeption des Produktes zu bestimmen (vgl.

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Berichte aus der Statistik. Jens Kahlenberg. Storno und Profitabilität in der Privathaftpflichtversicherung

Berichte aus der Statistik. Jens Kahlenberg. Storno und Profitabilität in der Privathaftpflichtversicherung Berichte aus der Statistik Jens Kahlenberg Storno und Profitabilität in der Privathaftpflichtversicherung Eine Analyse unter Verwendung von univariaten und bivariaten verallgemeinerten linearen Modellen

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Einführung in die Statistik mit EXCEL und SPSS

Einführung in die Statistik mit EXCEL und SPSS Christine Duller 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Einführung in die Statistik mit EXCEL und SPSS Ein

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Erwerbsbiografische Einflüsse auf das Gründungsverhalten eine genderspezifische Analyse

Erwerbsbiografische Einflüsse auf das Gründungsverhalten eine genderspezifische Analyse Erwerbsbiografische Einflüsse auf das Gründungsverhalten eine genderspezifische Analyse Frühjahrstagung des Arbeitskreises Die Arbeit der Selbstständigen Berlin, 21. März 2015 Dr. Rosemarie Kay, Olga Suprinovič,

Mehr

Konflikte in Personalratsgremien und mit der Dienststellenleitung

Konflikte in Personalratsgremien und mit der Dienststellenleitung Konflikte in Personalratsgremien und mit der Dienststellenleitung Berlin, www.wsi.de Inhalt des Vortrags Fragestellung, Forschungsansatz und Daten Konflikte zwischen Personalräten (PR) und Dienststellenleitungen

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

Risikoadjustierte Daten der Prävalenzmessung Dekubitus Kinder 2013. Dirk Richter

Risikoadjustierte Daten der Prävalenzmessung Dekubitus Kinder 2013. Dirk Richter Risikoadjustierte Daten der Prävalenzmessung Dekubitus Kinder 2013 Dirk Richter Berner Angewandte Fachhochschule Forschung Haute & Entwicklung/ école spécialisée Dienstleistung bernoise Pflege, Bern University

Mehr

Verwundbarkeit gegenüber Naturgefahren eine räumlich differenzierte Analyse an Beispielen von Köln und Cádiz (Spanien)

Verwundbarkeit gegenüber Naturgefahren eine räumlich differenzierte Analyse an Beispielen von Köln und Cádiz (Spanien) Statistische Woche München 12. Oktober 2010 Verwundbarkeit gegenüber Naturgefahren eine räumlich differenzierte Analyse an Beispielen von Köln und Cádiz (Spanien) Maike Vollmer Research Associate, UNU-EHS

Mehr

Leben und Arbeiten in Baden-Württemberg. Ergebnisse des Mikrozensus 2013

Leben und Arbeiten in Baden-Württemberg. Ergebnisse des Mikrozensus 2013 2014 Leben und Arbeiten in Baden-Württemberg Ergebnisse des Mikrozensus 2013 So erreichen Sie uns: Statistisches Landesamt Baden-Württemberg Böblinger Straße 68 70199 Stuttgart Telefon 0711/ 641-0 Telefax

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Staatsbürgerschaft oder Geburtsland?

Staatsbürgerschaft oder Geburtsland? Max-Planck-Institut für Bildungsforschung Staatsbürgerschaft oder Geburtsland? Unterschiedliche Operationalisierungen und ihre Implikationen für Aussagen zur Bildungsbeteiligung verschiedener Zuwanderergruppen

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Erfolgsbedingungen der Bewerbung um den Ausbildungsplatz:

Erfolgsbedingungen der Bewerbung um den Ausbildungsplatz: Erfolgsbedingungen der Bewerbung um den Ausbildungsplatz: Analyse einer Bewerberbefragung Michael Tiemann Vorstellung der Magisterarbeit, 2006 Gliederung Problemstellung Erfolgreiche Bewerberinnen und

Mehr

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der

Mehr

Statistische Modellierung Merkblatt

Statistische Modellierung Merkblatt Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC

Mehr

Grundlagen der Datenanalyse

Grundlagen der Datenanalyse Schematischer Überblick zur Behandlung quantitativer Daten Theorie und Modellbildung Untersuchungsdesign Codierung / Datenübertragung (Erstellung einer Datenmatrix) Datenerhebung Fehlerkontrolle / -behebung

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr