Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Größe: px
Ab Seite anzeigen:

Download "Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II"

Transkript

1 Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II

2 Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II Logistische Regression (1/27)

3 Zum Nachlesen/Vorbereiten Literatur Annahmen und Annahmeverletzungen Agresti ch. 15: Statistik II Logistische Regression (2/27)

4 Schätzverfahren und ihre Eigenschaften Annahmeverletzungen Was sind die Standard-Annahmen? Zufallsstichprobe Wahres Modell: y i = β 0 + β 1 x 1i + β 2 x 2i + ɛ i 1. Die abhängige Variable ist intervallskaliert und unbeschränkt. (Variablen werden ohne Fehler gemessen) 2. Alle unabhängigen Variablen haben Varianz 3. Keine perfekte Multikollineariät 4. Für jede mögliche Kombination der unabhängigen Variablen ist der (konditionale) Mittelwert von ɛ = 0 Statistik II Annahmen (16/26)

5 Schätzverfahren und ihre Eigenschaften Annahmeverletzungen Was sind die Standard-Annahmen? Zufallsstichprobe Wahres Modell: y i = β 0 + β 1 x 1i + β 2 x 2i + ɛ i 5. Keine Kovarianz zwischen x ki und ɛ 6. Für jedes beliebige Paar von Beobachtungen i und h sind ɛ i und ɛ h unkorreliert (keine Autokorrelation) 7. Für jede mögliche Kombination der unabhängigen Variablen ist die (konditionale) Varianz von ɛ gleich σ 2 und damit konstant (Homoskedastizität) 8. Für jede mögliche Kombination der unabhängigen Variablen ist ɛ normalverteilt Statistik II Annahmen (16/26)

6 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Statistik II Logistische Regression (3/27)

7 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Statistik II Logistische Regression (3/27)

8 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Annahmen in Politikwissenschaft häufig verletzt Z. B. Abhängigkeiten zwischen Beobachtungen (Zeitreihen, Panel... ) Kategoriale abhängige Variablen Statistik II Logistische Regression (3/27)

9 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Annahmen in Politikwissenschaft häufig verletzt Z. B. Abhängigkeiten zwischen Beobachtungen (Zeitreihen, Panel... ) Kategoriale abhängige Variablen Erweiterungen/Ergänzungen des linearen Modells Statistik II Logistische Regression (3/27)

10 Schätzverfahren und ihre Eigenschaften Annahmeverletzungen Was passiert, wenn Annahme 1 nicht erfüllt ist? Die abhängige Variable ist intervallskaliert und unbeschränkt. Variablen werden ohne Fehler gemessen Abhängige Variable hat häufig wenig diskrete Ausprägungen (Ratingskalen) Erwartete Werte außerhalb des gültigen Wertebereichs Modelle für ordinale Daten In der Literatur wenig diskutiert, häufig wird angenommen, daß Modell relativ robust ist Alle sozialwissenschaftlichen Variablen fehlerbehaftet Relativ unproblematisch, wenn Fehler voneinander unabhängig und Stichprobe groß Fehler bei y wird von ɛ absorbiert, OLS weniger effizient Fehler bei x schwächt im bivariaten Fall Zusammenhang ab, multivariat auf jeden Fall bias Statistik II Annahmen (17/26)

11 Was ist eine Funktion? Funktionen Exponenten, Wurzeln usw. Abbildungsvorschrift Berechnungsvorschrift Ordnet jedem Wert der x-variable(n) genau einen Wert zu Einstellige Funktionen Mehrstellige Funktionen Allgemeine Formulierung: f (x 1, x 2, ) Lineare Funktion besteht nur aus Konstanten und Produkten von x 1, x 2, Nicht-lineare Funktion: andere Elemente Bisher y als lineare Funktion von x 1, Alle Funktionen graphisch darstellbar (ggf. mehrdimensional) Steigung der Funktion in einem Punkt: (1.) Ableitung Statistik II Logistische Regression (4/27)

12 Funktionen Exponenten, Wurzeln usw. Nicht-lineare Funktionen: z. B. Polynome y = f (x) = 4 x + x x Statistik II Logistische Regression (5/27)

13 Exponenten Wiederholung Funktionen Exponenten, Wurzeln usw. Basis und Exponent Ganzzahlige positive Exponenten: x 3 = x x x Exponent 1 oder 0: x 1 = x; x 0 = 1 Negative Exponenten: x 1 = 1 x ; x 3 = 1 x 3 Rationale Exponenten Quadratwurzel aus x: Mit sich selbst multiplizieren, um x zu erhalten n-te Wurzel aus x: n-mal mit sich selbst multiplizieren, um x zu erhalten n Nenner = n-te Wurzel: x = x 1 n 5 Kompletter Bruch: x 4 = x 4 5 x 4 5 = 1 x 4 5 = 1 5 x 4 Statistik II Logistische Regression (6/27)

14 Funktionen Exponenten, Wurzeln usw. Was ist der natürliche Logarithmus? Logarithmus Umkehrfunktion zur Exponentialfunktion Natürlicher Logarithmus (Funktionsname ln() oder log e ) basiert auf Eulerscher Zahl e = e wichtige Konstante in vielen statistischen Verteilungen und Herleitungen (z. B. Normalverteilung) e 3 = exp(3) ln( ) 3 Natürlicher Logarithmus von x gibt Antwort auf die Frage: Wie oft muß ich e mit sich selbst multiplizieren, um x zu erhalten? Statistik II Logistische Regression (7/27)

15 Potenzen zur Basis e: y = exp(x) Funktionen Exponenten, Wurzeln usw. 150 y = f (x) = exp(x) y > x Statistik II Logistische Regression (8/27)

16 Funktionen Exponenten, Wurzeln usw. Natürlicher Logarithmus = Umkehrfunktion: y = ln(x) 1 y = f (x) = ln(x) ln(x) für x 0 nicht definiert x Statistik II Logistische Regression (9/27)

17 Das Problem Das binäre Logit-Modell Binäre Variablen in der Politikwissenschaft Wahlabsicht in den USA: Republikanisch (0) vs. Demokratisch (1) Land in bestimmtem Jahr in Bürgerkrieg verwickelt: ja (1) vs. nein (0) Parteibindung vorhanden: ja (1) vs. nein (0) Politisches System eine Demokratie: ja (1) vs. nein (0) Wertorientierungen: postmaterialistisch (1) vs. nichtpostmaterialistisch (0) Wahlabsicht zugunsten der CDU: ja (1) vs. nein (0) Statistik II Logistische Regression (10/27)

18 Das Problem Das binäre Logit-Modell Binäre Variablen in der Politikwissenschaft Wahlabsicht in den USA: Republikanisch (0) vs. Demokratisch (1) Land in bestimmtem Jahr in Bürgerkrieg verwickelt: ja (1) vs. nein (0) Parteibindung vorhanden: ja (1) vs. nein (0) Politisches System eine Demokratie: ja (1) vs. nein (0) Wertorientierungen: postmaterialistisch (1) vs. nichtpostmaterialistisch (0) Wahlabsicht zugunsten der CDU: ja (1) vs. nein (0) Viele relevante Variablen binär (oder dichotom) Wie modellieren? Statistik II Logistische Regression (10/27)

19 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Beispiel: Wahlverhalten für CDU durch Sympathie für Merkel zu erklären? Zweitstimme in Umfrage binäre Variable CDU-Wahl Für jeden Befragten 0 (nein) oder 1 (ja) Mittelwert der Dummy-Variablen entspricht relativer Häufigkeit bzw. Wahrscheinlichkeit der CDU-Wahl Warum? Statistik II Logistische Regression (11/27)

20 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Beispiel: Wahlverhalten für CDU durch Sympathie für Merkel zu erklären? Zweitstimme in Umfrage binäre Variable CDU-Wahl Für jeden Befragten 0 (nein) oder 1 (ja) Mittelwert der Dummy-Variablen entspricht relativer Häufigkeit bzw. Wahrscheinlichkeit der CDU-Wahl Warum? Mittelwert cduwahl = = Statistik II Logistische Regression (11/27)

21 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Gesamtwahrscheinlichkeit der CDU-Wahl ca Prozent Mittelwert der Dummy-Variablen in Sympathie-Gruppen = Anteil der CDU-Wähler in Sympathie-Gruppen = Konditionaler Mittelwert = Konditionale Wahrscheinlichkeit der CDU-Wahl in den Gruppen (n = 80) Statistik II Logistische Regression (11/27)

22 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Gesamtwahrscheinlichkeit der CDU-Wahl ca Prozent Mittelwert der Dummy-Variablen in Sympathie-Gruppen = Anteil der CDU-Wähler in Sympathie-Gruppen = Konditionaler Mittelwert = Konditionale Wahrscheinlichkeit der CDU-Wahl in den Gruppen (n = 80). tabstat cduwahl,by (polsympangelamerkel) Summary for variables: cduwahl by categories of: polsympangelamerkel (polsymp [Angela Merkel] ) polsympangelamerkel mean Total.125 Statistik II Logistische Regression (11/27)

23 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Verfahren zur Modellierung konditionaler Mittelwerte: lineare Regression cduwahl = β 0 + β 1 Sympathie Merkel Statistik II Logistische Regression (11/27)

24 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Verfahren zur Modellierung konditionaler Mittelwerte: lineare Regression cduwahl = β 0 + β 1 Sympathie Merkel. reg cduwahl polsympangelamerkel Source SS df MS Number of obs = 80 F( 1, 78) = 6.07 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cduwahl Coef. Std. Err. t P> t [95% Conf. Interval] polsympang ~ l _cons Statistik II Logistische Regression (11/27)

25 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Statistik II Logistische Regression (12/27)

26 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Wahrscheinlichkeit CDU-Wahl CDU-Sympathie Statistik II Logistische Regression (12/27)

27 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Wahrscheinlichkeit CDU-Wahl CDU-Sympathie 1. Heteroskedastizität Standardfehler 2. Wahrscheinlichkeiten außerhalb Intervall (0;1) 3. (Linearer Verlauf nicht plausibel) Statistik II Logistische Regression (12/27)

28 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Wahrscheinlichkeit CDU-Wahl CDU-Sympathie Statistik II Logistische Regression (12/27)

29 Wie kommt man zum Modell? Das Problem Das binäre Logit-Modell Problem: CDU-Wahl bzw. deren Wahrscheinlichkeit auf Wertebereich [0;1] beschränkt Transformation der Variablen 1. Schritt: Statt Wahrscheinlichkeiten odds betrachten (Entsprechen in etwa Wettquoten beim Sport) odds(p) = p p ; im Beispiel Wertebereich von 0 bis (fast) Variieren über Ausprägungen der unabhängigen z. B (6.6%) und 1.99 (66.6%) 2. Schritt: Von diesen odds wird der natürliche Logarithmus bestimmt (Logarithmierung) Statistik II Logistische Regression (13/27)

30 Das Problem Das binäre Logit-Modell Wie kommt man zum Modell? II Die logarithmierten Odds werden als Logits bezeichnet Wertebereich von (fast) bis (fast) + Im Beispiel Logits zwischen (6.6%) und (66.6%) Statistik II Logistische Regression (14/27)

31 Wie kommt man zum Modell? II Das Problem Das binäre Logit-Modell Die logarithmierten Odds werden als Logits bezeichnet Wertebereich von (fast) bis (fast) + Im Beispiel Logits zwischen (6.6%) und (66.6%) Nicht-lineares Verhältnis zur Wahrscheinlichkeit Wahrscheinlichkeit von 50% entspricht Logit von 0 Positiver Logit größere Wahrscheinlichkeit Negativer Logit kleinere Wahrscheinlichkeit Statistik II Logistische Regression (14/27)

32 Wie kommt man zum Modell? II Das Problem Das binäre Logit-Modell Die logarithmierten Odds werden als Logits bezeichnet Wertebereich von (fast) bis (fast) + Im Beispiel Logits zwischen (6.6%) und (66.6%) Nicht-lineares Verhältnis zur Wahrscheinlichkeit Wahrscheinlichkeit von 50% entspricht Logit von 0 Positiver Logit größere Wahrscheinlichkeit Negativer Logit kleinere Wahrscheinlichkeit Logit-Modell: linearer Zusammenhang zwischen x und Logit logit(cduwahl) = β 0 + β 1 merkelsympathie Schätzung der Koeffizienten/Standardfehler mit speziellem iterativen Verfahren (Maximum Likelihood) Statistik II Logistische Regression (14/27)

33 Das Problem Das binäre Logit-Modell In Stata. logit cduwahl polsympangelamerkel Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logistic regression Number of obs = 80 LR chi2(1) = 6.30 Prob > chi2 = Log likelihood = Pseudo R2 = cduwahl Coef. Std. Err. z P> z [95% Conf. Interval] polsympang ~ l _cons ? Statistik II Logistische Regression (15/27)

34 Das Problem Das binäre Logit-Modell In Stata. logit cduwahl polsympangelamerkel Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logistic regression Number of obs = 80 LR chi2(1) = 6.30 Prob > chi2 = Log likelihood = Pseudo R2 = cduwahl Coef. Std. Err. z P> z [95% Conf. Interval] polsympang ~ l _cons ? Richtung und Signifikanz Statistik II Logistische Regression (15/27)

35 Nicht-Linearität Zusammenhang zwischen x und y nicht-linear, aber monoton Mehr x, mehr y (positiver Zusammenhang) bzw. Mehr x, weniger y (negativer) Zusammenhang Aber nicht mit konstanter Rate S-förmiger Zusammenhang Statistik II Logistische Regression (16/27)

36 Nicht-Linearität Zusammenhang zwischen x und y nicht-linear, aber monoton Mehr x, mehr y (positiver Zusammenhang) bzw. Mehr x, weniger y (negativer) Zusammenhang Aber nicht mit konstanter Rate S-förmiger Zusammenhang Veränderung in Wahrscheinlichkeit nicht proportional zu Veränderung in x Großer Effekt, wenn Wahrscheinlichkeit im mittleren Bereich Kleiner Effekt, wenn Wahrscheinlichkeit sehr groß oder sehr gering Statistik II Logistische Regression (16/27)

37 Nicht-Linearität Zusammenhang zwischen x und y nicht-linear, aber monoton Mehr x, mehr y (positiver Zusammenhang) bzw. Mehr x, weniger y (negativer) Zusammenhang Aber nicht mit konstanter Rate S-förmiger Zusammenhang Veränderung in Wahrscheinlichkeit nicht proportional zu Veränderung in x Großer Effekt, wenn Wahrscheinlichkeit im mittleren Bereich Kleiner Effekt, wenn Wahrscheinlichkeit sehr groß oder sehr gering Statistik II Logistische Regression (16/27)

38 Was ist mit den zufälligen Fehlern? Im linearen Regressionsmodell zufällige Normalverteilung um konditionalen Mittelwert Separater Parameter (σ 2 ɛ) Für Logit-Modell Binomialverteilung um konditionale Wahrscheinlichkeit Varianz hängt ab von erwarteter Wahrscheinlichkeit (Heteroskedastizität) Ist durch Modell fixiert und wird nicht separat geschätzt Probit-Modelle sind sehr ähnlich, haben lediglich eine andere Link- bzw. Varianzfunktion Statistik II Logistische Regression (17/27)

39 Logit-Koeffizienten Modell nur in den Logits linear von Richtung (Vorzeichen) von Signifikanz Logits sind sehr unanschaulich Statistik II Logistische Regression (18/27)

40 Odds/Odd-Ratios logit(cduwahl) =β 0 + β 1 merkelsympathie e logit(cduwahl) = odds(cduwahl) =e (β 0+β 1 merkelsympathie) =e β 0 e β 1merkelsympathie Multiplikative Darstellung des Modells Für x = 0: odds = anti-logarithmierte Konstante e β 1 = exp(β 1 ) = Effektkoeffizient Veränderung von x um eine Einheit multipliziert die odds mit dem Effektkoeffizienten Statistik II Logistische Regression (19/27)

41 Odds/Odd-Ratios logit(cduwahl) =β 0 + β 1 merkelsympathie e logit(cduwahl) = odds(cduwahl) =e (β 0+β 1 merkelsympathie) =e β 0 e β 1merkelsympathie Multiplikative Darstellung des Modells Für x = 0: odds = anti-logarithmierte Konstante e β 1 = exp(β 1 ) = Effektkoeffizient Veränderung von x um eine Einheit multipliziert die odds mit dem Effektkoeffizienten Findet sich manchmal in (älterer) Literatur, nicht sehr anschaulich Statistik II Logistische Regression (19/27)

42 Wie kommt man von Logits zu Wahrscheinlichkeiten? Logit Wie nach p auflösen? ( ) p Logit = β 0 + β 1 x 1 = ln 1 p Statistik II Logistische Regression (20/27)

43 Wie kommt man von Logits zu Wahrscheinlichkeiten? Logarithmus loswerden exp(logit) = p 1 p Statistik II Logistische Regression (20/27)

44 Wie kommt man von Logits zu Wahrscheinlichkeiten? p auf eine Seite bringen, ausmultiplizieren exp(logit) (1 p) = p exp(logit) p exp(logit) = p Statistik II Logistische Regression (20/27)

45 Wie kommt man von Logits zu Wahrscheinlichkeiten? exp(logit) freistellen, rechte Seite zusammenfassen exp(logit) = p exp(logit) + p exp(logit) = (exp(logit) + 1) p Statistik II Logistische Regression (20/27)

46 Wie kommt man von Logits zu Wahrscheinlichkeiten? p wieder freistellen exp(logit) exp(logit) + 1 = p exp(β 0 + β 1 x 1 ) exp(β 0 + β 1 x 1 ) + 1 = p e (β 0+β 1 x 1 ) e (β 0+β 1 x 1 ) + 1 = p Statistik II Logistische Regression (20/27)

47 Wahrscheinlichkeiten p = eβ 0+β 1 x e β 0+β 1 x 1 Odds auch nicht wirklich anschaulich Klarste : erwartete Wahrscheinlichkeiten 1. Teil der Transformation auch umkehren Veränderung der Wahrscheinlichkeit nicht proportional zur Veränderung von x bzw. abhängig vom Niveau von x (und ggf. anderer x 2, ) S-förmiger Zusammenhang Statistik II Logistische Regression (21/27)

48 Erweiterung des Modells logit(y) = β 0 + β 1 x 1 + β 2 x 2 + Logistische Regression ebenfalls multivariat möglich Mehrere unabhängige Variablen wirken linear-additiv auf den Logit Wirkung einer Veränderung von x 1 um eine Einheit auf die Wahrscheinlichkeit von y = 1 hängt ab vom Niveau von x1 und vom Niveau von x2, Am besten graphisch darstellbar Statistik II Logistische Regression (22/27)

49 CDU-Wahl II CDU-Wahl als Funktion von Merkelsympathie Links-Rechts-Selbsteinstufung logit(cduwahl) = β 0 + β 1 merkelsympathie + β 2 LRS Statistik II Logistische Regression (23/27)

50 In Stata. logit cduwahl polsympangelamerkel lrsselbstselbst Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Logistic regression Number of obs = 78 LR chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = cduwahl Coef. Std. Err. z P> z [95% Conf. Interval] polsympang ~ l lrsselbsts ~ t _cons Statistik II Logistische Regression (24/27)

51 Graphische Darstellung Wie wirkt Merkelsympathie für Linke (LRS=2) Zentristen (LRS=5) Rechte (LRS=8)? Statistik II Logistische Regression (25/27)

52 Graphische Darstellung Prob. CDU-Wahl Merkelsympathie LRS=2 LRS=8 LRS=5 Statistik II Logistische Regression (25/27)

53 Graphische Darstellung Wie wirkt Merkelsympathie für Linke (LRS=2) Zentristen (LRS=5) Rechte (LRS=8)? Wirkung von Sympathie... Fast linear für Rechte Schwach bei Zentristen Praktisch nicht vorhanden bei Linken Implizite Interaktion auf der Ebene der Wahrscheinlichkeiten Prob. CDU-Wahl Merkelsympathie LRS=2 LRS=5 LRS=8 Statistik II Logistische Regression (25/27)

54 Multivariate Nicht-Linearität 1 p(cdu) Symp. Merkel LRS 8 10 Statistik II Logistische Regression (26/27)

55 Multivariate Nicht-Linearität 1 p(cdu) Symp. Merkel 0 0 LRS Statistik II Logistische Regression (26/27)

56 Multivariate Nicht-Linearität 1 p(cdu) Symp. Merkel LRS 10 Statistik II Logistische Regression (26/27)

57 Viele politikwissenschaftlich interessante Variablen dichotom Lineares Modell problematisch Logit-Modell als gute Alternative erfordert Sorgfalt Statistik II Logistische Regression (27/27)

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Einfache Modelle für Paneldaten. Statistik II

Einfache Modelle für Paneldaten. Statistik II Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Zeitreihen. Statistik II

Zeitreihen. Statistik II Statistik II Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Zum Nachlesen

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

Fallbeispiel: Kreditscoring

Fallbeispiel: Kreditscoring Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden:

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Panelregression (und Mehrebenenanwendungen)

Panelregression (und Mehrebenenanwendungen) Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Grundzüge der Ereignisdatenanalyse

Grundzüge der Ereignisdatenanalyse Grundzüge der Ereignisdatenanalyse Regressionsmodelle Sommersemester 2009 Regressionsmodelle Event History Analysis (1/48) Übersicht Wiederholung Exponential- und Weibull-Modell Weitere Modelle Regressionsmodelle

Mehr

Multiple Regression. Statistik II

Multiple Regression. Statistik II Statistik II Übersicht Wiederholung Literatur Regression Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Analyse von Tabellen und kategorialen Daten

Analyse von Tabellen und kategorialen Daten Hans-Jürgen Andreß Jacques A. Hagenaars Steffen Kühnel Analyse von Tabellen und kategorialen Daten Log-lineare Modelle, latente Klassenanalyse, logistische Regression und GSK-Ansatz Mit 32 Abbildungen

Mehr

Binäre Auswahlmodelle (Logit, Probit,...)

Binäre Auswahlmodelle (Logit, Probit,...) Binäre Auswahlmodelle (Logit, Probit,...) 27. November 204 In diesem Kapitel führen wir eine Klasse von Modellen für binäre Auswahlprobleme ein, deren wichtigste Vertreter das Logit- und das Probit-Modell

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse VL Forschungsmethoden Ereignisdatenanalyse 1 2 3 4 5 Übersicht VL Forschungsmethoden Event Data (1/45) Harold Macmillan, PM 1957-1963 The greatest challenge in politics: events, my dear boy, events Was

Mehr

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Stefan Lang 12 Oktober 2005 WS 05/06 Datensatzbeschreibung (1) Daten Versicherungsdaten für Belgien ca 160000 Beobachtungen Ziel Analyse der Risikostruktur

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

3. Einführung in die Zeitreihenanalyse

3. Einführung in die Zeitreihenanalyse 3. Einführung in die Zeitreihenanalyse Dr. Johann Burgstaller Finance Department, JKU Linz (Dieser Foliensatz wurde zuletzt aktualisiert am 25. Dezember 2007.) Dr. Johann Burgstaller IK Empirische Kapitalmarktforschung

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse. Statistik II

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse. Statistik II Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Wiederholung Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Berichte aus der Statistik. Jens Kahlenberg. Storno und Profitabilität in der Privathaftpflichtversicherung

Berichte aus der Statistik. Jens Kahlenberg. Storno und Profitabilität in der Privathaftpflichtversicherung Berichte aus der Statistik Jens Kahlenberg Storno und Profitabilität in der Privathaftpflichtversicherung Eine Analyse unter Verwendung von univariaten und bivariaten verallgemeinerten linearen Modellen

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Statistische Modellierung Merkblatt

Statistische Modellierung Merkblatt Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Nachholklausur STATISTIK II

Nachholklausur STATISTIK II Nachholklausur STATISTIK II Name, Vorname: Matrikel-Nr.: Die Klausur enthält zwei Typen von Aufgaben: T e i l A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens eine

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart. No. 3 / 2010

SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart. No. 3 / 2010 SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart No. 3 / 2010 Binär-logistische Regressionsanalyse. Grundlagen und Anwendung für Sozialwissenschaftler Jochen Mayerl

Mehr

x A, x / A x ist (nicht) Element von A. A B, A B A ist (nicht) Teilmenge von B. A B, A B A ist (nicht) echte Teilmenge von B.

x A, x / A x ist (nicht) Element von A. A B, A B A ist (nicht) Teilmenge von B. A B, A B A ist (nicht) echte Teilmenge von B. SBP Mathe Grundkurs 1 # 0 by Clifford Wolf # 0 Antwort Diese Lernkarten sind sorgfältig erstellt worden, erheben aber weder Anspruch auf Richtigkeit noch auf Vollständigkeit. Das Lernen mit Lernkarten

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

Einführung in Statistik und Messwertanalyse für Physiker

Einführung in Statistik und Messwertanalyse für Physiker Gerhard Böhm, Günter Zech Einführung in Statistik und Messwertanalyse für Physiker SUB Göttingen 7 219 110 697 2006 A 12486 Verlag Deutsches Elektronen-Synchrotron Inhalt sverzeichnis 1 Einführung 1 1.1

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Notiz zur logistischen Regression

Notiz zur logistischen Regression Kapitel 1 Notiz zur logistischen Regression 1.1 Grundlagen Bei dichotomen abhängigen Variablen ergeben sich bei einer normalen linearen Regression Probleme. Während man die Ausprägungen einer dichotomen

Mehr

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Vorlesung:Multivariate Analyseverfahren

Vorlesung:Multivariate Analyseverfahren Vorlesung:Multivariate Analyseverfahren Josef Brüderl, Oktober 24 Multivariate Verfahren sind statistische Verfahren zur Analyse der Beziehungsstruktur mehrerer Variablen. Man kann multivariate Verfahren

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Logistische Regression

Logistische Regression Grundideen Logistische Regression Exkurs Logistische Regression Auch nachzulesen bei: http://www.psychologie.uniwuerzburg.de/methoden/lehre/skripten/hs_meth_evaluation/hs_evaluation_logistisch eregression.pdf

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Analysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 6: Inferenzstatistik und Regression

Analysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 6: Inferenzstatistik und Regression Analysen politikwissenschaftlicher Datensätze mit Stata Sitzung 6: Inferenzstatistik und Regression 1 Vorbereitung Bitte laden Sie den Datensatz z:\daten\infsim.dta 2 Inferenzstatistik Grundproblem der

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Konflikte in Personalratsgremien und mit der Dienststellenleitung

Konflikte in Personalratsgremien und mit der Dienststellenleitung Konflikte in Personalratsgremien und mit der Dienststellenleitung Berlin, www.wsi.de Inhalt des Vortrags Fragestellung, Forschungsansatz und Daten Konflikte zwischen Personalräten (PR) und Dienststellenleitungen

Mehr

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression 6.0 Logistische Regression 6.1 Das binäre Modell 6.1 Das binäre Modell Sei x der Vektor der Einflussgrößen mit einem Eins-Element, um die Regressionskonstante zu modellieren. Angenommen, es gilt das Regressionsmodell:

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Daten aus Online-Access-Panels

Daten aus Online-Access-Panels Daten aus Online-Access-Panels der Einfluss der Referenzstudie bei Propensity Score-Anpassungsverfahren Michael Bergmann & Robert Greszki Präsentation auf der Gründungstagung der Sektion Methoden der Politikwissenschaft

Mehr

6. Modelle mit binären abhängigen Variablen

6. Modelle mit binären abhängigen Variablen 6. Modelle mt bnären abhänggen Varablen 6.1 Lneare Wahrschenlchketsmodelle Qualtatve Varablen: Bnäre Varablen: Dese Varablen haben genau zwe möglche Kategoren und nehmen deshalb genau zwe Werte an, nämlch

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Kap. 9: Regression mit einer binären abhängigen Variablen

Kap. 9: Regression mit einer binären abhängigen Variablen Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick:

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Modelle mit diskreten abhängigen Variablen

Modelle mit diskreten abhängigen Variablen Kapitel 19 Modelle mit diskreten abhängigen Variablen 19.1 Vorbemerkungen Bisher sind wir stets davon ausgegangen, dass die abhängige Variable y intervallskaliert ist. Zusätzlich haben wir meist angenommen,

Mehr

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit Fehlerrechnung Inhalt: 1. Motivation 2. Was sind Messfehler, statistische und systematische 3. Verteilung statistischer Fehler 4. Fehlerfortpflanzung 5. Graphische Auswertung und lineare Regression 6.

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung

Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Eine Einführung für Anwender - Marcel Erlinghagen - Gelsenkirchen, Oktober 2003 Gliederung

Mehr

Inhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14

Inhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14 VII 1 Einführung... 1 1.1 Warum Versuche?... 1 1.2 Warum Statistik?... 1 1.3 Warum Versuchsplanung?... 4 1.4 Welche Art von Ergebnissen kann man erwarten?... 6 1.5 Versuche oder systematische Beobachtung?...

Mehr

Inhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17

Inhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17 Inhalt Vorwort.................................................................. V Inhalt.................................................................... VII 1 Einführung..........................................................

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1 Fallbeispiel 5: Humankapital und Returns to Education Seite 1 Gliederung Einführung: Wirkungsanalysen in der Wirtschaftspolitik I. Theoretischer Teil 1 Humankapital 2 Returns to Education: Schooling Model

Mehr

Parametrische Statistik

Parametrische Statistik Statistik und ihre Anwendungen Parametrische Statistik Verteilungen, maximum likelihood und GLM in R Bearbeitet von Carsten F. Dormann 1. Auflage 2013. Taschenbuch. xxii, 350 S. Paperback ISBN 978 3 642

Mehr

Statistik für die Sozialwissenschaften

Statistik für die Sozialwissenschaften Leseprobe aus: Steffen-M. Kühnel, Dagmar Krebs Statistik für die Sozialwissenschaften Mehr Informationen zum Buch finden Sie auf rowohlt.de. Copyright 2012 by Rowohlt Verlag GmbH, Reinbek bei Hamburg 1

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent?

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Anwendungen PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Ulrike Braisch, Rainer Muche Institut für Epidemiologie und Medizinische Biometrie Universität Ulm Schwabstraße

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich die Frage, ob es systematische Zusammenhänge

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr