Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Größe: px
Ab Seite anzeigen:

Download "Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II"

Transkript

1 Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II

2 Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II Logistische Regression (1/27)

3 Zum Nachlesen/Vorbereiten Literatur Annahmen und Annahmeverletzungen Agresti ch. 15: Statistik II Logistische Regression (2/27)

4 Schätzverfahren und ihre Eigenschaften Annahmeverletzungen Was sind die Standard-Annahmen? Zufallsstichprobe Wahres Modell: y i = β 0 + β 1 x 1i + β 2 x 2i + ɛ i 1. Die abhängige Variable ist intervallskaliert und unbeschränkt. (Variablen werden ohne Fehler gemessen) 2. Alle unabhängigen Variablen haben Varianz 3. Keine perfekte Multikollineariät 4. Für jede mögliche Kombination der unabhängigen Variablen ist der (konditionale) Mittelwert von ɛ = 0 Statistik II Annahmen (16/26)

5 Schätzverfahren und ihre Eigenschaften Annahmeverletzungen Was sind die Standard-Annahmen? Zufallsstichprobe Wahres Modell: y i = β 0 + β 1 x 1i + β 2 x 2i + ɛ i 5. Keine Kovarianz zwischen x ki und ɛ 6. Für jedes beliebige Paar von Beobachtungen i und h sind ɛ i und ɛ h unkorreliert (keine Autokorrelation) 7. Für jede mögliche Kombination der unabhängigen Variablen ist die (konditionale) Varianz von ɛ gleich σ 2 und damit konstant (Homoskedastizität) 8. Für jede mögliche Kombination der unabhängigen Variablen ist ɛ normalverteilt Statistik II Annahmen (16/26)

6 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Statistik II Logistische Regression (3/27)

7 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Statistik II Logistische Regression (3/27)

8 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Annahmen in Politikwissenschaft häufig verletzt Z. B. Abhängigkeiten zwischen Beobachtungen (Zeitreihen, Panel... ) Kategoriale abhängige Variablen Statistik II Logistische Regression (3/27)

9 Annahmen und Annahmeverletzungen Literatur Annahmen und Annahmeverletzungen Ergebnisse auf Grundlage einer Stichprobe nur Schätzungen Schätzverfahren setzten Annahmen voraus Wenn Annahmen nicht zutreffen Verzerrte Parameterschätzungen Ineffiziente (und/oder inkonsistente) Parameterschätzungen Zu optimistische Standardfehler Annahmen in Politikwissenschaft häufig verletzt Z. B. Abhängigkeiten zwischen Beobachtungen (Zeitreihen, Panel... ) Kategoriale abhängige Variablen Erweiterungen/Ergänzungen des linearen Modells Statistik II Logistische Regression (3/27)

10 Schätzverfahren und ihre Eigenschaften Annahmeverletzungen Was passiert, wenn Annahme 1 nicht erfüllt ist? Die abhängige Variable ist intervallskaliert und unbeschränkt. Variablen werden ohne Fehler gemessen Abhängige Variable hat häufig wenig diskrete Ausprägungen (Ratingskalen) Erwartete Werte außerhalb des gültigen Wertebereichs Modelle für ordinale Daten In der Literatur wenig diskutiert, häufig wird angenommen, daß Modell relativ robust ist Alle sozialwissenschaftlichen Variablen fehlerbehaftet Relativ unproblematisch, wenn Fehler voneinander unabhängig und Stichprobe groß Fehler bei y wird von ɛ absorbiert, OLS weniger effizient Fehler bei x schwächt im bivariaten Fall Zusammenhang ab, multivariat auf jeden Fall bias Statistik II Annahmen (17/26)

11 Was ist eine Funktion? Funktionen Exponenten, Wurzeln usw. Abbildungsvorschrift Berechnungsvorschrift Ordnet jedem Wert der x-variable(n) genau einen Wert zu Einstellige Funktionen Mehrstellige Funktionen Allgemeine Formulierung: f (x 1, x 2, ) Lineare Funktion besteht nur aus Konstanten und Produkten von x 1, x 2, Nicht-lineare Funktion: andere Elemente Bisher y als lineare Funktion von x 1, Alle Funktionen graphisch darstellbar (ggf. mehrdimensional) Steigung der Funktion in einem Punkt: (1.) Ableitung Statistik II Logistische Regression (4/27)

12 Funktionen Exponenten, Wurzeln usw. Nicht-lineare Funktionen: z. B. Polynome y = f (x) = 4 x + x x Statistik II Logistische Regression (5/27)

13 Exponenten Wiederholung Funktionen Exponenten, Wurzeln usw. Basis und Exponent Ganzzahlige positive Exponenten: x 3 = x x x Exponent 1 oder 0: x 1 = x; x 0 = 1 Negative Exponenten: x 1 = 1 x ; x 3 = 1 x 3 Rationale Exponenten Quadratwurzel aus x: Mit sich selbst multiplizieren, um x zu erhalten n-te Wurzel aus x: n-mal mit sich selbst multiplizieren, um x zu erhalten n Nenner = n-te Wurzel: x = x 1 n 5 Kompletter Bruch: x 4 = x 4 5 x 4 5 = 1 x 4 5 = 1 5 x 4 Statistik II Logistische Regression (6/27)

14 Funktionen Exponenten, Wurzeln usw. Was ist der natürliche Logarithmus? Logarithmus Umkehrfunktion zur Exponentialfunktion Natürlicher Logarithmus (Funktionsname ln() oder log e ) basiert auf Eulerscher Zahl e = e wichtige Konstante in vielen statistischen Verteilungen und Herleitungen (z. B. Normalverteilung) e 3 = exp(3) ln( ) 3 Natürlicher Logarithmus von x gibt Antwort auf die Frage: Wie oft muß ich e mit sich selbst multiplizieren, um x zu erhalten? Statistik II Logistische Regression (7/27)

15 Potenzen zur Basis e: y = exp(x) Funktionen Exponenten, Wurzeln usw. 150 y = f (x) = exp(x) y > x Statistik II Logistische Regression (8/27)

16 Funktionen Exponenten, Wurzeln usw. Natürlicher Logarithmus = Umkehrfunktion: y = ln(x) 1 y = f (x) = ln(x) ln(x) für x 0 nicht definiert x Statistik II Logistische Regression (9/27)

17 Das Problem Das binäre Logit-Modell Binäre Variablen in der Politikwissenschaft Wahlabsicht in den USA: Republikanisch (0) vs. Demokratisch (1) Land in bestimmtem Jahr in Bürgerkrieg verwickelt: ja (1) vs. nein (0) Parteibindung vorhanden: ja (1) vs. nein (0) Politisches System eine Demokratie: ja (1) vs. nein (0) Wertorientierungen: postmaterialistisch (1) vs. nichtpostmaterialistisch (0) Wahlabsicht zugunsten der CDU: ja (1) vs. nein (0) Statistik II Logistische Regression (10/27)

18 Das Problem Das binäre Logit-Modell Binäre Variablen in der Politikwissenschaft Wahlabsicht in den USA: Republikanisch (0) vs. Demokratisch (1) Land in bestimmtem Jahr in Bürgerkrieg verwickelt: ja (1) vs. nein (0) Parteibindung vorhanden: ja (1) vs. nein (0) Politisches System eine Demokratie: ja (1) vs. nein (0) Wertorientierungen: postmaterialistisch (1) vs. nichtpostmaterialistisch (0) Wahlabsicht zugunsten der CDU: ja (1) vs. nein (0) Viele relevante Variablen binär (oder dichotom) Wie modellieren? Statistik II Logistische Regression (10/27)

19 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Beispiel: Wahlverhalten für CDU durch Sympathie für Merkel zu erklären? Zweitstimme in Umfrage binäre Variable CDU-Wahl Für jeden Befragten 0 (nein) oder 1 (ja) Mittelwert der Dummy-Variablen entspricht relativer Häufigkeit bzw. Wahrscheinlichkeit der CDU-Wahl Warum? Statistik II Logistische Regression (11/27)

20 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Beispiel: Wahlverhalten für CDU durch Sympathie für Merkel zu erklären? Zweitstimme in Umfrage binäre Variable CDU-Wahl Für jeden Befragten 0 (nein) oder 1 (ja) Mittelwert der Dummy-Variablen entspricht relativer Häufigkeit bzw. Wahrscheinlichkeit der CDU-Wahl Warum? Mittelwert cduwahl = = Statistik II Logistische Regression (11/27)

21 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Gesamtwahrscheinlichkeit der CDU-Wahl ca Prozent Mittelwert der Dummy-Variablen in Sympathie-Gruppen = Anteil der CDU-Wähler in Sympathie-Gruppen = Konditionaler Mittelwert = Konditionale Wahrscheinlichkeit der CDU-Wahl in den Gruppen (n = 80) Statistik II Logistische Regression (11/27)

22 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Gesamtwahrscheinlichkeit der CDU-Wahl ca Prozent Mittelwert der Dummy-Variablen in Sympathie-Gruppen = Anteil der CDU-Wähler in Sympathie-Gruppen = Konditionaler Mittelwert = Konditionale Wahrscheinlichkeit der CDU-Wahl in den Gruppen (n = 80). tabstat cduwahl,by (polsympangelamerkel) Summary for variables: cduwahl by categories of: polsympangelamerkel (polsymp [Angela Merkel] ) polsympangelamerkel mean Total.125 Statistik II Logistische Regression (11/27)

23 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Verfahren zur Modellierung konditionaler Mittelwerte: lineare Regression cduwahl = β 0 + β 1 Sympathie Merkel Statistik II Logistische Regression (11/27)

24 Das Problem Das binäre Logit-Modell Strategie I: Lineares Wahrscheinlichkeitsmodell Verfahren zur Modellierung konditionaler Mittelwerte: lineare Regression cduwahl = β 0 + β 1 Sympathie Merkel. reg cduwahl polsympangelamerkel Source SS df MS Number of obs = 80 F( 1, 78) = 6.07 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = cduwahl Coef. Std. Err. t P> t [95% Conf. Interval] polsympang ~ l _cons Statistik II Logistische Regression (11/27)

25 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Statistik II Logistische Regression (12/27)

26 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Wahrscheinlichkeit CDU-Wahl CDU-Sympathie Statistik II Logistische Regression (12/27)

27 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Wahrscheinlichkeit CDU-Wahl CDU-Sympathie 1. Heteroskedastizität Standardfehler 2. Wahrscheinlichkeiten außerhalb Intervall (0;1) 3. (Linearer Verlauf nicht plausibel) Statistik II Logistische Regression (12/27)

28 Probleme? Wiederholung Das Problem Das binäre Logit-Modell Wahrscheinlichkeit CDU-Wahl CDU-Sympathie Statistik II Logistische Regression (12/27)

29 Wie kommt man zum Modell? Das Problem Das binäre Logit-Modell Problem: CDU-Wahl bzw. deren Wahrscheinlichkeit auf Wertebereich [0;1] beschränkt Transformation der Variablen 1. Schritt: Statt Wahrscheinlichkeiten odds betrachten (Entsprechen in etwa Wettquoten beim Sport) odds(p) = p p ; im Beispiel Wertebereich von 0 bis (fast) Variieren über Ausprägungen der unabhängigen z. B (6.6%) und 1.99 (66.6%) 2. Schritt: Von diesen odds wird der natürliche Logarithmus bestimmt (Logarithmierung) Statistik II Logistische Regression (13/27)

30 Das Problem Das binäre Logit-Modell Wie kommt man zum Modell? II Die logarithmierten Odds werden als Logits bezeichnet Wertebereich von (fast) bis (fast) + Im Beispiel Logits zwischen (6.6%) und (66.6%) Statistik II Logistische Regression (14/27)

31 Wie kommt man zum Modell? II Das Problem Das binäre Logit-Modell Die logarithmierten Odds werden als Logits bezeichnet Wertebereich von (fast) bis (fast) + Im Beispiel Logits zwischen (6.6%) und (66.6%) Nicht-lineares Verhältnis zur Wahrscheinlichkeit Wahrscheinlichkeit von 50% entspricht Logit von 0 Positiver Logit größere Wahrscheinlichkeit Negativer Logit kleinere Wahrscheinlichkeit Statistik II Logistische Regression (14/27)

32 Wie kommt man zum Modell? II Das Problem Das binäre Logit-Modell Die logarithmierten Odds werden als Logits bezeichnet Wertebereich von (fast) bis (fast) + Im Beispiel Logits zwischen (6.6%) und (66.6%) Nicht-lineares Verhältnis zur Wahrscheinlichkeit Wahrscheinlichkeit von 50% entspricht Logit von 0 Positiver Logit größere Wahrscheinlichkeit Negativer Logit kleinere Wahrscheinlichkeit Logit-Modell: linearer Zusammenhang zwischen x und Logit logit(cduwahl) = β 0 + β 1 merkelsympathie Schätzung der Koeffizienten/Standardfehler mit speziellem iterativen Verfahren (Maximum Likelihood) Statistik II Logistische Regression (14/27)

33 Das Problem Das binäre Logit-Modell In Stata. logit cduwahl polsympangelamerkel Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logistic regression Number of obs = 80 LR chi2(1) = 6.30 Prob > chi2 = Log likelihood = Pseudo R2 = cduwahl Coef. Std. Err. z P> z [95% Conf. Interval] polsympang ~ l _cons ? Statistik II Logistische Regression (15/27)

34 Das Problem Das binäre Logit-Modell In Stata. logit cduwahl polsympangelamerkel Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logistic regression Number of obs = 80 LR chi2(1) = 6.30 Prob > chi2 = Log likelihood = Pseudo R2 = cduwahl Coef. Std. Err. z P> z [95% Conf. Interval] polsympang ~ l _cons ? Richtung und Signifikanz Statistik II Logistische Regression (15/27)

35 Nicht-Linearität Zusammenhang zwischen x und y nicht-linear, aber monoton Mehr x, mehr y (positiver Zusammenhang) bzw. Mehr x, weniger y (negativer) Zusammenhang Aber nicht mit konstanter Rate S-förmiger Zusammenhang Statistik II Logistische Regression (16/27)

36 Nicht-Linearität Zusammenhang zwischen x und y nicht-linear, aber monoton Mehr x, mehr y (positiver Zusammenhang) bzw. Mehr x, weniger y (negativer) Zusammenhang Aber nicht mit konstanter Rate S-förmiger Zusammenhang Veränderung in Wahrscheinlichkeit nicht proportional zu Veränderung in x Großer Effekt, wenn Wahrscheinlichkeit im mittleren Bereich Kleiner Effekt, wenn Wahrscheinlichkeit sehr groß oder sehr gering Statistik II Logistische Regression (16/27)

37 Nicht-Linearität Zusammenhang zwischen x und y nicht-linear, aber monoton Mehr x, mehr y (positiver Zusammenhang) bzw. Mehr x, weniger y (negativer) Zusammenhang Aber nicht mit konstanter Rate S-förmiger Zusammenhang Veränderung in Wahrscheinlichkeit nicht proportional zu Veränderung in x Großer Effekt, wenn Wahrscheinlichkeit im mittleren Bereich Kleiner Effekt, wenn Wahrscheinlichkeit sehr groß oder sehr gering Statistik II Logistische Regression (16/27)

38 Was ist mit den zufälligen Fehlern? Im linearen Regressionsmodell zufällige Normalverteilung um konditionalen Mittelwert Separater Parameter (σ 2 ɛ) Für Logit-Modell Binomialverteilung um konditionale Wahrscheinlichkeit Varianz hängt ab von erwarteter Wahrscheinlichkeit (Heteroskedastizität) Ist durch Modell fixiert und wird nicht separat geschätzt Probit-Modelle sind sehr ähnlich, haben lediglich eine andere Link- bzw. Varianzfunktion Statistik II Logistische Regression (17/27)

39 Logit-Koeffizienten Modell nur in den Logits linear von Richtung (Vorzeichen) von Signifikanz Logits sind sehr unanschaulich Statistik II Logistische Regression (18/27)

40 Odds/Odd-Ratios logit(cduwahl) =β 0 + β 1 merkelsympathie e logit(cduwahl) = odds(cduwahl) =e (β 0+β 1 merkelsympathie) =e β 0 e β 1merkelsympathie Multiplikative Darstellung des Modells Für x = 0: odds = anti-logarithmierte Konstante e β 1 = exp(β 1 ) = Effektkoeffizient Veränderung von x um eine Einheit multipliziert die odds mit dem Effektkoeffizienten Statistik II Logistische Regression (19/27)

41 Odds/Odd-Ratios logit(cduwahl) =β 0 + β 1 merkelsympathie e logit(cduwahl) = odds(cduwahl) =e (β 0+β 1 merkelsympathie) =e β 0 e β 1merkelsympathie Multiplikative Darstellung des Modells Für x = 0: odds = anti-logarithmierte Konstante e β 1 = exp(β 1 ) = Effektkoeffizient Veränderung von x um eine Einheit multipliziert die odds mit dem Effektkoeffizienten Findet sich manchmal in (älterer) Literatur, nicht sehr anschaulich Statistik II Logistische Regression (19/27)

42 Wie kommt man von Logits zu Wahrscheinlichkeiten? Logit Wie nach p auflösen? ( ) p Logit = β 0 + β 1 x 1 = ln 1 p Statistik II Logistische Regression (20/27)

43 Wie kommt man von Logits zu Wahrscheinlichkeiten? Logarithmus loswerden exp(logit) = p 1 p Statistik II Logistische Regression (20/27)

44 Wie kommt man von Logits zu Wahrscheinlichkeiten? p auf eine Seite bringen, ausmultiplizieren exp(logit) (1 p) = p exp(logit) p exp(logit) = p Statistik II Logistische Regression (20/27)

45 Wie kommt man von Logits zu Wahrscheinlichkeiten? exp(logit) freistellen, rechte Seite zusammenfassen exp(logit) = p exp(logit) + p exp(logit) = (exp(logit) + 1) p Statistik II Logistische Regression (20/27)

46 Wie kommt man von Logits zu Wahrscheinlichkeiten? p wieder freistellen exp(logit) exp(logit) + 1 = p exp(β 0 + β 1 x 1 ) exp(β 0 + β 1 x 1 ) + 1 = p e (β 0+β 1 x 1 ) e (β 0+β 1 x 1 ) + 1 = p Statistik II Logistische Regression (20/27)

47 Wahrscheinlichkeiten p = eβ 0+β 1 x e β 0+β 1 x 1 Odds auch nicht wirklich anschaulich Klarste : erwartete Wahrscheinlichkeiten 1. Teil der Transformation auch umkehren Veränderung der Wahrscheinlichkeit nicht proportional zur Veränderung von x bzw. abhängig vom Niveau von x (und ggf. anderer x 2, ) S-förmiger Zusammenhang Statistik II Logistische Regression (21/27)

48 Erweiterung des Modells logit(y) = β 0 + β 1 x 1 + β 2 x 2 + Logistische Regression ebenfalls multivariat möglich Mehrere unabhängige Variablen wirken linear-additiv auf den Logit Wirkung einer Veränderung von x 1 um eine Einheit auf die Wahrscheinlichkeit von y = 1 hängt ab vom Niveau von x1 und vom Niveau von x2, Am besten graphisch darstellbar Statistik II Logistische Regression (22/27)

49 CDU-Wahl II CDU-Wahl als Funktion von Merkelsympathie Links-Rechts-Selbsteinstufung logit(cduwahl) = β 0 + β 1 merkelsympathie + β 2 LRS Statistik II Logistische Regression (23/27)

50 In Stata. logit cduwahl polsympangelamerkel lrsselbstselbst Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Iteration 5: log likelihood = Logistic regression Number of obs = 78 LR chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = cduwahl Coef. Std. Err. z P> z [95% Conf. Interval] polsympang ~ l lrsselbsts ~ t _cons Statistik II Logistische Regression (24/27)

51 Graphische Darstellung Wie wirkt Merkelsympathie für Linke (LRS=2) Zentristen (LRS=5) Rechte (LRS=8)? Statistik II Logistische Regression (25/27)

52 Graphische Darstellung Prob. CDU-Wahl Merkelsympathie LRS=2 LRS=8 LRS=5 Statistik II Logistische Regression (25/27)

53 Graphische Darstellung Wie wirkt Merkelsympathie für Linke (LRS=2) Zentristen (LRS=5) Rechte (LRS=8)? Wirkung von Sympathie... Fast linear für Rechte Schwach bei Zentristen Praktisch nicht vorhanden bei Linken Implizite Interaktion auf der Ebene der Wahrscheinlichkeiten Prob. CDU-Wahl Merkelsympathie LRS=2 LRS=5 LRS=8 Statistik II Logistische Regression (25/27)

54 Multivariate Nicht-Linearität 1 p(cdu) Symp. Merkel LRS 8 10 Statistik II Logistische Regression (26/27)

55 Multivariate Nicht-Linearität 1 p(cdu) Symp. Merkel 0 0 LRS Statistik II Logistische Regression (26/27)

56 Multivariate Nicht-Linearität 1 p(cdu) Symp. Merkel LRS 10 Statistik II Logistische Regression (26/27)

57 Viele politikwissenschaftlich interessante Variablen dichotom Lineares Modell problematisch Logit-Modell als gute Alternative erfordert Sorgfalt Statistik II Logistische Regression (27/27)

Zeitreihen. Statistik II

Zeitreihen. Statistik II Statistik II Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Zum Nachlesen

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Fallbeispiel: Kreditscoring

Fallbeispiel: Kreditscoring Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden:

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Grundzüge der Ereignisdatenanalyse

Grundzüge der Ereignisdatenanalyse Grundzüge der Ereignisdatenanalyse Regressionsmodelle Sommersemester 2009 Regressionsmodelle Event History Analysis (1/48) Übersicht Wiederholung Exponential- und Weibull-Modell Weitere Modelle Regressionsmodelle

Mehr

Binäre Auswahlmodelle (Logit, Probit,...)

Binäre Auswahlmodelle (Logit, Probit,...) Binäre Auswahlmodelle (Logit, Probit,...) 27. November 204 In diesem Kapitel führen wir eine Klasse von Modellen für binäre Auswahlprobleme ein, deren wichtigste Vertreter das Logit- und das Probit-Modell

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse

Übersicht. VL Forschungsmethoden. Ereignisdatenanalyse VL Forschungsmethoden Ereignisdatenanalyse 1 2 3 4 5 Übersicht VL Forschungsmethoden Event Data (1/45) Harold Macmillan, PM 1957-1963 The greatest challenge in politics: events, my dear boy, events Was

Mehr

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen

Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen Stefan Lang 12 Oktober 2005 WS 05/06 Datensatzbeschreibung (1) Daten Versicherungsdaten für Belgien ca 160000 Beobachtungen Ziel Analyse der Risikostruktur

Mehr

3. Einführung in die Zeitreihenanalyse

3. Einführung in die Zeitreihenanalyse 3. Einführung in die Zeitreihenanalyse Dr. Johann Burgstaller Finance Department, JKU Linz (Dieser Foliensatz wurde zuletzt aktualisiert am 25. Dezember 2007.) Dr. Johann Burgstaller IK Empirische Kapitalmarktforschung

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart. No. 3 / 2010

SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart. No. 3 / 2010 SISS: Schriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart No. 3 / 2010 Binär-logistische Regressionsanalyse. Grundlagen und Anwendung für Sozialwissenschaftler Jochen Mayerl

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Vorlesung:Multivariate Analyseverfahren

Vorlesung:Multivariate Analyseverfahren Vorlesung:Multivariate Analyseverfahren Josef Brüderl, Oktober 24 Multivariate Verfahren sind statistische Verfahren zur Analyse der Beziehungsstruktur mehrerer Variablen. Man kann multivariate Verfahren

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1

Fallbeispiel 5: Humankapital und Returns to Education. Seite 1 Fallbeispiel 5: Humankapital und Returns to Education Seite 1 Gliederung Einführung: Wirkungsanalysen in der Wirtschaftspolitik I. Theoretischer Teil 1 Humankapital 2 Returns to Education: Schooling Model

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression 6.0 Logistische Regression 6.1 Das binäre Modell 6.1 Das binäre Modell Sei x der Vektor der Einflussgrößen mit einem Eins-Element, um die Regressionskonstante zu modellieren. Angenommen, es gilt das Regressionsmodell:

Mehr

Notiz zur logistischen Regression

Notiz zur logistischen Regression Kapitel 1 Notiz zur logistischen Regression 1.1 Grundlagen Bei dichotomen abhängigen Variablen ergeben sich bei einer normalen linearen Regression Probleme. Während man die Ausprägungen einer dichotomen

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Kap. 9: Regression mit einer binären abhängigen Variablen

Kap. 9: Regression mit einer binären abhängigen Variablen Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick:

Mehr

Modelle mit diskreten abhängigen Variablen

Modelle mit diskreten abhängigen Variablen Kapitel 19 Modelle mit diskreten abhängigen Variablen 19.1 Vorbemerkungen Bisher sind wir stets davon ausgegangen, dass die abhängige Variable y intervallskaliert ist. Zusätzlich haben wir meist angenommen,

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung

Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Eine Einführung für Anwender - Marcel Erlinghagen - Gelsenkirchen, Oktober 2003 Gliederung

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Logistische Regression - - - - - 24. Juni 2011

Logistische Regression - - - - - 24. Juni 2011 Lehrveranstaltung Empirische Forschung und Politikberatung Sommersemester 2011 Logistische Regression - - - - - 24. Juni 2011 Anja Hall, Bundesinstitut für Berufsbildung, AB 2.2: Qualifikation, berufliche

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Statistik für die Sozialwissenschaften

Statistik für die Sozialwissenschaften Leseprobe aus: Steffen-M. Kühnel, Dagmar Krebs Statistik für die Sozialwissenschaften Mehr Informationen zum Buch finden Sie auf rowohlt.de. Copyright 2012 by Rowohlt Verlag GmbH, Reinbek bei Hamburg 1

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen.

5.2 Optionen Auswahl der Statistiken, die bei der jeweiligen Prozedur zur Verfügung stehen. 5 Statistik mit SPSS Die Durchführung statistischer Auswertungen erfolgt bei SPSS in 2 Schritten, der Auswahl der geeigneten Methode, bestehend aus Prozedur Variable Optionen und der Ausführung. 5.1 Variablen

Mehr

Klausur STATISTIK 2 für Diplom VWL

Klausur STATISTIK 2 für Diplom VWL Klausur STATISTIK 2 für Diplom VWL Name, Vorname: Matrikel-Nr. Die Klausur enthält zwei Typen von Aufgaben: Teil A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Partial Credit Model und Tutz Model

Partial Credit Model und Tutz Model November 22, 2011 Item Response Theory - Partial Credit Model Einleitung IRT-Einteilung Datenstruktur PCM - Herleitung Parameterschätzung Goodness of Fit Beispiel Sequential Models for Ordered Responses

Mehr

Semiparametrisches Kredit Scoring

Semiparametrisches Kredit Scoring Semiparametrisches Kredit Scoring Marlene Müller Fraunhofer Institut für Techno- und Wirtschaftsmathematik (ITWM) Kaiserslautern Bernd Rönz, Wolfgang Härdle Center for Applied Statistics and Economics

Mehr

Master of Science in Pflege

Master of Science in Pflege Master of Science in Pflege Modul: Statistik Einfache und multiple Regressionsanalyse / Logistische Regressionsanalyse November 2012 Prof. Dr. Jürg Schwarz Folie 2 Programm 28. November 2012: Vormittag

Mehr

ax 2 + bx + c = 0, (4.1)

ax 2 + bx + c = 0, (4.1) Kapitel 4 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt?

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt? Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Blatt 7 Dipl.-Math. oec. D. Engel Übungen zur Vorlesung Statistik 2 Aufgabe 25 (keine Abgabe) Angenommen die Zielvariable

Mehr

Neuerungen in Minitab 16

Neuerungen in Minitab 16 Neuerungen in Minitab 16 minitab@additive-net.de - Telefon: 06172 / 5905-30 Willkommen zu Minitab 16! Die neueste Version der Minitab Statistical Software umfasst mehr als siebzig neue Funktionen und Verbesserungen,

Mehr

Survival Analysis. Rene.Boeheim@jku.at. December 2008

Survival Analysis. Rene.Boeheim@jku.at. December 2008 Survival Analysis René Böheim Rene.Boeheim@jku.at December 2008 Basierend auf Cleves, Gould, and Gutierrez (2004), An Introduction to Survival Analysis using Stata, Revised Edition, Stata Press, Texas.

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)

PRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 Methoden der Modellbildung statischer Systeme Teil 2 (für ausgewählte Masterstudiengänge) FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.

Mehr

Modellierung des Stornos nach Beitragsanpassung in der PKV

Modellierung des Stornos nach Beitragsanpassung in der PKV ierung des Stornos nach Beitragsanpassung in der PKV 02.07.2013 Alexander Küpper Central Krankenversicherung AG Inhaltsverzeichnis Einführung Gesetzlicher Rahmen Stornomodell Anwendung Ausblick und Weiterentwicklung

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

Berichte aus der Volkswirtschaft. Dietmar Barth. Die Ökonomie von Sportwetten. Effizienzanalyse von Wettquoten

Berichte aus der Volkswirtschaft. Dietmar Barth. Die Ökonomie von Sportwetten. Effizienzanalyse von Wettquoten Berichte aus der Volkswirtschaft Dietmar Barth Die Ökonomie von Sportwetten Effizienzanalyse von Wettquoten D100 (Diss. Universität Hohenheim) Shaker Verlag Aachen 2012 Inhaltsverzeichnis Verzeichnis der

Mehr

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen** Effektschätzung in Cluster-Randomized Trials mit binärer Zielgröße: Eine Sensitivitätsanalyse mit numerischer Integration, MCMC und NPMLE am Beispiel der DHP Oliver Kuß*; Dorothee Twardella**; Maria Blettner***;

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Binäre Gleitkommazahlen

Binäre Gleitkommazahlen Binäre Gleitkommazahlen Was ist die wissenschaftliche, normalisierte Darstellung der binären Gleitkommazahl zur dezimalen Gleitkommazahl 0,625? Grundlagen der Rechnerarchitektur Logik und Arithmetik 72

Mehr

Logistische Regression

Logistische Regression TU Chemnitz SoSe 2012 Seminar: Multivariate Analysemethoden 26.06.2012 Dozent: Dr. Thomas Schäfer Logistische Regression Ein Verfahren zum Schätzen von Wahrscheinlichkeiten Referentinnen: B. Sc. Psych.

Mehr

4. Quantitative Analyse der Ligand-Bindungsstudien

4. Quantitative Analyse der Ligand-Bindungsstudien 4. Quantitative Analyse der Ligand-Bindungsstudien Im folgenden apitel sollen die grundlegenden analytischen Methoden zur Interpretation der experimentell gewonnenen Bindungsdaten vorgestellt werden. ie

Mehr

Binäre logistische Regressionsanalyse

Binäre logistische Regressionsanalyse Binäre logistische Regressionsanalyse Eine Einführung für Sozialwissenschaftler mit SPSS für Windows Sabine Fromm Bamberger Beiträge zur empirischen Sozialforschung Nr. 11, 2005 Herausgeber: Gerhard Schulze

Mehr

Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren

Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Marlene Müller Beuth Hochschule für Technik Berlin, Fachbereich II Luxemburger Str. 10, D 13353 Berlin

Mehr

Computer Vision: Optische Flüsse

Computer Vision: Optische Flüsse Computer Vision: Optische Flüsse D. Schlesinger TUD/INF/KI/IS Bewegungsanalyse Optischer Fluss Lokale Verfahren (Lukas-Kanade) Globale Verfahren (Horn-Schunck) (+ kontinuierliche Ansätze: mathematische

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

IBM SPSS Regression 22

IBM SPSS Regression 22 IBM SPSS Regression 22 Hinweis Vor Verwendung dieser Informationen und des darin beschriebenen Produkts sollten die Informationen unter Bemerkungen auf Seite 33 gelesen werden. Produktinformation Diese

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

Commercial Banking. Kreditportfoliosteuerung

Commercial Banking. Kreditportfoliosteuerung Commercial Banking Kreditportfoliosteuerung Dimensionen des Portfoliorisikos Risikomessung: Was ist Kreditrisiko? Marking to Market Veränderungen des Kreditportfolios: - Rating-Veränderung bzw. Spreadveränderung

Mehr

Klaus-Groth-Schule - Neumünster Fachcurriculum Mathematik

Klaus-Groth-Schule - Neumünster Fachcurriculum Mathematik Jahrgang 10 Funktionen Funktionsbegriff - Definition - vielfältige Anwendungen - Umkehrbarkeit (intuitiv, Anwendungen) ganzrationale Funktionen Modellierung - Ablesen der Werte - Ungefähre Bestimmung der

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Investition & Finanzierung. 2. Investitionsrechnung unter Sicherheit

Investition & Finanzierung. 2. Investitionsrechnung unter Sicherheit Investition & Finanzierung 2. Investitionsrechnung unter Univ.-Prof. Dr. Dr. Andreas Löffler (AL@wacc.de) 1 Unter Cashflows verstehen wir Ein- sowie Auszahlungen. Wir konzentrieren uns vollkommen auf diese

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Fragen und Antworten zu Kapitel 18

Fragen und Antworten zu Kapitel 18 Fragen und Antworten zu Kapitel 18 (1) Nennen Sie verschiedene Zielsetzungen, die man mit der Anwendung der multiplen Regressionsanalyse verfolgt. Die multiple Regressionsanalyse dient der Kontrolle von

Mehr