Kap. 9: Regression mit einer binären abhängigen Variablen

Größe: px
Ab Seite anzeigen:

Download "Kap. 9: Regression mit einer binären abhängigen Variablen"

Transkript

1 Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick: weitere Modelle der Mikroökonometrie

2 9.1 Motivation in allen bisherigen Beispielen war abhängige Variable stetig: Testergebnisse (Kalifornien, Massachusetts) Unfallraten pro Einwohner diskrete abhängige Variablen ebenfalls denkbar: Arbeitsmarktpartizipation (ja/nein) Kreditantrag wird bewilligt (ja/nein) In diesen Beispielen ist abhängige Variablen binär häufigster Fall in empirischer Wirtschaftsforschung neben linearer Regression. Wie sehen Regressionsmodelle für solche Daten aus? C. Kleiber: Ökonometrie 1 Kap. 9-1 U Basel, HS 2008

3 9.1 Motivation Empirisches Beispiel: Rassendiskriminierung am Hypothekenmarkt? Anträge für Hypotheken im Grossraum Boston Beobachtungen, gesammelt unter Home Mortgage Disclosure Act (HMDA) HMDA-Daten enthalten alle Anträge von Schwarzen, Hispanics, Stichprobe aus Weissen. Hier nur Daten zu Anträgen von Schwarzen und Weissen. Variablen: abhängige Variable: Wurde Antrag abgelehnt? (ja/nein) Regressoren: Einkommen, Vermögen, Beschäftigungsstatus, Familienstand, Schulabschluss, Hautfarbe (bzw. Transformationen) C. Kleiber: Ökonometrie 1 Kap. 9-2 U Basel, HS 2008

4 9.1 Motivation R> data("hmda", package = "AER") R> with(hmda, table(deny, afam)) afam deny no yes no yes Also ca. 28% der Anträge von Schwarzen abgelehnt, aber nur ca. 9% der von Weissen. Vorsicht: Hinzunahme von Kovariablen könnte Differenz verkleinern ( Verzerrung durch vergessene Variablen) C. Kleiber: Ökonometrie 1 Kap. 9-3 U Basel, HS 2008

5 9.2 Das lineare Wahrscheinlichkeitsmodell Naheliegende Idee: lineare Regression mit (für einen Regressor) Y i = β 0 + β 1 X i + u i Fragen: Bei linearer Regression gilt bekanntlich β 1 = E(Y i X i )/ X i. Wie interpretiert man β 1, wenn Y i binär? Was bedeutet die Regressionsgerade β 0 + β 1 X i, wenn Y i binär? Was bedeutet die Prognose Ŷi, wenn Y i binär? Was ist z.b. Ŷi = 0.59? Bei linearer Regression nehmen wir an (A1) E(u i X i ) = 0, und damit E(Y i X i ) = β 0 +β 1 X i was sind die Implikationen, wenn Y i binär? C. Kleiber: Ökonometrie 1 Kap. 9-4 U Basel, HS 2008

6 9.2 Das lineare Wahrscheinlichkeitsmodell Da Y {0, 1}: einziges denkbares Modell ist Bernoulli-Verteilung mit Dichte/Wahrscheinlichkeitsfunktion f(y; p) = p y (1 p) 1 y, y {0, 1}. Erwartungswert Varianz E(Y ) = p Var(Y ) = p(1 p) Bekannt: für Y i Bernoulli(p) u.i.v. ist deren Summe binomialverteilt n Y i Bin(n, p) i=1 Deshalb auch Notation: Y i Bin(1, p) C. Kleiber: Ökonometrie 1 Kap. 9-5 U Basel, HS 2008

7 9.2 Das lineare Wahrscheinlichkeitsmodell Für Y i Bin(1, p) heisst Y i = β 0 + β 1 X i + u i das lineare Wahrscheinlichkeitsmodell (linear probability model, LPM). Eigenschaften: E(Y i X i ) = β 0 + β 1 X i (W keit, dass Y i = 1 für gegebenes X i ) Ŷi prognostizierte W keit, dass Y i = 1 für gegebenes X i E(Y i X i ) X i = β 1 Änderung der W keit, dass Y i = 1 bei Änderung in X i um 1 C. Kleiber: Ökonometrie 1 Kap. 9-6 U Basel, HS 2008

8 9.2 Das lineare Wahrscheinlichkeitsmodell Lineares Wahrscheinlichkeitsmodell für Stichprobe mit n = 100: pirat C. Kleiber: Ökonometrie 1 Kap. 9-7 U Basel, HS 2008

9 9.2 Das lineare Wahrscheinlichkeitsmodell R> fm_lpm <- lm(i(as.numeric(deny) - 1) ~ pirat, data = HMDA) R> coeftest(fm_lpm) t test of coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) pirat < 2e-16 Beispiel zu Prognosen von Ablehnungsw keit für X = 0.3: P (Y i = 1 X = 0.3) = = Effekt einer Änderung der unabhängigen Variablen pirat von 0.3 auf 0.4: P (Y i = 1 X = 0.4) = = Also steigt W keit für Ablehnung von auf (um ca. 6 Prozentpunkte). C. Kleiber: Ökonometrie 1 Kap. 9-8 U Basel, HS 2008

10 9.2 Das lineare Wahrscheinlichkeitsmodell Zusammenfassung: Lineares Wahrscheinlichkeitsmodell modelliert W keit als lineare Funktion von X Vorteile: Y i = β 0 + β 1 X i + u i Schätzung, Interpretation und Inferenz wie im multiplen linearen Regressionsmodell ( nichts Neues) Nachteile: Warum sollte W keit linear in X sein? prognostizierte W keiten ˆβ 0 + ˆβ 1 X i könnten < 0 oder > 1 werden! Lösung: verwende nichtlineares Wahrscheinlichkeitsmodell Probit- oder Logit-Regression C. Kleiber: Ökonometrie 1 Kap. 9-9 U Basel, HS 2008

11 9.3 Probit- und Logit-Modelle Problem des linearen W keitsmodells: Ansatz Wir brauchen aber: 0 P (Y = 1 X) 1 für alle X i P (Y i = 1 X) = β 0 + β 1 X i P (Y = 1 X) sollte wachsen in X i, falls β 1 > 0 Also brauchen wir nichtlineare funktionale Form für die W keit, z.b. eine S-förmige Kurve. Probit-Modell: P (Y i = 1 X) = Φ(β 0 + β 1 X i ) mit Φ VF der Standardnormalverteilung Beispiel: für β 0 = 2, β 1 = 3 und X = 0.4 ist P (Y i = 1 X = 0.4) = Φ( ) = Φ( 0.8) Damit P (Y i = 1 X = 0.4) Fläche unter der Kurve links von z = 0.8. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

12 9.3 Probit- und Logit-Modelle dnorm(x) x C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

13 9.3 Probit- und Logit-Modelle Was spricht für Probit-Modell? (diese) S-förmige Kurve liefert 0 P (Y = 1 X) 1 für alle X i P (Y = 1 X) wachsend in X i falls β 1 > 0 relativ einfach zu benutzen (Tabellen für Normalverteilung!) einfache Interpretation: β 0 + β 1 X i =: z-wert (ein Index ) ˆβ 0 + ˆβ 1 X i ist prognostizierter z-wert, gegeben X i β 1 ist Änderung im z-wert bei Änderung von X i um eine Einheit C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

14 9.3 Probit- und Logit-Modelle Probit-Modell für Stichprobe mit n = 100: pirat C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

15 9.3 Probit- und Logit-Modelle Umsetzung in R: (Details später) R> fm_probit1 <- glm(deny ~ pirat, family = binomial(link = "probit"), + data = HMDA) R> coeftest(fm_probit1) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 pirat e-14 Also geschätzte Regressionsbeziehung: P (Y = 1 pirat) = Φ( pirat) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

16 9.3 Probit- und Logit-Modelle Koeffizient positiv (plausibel?) Standardfehler haben übliche Bedeutung Prognosen von W keiten: P (Y i = 1 X = 0.3) = Φ( ) = Φ( 1.304) = Effekt einer Änderung der unabhängigen Variable pirat von 0.3 auf 0.4: P (Y i = 1 X = 0.4) = Φ( ) = Φ( 1.007) = Also steigt W keit für Ablehnung von auf 0.157, um ca. 6 Prozentpunkte. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

17 9.3 Probit- und Logit-Modelle Dies geht alles auch für multiple Regressoren: R> fm_probit2 <- glm(deny ~ pirat + afam, + family = binomial(link = "probit"), data = HMDA) R> coeftest(fm_probit2) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 pirat e-13 afamyes < 2e-16 Also geschätzte Regressionsbeziehung: P (Y = 1 pirat, afam) = Φ( pirat afam) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

18 9.3 Probit- und Logit-Modelle Wie ist der Einfluss des Regressors Hautfarbe? ist Koeffizient statistisch signifikant? geschätzter Effekt der Hautfarbe bei pirat von 0.3: P (Y i = 1 pirat = 0.3, afam = yes ) = Φ( 0.728) = bzw. P (Y i = 1 pirat = 0.3, afam = no ) = Φ( 1.436) = Differenz ist (also 15.8 Prozentpunkte!) aber Verzerrung durch vergessene Variablen...? (später mehr) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

19 9.3 Probit- und Logit-Modelle Logit-Regression: (auch: logistische Regression) Warum Normalverteilung (Probit)? Gesucht war nur S-förmige Kurve. Alternativen zu Probit sind gegeben durch andere VFen F an Stelle von Φ: P (Y = 1 X) = F (β 0 + β 1 X) Populär: VF der logistischen Verteilung mit F (β 0 + β 1 X) = exp{ (β 0 + β 1 X)} Logit führt auf einfachere Formeln (wg. expliziter Form von F ) Ergebnisse meist ähnlich zu Probit Vorsicht: die Werte der Koeffizienten in Probit- und Logit-Modellen lassen sich nicht gut vergleichen (Grund: Standardnormal- und logistische Verteilung haben unterschiedliche Varianzen), vergleiche besser Prognosen C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

20 9.3 Probit- und Logit-Modelle Vergleich Logit und Probit: Normalverteilung vs. logistische Verteilung Dichten VFen pnorm plogis plogis, skaliert x x Beide Verteilungen sind symmetrisch, die logistische Verteilung hat aber schwerere Ränder. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

21 9.3 Probit- und Logit-Modelle Logit- und Probit-Modell für Stichprobe mit n = 100: Probit Logit pirat C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

22 9.3 Probit- und Logit-Modelle Umsetzung in R: (Logit ist Voreinstellung der Funktion, deshalb kein Argument link!) R> fm_logit2 <- glm(deny ~ pirat + afam, family = binomial, data = HMDA) R> coeftest(fm_logit2) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 pirat e-13 afamyes < 2e-16 führt auf Prognose P (Y i = 1 pirat = 0.4, afam = yes ) = F ( 1.242) = Zum Vergleich: bei Probit ergab sich P (Y i = 1 pirat = 0.4, afam = yes ) = Φ( 0.728) = C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

23 9.4 Maximum Likelihood Probit: P (Y = 1 X) = Φ(β 0 + β 1 X) wie schätzt man hier die Regressionskoeffizienten? Naheliegend wäre nichtlineare KQ-Methode n i=1 [y i Φ( ˆβ 0 ˆβ 1 x i )] 2 min ˆβ 0, ˆβ 1! Es gibt keine explizite Lösung (geschlossene Formel), aber man kann solche Optimierungsprobleme mit numerischen Methoden lösen. Praxis: den üblichen Schätzer erhält man über eine andere Methode, die Maximum- Likelihood-Methode (ML). Idee: Schätzung besteht aus denjenigen Parameterwerten, die mit grösster Wahrscheinlichkeit die beobachtete Stichprobe liefern. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

24 9.4 Maximum Likelihood Formaler Rahmen: (ignoriere zunächst die X i ) gemeinsame Verteilung von Y 1,..., Y n gegeben durch Dichte f(y 1,..., y n ), diese hängt von Parametern β ab für die Realisationen y 1,..., y n ist Likelihood-Funktion definiert durch L(β) = f(y 1,..., y n ; β), also die gemeinsame Dichte aufgefasst als Funktion der Parameter. die Statistik ˆβ = arg max L(β) β heisst Maximum-Likelihood-Schätzer (MLE) für β der Schätzer, der mit grösster Wahrscheinlichkeit die beobachtete Stichprobe liefert. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

25 9.4 Maximum Likelihood Beispiel: (Probit-MLE ohne Regressoren) Sei Y i Bin(1, p), d.h. P (Y i = 1) = p und P (Y i = 0) = 1 p. Also Dichte/Wahrscheinlichkeitsfunktion f(y i ; p) = P (Y i = y i ) = p y i (1 p) 1 y i, y i {0, 1}. Daten seien Y 1,..., Y n u.i.v. Dann ist gemeinsame Verteilung f(y 1,..., y n ; p) = n p y i (1 p) 1 y i = p P n i=1 y i (1 p) P n i=1 (1 y i ) i=1 = p P n i=1 y i (1 p) n P n i=1 y i Aufgefasst als Funktion von p ist dies auch die Likelihood: L(p) := f(y 1,..., y n ; p) = p P n i=1 y i (1 p) n P n i=1 y i C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

26 9.4 Maximum Likelihood Maximiere dies nun bzgl. p. Einfacher und üblich: maximiere Log-Likelihood l(p) = log L(p) = log (p P ) n i=1 y i (1 p) n P n i=1 y i ( n ) ( ) n = y i log(p) + n y i log(1 p) i=1 i=1 Nullsetzen der 1. Ableitung: l (p) = ( n i=1 y i ) 1 p + ( n n i=1 ) ( y i 1 ) 1 p = 0 Lösung ist ˆp = ȳ der Anteil der Einsen in Stichprobe. Also liefert die ML-Methode hier einen bekannten Schätzer. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

27 9.4 Maximum Likelihood Beispiel: (Probit-MLE mit einem echten Regressor) Sei nun P (Y i = 1 X i ) = Φ(β 0 + β 1 X i ) und P (Y i = 0 X i ) = 1 Φ(β 0 + β 1 X i ). Also Dichte/Wahrscheinlichkeitsfunktion für n = 1 P (Y i = y i X i ) = Φ(β 0 + β 1 X i ) y i [1 Φ(β 0 + β 1 X i )] 1 y i, y i {0, 1}. Probit-Likelihood streng genommen eine bedingte Likelihood ist nun gemeinsame Dichte von Y 1,..., Y n gegeben X 1,..., X n als Funktion von β 0 und β 1 L(β 0, β 1 ) = n Φ(β 0 + β 1 X i ) y i [1 Φ(β 0 + β 1 X i )] 1 y i i=1 = Φ(β 0 + β 1 X i ) P n i=1 y i [1 Φ(β 0 + β 1 X i )] n P n i=1 y i Maximiere dies nun bzgl. β 0, β 1. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

28 9.4 Maximum Likelihood für Y i u.i.v. Bernoulli ist MLE der natürliche Schätzer von p, der Anteil der Einsen in grossen Stichproben (n ) gilt für ML-Schätzer (MLE) unter technischen Annahmen konsistent effizient (hat kleinste Varianz) approximativ normalverteilt Tests über t-statistik, 95%-Konfidenzintervall über ȳ ± 1.96 SE(ȳ) Bemerkung zu R: im Regressionsoutput z statt t dies betont, dass grosse Stichproben erforderlich sind bzw. die Verteilung, aus der die p-werte berechnet werden, nur in grossen Stichproben eine gute Approximation liefert es gibt keine explizite Lösung (geschlossene Formel) dieses Optimierungsproblems, sobald ein echter Regressor im Modell ist. Zielfunktion kann aber mittels numerischer Methoden maximiert werden völlig analog für mehrere Regressoren völlig analog für Logit-Regression C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

29 9.5 Analyse der HMDA-Daten Bisherige Modelle leiden vermutlich unter Verzerrung durch vergessene Variablen Nun: ausgewählte Ergebnisse aus Munnell, A. H., Tootell, G. M. B., Browne, L. E. and McEneaney, J. (1996). Mortgage Lending in Boston: Interpreting HMDA Data. American Economic Review, 86, Hauptbeitrag dieser Arbeit: Verbesserung einer früheren Arbeit durch Bereitstellung neuer Kovariablen (!) Entscheidung über Hypothek erfolgt durch Bankangestellte aufgrund von persönlichem Gespräch. Angestellte kennen Situation der Antragsteller. Welche persönlichen Umstände der Antragsteller könnten für die Entscheidung relevant sein? C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

30 9.5 Analyse der HMDA-Daten Datensatz HMDA: Daten für 2380 Anträge für Kovariablen sind pirat hirat lvrat chist mhist phist insurance selfemp afam payment to income ratio housing expense to income ratio loan to value ratio consumer credit history mortgage history public bad credit history? mortgage insurance (denied? yes/no) self-employed? Hautfarbe (Faktor, Indikator für African-American ). C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

31 9.5 Analyse der HMDA-Daten Umsetzung in R: Logit/Probit sind in statistischer Terminologie generalisierte lineare Modelle (GLMs). GLMs verallgemeinern Ideen des multiplen linearen Regressionsmodells auf Situationen mit nicht-metrischen Y i, indem von anderen Verteilungen als der Normalverteilung ausgegangen wird es gibt eine Funktion glm(), die i.w. wie lm() funktioniert glm() hat zwei neue Argumente: family für Verteilung (bei Bernoulli-Variablen: binomial), und link für (bei Bernoulli-Variablen) funktionale Form der S-Kurve (Probit, Logit) Ergebnis von glm() kann wieder mit den üblichen Funktionen ausgewertet werden: summary(), predict(), etc. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

32 9.5 Analyse der HMDA-Daten Beispiel: Regression aus SW, Tab. 11.2, Spalte (3) R> mlvrat <- with(hmda, lvrat >= 0.8 & lvrat < 0.95) R> hlvrat <- with(hmda, lvrat >= 0.95) R> fm_probit3 <- glm(deny ~ afam + pirat + hirat + mlvrat + hlvrat + + I(as.numeric(chist)) + I(as.numeric(mhist)) + phist + insurance + + selfemp, family = binomial(link = "probit"), data = HMDA) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

33 9.5 Analyse der HMDA-Daten R> coeftest(fm_probit3) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 afamyes e-05 pirat e-06 hirat mlvrattrue hlvrattrue e-06 I(as.numeric(chist)) e-13 I(as.numeric(mhist)) phistyes e-09 insuranceyes < 2e-16 selfempyes C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

34 9.5 Analyse der HMDA-Daten Anpassungsgüte des Modells: übliches R 2 hier nicht sinnvoll (warum?) Auswertung der Prognosen innerhalb der Stichprobe: R> table(hmda$deny, round(predict(fm_probit3, type = "response"))) 0 1 no yes Unser Modell erkennt die Abgelehnten also schlecht! C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

35 9.5 Analyse der HMDA-Daten Ausgangsproblem: gibt es noch Unterschiede bzgl Hautfarbe? R> new1 <- with(hmda, data.frame(pirat = mean(pirat), hirat = mean(hirat), + mlvrat = FALSE, hlvrat = FALSE, chist = factor("2"), + mhist = factor("2"), phist = factor("no"), insurance = factor("no"), + selfemp = factor("no"), afam = factor("yes"))) R> new2 <- new1 R> new2$afam <- factor("no") R> predict(fm_probit3, newdata = new1, type = "response") R> predict(fm_probit3, newdata = new2, type = "response") C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

36 9.5 Analyse der HMDA-Daten Anmerkungen: Koeffizienten inhaltlich plausibel Faktor African-American bleibt in diversen Spezifikationen signifikant, Hinzunahme von Kovariablen reduziert aber den geschätzten Effekt Probit und Logit liefern ähnliche Ergebnisse Potentielle Probleme: interne Validität Verzerrung durch vergessene Variablen (unklar: was erfährt Bankangestellte sonst beim Gespräch?) funktionale Form (unklar) Messfehler (frühere Studie ja, nun nein) Selektion (nein) Simultanität (nein) externe Validität: dies gilt zunächst nur für Boston C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

37 9.6 Ausblick: Weitere Modelle der Mikroökonometrie Logit/Probit sind nur zwei Beispiele von Modellen, die mit der Maximum-Likelihood-Methode geschätzt werden. Es gibt viele weitere in der Mikroökonometrie: multinomiale abhängige Variablen (Bsp.: Wahl des Transportmittels zur Arbeit) Zähldaten (Bsp.: Anzahl Arztbesuche) zensierte Daten (Bsp.: Ausgaben für langlebige Gebrauchsgüter) Mehr dazu: Vorlesung Mikroökonometrie auf der Master-Stufe! C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression 6.0 Logistische Regression 6.1 Das binäre Modell 6.1 Das binäre Modell Sei x der Vektor der Einflussgrößen mit einem Eins-Element, um die Regressionskonstante zu modellieren. Angenommen, es gilt das Regressionsmodell:

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Generalisierte lineare Modelle. Statistik 3 im Nebenfach. Binäre Regressionsmodelle. 4.1 Binäre Regression

Generalisierte lineare Modelle. Statistik 3 im Nebenfach. Binäre Regressionsmodelle. 4.1 Binäre Regression Generalisierte lineare Modelle Statistik 3 im Nebenfach Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München WS 2010/2011 basierend auf Fahrmeir, Kneib & Lang (2007) 4 Generalisierte

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Binäre Auswahlmodelle (Logit, Probit,...)

Binäre Auswahlmodelle (Logit, Probit,...) Binäre Auswahlmodelle (Logit, Probit,...) 27. November 204 In diesem Kapitel führen wir eine Klasse von Modellen für binäre Auswahlprobleme ein, deren wichtigste Vertreter das Logit- und das Probit-Modell

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen** Effektschätzung in Cluster-Randomized Trials mit binärer Zielgröße: Eine Sensitivitätsanalyse mit numerischer Integration, MCMC und NPMLE am Beispiel der DHP Oliver Kuß*; Dorothee Twardella**; Maria Blettner***;

Mehr

Klausur STATISTIK 2 für Diplom VWL

Klausur STATISTIK 2 für Diplom VWL Klausur STATISTIK 2 für Diplom VWL Name, Vorname: Matrikel-Nr. Die Klausur enthält zwei Typen von Aufgaben: Teil A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens

Mehr

Unsupervised Kernel Regression

Unsupervised Kernel Regression 9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren

Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Marlene Müller Beuth Hochschule für Technik Berlin, Fachbereich II Luxemburger Str. 10, D 13353 Berlin

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Semiparametrisches Kredit Scoring

Semiparametrisches Kredit Scoring Semiparametrisches Kredit Scoring Marlene Müller Fraunhofer Institut für Techno- und Wirtschaftsmathematik (ITWM) Kaiserslautern Bernd Rönz, Wolfgang Härdle Center for Applied Statistics and Economics

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt?

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt? Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Blatt 7 Dipl.-Math. oec. D. Engel Übungen zur Vorlesung Statistik 2 Aufgabe 25 (keine Abgabe) Angenommen die Zielvariable

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Lasso in LMs und GLMs

Lasso in LMs und GLMs Lasso in LMs und GLMs Seminar Regularisierungstechniken und strukturierte Regression, Prof. Dr. Gerhard Tutz, Institut für Statistik, Ludwig-Maximilians-Universität München Referent: Patrick Schenk Betreuer:

Mehr

Zeitreihenanalyse. Teil III: Nichtlineare Zeitreihenmodelle. Prof. Dr. W. Zucchini, Dr. O. Nenadić, A. Schlegel. Göttingen, Januar 2008 DAX

Zeitreihenanalyse. Teil III: Nichtlineare Zeitreihenmodelle. Prof. Dr. W. Zucchini, Dr. O. Nenadić, A. Schlegel. Göttingen, Januar 2008 DAX Zeitreihenanalyse Teil III: Nichtlineare Zeitreihenmodelle Prof. Dr. W. Zucchini, Dr. O. Nenadić, A. Schlegel DAX -10-5 0 5 10 0 200 400 600 800 1000 trading day Göttingen, Januar 2008 Inhaltsverzeichnis

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

Untersuchungen zum Thema Tracking Error

Untersuchungen zum Thema Tracking Error Untersuchungen zum Thema Tracking Error J. Fulmek 24. August 2003 1 Einleitung Im Folgenden werden folgende Punkte untersucht: 1. verschiedene in der Literatur übliche Definitionen des Tracking Errors

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Commercial Banking Übung 1 Kreditscoring

Commercial Banking Übung 1 Kreditscoring Commercial Banking Übung Kreditscoring Dr. Peter Raupach raupach@wiwi.uni-frankfurt.de Sprechzeit Dienstag 6-7:00 Uhr Raum 603 B Kreditscoring Gliederung Grundanliegen Das Sample Modellspezifikation Diskriminanzanalyse

Mehr

Stochastische Prozesse und Zeitreihenmodelle

Stochastische Prozesse und Zeitreihenmodelle Kapitel 12 Stochastische Prozesse und reihenmodelle [ Stochastische Prozesse und reihenmodelle ] Einleitung:.com-Blase an der NASDAQ Department of Statistics and Mathematics WU Wien c 2008 Statistik 12

Mehr

Statistische Methoden: Tests, Regression und multivariate Verfahren

Statistische Methoden: Tests, Regression und multivariate Verfahren (CM)²-Nachwuchsring, Workshop Statistik, 25.Januar 2013 Statistische Methoden: Tests, Regression und multivariate Verfahren Ralf Korn ((CM)², TU Kaiserslautern, Fraunhofer ITWM) 0. Einige Probleme aus

Mehr

Regressionsmodelle für kategoriale Daten und Zähldaten

Regressionsmodelle für kategoriale Daten und Zähldaten Kapitel 8 Regressionsmodelle für kategoriale Daten und Zähldaten Das Modell der linearen Regression und Varianzanalyse (vgl. Abschn. 6.3, 7.3, 12.9.1) lässt sich zum verallgemeinerten linearen Modell (GLM,

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

Modelle mit diskreten abhängigen Variablen

Modelle mit diskreten abhängigen Variablen Kapitel 19 Modelle mit diskreten abhängigen Variablen 19.1 Vorbemerkungen Bisher sind wir stets davon ausgegangen, dass die abhängige Variable y intervallskaliert ist. Zusätzlich haben wir meist angenommen,

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko

Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko Jan Jescow Stoehr Gliederung 1. Einführung / Grundlagen 1.1 Ziel 1.2 CreditRisk+ und CreditMetrics 2. Kreditportfolio 2.1 Konstruktion

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Modellierung des Stornos nach Beitragsanpassung in der PKV

Modellierung des Stornos nach Beitragsanpassung in der PKV ierung des Stornos nach Beitragsanpassung in der PKV 02.07.2013 Alexander Küpper Central Krankenversicherung AG Inhaltsverzeichnis Einführung Gesetzlicher Rahmen Stornomodell Anwendung Ausblick und Weiterentwicklung

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Geoadditive Regression

Geoadditive Regression Seminar: Stochastische Geometrie und ihre Anwendungen - Zufallsfelder Universität Ulm 27.01.2009 Inhalt Einleitung 1 Einleitung 2 3 Penalisierung 4 Idee Variogramm und Kovarianz Gewöhnliches Ansatz für

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Preferred citation style for this presentation

Preferred citation style for this presentation Preferred citation style for this presentation Simma, A. (2002) Ziel- und Verkehrsmittelwahl für Wege zum Skifahren in der Schweiz, 3. AMUS-Konferenz, Aachen, Juli 2002. 1 Ziel - und Verkehrsmittelwahl

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Nichtlebenversicherungsmathematik Aus welchen Teilen besteht eine Prämie Zufallsrisiko, Parameterrisiko, Risikokapital Risikomasse (VaR, ES) Definition von Kohärenz Zusammengesetze Poisson: S(i) CP, was

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Klausur Wirtschaftsmathematik Lösungshinweise

Klausur Wirtschaftsmathematik Lösungshinweise Klausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 27. Juni 2015 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 1 16 Punkte Anton Arglos hat von seiner Großmutter 30 000 geschenkt

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

KAPITEL 4. Lineare Ausgleichsrechnung Beispiel 4.1. Das Ohmsche Gesetz: U = RI. Eine Meßreihe von Daten:

KAPITEL 4. Lineare Ausgleichsrechnung Beispiel 4.1. Das Ohmsche Gesetz: U = RI. Eine Meßreihe von Daten: KAPITEL 4 Lineare Ausgleichsrechnung Beispiel 41 Das Ohmsche Gesetz: Eine Meßreihe von Daten: U = RI (U i, I i ) (Spannung, Stromstärke), i = 1,, m Aufgabe: man bestimme aus diesen Meßdaten den Widerstand

Mehr

Technische Universität München. Zentrum Mathematik

Technische Universität München. Zentrum Mathematik Technische Universität München Zentrum Mathematik Modellwahl bei der KFZ Haftpflicht-Versicherung mit Hilfe von GLMs Diplomarbeit von Ivonne Siegelin Themenstellerin: Prof. Dr. C. Czado, Dr. G. Sussmann

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Computer Vision: Optische Flüsse

Computer Vision: Optische Flüsse Computer Vision: Optische Flüsse D. Schlesinger TUD/INF/KI/IS Bewegungsanalyse Optischer Fluss Lokale Verfahren (Lukas-Kanade) Globale Verfahren (Horn-Schunck) (+ kontinuierliche Ansätze: mathematische

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Master of Science in Pflege

Master of Science in Pflege Master of Science in Pflege Modul: Statistik Einfache und multiple Regressionsanalyse / Logistische Regressionsanalyse November 2012 Prof. Dr. Jürg Schwarz Folie 2 Programm 28. November 2012: Vormittag

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

ChangePoint-Analysen - ein Überblick

ChangePoint-Analysen - ein Überblick ChangePoint-Analysen - ein Überblick Gliederung Motivation Anwendungsgebiete Chow Test Quandt-Andrews Test Fluktuations-Tests Binary Segmentation Recursive circular and binary segmentation algorithm Bayesscher

Mehr

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X

Mehr

Algorithmische Modelle als neues Paradigma

Algorithmische Modelle als neues Paradigma Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Fallbeispiel: Kreditscoring

Fallbeispiel: Kreditscoring Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden:

Mehr

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners 1 KAP 15. Spiele unter unvollständiger Information Bisher angenommen: jeder Spieler kennt alle Teile des Spiels seine Gegenspieler, deren Aktionen, deren Nutzen, seinen eigenen Nutzen etc. Oft kennt man

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1

i x k k=1 i u i x i v i 1 0,2 24 24 0,08 2 0,4 30 54 0,18 3 0,6 54 108 0,36 4 0,8 72 180 0,60 5 1,0 120 300 1,00 2,22 G = 1 + 1 n 2 n i=1 1. Aufgabe: Der E-Commerce-Umsatz (in Millionen Euro) der fünf größten Online- Shopping-Clubs liegt wie folgt vor: Club Nr. Umsatz 1 120 2 72 3 54 4 30 5 24 a) Bestimmen Sie den Ginikoeffizienten. b) Zeichnen

Mehr

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests

Beispiel: Sonntagsfrage. Einführung in die induktive Statistik. Statistische Tests. Statistische Tests Beispiel: Sonntagsfrage Vier Wochen vor der österreichischen Nationalratswahl 1999 wurde 499 Haushalten die Sonntagsfrage gestellt: Falls nächsten Sonntag Wahlen wären, welche Partei würden Sie wählen?

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Seminar zur speziellen Betriebswirtschaftslehre Kreditrisiko. Thema 4 Backtesting von Portfoliomodellen für Kreditrisiko

Seminar zur speziellen Betriebswirtschaftslehre Kreditrisiko. Thema 4 Backtesting von Portfoliomodellen für Kreditrisiko Seminar zur speziellen Betriebswirtschaftslehre Kreditrisiko Thema 4 Backtesting von Portfoliomodellen für Kreditrisiko Vortrag von Igor Grinberg, Kai Hartmanshenn und Stephan Pueschel am 30.01.2002 Gliederung

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Statistische Verfahren für das Data Mining in einem Industrieprojekt

Statistische Verfahren für das Data Mining in einem Industrieprojekt Statistische Verfahren für das Data Mining in einem Industrieprojekt Thorsten Dickhaus Forschungszentrum Jülich GmbH Zentralinstitut für Angewandte Mathematik Telefon: 02461/61-4193 E-Mail: th.dickhaus@fz-juelich.de

Mehr

Zur Verfügung gestellt in Kooperation mit / provided in cooperation with: GESIS - Leibniz-Institut für Sozialwissenschaften

Zur Verfügung gestellt in Kooperation mit / provided in cooperation with: GESIS - Leibniz-Institut für Sozialwissenschaften www.ssoar.info Teilnehmen oder Boykottieren : ein Anwendungsbeispiel der binären logistischen Regression mit SPSSx Kühnel, Steffen M.; Jagodzinski, Wolfgang; Terwey, Michael Veröffentlichungsversion /

Mehr

Notiz zur logistischen Regression

Notiz zur logistischen Regression Kapitel 1 Notiz zur logistischen Regression 1.1 Grundlagen Bei dichotomen abhängigen Variablen ergeben sich bei einer normalen linearen Regression Probleme. Während man die Ausprägungen einer dichotomen

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Monte Carlo Methoden in Kreditrisiko-Management

Monte Carlo Methoden in Kreditrisiko-Management Monte Carlo Methoden in Kreditrisiko-Management P Kreditportfolio bestehend aus m Krediten; Verlustfunktion L = n i=1 L i; Die Verluste L i sind unabhängig bedingt durch einen Vektor Z von ökonomischen

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr