Kap. 9: Regression mit einer binären abhängigen Variablen

Größe: px
Ab Seite anzeigen:

Download "Kap. 9: Regression mit einer binären abhängigen Variablen"

Transkript

1 Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick: weitere Modelle der Mikroökonometrie

2 9.1 Motivation in allen bisherigen Beispielen war abhängige Variable stetig: Testergebnisse (Kalifornien, Massachusetts) Unfallraten pro Einwohner diskrete abhängige Variablen ebenfalls denkbar: Arbeitsmarktpartizipation (ja/nein) Kreditantrag wird bewilligt (ja/nein) In diesen Beispielen ist abhängige Variablen binär häufigster Fall in empirischer Wirtschaftsforschung neben linearer Regression. Wie sehen Regressionsmodelle für solche Daten aus? C. Kleiber: Ökonometrie 1 Kap. 9-1 U Basel, HS 2008

3 9.1 Motivation Empirisches Beispiel: Rassendiskriminierung am Hypothekenmarkt? Anträge für Hypotheken im Grossraum Boston Beobachtungen, gesammelt unter Home Mortgage Disclosure Act (HMDA) HMDA-Daten enthalten alle Anträge von Schwarzen, Hispanics, Stichprobe aus Weissen. Hier nur Daten zu Anträgen von Schwarzen und Weissen. Variablen: abhängige Variable: Wurde Antrag abgelehnt? (ja/nein) Regressoren: Einkommen, Vermögen, Beschäftigungsstatus, Familienstand, Schulabschluss, Hautfarbe (bzw. Transformationen) C. Kleiber: Ökonometrie 1 Kap. 9-2 U Basel, HS 2008

4 9.1 Motivation R> data("hmda", package = "AER") R> with(hmda, table(deny, afam)) afam deny no yes no yes Also ca. 28% der Anträge von Schwarzen abgelehnt, aber nur ca. 9% der von Weissen. Vorsicht: Hinzunahme von Kovariablen könnte Differenz verkleinern ( Verzerrung durch vergessene Variablen) C. Kleiber: Ökonometrie 1 Kap. 9-3 U Basel, HS 2008

5 9.2 Das lineare Wahrscheinlichkeitsmodell Naheliegende Idee: lineare Regression mit (für einen Regressor) Y i = β 0 + β 1 X i + u i Fragen: Bei linearer Regression gilt bekanntlich β 1 = E(Y i X i )/ X i. Wie interpretiert man β 1, wenn Y i binär? Was bedeutet die Regressionsgerade β 0 + β 1 X i, wenn Y i binär? Was bedeutet die Prognose Ŷi, wenn Y i binär? Was ist z.b. Ŷi = 0.59? Bei linearer Regression nehmen wir an (A1) E(u i X i ) = 0, und damit E(Y i X i ) = β 0 +β 1 X i was sind die Implikationen, wenn Y i binär? C. Kleiber: Ökonometrie 1 Kap. 9-4 U Basel, HS 2008

6 9.2 Das lineare Wahrscheinlichkeitsmodell Da Y {0, 1}: einziges denkbares Modell ist Bernoulli-Verteilung mit Dichte/Wahrscheinlichkeitsfunktion f(y; p) = p y (1 p) 1 y, y {0, 1}. Erwartungswert Varianz E(Y ) = p Var(Y ) = p(1 p) Bekannt: für Y i Bernoulli(p) u.i.v. ist deren Summe binomialverteilt n Y i Bin(n, p) i=1 Deshalb auch Notation: Y i Bin(1, p) C. Kleiber: Ökonometrie 1 Kap. 9-5 U Basel, HS 2008

7 9.2 Das lineare Wahrscheinlichkeitsmodell Für Y i Bin(1, p) heisst Y i = β 0 + β 1 X i + u i das lineare Wahrscheinlichkeitsmodell (linear probability model, LPM). Eigenschaften: E(Y i X i ) = β 0 + β 1 X i (W keit, dass Y i = 1 für gegebenes X i ) Ŷi prognostizierte W keit, dass Y i = 1 für gegebenes X i E(Y i X i ) X i = β 1 Änderung der W keit, dass Y i = 1 bei Änderung in X i um 1 C. Kleiber: Ökonometrie 1 Kap. 9-6 U Basel, HS 2008

8 9.2 Das lineare Wahrscheinlichkeitsmodell Lineares Wahrscheinlichkeitsmodell für Stichprobe mit n = 100: pirat C. Kleiber: Ökonometrie 1 Kap. 9-7 U Basel, HS 2008

9 9.2 Das lineare Wahrscheinlichkeitsmodell R> fm_lpm <- lm(i(as.numeric(deny) - 1) ~ pirat, data = HMDA) R> coeftest(fm_lpm) t test of coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) pirat < 2e-16 Beispiel zu Prognosen von Ablehnungsw keit für X = 0.3: P (Y i = 1 X = 0.3) = = Effekt einer Änderung der unabhängigen Variablen pirat von 0.3 auf 0.4: P (Y i = 1 X = 0.4) = = Also steigt W keit für Ablehnung von auf (um ca. 6 Prozentpunkte). C. Kleiber: Ökonometrie 1 Kap. 9-8 U Basel, HS 2008

10 9.2 Das lineare Wahrscheinlichkeitsmodell Zusammenfassung: Lineares Wahrscheinlichkeitsmodell modelliert W keit als lineare Funktion von X Vorteile: Y i = β 0 + β 1 X i + u i Schätzung, Interpretation und Inferenz wie im multiplen linearen Regressionsmodell ( nichts Neues) Nachteile: Warum sollte W keit linear in X sein? prognostizierte W keiten ˆβ 0 + ˆβ 1 X i könnten < 0 oder > 1 werden! Lösung: verwende nichtlineares Wahrscheinlichkeitsmodell Probit- oder Logit-Regression C. Kleiber: Ökonometrie 1 Kap. 9-9 U Basel, HS 2008

11 9.3 Probit- und Logit-Modelle Problem des linearen W keitsmodells: Ansatz Wir brauchen aber: 0 P (Y = 1 X) 1 für alle X i P (Y i = 1 X) = β 0 + β 1 X i P (Y = 1 X) sollte wachsen in X i, falls β 1 > 0 Also brauchen wir nichtlineare funktionale Form für die W keit, z.b. eine S-förmige Kurve. Probit-Modell: P (Y i = 1 X) = Φ(β 0 + β 1 X i ) mit Φ VF der Standardnormalverteilung Beispiel: für β 0 = 2, β 1 = 3 und X = 0.4 ist P (Y i = 1 X = 0.4) = Φ( ) = Φ( 0.8) Damit P (Y i = 1 X = 0.4) Fläche unter der Kurve links von z = 0.8. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

12 9.3 Probit- und Logit-Modelle dnorm(x) x C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

13 9.3 Probit- und Logit-Modelle Was spricht für Probit-Modell? (diese) S-förmige Kurve liefert 0 P (Y = 1 X) 1 für alle X i P (Y = 1 X) wachsend in X i falls β 1 > 0 relativ einfach zu benutzen (Tabellen für Normalverteilung!) einfache Interpretation: β 0 + β 1 X i =: z-wert (ein Index ) ˆβ 0 + ˆβ 1 X i ist prognostizierter z-wert, gegeben X i β 1 ist Änderung im z-wert bei Änderung von X i um eine Einheit C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

14 9.3 Probit- und Logit-Modelle Probit-Modell für Stichprobe mit n = 100: pirat C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

15 9.3 Probit- und Logit-Modelle Umsetzung in R: (Details später) R> fm_probit1 <- glm(deny ~ pirat, family = binomial(link = "probit"), + data = HMDA) R> coeftest(fm_probit1) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 pirat e-14 Also geschätzte Regressionsbeziehung: P (Y = 1 pirat) = Φ( pirat) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

16 9.3 Probit- und Logit-Modelle Koeffizient positiv (plausibel?) Standardfehler haben übliche Bedeutung Prognosen von W keiten: P (Y i = 1 X = 0.3) = Φ( ) = Φ( 1.304) = Effekt einer Änderung der unabhängigen Variable pirat von 0.3 auf 0.4: P (Y i = 1 X = 0.4) = Φ( ) = Φ( 1.007) = Also steigt W keit für Ablehnung von auf 0.157, um ca. 6 Prozentpunkte. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

17 9.3 Probit- und Logit-Modelle Dies geht alles auch für multiple Regressoren: R> fm_probit2 <- glm(deny ~ pirat + afam, + family = binomial(link = "probit"), data = HMDA) R> coeftest(fm_probit2) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 pirat e-13 afamyes < 2e-16 Also geschätzte Regressionsbeziehung: P (Y = 1 pirat, afam) = Φ( pirat afam) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

18 9.3 Probit- und Logit-Modelle Wie ist der Einfluss des Regressors Hautfarbe? ist Koeffizient statistisch signifikant? geschätzter Effekt der Hautfarbe bei pirat von 0.3: P (Y i = 1 pirat = 0.3, afam = yes ) = Φ( 0.728) = bzw. P (Y i = 1 pirat = 0.3, afam = no ) = Φ( 1.436) = Differenz ist (also 15.8 Prozentpunkte!) aber Verzerrung durch vergessene Variablen...? (später mehr) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

19 9.3 Probit- und Logit-Modelle Logit-Regression: (auch: logistische Regression) Warum Normalverteilung (Probit)? Gesucht war nur S-förmige Kurve. Alternativen zu Probit sind gegeben durch andere VFen F an Stelle von Φ: P (Y = 1 X) = F (β 0 + β 1 X) Populär: VF der logistischen Verteilung mit F (β 0 + β 1 X) = exp{ (β 0 + β 1 X)} Logit führt auf einfachere Formeln (wg. expliziter Form von F ) Ergebnisse meist ähnlich zu Probit Vorsicht: die Werte der Koeffizienten in Probit- und Logit-Modellen lassen sich nicht gut vergleichen (Grund: Standardnormal- und logistische Verteilung haben unterschiedliche Varianzen), vergleiche besser Prognosen C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

20 9.3 Probit- und Logit-Modelle Vergleich Logit und Probit: Normalverteilung vs. logistische Verteilung Dichten VFen pnorm plogis plogis, skaliert x x Beide Verteilungen sind symmetrisch, die logistische Verteilung hat aber schwerere Ränder. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

21 9.3 Probit- und Logit-Modelle Logit- und Probit-Modell für Stichprobe mit n = 100: Probit Logit pirat C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

22 9.3 Probit- und Logit-Modelle Umsetzung in R: (Logit ist Voreinstellung der Funktion, deshalb kein Argument link!) R> fm_logit2 <- glm(deny ~ pirat + afam, family = binomial, data = HMDA) R> coeftest(fm_logit2) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 pirat e-13 afamyes < 2e-16 führt auf Prognose P (Y i = 1 pirat = 0.4, afam = yes ) = F ( 1.242) = Zum Vergleich: bei Probit ergab sich P (Y i = 1 pirat = 0.4, afam = yes ) = Φ( 0.728) = C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

23 9.4 Maximum Likelihood Probit: P (Y = 1 X) = Φ(β 0 + β 1 X) wie schätzt man hier die Regressionskoeffizienten? Naheliegend wäre nichtlineare KQ-Methode n i=1 [y i Φ( ˆβ 0 ˆβ 1 x i )] 2 min ˆβ 0, ˆβ 1! Es gibt keine explizite Lösung (geschlossene Formel), aber man kann solche Optimierungsprobleme mit numerischen Methoden lösen. Praxis: den üblichen Schätzer erhält man über eine andere Methode, die Maximum- Likelihood-Methode (ML). Idee: Schätzung besteht aus denjenigen Parameterwerten, die mit grösster Wahrscheinlichkeit die beobachtete Stichprobe liefern. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

24 9.4 Maximum Likelihood Formaler Rahmen: (ignoriere zunächst die X i ) gemeinsame Verteilung von Y 1,..., Y n gegeben durch Dichte f(y 1,..., y n ), diese hängt von Parametern β ab für die Realisationen y 1,..., y n ist Likelihood-Funktion definiert durch L(β) = f(y 1,..., y n ; β), also die gemeinsame Dichte aufgefasst als Funktion der Parameter. die Statistik ˆβ = arg max L(β) β heisst Maximum-Likelihood-Schätzer (MLE) für β der Schätzer, der mit grösster Wahrscheinlichkeit die beobachtete Stichprobe liefert. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

25 9.4 Maximum Likelihood Beispiel: (Probit-MLE ohne Regressoren) Sei Y i Bin(1, p), d.h. P (Y i = 1) = p und P (Y i = 0) = 1 p. Also Dichte/Wahrscheinlichkeitsfunktion f(y i ; p) = P (Y i = y i ) = p y i (1 p) 1 y i, y i {0, 1}. Daten seien Y 1,..., Y n u.i.v. Dann ist gemeinsame Verteilung f(y 1,..., y n ; p) = n p y i (1 p) 1 y i = p P n i=1 y i (1 p) P n i=1 (1 y i ) i=1 = p P n i=1 y i (1 p) n P n i=1 y i Aufgefasst als Funktion von p ist dies auch die Likelihood: L(p) := f(y 1,..., y n ; p) = p P n i=1 y i (1 p) n P n i=1 y i C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

26 9.4 Maximum Likelihood Maximiere dies nun bzgl. p. Einfacher und üblich: maximiere Log-Likelihood l(p) = log L(p) = log (p P ) n i=1 y i (1 p) n P n i=1 y i ( n ) ( ) n = y i log(p) + n y i log(1 p) i=1 i=1 Nullsetzen der 1. Ableitung: l (p) = ( n i=1 y i ) 1 p + ( n n i=1 ) ( y i 1 ) 1 p = 0 Lösung ist ˆp = ȳ der Anteil der Einsen in Stichprobe. Also liefert die ML-Methode hier einen bekannten Schätzer. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

27 9.4 Maximum Likelihood Beispiel: (Probit-MLE mit einem echten Regressor) Sei nun P (Y i = 1 X i ) = Φ(β 0 + β 1 X i ) und P (Y i = 0 X i ) = 1 Φ(β 0 + β 1 X i ). Also Dichte/Wahrscheinlichkeitsfunktion für n = 1 P (Y i = y i X i ) = Φ(β 0 + β 1 X i ) y i [1 Φ(β 0 + β 1 X i )] 1 y i, y i {0, 1}. Probit-Likelihood streng genommen eine bedingte Likelihood ist nun gemeinsame Dichte von Y 1,..., Y n gegeben X 1,..., X n als Funktion von β 0 und β 1 L(β 0, β 1 ) = n Φ(β 0 + β 1 X i ) y i [1 Φ(β 0 + β 1 X i )] 1 y i i=1 = Φ(β 0 + β 1 X i ) P n i=1 y i [1 Φ(β 0 + β 1 X i )] n P n i=1 y i Maximiere dies nun bzgl. β 0, β 1. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

28 9.4 Maximum Likelihood für Y i u.i.v. Bernoulli ist MLE der natürliche Schätzer von p, der Anteil der Einsen in grossen Stichproben (n ) gilt für ML-Schätzer (MLE) unter technischen Annahmen konsistent effizient (hat kleinste Varianz) approximativ normalverteilt Tests über t-statistik, 95%-Konfidenzintervall über ȳ ± 1.96 SE(ȳ) Bemerkung zu R: im Regressionsoutput z statt t dies betont, dass grosse Stichproben erforderlich sind bzw. die Verteilung, aus der die p-werte berechnet werden, nur in grossen Stichproben eine gute Approximation liefert es gibt keine explizite Lösung (geschlossene Formel) dieses Optimierungsproblems, sobald ein echter Regressor im Modell ist. Zielfunktion kann aber mittels numerischer Methoden maximiert werden völlig analog für mehrere Regressoren völlig analog für Logit-Regression C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

29 9.5 Analyse der HMDA-Daten Bisherige Modelle leiden vermutlich unter Verzerrung durch vergessene Variablen Nun: ausgewählte Ergebnisse aus Munnell, A. H., Tootell, G. M. B., Browne, L. E. and McEneaney, J. (1996). Mortgage Lending in Boston: Interpreting HMDA Data. American Economic Review, 86, Hauptbeitrag dieser Arbeit: Verbesserung einer früheren Arbeit durch Bereitstellung neuer Kovariablen (!) Entscheidung über Hypothek erfolgt durch Bankangestellte aufgrund von persönlichem Gespräch. Angestellte kennen Situation der Antragsteller. Welche persönlichen Umstände der Antragsteller könnten für die Entscheidung relevant sein? C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

30 9.5 Analyse der HMDA-Daten Datensatz HMDA: Daten für 2380 Anträge für Kovariablen sind pirat hirat lvrat chist mhist phist insurance selfemp afam payment to income ratio housing expense to income ratio loan to value ratio consumer credit history mortgage history public bad credit history? mortgage insurance (denied? yes/no) self-employed? Hautfarbe (Faktor, Indikator für African-American ). C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

31 9.5 Analyse der HMDA-Daten Umsetzung in R: Logit/Probit sind in statistischer Terminologie generalisierte lineare Modelle (GLMs). GLMs verallgemeinern Ideen des multiplen linearen Regressionsmodells auf Situationen mit nicht-metrischen Y i, indem von anderen Verteilungen als der Normalverteilung ausgegangen wird es gibt eine Funktion glm(), die i.w. wie lm() funktioniert glm() hat zwei neue Argumente: family für Verteilung (bei Bernoulli-Variablen: binomial), und link für (bei Bernoulli-Variablen) funktionale Form der S-Kurve (Probit, Logit) Ergebnis von glm() kann wieder mit den üblichen Funktionen ausgewertet werden: summary(), predict(), etc. C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

32 9.5 Analyse der HMDA-Daten Beispiel: Regression aus SW, Tab. 11.2, Spalte (3) R> mlvrat <- with(hmda, lvrat >= 0.8 & lvrat < 0.95) R> hlvrat <- with(hmda, lvrat >= 0.95) R> fm_probit3 <- glm(deny ~ afam + pirat + hirat + mlvrat + hlvrat + + I(as.numeric(chist)) + I(as.numeric(mhist)) + phist + insurance + + selfemp, family = binomial(link = "probit"), data = HMDA) C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

33 9.5 Analyse der HMDA-Daten R> coeftest(fm_probit3) z test of coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 afamyes e-05 pirat e-06 hirat mlvrattrue hlvrattrue e-06 I(as.numeric(chist)) e-13 I(as.numeric(mhist)) phistyes e-09 insuranceyes < 2e-16 selfempyes C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

34 9.5 Analyse der HMDA-Daten Anpassungsgüte des Modells: übliches R 2 hier nicht sinnvoll (warum?) Auswertung der Prognosen innerhalb der Stichprobe: R> table(hmda$deny, round(predict(fm_probit3, type = "response"))) 0 1 no yes Unser Modell erkennt die Abgelehnten also schlecht! C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

35 9.5 Analyse der HMDA-Daten Ausgangsproblem: gibt es noch Unterschiede bzgl Hautfarbe? R> new1 <- with(hmda, data.frame(pirat = mean(pirat), hirat = mean(hirat), + mlvrat = FALSE, hlvrat = FALSE, chist = factor("2"), + mhist = factor("2"), phist = factor("no"), insurance = factor("no"), + selfemp = factor("no"), afam = factor("yes"))) R> new2 <- new1 R> new2$afam <- factor("no") R> predict(fm_probit3, newdata = new1, type = "response") R> predict(fm_probit3, newdata = new2, type = "response") C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

36 9.5 Analyse der HMDA-Daten Anmerkungen: Koeffizienten inhaltlich plausibel Faktor African-American bleibt in diversen Spezifikationen signifikant, Hinzunahme von Kovariablen reduziert aber den geschätzten Effekt Probit und Logit liefern ähnliche Ergebnisse Potentielle Probleme: interne Validität Verzerrung durch vergessene Variablen (unklar: was erfährt Bankangestellte sonst beim Gespräch?) funktionale Form (unklar) Messfehler (frühere Studie ja, nun nein) Selektion (nein) Simultanität (nein) externe Validität: dies gilt zunächst nur für Boston C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

37 9.6 Ausblick: Weitere Modelle der Mikroökonometrie Logit/Probit sind nur zwei Beispiele von Modellen, die mit der Maximum-Likelihood-Methode geschätzt werden. Es gibt viele weitere in der Mikroökonometrie: multinomiale abhängige Variablen (Bsp.: Wahl des Transportmittels zur Arbeit) Zähldaten (Bsp.: Anzahl Arztbesuche) zensierte Daten (Bsp.: Ausgaben für langlebige Gebrauchsgüter) Mehr dazu: Vorlesung Mikroökonometrie auf der Master-Stufe! C. Kleiber: Ökonometrie 1 Kap U Basel, HS 2008

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression

6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression 6.0 Logistische Regression 6.1 Das binäre Modell 6.1 Das binäre Modell Sei x der Vektor der Einflussgrößen mit einem Eins-Element, um die Regressionskonstante zu modellieren. Angenommen, es gilt das Regressionsmodell:

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle

Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle Motivation Grundbegriffe Autoregressionen (AR-Modelle) Dynamische Regressionsmodelle (ADL-Modelle) Nichstationarität Ausblick 12.1 Motivation

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Generalisierte lineare Modelle. Statistik 3 im Nebenfach. Binäre Regressionsmodelle. 4.1 Binäre Regression

Generalisierte lineare Modelle. Statistik 3 im Nebenfach. Binäre Regressionsmodelle. 4.1 Binäre Regression Generalisierte lineare Modelle Statistik 3 im Nebenfach Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München WS 2010/2011 basierend auf Fahrmeir, Kneib & Lang (2007) 4 Generalisierte

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

4 Binäre Regressionsmodelle, Folien 2

4 Binäre Regressionsmodelle, Folien 2 4 Binäre Regressionsmodelle, Folien 2 Ludwig Bothmann (basierend auf Unterlagen von Nora Fenske) Statistik III für Nebenfachstudierende WS 2014/2015 4.5 Hypothesentests Lineare Hypothesen Betrachtet werden

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 008/009 Fachbereich

Mehr

Einführung in Statistik und Messwertanalyse für Physiker

Einführung in Statistik und Messwertanalyse für Physiker Gerhard Böhm, Günter Zech Einführung in Statistik und Messwertanalyse für Physiker SUB Göttingen 7 219 110 697 2006 A 12486 Verlag Deutsches Elektronen-Synchrotron Inhalt sverzeichnis 1 Einführung 1 1.1

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Binäre Auswahlmodelle (Logit, Probit,...)

Binäre Auswahlmodelle (Logit, Probit,...) Binäre Auswahlmodelle (Logit, Probit,...) 27. November 204 In diesem Kapitel führen wir eine Klasse von Modellen für binäre Auswahlprobleme ein, deren wichtigste Vertreter das Logit- und das Probit-Modell

Mehr

Berichte aus der Statistik. Jens Kahlenberg. Storno und Profitabilität in der Privathaftpflichtversicherung

Berichte aus der Statistik. Jens Kahlenberg. Storno und Profitabilität in der Privathaftpflichtversicherung Berichte aus der Statistik Jens Kahlenberg Storno und Profitabilität in der Privathaftpflichtversicherung Eine Analyse unter Verwendung von univariaten und bivariaten verallgemeinerten linearen Modellen

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Analyse von Tabellen und kategorialen Daten

Analyse von Tabellen und kategorialen Daten Hans-Jürgen Andreß Jacques A. Hagenaars Steffen Kühnel Analyse von Tabellen und kategorialen Daten Log-lineare Modelle, latente Klassenanalyse, logistische Regression und GSK-Ansatz Mit 32 Abbildungen

Mehr

Regression mit Faktoren, Interaktionen und transformierten Variablen

Regression mit Faktoren, Interaktionen und transformierten Variablen Kap. 5: Regression mit Faktoren, Interaktionen und transformierten Variablen Motivation Regressionen mit transformierten Variablen Ausblick: Nichtlineare Regression Mehr zu Regressionen mit qualitativen

Mehr

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent?

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Anwendungen PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Ulrike Braisch, Rainer Muche Institut für Epidemiologie und Medizinische Biometrie Universität Ulm Schwabstraße

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Stochastische Eingangsprüfung, 17.05.2008

Stochastische Eingangsprüfung, 17.05.2008 Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

Parametrische Statistik

Parametrische Statistik Statistik und ihre Anwendungen Parametrische Statistik Verteilungen, maximum likelihood und GLM in R Bearbeitet von Carsten F. Dormann 1. Auflage 2013. Taschenbuch. xxii, 350 S. Paperback ISBN 978 3 642

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Unsupervised Kernel Regression

Unsupervised Kernel Regression 9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 Wiederholung:

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns

2. Statistische Methoden in der Diagnostik. Elemente des Studiendesigns 2. Statistische Methoden in der Diagnostik Elemente des Studiendesigns Diagnosestudien in der Medizin Klassifikation in krank - nicht krank basierend auf diagnostischem Test Beispiel: Diagnose von Brustkrebs

Mehr

Statistische Modellierung Merkblatt

Statistische Modellierung Merkblatt Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC

Mehr

Teil I Beschreibende Statistik 29

Teil I Beschreibende Statistik 29 Vorwort zur 2. Auflage 15 Vorwort 15 Kapitel 0 Einführung 19 0.1 Methoden und Aufgaben der Statistik............................. 20 0.2 Ablauf statistischer Untersuchungen..............................

Mehr

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen** Effektschätzung in Cluster-Randomized Trials mit binärer Zielgröße: Eine Sensitivitätsanalyse mit numerischer Integration, MCMC und NPMLE am Beispiel der DHP Oliver Kuß*; Dorothee Twardella**; Maria Blettner***;

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Statistik im Bachelor-Studium der BWL und VWL

Statistik im Bachelor-Studium der BWL und VWL Max C. Wewel Statistik im Bachelor-Studium der BWL und VWL Methoden, Anwendung, Interpretation Mit herausnehmbarer Formelsammlung ein Imprint von Pearson Education München Boston San Francisco Harlow,

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Einfache Modelle für Paneldaten. Statistik II

Einfache Modelle für Paneldaten. Statistik II Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

Schätzen der Fehlerzahl. in Software-Dokumenten. Dr. Frank Padberg Universität Karlsruhe Mai 2003

Schätzen der Fehlerzahl. in Software-Dokumenten. Dr. Frank Padberg Universität Karlsruhe Mai 2003 Schätzen der Fehlerzahl in Software-Dokumenten Dr. Frank Padberg Universität Karlsruhe Mai 2003 Motivation beim Testen oder bei Inspektionen werden nicht alle Fehler gefunden Anzahl der unentdeckten Fehler

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren

Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Marlene Müller Beuth Hochschule für Technik Berlin, Fachbereich II Luxemburger Str. 10, D 13353 Berlin

Mehr

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................

Mehr

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks 29.08.2011

Monte-Carlo-Simulationen mit Copulas. Kevin Schellkes und Christian Hendricks 29.08.2011 Kevin Schellkes und Christian Hendricks 29.08.2011 Inhalt Der herkömmliche Ansatz zur Simulation logarithmischer Renditen Ansatz zur Simulation mit Copulas Test und Vergleich der beiden Verfahren Fazit

Mehr

Logistische Regression

Logistische Regression Grundideen Logistische Regression Exkurs Logistische Regression Auch nachzulesen bei: http://www.psychologie.uniwuerzburg.de/methoden/lehre/skripten/hs_meth_evaluation/hs_evaluation_logistisch eregression.pdf

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007

DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 2006/07 28.02.2007 Wirtschaftswissenschaftliches Prüfungsamt DIPLOMVORPRÜFUNG GRUNDZÜGE DER STATISTIK, TEIL B WINTERSEMESTER 006/07 8.0.007 Lösung Prof. Dr. R Friedmann / Dr. R. Hauser Hinweise für die Klausurteilnehmer

Mehr

Klausur STATISTIK 2 für Diplom VWL

Klausur STATISTIK 2 für Diplom VWL Klausur STATISTIK 2 für Diplom VWL Name, Vorname: Matrikel-Nr. Die Klausur enthält zwei Typen von Aufgaben: Teil A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Stochastische Prozesse und Zeitreihenmodelle

Stochastische Prozesse und Zeitreihenmodelle Kapitel 12 Stochastische Prozesse und reihenmodelle [ Stochastische Prozesse und reihenmodelle ] Einleitung:.com-Blase an der NASDAQ Department of Statistics and Mathematics WU Wien c 2008 Statistik 12

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Teil II Optimierung. Peter Buchholz 2016. Modellgestützte Analyse und Optimierung Kap. 9 Einführung Optimierung

Teil II Optimierung. Peter Buchholz 2016. Modellgestützte Analyse und Optimierung Kap. 9 Einführung Optimierung Teil II Optimierung Gliederung 9 Einführung, Klassifizierung und Grundlagen 10 Lineare Optimierung 11 Ganzzahlige und kombinatorische Optimierung 12 Dynamische Optimierung Literatur: zu 10-12: Neumann,

Mehr

Commercial Banking. Kreditgeschäft. Gestaltung der Vertragsbeziehung: Sicherheiten, Kündigungsrechte, Relationship Banking,...

Commercial Banking. Kreditgeschäft. Gestaltung der Vertragsbeziehung: Sicherheiten, Kündigungsrechte, Relationship Banking,... Commercial Banking Kreditgeschäft Themen Rating, Ausfallrisiko erwarteter Verlust, unerwarteter Verlust, Pricing, Risikoabgeltung versus Kreditrationierung Gestaltung der Vertragsbeziehung: Sicherheiten,

Mehr

P( X µ c) Var(X) c 2. mit. In der Übung wurde eine alternative, äquivalente Formulierung verwendet: P( X µ < c) 1 Var(X)

P( X µ c) Var(X) c 2. mit. In der Übung wurde eine alternative, äquivalente Formulierung verwendet: P( X µ < c) 1 Var(X) Ich habe eine Frage zur Tschebyschew Ungleichung. In der Aufgabe 4 des Übungsblattes 3 benötigt man ja die Ungleichung. In diesem Falle war der Bereich (0, 20) symmetrisch um den Erwartungswert µ = 5.

Mehr

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt?

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt? Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Blatt 7 Dipl.-Math. oec. D. Engel Übungen zur Vorlesung Statistik 2 Aufgabe 25 (keine Abgabe) Angenommen die Zielvariable

Mehr

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch Universität Ulm 8969 Ulm Germany Dipl.-WiWi Sabrina Böck Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Wintersemester 8/9 Prognosen

Mehr

Inhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14

Inhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14 VII 1 Einführung... 1 1.1 Warum Versuche?... 1 1.2 Warum Statistik?... 1 1.3 Warum Versuchsplanung?... 4 1.4 Welche Art von Ergebnissen kann man erwarten?... 6 1.5 Versuche oder systematische Beobachtung?...

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Inhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17

Inhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17 Inhalt Vorwort.................................................................. V Inhalt.................................................................... VII 1 Einführung..........................................................

Mehr

Tutorial: Regression Output von R

Tutorial: Regression Output von R Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen

Mehr

Semiparametrisches Kredit Scoring

Semiparametrisches Kredit Scoring Semiparametrisches Kredit Scoring Marlene Müller Fraunhofer Institut für Techno- und Wirtschaftsmathematik (ITWM) Kaiserslautern Bernd Rönz, Wolfgang Härdle Center for Applied Statistics and Economics

Mehr

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3

Inhaltsverzeichnis. I Einführung in STATISTICA 1. 1 Erste Schritte in STATISTICA 3 I Einführung in STATISTICA 1 1 Erste Schritte in STATISTICA 3 2 Datenhaltung in STATISTICA 11 2.1 Die unterschiedlichen Dateitypen in STATISTICA....... 11 2.2 Import von Daten......... 12 2.3 Export von

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr