SHIP/KEF-Richtlinien zur Durchführung qualitätsgesicherter

Größe: px
Ab Seite anzeigen:

Download "SHIP/KEF-Richtlinien zur Durchführung qualitätsgesicherter"

Transkript

1 Sebastian E Baumeister, Carsten-Oliver Schmidt, Till Ittermann, Henry Völzke Version SHIP/KEF-Richtlinien zur Durchführung qualitätsgesicherter Auswertungen 1 Für Auswertungsprojekte ist im Regelfall ein bewilligter Datennutzungsantrag erforderlich 2 Vor Beginn der Analysen ist ein Analyseplan zu erstellen Dieser ist zumindest zwischen Erst-, Zweit- und Letztautor abzustimmen 3 Variablendefinitionen und statistische Analysen sind vollständig in Programmen (zb Stata-Do-Files und Log-Files) zu dokumentieren Diese Programme sind vor Ersteinreichung des Manuskripts an den Leiter des Publikationskomitees zu schicken (siehe Appendix mit Beispielanalysen) 4 Die Log-Files, die alle Variablendefinitionen und statistischen Analysen beinhalten, sind durch eine zweite Person zu kontrollieren Hierzu erfolgt insbesondere ein Abgleich mit den Tabellen des Manuskripts 5 Die Analysen sind sachgerecht durchzuführen, dies umfasst: die Auswertungen mit adäquaten statistischen Verfahren und die Überprüfung der Annahmen der verwendeten Verfahren [1,2,3] Bei erheblicher Verletzung der Annahmen sind die Analysen entsprechend anzupassen Die Überprüfung der Annahmen ist ebenfalls im Do- und Log-File zu dokumentieren

2 Appendix Allgemeine Hinweise In der Regel stehen die Ergebnisse von Regressionsmodellen in einem Auswertungsprojekt im Vordergrund Bei der Schätzung von Regressionsmodellen ist sicherzustellen, dass die zugrundeliegenden Annahmen erfüllt sind [1,2,3] Substantielle Verletzungen dieser Annahmen können zu Verzerrungen der Schätzer (Koeffizienten, P- Werte, Konfidenzintervalle, etc) führen Wichtige Annahmen im Rahmen klassischer Regressionsmodellen umfassen: a Normalverteilung der Residuen b Linearität c Homoskedaszität d Einflussreiche Beobachtungen e Unabhängigkeit der Residuen f Missing completely at random (MCAR) Annahme bei fehlenden Werten und Ausfällen Hinweise zur Kovariablen-Auswahl Die Berücksichtigung und Auswahl von Kovariablen in einem Regressionsmodell kann unterschiedliche Ziele verfolgen Grundsätzlich ist zwischen Konfounder- und Prädiktionsmodellen zu differenzieren [1,2,3] Im Konfoundermodell steht der Zusammenhang zwischen Exposure und Outcome im Vordergrund Die Auswahl zu adjustierender Konfounder erfolgt theoriegeleitet (zb mittels kausaler Grafen) oder anhand empirischer Kriterien (zb 15%-Change-in-Coefficient) [4] Bei der Entwicklung von Prädiktionsmodellen [3] kommen die theoriegeleitete und empirisch-automatisierte Selektion (wie Stepwise-Verfahren) zur Anwendung [3] Quellen: 1 Vittinghoff et al 2005 Regression Methods in Biostatistics 2 Harrell 2001 Regression Modeling Strategies 3 Steyerberg 2010 Clinical Prediction Models 4 Rothman, Grennland, Lash 2008 Modern Epidemiology Beispielsyntax und Log-File für die Durchführung und Überprüfung einer Regressionsanalyse Das folgende Beispiel dient zur Illustration von Do- und Log-Dateien Analysiert werden Korrelate des Geburtsgewichts mittels linearer Regression 1 Log-File zur Variablendefinition ** Sebastian Baumeister ** Titel of project: Maternal correlates of birth weight ** Pfad: E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\ glo bw "E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\" 2

3 *Load original dataset and save under new name ******************** use clear (Hosmer & Lemeshow data) save "$bw\bw_smokingdta", replace file E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\\bw_smokingdta saved codebook, c Variable Obs Unique Mean Min Max Label id identification code low birth weight<2500g age age of mother lwt weight at last menstrual period race race smoke smoked during pregnancy ptl premature labor history (count) ht has history of hypertension ui presence, uterine irritability ftv number of visits to physician during 1st trimester bwt birth weight (grams) white race==white black race==black other race==other ptd lwd * Define new outcome variables ************ Low birth weight recode bwt (min/2500=1) ( /max=0), gen(lowbwt) (189 differences between bwt and lowbwt) label variable lowbwt "birth weight" label define lowbwt 1 "1,birth weight<2500g" 0 "0,birth weight>=2500" label value lowbwt lowbwt *Covariables ************ * Age groups recode age (min/19=1) (20/23=2) (24/26=3) (27/max=4) (=), gen(age4) (189 differences between age and age4) save, replace file E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\\bw_smokingdta saved log close Der 2 Log-File unten veranschaulicht das Vorgehen bei der Durchführung und Überprüfung der Annahmen der linearen ( kleinste Quadrate ) Regression 2 Log-File zur Auswertung ** Sebastian Baumeister ** Titel of project: Maternal correlates of birth weight ** Pfad: E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\ glo bw "E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\" use "$bw\bw_smokingdta", clear (Hosmer & Lemeshow data) des, sh Contains data from E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\\bw_smokingdta obs: 189 Hosmer & Lemeshow data 3

4 vars: Jan :15 size: 5,292 Sorted by: * Analytical sample *********************** glo out bwt glo cov age lwt race smoke ptl ht ui ftv tabmiss $out $cov Variable Obs Missings FeqMissings NonMiss FeqNonMiss bwt age lwt race smoke ptl ht ui ftv egen nm=rowmiss($out $cov) fre nm nm Freq Percent Valid Cum Valid recode nm (0=0) (1/max=1),gen(miss) (0 differences between nm and miss) * No missing values on any variable included in the (regression analyses) * Table 1: Characteritics of the mothers ************************ tabstat age lwt ptl ftv if miss==0, s(n median p25 p75 mean sd) c(s) variable N p50 p25 p75 mean sd age lwt ptl ftv fre race smoke ht ui if miss==0 race -- race -- Freq Percent Valid Cum Valid 1 white black other Total smoke -- smoked during pregnancy Freq Percent Valid Cum Valid Total ht -- has history of hypertension Freq Percent Valid Cum

5 Valid Total ui -- presence, uterine irritability Freq Percent Valid Cum Valid Total * Table 2: Correlates of birth weight ************************ reg bwt age irace ismoke iht lwt ptl ftv if miss==0 Source SS df MS Number of obs = F( 8, 180) = 509 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] age race smoke ht lwt ptl ftv _cons * Test of linear regression (OLS) assumptions ************************** * Normality of residuals: looks fine ***** predict r, res kdensity r, norm qnorm r pnorm r * Homoscedasticity: looks fine ***** estat hettest age irace ismoke iht lwt ptl ftv, iid Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: age irace ismoke iht lwt ptl ftv chi2(8) = 745 Prob > chi2 = rvfplot, yline(0) * Linearity ***** * Age - looks nonlinear, modeled using restricted cubic splines twoway (scatter bwt age) (lfit bwt age) (lowess bwt age) (fpfit bwt age) acprplot age, lowess lsopts(bwidth(1)) 5

6 centile age if miss==0, c( ) -- Binom Interp -- Variable Obs Percentile Centile [95% Conf Interval] age mkspline2 ag_=age, cubic knots( ) dis knot1 knot2 knot3 knot age * Weight at last menstrual period - looks linear twoway (scatter bwt lwt) (lfit bwt lwt) (lowess bwt lwt) /*(fpfit bwt lwt)*/ * premature labor history twoway (scatter bwt ptl) (lfit bwt ptl) (lowess bwt ptl) /*(fpfit bwt lwt)*/ fre ptl ptl -- premature labor history (count) Freq Percent Valid Cum Valid Total *only few subjects with premature labor history >1 therefore recode with new variables values 0 and 1+ recode ptl (0=0 "0,zero") (1/3=1 "1,1+"), gen(plt_2c) (6 differences between ptl and plt_2c) * Collinearity - not an issue ***** vif Variable VIF 1/VIF age race smoke ht lwt ptl ftv Mean VIF 117 collin bwt age race smoke ht lwt plt_2c ftv if miss==0 (obs=189) Collinearity Diagnostics SQRT R- Variable VIF VIF Tolerance Squared bwt age race smoke ht lwt plt_2c ftv Mean VIF 118 6

7 Cond Eigenval Index Condition Number Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept) Det(correlation matrix) * Omitted variables / exogeneity -> not suspected ***** linktest Source SS df MS Number of obs = F( 2, 186) = 2123 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] _hat _hatsq _cons estat ovtest Ramsey RESET test using powers of the fitted values of bwt Ho: model has no omitted variables F(3, 177) = 149 Prob > F = * Influential observations ***** *Cookd distance > 4/N reg bwt ag_* irace ismoke iht lwt ptl ftv if miss==0 Source SS df MS Number of obs = F( 10, 178) = 464 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons

8 predict d, cooksd li bwt age race smoke ht lwt plt_2c ftv if d>4/ bwt age race smoke ht lwt plt_2c ftv white ,zero other , white , white ,zero black ,zero black ,zero white ,zero other , white ,zero black ,zero other , black ,zero *dfits > 2*sqrt(k/N) predict dfits, dfits quiet scalar thresh=2*sqrt((e(df_m)+1)/e(n)) di "dfits threshold=" %63f thresh dfits threshold= 0482 li dfits bwt age race smoke ht lwt plt_2c ftv if abs(dfits)>2*thresh & e(sample) dfits bwt age race smoke ht lwt plt_2c ftv white , white ,zero black ,zero reg bwt ag_* irace ismoke iht lwt ptl ftv if miss==0 & d<4/189 Source SS df MS Number of obs = F( 10, 166) = 490 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons reg bwt ag_* irace ismoke iht lwt ptl ftv if miss==0 & abs(dfits)<2*thresh Source SS df MS Number of obs = F( 10, 175) = 414 Model Prob > F = Residual R-squared =

9 Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons *Some influential observation that distort estimates *Robust and quantile regression rreg bwt ag_* irace ismoke iht lwt ptl ftv Robust regression Number of obs = 189 F( 10, 178) = 444 Prob > F = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons xi: qreg bwt ag_* irace ismoke iht lwt ptl ftv irace _Irace_1-3 (naturally coded; _Irace_1 omitted) ismoke _Ismoke_0-1 (naturally coded; _Ismoke_0 omitted) iht _Iht_0-1 (naturally coded; _Iht_0 omitted) Iteration 1: WLS sum of weighted deviations = Median regression Number of obs = 189 Raw sum of deviations (about 2977) Min sum of deviations Pseudo R2 = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ _Irace_ _Irace_ _Ismoke_ _Iht_ lwt ptl ftv _cons

10 *Final robust regression model xi: rreg bwt ag_* irace ismoke iht lwt iplt_2c ftv if miss==0 irace _Irace_1-3 (naturally coded; _Irace_1 omitted) ismoke _Ismoke_0-1 (naturally coded; _Ismoke_0 omitted) iht _Iht_0-1 (naturally coded; _Iht_0 omitted) iplt_2c _Iplt_2c_0-1 (naturally coded; _Iplt_2c_0 omitted) Robust regression Number of obs = 189 F( 10, 178) = 479 Prob > F = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ _Irace_ _Irace_ _Ismoke_ _Iht_ lwt _Iplt_2c_ ftv _cons testparm ag_* ( 1) ag_1 = 0 ( 2) ag_2 = 0 ( 3) ag_3 = 0 log close F( 3, 178) = 152 Prob > F =

Einführung II. Kontext und Mehr-Ebenen-Datensätze. Wiederholung Statistische Mehr-Ebenen-Modelle Politisches Vertrauen in Europa Fazit/Ausblick

Einführung II. Kontext und Mehr-Ebenen-Datensätze. Wiederholung Statistische Mehr-Ebenen-Modelle Politisches Vertrauen in Europa Fazit/Ausblick Einführung II Kontext und Mehr-Ebenen-Datensätze Kontext und Mehr-Ebenen-Datensätze Einführung II (1/28) Warum? Wiederholung Moderne Erklärungen = Mehr-Ebenen-Erklärungen Viele Datensätze sind strukturiert

Mehr

. * Beispiel 2: Anteil niederlaendischer Frauen ohne Konfession ( )

. * Beispiel 2: Anteil niederlaendischer Frauen ohne Konfession ( ) . * Beispiel 2: Anteil niederlaendischer Frauen ohne Konfession (1889-1969). use http://eswf.uni-koeln.de/daten/stata/kohorte.dta, clear. des Contains data from kohorte.dta obs: 48 vars: 36 15 May 2005

Mehr

Statistische Methoden der Lebensverlaufsforschung. Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften

Statistische Methoden der Lebensverlaufsforschung. Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften Statistische Methoden der Lebensverlaufsforschung Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften Lebensverlauf Deutschland, ca 1870 Johannes Giesecke Statistische

Mehr

ANOVA und Transformationen

ANOVA und Transformationen und Statistik II Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur Literatur für nächste

Mehr

ANOVA und Transformationen. Statistik II

ANOVA und Transformationen. Statistik II und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste

Mehr

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt. Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.

Mehr

Spezifikationsprobleme Omitted Variable Bias

Spezifikationsprobleme Omitted Variable Bias Spezifikationsprobleme Omitted Variable Bias Spezifikationsprobleme In der Grundgesamtheit gilt der wahre (aber unbekannte) Zusammenhang y = 0 + 1x 1 + : : : kx k dieser Zusammenhang soll anhand einer

Mehr

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1 FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die

Mehr

* Beispiel 1: Verkehrsunfaelle

* Beispiel 1: Verkehrsunfaelle * Beispiel 1: Verkehrsunfaelle. use "C:\hja\lehre\daten\wooldridge\stata\TRAFFIC2.DTA", clear. des Contains data from C:\hja\lehre\daten\wooldridge\stata\TRAFFIC2.DTA obs: 108 vars: 48 17 Aug 1999 23:02

Mehr

Das Lineare Regressionsmodell

Das Lineare Regressionsmodell Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Schäfer A & Schöttker-Königer T, Statistik für (2015) Arbeitsblatt 1 STATA Kapitel 8 Seite 1 Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon

Mehr

Klausur: Angewandte Ökonometrie. Termin: , 14:00 16:00. Prüfer: Prof. Dr. Hans-Jörg Schmerer. Datum:

Klausur: Angewandte Ökonometrie. Termin: , 14:00 16:00. Prüfer: Prof. Dr. Hans-Jörg Schmerer. Datum: Fakultät für Wirtschaftswissenschaft Lehrstuhl für Volkswirtschaftslehre, insb. Internationale Ökonomie Univ.-Prof. Dr. Hans-Jörg Schmerer Name: Vorname: Matrikel-Nr.: Klausur: 42270 Angewandte Ökonometrie

Mehr

Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung

Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Sommersemester 2007, 14082007, 16:30 18:30 Uhr Hinweise zur Klausur Die Klausur besteht

Mehr

Übungsblatt 10: Lineare Regression (Sitzung 11)

Übungsblatt 10: Lineare Regression (Sitzung 11) 1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede

Mehr

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09 Dr Sylvia Kaufmann Februar 2009 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 1 1 Gliederung Zeitreihenökonometrie Einführung

Mehr

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression. Woche 11: Multiple lineare Regression Patric Müller Teil XIII Multiple lineare Regression ETHZ WBL 17/19, 10.07.017 Wahrscheinlichkeit und Statistik Patric Müller WBL

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse II: Lineare multiple Regression

Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse II: Lineare multiple Regression Institut für Soziologie Methoden 2 Regressionsanalyse II: Lineare multiple Regression Hinweise zur Hausarbeit Abgabe bis 07.08.2017 bis 23 Uhr als PDF-Datei per E-Mail an methoden2@soziologie.uni-muenchen.de

Mehr

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle

Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit 2. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle In vielen Untersuchungen soll eine komplexere Beziehungsstruktur untersucht werden.

Mehr

Kovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen

Kovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen Kovarianzanalyse 1 metrische und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Lineare Modelle (2. Teil) Wie läßt sich die Abhängigkeit einer metrischen Variablen von

Mehr

Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik

Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz und Jens Kolbe Econ Boot Camp 2013 SFB 649 Ökonomisches Risiko Immo ist wichtig 2 Economist, 2002 Krise, 2008 Immo

Mehr

Übungsblatt 3: Multivariate Analyseverfahren

Übungsblatt 3: Multivariate Analyseverfahren Prof Bernd Fitzenberger, PhD Ute Leuschner Übung zur Veranstaltung Empirische Wirtschaftsforschung Albert-Ludwigs-Universität Freiburg Sommersemester 2012 Übungsblatt 3: Multivariate Analyseverfahren Für

Mehr

Längsschnittanalyse kategorialer Daten

Längsschnittanalyse kategorialer Daten Längsschnittanalyse kategorialer Daten Datenaufbereitung Als Beispiel verwende ich den Datensatz über Gewerkschaftsmitgliedschaften, den wir auch in einer Übung verwendet haben. Zunächst schneide ich mir

Mehr

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56

Mehr

Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse I: Lineare Regression

Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse I: Lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Lineare Regression Organisatorisches Hausarbeitsgruppen: Aktueller Stand der Gruppenbildung Bitte bis spätestens 03.07.2017 die Gruppenzusammensetzung

Mehr

Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik

Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz und Martin Wersing Econ Boot Camp 2010 SFB 649 Ökonomisches Risiko Gute Vorsätze: Herz & Kopf & Hand Lernziel: Immotheorie

Mehr

Einfache Modelle für Paneldaten. Statistik II

Einfache Modelle für Paneldaten. Statistik II Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)

Mehr

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode? Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2

Mehr

Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik. Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko

Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik. Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko Gute Vorsätze: Herz & Kopf & Hand Lernziel: Immotheorie + Daten

Mehr

Multiple Regression III

Multiple Regression III Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen

Mehr

Empirische Wirtschaftsforschung in R

Empirische Wirtschaftsforschung in R Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre

Mehr

Wiederholungsklausur zur Vorlesung Empirische Wirtschaftsforschung (Bachelor)

Wiederholungsklausur zur Vorlesung Empirische Wirtschaftsforschung (Bachelor) Prof Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Wiederholungsklausur zur Vorlesung Empirische Wirtschaftsforschung (Bachelor) Sommersemester 2012, 07092012, 12:00 13:30 Uhr Hinweise zur Klausur

Mehr

Lineare Regression in R, Teil 1

Lineare Regression in R, Teil 1 Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus

Mehr

MEHR ALS LINEAR ODER LOGISTISCH?

MEHR ALS LINEAR ODER LOGISTISCH? MEHR ALS LINEAR ODER LOGISTISCH? QUANTILS EN UND ADAPTIVE SPLINES IN SAS MIHAI PAUNESCU QUANTILE proc univariate data=dat; ods select moments quantiles; var sales; Basic Statistical Measures Location Variability

Mehr

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer

Mehr

Modellspezifikationen Nichtlinearitäten

Modellspezifikationen Nichtlinearitäten Modellspezifikationen Nichtlinearitäten Agenda Dummy-Variablen Interaktionseffekte (quadratische Effekte / Polynome) Dummy Interaktion Logarithmierte Variablen Wachstumsraten / Semielastizitäten Elastizitäten

Mehr

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte) Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf

Mehr

Zeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung.

Zeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung. Statistik II 1 Literatur 2 -Daten Trends und Saisonalität Fehlerstruktur 3 Statistik II (1/31) Literatur Zum Nachlesen Wooldridge ch 101 & 102 Statistik II (2/31) Literatur Für nächste Woche Einfache für

Mehr

Countdata, Postestimation und Modellvergleich

Countdata, Postestimation und Modellvergleich Countdata, Statistik II 1 Literatur 2 3 4 Statistik II Countdata (1/29) Literatur Zum Nachlesen Für heute: Scott/Freese ch. 8 Für nächste Woche: Wooldridge Kapitel 10.1 und 10.2 (im Reader) Statistik II

Mehr

. // Ben Jann, 2. Mai version clear all. . set linesize set type double. . set more off

. // Ben Jann, 2. Mai version clear all. . set linesize set type double. . set more off // Ben Jann, jann@sozunibech, 2 Mai 2014 version 121 clear all set linesize 100 set type double set more off /*---------------------------------------------------------------------------*/ /* Experiment

Mehr

Logistische Regression

Logistische Regression Logistische Regression Teil 2: Beispiel Dirk Enzmann Fortgeschrittene quantitative Methoden der Kriminologie 29.04.206 Universität Hamburg Dirk Enzmann (Hamburg) Logistische Regression UHH, 29.04.206 /

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

Übungsblatt 4: Multivariate Analyseverfahren

Übungsblatt 4: Multivariate Analyseverfahren Prof Bernd Fitzenberger, PhD Dr Roland Füss Übung zur Veranstaltung Empirische Wirtschaftsforschung Aderonke Osikominu Albert-Ludwigs-Universität Freiburg Mehdi Hosseinkouchack Wintersemester 2007/08 Übungsblatt

Mehr

Analyse von Querschnittsdaten. Heteroskedastizität

Analyse von Querschnittsdaten. Heteroskedastizität Analyse von Querschnittsdaten Heteroskedastizität Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse

Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen

Mehr

AMOS/SPSS output. One-factor model (9-item version)

AMOS/SPSS output. One-factor model (9-item version) One-factor model (9-item version) Fit Summary AMOS/SPSS output Default model 18 1817,639 27,000 67,320 Saturated model 45,000 0 Independence model 9 14251,254 36,000 395,868 Default model,872,830,874,832,874

Mehr

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Ein Modell für den Weltmarkt von Kupfer

Ein Modell für den Weltmarkt von Kupfer Draft 1 Ein Modell für den Weltmarkt von Kupfer siehe Estimating and Forecasting Industry Demand for Price-Taking Firms, aus: Thomas, Maurice: Managerial Economics, 9/e http://highered.mcgraw-hill.com/sites/dl/free/0073402818/459485/tho02818_mod3_web.pdf

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander

Mehr

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne). Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den

Mehr

Missing Data. Regressionsmodelle für Politikwissenschaftler. Wiederholung Missing Data

Missing Data. Regressionsmodelle für Politikwissenschaftler. Wiederholung Missing Data Regressionsmodelle für Politikwissenschaftler TSCS Regression in Stata Struktur definieren:. xtset id year panel variable: time variable: delta: id (strongly balanced) year, 1996 to 2004, but with gaps

Mehr

Countdata, Postestimation und Modellvergleich. Statistik II

Countdata, Postestimation und Modellvergleich. Statistik II Countdata, Statistik II Wiederholung/Fortsetzung Literatur Postestimation Modellvergleich Statistik II Countdata (1/29) Literatur Zum Nachlesen Für heute: Scott/Freese ch. 8 Für nächste Woche: Wooldridge

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

Determinanten der Fremdenfeindlichkeit

Determinanten der Fremdenfeindlichkeit Christian-Albrechts-Universität zu Kiel Institut für Sozialwissenschaften Bereich Soziologie Sommersemester 2014 Seminar: Design und Datenerhebung/ Datenauswertung Dipl.-Soz. Saskia Maria Fuchs Determinanten

Mehr

Panelregression (und Mehrebenenanwendungen)

Panelregression (und Mehrebenenanwendungen) Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007

Mehr

Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold

Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold Statistik IV 3. Datenaufbereitung II und erste Auswertungen Dozent: Jürgen Leibold 1 Terminplanung Nr. Termin Inhalt 1 14.04.09 Einführung Organisatorisches und Scheinvoraussetzungen Statistik mit Softwareunterstützung?

Mehr

Multiple Regression. Statistik II

Multiple Regression. Statistik II Statistik II Übersicht Wiederholung Literatur Regression Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit

Mehr

Zur Erinnerung: Annahmen

Zur Erinnerung: Annahmen Zur Erinnerung: Annahmen Vorlesung 6: Heteroskedastizität. Beispiele mit heteroskedastischen Fehlertermen. Auswirkungen von Heteroskedastizität auf OLS-Schätzungen. Wie erkennt man das Vorliegen von Heteroskedastizität?

Mehr

Musterlösung zu Serie 2

Musterlösung zu Serie 2 Dr. Lukas Meier Varianzanalyse und Versuchsplanung HS 2017 Musterlösung zu Serie 2 1. a) We use summary() to display a summary of the data. > d.stream

Mehr

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander

Mehr

Probeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden!

Probeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden! Probeklausur EW II Bitte schreiben Sie Ihre Antworten in die Antwortfelder bzw. markieren Sie die zutreffenden Antworten deutlich in den dafür vorgesehenen Kästchen. Wenn Sie bei einer Aufgabe eine nicht-zutreffende

Mehr

Mittelwerte, Zusammenhangsmaße, Hypothesentests in Stata

Mittelwerte, Zusammenhangsmaße, Hypothesentests in Stata Mittelwerte,, in Stata Statistik II Statistik II Mittelwerte,, (1/30) Wiederholung: Daten & Deskriptive Statistik Statistik II Mittelwerte,, (2/30) Daten verwalten Datenmatrix aus Fällen (Zeilen) und Variablen

Mehr

Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS)

Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Vorbereitungen Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Falls das R - Paket car noch nicht installiert wurde, kann dies mit der Funktion install.packages() erledigt werden. install.packages("car")

Mehr

Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung

Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Prof Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Sommersemester 2012, 24072012, 8:00 9:30 Uhr Hinweise zur Klausur Die Klausur

Mehr

Fragen zum zweiten Teil der Vorlesung

Fragen zum zweiten Teil der Vorlesung Albert-Ludwigs-Universität Freiburg Ökonometrie (Bachelor) Lehrstuhl Prof. Fitzenberger, Ph.D. WS 2011/12 Fragen zum zweiten Teil der Vorlesung 1. Es soll geprüt werden, ob das obere Quartil (das 75%-Quantil)

Mehr

Mittelwerte, Zusammenhangsmaße, Hypothesentests in Stata

Mittelwerte, Zusammenhangsmaße, Hypothesentests in Stata Mittelwerte,, Hypothesentests in Stata Statistik II Statistik II Mittelwerte,, Hypothesentests (1/30) Wiederholung: Daten & Deskriptive Statistik Zwei nominale Variablen Zwei ordinale Variablen Nominal/intervallskalierte

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

Vorlesung 7: Zwischenresümee

Vorlesung 7: Zwischenresümee Vorlesung 7: Zwischenresümee 1. Nachträge zur letzten Sitzung (Heteroskedastizität) 2. Nicht-lineare Funktionen (with a little help from Stata) 3. Darstellung der Ergebnisse einer Regressionsanalyse Tabellen

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse)

Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse) Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse) Aufgabe H: Für diese Analyse verwenden wir Daten aus dem Current Population Survey 1991 USamerikanischer Haushalte,

Mehr

Kurs Empirische Wirtschaftsforschung

Kurs Empirische Wirtschaftsforschung Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische

Mehr

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Schweizer Statistiktage, Aarau, 18. Nov. 2004 Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der

Mehr

Statistik II für Betriebswirte Vorlesung 8

Statistik II für Betriebswirte Vorlesung 8 Statistik II für Betriebswirte Vorlesung 8 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 3. Dezember 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 8 Version:

Mehr

6. Tutoriumsserie Statistik II

6. Tutoriumsserie Statistik II 6. Tutoriumsserie Statistik II 1. Aufgabe: Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktmenge y und Gesamtkosten

Mehr

Übung Statistik I Statistik mit Stata SS Wiederholung und Probeklausur

Übung Statistik I Statistik mit Stata SS Wiederholung und Probeklausur Übung Statistik I Statistik mit Stata SS07 04.06.2007 7. Wiederholung und Probeklausur Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata -

Mehr

5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen)

5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen) 5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen) Bringen Sie alles mit, was Ihnen helfen kann die letzte Aufgabe zu lösen: Taschenrechner, Laptop, Tafelwerke, oder.... Installieren Sie z.b.

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

6.2 Lineare Regression

6.2 Lineare Regression 6.2 Lineare Regression Einfache lineare Regression (vgl. Kap. 4.7) Y i = θ 0 + θ 1 X i + ǫ i ǫ i (0, σ 2 ) ˆθ 1 ˆθ 0 = S XY S 2 X = 1 ( Yi n ˆθ ) 1 Xi als Lösung der Minimumaufgabe n (Y i θ 1 X 1 θ 0 )

Mehr

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik

Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN SS 97 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik 15 45

Mehr

Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018

Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018 Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018 Aufgabe 3: Die Datei WAGES2.DTA enthält Daten einer Stichprobe von 935 männlichen US-amerikanischen Arbeitnehmern im Alter von 28 bis 38 Jahren.

Mehr

Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für Gesundheitsfachberufe (2015) ISBN

Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für Gesundheitsfachberufe (2015) ISBN Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (25) Arbeitsblatt STATA Kapitel 6 Seite Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Aufgabe 1 (20 Punkte) Sei y = Xβ + ε ein N 1 Vektor und X eine N K Matrix.

Mehr

Technische Universität München Zentrum Mathematik Sommersemester Juli 2005 Arbeitszeit 60 Minuten

Technische Universität München Zentrum Mathematik Sommersemester Juli 2005 Arbeitszeit 60 Minuten Name: Frau Herr (nichtzutreffendes bitte streichen) Fachrichtung geb. am (Tag/Mon/Jahr) Semestralklausur aus Praktikum BWL-Statistik Technische Universität München Zentrum Mathematik Sommersemester 2005

Mehr

Logistische Regression

Logistische Regression Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum

Mehr

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen:

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: Gesamtpunktzahl: 96 Pobeklausur: Einführung in die Ökonometrie 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: cigs: gerauchte Zigaretten pro Tag educ: Bildung

Mehr

STATA II: Daten- und Analysevorbereitung (Teil 1)

STATA II: Daten- und Analysevorbereitung (Teil 1) STATA II: Daten- und Analysevorbereitung (Teil 1) 10. November 2003 Wiederholung I K:\mo14-16 Aufgaben: 1. Stellen Sie den aktuell gültigen Pfad \data fest und wechseln Sie in das \project1 Verzeichnis

Mehr

6.4 Kointegration Definition

6.4 Kointegration Definition 6.4 Kointegration 6.4.1 Definition Nach Engle und Granger (1987): Wenn zwei oder mehrere Variablen I(1) sind, eine Linearkombination davon jedoch I() ist, dann sind die Variablen kointegriert. Allgemein:

Mehr

Klausur zur Vorlesung: Einführung in die Empirische Wirtschaftsforschung. Prof. Bernd Fitzenberger, Ph.D. WS 2010/11. Mittwoch, 16.

Klausur zur Vorlesung: Einführung in die Empirische Wirtschaftsforschung. Prof. Bernd Fitzenberger, Ph.D. WS 2010/11. Mittwoch, 16. Klausur zur Vorlesung: Einführung in die Empirische Wirtschaftsforschung Prof. Bernd Fitzenberger, Ph.D. WS 2010/11 Mittwoch, 16. Februar 2011 Die folgenden drei Aufgaben sind alle zu bearbeiten. Die insgesamt

Mehr

Supply Chain Management

Supply Chain Management Supply Chain Management Forecasting Methods Prof. Dr.-Ing. Burkhard Schmager Department of Industrial Engineering EAH Jena Sept 2016 SS 2016 Kapitel 2-1 Material Planning Approaches MRP - methods deterministical

Mehr

Statistics, Data Analysis, and Simulation SS 2015

Statistics, Data Analysis, and Simulation SS 2015 Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler

Mehr

Heteroskedastie. Test auf Heteroskedastie. Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist.

Heteroskedastie. Test auf Heteroskedastie. Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist. Heteroskedastie Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist. Beispiele: Bei Zeitreihendaten : Ansteigen der Varianz über die Zeit, Anstieg der Varianz mit

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Regressionsanalyse in R

Regressionsanalyse in R Regressionsanalyse in R Session 6 1 Einfache Regression Lineare Regression ist eines der nützlichsten Werkzeuge in der Statistik. Regressionsanalyse erlaubt es Zusammenhänge zwischen Parametern zu schätzen

Mehr

Lösung 10 / Dirk Enzmann, UHH SS2013 Monday June 24 21:39: Page 1

Lösung 10 / Dirk Enzmann, UHH SS2013 Monday June 24 21:39: Page 1 Lösung 10 / Dirk Enzmann, UHH SS2013 Monday June 24 21:39:06 2013 Page 1 name:

Mehr