SHIP/KEF-Richtlinien zur Durchführung qualitätsgesicherter
|
|
- Alma Ziegler
- vor 5 Jahren
- Abrufe
Transkript
1 Sebastian E Baumeister, Carsten-Oliver Schmidt, Till Ittermann, Henry Völzke Version SHIP/KEF-Richtlinien zur Durchführung qualitätsgesicherter Auswertungen 1 Für Auswertungsprojekte ist im Regelfall ein bewilligter Datennutzungsantrag erforderlich 2 Vor Beginn der Analysen ist ein Analyseplan zu erstellen Dieser ist zumindest zwischen Erst-, Zweit- und Letztautor abzustimmen 3 Variablendefinitionen und statistische Analysen sind vollständig in Programmen (zb Stata-Do-Files und Log-Files) zu dokumentieren Diese Programme sind vor Ersteinreichung des Manuskripts an den Leiter des Publikationskomitees zu schicken (siehe Appendix mit Beispielanalysen) 4 Die Log-Files, die alle Variablendefinitionen und statistischen Analysen beinhalten, sind durch eine zweite Person zu kontrollieren Hierzu erfolgt insbesondere ein Abgleich mit den Tabellen des Manuskripts 5 Die Analysen sind sachgerecht durchzuführen, dies umfasst: die Auswertungen mit adäquaten statistischen Verfahren und die Überprüfung der Annahmen der verwendeten Verfahren [1,2,3] Bei erheblicher Verletzung der Annahmen sind die Analysen entsprechend anzupassen Die Überprüfung der Annahmen ist ebenfalls im Do- und Log-File zu dokumentieren
2 Appendix Allgemeine Hinweise In der Regel stehen die Ergebnisse von Regressionsmodellen in einem Auswertungsprojekt im Vordergrund Bei der Schätzung von Regressionsmodellen ist sicherzustellen, dass die zugrundeliegenden Annahmen erfüllt sind [1,2,3] Substantielle Verletzungen dieser Annahmen können zu Verzerrungen der Schätzer (Koeffizienten, P- Werte, Konfidenzintervalle, etc) führen Wichtige Annahmen im Rahmen klassischer Regressionsmodellen umfassen: a Normalverteilung der Residuen b Linearität c Homoskedaszität d Einflussreiche Beobachtungen e Unabhängigkeit der Residuen f Missing completely at random (MCAR) Annahme bei fehlenden Werten und Ausfällen Hinweise zur Kovariablen-Auswahl Die Berücksichtigung und Auswahl von Kovariablen in einem Regressionsmodell kann unterschiedliche Ziele verfolgen Grundsätzlich ist zwischen Konfounder- und Prädiktionsmodellen zu differenzieren [1,2,3] Im Konfoundermodell steht der Zusammenhang zwischen Exposure und Outcome im Vordergrund Die Auswahl zu adjustierender Konfounder erfolgt theoriegeleitet (zb mittels kausaler Grafen) oder anhand empirischer Kriterien (zb 15%-Change-in-Coefficient) [4] Bei der Entwicklung von Prädiktionsmodellen [3] kommen die theoriegeleitete und empirisch-automatisierte Selektion (wie Stepwise-Verfahren) zur Anwendung [3] Quellen: 1 Vittinghoff et al 2005 Regression Methods in Biostatistics 2 Harrell 2001 Regression Modeling Strategies 3 Steyerberg 2010 Clinical Prediction Models 4 Rothman, Grennland, Lash 2008 Modern Epidemiology Beispielsyntax und Log-File für die Durchführung und Überprüfung einer Regressionsanalyse Das folgende Beispiel dient zur Illustration von Do- und Log-Dateien Analysiert werden Korrelate des Geburtsgewichts mittels linearer Regression 1 Log-File zur Variablendefinition ** Sebastian Baumeister ** Titel of project: Maternal correlates of birth weight ** Pfad: E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\ glo bw "E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\" 2
3 *Load original dataset and save under new name ******************** use clear (Hosmer & Lemeshow data) save "$bw\bw_smokingdta", replace file E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\\bw_smokingdta saved codebook, c Variable Obs Unique Mean Min Max Label id identification code low birth weight<2500g age age of mother lwt weight at last menstrual period race race smoke smoked during pregnancy ptl premature labor history (count) ht has history of hypertension ui presence, uterine irritability ftv number of visits to physician during 1st trimester bwt birth weight (grams) white race==white black race==black other race==other ptd lwd * Define new outcome variables ************ Low birth weight recode bwt (min/2500=1) ( /max=0), gen(lowbwt) (189 differences between bwt and lowbwt) label variable lowbwt "birth weight" label define lowbwt 1 "1,birth weight<2500g" 0 "0,birth weight>=2500" label value lowbwt lowbwt *Covariables ************ * Age groups recode age (min/19=1) (20/23=2) (24/26=3) (27/max=4) (=), gen(age4) (189 differences between age and age4) save, replace file E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\\bw_smokingdta saved log close Der 2 Log-File unten veranschaulicht das Vorgehen bei der Durchführung und Überprüfung der Annahmen der linearen ( kleinste Quadrate ) Regression 2 Log-File zur Auswertung ** Sebastian Baumeister ** Titel of project: Maternal correlates of birth weight ** Pfad: E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\ glo bw "E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\" use "$bw\bw_smokingdta", clear (Hosmer & Lemeshow data) des, sh Contains data from E:\Arbeit\Greifswald\ship_statistik\Richtlinie zur Durchführung von Auswertungen\data\\bw_smokingdta obs: 189 Hosmer & Lemeshow data 3
4 vars: Jan :15 size: 5,292 Sorted by: * Analytical sample *********************** glo out bwt glo cov age lwt race smoke ptl ht ui ftv tabmiss $out $cov Variable Obs Missings FeqMissings NonMiss FeqNonMiss bwt age lwt race smoke ptl ht ui ftv egen nm=rowmiss($out $cov) fre nm nm Freq Percent Valid Cum Valid recode nm (0=0) (1/max=1),gen(miss) (0 differences between nm and miss) * No missing values on any variable included in the (regression analyses) * Table 1: Characteritics of the mothers ************************ tabstat age lwt ptl ftv if miss==0, s(n median p25 p75 mean sd) c(s) variable N p50 p25 p75 mean sd age lwt ptl ftv fre race smoke ht ui if miss==0 race -- race -- Freq Percent Valid Cum Valid 1 white black other Total smoke -- smoked during pregnancy Freq Percent Valid Cum Valid Total ht -- has history of hypertension Freq Percent Valid Cum
5 Valid Total ui -- presence, uterine irritability Freq Percent Valid Cum Valid Total * Table 2: Correlates of birth weight ************************ reg bwt age irace ismoke iht lwt ptl ftv if miss==0 Source SS df MS Number of obs = F( 8, 180) = 509 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] age race smoke ht lwt ptl ftv _cons * Test of linear regression (OLS) assumptions ************************** * Normality of residuals: looks fine ***** predict r, res kdensity r, norm qnorm r pnorm r * Homoscedasticity: looks fine ***** estat hettest age irace ismoke iht lwt ptl ftv, iid Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: age irace ismoke iht lwt ptl ftv chi2(8) = 745 Prob > chi2 = rvfplot, yline(0) * Linearity ***** * Age - looks nonlinear, modeled using restricted cubic splines twoway (scatter bwt age) (lfit bwt age) (lowess bwt age) (fpfit bwt age) acprplot age, lowess lsopts(bwidth(1)) 5
6 centile age if miss==0, c( ) -- Binom Interp -- Variable Obs Percentile Centile [95% Conf Interval] age mkspline2 ag_=age, cubic knots( ) dis knot1 knot2 knot3 knot age * Weight at last menstrual period - looks linear twoway (scatter bwt lwt) (lfit bwt lwt) (lowess bwt lwt) /*(fpfit bwt lwt)*/ * premature labor history twoway (scatter bwt ptl) (lfit bwt ptl) (lowess bwt ptl) /*(fpfit bwt lwt)*/ fre ptl ptl -- premature labor history (count) Freq Percent Valid Cum Valid Total *only few subjects with premature labor history >1 therefore recode with new variables values 0 and 1+ recode ptl (0=0 "0,zero") (1/3=1 "1,1+"), gen(plt_2c) (6 differences between ptl and plt_2c) * Collinearity - not an issue ***** vif Variable VIF 1/VIF age race smoke ht lwt ptl ftv Mean VIF 117 collin bwt age race smoke ht lwt plt_2c ftv if miss==0 (obs=189) Collinearity Diagnostics SQRT R- Variable VIF VIF Tolerance Squared bwt age race smoke ht lwt plt_2c ftv Mean VIF 118 6
7 Cond Eigenval Index Condition Number Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept) Det(correlation matrix) * Omitted variables / exogeneity -> not suspected ***** linktest Source SS df MS Number of obs = F( 2, 186) = 2123 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] _hat _hatsq _cons estat ovtest Ramsey RESET test using powers of the fitted values of bwt Ho: model has no omitted variables F(3, 177) = 149 Prob > F = * Influential observations ***** *Cookd distance > 4/N reg bwt ag_* irace ismoke iht lwt ptl ftv if miss==0 Source SS df MS Number of obs = F( 10, 178) = 464 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons
8 predict d, cooksd li bwt age race smoke ht lwt plt_2c ftv if d>4/ bwt age race smoke ht lwt plt_2c ftv white ,zero other , white , white ,zero black ,zero black ,zero white ,zero other , white ,zero black ,zero other , black ,zero *dfits > 2*sqrt(k/N) predict dfits, dfits quiet scalar thresh=2*sqrt((e(df_m)+1)/e(n)) di "dfits threshold=" %63f thresh dfits threshold= 0482 li dfits bwt age race smoke ht lwt plt_2c ftv if abs(dfits)>2*thresh & e(sample) dfits bwt age race smoke ht lwt plt_2c ftv white , white ,zero black ,zero reg bwt ag_* irace ismoke iht lwt ptl ftv if miss==0 & d<4/189 Source SS df MS Number of obs = F( 10, 166) = 490 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons reg bwt ag_* irace ismoke iht lwt ptl ftv if miss==0 & abs(dfits)<2*thresh Source SS df MS Number of obs = F( 10, 175) = 414 Model Prob > F = Residual R-squared =
9 Adj R-squared = Total Root MSE = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons *Some influential observation that distort estimates *Robust and quantile regression rreg bwt ag_* irace ismoke iht lwt ptl ftv Robust regression Number of obs = 189 F( 10, 178) = 444 Prob > F = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ race smoke ht lwt ptl ftv _cons xi: qreg bwt ag_* irace ismoke iht lwt ptl ftv irace _Irace_1-3 (naturally coded; _Irace_1 omitted) ismoke _Ismoke_0-1 (naturally coded; _Ismoke_0 omitted) iht _Iht_0-1 (naturally coded; _Iht_0 omitted) Iteration 1: WLS sum of weighted deviations = Median regression Number of obs = 189 Raw sum of deviations (about 2977) Min sum of deviations Pseudo R2 = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ _Irace_ _Irace_ _Ismoke_ _Iht_ lwt ptl ftv _cons
10 *Final robust regression model xi: rreg bwt ag_* irace ismoke iht lwt iplt_2c ftv if miss==0 irace _Irace_1-3 (naturally coded; _Irace_1 omitted) ismoke _Ismoke_0-1 (naturally coded; _Ismoke_0 omitted) iht _Iht_0-1 (naturally coded; _Iht_0 omitted) iplt_2c _Iplt_2c_0-1 (naturally coded; _Iplt_2c_0 omitted) Robust regression Number of obs = 189 F( 10, 178) = 479 Prob > F = bwt Coef Std Err t P>t [95% Conf Interval] ag_ ag_ ag_ _Irace_ _Irace_ _Ismoke_ _Iht_ lwt _Iplt_2c_ ftv _cons testparm ag_* ( 1) ag_1 = 0 ( 2) ag_2 = 0 ( 3) ag_3 = 0 log close F( 3, 178) = 152 Prob > F =
Einführung II. Kontext und Mehr-Ebenen-Datensätze. Wiederholung Statistische Mehr-Ebenen-Modelle Politisches Vertrauen in Europa Fazit/Ausblick
Einführung II Kontext und Mehr-Ebenen-Datensätze Kontext und Mehr-Ebenen-Datensätze Einführung II (1/28) Warum? Wiederholung Moderne Erklärungen = Mehr-Ebenen-Erklärungen Viele Datensätze sind strukturiert
. * Beispiel 2: Anteil niederlaendischer Frauen ohne Konfession ( )
. * Beispiel 2: Anteil niederlaendischer Frauen ohne Konfession (1889-1969). use http://eswf.uni-koeln.de/daten/stata/kohorte.dta, clear. des Contains data from kohorte.dta obs: 48 vars: 36 15 May 2005
Statistische Methoden der Lebensverlaufsforschung. Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften
Statistische Methoden der Lebensverlaufsforschung Prof. Dr. Johannes Giesecke Humboldt-Universität zu Berlin Institut für Sozialwissenschaften Lebensverlauf Deutschland, ca 1870 Johannes Giesecke Statistische
ANOVA und Transformationen
und Statistik II Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur Literatur für nächste
ANOVA und Transformationen. Statistik II
und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste
Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.
Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.
Spezifikationsprobleme Omitted Variable Bias
Spezifikationsprobleme Omitted Variable Bias Spezifikationsprobleme In der Grundgesamtheit gilt der wahre (aber unbekannte) Zusammenhang y = 0 + 1x 1 + : : : kx k dieser Zusammenhang soll anhand einer
FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1
FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die
* Beispiel 1: Verkehrsunfaelle
* Beispiel 1: Verkehrsunfaelle. use "C:\hja\lehre\daten\wooldridge\stata\TRAFFIC2.DTA", clear. des Contains data from C:\hja\lehre\daten\wooldridge\stata\TRAFFIC2.DTA obs: 108 vars: 48 17 Aug 1999 23:02
Das Lineare Regressionsmodell
Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines
Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung
Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über
Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Schäfer A & Schöttker-Königer T, Statistik für (2015) Arbeitsblatt 1 STATA Kapitel 8 Seite 1 Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon
Klausur: Angewandte Ökonometrie. Termin: , 14:00 16:00. Prüfer: Prof. Dr. Hans-Jörg Schmerer. Datum:
Fakultät für Wirtschaftswissenschaft Lehrstuhl für Volkswirtschaftslehre, insb. Internationale Ökonomie Univ.-Prof. Dr. Hans-Jörg Schmerer Name: Vorname: Matrikel-Nr.: Klausur: 42270 Angewandte Ökonometrie
Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung
Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Sommersemester 2007, 14082007, 16:30 18:30 Uhr Hinweise zur Klausur Die Klausur besteht
Übungsblatt 10: Lineare Regression (Sitzung 11)
1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede
1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.
Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09 Dr Sylvia Kaufmann Februar 2009 Angewandte Ökonometrie, Sylvia Kaufmann, FS09 1 1 Gliederung Zeitreihenökonometrie Einführung
Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.
Woche 11: Multiple lineare Regression Patric Müller Teil XIII Multiple lineare Regression ETHZ WBL 17/19, 10.07.017 Wahrscheinlichkeit und Statistik Patric Müller WBL
Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen
Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit
Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse II: Lineare multiple Regression
Institut für Soziologie Methoden 2 Regressionsanalyse II: Lineare multiple Regression Hinweise zur Hausarbeit Abgabe bis 07.08.2017 bis 23 Uhr als PDF-Datei per E-Mail an methoden2@soziologie.uni-muenchen.de
Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit. 21. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle
Forschungspraktikum Gruppenbezogene Menschenfeindlichkeit 2. Juni 2007: Pfadanalyse und lineare Strukturgleichungsmodelle In vielen Untersuchungen soll eine komplexere Beziehungsstruktur untersucht werden.
Kovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen
Kovarianzanalyse 1 metrische und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Lineare Modelle (2. Teil) Wie läßt sich die Abhängigkeit einer metrischen Variablen von
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz und Jens Kolbe Econ Boot Camp 2013 SFB 649 Ökonomisches Risiko Immo ist wichtig 2 Economist, 2002 Krise, 2008 Immo
Übungsblatt 3: Multivariate Analyseverfahren
Prof Bernd Fitzenberger, PhD Ute Leuschner Übung zur Veranstaltung Empirische Wirtschaftsforschung Albert-Ludwigs-Universität Freiburg Sommersemester 2012 Übungsblatt 3: Multivariate Analyseverfahren Für
Längsschnittanalyse kategorialer Daten
Längsschnittanalyse kategorialer Daten Datenaufbereitung Als Beispiel verwende ich den Datensatz über Gewerkschaftsmitgliedschaften, den wir auch in einer Übung verwendet haben. Zunächst schneide ich mir
Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56
Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse I: Lineare Regression
Institut für Soziologie Methoden 2 Regressionsanalyse I: Lineare Regression Organisatorisches Hausarbeitsgruppen: Aktueller Stand der Gruppenbildung Bitte bis spätestens 03.07.2017 die Gruppenzusammensetzung
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz und Martin Wersing Econ Boot Camp 2010 SFB 649 Ökonomisches Risiko Gute Vorsätze: Herz & Kopf & Hand Lernziel: Immotheorie
Einfache Modelle für Paneldaten. Statistik II
Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)
X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?
Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik. Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko
Wieviel ist (m)ein Haus wert? - Immobilienbewertung mit Hilfe der Statistik Axel Werwatz Econ Boot Camp 2012 SFB 649 Ökonomisches Risiko Gute Vorsätze: Herz & Kopf & Hand Lernziel: Immotheorie + Daten
Multiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
Empirische Wirtschaftsforschung in R
Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre
Wiederholungsklausur zur Vorlesung Empirische Wirtschaftsforschung (Bachelor)
Prof Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Wiederholungsklausur zur Vorlesung Empirische Wirtschaftsforschung (Bachelor) Sommersemester 2012, 07092012, 12:00 13:30 Uhr Hinweise zur Klausur
Lineare Regression in R, Teil 1
Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus
MEHR ALS LINEAR ODER LOGISTISCH?
MEHR ALS LINEAR ODER LOGISTISCH? QUANTILS EN UND ADAPTIVE SPLINES IN SAS MIHAI PAUNESCU QUANTILE proc univariate data=dat; ods select moments quantiles; var sales; Basic Statistical Measures Location Variability
11. Übungsblatt zur Vorlesung Ökonometrie SS 2014
Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer
Modellspezifikationen Nichtlinearitäten
Modellspezifikationen Nichtlinearitäten Agenda Dummy-Variablen Interaktionseffekte (quadratische Effekte / Polynome) Dummy Interaktion Logarithmierte Variablen Wachstumsraten / Semielastizitäten Elastizitäten
Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)
Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf
Zeitreihen. Statistik II. Literatur. Zeitreihen-Daten Modelle Probleme Trends und Saisonalität Fehlerstruktur. 1 Wiederholung.
Statistik II 1 Literatur 2 -Daten Trends und Saisonalität Fehlerstruktur 3 Statistik II (1/31) Literatur Zum Nachlesen Wooldridge ch 101 & 102 Statistik II (2/31) Literatur Für nächste Woche Einfache für
Countdata, Postestimation und Modellvergleich
Countdata, Statistik II 1 Literatur 2 3 4 Statistik II Countdata (1/29) Literatur Zum Nachlesen Für heute: Scott/Freese ch. 8 Für nächste Woche: Wooldridge Kapitel 10.1 und 10.2 (im Reader) Statistik II
. // Ben Jann, 2. Mai version clear all. . set linesize set type double. . set more off
// Ben Jann, jann@sozunibech, 2 Mai 2014 version 121 clear all set linesize 100 set type double set more off /*---------------------------------------------------------------------------*/ /* Experiment
Logistische Regression
Logistische Regression Teil 2: Beispiel Dirk Enzmann Fortgeschrittene quantitative Methoden der Kriminologie 29.04.206 Universität Hamburg Dirk Enzmann (Hamburg) Logistische Regression UHH, 29.04.206 /
Statistischer Rückschluss und Testen von Hypothesen
Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse
Übungsblatt 4: Multivariate Analyseverfahren
Prof Bernd Fitzenberger, PhD Dr Roland Füss Übung zur Veranstaltung Empirische Wirtschaftsforschung Aderonke Osikominu Albert-Ludwigs-Universität Freiburg Mehdi Hosseinkouchack Wintersemester 2007/08 Übungsblatt
Analyse von Querschnittsdaten. Heteroskedastizität
Analyse von Querschnittsdaten Heteroskedastizität Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004 03.11.2004
Institut für Soziologie Benjamin Gedon. Methoden 2. Kausalanalyse
Institut für Soziologie Methoden 2 Kausalanalyse Inhalt 1. Kausalanalyse 2. Anwendungsbeispiel 3. Wiederholung 4. Übungsaufgabe # 2 Kausalanalyse Kausalität: Identifizieren von Ursache-Wirkungs-Beziehungen
AMOS/SPSS output. One-factor model (9-item version)
One-factor model (9-item version) Fit Summary AMOS/SPSS output Default model 18 1817,639 27,000 67,320 Saturated model 45,000 0 Independence model 9 14251,254 36,000 395,868 Default model,872,830,874,832,874
Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:
Ein Modell für den Weltmarkt von Kupfer
Draft 1 Ein Modell für den Weltmarkt von Kupfer siehe Estimating and Forecasting Industry Demand for Price-Taking Firms, aus: Thomas, Maurice: Managerial Economics, 9/e http://highered.mcgraw-hill.com/sites/dl/free/0073402818/459485/tho02818_mod3_web.pdf
Biostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).
Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den
Missing Data. Regressionsmodelle für Politikwissenschaftler. Wiederholung Missing Data
Regressionsmodelle für Politikwissenschaftler TSCS Regression in Stata Struktur definieren:. xtset id year panel variable: time variable: delta: id (strongly balanced) year, 1996 to 2004, but with gaps
Countdata, Postestimation und Modellvergleich. Statistik II
Countdata, Statistik II Wiederholung/Fortsetzung Literatur Postestimation Modellvergleich Statistik II Countdata (1/29) Literatur Zum Nachlesen Für heute: Scott/Freese ch. 8 Für nächste Woche: Wooldridge
Beispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
Determinanten der Fremdenfeindlichkeit
Christian-Albrechts-Universität zu Kiel Institut für Sozialwissenschaften Bereich Soziologie Sommersemester 2014 Seminar: Design und Datenerhebung/ Datenauswertung Dipl.-Soz. Saskia Maria Fuchs Determinanten
Panelregression (und Mehrebenenanwendungen)
Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007
Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold
Statistik IV 3. Datenaufbereitung II und erste Auswertungen Dozent: Jürgen Leibold 1 Terminplanung Nr. Termin Inhalt 1 14.04.09 Einführung Organisatorisches und Scheinvoraussetzungen Statistik mit Softwareunterstützung?
Multiple Regression. Statistik II
Statistik II Übersicht Wiederholung Literatur Regression Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit
Zur Erinnerung: Annahmen
Zur Erinnerung: Annahmen Vorlesung 6: Heteroskedastizität. Beispiele mit heteroskedastischen Fehlertermen. Auswirkungen von Heteroskedastizität auf OLS-Schätzungen. Wie erkennt man das Vorliegen von Heteroskedastizität?
Musterlösung zu Serie 2
Dr. Lukas Meier Varianzanalyse und Versuchsplanung HS 2017 Musterlösung zu Serie 2 1. a) We use summary() to display a summary of the data. > d.stream
Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:
Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen
Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.
Biostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
Probeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden!
Probeklausur EW II Bitte schreiben Sie Ihre Antworten in die Antwortfelder bzw. markieren Sie die zutreffenden Antworten deutlich in den dafür vorgesehenen Kästchen. Wenn Sie bei einer Aufgabe eine nicht-zutreffende
Mittelwerte, Zusammenhangsmaße, Hypothesentests in Stata
Mittelwerte,, in Stata Statistik II Statistik II Mittelwerte,, (1/30) Wiederholung: Daten & Deskriptive Statistik Statistik II Mittelwerte,, (2/30) Daten verwalten Datenmatrix aus Fällen (Zeilen) und Variablen
Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS)
Vorbereitungen Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Falls das R - Paket car noch nicht installiert wurde, kann dies mit der Funktion install.packages() erledigt werden. install.packages("car")
Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung
Prof Dr Isabel Schnabel Johannes Gutenberg-Universität Mainz Abschlussklausur zur Vorlesung Empirische Wirtschaftsforschung Sommersemester 2012, 24072012, 8:00 9:30 Uhr Hinweise zur Klausur Die Klausur
Fragen zum zweiten Teil der Vorlesung
Albert-Ludwigs-Universität Freiburg Ökonometrie (Bachelor) Lehrstuhl Prof. Fitzenberger, Ph.D. WS 2011/12 Fragen zum zweiten Teil der Vorlesung 1. Es soll geprüt werden, ob das obere Quartil (das 75%-Quantil)
Mittelwerte, Zusammenhangsmaße, Hypothesentests in Stata
Mittelwerte,, Hypothesentests in Stata Statistik II Statistik II Mittelwerte,, Hypothesentests (1/30) Wiederholung: Daten & Deskriptive Statistik Zwei nominale Variablen Zwei ordinale Variablen Nominal/intervallskalierte
Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
Vorlesung 7: Zwischenresümee
Vorlesung 7: Zwischenresümee 1. Nachträge zur letzten Sitzung (Heteroskedastizität) 2. Nicht-lineare Funktionen (with a little help from Stata) 3. Darstellung der Ergebnisse einer Regressionsanalyse Tabellen
Varianzkomponentenschätzung
Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler
Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen
Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen
Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse)
Mikro-Ökonometrie, WS 2017/2018 Musterlösung von Aufgabe H(eckman sche Selection Bias Analyse) Aufgabe H: Für diese Analyse verwenden wir Daten aus dem Current Population Survey 1991 USamerikanischer Haushalte,
Kurs Empirische Wirtschaftsforschung
Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische
Schweizer Statistiktage, Aarau, 18. Nov. 2004
Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der
Statistik II für Betriebswirte Vorlesung 8
Statistik II für Betriebswirte Vorlesung 8 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 3. Dezember 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 8 Version:
6. Tutoriumsserie Statistik II
6. Tutoriumsserie Statistik II 1. Aufgabe: Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktmenge y und Gesamtkosten
Übung Statistik I Statistik mit Stata SS Wiederholung und Probeklausur
Übung Statistik I Statistik mit Stata SS07 04.06.2007 7. Wiederholung und Probeklausur Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata -
5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen)
5. Übung Datenanalyse und Statistik WS07/08 (Boogaart, Jansen) Bringen Sie alles mit, was Ihnen helfen kann die letzte Aufgabe zu lösen: Taschenrechner, Laptop, Tafelwerke, oder.... Installieren Sie z.b.
7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
Beispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
6.2 Lineare Regression
6.2 Lineare Regression Einfache lineare Regression (vgl. Kap. 4.7) Y i = θ 0 + θ 1 X i + ǫ i ǫ i (0, σ 2 ) ˆθ 1 ˆθ 0 = S XY S 2 X = 1 ( Yi n ˆθ ) 1 Xi als Lösung der Minimumaufgabe n (Y i θ 1 X 1 θ 0 )
Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik
TECHNISCHE UNIVERSITÄT MÜNCHEN - WEIHENSTEPHAN SS 97 MATHEMATIK UND STATISTIK, INFORMATIONS- UND DOKUMENTATIONSZENTRUM Klausur zu Biometrische und Ökonometrische Methoden und Ökologische Statistik 15 45
Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018
Lösung Aufgabenblatt 3 zur Mikro-Ökonometrie, WS 2017/2018 Aufgabe 3: Die Datei WAGES2.DTA enthält Daten einer Stichprobe von 935 männlichen US-amerikanischen Arbeitnehmern im Alter von 28 bis 38 Jahren.
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für Gesundheitsfachberufe (2015) ISBN
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (25) Arbeitsblatt STATA Kapitel 6 Seite Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im SS 2012 Aufgabe 1 (20 Punkte) Sei y = Xβ + ε ein N 1 Vektor und X eine N K Matrix.
Technische Universität München Zentrum Mathematik Sommersemester Juli 2005 Arbeitszeit 60 Minuten
Name: Frau Herr (nichtzutreffendes bitte streichen) Fachrichtung geb. am (Tag/Mon/Jahr) Semestralklausur aus Praktikum BWL-Statistik Technische Universität München Zentrum Mathematik Sommersemester 2005
Logistische Regression
Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum
Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen:
Gesamtpunktzahl: 96 Pobeklausur: Einführung in die Ökonometrie 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: cigs: gerauchte Zigaretten pro Tag educ: Bildung
STATA II: Daten- und Analysevorbereitung (Teil 1)
STATA II: Daten- und Analysevorbereitung (Teil 1) 10. November 2003 Wiederholung I K:\mo14-16 Aufgaben: 1. Stellen Sie den aktuell gültigen Pfad \data fest und wechseln Sie in das \project1 Verzeichnis
6.4 Kointegration Definition
6.4 Kointegration 6.4.1 Definition Nach Engle und Granger (1987): Wenn zwei oder mehrere Variablen I(1) sind, eine Linearkombination davon jedoch I() ist, dann sind die Variablen kointegriert. Allgemein:
Klausur zur Vorlesung: Einführung in die Empirische Wirtschaftsforschung. Prof. Bernd Fitzenberger, Ph.D. WS 2010/11. Mittwoch, 16.
Klausur zur Vorlesung: Einführung in die Empirische Wirtschaftsforschung Prof. Bernd Fitzenberger, Ph.D. WS 2010/11 Mittwoch, 16. Februar 2011 Die folgenden drei Aufgaben sind alle zu bearbeiten. Die insgesamt
Supply Chain Management
Supply Chain Management Forecasting Methods Prof. Dr.-Ing. Burkhard Schmager Department of Industrial Engineering EAH Jena Sept 2016 SS 2016 Kapitel 2-1 Material Planning Approaches MRP - methods deterministical
Statistics, Data Analysis, and Simulation SS 2015
Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
Heteroskedastie. Test auf Heteroskedastie. Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist.
Heteroskedastie Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist. Beispiele: Bei Zeitreihendaten : Ansteigen der Varianz über die Zeit, Anstieg der Varianz mit
Übung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
Regressionsanalyse in R
Regressionsanalyse in R Session 6 1 Einfache Regression Lineare Regression ist eines der nützlichsten Werkzeuge in der Statistik. Regressionsanalyse erlaubt es Zusammenhänge zwischen Parametern zu schätzen
Lösung 10 / Dirk Enzmann, UHH SS2013 Monday June 24 21:39: Page 1
Lösung 10 / Dirk Enzmann, UHH SS2013 Monday June 24 21:39:06 2013 Page 1 name: