Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression

Ähnliche Dokumente
8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme)

1 Beispiel zur Methode der kleinsten Quadrate

Finanzmarkttheorie I. Performancemessung in EViews Übungsunterlage. Prof. Dr. Heinz Zimmermann WWZ Uni Basel Frühling 2015

Probeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden!

1 Gliederung Zeitreihenökonometrie. Angewandte Ökonometrie (Folien) Zeitreihenökonometrie Universität Basel, FS 09. Dr. Sylvia Kaufmann.

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

Übung V Lineares Regressionsmodell

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

Dipl. Vw. Matthias Kirbach Sommersemester Übung IX. Dynamische Modelle

Heteroskedastie. Test auf Heteroskedastie. Heteroskedastie bedeutet, dass die Varianz der Residuen in der Stichprobe nicht konstant ist.

1. Übung: Einführung in EVIEWS

Beispiel für Varianzanalyse in multipler Regression mit zwei erklärenden Variablen

Analyse Multikollinearität am Beispiel einer Importfunktion für die Schweiz

x t2 y t = 160, y = 8, y y = 3400 t=1

Das lineare Regressionsmodell

6.4 Kointegration Definition

Kapitel 10. Multikollinearität. Exakte Multikollinearität Beinahe Multikollinearität

2. Fehlerhafte Auswahl der exogenen Variablen (Verletzung der A1-Annahme)

Übung VIII Ökonometrische Testverfahren

Kurze Einführung in die Ökonometrie-Software E-Views

Klausur zur Veranstaltung Empirische Wirtschaftspolitik

5 Multivariate stationäre Modelle

Übung zur Empirischen Wirtschaftsforschung. VII. Ökonometrische Testverfahren. 7.2 Die Geldnachfragefunktion

Übung zur Empirischen Wirtschaftsforschung. VII. Ökonometrische Testverfahren. 7.1 Geldnachfragefunktion. 7.2 Empirische Ergebnisse: Westdeutschland

Klausur zur Veranstaltung Empirische Wirtschaftspolitik Wintersemester 2012/2013

Dipl. Vw. Matthias Kirbach Sommersemester Übung VII/ VIII. Makroökonometrische Modellierung nach der Vereinigung

6. Tutoriumsserie Statistik II

Übungsblatt 7: Schätzung eines Mietspiegels

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2017/18. ( = 58 Punkte)

V. Das lineare Regressionsmodell

Mehr Ärzte = höhere Lebenserwartung?

Die Schätzung einer Produktionsfunktion

2 Anwendungen und Probleme

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung

3. Das einfache lineare Regressionsmodell

Prof. Regina T. Riphahn, Ph.D. WS 04/05 Abschlussklausur zur Veranstaltung "Einführung in die Ökonometrie" am 24. Februar 2005,

Lösung - Übungsblatt 10

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Biostatistik 101 Korrelation - Regressionsanalysen

Multivariate Verfahren

Allgemein zu Hypothesentests: Teststatistik. OLS-Inferenz (Small Sample) Allgemein zu Hypothesentests

VI. Die Taylor Regel

IV. Prognosen - Teil 2

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Lineare Regression in R, Teil 1

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS 2018

IV. Prognosen - Teil 2

Übung zur Empirischen Wirtschaftsforschung. VI. Die Taylor Regel. 6.2 Die Taylor Regel. 6.3 Die Taylor Regel für die US-Geldpolitik

Kurzeinführung in EViews

11. weitere Übungsaufgaben Statistik II WiSe 2017/2018

Dipl. Vw. Matthias Kirbach Sommersemester Übung VI/ VII

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)

Übungsblatt 4. Autokovarianz, Autokorrelation Invertierbarkeit und Kausalität

Übung zur Empirischen Wirtschaftsforschung IX. Einkommensfunktion

Zeitreihen-Ökonometrie, SS 2017 Lösungen Aufgabenblatt 3

Das klassische Regressionsmodell: Ein Beispiel

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen.

III. Prognosen - Teil 1

VI. Die Taylor Regel

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)

Statistik II Übung 1: Einfache lineare Regression

4. Das multiple lineare Regressionsmodell

1. Die gemeinsame Dichtefunktion der Zufallsvariablen X,Y sei. 1 für 0 x 1 und 0 y 1 0 sonst. 1 Volumen über schraffierter Fläche = = 0.

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch

Tutorium Wirtschaftsprognosen und Geldpolitik. Die Taylor Regel. 2 Die Taylor Regel. 3 Die Taylor Regel für die US-Geldpolitik. 4 Strukturbruchtest

Multiple Regression Mais-NP Zweidimensionale lineare Regression Data Display Dreidimensionale lineare Regression Multiple Regression

III. Prognosen - Teil 1

6 Nichtstationarität und Kointegration

Analyse von Querschnittsdaten. Signifikanztests I Basics

Beispiele für Prüfungsfragen Ökonometrie I und II

Aktienkurs der Wiener Börsekammer (Jänner 1968-Oktober 2004) Forecasts und Evaluation

Notiz zur Schätzung des strukturellen Defizits mit Hilfe der langfristigen Aufkommenselastizität. von: Carsten Colombier

3.3 Konfidenzintervalle für Regressionskoeffizienten

Fragestunde zur Übung

Lineare Modelle in R: Klassische lineare Regression

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

6. Heteroskedastizität (Verletzung der B2-Annahme)

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Übung zur Empirischen Wirtschaftsforschung VIII. Einkommensfunktion

Statistik II Übung 2: Multivariate lineare Regression

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

Statistik II. IV. Hypothesentests. Martin Huber

Prognoseintervalle für y 0 gegeben x 0

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Transkript:

Prof. Dr. Peter von der Lippe ( Übungsblatt E) Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression Das Beispiel "Mindestlöhne" zur einfachen multiplen Regression ergab die folgenden Parameter αˆ = 7,1028, βˆ = - 0,08175, r 2 = 0,008275 sowie die geschätzten Standardabweichungen der Schätzung von αˆ und βˆ in Höhe von ˆ = 0,400223 und σˆ α ˆ = 2,9256. Mit den Regressoren x 2, x 3 und x 4 ist der Datensatz wie folgt angereichert worden y = x1 = Höhe des Mindestlohns, x2 = Arbeitskosten 2005 in je Stunde, x3 = Personalzusatzkosten in Prozent des Direktentgelts x4 = Jahressollarbeitsstunden σβ ˆ Die Daten sind als eine Gruppe zusammengefasst worden: obs Y X1 X2 X3 X4 1 Irland 4.4 8.65 19.47 40 1817 2 Frankreich 9 8.44 21.38 93 1610 3 U.K. 5.5 8.2 20.47 46 1704 4 Belgien 8.2 8.08 25.64 90 1709 5 Niederlande 5.5 8.08 25.45 83 1736 6 USA 4.6 4.3 19.27 45 1920 7 Spanien 8.5 3.42 17.25 85 1754 Und für die einfache Regression nur mit x 1 (wie in der Übungsaufgabe zur einfachen Regression, download A, die mit den dortigen Ergebnissen zu vergleichenden Zahlen sind mit Fettdruck hervorgehoben) erhält man den folgenden Ausdruck Variable Coefficient Std. Error t-statistic Prob. C 7.102804 2.925650 2.427769 0.0595 X1-0.081750 0.400224-0.204259 0.8462 R-squared 0.008275 Mean dependent var 6.528571 Adjusted R-squared -0.190070 S.D. dependent var 1.964446 S.E. of regression 2.143020 Akaike info criterion 4.597266 Sum squared resid 22.96268 Schwarz criterion 4.581811 Log likelihood -14.09043 F-statistic 0.041722 Durbin-Watson stat 2.788567 Prob(F-statistic) 0.846205 Wie man sieht, erhält man die gleichen Werte, wie in der anfänglichen Übungsaufgabe (Download A) mit Excel, bzw. dem Taschenrechner errechnet. Ferner ist leicht zu erkennen, dass die Steigung nicht signifikant von 0 verschieden ist, weil der t-wert nur- 0,204259 beträgt. Auch der Ordinatenabschnitt ist nicht auf dem 5% Niveau gesichert (prob-value hiervon 5,95% also weniger als 5%). Die mit EViews erzeugten Streuungsdiagramme (jeweils y als abhängige Variabel auf der Abszisse) Befehl "Multiple Graph (Scatter plot)" für die Gruppe "Mindestlohn" der Variablen y, x 1,,x 4 zeigt, dass bei x 1 und x 2 mit der abhängigen Variable y kaum korrelieren

v.d.lippe, Übungsaufgabe "Mindestlohn" zur multiplen Regression mit EViews 2 9 26 Höhe des Mindestlohns 8 7 6 5 4 Arbeitskosten 25 24 23 22 21 20 19 18 3 17 100 1950 90 1900 Personalzusatzkosten 80 70 60 50 Jahressollarbeitszeit 1850 1800 1750 1700 40 1650 30 1600 Die Korrelationstabelle, die ebenfalls leicht mit EViews zu berechnen ist, zeigt wie schon die Graphik eine betragsmäßig recht hohe Korrelation zwischen y und x3 und x4 Y X1 X2 X3 X4 Y 1.000000-0.090969 0.103105 0.864993-0.709782 X1-0.090969 1.000000 0.605727 0.014235-0.531127 X2 0.103105 0.605727 1.000000 0.455431-0.372796 X3 0.864993 0.014235 0.455431 1.000000-0.667893 X4-0.709782-0.531127-0.372796-0.667893 1.000000 Bemerkenswert ist, dass die steigt mit zunehmendem Anteil der Personalnebenkosten an den gesamten Arbeitskosten (r = 0,864993) und auch steigt mit abnehmender Arbeitszeit (Verkürzung der Arbeitszeit erhöht also tendenziell die, wie die negative Korrelation 0,709782 zeigt). Die beachtlich hohe Korrelationen zwischen x 1 und x 2 in Höhe von r 12 = 0,6057, aber auch r 14 = - 0,5311 und r 34 = - 0,6679 sprechen dafür, dass man bei den Daten ein Problem mit Multikollinearität hat (vgl. auch Fußnote 2). Für die "group" der fünf Variablen y, x 1,..,x 4 kann man neben der multiple graph und der Korrelationstabelle auch mit view descriptive statistics die folgende Tabelle mit Kennzahlen der Verteilung der jeweiligen Variable bestimmen. Einiges davon ist bei der geringen Zahl

v.d.lippe, Übungsaufgabe "Mindestlohn" zur multiplen Regression mit EViews 3 der Daten (observations) für jede Variable (nur n = T = 7) im Grunde natürlich wenig sinnvoll und nur hier als Übungsbeispiel zu vertreten. Das gilt für den Jarque-Bera Test auf Normalverteiltheit (vgl. auch Seite 5 unten) der entsprechenden Variablen (er orientiert sich an den beiden Momenten, Schiefe [skewness] und Wölbung [Kurtosis]) 1 und natürlich auch für die nachfolgend beschriebenen Regressionen [in der Praxis würde man derartige Rechnungen mit nur t = 7 Wertetupeln nicht durchführen]). Y X1 X2 X3 X4 Mean 6.528571 7.024286 21.27571 68.85714 1750.000 Median 5.500000 8.080000 20.47000 83.00000 1736.000 Maxim um 9.000000 8.650000 25.64000 93.00000 1920.000 Minimum 4.400000 3.420000 17.25000 40.00000 1610.000 Std. Dev. 1.964446 2.185985 3.178615 23.85672 97.46623 Skewness 0.200260-0.963872 0.426804-0.251796 0.447346 Kurtosis 1.264124 2.037254 1.821517 1.163242 2.686566 Jarque-Bera 0.925657 1.354231 0.617595 1.057958 0.262125 Probability 0.629500 0.508081 0.734329 0.589206 0.877163 Sum 45.70000 49.17000 148.9300 482.0000 12250.00 Sum Sq. Dev. 23.15429 28.67117 60.62157 3414.857 56998.00 Farblich markiert sind Angaben, die bei den Regressionsrechnungen jeweils für die dependent variable y wieder erscheinen. Es gelten dabei die folgenden Zusammenhänge 6,528 = 45,7/7 und für die Standardabweichung (Std.Dev), 1,96444 = 23.15429 6. Man kann nun leicht alle einfachen Regressionen berechnen, was hier nur kurz summarisch wiedergegeben werden soll (Regressoren x i mit i = 1, 2, 3, 4) i = 1 i = 2 i = 3 i = 4 C (const.) = αˆ 7.102804 5.172865 1.624113 31.56366 X i (Regr. Koeff = ˆβ i ) -0.081750 0.063721 0.071227* -0.014306 Korrelation r yi - 0.090969 0.103105 0.864993-0.709782 R 2 = 2 r y.i 0.008272 0.8258 0.748213 0.073990 * dies ist der einzige Regressionskoeffizient der auf dem 5% Niveau signifikant ist (prob 0.011945) Die größten einfachen Korrelationskoeffizienten sind r 13 und r 14, d.h. neben den Lohnebenkosten hat vor allem die Arbeitszeit einen Einfluss auf die. Auf der nächsten Seite findet man die Regression von y auf x 3 und x 4. Die Ergebnisse ermöglichen es, partielle Korrelationen auszurechnen und die Rekursionsformeln zu verifizieren: ry4 ry3r34 0.7097 [ 0.865 ( 0.6679) ] 0.13206 ry 4.3 = = = = 0.3536 2 2 1 r 1 r 0.25187 0.55392 0.37346 ( )( ) y3 34 2 2 2 2 R y.34 = R y.3 + ry4.3(1 R y.3) = 0.748213 + 0.125041 0.251787 = 0.779697. 1 Die Werte für die prob values (0,6295 0,58081 ) sind durchwegs größer als 0,05, so dass die Hypothese der Normalverteiltheit nicht auf dem 5%Niveau verworfen werden kann.

v.d.lippe, Übungsaufgabe "Mindestlohn" zur multiplen Regression mit EViews 4 Wie man prüft, ob hinzugekommene Regressoren signifikant sieht steht auf Seite 5 oben. Variable Coefficient Std. Error t-statistic Prob. C 10.93603 12.39506 0.882289 0.4275 X3 0.058115 0.025965 2.238211 0.0888 X4-0.004805 0.006355-0.756080 0.4917 R-squared 0.779697 Mean dependent var 6.528571 Adjusted R-squared 0.669546 S.D. dependent var 1.964446 S.E. of regression 1.129264 Akaike info criterion 3.378536 Sum squared resid 5.100950 Schwarz criterion 3.355355 Log likelihood -8.824878 F-statistic 7.078422 Durbin-Watson stat 2.057805 Prob(F-statistic) 0.048533 Wie man sieht hat sich R 2 nicht wesentlich erhöht, nämlich von R 2 y. 3 = 0.748213 zu R 2 y. 34 = 0.779697. Auch bei Hinzukommen von zwei weiteren Regressoren vergrößert sich R 2 nicht wesentlich zu R 2 y. 1234 = 0.90235 Die gelb markierte Zahl (und die entsprechende Zahl in der Gleichung "alle" wird für den F-Test auf der nächsten Seite benötigt) Betrachtet man alle vier (K = 4) Regressoren so erhält man mit E-Views die Gleichung ("Alle" genannt), die im Computerausdruck wie folgt aussieht Links sieht man das sehr wichtige workfile window (nicht löschen!!), in dem alle Variablen verzeichnet sind, auch berechnete Gleichungen (Symbol =) oder benannte Tabellen (wie hier etwa "Korrelatio-

v.d.lippe, Übungsaufgabe "Mindestlohn" zur multiplen Regression mit EViews 5 nen"). Es ist wichtig, ein Objekt jeweils zu benennen wenn es für spätere Berechnungen wieder benutzt werden soll und nicht verloren gehen soll. Zum Testen der Hypothese H 0 : β 1 = β 2 = 0 (die zu x 3 und x 4 hinzugekommenen Regressoren x 1 und x 2 liefern [zusammengenommen] 2 keinen signifikanten Erklärungsbeitrag) ist wie folgt vorzugehen 0 (S û Sûû ) / L (5,100950 2,261024) / 2 F = û = 1,256 Sûû /(T K 1) 2,261024/ 2 = was zu vergleichen ist mit dem Tabellenwert der F Verteilung bei 95% Signifikanzniveau und 2 Zähler- Freiheitsgrade und 2 Nenner- Freiheitsgrade. Der Tabellenwert ist 19,0 (da 1,25 < 19 ist H 0, die Hpothese der Irrelevanz der hinzugekommenen Regressoren) nicht zu verwerfen Mit "Resids" erhält man die folgende (farbige) Graphik der Residuen zur Beurteilung der Güte der Anpassung. Die Abszisse ist bei Querschnittsdaten, die hier vorliegen nicht von großem Interesse. Man sieht aber, dass sich die (y) bei den Einheiten 1,2 und 3 (Irland, Frankreich und England) recht gut erklären lässt, Die Einheiten 4 (Belgien) und 5 (NL) haben höhere (bzw. niedrigere) als aufgrund der Regressoren zu erwarten ist, 10 9 8 7 1.2 6 0.8 5 0.4 4 0.0-0.4-0.8-1.2 1 2 3 4 5 6 7 Residual Actual Fitted Ausgehend von Resids kann man auch mit View eine ganze Reihe von statistischen Tests (= residual tests) für Annahmen über die Störgrößen durchführen, etwa Heteroskedastizität (B2) White Heterosk. Test Autokorrelation (B3) Correlogram Q Statistics Squared residuals Serial Correlation LM Test (= Breusch Godfrey Test) ARCH LM Test Normalverteiltheit (B4) Histogram Normality Test, das ist die folgende Abbildung: 3.2 2.8 2.4 2.0 1.6 1.2 0.8 0.4 0.0-1.5-1.0-0.5 0.0 0.5 1.0 Series: Residuals Sample 1 7 Observations 7 Mean -5.23e-16 Median 0.011607 Maximum 0.997262 Minimum -1.095848 Std. Dev. 0.613871 Skewness -0.249073 Kurtosis 3.331731 Jarque-Bera 0.104474 Probability 0.949104 2 Dass jeder Regressor für sich genommen nicht signifikant ist sieht man an den t-werten -0.2167 und -0.6521 und den dazugehörigen prob values (0.8485 und 0.5813), die alle größer als 0.05 also 5% sind. Wären die einzelne Regressoren (t Test) nicht signifikant, die Gesamtregression (F Test) dagegen schon, so spräche das für das Vorliegen von Multikollinearität.