Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D.

Lehrsuhl für Saisik und empirische Wirschafsforschung Prof. Regina T. Riphahn, Ph.D. Diplomvorprüfung in Saisik II Winersemeser 005/06 7.0.006 Aufgabe : [45 Punke] Eine Miarbeierin eines Nürnberger Saisik-Lehrsuhls möche herausfinden, welche Fakoren die Diplomnoe von Sudierenden beeinflussen. Sie befrag dazu T = 00 zufällig ausgewähle Absolvenen, die gerade ihr Diplom bekommen haben, zu folgenden Aspeken: DNoe: Diplomnoe (Werebereich von,0 bis 4,0) VDNoe: Noe im Vordiplom (Werebereich von,0 bis 4,0) Sem: Zahl der Fachsemeser bis zum Erhal des Diploms Aler: Aler der befragen Person bei Erhal des Diploms (in Jahren) Sex: Geschlech (weiblich =, männlich = 0) BY: Person samm aus Bayern (ja =, nein = 0) Die Miarbeierin unersell, dass eine Noe ein quaniaives Merkmal is, das hier in 0,-Schrien gemessen wurde, und formulier folgendes Modell: ( ) DNoe = β + β VDNoe + β ln Sem + β Aler + β Sex + β BY + e 0 3 4 5 Die Auswerung der Daen mi R ergib folgenden Oupu: Call: lm(formula = DNoe ~ VDNoe + log(sem) + Aler + Sex + BY) Coefficiens: Esimae Sd. Error value Pr(> ) (Inercep) -.08963.43869 -.633 0.058 VDNoe 0.6575 0.0754450? 7.7e-3 *** log(sem).40798 0.53668.64 0.004 * Aler -0.0006449 0.0473704-0.04 0.989 Sex -0.03849? -0.099 0.95 BY -0.538084 0.003 -.098 0.0386 * --- Signif. codes: 0 '***' 0.00 '**' 0.0 '*' 0.05 '.' 0. ' ' Residual sandard error: 0.5945 on 94 degrees of freedom Muliple R-Squared:?, Adjused R-squared: 0.546 F-saisic:.99 on? and? DF, p-value:.58e-4 a) Berechnen Sie uner Angabe des Rechenwegs die im Oupu fehlenden Were für (5 Punke) a) den -Wer für b ; a) den Sandardfehler für b 4 ; a3) Die Zahl der Freiheisgrade für den oalen F-Tes (df und df); a4) die geschäze Fehlerermvarianz; a5) das Besimmheismaß. b) Welche der unabhängigen Variablen haben einen signifikanen Einfluss auf die Diplomnoe und welche nich (α=5%)? Begründen Sie Ihre Enscheidung. (,5 Punke) c) Berachen Sie die Koeffizienen b, b und b 5. (6 Punke) c) Angenommen Suden A war im Vordiplom um 5 Noeneinheien, d.h. eine halbe Noe besser als Suden B. Was erwaren Sie, um wie viele Noeneinheien wird A im Diplom besser als B sein, wenn A und B ansonsen in allen Merkmalen übereinsimmen? Begründen Sie.

c) Angenommen Suden C und Suden D simmen in allen Merkmalen überein, außer dass C aus Bayern samm und D nich. Wenn D als Diplomnoe eine,0 ha, welche Diplomnoe erwaren Sie dann für C? Begründen Sie. c3) Was gib der Koeffizien b an? Inerpreieren Sie. d) Mi einem Inerakionserm kann der gemeinsame Einfluss von zwei Merkmalen unersuch werden. Nennen Sie zwei sinnvolle Inerakionserme, die die Miarbeierin in das obige Modell aufnehmen könne und inerpreieren Sie diese inhallich. (4 Punke) e) Eine häufig genanne Annahme bei Regressionsschäzungen is die der Normalvereilung. Der Jarque- Bera-Tes biee eine Möglichkei, diese zu überprüfen. (7 Punke) e) Beschreiben Sie kurz, was die Normalvereilungsannahme aussag und warum sie nowendig is. e) Mi welchem R-Befehl rufen Sie den Jarque-Bera-Tes für das obige Modell auf? e3) Der Jarque-Bera-Tes aus e) liefer folgenden Oupu: Jarque Bera Tes Chi-squared = 0.8799, df =, p-value = 0.644 Begründen Sie kurz, ob die Normalvereilungsannahme hier als erfüll berache werden kann oder nich (α=5%). f) Die Miarbeierin vermue, dass es für die Diplomnoe auch eine Rolle spiel, ob ein Sudierender Saisik als Schwerpunkfach im Haupsudium gewähl hae (Variable Sa, ja=, nein=0). Sie schäz dazu das obige Modell zusäzlich separa für Saisiker und Nich-Saisiker. Die jeweiligen ANOVA-Tabellen sind im Folgenden angegeben (Tabelle : nur Saisiker, Tabelle : nur Nich-Saisiker, Tabelle 3: Saisiker und Nich-Saisiker zusammen). Führen Sie einen Chow-Tes auf dem 5%-Niveau durch. Geben Sie dabei auch die Null- und Alernaivhypohese, die Tessaisik, die Vereilung der Tessaisik und die Ablehnungsregion an. Inerpreieren Sie das Ergebnis. (9 Punke) Tabelle : Analysis of Variance Table Response: DNoe[Sa==] Df Sum Sq Mean Sq F value Pr(>F) VDNoe[Sa==] 8.5878 8.5878.0595 6.88e-05 *** log(sem)[sa==].4646.4646 6.330 0.08 * Aler[Sa==] 0.4689 0.4689.044 0.83 Sex[Sa==] 0.0066 0.0066 0.07 0.8970 BY[Sa==].0397.0397.6708 0.38 Residuals 7 0.5 0.3893 Tabelle : Analysis of Variance Table Response: DNoe[Sa==0] Df Sum Sq Mean Sq F value Pr(>F) VDNoe[Sa==0] 5.564 5.564 73.35 4.77e- *** log(sem)[sa==0].0556.0556 3.087 0.08684 Aler[Sa==0] 0.438 0.438.48 0.6949 Sex[Sa==0] 0.088 0.088 0.346 0.6989 BY[Sa==0] 0.4903 0.4903.4068 0.408 Residuals 6.596 0.3485 Tabelle 3: Analysis of Variance Table Response: DNoe Df Sum Sq Mean Sq F value Pr(>F) VDNoe 34.6 34.6 96.9548 3.894e-6 *** log(sem) 3.04 3.04 8.530 0.004373 ** Aler 0.09 0.09 0.0539 0.86887 Sex 0.007 0.007 0.095 0.8896 BY.555.555 4.3998 0.03867 * Residuals 94 33.7 0.353 g) Ein bei der Schäzung von Regressionsmodellen häufig aufreendes Phänomen is die sog. Auokorrelaion. (,5 Punke) g) Erläuern Sie kurz verbal und formal, was man uner Auokorrelaion verseh. g) Nennen Sie zwei Konsequenzen von Auokorrelaion für KQ-Schäzer.

g3) Die Miarbeierin unersell die Güligkei des AR()-Modells. Sie ruf in R mi > dwes(lm(dnoe ~ VDNoe + log(sem) + Aler + Sex + BY, alernaive = c("greaer")) einen Durbin-Wason-Tes auf und erhäl dabei folgendes Ergebnis: Durbin-Wason es daa: lm(dnoe ~ VDNoe + log(sem) + Aler + Sex + BY) DW =.43, p-value = 5.57e-05 alernaive hypohesis: rue auocorrelaion is greaer han 0 Geben Sie für diesen Tes die Null- und Alernaivhypohese an und begründen Sie, ob Auokorrelaion vorlieg oder nich. g4) Hilf Ihnen die Kennnis des vorliegenden AR()-Parameers bei der Vorhersage der abhängigen Variablen für die nächse Beobachung, T = 0. Begründen Sie Ihre Anwor. Aufgabe : [0 Punke] Welche Anwor is richig? Bie kreuzen Sie die zureffende Anwor an. Zu jeder Frage gib es nur eine richige Anwor. Für jede korrek angekreuze Anwor gib es Punk, für jede falsch angekreuze Anwor wird Punk abgezogen. Die Gesampunkzahl kann nich negaiv werden.. Ein Daaframe unerscheide sich von einer Marix dadurch, dass eine Marix nich mehrere Variablen enhalen kann. eine Marix nur Vekoren des gleichen Daenyps enhalen darf. eine Marix überhaup kein R-Objek is.. Welche Aussage is korrek? In R is das Dezimalrennzeichen das Komma. R unerscheide zwischen Groß- und Kleinschreibung. In R werden Befehlszeilen mi einem Punk abgeschlossen. 3. Mi welchem der folgenden Befehle berechne man in R den arihmeischen Mielwer der Elemene des Vekors x? > mean(x) > mw(x) > middle(x) 4. Mi welchem der folgenden R-Befehle konrollier man für den quadrieren Wer der Variable x? > lm(y~w+i(x^)+z) > lm(y~w+x^+z) > lm(y~w+x*x+z) 5. Welche Kennzahl der Häufigkeisvereilung der Elemene des Vekors x berechne man mi dem R-Befehl > sum(x)/lengh(x)? Sandardabweichung Median arihmeischen Mielwer 3

6. Welchen Wer berechne man mi folgender Formel (y is die abhängige Variable einer linearen Regression): > sum((y mean(y))^)? SSE SSR SST 7. 8. 9. 0. Mi welchem R-Befehl besimm man den kriischen Wer einer F-Vereilung mi 8 und Freiheisgraden bei einem Signifikanzniveau von 5%? > pf(0.05,8,) > qf(0.05,8,) > qf(0.95,8,) Welche Schreibweise des Befehls > read.able() is korrek, um den Daensaz Daen.x einzulesen? > read.able( C:\Sudien\Daen.x,header=T) > read.able( C:/Sudien/Daen.x,header=T) > read.able( C:/Sudien/Daen,header=T) Sie wollen die Wahrscheinlichkei dafür berechnen, dass eine mi 5 Freiheisgraden -vereile Zufallsvariable höchsens den Wer 0,6 annimm. Mi welchem R-Befehl erhalen Sie das richige Ergebnis? > d(0.6,5) > p(0.6,5) > p(0.6,5) p(0,5) Mi welchem der folgenden Parameer des Befehls > plo() ändern Sie die Beschrifung der y-achse? ylab ylim yaxis Aufgabe 3: In R wurde folgende Funkion programmier: [ Punke] > auswerung = funcion(x,y) { r = cor(x,y) reg=lm(y~x) plo(x,y) abline(reg) reurn(r) } Der Daensaz, auf den diese Funkion angewende werden soll, enhäl die beiden Variablen x und y, die die folgenden Ausprägungen haben: x y 3-3 4-4 3 5-5 4

a) Mi welchen Befehlen geben Sie diesen Daensaz in R ein? b) Welche Ergebnisse gib R bei folgenden Befehlen aus? b) > x[] b) > x[y==-4] b3) > x[y<6] c) Welchen Befehl müssen Sie in R eingeben, um die Funkion für den gegebenen Daensaz auszuführen? d) Geben Sie alle Ausgaben an, die mi dieser Funkion für den Daensaz erzeug werden. Aufgabe 4: [5 Punke] Wahr oder falsch? Tragen Sie für jede der folgenden Aussagen ein w für wahr oder ein f für falsch ein. Für jede richige Anwor gib es Punk, für jede falsche Anwor wird Punk abgezogen. Die Gesampunkzahl kann nich negaiv werden. Die Grundidee des F-Tess beseh darin, den Erklärungsgehal unerschiedlicher Modelle zu vergleichen. Immer wenn enweder kaegorische erklärende Variablen oder Dummyvariablen im linearen Modell berache werden, muss eine Referenzgruppe gebilde werden. Nimm eine Zufallsvariable einen beliebigen Wer (z.b. x = ) an, so is der an dieser Selle berechnee Wer der Wahrscheinlichkeisfunkion größer als der der Wahrscheinlichkeisdichefunkion. Beim Laspeyres-Index ensprich das Produk von Preis- und Mengenindex der Umsazmesszahl. n Der Ausdruck ( xi x ) gil nur für seige Zufallsvariablen. i= Eine Vorhersage auf Basis eines linearen Modells is genau dann unverzerr, wenn der Erwarungswer des Vorhersagefehlers 0 beräg. Der KQ Schäzer is inkonsisen, wenn cov(x,e) = 0. Der Herfindahl-Index is ein absolues Konzenraionsmaß. Empirisches Arbeien läss sich mi den Forderungen des kriischen Raionalismus nach Falsifikaion von Theorien begründen. Der KQ-Schäzer is (asympoisch) normalvereil. Erwarungswer und Varianz der Chi -Vereilung sind idenisch. Das Gauss-Markov-Theorem mach keine Aussage zu nichlinearen Schäzverfahren. Der Chow-Tes benuz die F-Vereilung. Im linearen Modell gib die Regressionskonsane den Mielwer der abhängigen Variablen an. Auf der Haupdiagonale der Varianz-Kovarianz Marix der geschäzen Parameer befinden sich ausschließlich die Varianzen der einzelnen Parameer. Die gemeinsame Dichefunkion zweier unabhängiger Zufallsvariablen unerscheide sich von der gemeinsamen Dichefunkion zweier korrelierer Zufallsvariablen. 5

Bei Auokorrelaion erser Ordnung in den Fehlerermen eines linearen Modells läss sich ein effiziener KQ Schäzer gewinnen, wenn die Daen vor der Schäzung ransformier werden. Grundidee des KQ Schäzers is, eine Linie so durch eine Punkwolke zu legen, dass die Summe der quadrieren horizonalen Abweichungen der beobacheen Were von der Linie minimier wird. Sobald heeroskedasische Fehlererme vorliegen, is der KQ Schäzer ineffizien. Unverzerre Schäzer der Sörermvarianz erhäl man nur, wenn die Freiheisgrade als T K berechne werden, wobei T die Anzahl der Beobachungen und K die Anzahl der geschäzen Parameer (inklusive der Konsanen) is. Zu den Mehoden saisischer Inferenz gehören das Schäzen, das Tesen und das Vorhersagen. Um zu prüfen, ob eine erklärende Variable signifikan is, die als Polynom drier Ordnung in der Regression berücksichig wurde, solle der F-Tes genuz werden. Bei linearen Regressionen wird die Schäzgüe mi dem Wer des R gemessen. Je größer der Gini-Koeffizien, umso gleichmäßiger die Vereilung. Wenn a eine Konsane is und Y eine Zufallsvariable, dann gil Var(Y-a) = Var(Y). Aufgabe 5: [0 Punke] Welche Anwor is richig? Bie kreuzen Sie die zureffende Anwor an. Zu jeder Frage gib es nur eine richige Anwor. Für jede korrek angekreuze Anwor gib es Punk, für jede falsch angekreuze Anwor wird Punk abgezogen. Die Gesampunkzahl kann nich negaiv werden.. Wenn c eine Konsane is und X und Y Zufallsvariablen sind, dann is die Varianz von (cx Y) c Var(X) Var (Y) c Var(X Y) c Var(X) + Var(Y) c Cov(X,Y). Um mi Hilfe eines linearen KQ Schäzers Koeffizienen zu gewinnen, die als Elasiziäen von Y hinsichlich X inerpreier werden können, muss man die erklärende Variable X als Polynom zweier Ordnung schäzen. die abhängige Variable Y logarihmier berachen. abhängige und erklärende Variable (Y und X) in logarihmierer Form berachen. 3. KQ Parameerschäzer sind Zufallsvariablen, weil sie als gewichee Summe von Zufallsvariablen beschrieben werden können. das Schäzverfahren keine exaken Were ergib. Inervallschäzer keine präzise Inerpreaion zulassen. 4. Bei einem Hypohesenes is die Ablehnungsregion umso größer, je niedriger das Signifikanzniveau. unabhängig von der Typ-I Fehlerwahrscheinlichkei. abhängig von der Anzahl der Beobachungen. 6

5. Eine Division der erklärenden Variable X k durch den Fakor a führ zu einem um den Fakor a reduzieren Parameerschäzwer für β k. einem um den Fakor a erhöhen Parameerschäzwer für β k. um den Fakor a erhöhen Schäzweren für alle Seigungsparameer des Modells. 6. Die Präzision der Schäzung eines Seigungsparameers is umso höher, je weniger Beobachungen vorliegen. je mehr Parameer geschäz werden. je größer die Sreuung der erklärenden Variable. 7. Ausgelassene relevane erklärende Variable führen dann nich zu verzerren Parameerschäzern, wenn die ausgelassene Variable mi dem Sörerm korrelier is. wenn die Sandardfehler heeroskedasisch sind. wenn die ausgelassene Variable mi den berücksichigen Variablen nich korrelier is. 8. Der Goldfeld-Quand Tes überprüf, ob aufeinander folgende Sörerme des Modells mieinander korrelier sind. ha T-K Freiheisgrade. wird in der Regel als einseiiger Tes durchgeführ. 9. Bei gegen unendlich konvergierender Sichprobengröße konvergier der Inervallschäzer der Seigungsparameer gegen das Signifikanzniveau. konvergier die Varianz des KQ Schäzers gegen Null. konvergier das R gegen. 0. 3 Ein RESET Tes mi quadrieren und kubischen vorhergesagen Weren ( ŷ und ŷ ) der abhängigen Variable ergib eine Tessaisik von 4,8 mi einem p-wer von 0,067. Dies bedeue: Das Modell solle in logarihmierer Form geschäz werden. Am Signifikanzniveau von 0% wird H 0 nich verworfen. Am Signifikanzniveau von 5% is das Modell nich fehlspezifizier. Aufgabe 6: [8 Punke] Brada und Graves argumenieren in ihrem 998 erschienen Arikel The Slowdown in Sovie Defense Expendiures (Souhern Economic Journal, 969-984), dass die sowjeischen Ausgaben für Vereidigung eine Funkion des sowjeischen Bruosozialproduks und der Vereidigungsausgaben der USA seien. Weniger sicher waren sie sich über den Einfluss der Anzahl sowjeischer Nuklearsprengköpfe im Vergleich zur Anzahl US-amerikanischer Nuklearsprengköpfe. Um ihre Hypohesen zu überprüfen, verwenden sie Jahresdaen von 960 bis 984 und schäzen zwei Modellspezifikaionen: ln( SDH ) ln( USD ) ln( SY ) e = β + β + β + 0 ln( SDH ) = β + β ln( USD ) + β ln( SY ) + β ln( SP ) + e () 0 3 wobei SDH : Sowjeische Vereidigungsausgaben im Jahr (in 970 Mrd. Rubel, Schäzung durch die CIA) USD : US-amerikanische Vereidigungsausgaben im Jahr (in 980 Mrd. US$) () 7

SY : SP : sowjeisches Bruosozialproduk im Jahr (in 970 Mrd. Rubel) Verhälnis der Anzahl sowjeischer Nuklearsprengköpfe zur Anzahl US-amerikanischer Nuklearsprengköpfe Die Schäzung von Spezifikaion () mi R liefer folgende Ergebnisse: Call: lm(formula = log(sdh) ~ log(usd) + log(sy)) Coefficiens: Esimae Sd. Error value Pr(> ) (Inercep) -.88 0.53367-5.399.0e-05 *** log(usd) 0.046 0.0756.44 0.63 log(sy).066 0.03796 8.086 < e-6 *** --- Signif. codes: 0 '***' 0.00 '**' 0.0 '*' 0.05 '.' 0. ' ' Residual sandard error: 0.04704 on degrees of freedom Muliple R-Squared: 0.9787, Adjused R-squared: 0.9767 F-saisic: 505. on and DF, p-value: <.e-6 Die Schäzung von Spezifikaion () mi R liefer sodann folgenden Oupu: Call: lm(formula = log(sdh) ~ log(usd) + log(sy) + log(sp)) Coefficiens: Esimae Sd. Error value Pr(> ) (Inercep) -.993 0.7084 -.8 0.004 * log(usd) 0.0569 0.0746 0.758 0.4570 log(sy) 0.9694 0.0647 4.98.0e- *** log(sp) 0.0573 0.038.80 0.0859. --- Signif. codes: 0 '***' 0.00 '**' 0.0 '*' 0.05 '.' 0. ' ' Residual sandard error: 0.0448 on degrees of freedom Muliple R-Squared: 0.985, Adjused R-squared: 0.9789 F-saisic: 37. on 3 and DF, p-value: <.e-6 a) Welche der beiden Spezifikaionen würden Sie bevorzugen? Begründen Sie kurz. ( Punke) b) Aus den Schäzergebnissen lassen sich weierhin folgende Angaben ermieln: (6 Punke) T Spezifikaion (): ee ˆˆ 0.036 und ; = eˆ 0.049 = = T T = Spezifikaion (): ee ˆˆ = 0.09 und eˆ 0.04. = = T = b) Berechnen Sie die Auokorrelaionskoeffizienen ρ () und ρ ( ) für AR() Sörermprozesse e und e. b) Berechnen Sie weierhin die (approximaiven) Durbin-Wason-Saisiken d () und d und esen ( ) Sie auf dem 5%-Signifikanzniveau auf posiive Auokorrelaion erser Ordnung. Geben Sie hierzu auch die Nullhypohese, die Alernaivhypohese sowie die Freiheisgrade sowie die jeweiligen kriischen Were an. c) Modell-Spezifikaion () wird erneu geschäz uner Verwendung der verzögeren abhängigen Variablen (y - ) als zusäzliche erklärende Größe: Die Durbin-Wason Tes-Saisik beräg.85, ein Langrange Muliplier Tes ha eine Tes-Saisik von 0.844. Lieg hier Auokorrelaion erser Ordnung vor? Begründen Sie Ihre Anwor. Skizzieren Sie zudem kurz die Vorgehensweise des Lagrange Muliplier Tess. (6 Punke) d) Zeigen Sie allgemein, dass e homoskedasisch is, wenn ein AR() Sörermprozess der Form e = ρe + υ gegeben is, für den gil: E( e ) = 0 ; E ( υ ) = 0 ; Var ( υ ) = σ ; Cov( υ, υ ) = 0, υ s für s. (4 Punke) 8