Kapitel 4. Eigenschaften von OLS-Schätzfunktionen

Ähnliche Dokumente
Kapitel 4. Eigenschaften von OLS-Schätzfunktionen

Eigenschaften des OLS-Schätzers

2 Zufallsvariable und Verteilungen

Empirische Wirtschaftsforschung

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Grundgedanke der Regressionsanalyse

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Beschreibende Statistik Mittelwert

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

Standardnormalverteilung / z-transformation

Streuungs-, Schiefe und Wölbungsmaße

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

-70- Anhang: -Lineare Regression-

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Elemente der Mathematik - Sommer 2016

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Seminar Analysis und Geometrie Professor Dr. Martin Schmidt - Markus Knopf - Jörg Zentgraf. - Fixpunktsatz von Schauder -

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Stochastische Prozesse

3. Lineare Algebra (Teil 2)

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

6. Modelle mit binären abhängigen Variablen

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

Lösungen zum 3. Aufgabenblock

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Prof. Dr. Roland Füss Statistik II SS 2008

Konkave und Konvexe Funktionen

Erwartungswert, Varianz, Standardabweichung

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Grundlagen der Mathematik I Lösungsvorschlag zum 12. Tutoriumsblatt

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

Asymptotische Stochastik (SS 2010) Übungsblatt 1 P X. 0, n.

Analyse von Querschnittsdaten. Bivariate Regression

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

3.3 Lineare Abbildungen und Matrizen

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Lineare Regression - Mathematische Grundlagen

Das zum dualen Problem (10.2) gehörige Barriere-Problem lautet analog

4.6 Das Pumping-Lemma für reguläre Sprachen:

Stochastische Prozesse

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

Z Z, kurz { } Zählt die Reihenfolge der Buchstaben (ja/nein) Daraus ergeben sich wiederum vier Möglichkeiten, Wörter der Länge k zu bilden.

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

Teil E: Qualitative abhängige Variable in Regressionsmodellen

Weitere NP-vollständige Probleme

12 UMPU Tests ( UMP unbiased )

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Determinanten - I. den i-ten Zeilenvektor der n n-matrix A bezeichnet.

Werkstoffmechanik SS11 Baither/Schmitz. 5. Vorlesung

Kreditrisikomodellierung und Risikogewichte im Neuen Baseler Accord

5.3.3 Relaxationsverfahren: das SOR-Verfahren

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

18. Dynamisches Programmieren

4. Rechnen mit Wahrscheinlichkeiten

Zufallsvariable, Wahrscheinlichkeitsverteilungen und Erwartungswert

Auswertung univariater Datenmengen - deskriptiv

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

FORMELSAMMLUNG STATISTIK (I)

( ) γ. (t 1 ) (t 2 ) = Arg γ 2(t 2 )

Spiele und Codes. Rafael Mechtel

Auswertung univariater Datenmengen - deskriptiv

Zulassungsprüfung Stochastik,

Lineare Regression (1) - Einführung I -

5. ZWEI ODER MEHRERE METRISCHE MERKMALE

Der Erweiterungsfaktor k

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

Methoden der innerbetrieblichen Leistungsverrechnung

Verteilungen eindimensionaler diskreter Zufallsvariablen

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

1 Mehrdimensionale Analysis

Diskrete Mathematik 1 WS 2008/09

3 Elastizitätstheorie

4.5 Lemma Das folgende Problem Par{ 1, 0, 1}max p ist NP-vollständig:

Mathematische und statistische Methoden II

Netzwerkstrukturen. Entfernung in Kilometer:

5. Gruppenübung zur Vorlesung. Höhere Mathematik 1. Wintersemester 2012/2013

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

1.1 Das Prinzip von No Arbitrage

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Lineare Optimierung Dualität

Die Leistung von Quicksort

Vermessungskunde für Bauingenieure und Geodäten

INTELLIGENTE DATENANALYSE IN MATLAB. Mathematische Grundlagen

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik

Statistische Methoden für Bauingenieure WS 13/14

Aspekte zur Approximation von Quadratwurzeln

Vermessungskunde für Bauingenieure und Geodäten

Multivariate Analysemethoden

2πσ. e ax2 dx = x exp. 2πσ. 2σ 2. Die Varianz ergibt sich mit Hilfe eines weiteren bestimmten Integrals: x 2 e ax2 dx = 1 π.

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Aufgabe 1: Portfolio Selection

8. MARKOVKETTEN 127. Abbildung 8.1: Reduzible und periodische Markovkette. p ji IIP[X n 1 = j] = [(IIP[X n 1 = j]) j E P ] i. j=0

Transkript:

Kaptel 4 Egenschaften von OLS-Schätzfunktonen De Mathematk st ene Art Spelzeug, welches de Natur uns zuwarf zum Troste und zur Unterhaltung n der Fnsterns. (Jean le Rond d Alembert, 1717-1783) Wr haben berets m zweten Kaptel de OLS-Methode kennengelernt und darüber hnaus m letzten Kaptel festgestellt, dass de Anwendung deser Methode auf ene konkrete Stchprobe Schätzungen also fxe Zahlenwerte (Realsatonen) b 1 und b für de Zufallsvarablen β 1 und β der SRF y = β 1 + β x + ˆε lefert. Im Abschntt über de Monte Carlo Smulatonen haben wr gesehen, dass de Idee der wederholten Stchprobenzehungen ( repeated samplng ) ganz natürlch zur Idee der Stchprobenkennwertvertelungen führt. Wr nteresseren uns m Folgenden vor allem für de Momente 1 solcher Stchprobenkennwertvertelungen. De Monte Carlo Smulatonen haben uns berets gezegt, dass aufgrund des Gesetzes der Großen Zahl der Mttelwert ener Stchprobenkennwertvertelung oft zemlch genau dem wahren Wert der Grundgesamthet entsprcht, und dass aufgrund des Zentralen Grenzwertsatzes be ener genügend großen Anzahl von Zehungen de Stchprobenkennwertvertelung oft ener Normalvertelung zemlch ähnlch seht. Allerdngs leferten uns de Monte Carlo Smulatonen nur ene ntutve Vorstellung, kene hard facts mt denen man rechnen kann. In desem Kaptel wollen wr dese Ideen etwas weter entwckeln und den Erwartungswert und de Varanz der Stchprobenkennwertvertelungen der geschätzten Koeffzenten β 1 und β allgemen berechnen. Dese werden uns m nächsten Kaptel schleßlch de Durchführung von Hypothesentests erlauben. Allerdngs werden wr des unter der relatv restrktven Annahme ener determnstschen x Varable und von dentsch und unabhängg vertelten (..d.) Störtermen tun. Der Vortel legt 1 Momente snd Kenngrößen ener Zufallsvarablen, bzw. ener Vertelungsfunkton. Das k-te zentrale Moment st defnert als µ k = E[x E(x)] k Das zentrale Moment erster Ordnung (für k = 1) st stets glech Null (µ 1 = 0), da µ 1 = E(x µ) 1 = µ µ = 0;daszentraleMomentzweterOrdnung(für k = )st devaranz(µ = E[x E(x)] ), das zentrale Moment drtter Ordnung st de Schefe, das zentrale Moment verter Ordnung entsprcht der Wölbung bzw. Kurtoss. 1

Angewandte Ökonometre darn, dass uns unter desen Annahmen relatv enfach enen Schätzer für de Standardfehler der Koeffzenten berechnen können. Dese Annahmen werden n späteren Kapteln gelockert. Vorher werden wr uns aber noch mt engen statstschen Egenschaften des OLS- Schätzers beschäftgen. Wr haben berets mehrmals erwähnt, dass OLS-Schätzer bestmöglche Schätzer snd, ohne allerdngs genauer zu spezfzeren, was wr darunter verstehen. Des werden wr n desem Kaptel nachholen. Das Konzept der Stchprobenkennwertvertelungen erlaubt es uns nämlch, de Egenschaften von Schätzfunktonen etwas präzser zu defneren. Konkret wünschen wr uns Schätzfunktonen, de m Durchschntt rchtge und möglchst genaue Schätzungen lefern. Mt m Durchschntt rchtg menen wr, dass der Erwartungswert der Stchprobenkennwertvertelung glech dem wahren Wert der Grundgesamthet sen sollte. In der Sprache der Ökonometrkernnen wrd dese Egenschaft ener Schätzfunkton Erwartungstreue genannt. Mt möglchst genau menen wr, dass de Stchprobenkennwertvertelung ene möglchst klene Varanz haben sollte, oder etwas genauer, dass de Varanz der Stchprobenkennwertvertelung der OLS Schätzer klener sen sollte als de Varanz aller verglechbaren alternatven Schätzfunktonen. Ene Schätzfunkton, de dese zwete Egenschaft erfüllt, wrd n der Sprache der Ökonometrkernnen effzent genannt. In desem Kaptel werden wr zuerst zegen, dass de OLS-Schätzer unter bestmmten Annahmen tatsächlch erwartungstreu und effzent snd. Des st das Ergebns des bekannten Gauss-Markov Theorems, das n der Ökonometre ene zentrale Rolle spelt. Tatsächlch wrd sch en großer Tel deser Veranstaltung mt der Frage beschäftgen, was zu tun st, wenn ene oder mehrere der Gauss-Markov Annahmen verletzt snd. Da das Gauss-Markov Theorem n der Ökonometre ene derart grundlegende Rolle spelt, werden wr es etwas ausführlcher bewesen. De Erwartungstreue und Effzenz der OLS-Schätzer snd sogenannte Klene Stchprobenegenschaften, d.h. se gelten auch n klenen Stchproben (oder genauer, unabhängg von der Stchprobengröße). Leder lassen sch dese Klene Stchprobenegenschaften n komplzerteren Fällen ncht mmer bewesen (z.b. wenn enge der Gauss-Markov Annahmen ncht erfüllt snd). Deshalb werden wr m letzten Abschntt enge asymptotsche Egenschaften dskuteren. De wchtgste deser asymptotschen Egenschaften st de Konsstenz. Etwas verenfachend gesprochen st ene Schätzfunkton konsstent, wenn se mt zunehmender Stchprobengröße mmer genauer wrd. Schleßlch werden wr noch kurz den mttleren quadratschen Fehler (mean square error) dskuteren. Nach deser etwas ausführlchen Vorschau können wr uns nun an de Arbet machen. Für alle, denen deses Kaptel etwas schwerg erschent, en klener Trost vorab: deses Kaptel wrd n enem späteren Kaptel Schrtt für Schrtt wederholt allerdngs unter Verwendung der Matrxschrebwese.

Angewandte Ökonometre 3 4.1 Klene Stchprobenegenschaften Klene Stchprobenegenschaften snd we berets erwähnt unabhängg von der Stchprobengröße gültg, das heßt, se gelten auch n klenen Stchproben. De beden wchtgsten klene Stchprobenegenschaften snd: 1. Erwartungstreue (Unverzerrthet): Ene Schätzfunkton β für den wahren Wert β der Grundgesamthet st erwartungstreu ( unbased ), wenn E( β) = β und zwar für jeden belebgen Stchprobenumfang n. Benchterwartungstreuen SchätzernwrdE( β) β Verzerrung (bas)genannt Bas = E( β) β Ernnern wr uns, der Erwartungswert st enfach en mt den Wahrschenlchketen gewchtetes Mttel über alle möglchen Ausprägungen ener Zufallsvarable. Erwartungstreue sagt also nchts über das Ergebns ener enzelnen Schätzung aus, sondern st ene Egenschaft ener Schätzfunkton.. Effzenz: Ene Schätzfunkton heßt effzent, wenn se 1. erwartungstreu st, und. varanzmnmal unter allen verglechbaren erwartungstreuen Schätzfunktonen st: var( β) var( β ) wobe β jede belebge lneare und erwartungstreue Schätzfunkton für β sen kann. Effzenz bezeht sch mmer auf enen Verglech der Varanz von Schätzfunktonen, st also en relatves Konzept. Deshalb muss stets angeben werden, nnerhalb welcher Klasse von Schätzfunktonen en Schätzer effzent st. In desem Kaptel werden wr zegen, dass der OLS-Schätzer unter ener Rehe von Annahmen nnerhalb der Klasse aller unverzerrten lnearen Schätzfunktonen effzent st. Dese Egenschaft wrd Effzenz genannt, wel effzente Schätzer de verfügbare Informaton n der Stchprobe effzent nützen, und deshalb genauer snd als alternatve Schätzfunktonen. 4.1.1 Enführung und Wederholung Zur Erläuterung starten wr mt enem bekannten Fall aus der enführenden Statstk, ener unvaraten Zufallsvarable y. Dabe wrd üblcherwese angenommen, dass alle Beobachtungen aus der glechen Vertelung gezogen wurden (also dentsch vertelt snd), und dass de enzelnen y unterenander statstsch unabhängg snd. Des wrd üblcherwese mt..d. abgekürzt für ndependent and dentcally-dstrbuted. Zudem nehmen wr an, dass der Erwartungswert von y n der Grundgesamthet

Angewandte Ökonometre 4 µ se (d.h. E(y) = µ), und dass de Varanz der Grundgesamthet ene endlche Zahl σ se (d.h. var(y) = σ ). Durch de Verwendung der grechschen Symbole µ und σ wrd zum Ausdruck gebracht, dass dese Parameter snd, also unbekannte Zahlen der Grundgesamthet. Man beachte, dass de emprsche Varanz, de auf Grundlage von Realsatonen berechnet wrd, mmer ene endlche Zahl st, des muss für de Varanz der Zufallsvarable de für en belebg oft wederholbares Zufallsexperment defnert st ncht gelten. Deser datengenererende Prozess (DGP) wrd kompakt angeschreben als y..d.(µ,σ ) Aus der Statstk wssen wr, dass unter desen Annahmen der Mttelwert ener Zufallsstchprobe ȳ = 1/n y en unverzerrter Schätzer für den Mttelwert der Grundgesamthet µ st E(ȳ) = µ De Vertelung deser Stchprobenmttelwerte ȳ, de man be wederholten Stchprobenzehungen erhält, st ene Stchprobenkennwertvertelung (samplng dstrbuton). In der enführenden Statstk wrd gezegt, dass de Varanz der Mttelwerte glech der Varanz der Grundgesamthet (var(y) := σ ) dvdert durch de Stchprobengröße n st 3 var(ȳ) := σ ȳ = σ n Da de Varanz der Grundgesamthet σ üblcherwese ebenso weng beobachtbar st wedermttelwert µdergrundgesamthet, mussde wahre Varanzσ ebenfallsaus der Stchprobe geschätzt werden. Den Schätzer für de Varanz der Grundgesamthet σ bezechnen wr mt ˆσ. In der enführenden Statstk wrd gezegt, dass m Fall unvarater Vertelungen de Schätzfunkton ˆσ = 1 (y ȳ) n 1 en erwartungstreuer Schätzer für de Varanz der Grundgesamthet σ st. Genau das gleche wollen wr nun für den bvaraten Fall y = β 1 + β x + ˆε zegen, nur untersuchen wr anstelle der Stchprobenkennwertvertelung des Mttelwertes ȳ (der als Schätzer für µ verwendet wrd) de Stchprobenkennwertvertelungen von β 1 und β, de als Schätzer für β 1 und β denen. E(ȳ) = E(1/n y ) = 1/n E(y ) = 1/n(nµ) = µ. 3 var(ȳ) = var(1/n y ) = E[1/n y E(1/n y )] = 1/n E[ (y E(y ))] = 1) 1/n E[(y E(y ))] = ) 1/n (nσ ) = σ /n wenn y..d.(µ,σ ), wobe das = 1) Unabhänggket (d.h. cov(y,y j ) = 0 für j) und = ) Homoskedastztät (d.h. var(y ) = σ ) erfordert.

Angewandte Ökonometre 5 Wr werden uns n desem Kaptel auf determnstsche Regressoren beschränken, de x seen also fxed n repeated samplng. Des erlechtert ncht nur de folgenden Herletungen, sondern auch de Notaton ganz beträchtlch. De Schlussfolgerungen gelten wetgehend auch für stochastsche Regressoren, zumndest wenn de Regressoren ncht mt den Störtermen korrelert snd. Dazu glech mehr. 4.1. Erwartungstreue der geschätzten OLS-Koeffzenten Wr werden nun zegen, dass der OLS Schätzer für den Stegungskoeffzenten 4 β = ĉov(x,y) var(x) (mt = 1,...,n) tatsächlch erwartungstreu st. = (x x)(y ȳ) (x = (x x)y x) (x x) Dazu st es wchtg zu erkennen, dass dese Schätzfunkton für β lnear n den y st, d.h. der Schätzer β kann auch geschreben werden als β = n w y (4.1) =1 mt den Gewchten d.h. β st ene gewchtete Summe der y. w := (x x) j (x j x) Des st unproblematsch, da de x annahmegemäß determnstsch snd ( fxed n repeated samplng). Offenschtlch st β also ene lneare Schätzfunkton; der geschätzte Parameter β st ene Lnearkombnaton der stochastschen y, wobe de w de (determnstschen) Gewchte darstellen, de ene Funkton der x snd. De Gewchte w haben dre wchtge Egenschaften, de wr glech benötgen werden: 1. w = 0 (de Summe der Gewchte st Null) da w = ( ) (x x) j (x = j x) (x x) j (x j x) = 0 mt,j = 1,...,n, wel de Summe der Abwechungen vom Mttelwert mmer Null st, d.h. (x x) = n x n x = 0, wel x := 1 n x!. w = 1/ (x x) 4 Das drtte Glechhetszechen folgt, wel (x x)(y ȳ) = (x x)y (x x)ȳ = (x x)y ȳ (x x) = (x x)y wel (x x) = 0.

Angewandte Ökonometre 6 da w = ( ) (x x) j (x = j x) (x x) ( (x x) ) = 1 (x x) 3. mt,j = 1,...,n. w (x x) = w x = 1 Das erste = glt, wel w = 0, es blebt also nur zu zegen, dass w x = 1 w x = (x x)x (x x) = = = x x x x x x +n x x n x x n x +n x x n x x n x (da x = n x) = 1 Mt desen dre Egenschaften bewaffnet können wr uns nun an den egentlchen Bewes für de Erwartungstreue machen. Bewes der Erwartungstreue: Um de Unverzerrthet (Erwartungstreue) von β zu zegen müssen wr enen Zusammenhang zwschen der Schätzfunkton β und dem entsprechenden Wert β der Grundgesamthet herstellen, und davon den Erwartungswert blden. Dazu wrd n der Regel nach dem folgenden Muster vorgegangen: man setzt den wahren Zusammenhang der Grundgesamthet, d.h. y = β 1 +β x +ε, n de Schätzfunkton β = ĉov(x,y)/ var(x) = w y (sehe (4.1)) en, und bldet anschleßend den Erwartungswert davon. Ensetzen des wahren Zusammenhangs n de Schätzfunkton gbt β = w y = w (β 1 +β x +ε ) = β 1 w +β w x + w ε = β + w ε (4.) da wr gerade gezegt haben, dass w = 0 und w x = 1.

Angewandte Ökonometre 7 Nun blden wr davon den Erwartungswert ( E( β ) = E β + ) w ε = β + E(w ε ) (wel E(β ) = β ) ( ) = β +E (x x)ε (x x) ( ) cov(x,ε) = β +E var(x) (4.3) Daraus folgt, dass der Schätzer β nur dann erwartungstreu st, wenn de erklärende Varable x und de Störterme unkorrelert snd, bzw. wenn cov(x,ε) = 0. Vorscht, des bezeht sch auf de Störterme ε des datengenererenden Prozesses, ncht auf de Resduen ˆε! Aufgrund der Mechank des OLS Schätzers (d.h. aus den Bedngungen 1. Ordnung) folgt mmer x ˆε = 0, d.h. dass de erklärenden Varablen und de Resduen unkorrelert snd, des glt aber nur für de Stchprobe, ncht notwendgerwese für de Störterme ε der Grundgesamthet! Man beachte, dass der zwete Term von Glechung (4.3), d.h. cov(x, ε)/ var(x), auch als Stegungskoeffzent ener Regresson von ε auf x nterpretert werden kann, d.h. wennε = α 1 +α x +ν stα = cov(x,ε)/var(x),deshalbkönnenwrauchschreben E( β ) = β +E(α ). Offenschtlch st OLS-Schätzer β nur dann erwartungstreu, d.h. E( β ) = β, wenn de x mt den Störtermen ε der Grundgesamthet m Erwartungswert unkorrelert snd. Übung: Zegen Se, dass man das selbe Ergebns erhält, wenn man den wahren Zusammenhang y = β 1 +β x +ε n de OLS Schätzfunkton β = cov(x,y)/var(x) ensetzt und den Erwartungswert bldet. Sollten de Störterme mt den erklärenden Varablen korrelert sen, st der OLS Schätzer verzerrt! Ene solche Korrelaton st leder ncht so selten, tatsächlch handelt es sch dabe um enes der graverendsten Probleme der Ökonometre. Regressoren, de mt den Störtermen ε korrelert snd, werden endogene Regressoren genannt, oder man sprcht enfach von enem Endogentätsproblem). Es gbt mehrere Ursachen de zu ener stochastschen Abhänggket zwschen Störtermen ε und erklärenden Varablen x führen. Der vermutlch häufgste Fall snd rrtümlch ncht berückschtgte erklärende Varablen, de sowohl mt y als auch mt ener oder mehreren berückschtgten x Varablen korrelert snd ( omtted varables ). Wetere Bespele snd Fälle, n denen der datengenererenden Prozess durch en smultanes Glechungssystem beschreben wrd und m System feed-backs auftreten, oder auch enfache Messfehler n den x-varablen. In solchen Fällen von Endogentät snd we wr soeben gesehen haben de OLS- Schätzer systematsch verzerrt! Dese teferen Probleme werden wr erst n späteren Kapteln ausführlch dskuteren.

Angewandte Ökonometre 8 Im Moment wollen wr uns das Leben aber noch enfach machen und determnstsche x annehmen. 5 Wenn x determnstsch st, st natürlch auch w determnstsch ( fxed n repeated samplng ), also können de w vor den Erwartungswertoperator gezogen werden. Für determnstsche x recht de wesentlch wenger strenge Annahme E(ε ) = 0, damt der Schätzer unverzerrt st, denn E( β ) = β + w E(ε ) = β wenn E(ε ) = 0 Vel enfacher lässt sch zegen, dass β 1 = ȳ β x ebenfalls en unverzerrter Schätzer für β 1 st E( β 1 ) = E[(β 1 +β x) β x)] = β 1 wenn E( β ) = β. Wr fassen zusammen: β = ĉov(y,x)/ var(x) st en erwartungstreuer (unverzerrter) Schätzer für β, wenn de Störterme der Grundgesamthet ε mt den x unkorrelert snd. Be determnstschen x recht de wesentlch wenger strenge Annahme E(ε ) = 0 für den Bewes der Erwartungstreue von β. 4.1.3 De Varanz und Kovaranz der OLS Schätzer Den Erwartungswert der Schätzfunktonen β 1 und β haben wr berets berechnet und dabe festgestellt, dass cov(x,ε ) = 0 ene notwendge Bedngung für de Erwartungstreue der OLS-Schätzer st. Als nächstes wollen wr de Varanzen der Schätzfunktonen β 1 und β berechnen. Schätzungen für dese Varanzen werden es uns schleßlch erlauben statstsche Tests durchzuführen. De Varanz der Zufallsvarable β st defnert var( β ) = E[ β E( β )] = E[ β β ] (wenn E( β ) = β, sehe oben) ( ) = E w ε (da β = β + w ε ; s. Glechung (4.)) = E ( w 1ε 1 +w ε + +w nε n + +w 1 w ε 1 ε + +w n 1 w n ε n 1 ε n ) ( n ) n n = E +E w w j ε ε j =1 w ε }{{} = σ w wenn homoskedastsch =1 j= j> } {{ } = 0 wenn kene Autokorrelaton (4.4) 5 Man beachte, dass de Kovaranz zwschen ener Zufallsvarable und ener determnstschen Varable mmer Null st. De Kovaranz st defnert cov(y,x) = E[y E(y )][x E(x )], wobe über alle möglchen Ausprägungen aufsummert wrd. Ene determnstsche Varable kann als ene degenererte Zufallsvarable angesehen werden, de nur ene Ausprägung mt Wahrschenlchket Ens annmmt; für determnstsche x glt also x = E(x ), weshalb cov(y,x) = 0.

Angewandte Ökonometre 9 Deser letzte Ausdruck st mt all den Kreuztermen etwas unappettlch lang. Außerdem enthält er wet mehr als n Unbekannte (Kreuz-)Produkte von Störtermen, es wäre also völlg ausschtslos dese Varanz aus ener Stchprobe schätzen zu wollen. Um her weter zukommen benötgen wr zusätzlche Annahmen über de Störterme ε. Ene radkale Annahme, de das Problem allerdngs massv verenfacht, st ε..d. ( 0,σ ) Des st ene sehr kompakte Schrebwese für ε st unabhängg und dentsch vertelt (..d. steht für ndependent and dentcally dstrbuted )mte(ε ) = 0undvar(ε ) = σ ; das heßt, vor der Klammer steht de Art der Vertelung, das erste Argument n der Klammer st der Erwartungswert, das zwete Argument de Varanz (generell werden n der Klammer de Parameter der Vertelung angegeben, n desem Fall snd des Erwartungswert und Varanz). Im enzelnen umfasst des folgende Annahmen: 1. alle Störterme ε snd dentsch vertelt (d.h. werden aus der glechen Vertelung gezogen); des kommt m zweten von..d. (dentcally dstrbuted) zum Ausdruck. Des mplzert auch, dass de Varanz aller Störterme ε glech groß st, also enfach ene reelle Zahl σ st. Anders ausgedrückt, alle ε haben de gleche endlche Varanz σ. Ist dese Annahme erfüllt sprcht man von homoskedastschen Störtermen, st de Annahme verletzt sprcht man von heteroskedastschen Störtermen (oder enfach von Heteroskedastztät). Genauer genommenstbeheteroskedastztät debedngte Varanz var(ε x)enefunkton der erklärenden Varable, d.h. var(ε x) = σ (x).. Unabhänggket der Zehungen, d.h. E(ε ε j ) = 0 für j (des mplzert auch cov(ε,ε j ) = 0 für j); des kommt m ersten von..d. (ndependent) zum Ausdruck. Wenn dese Annahme verletzt st sprcht man von Autokorrelaton der Störterme. 3. E(ε ) = 0: Dese Annahme haben wr berets für den Bewes der Erwartungstreue benötgt. (Wenn de x stochastsch snd wrd de wesentlch strengere Annahme E(ε x ) = 0 benötgt, d.h. der bedngte Erwartungswert der ε muss Null sen. Damt werden wr uns erst später beschäftgen.) Um Glechung (4.4) zu verenfachen benötgen wr de ersten zwe deser dre Annahmen, d.h. E(ε ) = σ (Homoskedastztät) und E(ε ε j ) = 0 für j (Unabhänggket). Wennde Annahme E(ε ε j ) = 0erfüllt st (d.h. kene Autokorrelaton vorlegt) fallen de Kreuzterme n Glechung (4.4) weg, deshalb glt n desem Fall ( ) var( β ) = E w ε Wenn de x (und damt automatsch auch de w ) determnstsch snd können de w vor den Erwartungswertoperator gezogen werden var( β ) = w E(ε )

Angewandte Ökonometre 10 Wenn zusätzlch de erste Annahme E(ε ) = σ (kene Heteroskedastztät) erfüllt st glt schleßlch var( β ) = w σ = σ w da σ en fxer Parameter der Grundgesamthet st. Nun haben wr berets vorhn gezegt (Sete 5), dass w = ẍ ( ẍ ) = 1 (x x). Deshalb st de Varanz des OLS-Schätzers β glech var( β ) = σ (x x) Man beachte, dass des nur glt, wenn alle Annahmen erfüllt snd, de wr zur Herletung benötgt haben; konkret snd des Exogentät der Regressoren (cov(x, ε) = 0) und ε..d.(0,σ ), wobe de zwete Annahme mplzert E(ε ) = 0, cov(ε,ε j ) = 0 für j (kene Autokorrelaton) und var(ε ) = σ (kene Heteroskedastztät). Ähnlch (wennglech etwas mühsamer) kann man zegen, dass de Varanz des Interzepts ˆβ 1 folgendermaßen berechnet werden kann: var( β 1 ) = E[ β 1 E( β 1 )] = σ x n ẍ Da β 1 und β Zufallsvarablen snd kann man auch de Kovaranz zwschen den beden Schätzern berechnen. Dese st defnert cov( β 1, β ) = E{[ β 1 E( β 1 )][ β E( β )]} = E[( β 1 β 1 )( β β )] Wr ernnern uns, dass β 1 = ȳ β x und be Erwartungstreue von β glt E( β 1 ) = ȳ β x. Daraus folgt β 1 E( β 1 ) = x( β β ). Wenn wr des oben ensetzen erhalten wr cov( β 1, β ) = E[( β 1 β 1 )( β β )] = xe( β β ) = xvar( β ) De Kovaranzen zwschen Schätzern werden wr später für Tests von gemensamen Hypothesen ( jont hypothess ) benötgen. Wr fassen zusammen: unter den bsher getroffenen Annahmen determnstscher x und ε..d.(0,σ ) glt E( β ) = β var( β ) = σ [x x] E( β 1 ) = β 1 var( β 1 ) = σ x n [x x] cov( β 1, β ) = xσ [x x]

Angewandte Ökonometre 11 4.1.4 En Schätzer für de Varanz der Störterme σ Nun haben wr zwar enen Schätzer für β 1 und β sowe ene Formel für deren Varanzen, aber n desen Formeln für de Varanzen kommt de unbekannte Varanz der Störterme der Grundgesamthet σ vor. Da wr dese ncht beobachten können müssen wr als nächstes ene erwartungstreue Schätzfunkton ˆσ für das wahre σ der Grundgesamthet herleten. Leder kommt das σ n dem nach der OLS Methode zu mnmerenden Ausdruck mn (y β 1 β x ) ncht vor, deshalb müssen wr m folgenden enen ndrekten und telwese etwas mühsamen Weg gehen, um enen Schätzer für σ zu erhalten. 6 Wr ernnern uns, das wahre Modell der Grundgesamthet st und für de Mttelwerte glt 7 y = β 1 +β x +ε ȳ = β 1 +β x+ ε Das Modell mt mttelwerttransformerten Daten (d.h. n Abwechungsform) st also y ȳ = β (x x)+(ε ε) Man beachte, dass das Interzept β 1 be der Dfferenzenbldung wegfällt. Wr snd an enem Schätzer für de Varanz der unbeobachtbaren Störterme der Grundgesamthet ε nteressert. Da wr dese ncht kennen st es nahelegend, dazu von den beobachtbaren Stchprobenresduen ˆε auszugehen. Deshalb versuchen wr enen Zusammenhang zwschen den Störtermen der Grundgesamthet ε und den Stchprobenresduen ˆε herzustellen (bzw. zwschen deren Varanzen). Um de Schrebwese etwas zu Verenfachen kennzechnen wr m Folgenden mttelwerttransformerte Daten mt zwe Punkten über der Varable, d.h. ẍ := (x x) Wr begnnen damt, den wahren Zusammenhang der Grundgesamthet ÿ = β ẍ + (ε ε) n den Stchproben-Zusammenhang ˆε = ÿ β ẍ enzusetzen und erhalten ˆε = β ẍ +(ε ε) β ẍ = (β β )ẍ +(ε ε) Wr snd letztendlch an ener Varanz nteressert, deshalb quadreren wr desen Ausdruck ˆε = ( β β ) ẍ +(ε ε) ( β β )ẍ (ε ε) und summeren über alle n Beobachtungen auf (beachte, dass n =1ẍ = 0) ˆε = ( β β ) ẍ + (ε ε) ( β β ) ẍ ε und nehmen von beden Seten den Erwartungswert ] E [ˆε = E( β β ) [ ] ẍ +E (ε ε) E [( β β ) ] ẍ ε }{{}}{{}}{{} A B C 6 De folgenden Ausführungen halten sch eng an Gujarat 1995. 7 y = nβ 1 +β x + ε. Dvderen durch n gbt ȳ = β 1 +β x+ ε.

Angewandte Ökonometre 1 De folgende Rechnere st etwas umständlch, se werden später sehen, dass sch des n Matrxschrebwese deutlch enfacher darstellen lässt. Nun aber ans Werk! Wr haben berets gezegt dass var( β ) = E( β β ) = σ ẍ := Daraus folgt, dass der erste Term A = σ. σ (x x) Der zwete Term B = E[ (ε ε) ] = (n 1)σ, wenn de ε..d.(0,σ ). Bewes: Zuerst st zu beachten, dass der Störterm ε ene von n verschedenen Zufallsvarablen st, da = 1...,n). Wr haben angenommen, dass E(ε ) = 0, d.h. wenn wr über alle möglchen mt den Wahrschenlchketen gewchteten Ausprägungen der enen Zufallsvarable ε aufsummeren st dese gewchtete Summe Null. Daraus folgt aber ncht, dass n =1 ε = 0, denn her summeren wr über n verschedene Zufallsvarablen auf! De Bedngungen erster Ordnung für de OLS Schätzer garanteren zwar, dass für de Resduen glt n =1 ˆε = 0 (sofern de Regresson en Interzept enthält), des muss aber ncht für de Störterme ε gelten! Weters ernnern wr uns, dass var(ε ) := E[ε E(ε )] = E(ε ) = σ wenn de nsgesamt n Störterme alle homoskedastsch und ncht autokorrelert snd. [ ] E (ε ε) [ ] = E (ε ε ε+ ε ) = E ( ( ) ε ε 1 1 ε j )+ ε j n n j j = E(ε ) E [ ] 1 n (ε ε j ) + E j = nσ n E(ε ) + ( ) 1 E(ε n j ) j = nσ σ + ( ) 1 σ n n = nσ σ +σ = (n 1)σ j ( 1 n j ) ε j wenn E(ε ) = σ und E(ε ε j ) = 0 für j mt,j = 1,...,n. Dabe haben wr wederholt von den Annahmen E(ε ) = σ und E(ε ε j ) = 0 für j (d.h. Homoskedastztät und Unabhänggket) Gebrauch gemacht. Das mplzert, dass das folgende Ergebns nur be Homoskedastztät und Unabhänggket glt! Hnwes: Um z.b. zu sehen, dass E [ ( )] 1 ε ε j = n j n E(ε ) = σ

Angewandte Ökonometre 13 empfehlt es sch de nnere Summe auszuschreben E [ ] 1 n ε (ε 1 +ε + +ε + +ε n ) = [ E(ε ε 1 )+E(ε ε )+ +E(ε n )+ +E(ε ε n ) ] = E(ε n ) = σ wenn (und nur wenn!) E(ε ) = σ und E(ε ε j ) = 0 für j, d.h. wenn de Störterme homoskedastsch und ncht autokorrelert snd. Falls dese Bedngungen verletzt snd gelten de letzten beden letzten Glechhetszechen ncht! Dese Fälle werden wr später n den Kapteln über Heteroskedastztät und Autokorrelaton ausführlcher dskuteren. Übungsaufgabe: Zegen Se, dass E( ε ) = σ /n. Welche Annahmen snd dazu erforderlch? Für den drtten Term C = E [( β β ) ] ẍ ε berückschtgen wr, dass β = ẍÿ ẍ = ẍ(β ẍ +ε ) ẍ = β + ẍε weshalb ẍε = ( β β ) ẍ. Ensetzen n C = E [( β β ) ] ẍ ε unter Berückschtgung von var( β ) = E[ β E( β )] = σ / ẍ gbt [ ] C = E ( β β ) ẍ = σẍ ẍ ẍ = σ Wr fassen nun de Terme A = σ, B = (n 1)σ und C = σ zusammen ] E [ˆε = σ +(n 1)σ σ = (n )σ Daraus können wr weder enen erwartungstreuen Schätzer für de Varanz der Grundgesamthet σ bestmmen, denn aus der letzten Glechung folgt Wr defneren nun en E( ˆε ) n ˆσ = = σ (4.5) ˆε n denn aufgrund Glechung (4.5) glt E(ˆσ ) = σ, also st ˆσ en erwartungstreuer Schätzer für σ! Wr können also tatsächlch aus den Stchprobenresduen ˆε enen erwartungstreuen Schätzer ˆσ fürdevaranzder Störtermeder Grundgesamthet σ berechnen, ndem wrdequadratsummeder Resduen ˆε durch de Anzahl der Frehetsgrade n dvderen.

Angewandte Ökonometre 14 De Wurzel deses erwartungstreuen Schätzers wrd n der Lteratur Standardfehler der Regresson ( standard error of regresson oder standard error of estmate ) genannt ˆσ = ˆε n (4.6) Man beachte aber, dass wr für de Herletung wederholt de Annahme gemacht haben, dass de Varanz der Störterme konstant st, E(ε ) = σ (d.h. kene Heteroskedastztät vorlegt), und dass de Störterme unterenander unkorrelert snd, E(ε ε j ) = 0 für j (d.h. kene Autokorrelaton vorlegt), und dass der Regressor x exogen st (d.h. cov(x,ε) = 0). Ist mndestens ene deser Annahmen verletzt wrd der nach obger Formel berechnete Standardfehler der Regresson falsche Ergebnsse lefern, d.h. en verzerrter Schätzer für σ sen. 8 Standardfehler der Koeffzenten: Durch Ensetzen deses Schätzers für den Standardfehler der Regresson n de Formeln für de Varanzen der Koeffzenten erhalten wr Schätzer für de Varanzen der Koeffzenten var( β ) := ˆσ β = ˆσ [x x], var( β 1 ) := ˆσ β1 = ˆσ x n [x x] und de Wurzeln daraus snd de Standardfehler der Koeffzenten ˆσ ŝe( β ) := = ˆσ β [x x], ŝe( β ˆσ 1 ) := = x ˆσ β1 n [x x] Frehetsgrade: Wr haben gesehen, dass wr zur Berechnung enes erwartungstreuen Schätzers für σ de Quadratsumme der Stchprobenresduen ˆε durch n dvderen müssen, ncht durch n, we man das ad hoc erwarten würde. Warum st das so? De Schätzung von Parametern st eng verbunden mt der jewels zur Verfügung stehenden Informaton. Für ene ntutve Erklärung ernnern wr uns an de Herletung des OLS-Schätzers. Dazu haben wr folgenden Ausdruck mnmert n n mn ˆε = mn (y β 1 β ) x β 1, β β 1, β =1 =1 Für jeden zu schätzenden Parameter erhalten wr ene Bedngungen erster Ordnung ˆε = ( y β 1 β ) x = 0 ˆε = 0 β 1 }{{} ˆε ˆε = ( y β 1 β ) x x = 0 xˆε = 0 β }{{} ˆε 8 Man beachte aber, dass wr de beden ersten Annahmen ncht benötgt haben, um de Erwartungstreue der Schätzer β 1 und β zu zegen.

Angewandte Ökonometre 15 Dese beden Glechungen legen ene Restrkton auf de Resduen. Wenn wr z.b. nur de Resduen ˆε 1,ˆε,...,ˆε n kennen würden, könnten wr de beden fehlenden Resduen ˆε n 1 und ˆε n mt Hlfe deser beden Bedngungen 1. Ordnung ˆε = x ˆε = 0 berechnen. 9 Zwe der Resduen snd deshalb ncht fre, sondern 0, snd durch de Bedngungen erster Ordnung determnert, und enthalten deshalb kene Informaton über de Störterme der Grundgesamthet ε. Da wr für jeden zu schätzenden Parameter ene Bedngung erster Ordnung haben, verleren wr mt jedem geschätzten Parameter enen Frehetsgrad. In desem Fall haben wr zwe Parameter geschätzt ( β 1 und β ), deshalb verleren wr zwe Frehetsgrade. Mt Hlfe des Schätzers ˆσ (Standardfehler der Regresson) können wr nun de erwartungstreuen Schätzer für de Varanz der Parameter β 1 und β, d.h. ˆσ β1 und ˆσ β aus den Stchprobendaten berechnen, de uns später de Durchführung statstscher Tests ermöglchen wrd. Wr fassen nochmals zusammen: β = ŝe( β ) := ˆσ β = (x x)(y ȳ) (x x) ˆσ (x x) β 1 = ȳ β x ˆσ ŝe( β 1 ) := = x ˆσ β1 n (x x) cov( β 1, β ) = xˆσ (x x) ˆσ = ˆε n Damt haben wr de wesentlchen Elemente besammen. De Standardfehler der Schätzer snd en Maß für de Genaugket der Schätzer, d.h. en Schätzer st ceters parbus umso genauer, je klener sen Standardfehler st. Man beachte, dass de Standardfehler de gleche Dmenson haben we de Koeffzenten, deshalb st ncht de absolute Größe des Standardfehlers entschedend, sondern sene Größe m Verhältns zum Koeffzenten. Als Faustregel kann man sch merken, dass der Standardfehler höchstens halb so groß sen sollten we der dazugehörge Koeffzent; mehr dazu m Kaptel über Hypothesentests. 9 Stellen Se sch vor, Se kennen von dre Resduen nur zwe, z.b. ˆε 1 = 3 und ˆε = +1. Wenn Se wssen, dass de Resduen de Bedngung 3 =1 ˆε = 0 erfüllen, können Se daraus sofort schleßen, dass ˆε 3 = sen muss.

Angewandte Ökonometre 16 y σ st klen y σ st groß x x Abbldung 4.1: Regressonen mt unterschedlcher Varanz von ε (σ ). y y x x Abbldung 4.: Unterschedlche Streuung der erklärenden x Varable. In der lnken Abbldung streut x stark, n der rechten Abbldung st de Streuung von x deutlch klener. Wovon hängt nun de Größe des Standardfehlers ab? Wr wollen uns vorerst auf den mest nteresserenden Standardfehler des Stegungskoeffzenten β beschränken. Ceters parbus st der Standardfehler ˆσ ŝe( β ) = n =1 (x x) umso klener,... 1....je klener de Varanz der Störterme der Grundgesamthet σ st (zur Ernnerung, ˆσ st en Schätzer für σ ). Abbldung 4.1 zegt zwe Stchproben, de sch nur n der Varanz der Grundgesamthet σ unterscheden.....je größer de Streuung der x st (d.h. je größer (x x) ). Abbldung 4. zegt zwe Stchproben mt glechem σ, de sch nur n der Streuung der x unterscheden. Offenschtlch st de Schätzung umso genauer, je größer de Streuung der x st! 3....je größer der Stchprobenumfang n st, da der Nenner n =1 (x x) mt dem Stchprobenumfang n zunmmt. Offenschtlch können wr β umso genauer schätzen, je größer de Stchprobe st.

Angewandte Ökonometre 17 4. Im multplen Regressonsmodell mt mehreren Regressoren kommt noch ene verte Determnante dazu; ceters parbus st der Standardfehler enes Koeffzenten umso klener, je wenger der entsprechende Regressor mt allen anderen Regressoren korrelert st. Des wrd m Folgenden etwas näher erläutert. Standardfehler der Koeffzenten m multplen Regressonsmodell De Herletung der Standardfehler für Regressonsmodelle mt mehreren erklärenden x Varablen st n Summennotaton etwas umständlch, deshalb wrd her nur das Ergebns vorweggenommen, de Detals folgen, wenn wr de Matrxschrebwese enführen. Für das multple Regressonsmodell y = β 1 + β x + β 3 x 3 + + β h x h + + β k x k + ˆε kann man zegen, dass en Schätzer für den Standardfehler enes belebgen Stegungskoeffzenten β h durch den folgenden Ausdruck gegeben st ˆσ ŝe( β h ) = (1 Rh ) (x (4.7) x) Deser Standardfehler unterschedet sch nur durch den Term (1 Rh ) m Nenner vom Standardfehler für den bvaraten Fall. Das Bestmmthetsmaß Rh wrd aus folgender Hlfsregresson berechnet x h = α 1 + α x + + α h 1 x h 1 + α h+1 x h+1 + + α k x k +ν R h Dabe wrd der nteresserenden Regressor x h auf alle anderen Regressoren regressert. Offenschtlch st das Bestmmthetsmaß Rh deser Hlfsregresson umso größer, je stärker der Regressor x h mt allen anderen Regressoren korrelert st. Aus Glechung (4.7) st erschtlch, dass der Standardfehler ŝe( β h ) ceters parbus umso größer st, je näher das R h be Ens legt. In anderen Worten, der Schätzer β h st ceters parbus umso ungenauer, je größer de lneare Abhänggketen zwschen x h und allen anderen Regressoren st. Desen Fall werden wr später unter dem Begrff Multkollneartät ausführlch dskuteren. Im Extremfall, wenn es ene lneare Abhänggket zwschen den Regressoren gbt, st das Rh exakt glech Ens, deshalb st der Nenner des Standarsfehlers (4.7) glech Null, d.h. der Standardfehler st ncht defnert. Deser Extremfall wrd perfekte Multkollneartät genannt.

Angewandte Ökonometre 18 4. Gauss-Markov Theorem Bewesen muss ch desen Käs, sonst st de Arbet unserös. (F. Wlle) Bsher haben wr uns ausschleßlch mt der Erwartungstreue des OLS-Schätzers und mt der Schätzung von dessen Varanz beschäftgt. In desem Abschntt werden wr nun de Effzenz des OLS-Schätzers bewesen. Das Gauss-Markov Theorem besagt nämlch, dass der OLS-Schätzer unter bestmmten Annahmen von allen möglchen lnearen und erwartungstreuen Schätzfunktonen de klenste Varanz hat, bzw. Unter den (Gauss schen) Annahmen des klassschen lnearen Regressonsmodells hat der OLS-Schätzer nnerhalb der Klasse aller lnearen und erwartungstreuen Schätzfunktonen de klenste Varanz, oder n anderen Worten, er st BLUE, d.h. en Best Lnear Unbased Estmator. DeOLS-Schätzfunktonst wewrberetsgesehenhaben lnear,da β = w y. Wr werden nun zegen, dass wenn de unten angeführten Gauss-Markov Annahmen erfüllt snd der OLS-Schätzer effzent st, d.h. var( β OLS ) var( β ) wobe β jede belebge lneare und erwartungstreue Schätzfunkton für β sen kann. Das Gauss-Markov Theorem und de zugrunde legenden Gauss-Markov Annahmen spelen n der Ökonometre ene ähnlch fundamentale Rolle we das Modell vollständger Konkurrenz n der Mkroökonomk, se stellen das Referenzmodell schlechthn dar. Enen Großtel der restlchen Veranstaltung werden wr uns mt Fällen beschäftgen, wenn de Gauss-Markov Annahmen ncht erfüllt snd. 4..1 Bewes für de Effzenz des OLS-Schätzers (Gauss-Markov Theorem) Der Bewes der Effzenz des OLS-Schätzers st ener der Höhepunkte jeder enführenden Ökonometre-Veranstaltung, geneßen Se also das Folgende.10 De Grunddee deses Beweses funktonert folgendermaßen: 1. Wr gehen von ener belebgen lnearen Schätzfunkton aus.. Wr ermtteln de notwendgen Bedngungen, unter denen dese lneare Schätzfunkton erwartungstreu st. 3. Wr mnmeren de Varanz deser belebgen lnearen Schätzfunkton unter der Nebenbedngung, dass dese lneare Schätzfunkton erwartungstreu st. 10 Wer mt dem Geneßen Probleme hat se getröstet, Se werden n der Veranstaltung auch noch Anwendungsorenterteres erleben.

Angewandte Ökonometre 19 4. Wr werden sehen, dass de aus der Mnmerung resulterende also varanzmnmale Schätzfunkton genau der OLS-Schätzer st. Deshalb st der OLS Schätzer varanzmnmal. Allerdngs werden wr m Laufe der Bewesführung enge Annahmen benötgen, de sogenannten Gauss-Markov Annahmen. Selbstverständlch glt der Bewes nur, falls dese Annahmen tatsächlch gültg snd. Deshalb st es ratsam genau darauf zu Achten, an welcher Stelle welche Annahmen getroffen werden müssen. Also los, wr begnnen mt dem Stegungsparameter β. Um de Effzenz des OLS- Schätzers β zu bewesen mnmeren wr de Varanz ener belebgen lnearen Schätzfunkton β (sprch β Schlange) β = n c y =1 wobe de c (belebge) determnstsche Gewchte snd, de natürlch ene Funkton der x sen können. Der Bewes soll außerdem nur für erwartungstreue Schätzfunktonen gelten, d.h. wr müssen zuerst de notwendgen Bedngungen ermtteln, unter denen de lneare Schätzfunkton β = n =1 c y erwartungstreu st. Erwartungstreue bedeutet E( β ) = β Ensetzen des obgen Schätzers gbt: E( β ) = E( c y ) = c E(y ) (da c determnstsch) = c (β 1 +β x ) [da y = β 1 +β x +ε und E(ε ) = 0] = β 1 c +β c x = β wenn c = 0 und c x = 1 Das heßt, damt β = c y en unverzerrter Schätzer für β st müssen de Bedngungen c = 0 und c x = 1 erfüllt sen. 11 Nun mnmeren wr de Varanz von β unter desen beden Nebenbedngungen für Unverzerrthet. De Varanz von β st ( ) var( β ) = var c y = c var(y ) (wel de y statstsch unabhängg snd) = c σ = σ c 11 Man beachte, dass de Gewchte w = ẍ / j ẍ j auf Sete 5 dese Bedngungen erfüllten.

Angewandte Ökonometre 0 da unter den Annahmen determnstscher x und E(ε ) = 0 glt var(y ) = var(ε ) = σ,wel var(y ) := E[β 1 +β x +ε E(β 1 +β x +ε )] = E[ε E(ε )] ) = E(ε ) = σ. Man beachte, dass wr dabe auch von den Gauss-Markov Annahmen über den Störterm ε..d.(0,σ ) (d.h. unter anderem, kene Autokorrelaton und kene Heteroskedastztät) Gebrauch gemacht haben. Wr suchen nun de Gewchte c 1,c,...,c n, de de Varanz von β unter den Nebenbedngungen c = 0 und c x = 1 (Erwartungstreue) mnmeren. Des st ene enfache Mnmerungsaufgabe unter Nebenbedngungen und kann z.b. mt der Lagrange Methode enfach gelöst werden. Da wr zwe Nebenbedngungen haben benötgen wr zwe Lagrangemultplkatoren λ 1 und λ. De Lagrangefunkton st L(c 1,...,c n,λ 1,λ ) = σ c λ 1 ( c ) und de Bedngungen erster Ordnung für en Optmum snd L c 1 = c 1 σ λ 1 λ x 1 = 0 L c = c σ λ 1 λ x = 0. L = c n σ λ 1 λ x n = 0 c n L = c = 0 λ 1 L = c x 1 = 0 λ ( ) λ c x 1 Ausdesenn+GlechungenkönnendeUnbekanntenc 1,...,c n,λ 1 undλ berechnet werden. De ersten n Glechungen können geschreben werden als Aufsummeren deser Glechungen gbt c 1 = 1 σ (λ 1 +λ x 1 ) c = 1 σ (λ 1 +λ x ). c n = 1 σ (λ 1 +λ x n ) c = 1 σ (nλ 1 +λ x ) = 0 da c = 0 ene Bedngung erster Ordnung st.

Angewandte Ökonometre 1 Als nächstes können wr de erste Glechung des obgen Glechungssystems mt x 1, de zwete mt x usw. multplzeren c 1 x 1 = 1 σ (λ 1x 1 +λ x 1 ) c x = 1 σ (λ 1x +λ x ). c n x n = 1 σ (λ 1x n +λ x n ) Aufsummeren gbt ( ) c x = 1 λ σ 1 x +λ (x ) = 1 wobe c x = 1 weder ene Bedngung erster Ordnung st. Desebeden Glechungen könnennach λ 1 undλ gelöst werden (ncht so schüchtern, versuchen Se s ruhg mal!) λ 1 = λ = σ x n( x ) ( x ) nσ n( x ) ( x ) Dese Glechungen können schleßlch n engesetzt werden und geben de Lösung Deshalb st c = c = 1 σ (λ 1 +λ x ) nx j x j n( j x j ) ( j x j) = (x x) j (x j x) β = n c y = =1 (x x)y (x x) ene effzente(d.h. erwartungstreue und varanzmnmale) Schätzfunkton. Aber des st genau de Glechung des OLS-Schätzers. Damt haben wr gezegt, dass der OLS- Schätzer tatsächlch de mnmale Varanz unter allen lnearen erwartungstreuen Schätzfunktonen hat, wenn de Gauss-Markov Annahmen erfüllt snd. qed Deser Ansatz lefert auch ene alternatve Möglchket de Varanz von β zu berechnen, denn wr haben vorhn gezegt, dass var( β ) = σ c. Wr multplzeren nx j c = x j n( j x j ) ( j x j)

Angewandte Ökonometre mt c und Summeren über alle (für,j = 1,...,n) c = n (c x ) c j x j n( j x j ) ( j x j) Da c = 0 und c x = 1 folgt also c = n n( x ) ( x ) var( β ) = (x x) Des st wederum exakt de Varanz des OLS-Schätzers. Ähnlch kann en BLU 1 Schätzer für β 1 und dessen Varanz berechnet werden: σ β 1 = ȳ β x var( β 1 ) = σ ( x ) n ẍ Ene allgemenere untere Abschätzung der Varanzen ener erwartungstreuen Schätzfunkton erlaubt de Rao-Cramer sche Unglechung (sehe z.b. Kmenta 1990, S. 160f, Frohn 1995). Übungsaufgabe: Zegen Se, dass (x ) 1 n ( x ) = (x x). Hnwes: es st enfacher zu zegen, dass (x x) glech (x ) 1 n ( x ) st. Wr haben für den Gauss-Markov Bewes ene Rehe von Annahmen benötgt, de wr telwese auch schon für de Herletung des Schätzers für σ verwendet haben. Wr werden nun dese Annahmen noch enmal ausführlch und etwas überschtlcher zusammenfassen. 4.. Annahmen des klassschen lnearen Regressonsmodells (CLRM) Her fassen wr noch enmal de Annahmen zusammen, de für den Bewes der Effzenz des OLS Schätzers benötgt wurden: A1 Der datengenererende Prozess wrd durch de lneare Funkton y = β 1 +β x +ε korrekt beschreben, oder n anderen Worten, de wahre Bezehung zwschen der erklärenden Varablen x und der zu erklärenden Varablen y (d.h. de Populaton Regresson Functon ) st lnear n den Parametern. 1 BLUE bedeutet Best Lnear Unbased Estmator, man sprcht also von von enem BLU Schätzer.

Angewandte Ökonometre 3 A De Anzahl der zur Verfügung stehenden Beobachtungen st mndestens so groß we de Anzahl der zu schätzenden Koeffzenten, und es gbt kene exakte lneare Abhänggket zwschen den erklärenden Varablen. Für das bvarate Modell y = β 1 +β x +ε bedeutet des, dass n und dass x ken Velfaches der Regressonskonstanten sen darf, d.h., dass x mndestens zwe verschedene Ausprägungen haben muss. Für das multple Regressonsmodell mt k erklärenden Varablen mplzert des, dass n k sen muss, und dass kene erklärende Varable sch als Lnearkombnaton der restlchen erklärenden Varablen darstellen lässt (kene perfekte Multkollnaeartät). Falls dese Annahme verletzt st exstert kene endeutge Lösung für den OLS Schätzer! A3 De Störterme ε snd ncht mt den erklärenden Varablen x korrelert, bzw. cov(x,ε) = 0. Für stochastsche x wrd wrd stochastsche Unabhänggket gefordert, d.h. E(ε x) = E(ε ) = 0 Im Folgenden werden wr darüber hnaus häufg annehmen, dass de erklärenden Varablen x determnstsch snd, d.h. de x werden be wederholten Stchprobenzehungen ( repeated samplng ) als fest gegebene (determnstsche) Größen angenommen. In desem Fall und wenn de PRF korrekt spezfzert wurde (Annahme 1) recht de wesentlch wenger strenge Annahme E(ε ) = 0. Wenn dese und alle vorhergehenden Annahmen erfüllt snd st der OLS Schätzer unverzerrt; ene Verletzung deser Annahme führt zu enem Bas des OLS Schätzers. A4 De nsgesamt n Störterme ε haben alle de gleche Vertelung mt Erwartungswert Null und Varanz σ, und snd darüber hnaus unterenander unkorrelert. Des wrd kompakt geschreben als ε..d.(0,σ ) wobe..d. für ndependent and dentcally dstrbuted steht. De Annahme E(ε ) = 0 haben wr berets vorher getroffen, darüber hnaus fordert dese Annahme 1. Homoskedastztät: alle ε haben de gleche konstante Varanz σ. Etwas genauer fordert dese Annahme, dass de bedngten Varanzen der Störterme glech sen müssen, d.h. var(ε x) = E(ε x) = σ Wenn de Störterme dese Annahme verletzen sprcht man von Heteroskedastztät. Abbldung 4.3 zegt zwe Bespele für Heteroskedastztät, n der lnken Abbldung nmmt de Varanz der Störterme mt x zu, n der rechten Abbldung nmmt se ab.

Angewandte Ökonometre 4 600 Y vs. X 900 Y vs. X Y 500 400 300 00 100 0-100 -00 0 0 40 60 80 100 X Y 800 700 600 500 400 300 00 0 0 40 60 80 100 X Abbldung 4.3: Heteroskedastsche Störterme: De Varanz der Störterme σ st ncht konstant, sondern hängt von x ab.. De Störterme ε der Grundgesamthet snd ncht autokorrelert, d.h. de (bedngte) Korrelaton zwschen zwe belebgen Störtermen ε und ε j für j st glech Null: E(ε ε j x) = 0 für j We berets mehrfach erwähnt mplzert dese Annahme auch cov(ε,ε j x) = 0 (Achtung: der Umkehrschluss glt ncht, aus ener Kovaranz von Null folgt ncht notwendgerwese stochastsche Unabhänggket, da de Kovaranz nur lneare Abhänggketen msst). Abbldung 4.4 zegt zwe Fälle mt autokorrelerten Störtermen. Falls de Annahme ε..d.(0,σ ) verletzt st, aber alle vorhergehenden Annahmen erfüllt snd, st der OLS Schätzer zwar unverzerrt, aber ncht effzent. Nur wenn alle ver vorhergehenden Annahmen erfüllt snd st der OLS Schätzer effzent! 4.3 Asymptotsche Egenschaften ( Große Stchprobenegenschaften ) Wr haben bsher Schätzfunktonen für β 1 und β hergeletet, de es uns erlauben aus den beobachtbaren Daten ener Stchprobe Schätzungen für de nteresserende Parameter ener unbekannten Grundgesamthet zu berechnen. Um de Anwendbarket deser Schätzer unter verschedenen Bedngungen beurtelen zu können, müssen deren Egenschaften beurtelt werden können. Bsher haben wr zwe Egenschaften von Schätzfunktonen untersucht, nämlch Unverzerrthet und Effzenz. Dese Egenschaften gelten unabhängg von der Stchprobengröße, also auch n klenen Stchproben. Deshalb werden dese Egenschaften häufg Klene-Stchproben Egenschaften genannt. In manchen Fällen können auch

Angewandte Ökonometre 5 Postve Autokorrelaton: Negatve Autokorrelaton: 60 10 40 80 60 0 40 40 0 0 0-0 60 40 0 0-40 -0-40 -40 0-0 -40-60 5 10 15 0 5 30 35 40 45 50 55 60 65 70 75 80-60 5 10 15 0 5 30 35 40 45 50 55 60 65 70 75 80 Resdual Actual Ftted Resdual Actual Ftted Abbldung 4.4: Autokorrelerte Störterme: cov(ε,ε j ) 0 für j. Im Fall postver Autokorrelaton st en Vorzechenwechsel der Störterme seltener als für..d. Störterme, m Fall negatver Autokorrelaton st en Vorzechenwechsel der Störterme häufger als für..d. Störterme. de Stchprobenkennwertvertelungen von solchen Schätzern allgemen ermttelt werden, zum Bespel de Vertelung der Mttelwerte aus wederholten Zufallsstchprobenzehungen, de aus ener normalvertelten Grundgesamthet gezogen wurden. Aber oft snd wesentlche Annahmen verletzt, de zur Herletung der Klene Stchprobenegenschaften benötgt wurden, und deshalb können n komplzerteren Fällen Egenschaften we Erwartungstreue oder Effzenz häufg ncht bewesen werden. In solchen Fällen wrd mest auf sogenannte Große-Stchproben Egenschaften (asymptotsche Egenschaften) zurückgegrffen, de häufg unter wenger restrktven Annahmen bewesen werden können. Am enfachsten können de grundlegenden asymptotschen Konzepte anhand der Vertelung des Mttelwertes ener Zufallsvarablen veranschaulcht werden. Se X ene Zufallsvarable mt unbekannter Dchtefunkton, von der aber bekannt st, dass deren Momente Mttelwert µ und Varanz σ fxe Zahlen snd (d.h. ncht unendlch groß snd). Wr stellen uns vor, dass aus deser Vertelung n Zahlen gezogen werden und daraus der Stchprobenmttelwert x n berechnet wrd, wobe das tefgestellte n angbt, auf wevelen Beobachtungen der Stchprobenmttelwert beruht. ImFolgendenuntersuchen wrenefolge von Schätzfunktonen ˆµ n untersuchen, denn wenn zusätzlche Beobachtungen dazukommen, ändert sch n der Regel auch de Schätzfunkton. Für den enfachen Stchprobenmttelwert st ene solche Folge von Schätzfunktonen z.b. { {ˆµ} n = x 1, x 1 +x, x 1 +x +x 3,..., x } 1 +x + +x n 3 n Dese Mttelwerte snd natürlch selbst weder Zufallsvarablen mt Dchtefunktonen f(ˆµ n ). De asymptotsche Theore untersucht unter anderem, we sch ene Folge solcher Zufallsvarablen ˆµ n und deren Vertelung verhält, wenn de Stchprobengröße n gegen Unendlch geht, d.h. n.

Angewandte Ökonometre 6 Wr würden natürlch hoffen, dass de Schätzungen umso genauer werden, umso größer de Stchprobe wrd. Dese Überlegungen werden uns zur vermutlch wchtgsten Egenschaft von Schätzfunktonen führen, nämlch zur Konsstenz; mehr dazu etwas später. Da de folgenden Ausführungen zemlch allgemen gehalten snd schreben wr θ für enen belebgen Parameter ener Vertelung, und mt θ bezechnen wr we üblch de Schätzfunkton für desen Parameter (θ könnte zum Bespel der Mttelwert µ oder der Stegungskoeffzent β aus unserem früheren Bespel sen). Asymptotsche Egenschaften snd vor allem n Fällen von Bedeutung, n denen sch klene Stchprobenegenschaften ncht ermtteln lassen, oder wenn man wssen möchte, ob sch der Erwartungswert ener verzerrten Schätzfunkton θ wengstens mt stegender Stchprobengröße (d.h. für n ) dem wahren Parameter θ zubewegt. 4.3.1 Konsstenz (Consstency) De Konsstenz st de für uns wchtgste asymptotsche Egenschaft. De Grunddee st zemlch enfach, konsstente Schätzer werden mt zunehmender Stchprobengröße mmer genauer. De formale Defnton seht zunächst etwas schwerg aus: Se θ en nteresserender Parameter und θ n ene Schätzfunkton für θ, de auf ener Stchprobe x 1,x,...,x n der Größe n beruht, dann st θ n ene konsstente Schätzfunkton für θ wenn für jedes δ > 0 glt [ ] lm Pr θ n θ < δ = 1 δ > 0 n das heßt, dass de Wahrschenlchket, dass mt stegendem Stchprobenumfang der Absolutbetrag der Dfferenz zwschen θ n und θ klener als ene belebg klene Zahl δ wrd, mt zunehmendem Stchprobenumfang gegen 1 konvergert. Etwas ungenau lässt sch des folgendermaßen ausdrücken: wenn der Stchprobenumfang sehr sehr groß wrd, wrd es sehr wahrschenlch, dass der Schätzer sehr nahe bem wahren Wert θ der Grundgesamthet legt. Wenn der Stchprobenumfang n unendlch groß wrd kollabert de Dchtefunkton ener konsstenten Schätzfunkton θ n m Punkt θ (sehe Abb. 4.5). Ene hnrechende, aber ncht notwendge Bedngung für Konsstenz st, dass lm E( θ n ) = θ und n lm var( θ n ) = 0 n d.h. wenn der Schätzer asymptotsch unverzerrt 13 st und de Varanz gegen Null geht. Um de tefere Bedeutung der Konvergenz zu verstehen benötgt man enge Begrffe aus der Stochastk, de her nur ganz kurz gestreft werden. 13 Asymptotsche Erwartungstreue (Asymptotc Unbasedness): θ n st ene asymptotsch erwartungstreue Schätzfunkton für θ wenn glt: lm n E( θ n ) = θ.

Angewandte Ökonometre 7 f(ˆθ) n = 10000 n = 1000 n = 100 n = 50 n = 10 θ ˆθ 100 ˆθ 10 ˆθ Abbldung 4.5: Konsstente Schätzer können n klenen Stchproben verzerrt sen, konvergeren aber mt stegendem Stchprobenumfang der Wahrschenlchket nach gegen den wahren Wert θ. Konvergenz der Wahrschenlchket nach ( Convergence n Probablty, auch Stochastsche Konvergenz genannt) st en zentrales Konzept zur Klärung des Verhaltens von Zufallsvarablen be wachsendem Stchprobenumfang. Se gbt verenfacht gesprochen an, n welchem Berech sch m Falle unendlch veler Expermente de Zufallsvarable befndet. Das Konzept der stochastschen Konvergenz wrd benötgt um Gesetze der großen Zahl zu bewesen. Gesetze der großen Zahl Generell snd Gesetze der großen Zahlen mest Aussagen über das Verhalten von Kenngrößen (z.b. Momenten) ener großen Zahl von Zufallsvarablen. Bespel: Für ene unendlche Folge von Zufallsvarablen x 1,x,..., de alle denselben Erwartungswert µ bestzen, wrd folgende Konvergenzaussage als (en) schwaches Gesetz der großen Zahlen bezechnet: Das arthmetsche Mttel von n Zufallsvarablen ˆµ n = (x 1 + x + +x n )/n konvergert stochastsch gegen µ wenn n gegen Unendlch geht; das bedeutet, für jede postve Zahl δ (belebg klen) glt lm Pr( ˆµ n µ < δ) = 1 n Deses schwache Gesetz der großen Zahl glt bespelswese, wenn de Zufallsvarablen x 1,x,x 3,... endlche Varanzen σ 1,σ,... haben, de zudem durch ene gemensame obere Grenze beschränkt snd, sowe unterenander unkorrelert snd (d.h., cov(x,x j ) = 0 für j). Konsstenz enes Schätzers bedeutet, dass ene Folge von Schätzfunktonen θ n stochastsch gegen das wahre θ konvergert, also en Gesetz der großen Zahl erfüllt st. In anderen Worten, be Konsstenz konvergert ene Folge von Schätzfunktonen θ n n Wahrschenlchket gegen den wahren Wert θ.

Angewandte Ökonometre 8 Des wrd oft kürzer geschreben als θ p θ Dafür hat sch auch de Notaton des sogenannten probablty-lmts (plm) engebürgert plm θ n = θ des st enfach ene andere Schrebwese für θ p θ, was wederum nur ene Kurzschrebwese für [ ] lm Pr θ n θ < δ = 1 δ > 0 n st, wobe δ belebg klen gewählt werden kann. Man beachte, dass es kene enfache Bezehung zwschen Effzenz und Konsstenz ener Schätzfunkton gbt. Ene Schätzfunkton kann zwar effzent und erwartungstreu sen, aber trotzdem ncht konsstent sen (z.b. wenn de Schätzfunkton ncht von n abhängt). Häufger st der Fall, dass ene Schätzfunkton zwar konsstent, aber ncht erwartrungstreu st! Natürlch können Schätzfunktonen auch konsstent und effzent, oder weder konsstent noch effzent sen. De Bedeutung der Konsstenz resultert ganz wesentlch daraus, dass das Rechnen mt probablty-lmts relatv enfach st. Regeln für das Rechnen mt probablty-lmts 1. Für ene belebge Konstante c glt plmc = c. Seen θ n und ϑ n Zufallsvarablen (z.b. Schätzfunktonen) mt plm θ n = θ und plm ϑ n = ϑ dann glt plm( θ n + ϑ n ) = plm θ n +plm ϑ n = θ+ϑ plm( θ n ϑn = plm θ n plm ϑ n = θϑ ) ( θn plm = plm θ n ϑ n plm ϑ = θ (für ϑ 0) n ϑ Man beachte, dass de letzten beden Egenschaften für den Erwartungswertoperator nur dann gelten, wenn θ und ϑ stochastsch unabhängg snd. Aus desen Gründen st Konsstenz üblcherwese deutlch enfacher zu bewesen als Erwartungstreue oder Effzenz. 3. Wenn θ enekonsstente Schätzfunkton fürθ stundh( θ)enestetgefunkton von θ st glt plmh( θ) = h(θ) Man sagt auch, dass sch de Konsstenz überträgt. Wenn θ ene konsstente Schätzfunktonfürθ st, dannstz.b. 1/ θ auchenekonsstente Schätzfunkton für 1/θ (für θ 0); oder ln θ st ene konsstente Schätzfunkton für für lnθ (für θ > 0). Des glt ncht für den Erwartungswertoperator!