Instrumentvariablen und Instrumentvariablenschätzer Ausgangspunkt der Überlegungen Es gibt endogene erklärende Variable. D. h. diese erklärenden Variablen werden selbst wieder durch das Modell erklärt. Man spricht auch von simultanen Wirkungen. Typischerweise werden solche Beziehungen durch ein System simultaner Gleichungen erfasst. Als Beispiel soll das einfache Marktgleichgewichtsmodell dienen, das auch einer Angebots- und einer Nachfragefunktion besteht: q S = β 0 + β 1 p + β z Angebotsfunktion q D = δ 0 + δ 1 p + δ w Nachfragefunktion Dass q und p im Gleichgewicht simultan (endogen) bestimmt werden, sieht man an der Wechselwirkung dieser beiden Variablen im obigen Gleichungssystem. Würde man (beide Gleichungen) isoliert mit KQ schätzen, würde diese Wechselwirkung nicht berücksichtigt. In diesem Fall entstehen verzerrte Schätzer. (Hier nicht weiter behandelt.) Möglich sind auch weggelassene Variablen. Relevante Erklärungsfaktoren, die in einer Regressionsgleichung ausgelassen wurden, führen zu zwei Effekten. a) Die Koeffizienten der einbezogenen erklärenden Variablen werden verzerrt geschätzt. Dies deshalb, weil der Lösungsalgorhythmus des KQ-Verfahrens (Minimierung der Fehlerquadratsumme) den tatsächlich einbezogenen Variablen einen Teil des Erklärungsbeitrags der ausgelassenen Variablen zuweist. b) Die nicht erklärte Streuung (RRS) steigt an, wenn relevante Erklärungsvariablen fehlen. Problem: In keinem empirischen Modell sind alle relevanten Erklärungsvariablen enthalten. Dies nicht nur, weil die entsprechenden Daten vielleicht nicht verfügbar wären, sondern vor allem aufgrund der komplexen ökonomischen Realitäten, die eine vollständige Spezifizierung der zugrundeliegenden theoretischen Modelle gar nicht zulassen. Streng genommen kann das Problem weggelassener Variablen deshalb gar nicht vollständig gelöst werden. Man kann nur versuchen, die Auswirkungen zu begrenzen. Eine Möglichkeit wären Proxy-Variablen, die dazu dienen, unbeobachtbare (theoretisch aber wichtige) Variablen zu approximieren. Geeignete Proxy-Variablen müssen allerdings vorhanden sein. Bei Paneldaten kann man durch Verwendung von FD- oder FE-Schätzern die Effekte zeitlich konstanter unbeobachteter Variablen eliminieren. Die Wirkungen zeitlich variabler unbeobachtbarer Variablen kann man damit aber nicht erfasssen. IV-Schätzer dienen nun zwei Zwecken: a) Der Berücksichtigung der Endogenität von erklärenden Variablen (siehe obiges Zwei- Gleichungsmodell). b) Der Ermöglichung konsistenter Schätzergebnisse, wenn relevante Variablen fehlen, beispielsweise weil diese unbeobachtbar sind. IV-Schätzer kann man bei reinen Zeitreihenmodellen anwenden, aber auch bei gepoolten Querschnittsschätzungen oder Panelschätzungen. 1
Bisherige Möglichkeiten bei unbeobachtbaren Variablen: a) Wir ignorieren das Problem und akzeptieren die Verzerrungen. b) Wir versuchen, geeignete Proxy-Variablen als Ersatz für die unbeobachteten Variablen zu finden. c) Wir verwenden FE oder FD-Schätzer, wenn möglich. Methodik der IV-Schätzung Ausgangsbeispiel sei die Lohngleichung für erwachsene Erwerbstätige: + βabil + e Wir nehmen an, diese Gleichung sei eine vollständige Beschreibung der Determinanten des Lohnsatzes. (Tatsächlich ist sie es nicht, weil zu simpel.) Der Fehlerterm e ist ein reiner Zufallsprozess. Ist abil nicht beobachtbar, kann aber durch eine geeignete Proxy-Variable wie die Intelligenz IQ ersetzt werden, ergibt die Schätzung von + βiq + e eine konsistente Schätzung der Lohnprämie von educ, also β 1. Hat man keine Proxy wie IQ zur Verfügung, bleibt nicht anderes übrig als zu schätzen. Der Effekt von abil wird dann vom Störterm aufgenommen, der dann natürlich kein (reiner) Zufallsprozess mehr ist. Dann haben wir das omitted variables -Problem und β 1 wird verzerrt geschätzt. kann dann als Grundlage der Schätzung dienen, wenn wir eine geeignete Instrumentvariable für educ finden. Das allgemeine Regressionsmodell lautet in diesem Fall y = β 0 + β1x wobei es möglich ist, dass x und u korreliert sind. Die IV-Methode ist sowohl möglich, wenn dies der Fall ist, wenn also Cov ( x, 0 ist. Sie funktioniert aber auch, wenn Cov ( x, = 0. Dann sollte man KQ verwenden. Im Fall Cov ( x, 0 benötigen wir zusätzliche Information. Genauer benötigen wir eine beobachtbare Variable z, die zwei Bedingungen erfüllt: (1) z sollte mit u unkorreliert sein: = 0 () z sollte mit x korreliert sein: 0 (Die Korrelation mit x kann dabei positiv oder negativ sein.)
Die Variable z heißt dann Instrumentvariable (kurz: Instrument) für die Variable x. = 0 bedeutet dann, dass die Variable z in der Gleichung y = β 0 + β1x exogen ist. Dass heißt in diesem Fall, dass die Variable z keinen eigenen partiellen Erklärungsbeitrag zu der abhängigen Variable y hat, wenn Variable x und verschiedene unbeobachtbare Variablen einbezogen werden. Außerdem sollte z mit den unbeobachteten Variablen (die in u auftauchen) unkorreliert sein. Wichtig ist, dass die Variable z mit der Variable x korreliert ist, also ein relevantes Instrument für x ist. = 0 kann meist nicht direkt getestet werden, da die in u enthaltene unbeobachtbare Variable ja eben nicht datenmäßig erfasst werden kann. Dann muss sich mit ökonomischen Plausibilitätsüberlegungen helfen und mehr oder weniger annehmen, dass keine Korrelation besteht. Manchmal findet man für die unbeobachtbare Variable eine Proxy-Variable. Dann kann man z auf diese Proxy regressieren und auf Signifikanz des Koeffizienten testen. Es sollte keine signifikante Beziehung bestehen. 0 kann leicht getestet werden. Man regressiert x auf z (oder umgekehrt) und bestimmt bei der Gleichung x 0 1 = π + π z + ν Ob der Koeffizient π 1 signifikant von Null verschieden ist. Achtung: zweiseitiger Test, da π 1 signifikant positiv oder signifikant negativ sein sollte. Ist diese Bedingung erfüllt, kann 0 als erfüllt gelten. Zurück zum Beispiel: Bei der Gleichung sollte ein Instrument z für educ (im allgemeinen Modell für x ) unkorreliert mit abil sein, aber korreliert mit educ. Beispiel: Die Sozialversicherungsnummer ist unkorreliert mit abil (das war erforderlich), aber auch mit educ. Das sollte nicht sein, so dass wir hier ein schlechtes Instrument haben. Unterschied zwischen Instrument und Proxy im Beispiel: Wooldridge: IQ als Proxy für abil geeignet, da wahrscheinlich hoch korreliert mit abil. IQ als Instrument für educ ungeeignet, da wahrscheinlich nicht hoch mit educ korreliert. Reichel: Letztes ist fraglich, da wahrscheinlich doch eine Korrelation zwischen IQ und educ besteht, zumindest indirekt, wenn die Eltern intelligenter Kinder für eine bessere formale Ausbildung sorgen. Diskussion möglicher Instrumente für educ : motheduc erfüllt wahrscheinlich 0 und ist so gesehen ein gutes Instrument für educ. 3
Aber motheduc kann auch mit abil und damit mit u korreliert sein, so dass = 0 nicht erfüllt. siblings erfüllt wahrscheinlich 0, da die Kinderzahl in Haushalten höherer Bildung niedriger ist. siblings wäre also negativ mit educ korreliert und damit ein gutes Instrument. Wahrscheinlich ist siblings aber auch unkorreliert mit abil, so dass = 0 ebenfalls erfüllt ist. siblings ist ein gutes Instrument für educ. Weiteres Beispiel: score = β 0 + β1skipped Das Klausurergebnis hängt ab von der Anzahl geschwänzter Stunden und weiteren unbeobachtbaren Variablen, die in u auftauchen. Die Zahl geschwänzter Stunden ist aber wahrscheinlich nicht unabhängig von diesen Faktoren. Höhere Motivation mag sich beispielsweise in weniger skipped äußern. Dieser Effekt über motiv steckt dann bereits in der Variable skipped drin. In einer KQ-Regression würde der reine skipped Effekt dann falsch ausgewiesen, nämlich überzeichnet. Wenn wir die anderen unbeobachteten Variablen nicht verfügbar haben, müssen wir ein Instrument für skipped suchen. Kandidat wäre distance. Hier gibt es wahrscheinlich eine signifikante positive Korrelation mit skipped. Also wäre die eine Bedingung für ein Instrument erfüllt. distance hat auch keinen direkten Effekt auf score. Das passt also auch. Aber ist distance unkorreliert mit u, d. h. mit unbeobachteten Variablen? Das ist zumindest fraglich. Je höher distance, desto höher könnte auch der Anteil der Studenten aus Familien mit niedrigem Einkommen sein, da diese vielleicht entfernter vom Campus wohnen. Das wiederum könnte bedeuten, dass bessere Studenten, die tendenziell aus reicherem Haus stammen, sowohl weniger skipped zeigen als auch vielleicht eine höhere Motivation und abil zeigen. Dann aber ist distance nicht unkorreliert mit u und die Bedingung = 0 wäre nicht erfüllt. Hätte man gute Proxies für die unbeobachteten Variablen, könnte man sie aus u herauslösen und direkt in einer Regressionsschätzung gemeinsam mit skipped schätzen. Dann bräuchte man allerdings kein Instrument für skipped mehr und könnte direkt mit KQ schätzen. Koeffizienten beim IV-Verfahren Der Schätzer für β1 ist gegeben als bei IV ist gegeben als ( zi z)( yi y) ( zi z )( xi x ) 1;IV ˆβ =. Wie man leicht sieht, steht im Zähler die Kovarianz zwischen z und y und im Nennen die Kovarianz zwischen z und x. Der Nenner gibt an, wie stark die Instrumentvariable z mit der zu instrumentierenden Variable x korreliert. Aufschlussreich ist ein Vergleich mit dem normalen KQ-Schätzer für β 1. Dieser ist 1;KQ ˆβ = ( xi ( yi y) ( xi x )( xi x ) 4
Betrachtet man die hinteren Terme der Kovarianzen im Zähler und Nenner, so sieht man, dass hier die Stärke der Beziehung zwischen y und x nur über x selbst (die vorderen Terme der Kovarianzen) determiniert wird. Beim IV-Schätzer geschieht dies nicht direkt über x, sondern über das Instrument z. Jetzt wird auch der Spezialfall, wonach für x kein Instrument gebraucht wird, weil x sein eigenes Instrument ist, deutlich. Dieser Fall tritt dann ein, wenn x streng exogen ist. Die Schätzer für β 1 sind in diesem Fall identisch, weil lediglich z durch x ersetzt wird. Hat man β 1 gefunden, kann man β 0 wie den KQ-Achsenabschnitt berechnen. Es gilt β0; IV = y 1 ˆβ ; IV x. Konsistenzeigenschaft Der IV-Schätzer ist konsistent, d. h. der Wahrscheinlichkeitsgrenzwert des Koeffizientenschätzers 1 ˆβ strebt gegen den wahren Wert. Das gilt aber nur, wenn die Bedingungen = 0 0 erfüllt sind. Ist eine dieser Bedingungen nicht erfüllt, gilt die Konsistenz nicht. Wichtig ist folgende Konstellation: Wir haben eine Korrelation zwischen x und u und benötigen deshalb den IV-Schätzer. Genau dann ist der IV-Schätzer jedoch verzerrt. Besonders gilt dies für kleine Stichproben. Standardfehler Der IV-Standardfehler ist immer größer als der KQ-Standardfehler. Die t-werte der Koeffizienten sind entsprechend kleiner. Dies liegt daran, dass zunächst x als Funktion des Instruments z geschätzt wird. Die geschätzten Werte von x auf Basis von z gehen dann in die Schätzung y = β 0 + β1x ein. Die Abbildung von x durch z kann aber nie perfekt sein, d. h. es verbleibt eine nicht erklärte Reststreuung und das Bestimmtheitsmaß liegt unter Eins. Dann wird auch die Schätzung des Koeffizienten 1 ˆβ der den Zusammenhang zwischen y und dem instrumentierten x misst, notwendigerweise unpräziser. Je enger der Zusammenhang zwischen der Variable x und dem Instrument z, desto geringer wird der ( zi z)( yi y) Zuwachs des Standardfehlers des IV-Schätzers 1;IV ˆβ = ( zi z )( xi x ) gegenüber dem Standardfehler des KQ-Schätzers. Diskussion des Beispiels bei Wooldridge Ausgangpunkt ist die Schätzgleichung Dessen KQ-Schätzung ergibt 5
log( wage) = 0.185 + 0.109educ (0.185) (0.014) R = 0.118 Die Bildungsrendite beträgt also knapp 11%. Jetzt werde fatheduc als Instrument für educ betrachtet. Dazu muss fatheduc mit educ korreliert sein. Mit u werde keine Korrelation unterstellt. Die Überprüfung ergibt: educ = 10.4 + 0.69 fatheduc (0.8) (0.09) R = 0.173 Das Instrument ist also hoch signifikant mit der eigentlichen erklärenden Variable korreliert. Das verhältnismäßig niedrige Bestimmtheitsmaß soll hier nicht weiter stören. Jetzt wird das Instrument fatheduc für educ verwendet. Hierzu ermittelt man die auf Basis von fatheduc geschätzten Werte für educ und setzt sie in die Ausgangsgleichung ein. Es folgt: log( wage) = 0.441+ 0.059educ (0.446) (0.035) R = 0.093 Hier fällt auf, dass die Bildungsrendite mit 5,9% nunmehr niedriger geschätzt wird. Der jetzt geringere Koeffizient resultiert aus den omitted variables -Phänomen der Ausgangregression. Diese hatte den Effekt von educ auf wage zu hoch ausgewiesen. Der Standardfehler der IV-Schätzung ist hingegen höher. Allgemeine Vorgehensweise beim IV-Verfahren Anstelle einer Regression von y auf x (mit dem Problem der Korrelation mit dem Störterm) regressiert man y nur auf den Teil von x, der mit dem Störterm unkorreliert ist. Dieser Bestandteil wird durch das Instrument abgebildet. Man muss also x auf das Instrument z regressieren. Ein gutes Instrument zeichnet sich durch einen engen, signifikanten Zusammenhang mit x aus. Zudem darf keine Korrelation mit u bestehen. Sollte eine solche existieren, führt dies zum Verlust der Konsistenzeigenschaft. Besonders ungünstig ist die Charakterisierung eines Instruments durch eine Korrelation mit dem Störterm einerseits und einer nur geringen Korrelation mit der x-variable. Dann hätten wir ein schwaches Instrument. Die aus der Regression x=f(z) hervorgehenden Schätzwerte für x setzt man in die Ausgangsgleichung ein und erhält einen konsistenten Schätzer für den Effekt von x auf y. 6