6. Wirkungsanalyse Grundlagen Ansätze für Daten ohne Selektionsbias Soziale Experimente CLRM

Ähnliche Dokumente
wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

2 Zufallsvariable und Verteilungen

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

5 Gemischte Verallgemeinerte Lineare Modelle

Grundgedanke der Regressionsanalyse

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte

Teil E: Qualitative abhängige Variable in Regressionsmodellen

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Kurs Mikroökonometrie Rudolf Winter-Ebmer Thema 3: Binary Choice Models Probit & Logit. Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

-70- Anhang: -Lineare Regression-

Prof. Dr. Roland Füss Statistik II SS 2008

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104

Beschreibende Statistik Mittelwert

Stochastische Prozesse

Statistik und Wahrscheinlichkeitsrechnung

»Möglichkeiten und Grenzen der Wirkungsmessung«

Lineare Regression (1) - Einführung I -

Empirische Wirtschaftsforschung

6. Modelle mit binären abhängigen Variablen

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

Gauss sche Fehlerrrechnung

Übung zur Vorlesung - Theorien Psychometrischer Tests II

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

Lösungen zum 3. Aufgabenblock

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Definition des linearen Korrelationskoeffizienten

Streuungs-, Schiefe und Wölbungsmaße

Auswertung univariater Datenmengen - deskriptiv

Konkave und Konvexe Funktionen

3. Lineare Algebra (Teil 2)

Kapitel V. Parameter der Verteilungen

Methoden der innerbetrieblichen Leistungsverrechnung

14 Schätzmethoden. Eigenschaften von Schätzungen ˆθ. Sei ˆθ n eine Schätzung eines Parameters θ, die auf n Beobachtungen beruht.

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Erwartungswert, Varianz, Standardabweichung

FORMELSAMMLUNG STATISTIK (I)

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

SS 2017 Torsten Schreiber

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)

Item-response Theorie (Probablistiche Testtheorie) Grundidee der item-response Theorie ist, dass die Antworten auf die Testitems lediglich

(Essentiell) τ-äquivalente Tests:

Numerische Methoden II

Mathematische und statistische Methoden II

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

An dem Ergebnis eines Zufallsexperiments interessiert oft nur eine spezielle Größe, meistens ein Messwert.

Zufallsvariable, Wahrscheinlichkeitsverteilungen und Erwartungswert

Nomenklatur - Übersicht

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

4. Indexzahlen. 5.1 Grundlagen 5.2 Preisindizes 5.3 Indexzahlenumrechnungen. Dr. Rebecca Schmitt, WS 2013/2014

U Test (Rangsummentest) Parameterfreie Tests. U -Test. U -Test. χ ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen

1.1 Beispiele zur linearen Regression

18. Vorlesung Sommersemester

In der beschreibenden Statistik werden Daten erhoben, aufbereitet und analysiert. Beispiel einer Datenerhebung mit Begriffserklärungen (Vokabel)

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Verteilungen eindimensionaler diskreter Zufallsvariablen

Bestimmung der Elementarladung nach Millikan. 1. Theorie zum Versuchs. F R = 6 $ $ $ r $ v. $ g. F s = 4 3 $ $ r 3 $ Öl.

Mi , Dr. Ackermann Übungsaufgaben Gewöhnliche Differentialgleichungen Serie 13

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

ME II, Prof. Dr. T. Wollmershäuser. Kapitel 2 Das IS-LM-Modell

Multivariate Analysemethoden

Vorlesung: Multivariate Statistik für Psychologen

Standardnormalverteilung / z-transformation

Netzwerkstrukturen. Entfernung in Kilometer:

Lösungen der Aufgaben zu Kapitel 2

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

e dt (Gaußsches Fehlerintegral)

Übung zu Erwartungswert und Standardabweichung

Der Erweiterungsfaktor k

Erläuterungen zur Analyse des Zinssatzswaps Referenz N//83734/5 zwischen der A/B Duegården und der Nykredit Bank A/S

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

Kapitel 7: Ensemble Methoden. Maschinelles Lernen und Neural Computation

22. Vorlesung Sommersemester

Protokoll zum Grundversuch Mechanik

Elemente der Mathematik - Sommer 2016

Kurs 9.3: Forschungsmethoden II

20 Ordinale Regression

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

Protokoll zu Versuch C1-Mischungsvolumina

Facility Location Games

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr

Rückblick Regression II: Anpassung an Polynome

Transkript:

6. Wrkungsanalyse 6.. Grundlagen 6.. Ansätze für Daten ohne Selektonsbas 6... Sozale Expermente 6... CLRM 6..3. Matchng 6.3. Ansätze für Daten mt Selektonsbas 6.3.. Dfferences-n-Dfferences 6.3.. Selektonsmodelle 6.3.3. IV-Regressonen 6.. Grundlagen Be Wrkungsanalysen geht es allgemen um de Messung des kausalen Effekts ener Interventon auf en nteresserendes Charakterstkum oder Verhalten der Betroffenen, das wr m Folgenden als Wrkungsvarable bezechnen. Zum Bespel man nteressert sch für de Auswrkung der Telnahme an ener Qualfzerungsmassnahme (Interventon auf den Lohn (Charakterstkum oder de Erwerbsberetschaft (Verhalten der Telnehmenden (Betroffenen. In der ökonometrschen Evaluatonslteratur wrd ene Interventon n Anlehnung an de Nomenklatur der expermentellen Medzn oft als Treatment ( Behandlung und de Betroffenen werden dementsprechend als de Treated bezechnet. Be der Messung der Auswrkung ener Interventon D auf ene Wrkungsvarable y der Betroffenen geht es n der Regel formal um de Bestmmung folgender Grösse: Average Treatment Effect on the Treated (ATT ATT E y D = E y D = = E y y D = wobe: y = Wert der Wrkungsvarablen be Betroffenhet y = Wert der Wrkungsvarablen be Ncht-Betroffenhet, wenn zu den Betroffenen zählend D =, wenn zu den Ncht-Betroffenen zählend E[y D = ] gbt den Erwartungswert von y an, wenn en Betroffener (D = betroffen wrd, und E[y D = ] den Erwartungswert von y, wenn en Betroffener ncht betroffen worden wäre. ATT msst folglch de mttlere Veränderung Man merke, dass ene gegebene Person m Hnblck auf D nur enen Wert (entweder oder aber n Bezug auf y zwe Werte (y und y annehmen kann.

von y be den Betroffenen. Dabe st zu beachten, dass E[y D = ] ene hypothetsche Grösse darstellt, de man ncht beobachten kann, da ene Person ncht glechzetg betroffen und ncht betroffen sen kann. De Hauptaufgabe der Evaluatonslteratur besteht darn, Ersatzwerte für E[y D = ] zu fnden. Dazu gbt es verschedenen Verfahren, de den Gegenstand deses Kaptels blden. Der Vollständgket halber se noch auf wetere, n der Lteratur unterschedene Wrkungen hngewesen. Average Treatment Effect on the Non-Treated (ATNT ATNT E y D = E y D = = E y y D = Herbe handelt es sch, um de erwartete Wrkung be den Ncht-Betroffenen, wenn se betroffen worden wären. Her besteht das Schätzproblem darn, de hypothetsche Grösse E[y D = ] zu bestmmen. Average Treatment Effect (ATE ( ( ATE P D = ATT + P D = ATNT ( ( = P D = E y D = P D = E y D = + P( D = E y D = P( D = E y D = = E y E y ATE msst de erwartete Wrkung der Interventon be Betroffenen und Ncht- Betroffenen zusammen. Wenn ene Interventon be allen Personen grundsätzlch de gleche Wrkung hervorruft (addtves Modell bzw. homogene Wrkung, wrd ATT = ATNT = ATE sen. Da sch der erwartete Wert E[y D = ] der Wrkungsvarablen be Ncht- Betroffenhet (y be den Betroffenen (D = ncht drekt beobachten lässt, legt es nahe, hn durch den beobachteten mttleren Wert be den Ncht- Betroffenen E[y D = ] zu approxmeren. Engesetzt n de Formel für ATT führt des zu ener Ersatz-Wrkungsmessung ATT.

" ATT " = E y D = E y D = = E y D = E y D = + E y D = E y D = = E y - y D = + E y D = E y D = = ATT + E y D = E y D = We das Ergebns zegt, st ATT = ATT, wenn E[y D = ] = E[y D = ] st, das hesst, wenn de Gruppenzugehörgket (Betroffener oder Ncht-Betroffener kene Auswrkung auf den erwarteten Wert der Wrkungsvarablen be Ncht-Betroffenhet hat. In desem Fall wären Betroffene und Ncht-Betroffene desbezüglch austauschbar. Wenn de Betroffenen de Ncht-Betroffenen wären und umgekehrt, wäre der Erwartungswert von y demnach der gleche. Wenn aber Letzteres ncht zutrfft, lefert ATT ene verzerrte Messung von ATT. We das obge Resultat zegt, beträgt de Höhe der Verzerrung E[y D = ] - E[y D = ]. Dese Verzerrung wrd Selektonsbas genannt. Das Wrkungs-Messproblem lässt sch auch m Rahmen des klassschen lnearen Regressonsmodells (CLRM betrachten. Dabe gehen wr von folgender lnearer Regressonsglechung aus: y = β' x + δ D + ε, wobe ε ~ IID(, In desem Modellrahmen berechnet sch ATT we folgt: = = = = E y D = E y D = " ATT " E y D E y D [, x] [, x] x [ x ] β x [ E[ D, x ] E[ D, x ] = β ' + δ + E ε D =, ' E ε D = = δ + ε = ε =, x] Der Verglech mt dem früheren Ergebns zegt, dass ATT = ATT = δ st, wenn für en gegebenes Merkmalsprofl x der Erwartungswert des Störterms ε unabhängg davon st, ob en Merkmalsträger von der Interventon betroffen (D = wurde oder ncht (D =. Das hesst, bezüglch der ncht erfassten Bestmmungsfaktoren ε müssen Betroffene und Ncht-Betroffene m Schntt glech sen. Des kommt der Annahme glech, dass de Interventonsvarable D und der Störterm ε stochastsch unabhängg snd bzw. dass D exogen st, was der 4. Annahme des CLRM entsprcht. De Annahme der Glechhet der Erwartungswerte hesst de Condtonal Mean Independence Annahme (MIA. Se st vonnöten, um δ als ATT zu dentfzeren, weshalb man n desem Zusammenhang von ener dentfzerenden Annahme sprcht. 3

Allgemener formulert lautet de MIA, dass { } j j j E y D =, x = E y D =, x = E y x für gegebenes j =, st. Des besagt, dass der Erwartungswert von y bzw. von y be gegebenem x für bede Personengruppen (D = und D = dentsch st. M.a.W.: Es spelt kene Rolle, wer betroffen wrd. Solange es sch um beobachtungshomogene Personen handelt, bleben de Erwartungswerte annahmegemäss de glechen. De MIA mplzert, dass für gegebenes x: E y D =, x = E y D =, x E y D =, x = E y D =, x, was uns erlaubt, de hypothetschen Erwartungswerte E[y D =, x] und E[y D =, x] durch hre beobachtbaren Pendants E[y D =, x] bzw. E[y D =, x] zu ersetzen. Es lassen sch wetere dentfzerende Annahmen unterscheden, de strenger snd als de MIA: Condtonal Independence Assumpton (CIA y, y D x Des besagt, dass für gegebenes x de (Ncht-Betroffenhet (D und de möglchen Ausprägungen von y bzw. y stochastsch unabhängg snd. Des mplzert wederum, dass: ( j =, x = ( j =, x = ( j für gegebenes = {,} F y D F y D F y j Das bedeutet, dass de gesamte Vertelung F (und ncht bloss de Erwartungswerte von y bzw. von y für bede Personengruppen (D = und D = dentsch st. M.a.W.: Es spelt kene Rolle, wer betroffen wrd. Solange es sch um beobachtungshomogene Personen handelt, bleben de Vertelungen unverändert. Im lnearen Regressonsmodell bezeht sch dese Egenschaft auf den Störterm ε. Independence Assumpton (IA y, y D Des entsprcht der CIA, glt aber unabhängg von den Werten von x. 4

De IA mplzert wederum, dass: ( j = = ( j = = ( j für gegebenes = {,} F y D F y D F y j De verschedenen Unabhänggketsannahmen sollen dafür sorgen, dass gemessene Unterschede zwschen Betroffenen und Ncht-Betroffenen bezüglch y als Kausalwrkungen nterpretert werden können. Dem legt de folgende Logk zugrunde: Wenn sch Betroffene und Ncht-Betroffene hnschtlch aller erfassten x und unerfassten ε Bestmmungsfaktoren von y ncht systematsch unterscheden, dann muss en festgestellter Untersched zwschen Betroffenen und Ncht-Betroffenen bezüglch y auf de Interventon bzw. de Betroffenhet zurückzuführen sen. Auf der glechen Logk beruht der n der expermentellen Forschung verwendete Kausaltätsbegrff. 5

6.. Ansätze für Daten ohne Selektonsbas De n Abschntt 6. behandelten Untersuchungsansätze gehen von der Gültgket der MIA aus. Se sollen deshalb nur dann Anwendung fnden, wenn man davon ausgehen kann, dass sch Betroffene und Ncht-Betroffene hnschtlch aller unerfassten Bestmmungsfaktoren von y ncht systematsch unterscheden. Des st eher dann zu erwarten, wenn de Daten expermentell gewonnen wurden (vgl. Abschntt 6.. oder wenn der Vektor x der erfassten Bestmmungsfaktoren alle systematschen Enflussfaktoren enthält. Im Englschen sprcht man n desem Zusammenhang von rch data (rechhaltgen Daten. Andernfalls snd Ansätze für Daten mt Selektonsbas zu verwenden (vgl. Abschntt 6.3. 6... Sozale Expermente Sozale Expermente werden.d.r. engesetzt, um de Auswrkung ener Telnahme an ener wrtschaftspoltschen Massnahmen (Interventon auf de Telnehmer zu messen. Sozale Expermente sorgen dafür, dass de Daten de MIA erfüllen, ndem se de Telnahme unter den potentellen Telnehmenden (D = randomseren. Das hesst, de Telnahme wrd ener zufällg ausgewählten Gruppe potenteller Telnehmender (D = verwegert (R =. Dese Gruppe dent als Kontrollgruppe für de Telnehmenden (R =. Aufgrund der Randomserung glt de folgende MIA E y D =, R = = E y D =, R =, so dass ATT = E y D =, R = E y D =, R =. Ene Kondtonerung auf x st ncht notwendg, da de Telnehmenden (R = und Ncht-Telnehmenden (R = merkmalshomogen sen müssten, wenn de Randomserung gelang. Aufgrund der Merkmalshomogentät lässt sch ATT durch enen enfachen Verglech der Mttelwerte der Telnehmergruppe und der Kontrollgruppe ermtteln: Da bede Gruppen merkmalshomogen snd, muss en festgestellter Untersched bezüglch des nteresserenden Charakterstkums y auf de Interventon R zurückzuführen sen. Demnach glt ATT N = = N ( y y R= R= N N R ( R N ( R y R y R = = = N = R 6

R kennzechnet den Mttelwert von R. Da R nur de Werte (Telnahme und (Nchttelnahme annehmen kann, entsprcht R dem Antel der Telnehmenden bzw. Betroffenen. N gbt we bslang de Stchprobengrösse an. ATT lässt sch auch mt dem folgenden enfachen Regressonsmodell bestmmen: y = β + β R + ε Demnach st ATT = E y = = R E y R [ ] [ = β + β+ E ε R = β E ε R = = β Dabe st zu beachten, dass wegen der Randomserung de MIA n Bezug auf ε glt: ] E[ε R = ] = E[ε R = ] Das hesst, de zwe Gruppen müssten auch hnschtlch der ncht erfassten Bestmmungsfaktoren ε homogen sen. De OLS-Schätzung von β und der Mttelwertverglech führen zum glechen Ergebns. Bewes: s = = OLS yr = β srr N ( N ( N ( R R N = ( R R N = N ( R R ( y y N ( R R = = = = N ( R R y R R y = = = R R R R = y = w y N ( 7

wobe: [ w R ] [ w R ] Folglch st: R = = = N R N R ( R R = = = N R R N R y R= = ( ( y R ( OLS β = = Mttelwertverglech N R N R Wenn de Kontroll- und Telnehmergruppen unterschedlch gross snd, entsteht Heteroskedastztät und heteroskedastsch-konsstente Standardfehler snd deshalb zu verwenden. 8

6... CLRM Im Untersched zu sozalen Expermenten geht das CLRM.d.R. davon aus, dass sch de Gruppen der Betroffenen (D = und Ncht-Betroffenen (D = hnschtlch der erfassten Bestmmungsfaktoren x unterscheden. Bezüglch der unerfassten Bestmmungsfaktoren ε hngegen wr de Gültgket der MIA weterhn unterstellt. Bem CLRM snd zwschen zwe Modellarten zu unterscheden: ( dem addtven Modell mt homogener Wrkung und y = β' x + δ D + ε, wobe ε ~ IID(, ( dem multplkatven Modell mt heterogenen Wrkungen y β ' x für D = = +ε y β ' x für D = = +ε bzw. zu ener Glechung zusammengefasst y = β ' x + δ ' x D + ε + ( ε ε D wobe δ = β - β und ε, ε ~ IID(, I Das addtve Modell geht davon aus, dass de Interventon be allen Betroffenen (trotz unterschedlcher Merkmalsprofle de gleche Wrkung δ hat, während das multplkatve Modell zulässt, dass de Wrkung je nach dem Merkmalsprofl x des Betroffenen streut. De Wrkung wrd als multplkatv bezechnet, wel se über Produkte (x D bzw. sogenannte Interaktonsterme ermttelt wrd. Das hesst, de Interventon nteragert mt den Merkmalsproflen. Infolge dessen gbt es für jede der K Varablen n x enen egenen Effekt. Demzufolge besteht δ aus enem weteren (K x -Vektor von Parametern. De MIA berechtgt uns, ATT m addtven Modell we folgt zu berechnen: [, x] [, x] E[ D, ] E[ D, ATT = E y D = E y D = = δ + ε = x ε = x ] = δ Demnach st ATT = δ, wenn (dentfzerende Annahme [ ε =, x] = [ ε =, x ] E D E D bzw. D exogen st. 9

Bem multplkatven Modell müssen de enzelnen merkmalsproflspezfschen Effekte gemttelt werden, um ATT zu erhalten. Des lässt sch am enfachsten bewerkstellgen, ndem man den Vektor δ mt dem Vektor x der Mttelwerte der Merkmalsprofle der Betroffenen (D = multplzert: ATT = E y D =, x E y D =, x ( = β β ' x + E ε D =, x E ε D =, x = δ ' x De dentfzerende MIA lautet n desem Fall: { } j j j E ε D =, x = E ε D =, x = E ε x j=, Bem multplkatven Modell st m Allgemenen ATT ATNT ATE, da de durchschnttlchen Merkmalsprofle der Betroffenen und Ncht-Betroffenen unterschedlch sen dürften. Bem addtven Modell hngegen st der Effekt ncht vom jewelgen Merkmalsprofl abhängg. Deshalb st ATT = ATNT = ATE. De MIA wrd verletzt, ( wenn de Betroffenhet (D bzw. de Telnahme an ener Massnahme über enen Selektonsprozess etwa folgender Art D, wenn γ ' z + ν > Schwellenwert =, wenn γ ' z + ν Schwellenwert erfolgt, wobe z enen Vektor beobachtbarer Bestmmungsfaktoren der Telnahme und ν ene Zufallsvarable darstellt, de unbeobachtbare Bestmmungsfaktoren erfasst, und ( wenn entweder z und ε (sog. Selekton nach beobachtbaren Varablen E [ z ε ] oder ν und ε korrelert snd (sog. Selekton nach unbeobachtbaren Varablen E [ νε]. En solcher Selektonsmechansmus ergbt sch etwa dann, wenn Telnehmer an ener Massnahme nach hren Erfolgsausschten bestmmt werden. Vgl. herzu das Roy-Modell n Abschntt 6.3..

6..3. Matchng-Verfahren Im Untersched zum CLRM unterstellen Matchng-Verfahren kene lneare Bezehung zwschen der Wrkungsvarablen y und den potentellen Bestmmungsfaktoren x und D. Folglch snd se flexbler. Zudem gehen se prnzpell von multplkatven Effekten aus. Matchng-Verfahren beruhen auf dem enfachen Mttelwertverglech, der be sozalen Expermenten angewendet wrd. Doch m Untersched zu sozalen Expermenten unterstellen Matchng-Verfahren (we auch de Regressonsanalyse ncht, dass de Betroffenen und Ncht-Betroffenen hnschtlch der erfassten Merkmale x homogen snd. Deshalb muss noch der Enfluss beobachteter Merkmalsunterschede elmnert werden. Zu desem Zweck untertelen Matchng-Verfahren de Merkmalsträger vorher n merkmalshomogene Gruppen und führen dann den Mttelwertverglech zwschen Betroffenen und Ncht- Betroffenen nach merkmalshomogenen Gruppen enzeln durch. Das Vorgehen lässt sch formal we folgt darstellen: = = = E E y D = x E y D = x D ATT E y y D x {(,, = } [ Δx D ] Δ P[ D ] = E = = x x = x = wobe P[x = x D = ] de relatve Häufgket der Betroffenen mt Merkmalsprofl x angbt. Demnach entsprcht ATT ener mt P[x = x D = ] gewchteten Summe der y-mttelwert-unterschede Δ zwschen bezüglch x merkmalshomogenen Betroffenen und Ncht-Betroffenen. We de obge Herletung zegt, beruht der Berechnung von ATT auf der folgenden MIA E y D =, x = E y D =, x. Dese verlangt, dass für gegebenes Merkmalsprofl x sch de Betroffenen und Ncht-Betroffenen bezüglch allfällg ncht erfasster Bestmmungsfaktoren (ε ncht systematsch unterscheden. Wenn x hochdmensonert st bzw. vele Merkmalsdmensonen berückschtgt, erwest sch en solches Vorgehen ( exaktes Matchng als weng praktkabel, da jede Beobachtung glechsam enmalg erschent und dadurch kene Verglechsmöglchket betet. Deshalb werden.d.r. ncht dentsche, sondern ähnlche Telnehmer und Nchttelnehmer verglchen ( unexaktes Matchng und de durchschnttlche Dfferenz deren y-werte als Wrkungsmass (ATT verwendet. Um unexaktes Matchng anzuwenden, muss erst de Ähnlchket zwschen den Merkmalsproflen von Telnehmern und Nchttelnehmern bestmmt werden.

Es gbt grundsätzlch zwe Verfahren, um de Ähnlchket zwschen Verglechsgruppen zu messen: - nchtparametrsche und - semparametrsche (Propensty Score Matchng. Bem nchtparametrschen Ansatz wrd de Ähnlchket zwschen den Merkmalsproflen der Merkmalsträger anhand von Dstanzmassen drekt ermttelt. En gängges Dstanzmass st das Mahalanobs-Mass d M, das we folgt defnert st ( x x ' Σ ( x x j M d j x = Das Mass entsprcht der Summe der quadrerten Abwechungen der Merkmalsprofle, dvdert durch de Kovaranzmatrx der Varablen des Merkmalsprofls. Be Propensty Score Matchng hngegen werden de mehrdmensonalen Merkmalsprofle ncht drekt verglchen, sondern zuerst zu enem Skalar (Propensty Score p verdchtet, der m Falle von ATT de Wahrschenlchket angbt, zur Gruppe der Betroffenen zu gehören: ( x [ x ] p P D = = E D Der Propensty Score ener Person mt Merkmalsprofl x lässt sch anhand ener ex post-schätzung der Wahrschenlchket der Betroffenhet (D = mttels enes bnomalen Modells we des Logt- oder Probt-Modells (daher semparametrsch bestmmen. Merkmalsähnlche Betroffene und Ncht-Betroffene snd dann solche mt ähnlchen Propensty Scores. Das Ersetzen enes Dstanzmasses durch den Propensty Score erfordert de Erfüllung dre Bedngungen. ( De MIA, de für gegebenes x glt, muss sch auch auf den Propensty Score p(x übertragen lassen, was nachgewesen werden kann. ( De Untertelung der Merkmalsträger n Gruppen, de bezüglch p(x homogen snd, sollte zu Gruppen führen, de auch hnschtlch x homogen snd. D.h., für gegebenes p(x sollten de Merkmalsprofle x und de Gruppenzugehörgket D stochastsch unabhängg sen: D x p( x Dese Bedngung nennt man de Balancng Condton. ( De merkmalshomogenen Verglechsgruppen müssen sowohl Betroffene als auch Ncht-Betroffene enthalten, da en Verglech sonst unmöglch wäre. Dese Bedngung, de Common Support Condton genannt wrd, wrd be Regressonsanalysen durch de Annahme ener parametrschen Bezehung zwschen den Kontrollvarablen x und der Wrkungsvarablen y automatsch erfüllt.

Zur Erfüllung der Balancng Condton wrd.d.r. we folgt verfahren:. De Propensty Scores aller Beobachtungen werden auf der Bass enes geschätzten Logt- oder Probt-Modells der Betroffenhet mt lnearen Kovaraten berechnet.. De Beobachtungen werden eventuell auf jenen Werteberech (Common Support der geschätzten Propensty Scores beschränkt, für den es sowohl Telnehmer als auch ncht Telnehmer gbt. 3. De Beobachtungen werden n k glech brete Propensty-Score-Intervalle (z.b. k = 5 untertelt. 4. Es wrd getestet, ob de mttleren Propensty Scores der Telnehmer und Nchttelnehmer n jedem Intervall glech snd. Dort, wo des ncht zutrfft, werden de Intervalle mmer weder halbert, bs sch de Glechhets-Hypothese ncht verwerfen lässt. 5. Es wrd dann getestet, ob de Mttelwerte der Kovarate der Telnehmer und Nchttelnehmer n jedem Intervall glech snd. Dort, wo des ncht zutrfft, werden de Intervalle mmer weder halbert, bs sch de Glechhets- Hypothese ncht verwerfen lässt. 6. Wenn sch de Glechhets-Hypothese ncht überall bestätgen lässt, wrd zum. Schrtt gesprungen, de lnearen Kovarate um Interaktonen erwetert und alle Schrtte wederholt, bs de Balancng Condton erfüllt st. Be unexaktem Matchng wrd ATT.d.R. (Ausnahme: Stratfcaton Matchng we folgt berechnet: ATT = y yˆ, N T = wobe yˆ = w y und w. j j j j C( j C( T stellt de Gruppe der Betroffenen und C( de Verglechsgruppe enes gegebenen Betroffenen, bestehend aus merkmalsähnlchen Ncht-Betroffenen, dar. De Matchng-Schätzer unterscheden sch n erster Lne hnschtlch der Wahl der Gewchte (w j und der Bestmmung der Verglechsgruppe C(. Dabe besteht stets en Trade-Off zwschen Varanz und Bas: Bretere Verglechsgruppe senken de Varanz des Schätzers aber erhöhen dessen Bas, da de Ähnlchket zwschen den verglchenen Betroffenen und Ncht- Betroffenen abnmmt, während engere Verglechsgruppen das Gegentel bewrken. Gängge Matchng-Verfahren snd Stratfcaton Matchng, Nearest Neghbor Matchng, Radus Matchng und Kernel Matchng. 3

Be Nearest Neghbor Matchng glt:, wenn j C ( C ( = mnp p j und w = n j j sonst Be Radus Matchng glt: { j j } C ( = p p p < r und w j, wenn j C ( = n sonst Be Kernel Matchng glt: C( =.d.r alle Ncht-Behandelten und w j = pj p G hn p k p G hn k C G(. stellt enen sogenannten Kernel ( Kern dar, der Beobachtungen n der Kontrollgruppe, deren Propensty Scores nahe be (wet von p legen, stärker (schwächer gewchten. h n st en Bandbreten-Parameter. Klenere Bandbreten-Parameter führen zu engeren Gewchtedchten. Gängge Kernel-Funktonen snd: de Epanechnkov ( 5 3 p = wenn j p x x 4 5 G G( x hn, sonst 5 und de Gauss sche p p G G( x = e j.5 x π hn. De obgen Formeln bezehen sch auf den Propensty Score. Wrd statt dessen das Mahalanobs-Mass verwendet, st de Dfferenz p p j der Propensty Scores durch das entsprechende Dstanzmass d j zu ersetzen. 4

Stratfcaton Matchng unterschedet sch etwas von den anderen Matchng- Verfahren. Es msst de Dfferenz zwschen den Mttelwerten der Wrkungsvarablen zweer merkmalsähnlcher Telgruppen von Telnehmern und Ncht- Telnehmern und mttelt dann de Mttelwert-Unterschede über alle Telgruppen hnweg. De relatven Häufgketen der Telnehmer nach Telgruppen denen dabe als Gewchte. ATT Q j q j q nq = q= nq nq n q= y Q n = y q yq n y q Das multplkatve Regressonsmodell und das Matchng-Modell müssten zum glechen Ergebns führen, wenn de Regressonsglechung rchtg spezfzert st und de Daten de Common-Support-Bedngung erfüllen. Da Matchng- Verfahren ohne den nterpolerenden Effekt bzw. de restrngerende Wrkung ener Regressonsglechung auskommen müssen, erfordern se enen grössere Stchprobe als Regressonsmodelle, um de gleche hohe Schätzgenaugket zu erzelen. 5

6.3. Ansätze für Daten mt Selektonsbas De nachfolgenden Verfahren kommen ohne de MIA aus. Das hesst, se lassen zu, dass de Verglechsgruppen auch hnschtlch der ncht erfassten Merkmale ε unterschedlch snd bzw. dass de Interventonsvarable D ncht exogen st bzw. dass de Interventonsvarable D und der Störterm ε ncht stochastsch unabhängg snd. 6.3.. Dfferences-n-Dfferences (DD Der DD-Ansatz benötgt Paneldaten, de sowohl m Querschntt ( =,,... als auch m Längsschntt (t =,,... streuen. Dabe werden.d.r. nur zwe Peroden betrachtet: ene vor (t = und ene nach (t = der Interventon. Der DD-Ansatz unterstellt ncht, dass MIA bezüglch der Nveaus E y = = t D E yt D = E y t+ D = = Eyt+ D = glt, sondern ledglch hnschtlch Veränderungen E y t+ yt D = = E yt+ yt D =. Dabe kennzechnen t und t+ zwe Zetpunkte (bspw. und. De Gültgket der MIA n den Nveaus mplzert de Gültgket der MIA n den Veränderungen, aber ncht umgekehrt. Gemäss dem DD-Ansatz st ATT = E y t+ yt D = E yt+ yt D =, d.h. glech der Dfferenz der mttleren Veränderungen der Wrkungsvarablen be den Betroffenen (D = mt und ohne Interventon. Aufgrund der MIA n den Veränderungen st ATT aber zuglech ATT = E y t+ yt D = E yt+ yt D =, d.h. glech der Dfferenz zwschen den Betroffenen und den Ncht-Betroffenen bezüglch der mttleren Veränderungen der Wrkungsvarablen. 6

Regressonsanalytsch betrachtet geht der DD-Ansatz vom folgenden Modell aus: y wobe: = β' x + δ D T + ε, t t t t = Personenndex t = Perodenndex: vorher (t = und nachher (t = D =, wenn Betroffenhetsgruppe zugehörg, sonst T =, wenn t =, sonst Demnach st das Produkt D T nur dann unglech bzw. glech, wenn es sch um enen Betroffenen (D = nach der Interventon (T = handelt. De Verletzung der MIA n den Nveaus bedeutet aus regressonsanalytscher Scht, dass [ ε =, x] [ ε =, x ] E D E D st. Nach Massgabe des DD-Ansatzes st dese Annahmeverletzung ausschlesslch auf zwe sog. fxe Effekte α D und γ T zurückzuführen, de m Störterm enthalten snd: εt = αd + γt + ηt, wobe η t ~ IID(,. α D msst de Abwechung des Erwartungswertes von ε t von für D = und γ t de Abwechung des Erwartungswertes von ε t von für T =. De Abwechungen snd als Folge unbeobachtbarer Heterogentät zu nterpreteren, de auf unerfasste gruppenspezfsche (Betroffene versus Ncht-Betroffene und perodenspezfsche Besonderheten zurückzuführen st. Das komplette Modell lautet somt y = β' x + δ D T + α D + γ T + η, wobe t t t D T t t [ η =, x] = [ η =, x ] E D E D st. Das hesst, de MIA glt ncht n Bezug auf ε, sondern ledglch n Bezug auf η. In desem Fall lässt sch de Wrkung δ der Interventon ncht we n Abschntt 6.. durch enen Verglech der Betroffenen und Ncht-Betroffenen m Zetpunkt t = ermtteln, da = x = x = δ + α δ. E yt= D, E yt= D, D 7

Noch hlft en Vorher-Nachher-Verglech be den Betroffenen weter, da = x = x = δ + γ δ. E yt= D, E yt= D, T Um δ zu ermtteln, muss velmehr der Untersched der Veränderungen be den Betroffenen und Ncht-Betroffenen E yt= yt= D =, x E yt= yt= D =, x = δ oder de Veränderung der Unterschede zwschen den Betroffenen und den Ncht-Betroffenen { } { t=, x,,, } t= x t= x t= x E y D = E y D = E y D = E y D = = δ oder schlcht de Dfferences n the Dfferences (daher der Name gemessen werden. Das Vorgehen lässt sch an der folgenden Graphk veranschaulchen Dabe st treatment after δ + α = Y Y D, control, after treatment after δ + γ = Y Y T δ = ˆ β dffs n dffs, treatment, before 8

Anwendungsbespele des DD-Ansatzes De Auswrkung von Steuerkredten (EITC auf de Erwerbsbetelgung De Auswrkung von Mndestlöhnen auf de Beschäftgung De Auswrkung von Enwanderungen auf de Arbetslosgket der Enhemschen Es st darauf hnzuwesen, dass der Standard-DD-Ansatz von ener enhetlchen Wrkung be allen Betroffenen unabhängg vom jewelgen Merkmalsprofl ausgeht (addtves Modell. Entsprcht des ncht der Wrklchket, wrd der gemessene ATT verzerrt sen. Wenn man n Anlehnung an das multplkatve Modell n Abschntt 6.. statt dessen davon ausgeht, dass de Gruppenzugehörgket und Perodenzugehörgket bzw. de Interventon (D =, T = mt den Regressoren nterageren, lautet de Regressonsglechung y = β ' x + β ' x D + β ' x T + β ' x D T + δ D T + α + γ + η t t t t t t D T t und ATT st glech E y t= yt= D =, x E yt= yt= D =, x = δ + β' x D. 9

6.3.. Selektonsmodelle Im Untersched zum DD-Ansatz versuchen Selektonsmodelle den Selektonsbas, der daraus entsteht, dass sch Betroffene und Ncht-Betroffene hnschtlch der unerfassten Bestmmungsfaktoren ε unterscheden, zu ermtteln. Des wrd ( durch de Enführung enes Selektonsmodells, de de Zugehörgket zur Gruppe der Betroffenen (D = bestmmen soll, und ( durch ene Vertelungsannahme bewerkstellgt. Im Allgemenen wrd vom folgenden Selektonsmodell ausgegangen D* = α' z +, wobe IID(, D =, wenn D* > γ und D =, wenn D * γ Da D * ncht beobachtet wrd und sch γ und deshalb ncht dentfzeren lassen, wrd der Enfachhet halber oft unterstellt, dass γ = und = st. Im Folgenden treffen wr dese Annahme auch. We bem CLRM kann zwschen ( enem addtven Modellansatz mt ener homogenen bzw. merkmalsproflunabhänggen Wrkung und ( enem multplkatven Modellansatz mt heterogenen bzw. merkmalsproflspezfschen Wrkungen. Je nach Modell ergbt sch ene andere Vertelungsannahme und somt auch ene andere gemessene Wrkung. Wr betrachten das addtve Modell zuerst. 6.3... Addtve Modell mt homogener Wrkung Das addtve Modell geht von folgender Modellstruktur aus y = β' x + δ D + ε, wobe ε ~ IID(, (Wrkungsglechung D* = α' z +, wobe IID(, D =, wenn D * > γ und D =, wenn D * γ (Selektonsmodell Dabe wrd.d.r. unterstellt (dentfzerende Annahme, dass ε ε ε, ~ N (, Ω und Ω = ε Infolge dessen glt de MIA E ε D = = E ε D = ncht.

Bewes [ ε ] * E = = ε > D E D = E ε > α ' z E α' z ε = > φ = ε Φ ( α' z ( α' z [ ε ] = θ λ * E = = ε < D E D = E ε < α ' z ε = E < α' z ( α' z ( α z φ = ε Φ ' = θ λ ATT st n desem Fall ATT = E y D =, x E y D =, x = β' x + δ + θ λ β' x θ λ = δ, d.h. gegenüber dem CLRM unverändert.

De Wrkungsglechung lässt sch dennoch ncht mt OLS schätzen, da E y x, D β ' x + δ D [ ε D ] = β ' x + δ D + = β ' x + δ + θ λ + ( λ D D D, es se denn, ε und snd ncht korrelert, so dass ε = θ = st. Zwe alternatven Schätzverfahren beten sch falls θ an: - das zwestufge Verfahren nach Heckman oder - Maxmum Lkelhood Das zwestufge Verfahren nach Heckman gestaltet sch we folgt:. Stufe: Probt-Schätzung der Wahrschenlchket der Telnahme Zunächst wrd α durch de Maxmerung der folgenden Lkelhood-Funkton L bestmmt: wobe: N L= L max = α D ( [ ( ] L = P D* > P D* D ( Φ ( P D* > = ( α ' z und P D* = Φ( α ' z Anhand der geschätzten Werte für α werden λ und λ für de. Stufe berechnet.. Stufe: OLS- bzw. GLS-Schätzung der Glechung: y = + δ + θ ˆ λ + ˆ λ β ' x D D ( D + ν Durch de Enschluss von λ und λ hat ν den konstanten Erwartungswert : E ν D = = E ν D = =, aber ν st heteroskedastsch (daher eventuell GLS.

Das Maxmum-Lkelhood-Verfahren hngegen st enstufg. Es werden jene Werte für α, β und δ bestmmt, de de gemensame Wahrschenlchket der Stchprobe bzw. de Lkelhood-Funkton L maxmert: N L= L max = αβ,, δ, ε, ρ wobe: D * * (, (, L = > P D y P D y P P D * * ( ( ( ( = P D y P y P D > y P y ( D* = Φ ( α ' z ( D* > = Φ ( α ' z D D ( P y y δ β ' x D = φ ε ε P α ' z > = Φ ( ρε ρ α ' z + = Φ ( ρε ( D* y P( D* y = α ' z Φ = α ' z Φ ( y β ' x δ D ε + ε ( y β' x δ D ε ( y β' x ε + ε ( ρε ρ + ( y β' x ε ( ρε De Parameterschätzungen snd asymptotsch normalvertelt, asymptotsch erwartungstreu (= konsstent und asymptotsch effzent. 3

6.3... Multplkatves Modell mt heterogener Wrkung Das Modell kennt zwe Unterformen: - das Modell mt exogener Selekton und - das Modell mt endogener Selekton (sog. Roy Modell. Das multplkatve Modell mt exogener Selekton führt ene zwete Wrkungsglechung en y = β x +ε für D = (Wrkungsglechung ' = y β ' x +ε für D = (Wrkungsglechung, um de Interventonsvarable mt den Merkmalsproflen der Merkmalsträger nterageren zu lassen. Des wrd klar, wenn man de zwe Glechungen zu ener zusammenführt y = β ' x + δ ' x D + ε + D ( ε ε, wobe δ = β - β. Ergänzt wrd das Modell um das Selektonsmodell von vorhn: D* = α ' z +, wobe IID(, D =, wenn D * > γ und D =, wenn D * γ (Selektonsmodell Dabe wrd.d.r. unterstellt (dentfzerende Annahme, dass ε, ε, ~ N (, Ω mt Ω = Infolge dessen glt auch her de MIA E ε = = ε = ε = = D E D bzw. E D E ε D = ncht. 4

Bewes * E ε = = ε > D E D * E ε = = ε > D E D = E ε > ' α z = E ε > ' α z E α ' z = > E α ' z = > φ = Φ ( α ' z ( α ' z φ = Φ ( α ' z ( α ' z = λ = λ * E ε = = ε < D E D * E ε = = ε < D E D = E ε < ' α z = E ε < ' α z E α ' z = < E α ' z = < ( α ' z ( α z φ = Φ ' ( α ' z ( α z φ = Φ ' = λ = λ ATT st n desem Fall ATT = E y D =, x E y D =, x = β β ' + E ε D =, x E ε D =,x ( x ( ' x ( = β β + λ Man merke, dass ATT jenem des addtven Modells entsprcht, wenn (we bem addtven Modell ε = ε, was = mplzert, und wenn β = β. In desem Fall glt: ATT = β β δ wobe und β β Achsenabschntte darstellen. 5

De obge Wrkungsglechung lässt sch ncht mt OLS schätzen, da [ ε ] E y x, D = β ' x + δ ' x D + D = β ' x + δ ' x D + D λ + ( D λ, es se denn, st weder mt ε noch mt ε korrelert, so dass = = st. Zwe Alternatven beten sch auch her an: - das zwestufge Verfahren von Heckman oder - Maxmum Lkelhood Das zwestufge Verfahren nach Heckman gestaltet sch we folgt:. Stufe: Probt-Schätzung der Wahrschenlchket der Telnahme Zunächst wrd α durch de Maxmerung der folgenden Lkelhood-Funkton L bestmmt: wobe: N L= L max = α D ( [ ( ] L = P D* > P D* D ( Φ z ( P D* > = ( α' und P D* = Φ( α ' z Anhand der geschätzten Werte für α werden λ und λ für de. Stufe berechnet.. Stufe: OLS- bzw. GLS-Schätzung der Glechung: y = β ' x + δ ' D x + D ˆ λ + ( D ˆ λ + ν Durch den Enschluss von λ ˆ bzw. λ ˆ hat ν den konstanten Erwartungswert : E ν D = = E ν D = = aber ν st heteroskedastsch (daher GLS. 6

Das Maxmum-Lkelhood-Verfahren hngegen st enstufg. Es werden jene Werte für α, β und δ bestmmt, de de gemensame Wahrschenlchket der Stchprobe bzw. de Lkelhood-Funkton L maxmert: : wobe: N L= L max = αβ δ ρ ρ,,,,,, D D * * (, (, D * * ( ( ( ( L = > P D y P D y = P D y P y P D > y P y P P ( D* = Φ ( α ' z ( D* > = Φ ( α ' z D ( P y ( P y y β ' x = φ y β ' x = φ P α' z > = Φ α' z = Φ ( D* y ( y β ' x + ( ρ ρ ( y β ' x + ( ρ ( y β ' x α' z + P( D* Φ y = ( ρ ρ α' z + ( y β ' x = Φ ( ρ De Parameterschätzungen snd asymptotsch normalvertelt, asymptotsch erwartungstreu (= konsstent und asymptotsch effzent. 7

Das multplkatve Modell mt endogener Selekton (Roy Modell verändert das bsherge Selektonsmodell D* = α ' z + D = und y = y, wenn D* > und D = und y = y, wenn D * we folgt: D* = y y D =, wenn y > y, und D = wenn y y Das hesst, de Betroffenhet oder - besser gesagt - de Telnahme an ener Massnahme rchtet sch danach, welche Alternatve (Telnahme oder Nchttelnahme der jewelgen Person de besten Ausschten bezüglch der Wrkungsvarablen y versprcht. Es wrd jene Alternatve gewählt, de dem jewelgen Merkmalsträger den grösseren Wert der Wrkungsvarablen n Ausscht stellt. Daraus ergeben sch folgende Veränderungen gegenüber dem multplkatven Modell mt exogener Selekton: ( α ' z = β ' x β ' x = β β ' x = ε ε = + = E ε = = E ε = so dass ε, ε, ~ N (, Ω mt Ω = + 8

E y E y D =, x = x ' x + D =, x = β ' x + φ Φ ( z ( z φ = β ' x + ρ Φ φ Φ ( z ( z φ = β ' x + ρ Φ φ E y D =, x = β ' x Φ ( z ( z ( z ( z ( z ( z ( z ( z φ = β ' x ρ Φ φ E y D =, x = β ' x Φ wobe: φ = β ' x ρ Φ ( z ( z ( z ( z z ( β β ' x ( β β ' x = =, da D * = y y + ATT st n desem Fall ATT = E y D =, x E y D =, x ( β β = ' x + E ε D =, x E ε D =,x = ( β β ' x + + ρ λ 9

De nachfolgende Graphk zegt, we ATT (de Dfferenz der Erwartungswerte der schrafferten Flächen n Abhänggket von Annahmen betreffend ρ, und streut. Zuglech zegt se, welche Verzerrungen entstehen, wenn man den Selektonsbas gnorert und anstelle der obgen Formel de Formel für ATT gemäss dem CLRM, d.h. β 'x β 'x verwendet. Nchttelnehmer y (y < y Telnehmer y (y > y postve Selekton (Annahme: ρ =, >, β 'x = β 'x β 'x β 'x negatve Selekton (Annahme: ρ =, <, β 'x = β 'x β 'x β 'x Kreuzselekton (Annahme: ρ = -, =, β 'x = β 'x β 'x β 'x 3

Bs auf enge wenge Veränderungen oder Umdeutungen blebt das Schätzverfahren m Prnzp das gleche. Es beten sch auch her weder zwe Vorgehen an: - das zwestufge Verfahren nach Heckman oder - Maxmum Lkelhood Zwestufges Verfahren nach Heckman. Stufe: Her st anzumerken, dass bezüglch D ( [ ( ] L = P D* > P D* D ( Φ ( P D* > = ( α ' z und P D* = Φ( α ' z nun glt: α ' z ( β β ' x ( β β = + ' x. Stufe: OLS- bzw. GLS-Schätzung der Glechung: y D D ˆ λ D ˆ λ ν = + + + ' ' ( + β x δ x und λ = φ Φ ( β β ( β β ' x ' x λ φ = Φ ( β β ( β β ' x ' x 3

Maxmum-Lkelhood Änderungen snd: P ( D* = Φ ( β β ' x P ( D* > = Φ ( β β ' x und P ( D* y > = Φ P( D* = Φ y ( β β ' x + ( y ' β x ( ρ ( β β ' x + ( y ' β x ( ρ 3

6.3.3. IV-Regressonen Im Untersched zum Selektonsmodell versucht der Instrumentvarablen(IV- Ansatz den Selektonsbas, der aus der Endogentät der Interventonsvarablen D entsteht, ncht zu modelleren, sondern zu elmneren, ndem sch de Wrkungsmessung auf jene Veränderungen der Programmtelnahme (D beschränkt, de auf Veränderungen der Instrumente (z zurückzuführen snd. De Instrumente (z snd de Bestmmungsfaktoren der Selektonsglechung. D* = α ' z + D = und y = y, wenn D* > und D = und y = y, wenn D * Um als Instrumente zu fungeren, müssen de Bestmmungsfaktoren der Selektonsglechung zwe Bedngungen erfüllen: ( Se müssen mt der Telnahme-Varablen D stark korreleren. ( Se müssen exogen sen: Cov(z, = Cov (z, ε = Cov (, x = De zwe Egenschaften, de m Rahmen ener IV-Regresson als dentfzerende Annahmen denen, bedeuten, dass Instrumente nur über D enen Enfluss auf y haben. En drekter Enfluss darf ncht bestehen. Gängge Instrumente snd hstorsche Enmalgketen oder Zufälle, de nchts mt der Wrkungsvarablen y zu tun haben und dafür sorgen, dass de Betroffenhet bzw. de Programmtelnahme eher zufällg entsteht. Idealerwese sollen Instrumente we Randomserungen (vgl. Abschntt 6.. wrken. Bem IV-Ansatz kann man auch unterscheden zwschen addtven Modellen, de ene enhetlche Wrkung be allen Betroffenen unterstellen, und multplkatven Modellen, de von merkmalsproflspezfschen Effekten ausgehen. Bem addtven Ansatz lautet der Modellrahmen y = β' x + δ D + ε, wobe ε ~ IID(, D* = α ' z + D = und y = y, wenn D* > und D = und y = y, wenn D * Wenn z de Exogentätsbedngung erfüllt, st [ ε =,, ] = [ ε =,, ] E D x z E D x z. 33

Das besagt, dass für gegebene Instrumentenwerte de Betroffenen und Ncht- Betroffenen hnschtlch ncht erfasster Bestmmungsfaktoren ε m Durchschntt dentsch snd. Infolge dessen st [, x, z] [, x, z] E[ D,, ] E[ D,, ATT = E y D = E y D = = δ + ε = x z ε = x z ] = δ De Wrkung ATT bzw. δ lässt sch mt enem IV-Schätzverfahren we SLS schätzen. Anhand der IV-Schätzung lässt sch zudem de Endogentät der Interventonsvarablen D mt enem Hausman-Test überprüfen. Der Hausman- Test beruht auf der Logk, dass de Dfferenz zwschen ener IV-Schätzung und ener OLS-Schätzung von δ ncht statstsch sgnfkant sen sollte, wenn de Interventonsvarable exogen st. Zudem lässt sch de Exogentät der Instrumente testen, sofern man mehr als enes hat. Zu desem Zweck st de sog. J-Statstk des Tests der überdentfzerenden Restrktonen zu berechnen. Wenn de Instrumente erklärungskräftg und exogen snd, st de J-Statstk, de dem m-fachen der F-Statstk ener Regresson der Resduen ener IV-Schätzung auf alle Instrumente entsprcht, χ -vertelt mt m-k Frehetsgraden, wobe k (= de Anzahl der endogenen Regressoren und m (> de Anzahl der externen Instrumente angbt. Der Vortel des IV-Ansatzes gegenüber Selektonsmodellen legt darn, dass der IV-Ansatz ohne ene Parametrserung der Vertelungen der Störterme auskommt. Dafür braucht es aber gute Instrumente. Das multplkatve Wrkungsmodell, das von de von merkmalsproflspezfschen Effekten ausgeht, beretet dem klassschen IV-Ansatz en Problem, da es n desem Fall unmöglch st, en Instrument zu fnden, das D bestmmt, ohne mt dem Störterm korrelert zu sen. Des legt an der veränderten Struktur der Wrkungsglechung: y = β ' x + δ ' x D + ε + ( ε ε We zu erkennen st, wrd en Instrument, das mt der Interventonsvarablen korrelert st, des auch mt dem zusammengesetzten Störterm D. + ( D ε ε ε sen. In desem Fall lässt sch ncht ATT, sondern en sog. Local Average Treatment Effekt (LATE unter bestmmten Umständen mt dem IV-Ansatz schätzen. Der LATE st n hrer Aussagekraft allerdngs engeschränkt. Wegen der heterogenen Wrkung der Interventon bezeht sch de gemessene Wrkung ledglch auf dejengen Merkmalsträger, deren Betroffenhet vom Instrument abhängt. Andere Instrumente können deshalb andere Wrkungen zutage fördern. 34

Anwendungsbespele Deheja/Wahba (999 Effekt SE t-wert P> t 95%-Intervall λ λ N N Expermentell (nur NSW Querverglech 794 67.67.8 476 33 85 6 Querverglech + RHV 643 688.39.7 9 996 85 6 Regressonsmodell (NSW+PSID homogene Wrkung 7 8.7.789-37 86 85 49 heterogene Wrkung ATE -783 3334 -..34-36 -546 85 49 heterogene Wrkung ATT 733 8..35 5 334 85 49 heterogene Wrkung ATNT -7738 359 -.6.3-4778 -697 85 49 Matchng (ATT Stratfcaton 3 76.4.3-79 384 98 33 Nearest Neghbor 56 6.5.799-3763 4883 85 57 Radus, r =. -9358 998-9.38. -33-743 57 583 Radus, r =. -7847 67-3.8. -898-3797 7 76 Radus, r =. 3 455.5.96-8698 945 6 3 Kernel 59 88.88.6-66 33 85 46 Selektonsmodell homogene Wrkung 437 3..3-543 648-67 85 49 heterogene Wrkung ATE 77 685..93-995 33493-77 -37 85 49 heterogene Wrkung ATT 3 35.68.494-3974 838-77 -37 85 49 heterogene Wrkung ATNT 744 759..9-36 36-77 -37 85 49 Deheja/Wahba ( Effekt SE t-wert P> t 95%-Intervall λ λ N N Expermentell (nur NSW Querverglech 794 67.67.8 476 33 85 6 Querverglech + RHV 643 688.39.7 9 996 85 6 Regressonsmodell (NSW+PSID homogene Wrkung 9 847.6.796-44 88 85 49 heterogene Wrkung ATE -385 36 -.8.37-5 85 49 heterogene Wrkung ATT 75 88.85.394-976 476 85 49 heterogene Wrkung ATNT -444 346 -..3-99 64 85 49 Matchng (ATT Stratfcaton 497 9.63.4-37 33 85 86 Nearest Neghbor 86 3895.33.74-6349 89 85 6 Radus, r =. -788 46-6.8. -55-556 5 54 Radus, r =. -64 54-3.. -48-375 7 9 Radus, r =. -35 389 -.36.7-7386 56 6 7 Kernel 34 934.44.5-488 37 85 86 Selektonsmodell homogene Wrkung 448 567.9.355-63 459-96 85 49 heterogene Wrkung ATE -6 879 -..7-55656 564 4543 85 49 heterogene Wrkung ATT -336 349 -..9-756 6384 4543 85 49 heterogene Wrkung ATNT -489 976 -.9.76-65 774 4543 85 49 35

unter Berückschtgung sämtlcher RHV Effekt SE t-wert P> t 95%-Intervall λ λ N N Expermentell (nur NSW Querverglech 794 67.67.8 476 33 85 6 Querverglech + RHV 643 688.39.7 9 996 85 6 Regressonsmodell (NSW+PSID homogene Wrkung -4 798..996-568 56 85 49 heterogene Wrkung ATE -357 3757 -.8.46-45 43 85 49 heterogene Wrkung ATT 6 83.94.5-3 36 85 49 heterogene Wrkung ATNT -343 49 -.84.398-34 4498 85 49 Matchng (ATT Stratfcaton 55 9.7.85-6 338 85 5 Nearest Neghbor 74 86.35.76-779 46 85 6 Radus, r =. -7983 75-7.43. -89-5876 56 6 Radus, r =. -787 366-3.33. -59-334 4 85 Radus, r =. -93 378 -.5.6-934 548 4 Kernel 8 95.35.78-584 348 85 5 Selektonsmodell homogene Wrkung 75 3.85.394-3 566-8 85 49 heterogene Wrkung ATE -6674 65 -.8.39-769 77 5858 98 85 49 heterogene Wrkung ATT 363 438.34.736-655 977 5858 98 85 49 heterogene Wrkung ATNT -8758 457 -.7.4-7694 9399 5858 98 85 49 36