6. Modelle mit binären abhängigen Variablen

6. Modelle mt bnären abhänggen Varablen 6.1 Lneare Wahrschenlchketsmodelle Qualtatve Varablen: Bnäre Varablen: Dese Varablen haben genau zwe möglche Kategoren und nehmen deshalb genau zwe Werte an, nämlch null und ens Multnomale Varablen: Dese Varablen haben mehr als zwe möglche sch gegensetg ausschleßende Alternatven und snd ncht geordnet (z.b. Wahl zwschen verschedenen Verkehrsmtteln) Ordnale Varablen: Dese Varablen haben ebenfalls mehr als zwe möglche Kategoren, snd aber geordnet (z.b. Kredtratng) Bespele für ökonometrsche Analysen mt bnären abhänggen Varablen: Analyse der Faktoren, de erklären, ob ene Person erwerbstätg oder aber erwerbslos st Analyse der Faktoren, de erklären, ob ene Person en bestmmtes Verkehrsmttel wählt oder aber en anderes Verkehrsmttel Analyse der Faktoren, de erklären, ob ene Person enem poltschen Programm zustmmt oder ncht Analyse der Faktoren, de erklären, ob en Unternehmen ene Innovaton durchgeführt hat oder ncht 1

Mt y ( = 1,, n) als bnäre abhängge Varable, x = (x 1,, x k ) als Vektor von k erklärenden Varablen (enschleßlch Konstante) und mt dem entsprechenden k-dmensonalen Parametervektor β = (β 1,, β k ) kann en ökonometrsches Modell we en lneares Regressonsmodell spezfzert werden: (6.1) y = β'x + u En solches lneares Regressonsmodell mt ener bnären abhänggen Varablen wrd als lneares Wahrschenlchketsmodell bezechnet. Mt E(u x ) = 0 folgt: (6.2) E(y x ) = β'x Da y ene bnäre Varable st mt y = 1 oder y = 0, st se Bernoull vertelt mt Parameter p und der folgenden Wahrschenlchketsfunkton: y 1-y (6.3) f (y ; p) = p (1-p ) für y = 0, 1 Im lnearen Wahrschenlchketsmodell folgt: (6.4) p = p (x, β) = P(y = 1 x, β) = E(y x ) = β'x Interpretaton der Stegungsparameter: De Stegungsparameter β h (h = 2,, k) geben ncht mehr de Veränderung von y be enem Ansteg der erklärenden Varablen x h um ene Enhet an (falls alle anderen erklärenden Varablen konstant gehalten werden) Stattdessen west β h (h = 2,, k) de Veränderung der Wahrschenlchket p (x, β), dass y den Wert ens annmmt, be ener Erhöhung von x h um ene Enhet (be quanttatven erklärenden Varablen) aus (ceters parbus) 2

Falls alle anderen erklärenden Varablen konstant gehalten werden, ergbt sch: (6.5) p (x, β) = ΔP y = 1 x, β = β Δx We be der OLS-Schätzung n lnearen Regressonsmodellen können de unbekannten Regressonsparameter β 1,, β k auch m lnearen Wahrschenlchketsmodell mt der OLS-Methode geschätzt werden. Des führt zum OLS- Schätzer des Parametervektors β = (β 1,, β k ). Es folgt: Der Schätzer der abhänggen Varablen st y = β x, das de geschätzte Wahrschenlchket p (x, β), dass y den Wert ens annmmt, darstellt Der geschätzte Stegungsparameter β h (h = 2,, k) gbt de Veränderung der geschätzten Wahrschenlchket p (x, β) an, falls x h um ene Enhet (be quanttatven erklärenden Varablen) stegt (ceters parbus) Problem: h h Da y Bernoull vertelt st mt dem Parameter p (x, β) = P(y = 1 x, β) = β x und u = - β x für y = 0 und u = 1 - β x für y = 1, folgt für de bedngte Varanz von y und de bedngte Varanz des Störterms u : (6.6) Var(y x ) = Var(u x ) = β'x (1 - β'x ) De bedngte Varanz des Störterms st damt notwendgerwese ncht konstant, so dass Heteroskedastztät vorlegt. Deshalb sollten zumndest heteroskedastztäts-robuste t-statstken verwendet werden. 3

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von Frauen Mt Hlfe enes lnearen Wahrschenlchketsmodells soll der Effekt anderer Enkommen (n 1000 Dollar) enschleßlch der des Ehemanns (nwfenc), der Ausbldungszet n Jahren (educ), der Berufserfahrung n Jahren (exper), der quadrerten Berufserfahrung n Jahren (expersq), des Alters n Jahren (age) sowe der Anzahl der Knder unter sechs Jahren (kdslt6) bzw. zwschen sechs und 18 Jahren (kdsge6) auf de Erwerbstätgket (nlf) von verherateten Frauen untersucht werden. Dabe nmmt nlf den Wert ens an, falls de Frau erwerbstätg st. De folgende OLS-Regressonsglechung wurde mt n = 753 Frauen geschätzt, wobe auch heteroskedastztäts-robust geschätzte Standardabwechungen der geschätzten Parameter (n eckgen Klammern) zusätzlch zu den konventonell geschätzten Standardabwechungen ausgewesen werden (R 2 = 0,264): ˆ nlf = 0,586-0,003nwfenc + 0,038educ + 0,039exper - 0,001expersq (0,154) (0,001) (0,007) (0,006) (0,000) [0,152] [0,002] [0,007] [0,006] [0,000] - 0,016age - 0,262kdslt6 + 0,013kdsge6 (0,002) (0,034) (0,013) [0,002] [0,032] [0,014] --------------------------------------------------------------------------------------------------------- 4

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von Frauen (Fortsetzung) Interpretaton: Auf der Grundlage beder t-statstken haben alle erklärenden Varablen außer kdsge6 sgnfkante Effekte En zusätzlches Ausbldungsjahr führt zu ener geschätzten Erhöhung der Wahrschenlchket der Erwerbstätgket um 0,038 oder 3,8 Prozentpunkte (ceters parbus) Zehn zusätzlche Ausbldungsjahre mplzeren somt ene sehr starke geschätzte Erhöhung der Wahrschenlchket der Erwerbstätgket um 0,038 10 = 0,38 oder 38 Prozentpunkte Ene Erhöhung von nwfenc um 10000 Dollar (d.h. nwfenc = 10) führt zu ener eher klenen geschätzten Redukton der Wahrschenlchket der Erwerbstätgket um 0,034 oder 3,4 Prozentpunkte Ene Erhöhung von exper um en Jahr führt zu ener geschätzten Veränderung der Wahrschenlchket der Erwerbstätgket um 0,039-2 0,0006 exper = 0,039 0,0012 exper En zusätzlches Knd unter sechs Jahren mplzert enen sehr starken geschätzten Rückgang der Wahrschenlchket der Erwerbstätgket um 0,262 oder 26,2 Prozentpunkte --------------------------------------------------------------------------------------------------------- 5

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von Frauen (STATA-Output) Mt STATA haben sch folgende OLS-Schätzergebnsse mt heteroskedastztäts-robust geschätzten Standardabwechungen der geschätzten Parameter gezegt: reg nlf nwfenc educ exper expersq age kdslt6 kdsge6, robust Lnear regresson Number of obs = 753 F( 7, 745) = 62.48 Prob > F = 0.0000 R-squared = 0.2642 Root MSE =.42713 ------------------------------------------------------------------------------ Robust nlf Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- nwfenc -.0034052.0015249-2.23 0.026 -.0063988 -.0004115 educ.0379953.007266 5.23 0.000.023731.0522596 exper.0394924.00581 6.80 0.000.0280864.0508983 expersq -.0005963.00019-3.14 0.002 -.0009693 -.0002233 age -.0160908.002399-6.71 0.000 -.0208004 -.0113812 kdslt6 -.2618105.0317832-8.24 0.000 -.3242058 -.1994152 kdsge6.0130122.0135329 0.96 0.337 -.013555.0395795 _cons.5855192.1522599 3.85 0.000.2866098.8844287 ------------------------------------------------------------------------------ --------------------------------------------------------------------------------------------------------- 6

Bewertung von lnearen Wahrschenlchketsmodellen: De Parameter snd genauso we n lnearen Regressonsmodellen enfach mt der OLS-Methode zu schätzen und de geschätzten Stegungsparameter snd enfach als partelle Effekte zu nterpreteren Jedoch snd de geschätzten Wahrschenlchketen p (x, β) = P(y = 1 x, β), dass de abhänggen Varablen y den Wert ens annehmen, ncht auf das Intervall von null bs ens beschränkt, d.h. für spezfsche Werte der erklärenden Varablen können de geschätzten Wahrschenlchketen entgegen der Defnton von Wahrschenlchketen negatv oder größer als ens sen Zudem hängen Wahrschenlchketen für alle denkbaren Werte lnear mt ener erklärenden Varablen zusammen. De vorherge Schätzung mplzert z.b. ene geschätzte Redukton der Wahrschenlchket der Erwerbstätgket um 0,262, falls sch de Anzahl der Knder unter sechs Jahren von null auf ens erhöht. Dese Redukton wrd genauso be ener Erhöhung von enem Knd auf zwe Knder geschätzt, obwohl ene Abschwächung des Rückgangs mt zunehmenden Knderzahlen realstscher erschent. De vorherge Analyse mplzert sogar den defntonsgemäß unmöglchen Fall, dass ver zusätzlche Knder zu enem geschätzten Rückgang der Wahrschenlchket der Erwerbstätgket um 0,262 4 = 1,048 oder 104,8 Prozentpunkte führen. Aus desen Gründen wrd das lneare Wahrschenlchketsmodell nur noch sehr selten n emprschen Anwendungen verwendet 7

6.2 Bnäre Probt- und Logtmodelle Bnäre abhängge Varablen y n enem ökonometrschen Modell mt dem Vektor x = (x 1,, x k ) von k erklärenden Varablen und dem entsprechenden Parametervektor β = (β 1,, β k ) snd generell Bernoull vertelt mt der folgenden Wahrschenlchketsfunkton ( = 1,, n): y y (6.7) f y ; x, β = p (x, β) 1 - p (x, β) Unterschedlche Modelle mt bnären abhänggen Varablen resulteren aus unterschedlchen Spezfkatonen der Wahrschenlchket p (x, β) = P(y = 1 x ), dass de abhängge Varable y den Wert ens annmmt. Be lnearen Wahrschenlchketsmodellen st dese Wahrschenlchket dentsch mt β x, so dass kene Werte zwschen null und ens gewährlestet snd. Dese Werte können durch nchtlneare Funktonen F (x, β) = F (β x ) und vor allem durch Vertelungsfunktonen belebger Zufallsvarablen schergestellt werden. Be bnären Probtmodellen st F (β x ) = Φ (β x ) der Wert der Vertelungsfunkton ener standardnormalvertelten Zufallsvarablen be β x : t 1 - (6.8) F 2 (β'x ) = Φ (β'x ) = p (x, β) = P(y = 1 x, β) = e dt 2π De Wahrschenlchketen p (x, β) n bnären Probtmodellen müssen somt durch Integraton berechnet werden. 1-y = P(y = 1 x, β) 1 - P(y = 1 x, β) für y = 0, 1 β'x 1-y - 2 8

Im Fall von bnären Logtmodellen st F (β x ) = Λ (β x ) der Wert der Vertelungsfunkton ener standardlogstschen Vertelung be β x : β'x e (6.9) F (β'x ) = Λ (β'x ) = p (x, β) = P(y = 1 x, β) = 1 + e β'x Im Untersched zu bnären Probtmodellen müssen de Wahrschenlchketen p (x, β) n bnären Logtmodellen ncht durch Integraton ermttelt werden, sondern wesen ene geschlossene Form auf. Trotz der substanzellen Unterschede n der funktonalen Form snd de Wahrschenlchketen p (x, β) = P(y = 1 x, β) n bnären Probt- und Logtmodellen (außer für enen konstanten Skalerungsfaktor) sehr ähnlch, so dass de Wahl zwschen den beden ökonometrschen Modellen n emprschen Untersuchungen kaum enen Untersched macht Interpretaton des Parameters β h n Modellen mt bnären abhänggen Varablen n Bezug auf den (partellen) Effekt der erklärenden Varablen x h (h = 2,, k) auf de Wahrschenlchket p (x, β) = P(y = 1 x, β): Der Parameter β h kann ncht so enfach we m lnearen Wahrschenlchketsmodell nterpretert werden, d.h. er kann ncht als Veränderung von p (x, β) nterpretert werden, falls (ceters parbus) x h um ene Enhet stegt (für ene quanttatve erklärende Varable) 9

Stattdessen beträgt der (partelle) margnale Wahrschenlchketseffekt von x h n Modellen mt bnären abhänggen Varablen we folgt ( = 1,, n): p (x, β) F (β x ) df (β x ) β x = = = f (β x )β x x d(β x ) x h h h h Dabe st F (β x ) n bnären Probtmodellen de Vertelungsfunkton ener standardnormalvertelten Zufallsvarablen und n bnären Logtmodellen de Vertelungsfunkton ener standardlogstsch vertelten Zufallsvarablen. Zudem st f (β x ) de entsprechende Dchtefunkton. Falls alle anderen erklärenden Varablen konstant gehalten werden, ergbt sch be ener Veränderung x h : (5.10) Δp (x, β) f(β x )β Δx h h Je klener de Veränderung x h, desto besser st de lneare Approxmaton. Wchtge Aspekte der (partellen) margnalen Wahrschenlchketseffekte: Das Vorzechen des Parameters β h gbt de Rchtung des margnalen Wahrschenlchketseffektes von x h an De margnalen Wahrschenlchketseffekte snd für β x = 0 maxmal, da de Dchtefunktonen an desem Wert maxmal snd De margnalen Wahrschenlchketseffekte vareren ncht nur mt unterschedlchen Werten der erklärenden Varablen x h, sondern auch mt unterschedlchen Werten der anderen erklärenden Varablen 10

In emprschen Analysen st de Betrachtung margnaler Wahrschenlchketseffekte ener erklärenden Varablen x h für ene typsche Beobachtung (z.b. Person, Haushalt, Unternehmen) nteressant. Deshalb werden häufg durchschnttlche margnale Wahrschenlchketseffekte über alle = 1,, n Beobachtungen geschätzt oder margnale Wahrschenlchketseffekte, de am arthmetschen Mttel der erklärenden Varablen ermttelt werden. Parameterschätzung: Be bnären Probt- und Logtmodellen st de Schätzung der Parameter mt der OLS-Methode ncht geegnet, da de wesentlchen Annahmen (Vorlegen enes lnearen Regressonsmodells) für günstge Schätzegenschaften ncht gegeben snd. Aus desem Grund sollte de OLS-Methode durch alternatve Schätzmethoden ersetzt werden. Der wchtgste Ansatz für bnäre Probt- und Logtmodelle st de Maxmum Lkelhood Methode (ML), de auf ener parametrschen Vertelung der abhänggen Varablen basert De Maxmum Lkelhood Methode st das wchtgste Schätzverfahren be qualtatven abhänggen Varablen (bzw. allgemen be mkroökonometrschen Modellen) und west unter bestmmten Annahmen sehr günstge Egenschaften auf, d.h. ML-Schätzer snd konsstent und asymptotsch effzent und Funktonen von ML-Schätzern snd asymptotsch normalvertelt (so dass sch t- bzw. z-statstken ableten lassen) 11

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von Frauen We m vorhergen Bespel soll der Effekt anderer Enkommen, der Ausbldungszet n Jahren, der enfachen und quadrerten Berufserfahrung, des Alters sowe der Anzahl der Knder unter sechs Jahren bzw. zwschen sechs und 18 Jahren auf de Erwerbstätgket von n = 753 verherateten Frauen untersucht werden. Jedoch werden jetzt kene lnearen Wahrschenlchketsmodelle, sondern bnäre Probt- und Logtmodelle untersucht. Dabe haben sch mt STATA folgende ML-Schätzergebnsse m bnären Probtmodell gezegt: probt nlf nwfenc educ exper expersq age kdslt6 kdsge6 Probt regresson Number of obs = 753 LR ch2(7) = 227.14 Prob > ch2 = 0.0000 Log lkelhood = -401.30219 Pseudo R2 = 0.2206 ------------------------------------------------------------------------------ nlf Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- nwfenc -.0120237.0048398-2.48 0.013 -.0215096 -.0025378 educ.1309047.0252542 5.18 0.000.0814074.180402 exper.1233476.0187164 6.59 0.000.0866641.1600311 expersq -.0018871.0006-3.15 0.002 -.003063 -.0007111 age -.0528527.0084772-6.23 0.000 -.0694678 -.0362376 kdslt6 -.8683285.1185223-7.33 0.000-1.100628 -.636029 kdsge6.036005.0434768 0.83 0.408 -.049208.1212179 _cons.2700768.508593 0.53 0.595 -.7267472 1.266901 ------------------------------------------------------------------------------ --------------------------------------------------------------------------------------------------------- 12

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von Frauen (Fortsetzung) Im bnären Logtmodell haben sch mt STATA dagegen folgende ML-Schätzergebnsse gezegt: logt nlf nwfenc educ exper expersq age kdslt6 kdsge6 Logstc regresson Number of obs = 753 LR ch2(7) = 226.22 Prob > ch2 = 0.0000 Log lkelhood = -401.76515 Pseudo R2 = 0.2197 ------------------------------------------------------------------------------ nlf Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- nwfenc -.0213452.0084214-2.53 0.011 -.0378509 -.0048394 educ.2211704.0434396 5.09 0.000.1360303.3063105 exper.2058695.0320569 6.42 0.000.1430391.2686999 expersq -.0031541.0010161-3.10 0.002 -.0051456 -.0011626 age -.0880244.014573-6.04 0.000 -.116587 -.0594618 kdslt6-1.443354.2035849-7.09 0.000-1.842373-1.044335 kdsge6.0601122.0747897 0.80 0.422 -.086473.2066974 _cons.4254524.8603697 0.49 0.621-1.260841 2.111746 ------------------------------------------------------------------------------ De Darstellung sämtlcher Schätzergebnsse m lnearen Wahrschenlchketsmodell sowe m bnären Probt- und Logtmodell, de typscherwese zumndest de Schätzwerte, de t- bzw. z-statstken oder geschätzten Standardabwechungen der geschätzten Parameter sowe Informatonen über de Sgnfkanz des Effektes der erklärenden Varablen enthält, hat z.b. folgendes Aussehen: --------------------------------------------------------------------------------------------------------- 13

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von Frauen (Fortsetzung) ML-Schätzwerte (z-statstken), abhängge Varable: Erwerbstätgket (nlf) Erklärende Varablen Lneares Wahrschenlchketsmodell nwfenc -0.003** (-2.23) educ 0.038*** (5.23) exper 0.039*** (6.80) expersq -0.001*** (-3.14) age -0.016*** (-6.71) kdslt6-0.262*** (-8.24) kdsge6 0.013 (0.96) Konstante 0.586 (3.85) Bnäres Probtmodell -0.012** (-2.48) 0.131*** (5.18) 0.123*** (6.59) -0.002*** (-3.15) -0.053*** (-6.23) -0.868*** (-7.33) 0.036 (0.83) 0.270 (0.53) Bnäres Logtmodell -0.021** (-2.53) 0.221*** (5.09) 0.206*** (6.42) -0.003*** (-3.10) -0.088*** (-6.04) -1.443*** (-7.09) 0.060 (0.80) 0.425 (0.49) Anmerkung: *** (**, *) bedeutet, dass de entsprechende erklärende Varable zum 1% (5%, 10%) Sgnfkanznveau enen Effekt aufwest, n = 753 --------------------------------------------------------------------------------------------------------- 14

--------------------------------------------------------------------------------------------------------- Bespel: Erklärung der Erwerbstätgket von verherateten Frauen (IV) Interpretaton: De Schätzergebnsse snd n allen dre ökonometrschen Modellen mt bnären abhänggen Varablen qualtatv sehr ähnlch, d.h. de Vorzechen der Parameterschätzwerte snd dentsch und deselben erklärenden Varablen haben enen sgnfkanten Effekt Allerdngs st de Höhe der Schätzwerte aufgrund unterschedlcher Schätzungen der durchschnttlchen margnalen Wahrschenlchketseffekte über alle Beobachtungen oder der margnalen Wahrschenlchketseffekte am arthmetschen Mttel der erklärenden Varablen ncht drekt verglechbar Ene kurze Überprüfung der Parameterschätzwerte n bnären Probt- und Logtmodellen (und evtl. lnearen Wahrschenlchketsmodellen) ergbt sch durch de Berückschtgung der unterschedlchen Skalerungsfaktoren n den margnalen Wahrschenlchketseffekten, d.h. als Faustregel können Schätzwerte n bnären Probtmodellen mt 1,6 multplzert (oder umgekehrt durch 0,625 dvdert) werden, um se mt den Schätzwerten n bnären Logtmodellen verglechbar zu machen, sowe durch 2,5 dvdert werden, um se mt den Schätzwerten n lnearen Wahrschenlchketsmodellen verglechbar zu machen --------------------------------------------------------------------------------------------------------- 15