2 Modelle für diskrete und beschränkte abhängige Variablen

Ähnliche Dokumente
Teil E: Qualitative abhängige Variable in Regressionsmodellen

Kurs Mikroökonometrie Rudolf Winter-Ebmer Thema 3: Binary Choice Models Probit & Logit. Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit

6. Modelle mit binären abhängigen Variablen

2 Zufallsvariable und Verteilungen

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

5 Gemischte Verallgemeinerte Lineare Modelle

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

Konkave und Konvexe Funktionen

Definition des linearen Korrelationskoeffizienten

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Statistik und Wahrscheinlichkeitsrechnung

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Empirische Wirtschaftsforschung

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Mathematische und statistische Methoden II

Grundgedanke der Regressionsanalyse

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

Elemente der Mathematik - Sommer 2016

Kapitel V. Parameter der Verteilungen

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

-70- Anhang: -Lineare Regression-

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

2.1 Einfache lineare Regression 31

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Streuungs-, Schiefe und Wölbungsmaße

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

Lösungen zum 3. Aufgabenblock

14 Schätzmethoden. Eigenschaften von Schätzungen ˆθ. Sei ˆθ n eine Schätzung eines Parameters θ, die auf n Beobachtungen beruht.

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

Standardnormalverteilung / z-transformation

Facility Location Games

3. Lineare Algebra (Teil 2)

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

20 Ordinale Regression

Ordered Response Models (ORM)

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Analyse von Querschnittsdaten. Bivariate Regression

Rückblick Regression II: Anpassung an Polynome

Stochastische Prozesse

Übung zur Vorlesung - Theorien Psychometrischer Tests II

1 Mehrdimensionale Analysis

Technische Universität München Zentrum Mathematik Diskrete Optimierung: Fallstudien aus der Praxis. Das Cutting Stock-Problem

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayessches Lernen

ME II, Prof. Dr. T. Wollmershäuser. Kapitel 2 Das IS-LM-Modell

Statistik der Extremwertverteilungen

Lineare Regression - Mathematische Grundlagen

Item-response Theorie (Probablistiche Testtheorie) Grundidee der item-response Theorie ist, dass die Antworten auf die Testitems lediglich

18. Vorlesung Sommersemester

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

Auswertung univariater Datenmengen - deskriptiv

Erwartungswert, Varianz, Standardabweichung

Gauss sche Fehlerrrechnung

16. Vorlesung Sommersemester

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

8 Logistische Regressionsanalyse

Multivariate Analysemethoden

Prof. Dr. Roland Füss Statistik II SS 2008

Sind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)

FORMELSAMMLUNG STATISTIK (I)

Lösungen der Aufgaben zu Kapitel 2

Aufgabe 1: Portfolio Selection

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Kreditrisikomodellierung und Risikogewichte im Neuen Baseler Accord

Beschreibende Statistik Mittelwert

3. Textprobe Makroökonomik (Auszug aus Kapitel 9)

Der Erweiterungsfaktor k

Teil IV: Drei Musterklausuren

Fallstudie 4 Qualitätsregelkarten (SPC) und Versuchsplanung

Anhang 9. Bias in ökologischen Studien bei nichtlinearen Risikomodellen

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

5.3.3 Relaxationsverfahren: das SOR-Verfahren

Kapitel 2: Klassifikation. Maschinelles Lernen und Neural Computation

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104

Netzwerkstrukturen. Entfernung in Kilometer:

Der stöchiometrische Luftbedarf einer Reaktion kann aus dem Sauerstoffbedarf der Reaktion und der Zusammensetzung der Luft berechnet werden.

Auswertung univariater Datenmengen - deskriptiv

Ihnen liegen Beobachtungen aus dem Current Population Survey aus dem Jahr 1988 vor. Unter anderem sind folgende Variablen enthalten:

Einführung in die numerische Mathematik

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr

3.3 Lineare Abbildungen und Matrizen

Protokoll zu Versuch C1-Mischungsvolumina

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

22. Vorlesung Sommersemester

1 Finanzmathematik. 1.1 Das Modell. Sei Xt

6. Übung zur Linearen Algebra II

Transkript:

2 Modelle für dskrete und beschränkte abhängge Varablen Mkrodaten snd sehr häufg dadurch gekennzechnet, daß neben den metrschen Varablen für de Indvduen bestmmte Egenschaften, d.h. qualtatve bzw. dskrete Merkmale beobachtet werden. Sehr häufg lassen sch dese qualtatven Merkmale we z.b. das Geschlecht ener Person oder de Exstenz ener Forschungsabtelung n enem Unternehmen durch entsprechende 0,1-Varablen (Dumm-Varablen, bnäre Varablen) abblden. Andere qualtatve Merkmale lassen mehr als zwe Alternatven zu. Dese Alternatven können entweder ungeordnet sen we bespelswese de Berufstätgket enes Indvduums (Arbeter, Angestellter, Beamter etc.) oder de Wahl des Prozeßortes be Patentstretgketen (Düsseldorf, München, Mannhem, etc.). Se können aber auch geordnet sen we bespelswese der höchste Bldungsabschluß ener Person (Hauptschule, Realschule, Gmnasum, Fachhochschule, Hochschule etc.) oder de subjektve Enschätzung der Bedeutung von Merkmalen (gernge bs große Bedeutung auf ener Skala von 1 bs 5, sogenannte Lkert-Skalen). Wederum andere Merkmale snd zwar quanttatv, treten aber nur n dskreten Ausprägungen auf (sogenannte Zähldaten, de m nachfolgenden Kaptel 3 behandelt werden), we bespelswese de Anzahl von Kndern n enem Haushalt oder de Anzahl von Patenten, de en Unternehmen hält. Oder se snd quanttatv, aber beschränkt we bespelswese de täglche Frezetnachfrage, de ncht 24 Stunden überstegen kann, oder aber das täglche Arbetsangebot, das ncht unter 0 Stunden snken kann. Dese Varablen bereten n der Regel weng Probleme, wenn se auf der rechten Sete der Glechung stehen, also erklärende Varablen snd. Des ändert sch, wenn de Erklärung der Varablen selbst m Mttelpunkt des Interesses steht, de qualtatven oder dskreten Merkmale also selbst endogene Varablen snd. De Methoden, de für derartge Modelle entwckelt worden snd, werden häufg unter dem Begrff Mkroökonometre zusammengefaßt, obwohl se nur enen Tel der Methoden für Mkrodaten blden. Zu desen Methoden snd nzwschen auch etlche Lehrbücher und Monographen entstanden, n deutscher Sprache bespelswese Ronnng (1991). Auch allgemene Lehrbücher o- der Monographen zur Ökonometre enthalten umfassende Abschntte, we nsbesonde- 44

re Amema (1985) n den Kapteln 9 und 10, aber auch Greene (1993) m Kaptel 19. Der mmer noch sehr lesenswerte Klassker n der Lteratur st jedoch zwefelsohne de Monographe des m Sommer 1999 verstorbenen Maddala (1983). 2.1 Modelle für bnäre abhängge Varablen 2.1.1 Das lneare Wahrschenlchketsmodell De enfachste Form, en Modell für bnäre abhängge Varablen zu konstrueren, st das lneare Wahrschenlchketsmodell (lnear probablt model). De abhängge Varable st ene bnäre, also 0,1-Varable, de z.b. mßt, ob das Indvduum en Auto gekauft hat oder ncht, oder ob Indvduum Gewerkschaftsmtgled st oder ncht. Es glt n desem Fall (2.1) 1 wenn Gewerkschaftsmtgled = 0 wenn ken Gewerkschaftsmtgled. Erklärt man de Entschedungen des Indvduums mt Hlfe geegneter unabhängger Varablen X we z.b. Alter n Jahren, Schulbldung, Berufserfahrung etc., so läßt sch de Wahrschenlchket, daß en Indvduum Gewerkschaftsmtgled st, folgendermaßen modelleren: (2.2) ( = 1) = F( Xβ ) ( = 0) = 1 F( X β ) P P wobe F( Xβ ) ene kumulerte Vertelungsfunkton st. Im lnearen Wahrschenlchketsmodell wrd dese Vertelungsfunkton lnear modellert, d.h. F( X β) folgt: (2.3) = X β + u = X β. Daraus Da nur de Werte 1 oder 0 annehmen kann, können de Störgrößen für gegebene erklärende Varablen (2.4) u = 1 X β bzw. u = X β. X ebenfalls nur 2 Werte annehmen 45

Daraus folgt, daß für gegebene X de Störgrößen u ncht de Bedngungen der Normalvertelung erfüllen können. De u folgen dann ener Bernoull-Vertelung. Ihr Erwartungswert st: (2.5) E( u) = ( 1 X β) P( = 1) = 1 Xβ 1 P( = 1) Der Erwartungswert st nur dann glech null, wenn P( 1) = = X β st. Es st ncht enmal gewährlestet, daß de prognostzerte Wahrschenlchket ( 1 ) P = X = X β zwschen 0 und 1 legt. Se kann sogar negatv werden. Ferner st für ( 1 ) P = X = X β de Varanz der Störgrößen von X abhängg (heteroskedastsch), denn es glt: 2 2 (2.6) E( u 2 X ) = ( 1 X β) P( = 1 ) + ( X β) 1 P( = 1 ) = X β ( 1 X β) X β 1 X β Der KQ-Schätzer der Glechung (2.3) st daher neffzent. Aufgrund deser Überlegungen st klar, daß das lneare Modell egentlch ncht geegnet st, ene abhängge 0,1- Varable zu erklären. Es fndet n emprschen Studen daher kaum Anwendung, so daß man für emprsche Illustratonen auf Lehrbuchbespele zurückgrefen muß. Wr benutzen das Bespel zur Erklärung der Mtgledschaft n der Gewerkschaft n den USA (Unon) aus dem Lehrbuch Johnston and DNardo (1997). De Varablen stammen aus dem Current Populaton Surve von 1988 und bedeuten: - Unon Mtgledschaft n ener Gewerkschaft ( Unon = 1) - Exp Potentelle Erfahrung ( Exp = Alter - Schuljahre - 5 ) 2 - Exp 2 ( Exp ) - Grade Anzahl der vollendeten Schuljahre - Marred verheratet ( Marred = 1) - Hgh beschäftgt n enem Wrtschaftszweg mt hohem gewerkschaftl. Organsatonsgrad ( Hgh = 1). Man erhält mt n RATS mt dem Befehl LINREG folgende Koeffzenten 46

Tabelle 2.1 Schätzergebnsse für das lneare Wahrschenlchketsmodell β t Sgn. level Exp.0200388 5.14 0.000 Exp2 -.0003706-4.53 0.000 Grade -.0124636-2.44 0.015 Marred.0133428 0.45 0.657 Hgh.1439396 5.61 0.000 constant.1021368 1.36 0.173 R 2 = 0.0837; N = 1000 2.1.2 Das Probt-Modell Snnvoller st en Modell, das de Wahrschenlchket ( 1) P = drekt aus ener Vertelungsannahme erklärt. Modelle, de auf dese Wese en dchotomes Wahlverhalten erklären wollen, bezechnet man auch als bnäre Wahlhandlungsmodelle oder Bnar Choce-Modelle. Erklärt wrd de Wahrschenlchket für den Entrtt bzw. Nchtentrtt enes Eregnsses, z.b. Kauferegnsses, unter der Bedngung gegebener erklärender Varablen, und es wrd analsert, we dese bedngte Wahrschenlchket mt den erklärenden Varablen varert. In der ökonometrschen Lteratur werden praktsch nur zwe alternatve Vertelungsannahmen verwendet: de Normalvertelung und de logstsche Vertelung. Das sogenannte Probt-Modell verwendet de kumulerte Vertelungsfunkton der Standardnormalvertelung: 1 P = X = F X =Φ X = e dz für σ = 1 2π (2.7) ( 1 ) ( β) ( β) X β De Grenzwerte 0 und 1 für de Wahrschenlchket P( = 1 X ) snd ncht verletzt. Da es sch be der abhänggen Varablen um ene Wahrschenlchket handelt, st dese Varable auf das Intervall [ 0,1 ] beschränkt. Es glt ferner (2.8) ( ) ( β) E x =Φ X X β 2 z 2 47

Somt st auch der Erwartungswert auf das Intervall [ 0,1 ] beschränkt. Um das klasssche Regressonsmodell auf desen Fall anzuwenden, wrd zwschen enem latenten Modelltel und enem beobachteten Modelltel unterscheden. Der latente Modelltel erklärt ene ncht beobachtbare (latente) Varable, de man als stetge Negung bespelswese en Konsumgut zu kaufen nterpreteren kann, we m klassschen Regressonsmodell. (2.9) Latenter Modelltel 2 = + mt u N( 0, σ ) X β u Der latente Modelltel sagt, daß de unbeobachtbare Varable ener stetgen Vertelung über den Werteberech (, + ) folgt we m klassschen Regressonsmodell. Im Probt-Modell gbt m latenten Modelltel an, mt welcher Intenstät der Haushalt den Kauf des Konsumgutes wünscht bzw. hn ablehnt. Für > 0 wünscht er den Kauf, für 0 lehnt er hn ab. Beobachtbar st aber m Probt-Modell ledglch de Varable nämlch ob der Haushalt das Konsumgut kauft ( = 1) oder ncht ( = 0). Der Haushalt, kauft das Gut nur, wenn de Bedngung > 0 bzw. u σ > X β σ glt. Für de beobachtbare Varable glt daher: (2.10) Beobachtbarer Modelltel = 1, wenn > 0 bzw. u σ > X 0, wenn 0 bzw. u σ X Wr erklären das Probt- und Logt-Modell m folgenden am Bespel enes Haushalts, der n der Untersuchungsperode entweder en langlebges Gebrauchsgut kauft ( = 1) oder ncht kauft ( = 0). De Idee des Probt-Modells kann dann we folgt beschreben werden: Haushalte haben en bestmmtes Enkommen, das zu Ausgaben z.b. für de Anschaffung enes Autos führt bzw. ncht führt. Es wrd angenommen, daß der krtsche Wert der latenten Varablen β σ β σ, be dem en Haushalt sch zu ener solchen Ausgabe entschleßt, 48

von Haushalt zu Haushalt varert. Folgen dese krtschen latenten Werte ener Normalvertelung, so daß sch wegen (2.11) ( ) ( ) ( ) ( ) P = 0 = P 0 = P u σ X β σ =Φ X β σ = 1 Φ( X β / σ) ( ) ( β σ) P = 1 = 1 Φ X =Φ( X β / σ) de folgende Lkelhoodfunkton für das Probt-Modell nach Sorterung n M Haushalte mt Beobachtung = 0 und N MHaushalte mt = 1 ergbt: (2.12) L = P( = 0) P( = 0) P( = 0) P( = 1) P( = 1) probt 1 2 M M+ 1 N M N ( 0) ( 0) L = P P > probt = 1 = M + 1 M ( σ β σ) ( σ β σ ) = P u X P u > X = 1 = M+ 1 M ( X β σ) ( X β σ ) = 1 Φ Φ = 1 = M+ 1 N N wobe Φ ( X β / σ) de kumulerte Vertelungsfunkton der Normalvertelung für enen Haushalt mt Merkmalsvektor X st. De Maxmerung der logarthmerten Lkelhoodfunkton durch Dfferentaton nach den Parametern β und σ sowe Nullsetzen der 1. Abletung, führt zu nchtlnearen Funktonen, aus denen de zu schätzenden Parameter teratv ermttelt werden können. De Maxmerung deser Lkelhoodfunkton st en nchtlneares Schätzproblem ähnlch der nchtlnearen KQ-Schätzung, we se n Ökonometre I behandelt wurde. Wr betrachten de Log-Lkelhoodfunkton M (2.13) ln Lprobt = ln 1 Φ ( Xβ σ) + lnφ( X β σ ) sowe deren Abletung nach β = 1 = M + 1 N (2.14) ln L N M φ X φ X = β Φ σ 1 Φ σ. probt = M+ 1 = 1 Dabe stellen φ und Φ auch m weteren Verlauf des Skrpts verenfachte Schrebwesen der Dchte φ( ) β σ sowe der kumulerten Vertelungsfunkton der Normalvertelung ( X β σ ) X Φ dar. Das teratve Verfahren schätzt dann de Glechung 49

1 2 (2.15) ln L lnl β j+ 1 = βj β β β β j wobe sch de Matrx der 2. Abletungen als β j (2.16) 2 M N ln L φ Xβ XX φ Xβ XX = φ + φ 2 2 β β = 1 ( 1 ) σ Φ σ = M + 1 Φ σ σ ergbt. β ˆ j st en Anfangswert, der z.b. aus den lnearen Wahrschenlchketsmodell stammen kann. Dese Iteratonen, z.b. mttels der Newton-Raphson-Methode oder des Verfahrens von Berndt, Hall, Hall and Hausmann (1974) konvergeren nur dann zuverlässg gegen en globales Maxmum der logarthmerten Lkelhoodfunkton, wenn dese global konkav bezüglch hrer Parameter st. Olsen (1978) hat nachgewesen, daß dese Bedngung für de obgen Modelle erfüllt st. Allerdngs snd n Probt-Modellen nur standardserte Koeffzenten β σ dentfzert. 2.1.3 Das Logt-Modell Im Probt-Modell wrd ene Normalvertelung des krtschen Wertes unterstellt, der durch de de Entschedung beenflussenden unabhänggen Varablen bestmmt wrd. Im Logt-Modell geht man demgegenüber von ener logstschen Vertelung aus: (2.17) 1 f() = X / 1 + β σ e 1 P( = 1 X ) = F(X β/ σ ) = 1 + e X β / σ Ansonsten st de Vorgehenswese enschleßlch deren Interpretaton vollständg analog zum Probt-Modell. 2.1.4 Verglech und emprsche Bespele für das Probt- und Logt-Modell In RATS snd enfache Prozeduren für bede Verfahren enthalten, de der LINREG- Prozedur entsprechen, ndem se LINREG durch LGT (Logt) oder PRB (Probt) ersetzen: 50

Das folgende Programm schätzt das lneare, das Probt- und das Logt-Modell für das oben genannte Bespel der Mtgledschaft n ener Gewerkschaft: allocate 1000 open data cps.rat data(format=rat,org=var)/age exp2 grade nd1 marred Inwage occ1 $ partt exp unon wegh hgh Lneares Wahrschenlchketsmodell lnreg unon / exp exp2 grade marred hgh constant Probt-Modell prb unon / exp exp2 grade marred hgh constant Logt-Modell lgt unon / #exp exp2 grade marred hgh constant De Ergebnsse lauten für das lneare Wahrschenlchketsmodell: Tabelle 2.2 Schätzergebnsse für das lneare Wahrschenlchketsmodell Varable Coeff Std Error T-Stat Sgnf 1. EXP 0.020038767 0.003896914 5.14221 0.00000033 2. EXP2-0.000370581 0.000081883-4.52572 0.00000675 3. GRADE -0.012463581 0.005100452-2.44362 0.01471364 4. MARRIED 0.013342779 0.030000989 0.44474 0.65660113 5. HIGH 0.143939577 0.025678520 5.60545 0.00000003 6. Constant 0.102136788 0.074933713 1.36303 0.17318220 für das Probt-Modell: Tabelle 2.3 Schätzergebnsse für das Probt-Modell Varable Coeff Std Error T.Stat Sgnf 1. EXP 0.083509133 0.015608799 5.35013 0.00000009 2. EXP2-0.001530796 0.000317877-4.81569 0.00000147 3. GRADE -0.042077965 0.018908978-2.22529 0.02606175 4. MARRIED 0.062251606 0.112583951 0.55293 0.58030792 5. HIGH 0.561295261 0.099662392 5.63197 0.00000002 6. Constant -1.468412409 0.295812594-4.96400 0.00000069 51

und für das Logt-Modell: Tabelle 2.4 Schätzergebnsse für das Logt-Modell Varable Coeff Std Errr T-Stat Sgnf 1. EXP 0.147402074 0.028097014 5.24618 0.00000016 2. EXP2-0.002686919 0.000565428-4.75201 0.00000201 3. GRADE -0.0704320887 0.032142049-2.18782 0.02868301 4. MARRIED 0.115463002 0.196778961 0l.58676 0.55736156 5. HIGH 0.980141109 0.180049032 5.44375 0.00000005 6. Constant -2.581435858 0.518685883-4.97688 0.00000065 Man erkennt erheblche Dfferenzen n den dre Schätzungen, d.h. de Schätzer snd ncht ndfferent gegenüber der Spezfkaton. De Parameter der dre Modelle haben jewels ene andere Interpretaton. Das Probt- und das Logt-Modell lefern m allgemenen ähnlche Ergebnsse. Das Probt-Modell unterstellt ene Normalvertelung mt Varanz σ = 1, das Logt-Modell ene logstsche Vertelung mt ener Varanz σ = 2 2 2 π, so daß de Ergebnsse des Probt-Modells multplzert mt σ = π / 3 annähernd den Ergebnssen des Logt-Modells entsprechen. Größere Unterschede treten nur auf, wenn das Datenmateral ene sehr hohe Schefe aufwest. In desem Fall st das Logt-Modell der adäquatere Ansatz. Im Gegensatz zum lneare Wahrschenlchketsmodell snd de geschätzten Koeffzenten des Probt-Modells und des Logt-Modells ncht als margnale Effekte zu nterpreteren, dese müssen auf Bass der Schätzung erst noch berechnet werden. Es glt allgemen: 3 (2.18) ( ) F( Xβ ) = x ( X β ) E k β k. 52

Also m lnearen Wahrschenlchketsmodell (2.19) E( ) x k = β k m Probt-Modell: (2.20) E( ) = φ( Xβ) β x k k und m Logt-Modell: E( ) (2.21) =Λ( Xβ) ( 1 Λ( X β) ) βk mt ( Xβ ) x k 53 Xβ e Λ =. X β 1 + e De margnalen Effekte hängen also m Probt- und m Logt-Modell von den exogenen Varablen X ab und snd daher für jedes Indvduum unterschedlch. Es gbt prnzpell 2 Wege, de margnalen Effekte zu berechnen. Man evaluert de margnalen Effekte jewels am arthmetschen Mttel der erklärenden Varablen X oder man evaluert für jedes Indvduum den margnalen Effekt und mttelt anschleßend über de margnalen Effekte. De Evaluaton am arthmetschen Mttel der erklärenden Varablen st für 0/1- Varablen ncht snnvoll. Daher berechnet man den margnalen Effekt ener 0/1 Varablen D häufg als F( Xβ D 1) F( Xβ D 0) = =. De Schätzungen der margnalen Effekte stmmen m Probt-Modell und m Logt-Modell häufg wetgehend überen. Man kann de bnären Choce-Modelle auch benutzen, um Prognosen für de Wahrschenlchketen P ( ) = 1 abzuleten. Es glt: (2.22) P ( ˆ = = Φ Xβ ) ( X ˆ β ) ˆ Xβ m lnearen Wahrschenlchketsmodell ( 1) m Probtmodell Λ m Logtmodell De Ursache der wesentlche Unterschede kann z.b. Heteroskedastztät der Störgröße sen. Für das lneare Modell haben wr dese berets gezegt. Dort hat ene Heteroskedaste aber nur Effekte auf de Schätzfehler. In nchtlnearen Modellen we dem Probtund Logt-Modell führt Heteroskedaste auch zu nkonsstenten Schätzern. Des ergbt sch für das Probt-Modell unmttelbar aus

X β (2.23) P ( = 1) =Φ σ g( X). Heteroskedaste st also en wesentlch ernsteres Problem als m lnearen Modell. Daher sollte m Rahmen von Analsen mt dem Probt- bzw. des Logt-Modell möglchst en Heteroskedastetest durchgeführt werden. De Maxmum-Lkelhood-Schätzung st aber mmer dann konsstent und effzent, wenn wr de rchtge Lkelhoodfunkton maxmert haben. In den mesten emprschen Anwendungen unterscheden sch de Parameter des Probt- und Logt-Modells nur gerngfügg. Daraus kann dann auf ene gewsse Robusthet gegenüber den unterschedlchen Annahmen geschlossen werden. Im Gegensatz zum lnearen Regressonsmodell st m Probt- und m Logt-Modell das klasssche Bestmmthetsmaß 2 R ncht als Maß für de Güte der Schätzung anwendbar. 2 Daher verwendet man sogenannte Pseudo-Bestmmthetsmaße oder auch Pseudo- R. Das enfachste Pseudo-Bestmmthestmaß st der Lkelhood-Rato-Index: (2.24) LRI ln L = 1 ln L 0 ln L 0 st dabe de Log-Lkelhood enes Probt- oder Logt-Modells, das nur ene Konstante und sonst kene erklärenden Varablen enthält. Es st we das klasssche Bestmmthetsmaß auf den Werteberech [ ] 2 0,1. Allerdngs snd selten Pseudo- R zu erwarten, de größer snd als 0,2. Sehr häufg snd se sogar klener als 0,1. En Bespel für de Anwendung des Probt-Modells ergbt sch aus ener jüngeren Stude des ZEW zum Technologetransfer von Hochschulen und öffentlchen Forschungsenrchtungen an prvate Unternehmen. Bese und Stahl (1999) haben mt enem Querschntt des Mannhemer Innovatonspanels untersucht, ob Forschungsergebnsse von Hochschulen und öffentlchen Forschungsenrchtungen maßgeblch für de Innovatonstätgket prvater Unternehmen snd. Dazu wurden de Unternehmen gefragt, ob es Produkt- oder Prozeßnnovatonen gbt, de ohne de Ergebnsse der jüngeren Forschung von Hochschulen oder öffentlchen Forschungsenrchtungen ncht zustandegekommen wären. 54

De Probtschätzung führte zu folgenden Ergebnssen (de Werte stellen de margnalen Effekte dar): Tabelle 2.5 Technologetransfer an prvate Unternehmen Transfer von Hochschulen und öffentlchen Forschungsenrchtungen Transfer von Unverstäten Transfer von Fachhochschulen Transfer von öffentlchen Forschungsenrchtungen Beschäftgtenzahl (n logs) 0,0240 0,022 0,0038 0,014 FuE-Intenstät 0,0042 0,0016-0,0000 0,0026 Produktlebenszklus Brete der Produktpalette Wssenschaftlerdchte Wssenschaftlerdchte (Un) Wssenschaftlerdchte (FHs) Wssenschaftlerdchte (Insttute) Investtonsgütersektor (Dumm) Neue Bundesländer (Dumm) -0,0011-0,0006-0,0018-0,0010-0,0110-0,0058-0,0044-0,0032-0,2070-0,387-0,471-0,482 0,197 0,586 0,377 0,017-0,127 0,038 0,038 0,039 0,016-0,0053-0.028 0,0034 0,0012 0,032 N 892 891 889 890 ln L -371,4-213,4-136,9-206,4 Pseudo R 2 0,0377 0,0931 0,1276 0,0605,, bezechnet en Sgnfkanznveau von 1%, 5% bzw. 10%. Enge Ergebnsse seen nur exemplarsch dskutert. De Negung der Unternehmen, sch Spllovers der öffentlchen Forschung anzuegnen, stegt mt der Größe und der FuE-Intenstät der Unternehmen (gemessen als Antel der FuE-Ausgaben am Umsatz). Insbesondere de Fähgketen, sch de Ergebnsse der Forschung öffentlcher Insttute 55

(Großforschungsenrchtungen, Fraunhofer-Insttute) anzuegnen, erfordert ene egene FuE-Tätgket der Unternehmen. Der Transfer von Fachhochschulen unterschedet sch davon jedoch deutlch. De Größe des Unternehmens spelt kene Rolle, klene und mttlere Unternehmen können n glechem Maße profteren. De räumlche Nähe gemessen als Wssenschaftlerdchte n enem Umkres von 100km st sgnfkant. Im übrgen konnte m Rahmen der Stude, de wetere Schätzungen enthält, dem Technologetransfer öffentlcher an prvate Enrchtungen ken besonders gutes Zeugns ausgestellt werden. Des betraf nsbesondere den Transfer von sogenannten Großforschungsenrchtungen. De wesentlchen Transfers fnden nur von Fraunhofer-Insttuten sowe engen Technschen Unverstäten statt. 2.1.5 Bvarate und Smultane Probt-Modelle Häufg stehen jedoch verschedene dskrete Entschedungen von Indvduen oder Unternehmen n enem drekten oder ndrekten Zusammenhang, we bespelswese de Entschedung über Erwerbsbetelgung und das Knderkregen von Frauen oder de Entschedung über Produkt- und Prozeßnnovatonen von Unternehmen. Es st dabe zwschen gensteten und ncht-gensteten Modellen zu unterscheden. In enem gensteten Modell hängt de zwete Entschedung vom Ergebns der ersten Entschedung ab. Es ergbt sch also en zwestufges Entschedungsmuster, we bespelswese auf der ersten Stufe de Entschedung über ene Fahrt mt dem egenen Auto oder enem öffentlchen Verkehrsmttel und auf der zweten Stufe de Entschedung zwschen dem Bus und der Bahn, gegeben ene Entschedung für öffentlche Verkehrsmttel auf der ersten Stufe. Derartge Modelle werden her ncht behandelt. Se können bespelswese n Ronnng (1991) nachgelesen werden. Das bvarate Probt-Modell entsprcht ener Übertragung des bekannten Modells mt schenbar unabhänggen Glechungen auf das Probt-Modell. Es hat folgende Struktur für den beobachtbaren Modelltel: 56

(2.25) 1 wenn > 0 1 1 = 1 0 wenn 0 1 wenn > 0 2 2 = 2 0 wenn 0 und folgende für den latenten Modelltel: (2.26) = X β + u mt Eu ( ) = 0, V( u ) = 1 1 1 1 1 1 1 = X β + u mt Eu ( ) = 0, Vu ( ) = 1, Cov( uu ) = ρ 2 2 2 2 1 1 1 2 De Varanzen können auf 1 normert werden, da we m gewöhnlchen Probt-Modell nur de standardserten Koeffzenten dentfzert snd. ρ beschrebt we m SUR-Modell de Korrelaton zwschen den Störgrößen der beden Glechungen. Das bvarate Probt- Modell kann mt der Maxmum-Lkelhood-Methode geschätzt werden. De ndvduellen Entrttswahrschenlchketen der beden Eregnsse werden folgendermaßen gebldet: (2.27) 1 = 1 2 = 2 =Φ 1 2 PY (, Y ) ( w, w, ρ + ) mt ρ + = qq 1 2ρ, w1 = q1 X1β1, w2 = q2x2 β2 und q 1 = 2 1 1, q2 = 22 1. Im Gegensatz zum bvaraten Probt-Modell hängt bem smultanen Probt-Modell de latente Varable der enen Glechung von der latenten Glechung der jewels anderen Glechung ab. D.h. es glt weterhn das beobachtbare Modell (2.25), aber statt des latenten Modells (2.26) glt jetzt: (2.28) = γ + X β + u mt Eu ( ) = 0, Vu ( ) = 1 1 2 1 1 1 1 1 1 = γ + X β + u mt Eu ( ) = 0, V( u ) = 1, Cov( uu ) = ρ 2 1 2 2 2 2 1 1 1 2 Das smultane Probt-Modell st damt en smultanes Modell n den latenten Varablen, ncht n den beobachtbaren. Mann kann zegen, daß en smultanes Modell n den beobachtbaren Varablen nur dann logsch konsstent st, wenn es ene rekursve Struktur aufwest. Ansonsten snd de sogenannte Kohärenzbedngungen verletzt (Blundell and Smth, 1994). Das smultane Probt-Modell kann bespelswese mt der zwestufgen Methode von Mallar (1977) oder Maddala (1983) geschätzt werden. Be desem Verfahren wrd zuerst de reduzerte Form des Glechungssstems (2.28) abgeletet: 57

(2.29) γβ β u = X + X + + γ u 1 2 1 1 1 2 1 2 1 1 γγ 1 2 1 γγ 1 2 1 γγ 1 2 γ β β γ = X + X + 2 1 2 2 1 2 2 1 2 1 γγ 1 2 1 γγ 1 2 1 γγ 1 2 u + u Tatsächlch werden m ersten Schrtt also de latenten Varablen 1 und 2 mt dem ML-Probt-Schätzer auf das gesamte Set exogener Varablen regressert: (2.30) = X Π+ υ 1 1 1 = X Π + υ 2 2 2 Im zweten Schrtt werden de Schätzungen der Latenten n de strukturelle Glechung (2.28) engesetzt. Be der gegebenen Normerung der Varanzen auf 1 können de Parameter somt konsstent geschätzt werden durch (2.31) = ˆ γ + X β + u 1 2 1 1 1 1 = ˆ γ + X β + u 2 1 2 2 2 2. De Schätzung der korrekten Form der Standardfehler st Maddala (1983) m Abschntt 7.3 zu entnehmen. In ener aktuellen ZEW-Stude (Eblng und Janz, 1999) wurde mt desem Ansatz der Zusammenhang zwschen Exporttätgket und Innovatonsverhalten m Denstlestungssektor smultan untersucht. Ausgangspunkt st dabe de Analse der Bestmmungsfaktoren für de Exportentschedung von Denstlestungsunternehmen. De Innovatonsfreudgket enes Unternehmens wrd generell als wchtge Bestmmungsgröße für de Exportentschedung enes Unternehmens angesehen: Nach Posner (1961) kann (gerade ntra-ndustreller) Handel durch Unterschede n der Technologe, also Innovatonen, begründet werden. Umgekehrt kann jedoch auch argumentert werden, daß Handel den Umsatzantel enes Unternehmens mt senen neuen Produkten erhöht. Das Unternehmen wrd daher de Innovatonsaktvtäten ntensveren. De Wrkungsrchtung, ob Exporterfolg durch Innovatonsaktvtäten begründet wrd oder Exporte velmehr Innovatonsaktvtäten verstärken, st somt a pror ncht endeutg. De Anwendung des vorgestellten smultanen Probtansatzes auf enen Querschntt des Mannhemer Innovatonspanels m Denstlestungssektor führte zu folgenden Ergebnssen: 58

Tabelle 2.6: Exporterfolg und Innovatonsaktvtäten Schätzung enes Smultanen Probtansatzes Exportglechung Innovatonsglechung Varable Koeffzent Standardabw. Koeffzent Standardabw. Exporteur 0,115 0,111 Innovator 0,282 0,147 Quanttatve Varablen: Lohnstückkosten m WZ - Verkehr -1,997 0,876 - EDV 1,291 0,760 - Technsche Beratung -1,242 0,584 - Wohnungswesen -0,904 2,443 - Beratungsunternehmen 0,029 0,167 - Rengungsgewerbe -1,754 1,212 - Sonstge Denstlestungen -1,094 0,366 Lohnnveau 0,279 0,085-0,082 0,079 Antel der Beschäftgten - mt Unverstätsabschluß 1,176 0,237 - mt Berufsabschluß 0,398 0,172 Größe des Unternehmens -0,150 0,111 0,246 0,093 (Größe des Unternehmens)^2-0,027 0,018-0,003 0,015 Investtonen n Informatonstechn. 4,780 1,486 Qualtatve Varablen: Grenznähe 0,506 0,219 Tel enes Konzerns 0,063 0,130 0,115 0,108 Ostvarable -0,643 0,119-0,091 0,130 Wrtschaftszwegvarable: - Verkehr 0,614 0,389 0,339 0,187 - EDV -0,500 0,441 0,503 0,197 - Technsche Denstlestungen 0,924 0,379 0,138 0,166 - Wohnungswesen -1,012 0,507-0,019 0,246 - Beratungsunternehmen -0,398 0,537 0,468 0,232 - Rengungsgewerbe 0,425 0,230 0,316 0,153 Konstante -0,977 0,263 0,186 0,265 Log-Lkelhood -395,259-615,442 Anzahl der Beobachtungen 1010 1010 Im Rahmen des Smultanen Probt-Modells zegt sch, daß Innovatonsaktvtäten sehr wohl sgnfkanten Enfluß auf de Exportaktvtäten von Denstlestungsunternehmen haben, de Exportaktvtäten jedoch hrersets von den Innovatonsaktvtäten ncht wesentlch beenflußt werden. Während zudem deutlch postve Effekte vom Lohnnveau (Per- 59

sonalkosten pro Beschäftgtem), das m Rahmen der Stude als Qualfkatonsnveau nterpretert wrd, auf de Exportwahrschenlchket festzustellen snd, beenflussen de Lohnstückkosten (Personalkosten pro Umsatzenhet) nur n enzelnen Branchen de Exportaktvtäten negatv. Hohe Löhne verschlechtern demnach ncht de Exportchancen von Denstlestungsunternehmen, wenn se das Qualfkatonsnveau der Unternehmen reflekteren. 2.2 Modelle für kategorale abhängge Varablen 2.2.1 Das geordnete Probt-Modell Das bnäre Wahlmodell st en Spezalfall allgemener Wahlmöglchketen. Fragt man z.b. nach der Erwerbstätgket, so leßen sch folgende dre Antworten unterscheden: n ncht erwerbstätg ( ) telwese (z.b. Telzet) erwerbstätg ( t ) v voll erwerbstätg ( ) Das latente Modelltel, das de Negung ene Erwerbstätgket aufzunehmen beschrebt, hat weder folgende Gestalt: (2.32) = X β + u mt u ~ N(0, σ ) 2 Der beobachtbare Modelltel läßt sch jetzt durch zwe 0,1 Varable beschreben, nämlch (2.33) e 1 wenn de Person erwerbstätg st = 0 wenn de Person ncht erwerbstätg st v 1 wenn de Person voll erwerbstätg st = 0 wenn de Person tels erwerbstätg st Alternatv können wr n ener Varablen mt 3 Ausprägungen we folgt koderen: (2.34) 0 ncht erwerbstätg = 1 Telzet beschäftgt 2 Vollzet beschäftgt 60

Bede Koderungen führen zum glechen Ergebns. In der ökonometrsche Lteratur verwendet man n der Regel de Coderung (2.34). De beobachtbare Varable st dann ordnal skalert. Allgemen können wr das latente Modell für J + 1 ordnale Kategoren we folgt schreben: (2.35) 0 für c 1 für c c = J für cj < 1 1< 2 Für de latente Varable sch we folgt aus dem latenten Modell: glt Glechung (2.32). De beobachtbaren Zustände ergeben (2.36) 0 < c bzw. < 1 c c bzw. c = cj Xβ u J cj < bzw. σ σ < σ u c1 Xβ 1 σ σ σ c1 Xβ u Xβ 1< < 2 σ σ < σ< 2 σ De Koeffzenten c j werden als Schwellenparameter (Threshold parameter) bezechnet, für de gelten muß (2.37) c1 < c2 < < cj Man kann zegen, daß be J > 1 Wahlmöglchketen en Schwellenparameter belebg gewählt werden kann, z.b. c 1 = 0. Wr sehen sofort, daß es sch bem geordneten Probt-Modell um ene drekte Verallgemenerung des Probt-Modells handelt, das für J = 1 das Probt-Modell als Spezalfall enthält. Für de Entrttswahrschenlchketen glt m geordneten Probt-Modell: (2.38) P ( = 0) = Φ ( ) Xβ σ c2 Xβ Xβ ( = 1) = Φ( σ σ) Φ ( σ) P cj Xβ P ( = J) = 1 Φ( ) σ σ Zusätzlch zu den Parametern β und σ werden auch de Schwellenparameter c 2, geschätzt, de genauso we de Parameter bs auf enen konstanten Faktor dentfzert snd. Man setzt daher n der Regel σ = 1., cj 61

Genau so we m Probt-Modell der Glechung (2.11) lassen sch auch für das geordnete Probt-Modell der Glechung (2.38) analog zu (2.20) margnale Effekte berechnen. Dese lauten m geordneten Probt-Modell: (2.39) P( = 0) x k P( = 1) x k P( = J) x k = φ( X β) β ( ( X ) ( c2 X )) = φ( c X β) β k = φ β φ β β k J k Kaser (1998) hat mt den Daten des Mannhemer Innovatonspanels untersucht, welchen Enfluß der Ensatz von neuen Technologen auf de erwartete Arbetsnachfrage von Denstlestungsunternehmen hat. Im Rahmen des MIP wurde de Unternehmen gefragt, ob se für verscheden vorgegebene Qualfkatonsstufen (heterogene Arbet) planen de Beschäftgung zu senken oder zu erhöhen. Dazu wurde hnen ene 5er-Lkert- Skala vorgegeben. De Mtte als der Wert 3 kennzechnet dabe ene konstante geplante Beschäftgung. De folgende Tabelle zegt de Auszüge der Schätzergebnsse für 2 Qualfkatonsgruppen (Unverstätsabsolventen und Beschäftgte mt abgeschlossener Berufsausbldung). 62

Tabelle 2.7 Bespel geordnetes Probt-Modell: Heterogene Arbetsnachfrage Hochschulabsolventen Beschäftgte mt abgeschlossener Berufsausbldung Arbetskosten der Qualfkatonsgruppe 0,001-0,004 IT-Investtonen als Antel an den Gesamtnvesttonen 0,004-0,003 Investtonen pro Kopf 0,020 0,006 Beschäftgte mt Hochschulabschluß (n Logs) Beschäftgte mt abg. Berufsausbldung (n Logs) 0,035-0,033-0,001 0,000 potentelle Kredtratonerung (Dumm) 0,022-0,067 Neue Bundesländer (Dumm) -0,159-0,197 Schwellenparameter 1-1,220-0,867 Schwellenparameter 2 0,821 0,938 Anzahl der Beobachtungen 1037 1059 Log-Lkelhood -829,797-992,685,, kennzechnen en Sgnfkanznveau von 0,10; 0,05 und 0,01. Im Rahmen der Schätzung wrd für Branchen und Umsatzerwartungen kontrollert. Es zegen sch deutlche Unterschede zwschen den beden gewählten Qualfkatonsgruppen n den Beschäftgungserwartungen bzw. -planungen der Unternehmen. Während sch für Beschäftge mt abgeschlossener Berufsausbldung en negatver Effekt der Arbetskosten nachwesen läßt, fndet man kenen Effekt be Hochschulabsolventen. De entschedende Varable war jedoch m Rahmen der untersuchten Fragestellung der Effekt des Ensatz neuer Technologe (her: Informatons- und Kommunkatonstechnologen). Im Rahmen der Schätzung des geordnete Probt-Modells der Beschäftgungserwartungen sehen wr, daß Unternehmen, de relatv vel n Informatons- und Kommunkatonstechnologen nvesteren, de Beschäftgung von Hochschulabsolventen auszuweten planen und de Beschäftgung enfacher Mtarbeter zu senken. Des läßt sch sehr vorschtg als Anzechen dafür nterpreteren, daß der vermehrte Ensatz von IT- Technologen auch m Denstlestungssektor enfache Arbetsplätze vernchtet und an- 63

spruchsvolle schafft. Man sprcht n desem Zusammenhang vom sogenannten skll bas of technologcal change (Bound and Johnson, 1992). 2.2.2 Das multnomale Logt-Modell Vele mehrdmensonale Kategoren lassen sch jedoch ncht oder nur sehr schwer geegnet ordnen. Konsumentschedungen für verscheden Marken we z.b. Automoble snd her en klasssches Bespel. Modelle für derartge ungeordnete bnäre Alternatven bezechnet man als multnomale Modelle. Das kurz her beschrebene multnomale Logt-Modell geht auf Thel (1969) und McFadden (1974) zurück. McFadden (1974) bezechnet sen Modell jedoch als kondtonales Logt-Modell. Der wesentlche Untersched st, daß man m multnomalen Logt-Modell de Wahlhandlungen durch de unterschedlchen Egenschaften der Indvduen erklärt, während be Entschedungen m kondtonalen Logt-Modell auch spezfsche Egenschaften der Alternatven berückschtgt werden können. Bede Modelle snd jedoch sehr ähnlch, so daß wr her nur kurz auf das multnomale Logt-Modell engehen. En enfache Darstellung mt enem Verglech der beden Ansätze fndet man be Greene (1993) n Kaptel 19.7 und sehr vel ausführlcher be Maddala (1983) n Kaptel 3. Dort fndet man auch wetere Alternatven we bespelswese das Multnomale Probt-Modell (Hausman and Wse, 1978). Im multnomalen Logt-Modell snd folgende Auswahlwahrschenlchketen n Verallgemenerung zu (2.17) für en Modell mt J + 1 Alternatve defnert: (2.40) P ( = 0) = 1+ J 1 j= 1 X β j e P ( = j) = für j = 1,, J J X βk 1+ e j= 1 e Xβk Man beachte dabe enen wesentlchen Untersched zu den bsher betrachteten Modellen. De Koeffzenten β j vareren mt den Alternatven. Im geordneten Probt-Modell waren de Koeffzenten unabhängg von der betrachteten Alternatve. De Varabltät 64

der Koeffzenten führt m multnomalen Logt-Modell zu erheblchen Interpretatonsproblemen. De Koeffzenten snd somt nur relatv nterpreterbar. In Glechung (2.40) wurden de Parameter β 0 wllkürlch zu Normerungszwecken auf 0 gesetzt. Wr hätten ebenso auch jeden anderen Parametervektor wählen können. De Koeffzenten erklären daher nur de Unterschede n den Präferenzen zur gewählten Normerung: (2.41) P( = j) ln = Xβ P ( = 0) j Insbesondere dese Enschränkung macht de Anwendung des Multnomalen Logt- Modells für de Praxs ncht sehr attraktv. De Schätzung des Multnomalen Logt- Modells st we auch m Logt-Modell de üblche Maxmum-Lkelhood-Schätzung be der de ndvduellen Beträge über de Glechung (2.40) defnert snd. 2.3 Modelle für beschränkte abhängge Varablen 2.3.1 Das Tobt-Modell Tpsch für Mkrodaten m allgemenen und Querschnttsdaten m besonderen snd auch sogenannte beschränkte abhängge Varablen (lmted dependent varables). Wll man bespelswese auf der Mkroebene das Arbetsangebot von Indvduen erklären, so läßt es sch nur für dejengen Personen beobachten, de auch tatsächlch arbeten. Be Arbetslosen st das beobachtbare Arbetsangebot auf den Wert Null beschränkt. En weteres Bespel snd Kaufentschedungen für dauerhafte Konsumgüter, de ncht n jeder Perode erfolgen, de Höhe der Ausgaben st also n velen Peroden auf den Wert Null beschränkt. En Modellansatz, der mt derartgen Beobachtungen für abhängge Varable umgehen kann, wurde von Tobn (1958) entwckelt. Tobn (1958) erwetert das bnäre Probt- Modell nsofern, als um m Bespel der dauerhaften Konsumgüter zu bleben neben der Entschedung, dauerhafte Konsumgüter zu kaufen oder ncht, de Entschedung über de Ausgabenhöhe smultan berückschtgt wrd. Es wrd daher nach hm auch Tobt- Modell genannt. De erklärenden Varablen 65 X beenflussen n desem Ansatz sowohl de Wahrschenlchket des Ausgabeneregnsses als auch de unterschedlche Höhe

der Ausgaben. Enen sehr lesenswerten Überblck über verschedene Spezfkatonen des Tobt-Modells fndet man be Amema (1985) n Kaptel 10. De Nullbeobachtungen m Tobt-Modell führen zu ener Konzentraton von Beobachtungen m Punkt Null, de das Problem mt sch brngt, daß ene gewöhnlche KQ- Schätzung zu verzerrten und nkonsstenten Schätzergebnssen führt. De Verzerrthet und Inkonsstenz rühren daher, daß n ener Regresson über alle Indvduen de KQ- Schätzung enen lnearen Zusammenhang erzwngt, der aufgrund der Beobachtungskonzentraton unangebracht st. Doch selbst wenn de Regresson nur über de Indvduen erfolgt, für de Ausgaben bzw. Arbetsangebote beobachtbar snd, treten verzerrte und nkonsstente Schätzer auf. Denn n dem Fall st de KQ-Schätzung mt enem sample selecton bas (vgl. dazu auch Heckman, 1976 und 1979) behaftet, da de Schätzung annmmt, de Stchprobe bestünde nur aus den verwendeten Beobachtungen, obglech auch de vernachlässgten "Nullbeobachtungen" der Stchprobe angehören. Im folgenden wrd anhand enes enfachen Modells zur Erklärung der Ausgaben für dauerhafte Konsumgüter veranschaulcht, we Nachfrageglechungen n Querschnttsmodellen unter Beachtung der Konzentraton von Beobachtungswerten m Punkt Null geschätzt werden können. En solches Modell, das der Beobachtungskonzentraton gerecht wrd, läßt sch we folgt formuleren. Für de endogene Varable, de n desem Fall als Konsumnegung nterpretert werden kann, nehmen wr we m Probt-Modell (vgl. Glechung (2.11)) en latentes Modell an: Latenter Modelltel (2.42) = X β + u mt u N(0, σ ) 2 Beobachtet werden kann jedoch nur ene postve Kaufentschedung: Beobachtbarer Modelltel (2.43) = Xβ + u wenn > 0 bzw. u σ > Xβ σ = 0 wenn 0 bzw. u σ Xβ σ bezechnet de latente endogene Varable, her de gewünschten Ausgaben für en dauerhaftes Konsumgut, we se sch z.b. aus der Maxmerung ener Nutzenfunkton unter Berückschtgung ener Budgetbeschränkung ergeben. Se st ncht drekt beob- 66

achtbar und hängt von drekt beobachtbaren Varablen X ab. De latente Varable st nur dann auch beobachtbar, wenn se postv st: > 0. Im Bespel: De Ausgabenentschedung wrd nur dann getroffen, wenn de gewünschten Ausgaben postv snd, be negatven optmalen Ausgaben (ene Art Desnvestton) fnden kene Ausgaben statt. Wrd de Glechung = Xβ + u mt Hlfe der KQ-Methode geschätzt, dann wrd mplzt unterstellt, daß m Mttel de sstematsche Komponente X β glt, d.h. E( ) = X β. Tatsächlch gelten aufgrund der Beobachtungskonzentraton unter der Annahme ener normalvertelten Störung u N σ 2 (0, ) jedoch de folgenden Erwartungswerte. Dazu sorteren wr de Stchprobe vom Umfang N n de ersten M Indvduen, für de de latente Varable beobachtbar st, und de N M Indvduen, für de se ncht beobachtet werden kann. Für de Telstchprobe ( = 1,, M) glt (2.44) ( > 0 ) = β + ( > β ) E X E u u X φ = Xβ + σ Φ ( X β σ) ( X β σ) und für de gesamte Stchprobe ( = 1,, N) (2.45) ( ) ( ) ( ) ( ) E( ) = P > 0 E > 0 + P 0 E 0 φ =Φ( Xβ / σ) Xβ + σ Φ ( Xβ σ ) ( X β σ ) 0 Der Ausdruck λ( X β / σ) = φ( X β / σ)/ Φ ( X β / σ) wrd als Inverse von Mlls-Rato bezechnet und hat m Rahmen der Tobt-Modelle ene besondere Bedeutung. Der Erwartungswert (2.44) st der Erwartungswert ener m Punkt = 0 abgeschnttenen oder trunkerten Normalvertelung, der Erwartungswert (2.45) st der Erwartungswert für ene m Punkt = 0 zenserten Normalvertelung. Während be der trunkerten Normalvertelung alle Beobachtungen < 0 ncht beobachtet snd (banal gesprochen: enfach fehlen), snd dese Beobachtungen be der zenserten Vertelung auf den Wert 0 gesetzt, d.h. de gesamte Wahrschenlchketsmasse konzentrert sch m Punkt 0. 67

De KQ-Schätzung st demnach nsofern fehlspezfzert, als mt dem sstematschen Modelltel Xβ bestmmte erklärende Varablen vernachlässgt snd. Wrd de lneare Regresson = Xβ + u z.b. nur über de ersten M Beobachtungen durchgeführt, dann rührt de Fehlspezfkaton daher, daß de Varable λ( X β / σ) = φ( X β / σ)/ Φ( X β / σ) unberückschtgt blebt (Heckman, 1979). Konsstente KQ-Schätzer snd aber möglch, wenn n ener Regresson über alle N Beobachtungen Φ ( X β / σ)[ X β + σφ( X β / σ)/ Φ ( X β / σ)] bzw. n ener Regresson, de ersten M Beobachtungen umfaßt, X β + σφ( X β / σ)/ Φ ( X β / σ) als sstematscher Modelltel verwendet wrd. Dese Egenschaften werden uns später m Rahmen der zwestufgen Heckman-Schätzung zu Nutze machen. 2.3.2 Maxmum-Lkelhood-Schätzung des Tobt-Modells De Lkelhoodfunkton des Tobt-Modells wrd analog zur Lkelhoodfunkton des Probt- Modells (2.12) gebldet. Se stellt sch n Form: (2.46) M N Tobt = ( = ) ( 0) = 1 = M + 1 L P P M N 1 σ φ X β σ Xβ σ = 1 = M+ 1 Φ X = [( )/ ] Φ ( / ) 1 ( β/ σ) dar, wobe das erste Produkt de ersten M Indvduen betrfft, für de de latente Varable beobachtbar st, das zwete Produkt de N - M Indvduen, für de se ncht beobachtet werden kann. Durch ene Umformulerung der Lkelhoodfunkton (2.46) n: (2.47) 1 φ[( Xβ)/ σ] LTobt = σ Φ( Xβ) (1 Φ( Xβ)) Φ( X β / σ) M M N M wrd erschtlch, daß das Tobt-Modell 2 Spezalfälle enthält: Der Faktor (2.48) L Trunk = M 1 φ[( Xβ)/ σ] σ Φ( X β ) beschrebt de Lkelhoodfunkton enes trunkerten Modells, n dem Beobachtungen = 0 gänzlch aus der Analse ausgeschlossen snd. Der zwete Tel von (2.47) 68

(2.49) L = Φ( X β / σ) (1 Φ( X β)) probt M N M st hngegen dentsch mt der Lkelhoodfunkton für das Probt-Modell, we es n (2.12) hergeletet wurde. Amema (1973, 1985) hat gezegt, daß man durch Maxmerung der logarthmerten Lkelhoodfunkton folgende ML-Schätzfunktonen erhält. (2.50) βˆ = ( XX ) X σˆ ( XX ) X λ 1 1 ˆ wobe = ( ), ( ) ˆ ˆ φ λ = Φ ˆ X X,, 1 X M = X ( X,, X N ),, 1 M = mt = und λ ˆ ( λˆ ˆ ) M + 1 M+ 1, λn Der erste Summand n Glechung (2.50) st der KQ-Schätzer der Beobachtungen mt > 0. Der ML-Schätzer des Tobt-Modells setzt sch also aus dem KQ-Schätzer der Fälle mt > 0 und enem Term zusammen, der de Beobachtungen für = 0 umfaßt. Ene Schätzung für 2 σ erhält man aus (2.51) 2 1 σˆ = ( X βˆ ) M Amema hat gezegt, daß der Schätzer konsstent, asmptotsch normal und asmptotsch effzent st; er st gegenüber dem Probt-Schätzer von ener höheren asmptotschen Effzenz, da er mehr Informatonen verarbetet. Olsen (1978) hat zudem de globale Konkavtät der Tobt-Lkelhoodfunkton nachgewesen. De Konsstenzegenschaft st allerdngs ncht gewährlestet, wenn ene der Modellannahmen (Homoskedastztät, dentsche Parameter für alle Indvduen oder de Annahme der Normalvertelung) verletzt st. Deshalb st de Überprüfung deser Annahmen besonders wchtg. Lee and Maddala (1985) haben für das Tobt-Modell entsprechende Tests zusammengestellt. Neuere Testverfahren fndet man auch be Greene (1993) n Kaptel 20 und sehr ausführlch m Sonderheft des Journal of Econometrcs von Blundell (1987). Inzwschen snd Erweterungen des Tobt-Models, de Heteroskedastztät zulassen, auch n der Standardsoftware relatv enfach umzusetzen und sehr zu empfehlen (vgl. Czarntzk und Stadtmann, 1999). 69

In RATS kann de Maxmum-Lkelhood-Schätzung we folgt geschreben werden: NONLIN SIGMASQ LINREG Y # CONSTANT X1 X2 FRML (LASTREG, NAMES = B, ADDPARMS) RHSFRML COMPUTE SIGMASQ = % SEESQ FRML TOBIT = (Z=RHSFRML (T)), % IF (%VALID (Y), $ -.5 LOG (SIGMASQ) -.5 (Y-Z) 2/SIGMASQ, $ LOG (%CDF ((TR-RHSFRML)/SQRT ( SIGMASQ))) MAXIMIZE (METHOD = BFGS) TRUNCATE 2.3.3 Zwestufge Heckman-Schätzung des Tobt-Modells Da es Zeten gab, zu denen de Tobt-Schätzung nach der ML-Methode sehr rechenzetaufwendg waren, schlug Heckman (1976) enen Schätzer vor, der wetgehend auf de KQ-Schätzung zurückgreft. Ausgangspunkt st der Sample-Selecton-Bas für das Tobt-Modell, wenn man den Tel des Samples mt > 0 berückschtgt (vgl. Herletung zu (2.44). (2.52) E X Eu u X ( > 0) = β + ( > β) = X β + σφ( X β / σ)/ Φ( X β / σ) De Fehlspezfkaton, als de Heckman (1979) den Sample-Selecton-Bas nterpretert, besteht also darn, daß das lneare Regressonsmodell = Xβ + u de Varable σφ( X β / σ)/ Φ ( X β / σ) ncht berückschtgt. Ene konsstente KQ-Schätzung st möglch, wenn man anstelle des lnearen Regressonsmodells das Modell (2.53) φ( Xβ / σ) = Xβ + σ + ε Φ( X β / σ) für dejengen Beobachtungen mt > 0 verwendet. Der Störterm ε = > E( 0) der Glechung (2.53) hat de Egenschaften E( ε = 0) und 2 ( ( ) ( ) ) β β β σ σ σ V = Σ = X X X. Glechung (2.53) entsprcht also enem 2 2 ( ε) σ σ 1 λ λ lnearen Regressonsmodell mt heteroskedastschen Störgrößen. Das Problem besteht 70

dann nur darn, n ener ersten Stufe standardserte Parameter β σ zu schätzen um φ( X β / σ)/ Φ ( X β / σ) evalueren zu können. Heckman (1976) hat daher folgendes zwestufge Verfahren vorgeschlagen: 1. Schätze mt ener ML-Probt-Schätzung de β standardserten Koeffzenten σ und bestmme daraus φ( X β / σ)/ Φ ( X β / σ). 2. Schätze de Parameter β und σ aus der Glechung (2.53) mt der KQ-Methode. De Klenstquadratschätzung von Glechung (2.53) führt zu ener konsstenten, aber ncht effzenten Schätzung der Parameter β und σ. Insbesondere snd Standardfehler, de ene Standardsoftware auswest, verzerrt, da se weder de Heteroskedastztät n ε noch de Tatsache, daß φ( X β / σ)/ Φ( X β / σ) auf ener ersten Stufe geschätzt und damt selbst mt Schätzfehlern behaftet st, berückschtgen. Der zwestufge Heckman- Schätzer für γ = ( β, σ) st asmptotsch normalvertelt. Das Verfahren von Heckman (1976,1979) läßt sch vel allgemener anwenden, um de Selektonsverzerrung m Rahmen enes lnearen Modells zu korrgeren. De Sample- Selekton kann bespelswese von ganz anderen als den Varablen des Modells φ( X β)/ Φ ( X β) abhängen. Das Vorgehen blebt glech. 2.3.4 Margnale Effekte m Tobt-Modell Ähnlch we m Probt-Modell messen de Koeffzenten β de margnalen Effekte der erklärenden Varablen X auf de latente endogene Varable, ncht de margnalen Effekte auf de beobachtete Varable (vgl. (2.20)). Im Tobt-Modell lassen sch de Erwartungswerte der latenten Varablen sowe der bedngten und unbedngten beobachteten Varablen unterscheden: (2.54) E ( ) = X β (2.55) E( > 0) = X β + σλ( X β σ ) (2.56) E( ) =Φ ( X β σ) Xβ + σλ( X β σ) De dazugehörgen partellen Abletungen ergeben de margnalen Effekte m Tobt- Modell: 71

(2.57) E x ( ) k = β k E( > 0) X β 2 k xk σ (2.58) = β 1 λ( X β σ) λ( X β σ) (2.59) ( β σ) ( 0) ( ) E( ) E > Φ Xβ σ =Φ X + E( < 0) x x x k k k E( ) X β =Φ x k σ φ( X β σ) βk + ( Xβ + σλ( X β σ) ) σ σ βk = φ( X β σ ) σ ( Xβ σ ) βk 1 λ( X β σ ) λ( X β σ) 2 Daraus wrd erschtlch, daß β k weder den margnalen Enfluß der Varablen x k auf de beobachtbare Varable aller Indvduen, noch den margnalen Effekt auf de beobachtete Varable derjengen Indvduen darstellt, für de se beobachtet werden kann. β k gbt ledglch zum Ausdruck, we sch de latente Varable aufgrund ener margnalen Änderung von x k verändert. Der Auswes der margnalen Effekte auf de tatsächlch beobachtete Varable st jedoch für de Interpretaton der Schätzergebnsse mmer vorzuzehen. 2.3.5 Bespel: Zuschauerzahlen be Fußballbundeslga-Spelen Czarntzk und Stadtmann (1999) vom ZEW n Mannhem und der WHU n Koblenz haben m Rahmen ener Stude de Bestmmungsgründe der Zuschauerzahlen von Fußball- Bundeslgaspelen der Sasons 1996/1997 sowe 1997/1998 untersucht. Se untersuchen 2 unterschedlche Modelle, de berets n Belgen bzw. Schottland für entsprechende Studen verwendet worden snd. De latente zu erklärende Varable st der Zuschauerzuspruch enes Bundeslgaspels (de Daten snd über de Sason gepoolt). Der Zuschauerzuspruch st jedoch m Untersched zu den obgen Ausführungen von oben zensert durch de maxmale Kapaztät der Staden. Das Stadon kann also ausverkauft sen: 72

(2.60) = X β + u wenn c = c c wenn > De Zenserung st also rechtssetg und zudem noch ndvduell varerend. Dese Erweterung führt aber zu kenen weteren Problemen, solange der Zenserungspunkt bekannt st. Zudem erlauben de Autoren Heteroskedastztät der Form σ 2 2 w σ e α =, wobe w Tele der erklärenden Varablen X umfaßt. De Lkelhoodfunkton des Tobt- Modells (2.46) läßt sch enfach anpassen zu: (2.61) L 1 Xβ c Xβ = φ 1 α α α c σe σe + Φ > c σe Tobt w w w Als erklärende Varablen X denen: - Marktgröße der Hemmannschaft (gemessen als Bevölkerung pro Bundeslgaklub n ener Stadt) - Marktgröße der Gastmannschaft (gemessen we oben, dvdert durch de Entfernung vom Austragungsort) - Tabellenplatz der Hemmannschaft - Tabellenplatz der Gastmannschaft - Reputaton der Hemmannschaft (gemessen als Performancendex über de letzten 6 Jahre) - Reputaton der Gastmannschaft (gemessen we oben) - Unscherhetsmaß für de Hemmannschaft (Funkton, de den Abstand der zum Errechen der Mesterschaft notwendgen Punkte zu den bsher errechten Punkten mßt) - Unscherhetsmaß für de Gastmannschaft (gemessen we oben) - Speltag der Sason - Maß für das Fan-Potental (gemessen als Anzahl der Fanclubs der Auswärtsmannschaft, nvers gewchtet mt der Entfernung zum Austragungsort) - Temperatur zur Spelzet Folgende Ergebnsse ergeben sch für das Tobt-Modell und de heteroskedastsche Erweterung: 73

Tabelle 2.8: Zuschauerzahlen be Fußballbundeslgaspele Varable Homoskedastsches Tobt-Modell Heteroskedastsches Tobt-Modell Marktgröße Hem 9,16 7,97 Marktgröße Gast 22,54 17,07 Tabellenplatz Hem -413,17-481,41 Tabellenplatz Gast -165,94-162,89 Reputaton Hem 766,50 765,37 Reputaton Gast 310,05 313,00 Unscherhet Hem 420,60 222,65 Unscherhet Gast 321,99 314,77 Speltag 195,93 187,53 Fan-Potental 1339,03 989,93 Temperatur 299,07 219,15 Konstante 13205,47 16201,00 σ 9934,44 9022,72 Log-Lkelhood -4339,12-4302,01 N 513 513 LR-Test auf Heterosked. 74,22 LM-Test auf Heterosked. 82,10 De ausgewesenen Schätzwerte snd de margnalen Effekte. De wesentlchen Ergebnsse lassen sch anhand des heteroskedastschen Tobt-Modells folgendermaßen nterpreteren: Jede Verbesserung des Tabellenplatzes der Hemmannschaft führt m Durchschntt zu 481 Zuschauern mehr, d.h. en Veren kann als Tabellenführer ungefähr 8.200 Zuschauer mehr erwarten denn als Tabellenletzter. De Reputaton sowohl der Hem- als auch der Gastmannschaft st sehr bedeutend für den Zuschauerzuspruch. En Team, das m Vorjahr Mester war, kann gegenüber ener Mannschaft, de Tabellenzehnter war, ungefähr 12.000 Zuschauer mehr erwarten. Ebenso spelen Fanclubs ene bedeutende Rolle. Der Untersched zwschen dem schlechtesten Potentalmaß und dem besten betrug ungefähr 14.000 Zuschauer. Natürlch st, we zu erwarten, auch das Wetter gemessen als Temperatur von großer Bedeutung. 74

75