3. Multinomiale Modelle

Ähnliche Dokumente
Multinomiale logistische Regression

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

Binäre abhängige Variablen

Kapitel 4: Binäre Regression

8. Februar Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

Fortgeschrittene Statistik Logistische Regression

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System

Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko

Diskriminanzanalyse Beispiel

Stochastische Eingangsprüfung,

Monte Carlo Methoden in Kreditrisiko-Management

Kommentierter SPSS-Ausdruck zur logistischen Regression

Statistische Thermodynamik I Lösungen zur Serie 1

2.Tutorium Generalisierte Regression

Einfache Modelle für Paneldaten. Statistik II

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Untersuchungen zum Thema Tracking Error

5. Schließende Statistik Einführung

Kategoriale abhängige Variablen:

Extremwertverteilungen

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), Michael Roers (Übung),

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Credit Risk+: Eine Einführung

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

1 Statistische Grundlagen

9. Schätzen und Testen bei unbekannter Varianz

Statistik I für Wirtschaftswissenschaftler Klausur am ,

Abschlussklausur (60 Minuten), 15. Juli 2014

Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

Kapitel 15: Differentialgleichungen

Präsenzübungsaufgaben zur Vorlesung Elementare Sachversicherungsmathematik

2. Gesundheitsfinanzierung

Kurs 00091: Finanzierungs- und entscheidungstheoretische Grundlagen der Betriebswirtschaftslehre

Varianzanalyse ANOVA

Rekursionen. Georg Anegg 25. November Methoden und Techniken an Beispielen erklärt

Multivariate Statistik

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe.

4. Das Capital Asset Pricing Model (CAPM) Markowitz-Modell: Werkzeug zur optimalen Portfolio-Selection.

Bisher angenommen: jeder Spieler kennt alle Teile des Spiels. - Diskontfaktor des Verhandlungspartners

Ausarbeitung des Seminarvortrags zum Thema

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

4. Wässrige Lösungen schwacher Säuren und Basen

Black Jack - Kartenzählen

Ein möglicher Unterrichtsgang

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Entscheidungsanalyse unter Unsicherheit Entscheidungskriterien in ökonomischen Netzen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Einführung in die statistische Datenanalyse I

Analyse bivariater Kontingenztafeln

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg,

Delta-Gamma-Verfahren als Standard- Risikomodell für Lebensversicherer

Kurzbeschreibung. Eingaben zur Berechnung. Das Optionspreismodell. Mit dem Eurex-OptionMaster können Sie

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Musterlösung Tutorium 3 zur Vorlesung

Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen

Lösungen zu den Übungsaufgaben aus Kapitel 5

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Statistik - Fehlerrechnung - Auswertung von Messungen

Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:

Kreisprozesse und Wärmekraftmaschinen: Wie ein Gas Arbeit verrichtet

Investition & Finanzierung. 2. Investitionsrechnung unter Sicherheit

Grundprinzipien der Bayes-Statistik

8.2 Thermodynamische Gleichgewichte, insbesondere Gleichgewichte in Mehrkomponentensystemen Mechanisches und thermisches Gleichgewicht

Nachholklausur STATISTIK II

Bestimmung einer ersten

ETWR TEIL B ÜBUNGSBLATT 4 WS14/15

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

Zählstatistik. Peter Appel. 31. Januar 2005

Computer Vision I. Nikos Canterakis. Lehrstuhl für Mustererkennung, Universität Freiburg

Optimierung I. 1 Einführung. Luise Blank. Wintersemester 2012/13. Universität Regensburg

Business Value Launch 2006

Schätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N

Herzlich Willkommen zur Vorlesung Statistik

Preferred citation style for this presentation

Elemente der Analysis II

V8 - Auf- und Entladung von Kondensatoren

Rekursionen (Teschl/Teschl )

Aufgabenblatt 4: Der Trade-off zwischen Bankenwettbewerb und Bankenstabilität

Statische Versuchsplanung (DoE - Design of Experiments)

Lineare Gleichungssysteme

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

DIPLOM. Abschlussklausur der Vorlesung Bank I, II:

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

3 Quellencodierung. 3.1 Einleitung

R ist freie Software und kann von der Website.

Transkript:

3. Multinomiale Modelle 3.1. Schätzproblem 3.2. Standardmodell 3.3. Schätzverfahren 3.4. Interpretation der Parameter 3.5. Unabhängigkeit irrelevanter Alternativen (IIA 3.6. Modellerweiterungen 3.1. Schätzproblem Multinomiale Modelle stellen eine Erweiterung des binomialen Modells dar. Im Unterschied zu letzterem beziehen sich multinomiale Modelle auf mehr als zwei sich gegenseitig ausschliessende Alternativen, die zudem keine natürliche Rangordnung aufweisen. Bei den Alternativen kann es sich etwa um Transportmittel (z.b. Auto, Bus oder Bahn, Berufe, Erwerbszustände (beschäftigt, arbeitslos, erwerbsinaktiv, Studienrichtungen, Marken, politische Parteien, Portfolioantee und des weiteren mehr handeln. Die zu erklärende Variable setzt sich aus entweder einem Vektor von Kodierungen (1, 2, 3,... oder aus mehreren Dummy-Variablen zusammen, die für jede Beobachtung angeben, welche Alternative gewählt wurde. Im ersten Fall ist die Kodierung arbiträr und hat keine natürliche Ordnung, während im zweiten Fall die abhängige Variable eine Matrix ist, die gleich viele Spalten wie Alternativen aufweist. Infolge dessen ist OLS als Schätzverfahren entweder unangemessen (1. Fall oder nicht implementierbar (2. Fall. 1

3.2. Standardmodell Die Standardspezifikation des multinomialen Modells stellt eine Verallgemeinerung des Modells des stochastischen Nutzens (Kapitel 2.5.2 dar, das sich nun auf Alternativen bezieht, das heisst, Daraus folgt U = v + u für j = 1,, y = 1 and y = 0, if U > U m j (Nutzenmaximierung im im Py [ = 1] = PU [ > U ] m j im = P[v + u > v + u ] m j im im = P[u u < v v ] m j im im = Fv ( v,..., v v,..., v v i1 im i wobei v v = α0 + γ ' z + γ ' s + β ' x j j j i = α0 + γ ' z + γ ' s + β ' x im m im m im m i v v = ( α α + γ '( z z + γ ' s γ ' s + ( β β ' x. im 0j 0m im j m im j m i Die letzte Gleichung zeigt, dass die relative Attraktivität (v v im zweier Alternativen j und m aus der Sicht des Entscheidungsträgers i abhängig ist von: - allgemein geteten, alternativspezifischen Präferenzen (α 0j α 0m, - Merkmalsunterschieden (z - z im, s - s im der Wahlalternativen aus der Sicht des Entscheidungsträgers i, - allgemein geteten Präferenzen (γ bezüglich der Alternativenmerkmalen (z, s, die womöglich nach Alternativen streuen (γ j, γ m, und - alternativspezifischen Präferenzen (β j, β m, die nach den Merkmalsprofen (x der Merkmalsträger variieren. Man merke, dass die Werte alternativenbezogener Variablen über die Alternativen hinweg streuen, während die Werte personenbeschreibender Variablen dies nicht tun. Ferner gt wie auch beim binomialen Modell, dass nur die Differenzen (α 0j - α 0m und (β j - β m und nicht die Einzelparameter identifiziert werden können, da eine unendliche Anzahl von Werten die gleiche Differenz bden kann. Bei multinomialen Modellen ist es deshalb nötig eine Bezugsalternative zu bestimmen, auf die sich solche Parameter stets beziehen. Die Wahl der Bezugsalternative ist in der Regel unerheblich. 2

Multinomiales Probit(MNP-Modell Das MNP-Modell unterstellt, dass die stochastischen Nutzenkomponenten u j -dimensional normalvertet sind mit Erwartungswert 0 und einer flexiblen Kovarianzmatrix Σ. Demzufolge sind die -1 Unterschiede der stochastischen Nutzenkomponenten (-1-dimensional normalvertet. u ~ N (0, Σ und F( = N ( v v,..., v v,..., v v 1 i1 im i Multinomiales Logit(MNL-Modell Das MNL-Modell unterstellt hingegen, dass die stochastischen Nutzenkomponenten u j (standard -dimensional unabhängige und gleich (i.i.d. Gumbel (G- bzw. extremwertvertet sind mit Erwartungswert 0 und einer Kovarianzmatrix σ 2 I. In diesem Fall sind die -1 Unterschiede der stochastischen Nutzenkomponenten (-1-dimensional logistisch vertet. u G 1 1 σ I F = =. exp ( v v exp v v 2 ~ (0,, ( ir ir r= 1 r= 1 Dies impliziert, dass 1 1 exp( v = = =. exp v v 1 exp v v exp( v ( + ( ir ir ir r= 1 r= 1 r= 1 r j Daran wird klar, dass die Wahrscheinlichkeit, dass Entscheidungsträger i Alternative j wählt, von dem relativen Nutzen abhängt, den Alternative j dem Entscheidungsträger stiftet: e grösser der relative Nutzenbeitrag einer Alternative, desto wahrscheinlicher wird sie vom betreffenden Entscheidungsträger gewählt. Ferner zeigt die Formel für die Wahlwahrscheinlichkeit, dass 0 < < 1 und j = 1 = 1 ist. Ferner wird erkenntlich, dass alle Alternativen mit der gleichen Wahrscheinlichkeit 1/ gewählt werden, wenn alle Alternativen in den Augen des Betrachters gleich attraktiv (v = v ir für alle r j erscheinen. 3

3.3. Schätzverfahren Die Parameter des multinomialen Modells lassen sich mit dem ML-Verfahren schätzen. Bei stochastisch unabhängigen Beobachtungen (Zufallsstichprobe schreibt sich die Log-Likelihood-Funktion wie folgt: ln L( β; y, x y ln. N = i= 1 j= 1 Im Fall des MNP-Modells erfordert die Maximierung der Likelihood-Funktion die Auswertung eines -1-dimensionalen Integrals einer multivariaten Normaldichte, was eine rechnerisch sehr anspruchsvolle Aufgabe ist. Lange Zeit erwies sich eine solche Aufgabe bei > 3 als praktisch unlösbar. Doch in jüngerer Zeit sind Rechenverfahren entwickelt worden, die solche Aufgaben lösbar machen. Das MNL-Modell wird wesentlich häufiger gebraucht, da sich die Wahlwahrscheinlichkeiten in diesem Modellrahmen direkt berechnen lassen, was die Maximierung der Likelihood-Funktion stark vereinfacht. Zudem kann gezeigt werden, dass die Hesse-Matrix der Likelihood-Funktion negativ definit ist. Folglich ist die Likelihood-Funktion überall konkav, so dass ein eindeutiges Maximum existiert. Ferner sind die ML-Schätzungen konsistent, asymptotisch effizient und normalvertet, sofern das Modell korrekt spezifiziert ist. 3.4. Interpretation der Parameter e nachdem, ob eine erklärende Variable die Alternativen oder die Entscheidungsträger beschreibt, sind die Parameter des MNL-Modells unterschiedlich zu interpretieren. 3.4.1. Bedeutung der Vorzeichen Die Vorzeichen der Koeffizienten der alternativenbeschreibenden Variablen (z, s geben an, ob die alternativenbezogenen Attribute nutzenstiftend (+ oder nutzensenkend (- sind. Die Vorzeichen der Koeffizienten der personenbeschreibenden Variablen (x hingegen zeigen, ob ein personenbeschreibendes Attribut den Nutzen einer Alternative erhöhen (+ oder senken (-. Die zugehörigen Parameter lassen sich als Präferenzverschiebungen betrachten. 4

3.4.2. Einfluss der erklärenden Variablen auf die Wahlwahrscheinlichkeiten Absoluter Einfluss personenbezogene Attribute Der Einfluss einer marginalen Änderung des l-ten Attributs der Person i auf die Wahrscheinlichkeit, Alternative j zu wählen, beträgt v = = βjl ir βrl x v x r = 1. Demnach hängt die Stärke des Effekts vom Ausgangswert aller Wahlwahrscheinlichkeiten sowie von der Stärke des Einflusses des Attributs auf sämtliche Alternativen ab. Infolge dessen lässt das Vorzeichen von β jl nicht erkennen, in welche Richtung sich eine Erhöhung des individuellen Attributs x l auf die Wahlwahrscheinlichkeit auswirkt. Die Vorzeichen personenbezogener Attribute sind lediglich in Bezug auf den Nutzeneffekt eindeutig deutbar. alternativenbezogene Attribute Die Auswirkung einer marginalen Änderung des l-ten Attributs der Alternative j auf die Wahlwahrscheinlichkeit beträgt je nachdem v = = (1 γl z v z l l v oder = = (1 γ jl s v s l l Demnach hängt die Stärke des Effekts alleine vom Ausgangswert der gleichen Wahlwahrscheinlichkeit sowie vom Koeffizienten γ l des betreffenden Attributs ab. Das Vorzeichen von γ l zeigt die Richtung des Effekts an. Die Auswirkung einer marginalen Änderung des l-ten Attributs der Alternative m auf beträgt hingegen v = = imγl z v z iml iml bzw. v = = γ s v s iml iml im ml Demnach hängt die Stärke des Effekts von der Höhe der zwei betroffenen Wahlwahrscheinlichkeiten und vom Koeffizienten (γ l bzw. γ lm des l-ten Attributs in Bezug auf die m-te Alternative ab. Das Vorzeichen von γ l bestimmt die Einflussrichtung. Relativer Einfluss (Elastizitäten Die drei obigen Grenzwirkungen lassen sich in Elastizitäten überführen. 5

personenbezogene Attribute x = = x εx β jl ir rl β x r = 1 Der Ausdruck für die Elastizität zeigt, dass die relative Änderung der Wahrscheinlichkeit, eine gegebene Alternative j zu wählen, infolge einer relativen Veränderung der personenbeschreibenden Variablen x l je nach dem Wert von β jl nach Alternativen streut. Das bedeutet, dass eine relative Veränderung personenbezogener Attribute die Verhältnisse ( odds der Wahlwahrscheinlichkeiten untereinander verändert. alternativenbezogene Attribute Eigenelastizität zl ε = = (1 γ z l z z l l l sl bzw. ε = = (1 γ s l s s jl l l Kreuzelastizität ε z = = γ z iml ziml im l iml ziml bzw. ε s = = γ s iml siml im ml iml siml Demnach ist die Kreuzelastizität für alle Alternativen j m identisch. M.a.W.: Eine relative Veränderung des l-ten Attributs der Alternative m hat den gleichen relativen Effekt auf die Wahlwahrscheinlichkeiten sämtlicher anderer Alternativen. Infolge dessen bleiben die Verhältnisse der Wahlwahrscheinlichkeiten untereinander unverändert. Dies impliziert zugleich, dass die Alternative gleichermassen Substitute sind. Es besteht also kein Substitutionsgefälle zwischen den Alternativen. 3.4.3. Auswirkung auf die relativen Wahlwahrscheinlichkeiten (Odds Die Parameter können auch dazu verwendet werden, um die Auswirkung einer diskreten Veränderung der erklärenden Variablen auf die relativen Wahlwahrscheinlichkeiten ( odds einer Person i in Bezug auf zwei Alternativen j und m im exp(v = for j m exp(v im zu berechnen. 6

personenbezogene Attribute Die faktorproportionale Veränderung der relativen Wahlwahrscheinlichkeiten infolge einer diskreten Veränderung Δ einer personenbeschreibenden Variablen x l berechnet sich wie folgt exp(v + β jlδx exp(v = exp ( βjl βml Δx exp(v + β Δx exp(v. im ml im Wenn m die Bezugsalternative bdet (β ml = 0, vereinfacht sich der obige Ausdruck auf exp(β jl Δx ; und wenn Δx = 1 ist, reduziert sich der Ausdruck auf exp(β jl - β ml. Wenn beides gt, beträgt die faktorproportionale Veränderung exp(β jl. In diesem Fall misst exp(β jl die proportionale Auswirkung einer Veränderung des Attributs x l des Entscheidungsträgers i um eine Einheit auf die relative Wahrscheinlichkeit, die Alternative j der gegebenen Bezugsalternative m vorzuziehen. alternativenbezogene Attribute Die faktorproportionale Auswirkung einer diskreten Veränderung Δ der alternativenbezogenen Variablen z l auf die relativen Wahlwahrscheinlichkeit zwischen zwei Alternativen j und m berechnet sich wie folgt: exp(v + γ lδz l exp(v = exp γl ( Δzl Δz iml exp(v + γδz exp(v. im l iml im Demnach verändert sich die relative Wahlwahrscheinlichkeit der zwei Alternativen nicht, wenn sich die alternativenbezogene Variable bei beiden Alternativen um den gleichen Betrag (Δz l = Δz iml verändert. Wenn der Nutzeneinfluss der alternativbezogenen Variablen alternativenspezifisch ist (d.h., γ jl γ ml, wandelt sich der obige Ausdruck zu exp(v + γ jlδs l exp(v = exp γ jlδsl γmlδs iml exp(v + γ Δs exp(v. im ml iml im Die Ausdrücke zeigen hinsichtlich der alternativenbezogenen Variablen: - exp(γ jl misst die faktorproportionale Auswirkung einer Veränderung des Wertes des l-ten Attributs der Alternative j um eine Einheit (Δs l = 1 auf die relativen Wahlwahrscheinlichkeiten zwischen Alternative j und einer beliebig anderen Alternative. Wenn γ jl = γ ml = γ l ist, gt das für zwei beliebige Alternativen. - Wenn sich die Attribute aller Alternativen um den gleichen Betrag verändern (Δz l = Δz iml = Δz, bleiben alle relativen Wahlwahrscheinlichkeiten unverändert, es sei denn, der Nutzeneffekt der Variablen streuen nach Alternativen (γ jl γ ml. 7

- Wenn sich die Attribute nur einer Alternative j verändern (Δz iml, Δs iml = 0 für alle m j, bleiben die relativen Wahlwahrscheinlichkeiten zwischen allen anderen Alternativen unverändert. Zieht man 1 von den obigen proportionalen Auswirkungen ab, erhält man die relativen Auswirkungen auf die relativen Wahlwahrscheinlichkeiten. 3.4.4. Aggregierter Einfluss Die bisher untersuchten Einflüsse beziehen sich auf die Einzelperson, was an dem Index i zu erkennen ist. Um aggregierte Effekte zu ermitteln, die für das gesamte Sample repräsentativ sind, gibt es wie beim binomialen Modell zwei Verfahren: Man kann entweder (i die obigen Effekte in Bezug auf die Mittelwerte aller erklärenden Variablen z, s und x berechnen oder (ii die Effekte für jede Beobachtung einzeln berechnen und dann die Einzeleffekte über alle Beobachtungen hinweg mitteln. 3.5. Unabhängigkeit irrelevanter Alternativen (IIA 3.5.1. Definition Die Verwendung alternativbeschreibender Variablen (z, s im Rahmen des MNL-Modells impliziert, dass die relative Wahrscheinlichkeit, dass eine beliebige Alternative j einer beliebig anderen Alternative m vorgezogen wird, von der Präsenz oder Attraktivität anderer Alternativen ausser j und m unabhängig ist. Diese Eigenschaft wird independence of irrelevant alternatives (IIA genannt. Sie ergibt sich aus der unterstellten Unabhängigkeit der stochastischen Nutzenkomponenten und impliziert, dass alle Alternativen aus der Sicht der Entscheidungsträger gleich gute Substitute sind. Aus diesem Grund sollte die Anwendung des MNL-Modells auf Situationen begrenzt bleiben, in welchen überzeugend argumentiert werden kann, dass die Alternativen nach Berücksichtigung der alternativbeschreibenden Variablen (z, s etwa gleich unterschiedlich sind. Die Folgen von IIA sind: - einheitliche Kreuzelastizitäten über Alternativen hinweg und - konstant bleibende relative Wahlwahrscheinlichkeiten nach der Veränderung der Attribute einer gegebenen Wahlalternative. IIA bezieht sich nicht auf MNL-Modelle, die nur personenbeschreibende erklärende Variablen enthalten, da eine Veränderung solcher Variablen das Verhältnis der Wahlwahrscheinlichkeiten untereinander wohl verändert und von der Anzahl der vorhandenen Alternativen abhängt. 8

Auswirkung von IIA P(Auto P(Bus r P(Bus b 2 Alternatives 1/3 2/3-3 Alternatives (intuitiv 1/3 1/3 1/3 3 Alternatives (IIA 1/5 2/5 2/5 2 Alternatives (IIA Category 1 1/3 2/3 - Category 2 2/3 1/3 - Total 1/2 1/2-3 Alternatives (IIA Category 1 1/5 2/5 2/5 Category 2 2/4 1/4 1/4 Total 14/40 13/40 13/40 9

3.5.2. Test für IIA Die IIA-Eigenschaft betrifft die Spezifikation des MNL-Modells. Wenn die Eigenschaft in Wirklichkeit nicht zutrifft, ist das MNL-Modell fehlspezifiziert und die Parameterschätzungen inkonsistent. Die Erfahrung zeigt allerdings, dass die Ergebnisse des MNL-Modells gegenüber Verletzungen der IIA- Eigenschaft relativ robust sind. Hausman und McFadden bieten einen Test der IIA-Eigenschaft an, der auf einem Hausman-Test aufbaut. Ein Hausman-Test besteht aus dem Vergleich zweier Parameterschätzungen, bei denen die eine sowohl bei der Nullhypothese (H 0 als auch bei der Gegenhypothese (H 1 und die andere nur bei der H 0 konsistent ist. Der IIA-Test beruht auf der Intuition, dass der Einschluss (unrestringiertes Modell einer oder mehrerer Alternativen zu inkonsistenten Parameterschätzungen und ihr Ausschluss (restringiertes Modell zu konsistenten Parameterschätzungen führen müsste, wenn diese Alternativen von den anderen Alternativen nicht stochastisch unabhängig sind. Der Test prüft, ob die Parameterschätzungen unter Einschluss und Ausschluss der Alternativen statistisch signifikant verschieden sind. Die Teststatistik H ist wie folgt definiert: ( ( 1 r u r u r u H = ˆ ˆ ' Var ˆ Var ˆ ˆ ˆ β β β β β β Es gt: H 0 : β r = β u (IIA annehmen H 1 : β r β u (IIA verwerfen H ist asymptotisch χ 2 -vertet mit so vielen Freiheitsgraden, wie beide Spezifikationen gemeinsame Parameter haben. Das restringierte Modell könnte weniger Parameter enthalten, da die maximale Zahl der alternativenspezifischen Konstanten (α 0j α 0m, der nicht generischen alternativenspezifischen Parameter (γ j, γ m und der personenbeschreibenden Parameter (β j - β m von der Anzahl der Wahlalternativen abhängt. Die Teststatistik bezieht sich nur auf die gemeinsamen Parameter der restringierten und unrestringierten Modelle. Die Kovarianzmatrix des restringierten Modells sollte grösser, da es weniger Information aus dem Sample berücksichtigt. 10

3.6. Modellerweiterungen Der Einschluss personenbeschreibender Variablen (x lockert die Restriktionen der IIA-Eigenschaft, da diese nur für Personen mit einheitlichen Merkmalsprofen gt. Einschneidendere Abhfen erfordern eine neue Modellspezifikation wie die folgenden. Multinomiales Probit(MNP-Modell Das MNP-Modell entsteht, wenn angenommen wird, dass die stochastische Nutzenkomponenten (u, j = 1,..., multivariat normalvertet sind mit Erwartungswert 0 und flexibler Kovarianzmatrix Σ. Im Unterschied zum MNL-Modell liefert das MNP-Modell keine direkt berechenbaren Ausdrücke ( closed form für die Wahlwahrscheinlichkeiten, sondern ein (-1-dimensionales Integral, dessen Maximierung eine rechnerisch sehr anspruchsvolle Aufgabe stellt, deren Lösung die Anwendung dafür geschaffener computerintensiver Methoden erfordert. Mixed-Logit(MXL-Modelle MXL-Modelle führen eine weitere stochastische Komponente (ε in die dem MNL-Modell zugrunde liegende Nutzenfunktion ein U = v + ε + u for j = 1,,, die allfällige unbeobachtete Heterogenität auffangen soll, die zu Korrelationen zwischen den alternativenspezifischen Nutzen führen. Es wird angenommen, dass die Werte des Vektors ε i für den Entscheidungsträger i einer allgemeinen Dichtefunktion f(ε i ; α mit konstanten Parametern α entstammen. Die Einführung von ε führt zum folgenden Ausdruck für die Wahrscheinlichkeit, dass Entscheidungsträger i Alternative j wählt = exp( v + ε. exp( v + ε r= 1 ir ir Um individuelle Wahlwahrscheinlichkeiten zu erhalten, die nur von den interessierenden Parameter der deterministischen Komponenten v der Nutzenfunktion abhängen, müssen die ε i s aus den Wahlwahrscheinlichkeiten herausgemittelt bzw. -integriert werden. Da Integration zu keinem direkt berechenbaren Ausdruck ( closed form führt, werden Zufallsstichproben aus der angenommenen Dichte von ε i statt dessen gezogen und anhand der obigen Formel Durchschnitte für die Wahlwahrscheinlichkeiten berechnet. α wird solange variiert, bis die Log-Likelihood-Funktion maximiert ist. Das Verfahren nennt sich simulierte Maximum-Likelihood und liefert konsistente und asymptotisch normale Schätzungen. 11

Nested-Logit-Modelle Genistete Logit-Modelle, auch hierarchische Modelle genannt, unterteen die Wahlalternativen in vermutet homogenere Untergruppen. Innerhalb der Untergruppen wird der unbeobachtbare Grad der Ähnlichkeit zwischen den Wahlalternativen als jewes homogen angesehen bzw. die IIA-Eigenschaft als erfüllt betrachtet Das genistete Modell liefert eine Hierarchie von Wahlalternativen. Die bedingte Wahrscheinlichkeit, dass der Entscheidungsträger i die j-te Alternative innerhalb der Untergruppe l wählt, gegeben Untergruppe l wurde bereits gewählt, lautet i, j l = exp( v l r = 1 i, j l exp( v i, j l Die unbedingte Wahrscheinlichkeit, dass der gleiche Entscheidungsträger die l-te Untergruppe wählt, ist = L exp( θ I s= 1 l exp( θ I s is, wobei I l v ir = ln exp r = 1 θ, l der sogenannte eingeschlossene Wert ( inclusive value, den Nutzen darstellt, den der Entscheidungsträger i durch die Wahl eine der l Alternativen aus der l-ten Untergruppe erwarten kann, und θ l den Grad der Heterogenität zwischen den Alternativen der l-ten Untergruppe misst. Die unbedingte Wahrscheinlichkeit, dass der Entscheidungsträger i die j-te Alternative in der l-ten Untergruppe wählt, beträgt nach den Grundlagen der Wahrscheinlichkeitsrechnung =. l i, j l Die Grade der Homogenität innerhalb der L Untergruppe zusammen mit den Parameter der repräsentativen Nutzenkomponente v lassen sich mit dem ML- Verfahren schätzen. Wenn alle L Heterogenitätsmasse 1 betragen, wandelt sich das genistete Modell in das MNL-Modell, was auf die Gültigkeit der IIA- Eigenschaft in Bezug auf alle Elementaralternativen hinweist. 12

Empirisches Beispiel 13

14

Weiterführende Literatur CAMERON, A., P. TRIVEDI (2005, Microeconometrics Methods and Applications, Cambridge University Press, Cambridge (UK, Kapitel 15. GREENE, W. (2003, Econometric Analysis, 5 th edition, Prentice Hall, New ersey, Kapitel 21. WINKELMANN, R., S. BOES (2006, Analysis of Microdata, Springer, Berlin,, Kapitel 5. 15