Teil E: Qualitative abhängige Variable in Regressionsmodellen

Ähnliche Dokumente
Übung zur Vorlesung - Theorien Psychometrischer Tests II

6. Modelle mit binären abhängigen Variablen

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

Übung zur Vorlesung - Theorien Psychometrischer Tests II

2 Zufallsvariable und Verteilungen

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Prof. Dr. Roland Füss Statistik II SS 2008

Grundgedanke der Regressionsanalyse

Streuungs-, Schiefe und Wölbungsmaße

Empirische Wirtschaftsforschung

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayessches Lernen

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Ordered Response Models (ORM)

Mathematische und statistische Methoden II

Stochastische Prozesse

(Essentiell) τ-äquivalente Tests:

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Standardnormalverteilung / z-transformation

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Multivariate Analysemethoden

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Konkave und Konvexe Funktionen

Netzwerkstrukturen. Entfernung in Kilometer:

Verteilungen eindimensionaler diskreter Zufallsvariablen

12 UMPU Tests ( UMP unbiased )

Zulassungsprüfung Stochastik,

2 Modelle für diskrete und beschränkte abhängige Variablen

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

Free Riding in Joint Audits A Game-Theoretic Analysis

Kapitel 2: Klassifikation. Maschinelles Lernen und Neural Computation

Kapitel 1: Einführung in die Mikroökonometrie. 1.1 Allgemeine Bemerkungen zur Veranstaltung Ziele der Veranstaltung Mikroökonometrie

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Lineare Regression (1) - Einführung I -

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Auswertung univariater Datenmengen - deskriptiv

Der Parameter Migrationsmatrix Teil I

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

8 Logistische Regressionsanalyse

MASCHINELLES LERNEN TOBIAS SCHEFFER, NIELS LANDWEHR, MATTHIAS BUSSAS. Mathematische Grundlagen

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Fallstudie 4 Qualitätsregelkarten (SPC) und Versuchsplanung

Statistische Methoden für Bauingenieure WS 13/14

Statistik und Wahrscheinlichkeit

Analyse von Querschnittsdaten. Bivariate Regression

ME II, Prof. Dr. T. Wollmershäuser. Kapitel 2 Das IS-LM-Modell

1 BWL 4 Tutorium V vom

Übungen zur Vorlesung Physikalische Chemie 1 (B. Sc.) Lösungsvorschlag zu Blatt 2

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr

1 Definition und Grundbegriffe

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

WS 2016/17 Prof. Dr. Horst Peters , Seite 1 von 9

1 Mehrdimensionale Analysis

Der Erweiterungsfaktor k

6. Wirkungsanalyse Grundlagen Ansätze für Daten ohne Selektionsbias Soziale Experimente CLRM

Beschreibende Statistik Mittelwert

Erwartungswert, Varianz, Standardabweichung

Item-response Theorie (Probablistiche Testtheorie) Grundidee der item-response Theorie ist, dass die Antworten auf die Testitems lediglich

-70- Anhang: -Lineare Regression-

NSt. Der Wert für: x= +1 liegt, erkennbar an dem zugehörigen Funktionswert, der gesuchten Nullstelle näher.

Werkstoffmechanik SS11 Baither/Schmitz. 5. Vorlesung

2. Wahrscheinlichkeitsrechnung

Facility Location Games

Kreditrisikomodellierung und Risikogewichte im Neuen Baseler Accord

Asymptotische Stochastik (SS 2010) Übungsblatt 1 P X. 0, n.

Datenaufbereitung und Darstellung

Nomenklatur - Übersicht

P(mindestens zwei gleiche Augenzahlen) = = 0.4 = = 120. den 5 vorbereiteten Gebieten drei auszuwählen: = 10. Deshalb ist 120 =

Modul 1: Einführung und Wahrscheinlichkeitsrechnung

EINFÜHRUNG IN DIE POISSON REGRESSION

Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler, Eidgenössische Technische Hochschule, ETH Zürich. 1. Teilprüfung FS 2008.

Stochastische Prozesse

Datenaufbereitung und -darstellung III

Kurs 9.3: Forschungsmethoden II

5. ZWEI ODER MEHRERE METRISCHE MERKMALE

Fachbereich Mathematik Prof. K. Grosse-Brauckmann D. Frisch WS 2007/08 10./ Gruppenübung

Automotive Auswertung der Betriebserfahrung zum Zuverlässigkeitsnachweis sicherheitskritischer Softwaresysteme. S. Söhnlein, F.

Gruppe. Lineare Block-Codes

Kaplan- Meier- Schätzer

Versicherungstechnischer Umgang mit Risiko

Streuungs-, Schiefe und Wölbungsmaße 1

INTELLIGENTE DATENANALYSE IN MATLAB. Mathematische Grundlagen

Klausuren zum Üben. Gesamtdauer der Anrufe in [Min]: bis 20 bis 40 bis 60 bis 90 bis 120 Anzahl der Schüler/innen:

Das zum dualen Problem (10.2) gehörige Barriere-Problem lautet analog

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

18. Vorlesung Sommersemester

Hydrosystemanalyse: Finite-Elemente-Methode (FEM)

ANOVA (Analysis of Variance) Varianzanalyse. Statistik Methoden. Ausgangssituation ANOVA. Ao.Prof.DI.Dr Josef Haas

Einführung in die Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung. Übersicht. Wahrscheinlichkeitsrechnung. bedinge Wahrscheinlichkeit

5. Gruppenübung zur Vorlesung. Höhere Mathematik 1. Wintersemester 2012/2013

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Transkript:

Tel E: Qualtatve abhängge Varable n Regressonsmodellen 1. Qualtatve abhängge Varable Grundlegendes Problem: In velen Fällen st de abhängge Varable nur über enen bestmmten Werteberech beobachtbar. Bsp. Wahlentschedungen: Wahl des Verkehrsmttels (Bus, Bahn, PKW) Partzpaton am Arbetsmarkt (Vollzet, Telzet, kene Partzpaton) Konsumentenentschedung über den Kauf von Produkt A, B, oder C. Zu erklärende Varable hat n desen Problemstellungen ken metrsches Meßnveau, sondern nur dskrete Ausprägungen klasssche ökonometrsche Methoden snd ncht per se anwendbar.

Her Behandlung des bnären Falls: Abhängge Varable kann nur zwe Werte annehmen Ja/Nen Entschedungen Umkoderen der qualtatven abhänggen Varablen auf de Werte 0 oder 1. Bsp.: Grundsätzlche Partzpatonsentschedung am Arbetsmarkt Kauf oder Nchtkauf enes Produktes. -2-

2. Lneares Wahrschenlchkets-Modell (LWM) 2.1. Modelldee LWM blebt nnerhalb der OLS-Methode des klassschen lnearen Regressonsmodells. Es behandelt de abhängge dskrete Varable ncht anders als ene metrsche. Der Regressonsansatz lautet n Vektorschrebwese: Y = x β + u = 1,..., N (1) mt Y : abhängge Varable, Wert 0 oder 1; x : 1 x k Vektor erklärender Varablen; β: k x 1 Parametervektor; u : Störvarable Eu ( )= 0. We bsher glt: EYx ( )= x β, aber auch: EYx ( ) = 1 P + 0 ( 1 P) = P mt: P = P( Y = 1 x) daher "Lneares Wahrschenlchkets-Modell": Bedngter Erwartungswert der abhänggen Varablen st de Wahrschenlchket, daß de bnäre abhängge Varable den Wert Ens annmmt. -3-

2.2. Probleme des LWM a) Methodsches Problem des LWM: Heteroskedaste u kann 2 Werte annehmen: x β oder 1 x β Eu ( ) = P( 1 x β) + ( 1 P)( x β ) = 0 Var( u) = P( 1 x β) + ( 1 P)( x β) = P( 1 P) = ( x β)( 1 x β ) 2 2 Aufgrund der Abhänggket der Varanz von den Beobachtungen heteroskedastsch x ' snd de Störterme u Lösung des Problems mt zwestufger GLS Schätzung: 1.) OLS-Schätzung von β. 2.) Weghted Least Squares Schätzung -4-

b) Inhaltlche Inkonsstenz des LWM Be OLS Schätzung von β kann Y = x β = P außerhalb des [0,1] Intervalles legen Interpretaton als Wahrschenlchket daher unplausbel. c) Lneare Zunahme der Wahrschenlchket Problematsch st außerdem de unterstellte Annahme ener dentschen Zunahme der Wahrschenlchket enes Eregnsses auf enen Impuls der exogenen Varablen unabhängg von hrem realserten Nveau. Es st z.b. anzunehmen, dass sch Enkommensänderungen auf sehr nedrgem oder sehr hohem Nveau anders auf de Kaufwahrschenlchket auswrken als glechwertge Veränderungen n den mttleren Enkommensberechen. Aus desen Gründen zeht man dem LWM Logt- und Probt-Modelle zur Erklärung ökonomscher Wahlhandlungen vor. Beden Modellen legt en sogenanntes Schwellenwertmodell zugrunde, das wr zunächst formuleren werden. -5-

3. Probt-Logt Modelle 3.1. Formulerung enes Schwellenwertmodells Es wrd angenommen, daß den dskreten Ausprägungen der abhänggen Varablen ene stetge, aber unbeobachtbare (latente) Varable Y zugrundelegt, deren Werteberech ncht beschränkt st: Y = x β + u De Störgröße u se unabhängg dentsch vertelt (..d.) mt Eu ( )= 0 und Var( u )=σ 2. Vorläufg erfolgt noch kene konkrete Vertelungsannahme hnschtlch u. Zwschen der latenten Varable ( Y ) Zusammenhang (Schwellenwertmodell): und den Beobachtungen ( Y ) besteht folgender Y = 1, wenn Y > 0 0, wenn Y 0-6-

Überschretet latente Varable den Wert Null, wrd für abh. Varable der Wert Ens beobachtet, sonst Null. Inhaltl. Interpretaton der latenten Varablen z.b.: Negung zur Partzpaton am Arbetsmarkt, Kaufanrez für Produkt A. De Wahrschenlchket für de Beobachtung von Y = 1 st: P ( Y = 1 ) = P ( Y > 0) = P ( u > x β ) = 1 F ( x β ) mt: F ( β ): Vertelungsfunkton für de Resduen an der Stelle x β x De Wahrschenlchket für de Beobachtung von Y = 0 st entsprechend: P ( Y = 0 ) = P ( u x β ) = F ( x β ) -7-

Zum Verglech: Lneares Wahrschenlchketsmodell: EY ( ) = P(Y= 1) = x β Schwellenwertmodell: EY ( ) = P(Y= 1) = 1 F( x β ) Das Schwellenwertmodell vermedet de nhaltlche Inkonsstenz des LWM: De Wahrschenlchket P(Y = 1) st m Schwellenwertmodell auf Werte zwschen 0 und 1 restrngert. -8-

3.2. Schätzung des Modells mt der Maxmum-Lkelhood-Methode Zur Schätzung des Modells mt der Maxmum-Lkelhood-Methode st ene Vertelungsannahme für u notwendg; dabe fnden prnzpell zwe Vertelungen Verwendung: a) Probt-Modell: u unabhängg dentsch normalvertelt (..n.d), u = N( 0, σ 2 ) Für Beobachtungen Y = 1 glt dann (wegen Symmetre der Normalvertelung): * P(Y > 0) = P(u > x β) = P(u / σ> x β/ σ) = 1 Φ( x β/ σ) = Φ( x β/ σ) Φ( x βσ) = βσ / x 2 1 ( ) exp( t ) dt 2π 2 Stelle x β σ Für de "Nullbeobachtungen" ( Y = 0 ) glt entsprechend: P(Y 0) = 1 Φ( x β/ σ ) st Vertelungsfkt. der Standardnormalvertelung an der Lkelhood-Funkton für das Probt-Modell be geegneter Anordnung der Stchprobe: -9-

[ 1 Φ β σ ] LProbt = ( x / ) Φ( x β/ σ ) 0 1 Erstes Produkt läuft über Beobachtungen mt Y = 0, zwetes Produkt über de mt Y = 1. Kompakte Schrebwese: N [ 1 Φ ] Y Y LProbt = Φ( x β/ σ) ( x β/ σ ) (1 ) = 1 Identfkatonsproblem: Nur β / σ kann dentfzert werden, da unendlch vele Kombnatonen von β und σ de gleche Wahrschenlchket erzeugen. Restrngeren des Parameters σ auf 1, d.h. Annahme ener Standardnormalvertelung der Resduen. -10-

b) Logt-Modell: u unabhängg dentsch logstsch vertelt mt Eu ( )= 0 und Var( u ) =τπ / Wederum aus Identfkatonsgründen: τ 2 = 1 Standard-logstsche Vertelung von u Vertelungsfunkton der Standard-logstschen Vertelung: 1 exp( x β ) F ( x β ) = = 1 + exp( x β ) 1 + exp( x β ) Lkelhoodfunkton m Logt Modell: L Logt N exp( x β ) = 1 x = 1 1 + exp( β ) ( 1 Y ) exp( x β ) x 1 + exp( β ) Y 2 2 3 De Logstsche Dchtefunkton ähnelt der Dchte der Standardnormalvertelung, hat jedoch enen flacheren Verlauf an den Enden. Für Probt- und Logt-Modell produzert de Maxmum Lkelhood-Methode konsstente Schätzer für den Parametervektor β. De Lkelhood Funkton st n beden Modellen global konkav. Erste Abletungen der Log-Lkelhood-Funkton snd m Probt- und Logt Modell nchtlnear. Aufsuchen der Nullstellen mttels teratver Methoden (Newton-Raphson Methode, Method of Scores) -11-

3.3 Praktsche Anwendung von Logt- und Probt-Modellen Das Logt-Modell st wegen geschlossener Form der Vertelungsfunkton enfacher handhabbar als das Probt-Modell. Durch Fortschrtte n der EDV-Technologe hat das Logt-Modell jedoch an Bedeutung verloren. Interpretaton der Parameterschätzwerte: De Parameterschätzwerte können bem Probt- bzw. Logt-Modell ncht we m klassschen lnearen Regressonsmodell oder m LWM als margnale Effekte nterpretert werden. Für Probt- bzw. Logt- Modelle glt velmehr: P x k mt : = Fx ( β) β = f( x β) β x β k k f( x β ): Dchtefunkton der jewelgen Vertelung a. d. Stelle x β. -12-

Bespel: Modellerung der Telnahme an beruflcher Weterbldung (Westdeutschland, 1988, Sozoökonomsches Panel) Ergebnsse ener ML-Schätzung Probt-Modell (Telnahme ja/nen) Erklärende Varablen Koeffzent t-wert Konstante -1.26403-7.87925 Alter/10-0.19883-4.82712 Mann Frau ausländscher Staatsbürger deutscher Staatsbürger Abtur ken Abtur Lehre kene Lehre Dplom ken Dplom erwerbstätg ncht erwerbstätg 0.04266 Referenz -0.54813 Referenz 0.06833 Referenz 0.57250 Referenz 0.96898 Referenz 0.36607 Referenz 0.47645-4.58732 0.45150 5.54323 4.88005 3.75390-13-

Lteratur: Hujer, R. (2003): Skrpt zur Vorlesung Mkroökonometre. Ronnng, G. (1991): Mkoökonometre, Berln. -14-