Modelle mit diskreten abhängigen Variablen

Größe: px
Ab Seite anzeigen:

Download "Modelle mit diskreten abhängigen Variablen"

Transkript

1 Kapitel 19 Modelle mit diskreten abhängigen Variablen 19.1 Vorbemerkungen Bisher sind wir stets davon ausgegangen, dass die abhängige Variable y intervallskaliert ist. Zusätzlich haben wir meist angenommen, dass die Störterme ε i normalverteilt sind. Sehr häufig ist diese Annahme aber nicht erfüllt und die abhängige Variable ist in irgendeiner Form beschränkt. In solchen Fällen spricht man von Limited Dependent Variables (LDV). In diesem Kapitel werden wir einige solcher Fälle und die damit einhergehenden Probleme diskutieren. 1 Zum Beispiel haben wir bisher Dummy-Variablen (auch bekannt als binäre, dichotome oder qualitative Variablen) ausschließlich als erklärende Variablen (auf der rechten Seite der Regressionsgleichungen) zugelassen. Solche qualitative Variablen können aber auch als abhängige Variable interessieren, z.b. kauft ein Kunde mit bestimmten Charakteristika ein Produkt oder kauft er es nicht, lässt sich jemand scheiden oder nicht, geht eine Firma in Konkurs oder nicht, usw. Es gibt zahlreiche Arten von diskreten abhängigen Variablen, die wichtigsten Fälle sind: Binäre abhängige Variablen: z.b. Kaufentscheidungen (ja/nein), Konkurse, lineares Wahrscheinlichkeitsmodell, Probit- / Logit Modelle; Ordinale abhängige Variablen: z.b. Schulnoten, Zustimmungsgrade,... Ordered Probit- / Logit Modelle; Nominale abhängige Variablen: z.b. Wahl eines Schultyps, eines Transportmittels,... Multinominale Logit Modelle; Zensierte oder gestutzte abhängige Variablen (censored or truncated): z.b. Arbeitsangebot kann nicht negativ sein, Einkommen über einer bestimmten Höhe werden in der Einkommenssteuerstatistik nicht einzeln ausgewiesen,... z.b. Tobit-Modelle 1 Dieses Kapitel folgt eng dem Lehrbuch von Long (1997). 1

2 Empirische Wirtschaftsforschung 2 Zähldaten: z.b. Anzahl der Kinder einer Frau, Zahl der Regierungswechsel in einer Periode,... Solche Daten treten häufig auf, wenn individuelles Verhalten beobachtet wird, deshalb werden Schätzverfahren für solche Daten üblicherweise der Mikroökonometrie zugerechnet. Da in diesen Fällen die Annahmen des klassischen linearen Regressionsmodells meist verletzt sind, wurden für diese Daten eigene Modelle entwickelt, die häufig auf der Maximum Likelihood Methode beruhen. Bevor wir uns aber ausführlich mit diesen Methoden beschäftigen, werden wir uns vorher noch kurz mit einem sehr einfachen Modell befassen, nämlich der Anwendung von OLS bei abhängigen Dummy Variablen Das Lineare Wahrscheinlichkeitsmodell (LPM) Beim Linearen Wahrscheinlichkeitsmodell (Linear Probability Model, LPM) wird das Modell mit einer binären abhängigen Variable einfach mit OLS geschätzt. 2 Angenommen wir interessieren uns dafür, welche Personen sich nach einer Verkaufsveranstaltung entschließen das Produkt zu kaufen, oder genauer, wie welche persönliche Charakteristika die Kaufwahrscheinlichkeit beeinflussen. Dazu könnten wir eine Zufallsstichprobe ziehen und die Personen befragen, ob sie das Produkt gekauft haben (y), sowie nach den interessierenden Charakteristika wie z.b. Einkommen (I), Alter (A), Bildungsniveau (E). Das Modell lautet wobei y i = y i = β 1 +β 2 I i +β 3 A i +β 4 E i +ε i { 1 wenn Person i das Produkt gekauft hat, 0 wenn Person i das Produkt nicht gekauft hat. Natürlich können auch erklärende Variablen qualitativ sein, z.b. das Geschlecht. Wennwirmitx i diei-tezeilederx Matrixbezeichnen(x i istalsoeinspaltenvektor, und x i ein 1 k Zeilenvektor mit den Daten für Beobachtungseinheit i) können wir das Modell schreiben als y i = x i β +ε i Dieses Modell kann prinzipiell mit OLS geschätzt werden (auch wenn dies Probleme mit sich bringt, mehr dazu später). Abbildung 19.1 zeigt das lineare Wahrscheinlichkeitsmodell (LPM) für den bivariatenfall.diepunktezeigendierealisationenvony (y i = 0odery i = 1).Diedurchgezogene (blaue)( Linie ist dasergebnis einer OLS-Regression undzeigt ŷ i = β 1 + β 2 x i. Die entsprechende PRF beschreibt den bedingten Erwartungswert E(y i x i ) = β 1 + β 2 x i. 2 Man kann zeigen, dass das LPM eng mit der statistischen Diskriminanzanalyse verwandt ist (siehe z.b. Maddala and Lahiri, 2009, 332f).

3 Empirische Wirtschaftsforschung 3 Dieser Erwartungswert hat eine interessante Interpretation. Da y nur zwei Werte annehmen kann, 0 oder 1, ist der bedingte Erwartungswert E(y i x i ) = [1 Pr(y i = 1 x i )]+[0 Pr(y i = 0 x i )] = Pr(y i = 1 x i ) wobei Pr die Wahrscheinlichkeit bezeichnet, mit der das Ereignis eintritt. Der Erwartungswert der binären Variable kann also als bedingte Wahrscheinlichkeit interpretiert werden, mit der das Ereignis y i = 1 für gegebene x i eintritt. Also gilt Pr(y i = 1) = ŷ i = x iβ Dies erklärt den Namen des LPM. Im LPM können die marginalen Effekte wie üblich interpretiert werden y = Pr(y i = 1) x h x h = β h d.h. β h gibt an, wie eine marginale Änderung der Variable x h die Eintrittswahrscheinlichkeit des Ereignisses beeinflusst. Wenn D eine Dummyvariable ist und der Vektor x i die restlichen erklärenden Variablen enthält ist wie üblich die Differenz der Erwartungswerte zu bilden Pr(y i = 1) = E(y i x i,d i = 1) E(y i x i,d i = 0) Daten: y x y E(y x) 50 ε 1 ε 0 x 100 x Abbildung 19.1: Das Linear Probability Model Beispiel: Ein bekanntes Beispiel für die Analyse einer diskreten abhängigen Variable stammt von Fair (1978). Dieser wertete das mittels Fragebögen erhobene Seitensprungverhalten seiner verheirateten Mitbürger aus. Da wir diesen Datensatz noch öfters verwenden werden sind in Tabelle 19.1 die deskriptiven Statistiken der Variablen zusammengefasst. Tabelle 19.2 zeigt die Anwendung einer einfachen OLS-Regression auf diese Daten, d.h. das Lineare Wahrscheinlichkeitsmodell, und Abbildung 19.2 das Histogramm der gefitteten Werte, d.h. der prognostizierten Wahrscheinlichkeiten.

4 Empirische Wirtschaftsforschung 4 Tabelle 19.1: Deskriptive Statistik zu Fair, Ray C. (1978), A Theory of Extramarital Affairs, Journal of Political Economy, Vol 86 No 1, Variable Mean Max. Min. Std. Dev. Description EMA Extramarital Affairs, 0 = no, 1 = yes, Sex = female, 1 = male, Age Age YMar No. of years married Kids Children, 0 = no, 1 = yes Relig How religious, 5 = very, 1 = anti Educ Education, from 9 (low) to 20 (high) Occ Occupation (1-7) RMar Rate marriage, from 5 = very happy to 1 = very unhappy n = 601, Survey data of first time married people. Tabelle 19.2: Das Lineare Wahrscheinlichkeitsmodell (OLS) Dependent Variable: EMA Method: Least Squares Included observations: 601 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-stat. Prob. C b SEX b AGE b YMAR b KIDS b RELIG b EDUC b OCC b RMAR b R-squared Log likelihood Adjusted R-squared Akaike info criterion S.E. of regression Schwarz criterion Sum squared resid F-statistic Durbin-Watson Stat Prob(F-statistic)

5 Empirische Wirtschaftsforschung Series: EMA_F Sample Observations 601 Mean Median Maximum Minimum Std. Dev Skewness Kurtosis Jarque-Bera Probability Abbildung 19.2: Histogram der prognostizierten Wahrscheinlichkeiten Probleme mit dem linearen Wahrscheinlichkeitsmodell Das lineare Wahrscheinlichkeitsmodell ist verblüffend einfach und wie die Praxis zeigt in vielen Fällen erstaunlich robust, weshalb es oft vernünftig ist zur ersten Orientierung mit einem solchen Modell zu beginnen. Leider hat es auch einige Nachteile: Die prognostizierten Wahrscheinlichkeiten können größer als Eins oder kleiner als Null sein, was natürlich der Definition einer Wahrscheinlichkeit widerspricht. Abbildung 19.2 mit dem Histogram der prognostizierten Werte zeigt, dass in dem Beispiel von Fair (1978) eine Reihe negativer Seitensprungwahrscheinlichkeiten vorhergesagt werden. Die unterstellte lineare Funktionsform ist häufig unrealistisch. Wenn z.b. bestimmt werden soll, mit welcher Wahrscheinlichkeit Frauen berufstätig sind, unterstellt das LPM, dass ein erstes Kind einer Frau den gleichen Einfluss auf die Wahrscheinlichkeit für die Berufstätigkeit hat wie ein viertes Kind. Heteroskedastizität: Man kann zeigen, dass die Varianz einer binären Variable y i mit Mittelwert µ immer µ(1 µ) ist. 3 Im Regressionsmodell ist der bedingte Erwartungswert E(y i x i ) = x iβ. Die bedingte Varianz von y ist deshalb von X abhängig var(y i x i ) = Pr(y i = 1 x i )[1 Pr(y i = 1 x i )] = x i β(1 x i β) d.h. das Modell ist heteroskedastisch. Deshalb ist das LPM nicht effizient und die Standardfehler sind verzerrt. Dieses Problem lässt sich durch die Anwendung eines FGLS Schätzers 4 (Feasible Generalized Least Squares), oder noch einfacher durch heteroskedastie-konsistente (White-) Standardfehler zumindest wesentlich mildern. 3 Warum? Sei y eine Dummy Variable mit E(y) = µ. Per Definition gilt var(y) = E(y µ) 2 = E(y 2 ) 2µE(y) + µ 2. Da y nur die Werte 0 und 1 annehmen kann gilt y 2 = y. Einsetzen von E(y) = µ gibt var(y) = µ µ 2 = µ(1 µ). 4 Man schätzt die gefitteten Werte ŷ i, berechnet daraus die Gewichte w i = ŷ i (1 ŷ i ), und regressiert y i /w i auf x i /w i.

6 Empirische Wirtschaftsforschung 6 Die Störterme sind nicht normalverteilt: Die Störterme sind die Differenz zwischen realisierten Werten und dem bedingten Erwartungswert ε i = y i E(y i x i ). In Abbildung 19.1 (Seite 3) ist der Störterm für einen Wert x eingezeichnet. Da y nur 0 oder 1 sein kann, ist der entsprechende Störterm entweder ε 1 = 1 E(y x ) oder ε 0 = 0 E(y x ). Diese Störterme können deshalb nicht normalverteilt sein. Dies beeinflusst zwar nicht die Unverzerrtheit des OLS Schätzers, aber die Teststatistiken sind in kleinen Stichproben ungültig. Einige der Probleme des LPM lassen sich beseitigen, wenn man eine Funktion wählt die sicher stellt, dass der bedingte Erwartungswert d.h. die Wahrscheinlichkeit im [0,1] Intervall liegt Pr(y i = 1 x i) = E(y i x i) = F(x iβ) wobei x iβ Indexfunktion genannt wird und F eine Transformationsfunktion ist, die folgende Eigenschaft erfüllt: F( ) = 0. F( ) = 1, df(x) dx f(x) 0 (dies impliziert 0 < F(z) < 1 z x) Eine solche Funktion F kann natürlich niemals linear sein, sondern wird meist S- förmig angenommen. Deshalb sind die marginalen Effekte nicht konstant, weshalb die Parameter dieser Modelle wie wir später sehen werden deutlich schwieriger zu interpretieren sind als die des LPM. y LPM 1.0 Logit x 100 x Abbildung 19.3: Vergleich LPM- und Logit Modell 19.3 Eine Interpretation: Latente Variablen Ein wesentliches Problem des LPM besteht darin, dass die prognostizierten Wahrscheinlichkeiten nicht im [0, 1] Intervall liegen müssen, sowie, dass konstante mar-

7 Empirische Wirtschaftsforschung 7 ginale Effekte häufig theoretisch unplausibel sind. Deshalb liegt es nahe eine Funktionsform zu wählen, die diese Probleme vermeidet. Meistens wird eine S-förmige Funktionsform gewählt wie in Abbildung In diesem Abschnitt werden wir versuchen eine plausible Begründung für eine solche Funktionsform zu geben, und anschließend werden wir uns mit der Schätzung und Interpretation der Parameter beschäftigen. Für das Verständnis ist es am einfachsten, wenn wir uns vorstellen, dass die beobachtbare binäre Variable y von einer zugrundeliegenden unbeobachtbaren intervallskalierten Variable y erzeugt wird. Falls die abhängige Variable y z.b. angibt, ob jemand eine Kauf getätigt hat oder nicht, könnte die latente intervallskalierte Variable y interpretiert werden als Kaufneigung ; oder wenn y angibt, ob eine Firma zahlungsunfähig wurde, könnte y als Liquidität oder etwas ähnliches interpretiert werden. Eine solche dahinterliegende unbeobachtbare Variable wird latente Variable genannt. Wir werden im weiteren solche latente Variablen mit einem hochgestellten kennzeichnen. Das Strukturmodell sei y i = x iβ +ε i mit y i = { 1 wenn y i > τ, 0 wenn y i τ. wobei τ einen (beliebigen) Schwellenwert (treshold oder cutoff point) bezeichnet. Meist wird τ = 0 angenommen, da sich die Wahl eines anderen (beliebigen) Schwellenwerts bei der Schätzung nur auf den Wert des Interzepts auswirkt, welches aber nur selten von Interesse ist. Die Wahrscheinlichkeit, dass für ein gegebenes x i die abhängige Variable y i den Wert 1 annimmt, kann für τ = 0 als Wert der Verteilungsfunktion an der Stelle x i β berechnet werden, denn Pr(y i = 1 x i ) = Pr(y > 0 x i ) = Pr(x iβ +ε i > 0 x i) = Pr(ε i > x i β x i ) = Pr(ε i x i β x i ) = F(x i β x i ) (der letzte Schritt folgt aus der Symmetrie der Normalverteilung). Diese Herleitung wird in Abbildung 19.4 grafisch veranschaulicht. Man beachte, dass auch für E(y x i) > τ und deshalb E(y x i) = 1 das tatsächlich beobachtete y i gleich Null sein kann (d.h. y i = 0), wenn nämlich ε i hinreichend negativ ist. Wir werden außerdem später sehen, dass σ in diesen Modellen nicht berechnet werden kann (d.h. nicht identifizierbar ist), sondern nur das Verhältnis β/σ.

8 Empirische Wirtschaftsforschung 8 y E(y x) x i β τ y = 0 y = 1 τ = 0 x i x Dichte Pr(y = 0) Pr(y = 1) Pr(y = 0) Pr(y = 1) Pr(y = 1) = F(xβ) Pr(y = 0) 0 x y i β y = xβ +ε Pr(y = 1) = Pr(xβ +ε > 0) x i β 0 ε = y xβ Pr(y = 1) = Pr(ε > xβ) 0 x i β ε = xβ y Pr(y = 1) = Pr(ε xβ) = F(xβ) Abbildung 19.4: Latente Variable Pr(y i = 1 x i ) = F(βx i ) Die obere Grafik von Abbildung 19.5 (Seite 9) zeigt die Verteilung des Störterms ε für 5 verschiedene x. Die schraffierte Fläche gibt die auf x bedingte Eintrittswahrscheinlichkeit Pr(y i = 1 x i ) an, die in der unteren Abbildung aufgetragen ist. Dies ist offensichtlich eine Verteilungsfunktion Probit- und Logit Modelle Benötigt wird also eine Transformationsfunktion F die sicherstellt, dass F(x iβ) in das Intervall [0, 1] fällt. Die beiden am häufigsten verwendeten Funktionen, die diese Annahme erfüllen, sind die Verteilungsfunktionen der Normal- und der logistischen Verteilung. Probit: verwendet für F die Verteilungsfunktion der Standardnormalverteilung: x Pr(y i = 1) = Φ(x i β) = i β x i β ( ) 1 z 2 φ(z)dz = 2π exp dz 2

9 Empirische Wirtschaftsforschung 9 y 8 7 y = 0 y = 1 τ E(y x) τ x 1 Pr(y = 1 x) Abbildung 19.5: Interpretation als latente Variable : die schraffierte Fläche der oberen Abbildung ist als Verteilungsfunktion in der unteren Abbildung dargestellt. wobei Φ (Phi) die Verteilungsfunktion (cdf für Cumulative Distribution Function ) und φ (phi) die Dichtefunktion (pdf für Probability Density Function ) der Standardnormalverteilung ist. Logit: basiert auf der Verteilungsfunktion (cdf) der logistischen Verteilung: Pr(y i = 1) = Λ(x iβ) = exp(x i β) 1+exp(x i β) wobei Λ(Lambda) die Verteilungsfunktion (cdf) der standard-logistischen Verteilung mit Mittelwert 0 und Varianz π 2 /3 ist. Die Dichtefunktion (pdf) der logistischen Verteilung ist nebenbei erwähnt λ(x exp(x i iβ) = β) [1+exp(x i β)]2

10 Empirische Wirtschaftsforschung 10 Die Schätzung beider Modelle erfolgt mittels Maximum Likelihood. Die Wahrscheinlichkeit Pr(y i = 1 x i) = F(x iβ) wobeif improbitmodelldiecdfφundimlogitmodelldiecdfλist(vgl.abbildung 19.4, Seite 8). Pr(y i = 1 x i ) = F(x i β) Pr(y i = 0 x i) = 1 F(x iβ) Wenn die Stichprobenziehungen unabhängig sind (i.i.d. sampling) ist die gemeinsame Wahrscheinlichkeit Pr(y 1,y 2,...,y n X) = [1 F(x i β)] [F(x i β)] {i,y i =0} {i,y i =1} Dadiebeobachteteny i AusprägungeneinesBinomialprozessessindistdieLikelihood Funktion für n Beobachtungen n L(β y,x) = [F(x iβ)] y i [1 F(x iβ)] 1 y i i=1 Die Log-Likelihood Funktion ist das Produkt der individuellen Likelihoodbeiträge lnl i n lnl = {y i ln[f(x i β)]+(1 y i)ln[1 F(x i β)]} i=1 Man beachte, dass der Wert dieser Log-Likelihood Funktion nie positiv sein kann, da 0 F( ) 1 impliziert, dass ln[f( ) 0] und ln[1 F( ) 0]. Die Bedingungen erster Ordnung sind lnl β = n i=1 [ yi f i f i +(1 y i ) F i (1 F i ) ] x i! = 0 wobei f i = df i /d(x iβ) die Dichtefunktion (pdf) ist, also φ für das Probit und λ für das Logit Modell. Die Parameter β dieses Modells können mit Hilfe iterativer Verfahren geschätzt werden. Die Log-Likelihood Funktion könnte z.b. in EViews (oder jedem anderen geeigneten Programm 5 einfach maximiert werden (hier für das Probit) logl LL1 Log-Likelihood Objekt LL1 anlegen OLS Schätzungen als Startwerte setzen eq1.ls y c x logl1 LL1.append xb = c(1) + c(2)*x LL1.append logl1 = + LL1.ml show LL1 (EMA ist die abhängige Dummyvariable Extramarital Affairs ) aber selbstverständlich sind entsprechende Routinen einfacher mit dem Befehl eqname.probit list of variables aufgerufen werden. 5 Für R Beispiele siehe z.b. Kleiber wwz.unibas.ch/fileadmin/wwz/redaktion/statistik/downloads/lehre/mikro/folien/binary.pdf

11 Empirische Wirtschaftsforschung 11 Beispiel: Tabelle 19.3 und 19.4 zeigen Probit- bzw. Logitschätzungen für die bereits früher zitierte Arbeit von Fair (1978) über außerehelicher Beziehungen (für die Definition der Variablen siehe Seite 4). Tabelle 19.3: Probit-Schätzung von Fair (1978) Dependent Variable: EMA Method: ML - Binary Probit (Quadratic hill climbing) Sample: Included observations: 601 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-stat. Prob. C b SEX b AGE b YMAR b KIDS b RELIG b EDUC b OCC b RMAR b Mean dependent var S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood Hannan-Quinn criter Restr. log likelihood Avg. log likelihood LR statistic (8 df) McFadden R-squared Probability(LR stat) 4.87E 11 Obs with Dep=0 451 Total obs 601 Obs with Dep=1 150 Achtung: Der Maximum Likelihood Schätzansatz bricht zusammen, wenn für eine Linearkombination x i β der erklärenden Variablen gilt { y i = 0 wenn x i β < 0, und y i = 1 wenn x iβ > 0 Dies bedeutet, dass in einer graphischen Abbildung die Beobachtungen durch eine Gerade (oder Hyperebene) perfekt getrennt werden können. Dieses Problem ist als Perfect Classifier Problem oder (Quasi-)Vollständige Separation bekannt (siehe z.b. Davidson and MacKinnon, 2003, 458).

12 Empirische Wirtschaftsforschung 12 Tabelle 19.4: Logit-Schätzung von Fair 1978 Dependent Variable: EMA Method: ML - Binary Logit (Quadratic hill climbing) Sample: Included observations: 601 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-stat. Prob. C b SEX b AGE b YMAR b KIDS b RELIG b EDUC b OCC b RMAR b Mean dependent var S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood Hannan-Quinn criter Restr. log likelihood Avg. log likelihood LR statistic (8 df) McFadden R-squared Probability(LR stat) 3.25E 11 Obs with Dep=0 451 Total obs 601 Obs with Dep= Identifizierbarkeit und Vergleich der Koeffizienten von Probit- & Logitmodellen Wir haben bereits früher gezeigt (siehe latente Variablen), dass Pr(y = 1 x) = Pr(y > 0 x) = Pr(xβ +ε i > 0 x) = Pr(ε i > xβ x) Man kann nun einfach eine Standardisierung vornehmen, indem man ε i durch σ dividiert (ε i /σ ist standardnormalverteilt mit Mittelwert 0 undstandardabweichung

13 Empirische Wirtschaftsforschung 13 1) ( ) Pr(y i = 1 x i ) = Pr εi σ > β x i σ ( ) εi = Pr σ β x i σ [ ( )] β = F x i σ Dies führt zur Likelihood Funktion ( ) β n [ ( L σ y,x = F bzw. Log-Likelihood Funktion lnl = n i=1 i=1 { [ ( y i ln F x i )] β σ x i )] yi [ ( β 1 F σ x i β σ [ ( +(1 y i )ln 1 F )] 1 yi x i )]} β σ Man beachte, dass β und σ hier immer nur gemeinsam als β/σ auftreten. Deshalb kann nur das Verhältnis β/σ berechnet werden, nicht aber die getrennten Werte β und σ. Man sagt, β und σ sind nicht einzeln identifiziert, sodern nur das Verhältnis β/σ ist identifiziert. Intuitiv kann man sich vorstellen, dass die latente Variable y im Strukturmodell y i = x iβ +ε i nicht beobachtbar ist, deshalb kann die Varianz von y nicht aus den beobachteten Daten berechnet werden. Tatsächlich kann man eine beliebige Varianz σ annehmen und dazu den entsprechenden Koeffizientenvektor β berechnen. Aus Einfachkeitsgründen hat es sich eingebürgert, für das Probitmodell eine Varianz von Eins (σp 2 = 1) und für das Logitmodell eine Varianz π 2 /3 (σl 2 = π2 /3) anzunehmen. Der Grund für diese Annahmen liegt einzig und alleine in der damit zu erzielenden Einfachheit. Also Probit: Standardnormalverteilung mit µ = 0 und var(ε) = 1 ε i N(0,1) Logit: Standard-logistische Verteilung mit µ = 0 und var(ε) = π 2 /3 ε i L(0,π 2 /3) (L bezeichne die logistische Verteilung) Abbildung 19.6 zeigt die Dichte und Verteilungsfunktionen dieser beiden Verteilungen. Die geschätzten Koeffizienten werden sich deshalb im Logit- und Probitmodell unterscheiden ˆβ P ˆβ L 1 π2 /3

14 Empirische Wirtschaftsforschung 14 Dichtefunktionen: Verteilungsfunktionen: Standardnormalverteilung Standardlogistische Verteilung Standardisierte logist. Verteilung Abbildung 19.6: Standardnormale & standard-logistische Verteilung Deshalb würden wir näherungsweise erwarten, dass ˆβ L π 2 /3 ˆβ P 1.81ˆβ P Nach Amemiya (1981) sollte man eher einen Wert von 1.6 verwenden, da für diesen Wert die Verteilungsfunktionen am ähnlichsten sind (vgl. Long, 1997, 47f) ˆβ L 1.6ˆβ P Diese Approximation funktioniert für Wahrscheinlichkeiten zwischen 0.1 und 0.9 recht gut. Für einen Vergleich der Koeffizienten des Logit Modells mit den Koeffizienten des linearen Wahrscheinlichkeitsmodells (LPM) empfiehlt Amemiya die Logit Koeffizienten mit 0.25 zu multiplizieren (vgl. Vogelvang 2005, S. 244; Greene 2003, S. 676).

15 Empirische Wirtschaftsforschung 15 Als grobe Faustregel gilt (Cameron & Trivedi 2005, 473) ˆβ Logit 4 ˆβ OLS ˆβ Probit 2.5 ˆβ OLS ˆβ Logit 1.6 ˆβ Probit Tabelle 19.5 zeigt die geschätzten Koeffizienten und deren p-werte (Prob.) für das LPM, Probit- und Logitmodell. Tabelle 19.5: Vergleich der Modelle Fair (1978) Variable LPM Prob. Probit Prob. Logit Prob. C SEX AGE YMAR KIDS RELIG EDUC OCC RMAR Wichtig ist, dass dadurch zwar die geschätzten Parameter in einem gewissen Sinne willkürlich sind (d.h. von der identifizierenden Annahme über die Varianz abhängig sind), dass dies aber keine Auswirkungen auf die Wahrscheinlichkeiten (predicted probabilities) hat. Dies kann für das Logit Modell einfach gezeigt werden. Die Verteilungsfunktion für die standardisierte logistische Verteilung (d.h. mit µ = 0 und σ 2 = 1) ist Λ s (ε) = exp[(π/ 3)ε] 1+exp[(π/ 3)ε] (diese standardisierte logistische Verteilungsfunktion ist in Abbildung 19.6 punktiert eingezeichnet). Wenn wir das Strukturmodell durch σ dividieren y + i σ = x i β σ + ε i σ hat ε i /σ eine standardisierte logistische Verteilung ( ) ( Λ s εi ) exp π ε i 3 σ = ( ) σ 1+exp da σ = π/ 3 ist aber π 3 ε i σ

16 Empirische Wirtschaftsforschung 16 ( Λ s εi ) = exp(ε i) σ 1+exp(ε i ) = Λ(ε i) Deshalb hängt die geschätzte Eintrittswahrscheinlichkeit eines Ereignisses Pr(y i = 1 x) nicht von der Annahme über die Varianz von ε i ab! Gleiches gilt für das Probit Modell Interpretation der Parameter Während die Schätzung der Modelle weitgehend von der entsprechenden Software übernommen wird und deshalb kaum Probleme bereitet ist die Interpretation der Ergebnisse deutlich komplexer als im Fall der linearen Regression. Abbildungen 19.7 und 19.8 verdeutlichen das Problem. Bei einer linearen Regression (Abbildung 19.7) sind die marginalen Effekte konstant und eine Dummy-Variable führt zu einer einfachen Parallelverschiebung der Regressionsgerade im Ausmaß des Koeffizienten der Dummy. Wie aus Abbildung 19.8 ersichtlich ist gilt dies nicht für nicht-lineare Modelle. Tatsächlich gehört eine kompakte Darstellung der Ergebnisse zu den schwierigeren Teilen einer Probit- oder Logit Analyse. y D = 0 D = 1 y i = β 1 +β 2 x i +β 3 D i β 2 β 2 β 3 β 2 β 3 β 2 x 1 x 2 x Abbildung 19.7: Interpretation der Parameter des linearen Regressionsmodells (LPM) Die Abbildungen 19.9 und zeigen die Funktion Pr(y i = 1 x i ) = F(β 1 +β 2 x i ) für unterschiedliche β 1, bzw. β 2. Man beachte, dass eine Erhöhung des Interzepts β 1 zu einer Linksverschiebung führt (der Grund dafür sollte aus Abbildung 19.5 ersichtlich sein).

17 Empirische Wirtschaftsforschung 17 y y i = f(α 1 +α 2 x i +α 3 D i ) = exp(α 1+α 2 x i +α 3 D i ) [1+exp(α 1 +α 2 x i +α 3 D i )] D = 0 D = 1 δ 4 δ 3 δ 6 δ 2 δ 5 δ 1 x 1 x 2 x Abbildung 19.8: Interpretation der Parameter des Logit Modells Pr(y = 1) β 1 = 10 β 1 = 5 β 1 = 0 β 1 = +5 β 1 = +10 (β 2 = 1) Abbildung 19.9: Parameter β 1 des Logit Modells Abbildung zeigt den multivariaten Fall Pr(y i = 1 x i) = F(β 1 +β 2 x i1 +β 3 x i2 ) Interpretation unter Verwendung der berechneten Wahrscheinlichkeiten Man kann nun die Schätzergebnisse verwenden um für bestimmte Werte von x i die entsprechenden Wahrscheinlichkeiten zu berechnen. Pr(y i = 1 x i ) = F(x iˆβ) = 1 F( x iˆβ)

18 Empirische Wirtschaftsforschung 18 Pr(Y = 1) β 2 = 0.1 β 2 = 0.3 β 2 = 1 β 2 = 2 β 2 = 0.5 (β 1 = 0) Abbildung 19.10: Parameter β 2 des Logit Modells 1 PHY=1»XL X2 X Abbildung 19.11: Das multivariate Logit Modell Für jedes Individuum existiert eine individuelle Wahrscheinlichkeit, d.h. die Wahrscheinlichkeiten sind beobachtungsspezifisch. Man kann nun einfach über die Wahrscheinlichkeiten aller Individuen mitteln, zum Beispiel kann man aus den Daten von Fair (1978) mit Hilfe einer Logit-Schätzung eine mittlere Seitensprungwahrscheinlichkeit von berechnen. Dies ist der Mittelwert der gefitteten Wahrscheinlichkeiten. In EViews erhalten Sie diesen Mittelwert z.b. mit equation eq1.logit ema c sex age ymar kids relig educ occ rmar eq1.fit ema_fit coef(1) m1 show m1 Man kann alternativ aber auch die Wahrscheinlichkeiten im Mittelwert der jeweiligen

19 Empirische Wirtschaftsforschung 19 x berechnen, d.h. Pr(y i = 1 x ) = F( x ˆβ). Dafür erhält man aus den Fair (1978) Daten einen Wert von Diesen Wert können Sie in EViews z.b. berechnen, indem Sie aus der Equation Toolbar View - Representations wählen, den Output mit Substituted Coefficients mit Copy & Paste in ein Programm-Fenster kopieren und dort Variablennamen ersetzen; für dieses Beispiel 6 coef(1) m2 = + - _ + + _ - + _ + - _ show m2 Interessanter sind jedoch häufig die Bereiche der Wahrscheinlichkeiten für unterschiedliche Werte von x. Die minimale und maximale Wahrscheinlichkeit in der Stichprobe ist definiert als min Pr(y i = 1 x i ) = min F(x iˆβ) i max Pr(y i = 1 x i) = max i F(x iˆβ) Dies sind die Werte für das Individuum mit der höchsten und das Individuum mit der niedrigsten Wahrscheinlichkeit. In EViews erhalten Sie diese einfach aus den oben berechneten gefitteten Werten z.b. mit ema_min1 bzw. ema_max1 Die Werte für das Fair-Beispiel finden Sie in der ersten Zeile von Tabelle Man kann auch den Bereich der Wahrscheinlichkeiten für die minimalen (bzw. maximalen) Wert jeder einzelnen x-variable berechnen, ungeachtet dessen, ob es tatsächlich ein Individuum mit solchen extremen Merkmalsausprägungen in der Stichprobe gibt. Dabei ist das Vorzeichen der geschätzten β h zu berücksichtigen x h = { min i x ki wenn β h 0, max i x ki wenn β h < 0 x h = { max i x ki wenn β h 0, min i x ki wenn β h < 0 wobei x h die zu verwendenden Werte von x ih für die Berechnung der minimalen und x h diewerte fürdieberechnung der maximalen Wahrscheinlichkeit bezeichnet. In der zweiten Zeile von Tabelle 19.6 finden sich die entsprechenden minimalen und maximalen Wahrscheinlichkeiten Pr(y = 1 x) = F( x ˆβ) und Pr(y = 1 x) = F( x ˆβ) Man beachte, dass diesen Wahrscheinlichkeiten vermutlich kein Individuum der Stichprobe entspricht, und dass die so berechneten Wahrscheinlichkeiten sehr empfindlich auf Ausreißer reagieren. 6 Das underline Zeichen am Zeilenende (!) erlaubt einen Befehl über mehrere Zeilen zu schreiben.

20 Empirische Wirtschaftsforschung 20 Diese Bereiche der Wahrscheinlichkeiten sind nützlich, um das Ausmaß der Nicht- Linearität abzuschätzen. Wenn diese gefitteten Wahrscheinlichkeiten z.b. alle zwischen 0.2 und 0.8 liegen können sie vermutlich durch ein lineares Modell möglicherweise einigermaßen gut angenähert werden. Ebenso, wenn der Bereich zwischen minimalen und maximalen Wert sehr klein ist. Tabelle 19.6: Bereich der gefitteten Wahrscheinlichkeiten für das Logit Modell (nach Fair 1978) Variable Min. Max. Diff. Pr(y i = 1 x i ) Pr(y i = 1 x min/max ) SEX AGE YMAR KIDS RELIG EDUC OCC RMAR Als nächstes kann man den Einfluss der einzelnen erklärenden Variablen untersuchen, indem man für jedes x h den minimalen und maximalen Wert einsetzt und für alle anderen Variablen jeweils den Mittelwert einsetzt ( x ist ein Vektor mit den Durchschnitten aller x Variablen außer der Variable x h ). Die Differenzen Diff h = Pr(y = 1 x,maxx h ) Pr(y = 1 x,minx h ) sind für unser Beispiel in Tabelle 19.6 ab Zeile 3 angegeben. Eine kleine Differenz bedeutet, dass eine Veränderung dieser Variable keinen großen Einfluss auf die prognostizierten Wahrscheinlichkeiten hat. Schließlich ist es wichtig, ob die maximalen und minimalen Werte in einen Bereich fallen, in denen die Kurve einigermaßen linear ist, oder in einen Bereich starker Nicht-Linearität. Häufig ist es nützlich, die Wahrscheinlichkeiten über einen Bereich einer Variablen graphisch darzustellen. Obwohl in unserem Beispiel das Geschlecht keinen signifikanten Erklärungsbeitrag leistet und deshalb nicht interpretiert werden sollte wollen wir im Moment davon absehen um die Methode zu demonstrieren. Abbildung zeigt die gefittetet Wahrscheinlichkeiten getrennt für Männer und Frauen (d.h. für SEX = 1 bzw. SEX = 0) über das Alter, wobei für alle anderen Variablen der Mittelwert eingesetzt wurde. Offensichtlich nehmen die Wahrscheinlichkeiten für beide Geschlechter mit dem Alter ab, aber auch der Unterschied zwischen Männern und Frauen wird kleiner. In Abbildung wird dasselbe über die Ehejahre gezeigt (für das Alter und alle anderen Variablen wird der Mittelwert eingesetzt). Hier wird der Unterschied zwischen Männern und Frauen offensichtlich nicht geringer, sondern nimmt mit den Ehejahren sogar zu. Man beachte aber, dass die gewählte Funktionsform keine Änderung des Vorzeichens zulässt.

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

VI Einkommensfunktion Teil 2

VI Einkommensfunktion Teil 2 Universität Ulm 89069 Ulm Germany Dipl.-Math. oec. Daniel Siepe Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur

Mehr

8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme)

8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme) 8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme) Annahme B4: Die Störgrößen u i sind normalverteilt, d.h. u i N(0, σ 2 ) Beispiel: [I] Neoklassisches Solow-Wachstumsmodell Annahme einer

Mehr

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift

Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Kapitel 18. Die Maximum-Likelihood Methode. 18.1 Grundidee

Kapitel 18. Die Maximum-Likelihood Methode. 18.1 Grundidee Kapitel 18 Die Maximum-Likelihood Methode 18.1 Grundidee Wir haben bisher (fast) ausschließlich die OLS-Methode angewandt um Schätzer für die Parameter eines Regressionsmodells zu bestimmen. Obwohl die

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

Finanzmarkttheorie I. Performancemessung in EViews Übungsunterlage. Prof. Dr. Heinz Zimmermann WWZ Uni Basel Frühling 2015

Finanzmarkttheorie I. Performancemessung in EViews Übungsunterlage. Prof. Dr. Heinz Zimmermann WWZ Uni Basel Frühling 2015 Prof. Dr. Heinz Zimmermann WWZ Uni Basel Frühling 2015 Finanzmarkttheorie I Performancemessung in EViews Übungsunterlage Die vorliegende Unterlage liefert eine kurze Einführung in die Schätzung linearer

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch

Prognosen. Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen. Auch ein Weiser hat nicht immer recht Prognosefehler sind hoch Universität Ulm 8969 Ulm Germany Dipl.-WiWi Sabrina Böck Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Wintersemester 8/9 Prognosen

Mehr

VI Einkommensfunktion Teil 1

VI Einkommensfunktion Teil 1 Universität Ulm 89069 Ulm Germany Dipl.-Math. oec. Daniel Siepe Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze

Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen

Mehr

Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression

Ergänzung der Aufgabe Mindestlöhne zu einer multiplen Regression Prof. Dr. Peter von der Lippe ( Übungsblatt E) Ergänzung der Aufgabe "Mindestlöhne" zu einer multiplen Regression Das Beispiel "Mindestlöhne" zur einfachen multiplen Regression ergab die folgenden Parameter

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Kap. 9: Regression mit einer binären abhängigen Variablen

Kap. 9: Regression mit einer binären abhängigen Variablen Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick:

Mehr

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

IV. Prognosen - Teil 2

IV. Prognosen - Teil 2 Universität Ulm 89069 Ulm Germany B.Sc. Daniele Sabella Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2014 Übung

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko

Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko Vergleich von KreditRisk+ und KreditMetrics II Seminar Portfoliokreditrisiko Jan Jescow Stoehr Gliederung 1. Einführung / Grundlagen 1.1 Ziel 1.2 CreditRisk+ und CreditMetrics 2. Kreditportfolio 2.1 Konstruktion

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Übung 1: Wiederholung Wahrscheinlichkeitstheorie

Übung 1: Wiederholung Wahrscheinlichkeitstheorie Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Übung zur Empirischen Wirtschaftsforschung. VI. Die Taylor Regel. 6.2 Die Taylor Regel. 6.3 Die Taylor Regel für die US-Geldpolitik

Übung zur Empirischen Wirtschaftsforschung. VI. Die Taylor Regel. 6.2 Die Taylor Regel. 6.3 Die Taylor Regel für die US-Geldpolitik Universität Ulm 89069 Ulm Germany Dipl.-Math. oec. Daniel Siepe Benedikt Blattner Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur

Mehr

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Stochastische Eingangsprüfung, 17.05.2008

Stochastische Eingangsprüfung, 17.05.2008 Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt! 1 Einführung 2 Wahrscheinlichkeiten kurz gefasst 3 Zufallsvariablen und Verteilungen 4 Theoretische Verteilungen (Wahrscheinlichkeitsfunktion)

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Statistische Auswertung der Daten von Blatt 13

Statistische Auswertung der Daten von Blatt 13 Statistische Auswertung der Daten von Blatt 13 Problemstellung 1 Graphische Darstellung der Daten 1 Diskussion der Normalverteilung 3 Mittelwerte und deren Konfidenzbereiche 3 Signifikanz der Behandlung

Mehr

Einfache Hypothesentests für multiple Regressionen

Einfache Hypothesentests für multiple Regressionen Kapitel 6 Einfache Hypothesentests für multiple Regressionen Economists have inherited from the physical sciences the myth that scientific inference is objective, and free of personal prejudice. This is

Mehr

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung

Dynamische Modelle. 1 Ökonomische Relevanz. 2 Ökonometrische Modelle. a) Statisches Modell und Differenzenbildung Universität Ulm 89069 Ulm Germany Prof. Dr. Werner Smolny Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Institutsdirektor Sommersemester

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Tutorium Wirtschaftsprognosen und Geldpolitik. Die Taylor Regel. 2 Die Taylor Regel. 3 Die Taylor Regel für die US-Geldpolitik. 4 Strukturbruchtest

Tutorium Wirtschaftsprognosen und Geldpolitik. Die Taylor Regel. 2 Die Taylor Regel. 3 Die Taylor Regel für die US-Geldpolitik. 4 Strukturbruchtest Universität Ulm 89069 Ulm Germany Michael Elbert Alexander Rieber Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Wintersemester 011/01

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

Klausur STATISTIK 2 für Diplom VWL

Klausur STATISTIK 2 für Diplom VWL Klausur STATISTIK 2 für Diplom VWL Name, Vorname: Matrikel-Nr. Die Klausur enthält zwei Typen von Aufgaben: Teil A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Einfache Modelle für Paneldaten. Statistik II

Einfache Modelle für Paneldaten. Statistik II Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)

Mehr

Kapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin

Kapitel 1 Einführung. Angewandte Ökonometrie WS 2012/13. Nikolaus Hautsch Humboldt-Universität zu Berlin Kapitel 1 Einführung Angewandte Ökonometrie WS 2012/13 Nikolaus Hautsch Humboldt-Universität zu Berlin 1. Allgemeine Informationen 2 17 1. Allgemeine Informationen Vorlesung: Mo 12-14, SPA1, 23 Vorlesung

Mehr

Tutorial: Regression Output von R

Tutorial: Regression Output von R Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Darstellung eines VAR(p)-Prozesses als VAR(1)-Prozess

Darstellung eines VAR(p)-Prozesses als VAR(1)-Prozess Darstellung eines VAR(p)-Prozesses als VAR(1)-Prozess Definiere x t = Y t Y t 1. Y t p+1 Sylvia Frühwirth-Schnatter Econometrics III WS 2012/13 1-84 Darstellung eines VAR(p)-Prozesses als VAR(1)-Prozess

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1)

Aufgabenstellung Aufgabe 1: Betrachten Sie das folgende ökonometrische Modell: y t = α + βx t + u t (1) Klausur: Einführung in die Ökonometrie Prüfer: Prof. Dr. Karl-Heinz Paqué Dr.Ludwigv.Auer Semester: WS 1999/00 Als Hilfsmittel sind zugelassen: nicht-programmierbarer Taschenrechner Diese Klausur besteht

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

13.5 Der zentrale Grenzwertsatz

13.5 Der zentrale Grenzwertsatz 13.5 Der zentrale Grenzwertsatz Satz 56 (Der Zentrale Grenzwertsatz Es seien X 1,...,X n (n N unabhängige, identisch verteilte zufällige Variablen mit µ := EX i ; σ 2 := VarX i. Wir definieren für alle

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

3. Das einfache lineare Regressionsmodell

3. Das einfache lineare Regressionsmodell 3. Das einfache lineare Regressionsmodell Ökonometrie: (I) Anwendung statistischer Methoden in der empirischen Forschung in den Wirtschaftswissenschaften Konfrontation ökonomischer Theorien mit Fakten

Mehr