Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Ähnliche Dokumente
Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

3 Multiple lineare Regression

Grundgedanke der Regressionsanalyse

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Klausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A

Prof. Dr. Roland Füss Statistik II SS 2008

Analyse von Querschnittsdaten. Bivariate Regression

Lineare Regression (1) - Einführung I -

Sind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

5. ZWEI ODER MEHRERE METRISCHE MERKMALE

WS 2016/17 Prof. Dr. Horst Peters , Seite 1 von 9

Mathematische und statistische Methoden II

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Vorlesung: Multivariate Statistik für Psychologen

ANOVA (Analysis of Variance) Varianzanalyse. Statistik Methoden. Ausgangssituation ANOVA. Ao.Prof.DI.Dr Josef Haas

1.1 Beispiele zur linearen Regression

Nomenklatur - Übersicht

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

Statistik und Wahrscheinlichkeitsrechnung

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Lineare Regression - Mathematische Grundlagen

Empirische Wirtschaftsforschung

Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D.

Kurs Mikroökonometrie Rudolf Winter-Ebmer Thema 3: Binary Choice Models Probit & Logit. Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit

Definition des linearen Korrelationskoeffizienten

2.1 Einfache lineare Regression 31

Hydrologie und Flussgebietsmanagement

8 Logistische Regressionsanalyse

Auswertung univariater Datenmengen - deskriptiv

Statistische Methoden für Bauingenieure WS 13/14

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

Streuungs-, Schiefe und Wölbungsmaße

Lineare Regression Teil des Weiterbildungskurses in angewandter Statistik

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

Standardnormalverteilung / z-transformation

3 Multiple lineare Regression

Lineare Regressionsanalyse mit SPSS

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104

Multivariate Analysemethoden

6. Modelle mit binären abhängigen Variablen

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D.

3. Lineare Algebra (Teil 2)

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

-70- Anhang: -Lineare Regression-

Ökometrie I 10 Korrelation - Regression

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

Beschreibende Statistik Mittelwert

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

Teil E: Qualitative abhängige Variable in Regressionsmodellen

Aspekte zur Approximation von Quadratwurzeln

(Essentiell) τ-äquivalente Tests:

In der beschreibenden Statistik werden Daten erhoben, aufbereitet und analysiert. Beispiel einer Datenerhebung mit Begriffserklärungen (Vokabel)

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

2 Zufallsvariable und Verteilungen

Konkave und Konvexe Funktionen

Prinzip "Proportional Reduction of Error" (PRE)

Erwartungswert, Varianz, Standardabweichung

VERGLEICH VON TESTVERFAHREN FÜR DIE DEFORMATIONSANALYSE

20 Ordinale Regression

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

5 Gemischte Verallgemeinerte Lineare Modelle

Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert:

5 Modell-Entwicklung. 5.1 Problemstellung

Anhang 9. Bias in ökologischen Studien bei nichtlinearen Risikomodellen

Bestimmung der Elementarladung nach Millikan. 1. Theorie zum Versuchs. F R = 6 $ $ $ r $ v. $ g. F s = 4 3 $ $ r 3 $ Öl.

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

22. Vorlesung Sommersemester

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Theoretische Physik 2 (Theoretische Mechanik)

Masterprüfung SS 2017

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Rückblick Regression II: Anpassung an Polynome

Block Nr.1, Thema Nr. 3. Regressionsanalyse

3.3 Lineare Abbildungen und Matrizen

Numerische Methoden II

Determinanten - I. den i-ten Zeilenvektor der n n-matrix A bezeichnet.

Beschreibung von Vorgängen durch Funktionen

Kapitel V. Parameter der Verteilungen

Ihnen liegen Beobachtungen aus dem Current Population Survey aus dem Jahr 1988 vor. Unter anderem sind folgende Variablen enthalten:

Lineare Optimierung Einführung

Kapitel 2: Klassifikation. Maschinelles Lernen und Neural Computation

Item-response Theorie (Probablistiche Testtheorie) Grundidee der item-response Theorie ist, dass die Antworten auf die Testitems lediglich

U Test (Rangsummentest) Parameterfreie Tests. U -Test. U -Test. χ ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Transkript:

Mehrfachregresson: Enfluss mehrerer Merkmale auf en metrsches Merkmal Desgnmatrx Bestmmthetsmaß F-Test T-Test für enzelne Regressoren

Mehrfachregresson Bvarat: x b b y + = 0 ˆ k k x b x b x b b y + + + + = l 0 ˆ Multvarat: Zugehörges Modell: Annahme: Störterme snd unabhängg und k k x x x y ε β β β β + + + + + = 0 ) (0, ~ σ ε ε N Matrxschrebwese: y = X b X Desgn-Matrx

Umsatz n verschedenen Flalen Zwegstelle Umsatz Ausbldung Erfahrung 9,5 3 4 5,79 7 3 4,75 4 7 4 3,0 3 6 5 3,9 0 6 4,77 7 0,83 3 6 8 0,5 0 Buch Bespel (S. 0)

Berechnung der Koeffzenten b We m bvaraten Fall bestmmt man b 0,b,,b n so, daß de Quadratsumme der Resduen am klensten st. = = = = n n e y y SQR ) ˆ ( st zu mnmeren! d.h. Löse Mnmerungsproblems mt Normalglechungen: y b = T T X X X ( ) y b = T T X X X Multplkaton mt (X T X) - lefert:

Berechne Koeffzenten b (Bsp. ) Löse Normalglechungen durch Matrxnverson: Im Prnzp hab ch nun alles um b zu berechnen Praktsch nemand löst dese Glechung per Hand! Softwarepakete we z. Bsp. SPSS und somt Regressonsfunkton y =.56 +.0 x + 0.655 x

Interpretaton des Resultats (Bsp. ) Regressonsfunkton: y =.56 +.0 x + 0.655 x Be enem Leter ohne Berufserfahrung und mt Ausbldungsgrad 0 erwartet man enen Umsatz von b 0 =.56 Mo Euro Mt jedem Jahr an Berufserfahrung stegt der Umsatz um b =.0 Mo Euro Für enen Leter mt 4 Jahren Berufserfahrung und Ausbldungsgrad 3 erwartet man sch enen Umsatz von b 0 +4b +3b =.569 Mo Euro

Multples Bestmmthetsmaß Analog zum bvaraten Fall: r SQE = = SQT SQR SQT Gesamtquadratsumme: Erklärte Quadratsumme: SQT n n ( y y) = y ny = = = SQE = n = ( yˆ y) Ncht erklärte Quadratsumme: SQR = n = ( y yˆ ) = n = e Varanzzerlegungsegenschaft: SQT = SQE + SQR

Der F-Test Test ob wengstens en Regressor enen Enfluß auf de Response Varable hat H 0 : b = b = = b k = 0, H : b 0 für mndestens enen Regressor Teststatstk: f = ( n k ) r k ( r ) folgt ener F-Vertelung (Sehe Buch S. 07) k und n-k- snd de sogenannten Frehetsgrade

Tests für enzelne Regressoren Teststatstk weder von der Form T = b s b Wobe b das -te Dagonalelement von und s n = e e n k = V ( t ) : = s X X e Getestete Hypothese: H0:b = 0, H: b 0 Entschedung für H falls T α ( ) Entsprechende Konfdenzntervalle für de Regressoren (S.) ( ) > Q t n k

Vorhersagen Mttels Mehrfachregresson Wetgehend analog zur Enfachregresson! Prognose für den Mttelwert: Welchen Wert nmmt y an ener Stelle x m Mttel an? Indvduelle Prognose: Welchen Wert nmmt ene neue ndvduelle Beobachtung von y an ener Stelle x an? Untersched legt ncht m Schätzer, sondern n der Genaugket des Schätzers KonfdenzntervalleBuch S.4

Dummy Varablen Dchotomer Faktor wrd mt 0 und codert Zum Bespel : Geschlecht (männlch, weblch) Raucher (ja, nen) Wrd m Modell genau so behandelt we ene metrsche Varable (Vergleche später das Kaptel über Varanzanalyse)

Bespel Gebrauchtwagen Vergleche de Unterlagen von Nagel: 00 Gebrauchtwagen, deren Pres, gefahrene Melen sowe Anzahl der Servces bekannt Frage: We hängt der Pres von desen beden Varablen ab? Multvarate Regresson ˆ = + + y b0 b x b x

Bespel Gebrauchtwagen: Ausgabe Bestmmthetsmaß Modell Modellzusammenfassung Standardf Korrgertes ehler des R R-Quadrat R-Quadrat Schätzers,987 a,974,974 4,48 a. Enflußvarablen : (Konstante), SERVICE, MILES Vergleche dazu Regresson mt nur enem Faktor Modell Modellzusammenfassung Standardf Korrgertes ehler des R R-Quadrat R-Quadrat Schätzers,806 a,650,647 5,57 a. Enflußvarablen : (Konstante), MILES

Bespel Gebrauchtwagen: Ausgabe Tabelle für F-Test (we m Buch S. 08) Modell Regresson Resduen Gesamt ANOVA b Quadrats Mttel der umme df Quadrate F Sgnfkanz 667999 333999,3 8,530,000 a 6689,5 97 70,53 6434890 99 a. Enflußvarablen : (Konstante), SERVICE, MILES b. Abhängge Varable: PRICE Mttel der Quadrate = Summe der Quadrate/Frehetsgrade F = 333999,3/70,53

Bespel Gebrauchtwagen: Ausgabe 3 Koeffzenten Koeffzenten a Modell (Konstante) MILES SERVICE a. Abhängge Varable: PRICE Regressonsfunkton: Bede Faktoren sgnfkant! Ncht standardserte Koeffzenten Standard serte Koeffzen ten Standardf B ehler Beta T Sgnfkanz 606,8 4,966 48,58,000-3,5E-0,00 -,84-49,788,000 35,837 3,903,569 34,807,000 ˆ y = 606, 0.035 x + 35, 8 x

Bespel Gebrauchtwagen: Graphsch Streudagramme für de enzelnen Faktoren 6000 6000 5800 5800 5600 5600 5400 5400 500 500 5000 5000 PRICE 4800 4600 0000 0000 30000 40000 50000 PRICE 4800 4600-0 3 4 5 6 MILES SERVICE

Zusammenhang zwschen Faktoren Streudagramme zwschen Servce und Melen 50000 40000 30000 Korrelaton R = 0.4 De beden Faktoren snd unabhängg 0000 MILES 0000-0 3 4 5 6 SERVICE

Dummy Varable für Servce Servce nur sehr wenge Ausprägungen ncht wrklch metrsche Varable, Man kann de Varable dchotomseren 0 für weng Servces (0 3) für vele Servces (4 oder 5) Führe Regresson mt Dummy Varable für Vele Servces durch

Bespel Gebrauchtwagen: Dummy Bestmmthetsmaß: Wesentlch klener als 0.974 Modell Modellzusammenfassung Standardf Korrgertes ehler des R R-Quadrat R-Quadrat Schätzers,905 a,89,85 09,70 a. Enflußvarablen : (Konstante), VIELSERV, MILES Koeffzenten: Modell (Konstante) MILES VIELSERV a. Abhängge Varable: PRICE Koeffzenten a Ncht standardserte Koeffzenten Standard serte Koeffzen ten Standardf B ehler Beta T Sgnfkanz 646,065 6,64 04,87,000-3,05E-0,00 -,789-8,39,000 7,3 8,579,4 9,49,000 Wagen mt velen Servce snd m Schntt um 7$ teurer als Wagen mt wengen Servces

Nchtlneare Regresson Bvarat: y = F( x ) ˆ Multvarat: yˆ = F( x, x, h, x k ) In deser Allgemenhet extrem vele Möglchketen! Nchtlneare Modelle mest wesentlch komplzerter zu berechnen als lneare Modell Auch Interpretaton oft schwerger, hlfrech wenn nchtlneares Modell auf Annahmen beruht, de durch de Problemstellung motvert werden können

Bespele für nchtlneare Regresson Regresson mt quadratschen Terme: yˆ = b 0 + b x + b x Wrd häufg verwendet, wenn lneare Regresson ncht gut funktonert (mehr Frehetsgrade, Modell noch ncht so komplzert) x Vorgangswese: Betrachte als zweten unabhänggen Faktor und führe ene lneare Mehrfachregresson durch

Bespel 7-9 Quadratsche Regresson 50 ERTRAG 40 30 0 0 x Beobachtet Lnear 0 0 0 0 30 40 50 60 70 Quadratsch DÜNGER Graphsche Inspekton zegt, dass das quadratsche Modell wohl besser st als das lneare

Bespel 7-9 Fortsetzung Lneares Modell (Enfachregresson) Modell Modellzusammenfassung Standardf Korrgertes ehler des R R-Quadrat R-Quadrat Schätzers,806 a,650,63 6,8378 a. Enflußvarablen : (Konstante), DÜNGER Modell (Konstante) DÜNGER a. Abhängge Varable: ERTRAG Koeffzenten a Ncht standardserte Koeffzenten Standard serte Koeffzen ten Standardf B ehler Beta T Sgnfkanz 6,39 3,75 4,353,00,486,099,806 4,96,000

Bespel 7-9 Fortsetzung Mehrfachregresson entsprcht quadratschem Modell (D = Dünger ) Beachte das wesentlch bessere Bestmmthetsmaß! Modell Modell (Konstante) DÜNGER D a. Abhängge Varable: ERTRAG Modellzusammenfassung Standardf Korrgertes ehler des R R-Quadrat R-Quadrat Schätzers,990 a,980,977,6959 a. Enflußvarablen : (Konstante), D, DÜNGER Koeffzenten a Ncht standardserte Koeffzenten Standard serte Koeffzen ten Standardf B ehler Beta T Sgnfkanz -3,07,659 -,85,089,959,07 3,48 8,8,000 -,08E-0,00 -,509-4,9,000

Bespele für nchtlneare Regresson Transformaton der Varablen: ln( yˆ ) = b + b x 0 Wrd typscherwese verwendet, falls de Daten ncht auf enen lnearen Zusammenhang sondern eher auf enen exponentellen Zusammenhang schlessen lassen VORSICHT: Transformaton schaut harmloser aus, als se mathematsch st! Zum Bespel verkomplzert sch de Berechnung von Konfdenzntervallen entschedend!

Bespel 8-3: Cobb-Douglas Produktonsfunkton V t = δ K L β t β t η t V t Wertschöpfung K t Kaptal L t Arbet η t Fehlerterm Logarthmeren der Glechung lefert: ln( Vt ) = β 0 + β ln( Kt ) + β ln( Lt ) + ln( ηt ) ln( η t ) Wobe Mttelwert 0 und konstante Varanz hat.

Überprüfen der Modellvoraussetzung Resduenplots: (Streudagramme zwschen Resduen und Regressoren) Prüfe Konstanz der Resdualvaranzen q-q-plots der Resduen: (Plot der geordneten standardserten Resduen gegen deren Erwartungswert falls N(0,) Prüfe Normalvertelungsannahme

Modellvoraussetzung Bsp. 7-9 Resdualplot: lneares Modell Resdualplot: quadratsches Modell 0 3 0 0 Unstandardzed Resdual -0-0 0 0 0 30 40 50 60 70 Unstandardzed Resdual - - -3-4 0 0 0 30 40 50 60 70 DÜNGER DÜNGER