Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression
|
|
- Jan Falk
- vor 6 Jahren
- Abrufe
Transkript
1 Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Regression Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 39 Einfache lineare Regression Bestimmung der Regressionsgerade Linearer Zusammenhang zwischen zwei metrischen Größen Y, X wird als Gerade visualisiert Finde Gerade Y α + β X β Steigung der Geraden: erhöht sich X um eine Einheit, so erhöht sich Y um β Einheiten. α : Achsenabschnitt, d.h. Wert von Y für X = 0 Welche Gerade ist die Beste? sollte etwa in der Mitte der Punktwolke liegen Abweichungen der Wertepaare (x i, y i ) (Punkte) von der Geraden möglichst klein (minimal) 30 3
2 Methode der kleinsten Quadrate Lineare Einfachregression und Kleinste-Quadrate-Schätzer Seien (x, y ),..., (x n, y n ) Beobachtungen der Merkmale X undy, dann heißt y i = α + βx i + ε i, i =,..., n, Y ist Zielgröße und X Einflussgröße Y soll mit Hilfe von X erklärt oder vorhergesagt werden Lineares Modell Y = α + βx + ε Minimierung der Abstände in Y -Richtung Wähle ˆα und ˆβ so, dass ( y i (ˆα + ˆβx i )) minimal wird lineare Einfachregression, wobei α den Achsenabschnitt (intercept), β die Steigung (slope) und ε den Fehler (Residuum, error, residual) bezeichnet. Die Kleinste-Quadrate-Schätzer für ˆα und ˆβ sind gegeben durch ˆα = ȳ ˆβ x, Die Residuen berechnen sich durch ˆβ = S xy Sx. ε i = y i ŷ i, i =,..., n, 3 mit ŷ i = ˆα + ˆβx i. 33 Beispiel: Nettomiete in Abhängigkeit von der Wohnfläche Beispiel: Nettomiete in Abhängigkeit von der Wohnfläche model_nm <- lm(nm ~ wfl, data = mietspiegel) summary(model_nm)$coef 500 Nettomiete ~ * Wohnfläche Nettomiete [EUR] Wohnfläche [ m ] ## Estimate Std. Error t value Pr(> t ) ## (Intercept) e-5 ## wfl e-3 Interpretation: Mit einer Steigerung der Wohnfläche um m ist durchschnittlich eine Steigerung der Miete um 6.9e verbunden. Nettomiete [EUR] Wohnfläche [ m ] 34 35
3 Standardabweichung des Störterms Streuungs- und Quadratsummenzerlegung Die geschätzte Standardabweichung der y-werte von der geschätzten Geraden ergibt sich zu: Ziel: Erklärung der Streuung von Y durch X s ε = mit ε i = y i ŷ i ε n i Wichtiges intuitives Maß zur Modellanpassung, hier: sqrt(summary(model_nm)$sigma) ## [] 3 (y i ȳ) = (ŷ i ȳ) + (y i ŷ i ) Streuung von Y = Erklärte Streuung + Rest SST = SSM + SSE Quadratsumme = Quadratsumme = Quadratsumme Gesamt Regression Residuen (Total) (Model) (Error) Das Bestimmtheitsmaß R Anteil der durch die lineare Regression auf X erklärten Varianz: R = SSM SST = = (ŷ i ȳ) (y i ȳ) (y i ȳ) (y i ŷ i ) (y i ȳ i ) = (y i ŷ) (y i ȳ) Es gilt: Bestimmtheitsmaß = Quadrat der Bravais-Pearson-Korrelation zwischen X undy : Nachweis von R = r XY ŷ = n ŷ i = n (ˆα + n n ˆβx i ) = ˆα + ˆβ x = (ȳ ˆβ x) + ˆβ x = ȳ Daraus folgt: n n n n (ŷ i ȳ) = (ŷ i ŷ) = (ˆα + ˆβx i ˆα + ˆβ x) = ˆβ (x i x) somit für R : S xy R = Sx Sy = rxy Wichtiges Maß zur Güte der Modellanpassung, hier: summary(model_nm)$r.squared ## [] R = (ŷ i ȳ) (y i ȳ) = ˆβ (x i x) n (y i ȳ) = s XY ( ) s X sxy (sx ) sy = = rxy s X s Y 39
4 Umkehrregression Umkehrregression Vertauscht man die Rollen von X und Y, so erhält man die Umkehrregression. Daten(X i, Y i ), i =,..., n Regression: Y = α + βx β = S XY S X Umkehrregression: X = γ + δy δ = S XY S Y Im XY -Koordinatensystem hat die Gerade der Umkehrregression die Darstellung Es gilt: β δ = S XY S X S Y = r β δ, also Gerade der Umkehrregression steiler β δ 0, also β undδ haben gleiches Vorzeichen Y = γ δ + δ X Beispiel: Umkehrregression Orthogonale Regression 500 also: wfl ~ * nm nm ~ * wfl Falls man die orthogonalen quadratischen Abstände zur Gerade minimiert, erhält man eine Gerade zwischen Regression und Umkehrregression. Löse Minimierungsproblem in α, β: Nettomiete [EUR] 000 (α ORR, β ORR ) = arg min α,β n (y i α βx i ) + β }{{ } Orthog. Abstand model_nm: nm ~ * wfl Wohnfläche [ m ] ˆβ ORR = S XY ˆα ORR = ȳ ˆβ ORR x [ ] (SY SX ) + 4S XY + (SY SX )
5 Wichtige Eigenschaften der linearen Regression Partielle Korrelation Asymmetrie: Regressionsgerade von Y auf X verschieden von Regressionsgerade von X auf Y Die Regressionsgerade geht durch ( x, ȳ) Interpretation der Steigung b steht im Mittelpunkt der Interpretation R -Wert gibt den Varianz-Erklärungsanteil wieder R ist Quadrat der Korrelation zwischen X und Y s ε gibt durchschnittliche Abweichung der Werte von der Regressionsgeraden an Ziel: Bestimmung der Korrelation zweier Merkmale unter konstant halten eines dritten Merkmals (auch: kontrollieren für ein drittes Merkmal). Beispiel: Korrelation der Quadratmetermiete und der Wohnfläche bei konstanter Zimmerzahl Idee: Herausrechnen des Zusammenhangs mit dem dritten Merkmal durch lineare Regression auf letzteres Partieller Korrelationskoeffizient (Definition) Partieller Korrelationskoeffizient: Es sei: X = ˆx + E = a + bz + E Y = ŷ + F = c + dz + F Es gilt: (also: Residuen E bzw F ) r XY Z = r XY r XZ r YZ r XZ r YZ Dann heißt die Maßzahl r XY Z = r EF partieller Korrelationskoeffizient zwischen X und Y unter Z (auch adjustiert/kontrolliert für Z )
6 Beispiel: (Partielle) Korrelation der Quadratmetermiete und der Wohnfläche Beispiel: (Partielle) Korrelation der Quadratmetermiete und der Wohnfläche Quadratmetermiete [EUR/ m ] Wohnfläche [ m ] Quadratmetermiete [EUR/ m ] Zimmerzahl (marginal_correlations <- cor(mietspiegel[, c("nmqm", "wfl", "rooms")])) ## nmqm wfl rooms ## nmqm ## wfl ## rooms nmqm_residuals <- resid(lm(nmqm ~ rooms, data = mietspiegel)) wfl_residuals <- resid(lm(wfl ~ rooms, data = mietspiegel)) (partial_correlation <- cor(nmqm_residuals, wfl_residuals)) 6 5 ## [] Zimmerzahl 4 3 Marginale Korrelation zwischen Quadratmetermiete (nmqm) und Wohnfläche (wfl): r nmqm,wfl Wohnfläche [ m ] Partielle Korrelation zwischen Quadratmetermiete (nmqm) und Wohnfläche (wfl) adjustiert für Wohnfläche: r nmqm,wfl rooms Beispiel: (Partielle) Korrelation der Quadratmetermiete und der Wohnfläche Beispiel: (Partielle) Korrelation Zimmer Zimmer 3 Zimmer 4 Zimmer 5 Zimmer 6 Zimmer r XY = 0. 0 Quadratmetermiete [EUR/ m ] 5 0 Y Wohnfläche [ m ] X
7 Beispiel: (Partielle) Korrelation Beispiel: (Partielle) Korrelation r XY = 0. r XY Gruppe = 0.77 Gruppe Gruppe Y Y X X Multiples Regressionsmodell Beispiel: Quadratmetermiete Gegeben sind ein Zielmerkmal Y und die Einflussgrößen X k Quadratmetermiete = a + b Zimmerzahl +b Baujahr +b 3 Zentralheizung +ε y = a + b x + b x b p x p + ε multiple_m_nmqm <- lm(nmqm ~ rooms + bj + zh0, data = mietspiegel) summary(multiple_m_nmqm) Das Modell kann aus den entsprechenden Daten mit Hilfe der KQ-Methode geschätzt werden. Analog zum linearen Modell ist das Bestimmtheitsmaß r ein zentrales Kriterium für die Modellanpassung. Die Parameter b k haben folgende Interpretation: Steigt das Merkmal X k um eine Einheit und bleiben die anderen konstant ( ceteris paribus-bedingung ), so verändert sich Y im Durchschnitt um b k Einheiten. Zielmerkmal auch: response, outcome, target, abhängige Variable; Einflussgrößen auch: Prädiktoren, Kovariablen, features, inputs, unabhängige Variablen. 344 ## ## Call: ## lm(formula = nmqm ~ rooms + bj + zh0, data = mietspiegel) ## ## Residuals: ## Min Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error t value Pr(> t ) ## (Intercept) e-08 *** ## rooms < e-6 *** ## bj e-6 *** ## zh < e-6 *** ## --- ## Signif. codes: 0 '***' 0.00 '**' 0.0 '*' 0.05 '.' 0. ' ' ## ## Residual standard error:. on 049 degrees of freedom ## Multiple R-squared: 0.85, Adjusted R-squared: 0.84 ## F-statistic: 55 on 3 and 049 DF, p-value: <e-6 345
8 Beispiel: Quadratmetermiete Beispiel: Quadratmetermiete Abbildung : 346 Abbildung : 347 Zusammenfassung multiples Regressionsmodell Erweiterungen Das multiple Regressionsmodell ist nützlich, um Zusammenhänge zwischen Merkmalen zu analysieren. Es ermöglicht: Quantifizierung des Zusammenhangs Herausrechnen von Störgrößen Auswahl von relevanten Einflussgrößen Erweiterungen des Modells beinhalten: Nichtlineare Zusammenhänge: y = a + f (x ) + f (x ) + + ε nominale/ordinale Merkmale als Einflussgrößen (z.b. Stadtbezirk, Geschlecht, Nationalität, etc.) Einbeziehung von Interaktionseffekten (z.b. geschlechterspezifische Effekte) Binäre Zielgrößen (krank/gesund), ordinale Zielgrößen, etc
9 Beispiel: Räumliches additives Mietspiegelmodell Beispiel: Räumliches additives Mietspiegelmodell Year of Construction Floorspace Begin of Tenancy Effect of Subquarter 80% credible intervals η Year η Floorspace [m ] η Year Quadratmetermiete = a + f(baujahr) + f(wohnfläche) + f(bezugsdatum) + f(stadtbezirk) + + ε Quadratmetermiete = a + f(baujahr) + f(wohnfläche) + f(bezugsdatum) + f(stadtbezirk) + + ε Nichtlineare Regressionsmodelle Beispiel: Michaelis-Menten-Modell Beispiel: Michaelis-Menten-Modell zur Beschreibung von chemischen Reaktionsraten bei Konzentration x mit Obergrenze β und Rate β. Nichtlinearer Zusammenhang zwischen X und Y, β kann Vektor sein. KQ- Schätzer aus DatenY i, X i : ˆβ := arg min β Y = f (X, β) + ε n (y i f (x i, β)) Lösung meist nicht analytisch, nur numerisch möglich, z.b. mit Paket nls in R. f(x) β y = β x /β + x + ε x 35 rotes β > schwarzes β > blaues β 353
10 Beispiel: Logistisches Wachstumsmodell Beispiel: Logistisches Modell zur Beschreibung von limitierten Wachstumsprozessen mit Obergrenze β, Wendepunkt β und Rate β 3 y = β + exp((β x)β 3 ) + ε f(x) β β x rotes β 3 > schwarzes β 3 > blaues β 3 354
Lineare Modelle in R: Klassische lineare Regression
Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)
Mehr1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:
Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60
MehrDeskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j
1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b
MehrTutorial: Regression Output von R
Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrKorrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrStatistik Einführung // Lineare Regression 9 p.2/72
Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression
MehrFormelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade
Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de
MehrBreusch-Pagan-Test I auf Heteroskedastie in den Störgrößen
4 Multiple lineare Regression Tests auf Heteroskedastie 4.11 Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen Ein weiterer Test auf Heteroskedastie in den Störgrößen ist der Breusch-Pagan-Test.
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
Mehr3. Das einfache lineare Regressionsmodell
3. Das einfache lineare Regressionsmodell Ökonometrie: (I) Anwendung statistischer Methoden in der empirischen Forschung in den Wirtschaftswissenschaften Konfrontation ökonomischer Theorien mit Fakten
MehrEine Einführung in R: Das Lineare Modell
Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrVorlesung 8a. Kovarianz und Korrelation
Vorlesung 8a Kovarianz und Korrelation 1 Wir erinnern an die Definition der Kovarianz Für reellwertige Zufallsvariable X, Y mit E[X 2 ] < und E[Y 2 ] < ist Cov[X, Y ] := E [ (X EX)(Y EY ) ] Insbesondere
MehrRegressionsanalyse in R
Regressionsanalyse in R Session 6 1 Einfache Regression Lineare Regression ist eines der nützlichsten Werkzeuge in der Statistik. Regressionsanalyse erlaubt es Zusammenhänge zwischen Parametern zu schätzen
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrKapitel 4: Binäre Regression
Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,
MehrÜbungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg
Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten
MehrWiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung
Regression II Statistik I Sommersemester 2009 Statistik I Regression II (1/33) R 2 Root Mean Squared Error Statistik I Regression II (2/33) Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2
MehrLineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)
Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff
Mehr2.Tutorium Generalisierte Regression
2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte
MehrKlausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik
Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:
MehrEinführung in die multiple Regression
Einführung in die multiple Regression Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@fh-heidelberg.de Bachelor S. Garbade (SRH Heidelberg) Multiple Regression Bachelor
Mehr10. Übung (Korrelation und lineare Regressionsanalyse)
10. Übung (Korrelation und lineare Regressionsanalyse) Es wird untersucht, ob ein linearer Zusammenhang zwischen zwei Variablen besteht. Mit anderen Worten: ob ein solcher Zusammenhang gibt, wenn der beobachteter
MehrVersuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann
Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................
MehrMathematik III - Statistik für MT(Master)
3. Regressionsanalyse Fachbereich Grundlagenwissenschaften Prof. Dr. Viola Weiß Wintersemester 0/03 Mathematik III - Statistik für MTMaster 3. Empirische Regressionsgerade Optimalitätskriterium: Die Summe
Mehr6.1 Grundbegriffe und historischer Hintergrund
Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrModerne Methodik bei der Analyse von Mietspiegeln
Moderne Methodik bei der Analyse von Mietspiegeln Dr. Susanne Meßler, omnistat gmbh 13. Oktober 2010 Inhalt Definition und Bedeutung eines Mietspiegels Datengrundlage Deskriptiver Überblick Einfachregression
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrStatistische Eigenschaften der OLS-Schätzer, Residuen,
Statistische Eigenschaften der OLS-Schätzer, Residuen, Bestimmtheitsmaß Stichwörter: Interpretation des OLS-Schätzers Momente des OLS-Schätzers Gauss-Markov Theorem Residuen Schätzung von σ 2 Bestimmtheitsmaß
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrGlossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale
Glossar Statistik 2 Bivariate Verfahren: zwei nummerische Merkmale Streudiagramm - Datenpaare (X, Y) als Punkte auf einem zweidimensionale Diagramm (Ordinate: Y, Abszisse: X) Lineare Regression - Optimierungsproblem
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrVorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13
Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Grundidee: Eine abhängige Variable soll als Linearkombination mehrerer unabhängiger
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrStatistik für Biologen 1. Fachsemester Mono-Bachelor
1. Fachsemester Mono-Bachelor Prof. Dr. Britta Tietjen Wintersemester 2012/2013 Termin Vorlesung: Montags, 10:15-11:00 Uhr Termine Tutorien: Donnerstags/Freitags Botanisches Museum Königin-Luise-Str. 6-8,
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
Mehr2.3 Nichtlineare Regressionsfunktion
Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren
MehrCrashkurs Einführung Biostatistik
Crashkurs Einführung Biostatistik Prof. Burkhardt Seifert Abteilung Biostatistik, ISPM Universität Zürich Deskriptive Statistik Wahrscheinlichkeitsrechnung, ersuchsplanung Statistische Inferenz Prinzip
MehrÜbungsblatt 7: Schätzung eines Mietspiegels
Prof. Bernd Fitzenberger, Ph.D. Ute Leuschner Stefanie Schäfer Übung zur Veranstaltung Empirische Wirtschaftsforschung Albert-Ludwigs-Universität Freiburg Wintersemester 2010/11 Übungsblatt 7: Schätzung
Mehr5.4.2 Kovarianz und Korrelation
102 5.4. Zusammenhangsanalyse bivariater quasi-stetiger Merkmale 5.4.2 Kovarianz und Korrelation Wie misst man den Zusammenhang zwischen metrischen Merkmalen? Betrachte den Mittelpunkt der Daten ( x, ȳ)
MehrLineare Regression mit einem Regressor: Einführung
Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,
MehrRegression mit Faktoren, Interaktionen und transformierten Variablen
Kap. 5: Regression mit Faktoren, Interaktionen und transformierten Variablen Motivation Regressionen mit transformierten Variablen Ausblick: Nichtlineare Regression Mehr zu Regressionen mit qualitativen
MehrMathematik in den Life Siences
Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart Inhaltsverzeichnis
MehrInstitut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004
Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Aufgabe 1 U t bedeute weißes Rauschen und B den Backshift
MehrLineare Regression. Abbildung 1: Streudiagramm Größe/Gewicht und beste Gerade.
Lineare Regression 1 Lineare Regression Gegeben seien Paare von Messdaten (x i, y i ), i = 1,..., n, geometrisch eine Punktwolke in der Ebene. Dabei können die x i und y i durchaus mehrfach auftreten,
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Preismesszahl: Misst Preisveränderung eines einzelnen Gutes: Preis zum Zeitpunkt
Mehr4. Das multiple lineare Regressionsmodell
4. Das multiple lineare Regressionsmodell Bisher: 1 endogene Variable y wurde zurückgeführt auf 1 exogene Variable x (einfaches lineares Regressionsmodell) Jetzt: Endogenes y wird regressiert auf mehrere
MehrWeitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression
Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen
Mehr6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale
6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale 6.1 Korrelationsanalyse 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig
MehrLineare Modelle in R: Einweg-Varianzanalyse
Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der
MehrEntschädigungen von Stiftungsräten
Bachelor Thesis Herbst 2013 Entschädigungen von Stiftungsräten Philippe Sigrist Blerim Gafuri Prof. Dr. Erhard Lüthi Baden, 19.12.2013 Entschädigungen von Stiftungsräten Autoren Philippe Sigrist Email:
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrStatistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.
Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },
MehrRegression I. Statistik I. Sommersemester Lineare Regression Zusammenhang und Modell Ein Beispiel: Armut und Gewaltverbrechen Zusammenfassung
Sommersemester 2009 Ein Beispiel: Armut und Gewaltverbrechen Rechtswahl 15 10 5 0 5 10 Arbeitslosigkeit Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2 Was ist ein Zusammenhang? Gemeinsame
MehrStatistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage
Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung
MehrPrüfungsleistung Quantitative Methoden II, WS10/11
Universität Hamburg Fachbereich Psychologie 46-02.020 Seminar: Datenanalyse, A Seminarleiter: Ingmar Böschen Wintersemester 2010/ 2011 13.03.11 Prüfungsleistung Quantitative Methoden II, WS10/11 Rick Bode
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Methodenlehre Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-06 Dr. Malte Persike persike@uni-mainz.de
MehrBeipiele zum Üben und Wiederholen Wirtschaftsstatistik 2 (Kurs 3) Lösungen
Beipiele zum Üben und Wiederholen Wirtschaftsstatistik 2 (Kurs 3) Lösungen 1.1 (Das Beispiel 1.1 entspricht dem Beispiel 7.1 aus dem Buch Brannath/Futschik/Krall) a) Streudiagramm mit Regressionsgerade.
MehrLösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die
Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:
MehrCharakterisierung der Daten: Sind es genug? Sind alle notwendig? Was ist naturgegeben, was von Menschen beeinflusst (beeinflussbar)?
3 Beschreibende Statistik 3.1. Daten, Datentypen, Skalen Daten Datum, Daten (data) das Gegebene Fragen über Daten Datenerhebung: Was wurde gemessen, erfragt? Warum? Wie wurden die Daten erhalten? Versuchsplanung:
MehrKapitel 1 Beschreibende Statistik
Beispiel 1.25: fiktive Aktienkurse Zeitpunkt i 0 1 2 Aktienkurs x i 100 160 100 Frage: Wie hoch ist die durchschnittliche Wachstumsrate? Dr. Karsten Webel 53 Beispiel 1.25: fiktive Aktienkurse (Fortsetzung)
Mehr9.3 Lineare Regression
9.3 Lineare Regression 115 A B C D E F G H 1 2 Pearsonscher Korrelationskoeffizient 3 4 5 6 x-werte y-werte ANALYSE ASSISTENT 7 2,4-4 8 3,2-1 9 8,3 6,4 Spalte 1 Spalte 2 10 6,4 6 Spalte 1 1 11 7,2 6,3
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrANalysis Of VAriance (ANOVA) 2/2
ANalysis Of VAriance (ANOVA) 2/2 Markus Kalisch 22.10.2014 1 Wdh: ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor X). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich
Mehr5. Zeitreihenanalyse und Prognoseverfahren
5. Zeitreihenanalyse und Prognoseverfahren Stichwörter: Trend, Saisonalität, Noise, additives Modell, multiplikatives Modell, Trendfunktion, Autokorrelationsfunktion, Korrelogramm, Prognosehorizont, Prognoseintervall,
MehrTEIL 13: DIE EINFACHE LINEARE REGRESSION
TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen
Mehr6 Korrelation und Regression
W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 1 6 Korrelation und Regression Aufgabe 6.1 (Beispiel 6.1, Produktmomentkorrelation): In einer Studie wurden u.a. die Serumkonzentrationen X
MehrStatistischer Rückschluss und Testen von Hypothesen
Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse
MehrKontingenztabelle: Führerschein Ja Nein Ja Nein Auto. Wie viel Prozent der Studierenden besitzen kein Auto?
Aufgabe 1: Eine (nicht repräsentative) Umfrage unter 200 Studierenden auf dem Campus der Ruhr-Universität ergab: 130 Studierende besitzen ein Auto, 160 einen Führerschein und 128 sowohl Auto als auch Führerschein.
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 31. Mai 2011 4. Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der
MehrLösung zu Kapitel 11: Beispiel 1
Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten
MehrMehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh
Mehrebenenanalyse Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Inhalt } Einführung } Fragestellung } Das Programm HLM } Mögliche Modelle } Nullmodell } Random
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2012/13. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2012/13 Aufgabe 1 Die Firma
MehrName (in Druckbuchstaben): Matrikelnummer: Unterschrift:
20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie
MehrI. Deskriptive Statistik 1
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................
MehrAnalyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen
Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
MehrKap. 8: Regression mit Paneldaten
Kap. 8: Regression mit Paneldaten Einführung Paneldaten für zwei Perioden Regression mit festen Effekten bzgl. Individuen Regression mit festen Effekten bzgl. Zeit Annahmen in der Paneldatenanalyse Empirisches
MehrLogistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios
Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)
MehrGedichtinterpretation und Modellbildung
Gadamers philosophische Hermeneutik angewandt auf die Statistik Seminar Wissenschaftstheorie für Statistiker bei PD Dr. Rudolf Seising, Prof. Dr. Thomas Augustin Gadamers philosophische Hermeneutik angewandt
MehrStatistische Methoden in der Wirtschaftsund Sozialgeographie
Statistische Methoden in der Wirtschaftsund Sozialgeographie Ort: Zeit: Multimediapool Rechenzentrum Mittwoch 10.15-11-45 Uhr Material: http://www.geomodellierung.de Thema: Beschreibung und Analyse Wirtschafts-
MehrErgänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
MehrFormale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung
Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 1 Maßzahlen für den Zusammenhang zwischen Merkmalen Kontingenztabelle:
MehrGemischte Modelle zur Schätzung geoadditiver Regressionsmodelle
Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle Thomas Kneib & Ludwig Fahrmeir Institut für Statistik, Ludwig-Maximilians-Universität München 1. Regressionsmodelle für geoadditive Daten
MehrKapitel 4: Merkmalszusammenhänge
Kapitel 4: Merkmalszusammenhänge Streudiagramme SPSS bietet die Möglichkeit, verschiedene Arten von Streudiagrammen zu zeichnen. Gehen Sie auf Grafiken Streu-/Punkt-Diagramm und wählen Sie die Option Einfaches
MehrDie Steigung m ist ein Quotient zweier Differenzen und heißt daher Differenzenquotient.
Seite Definition lineare Funktion Eine Funktion f mit dem Funktionsterm f(x) = m x + b, also der Funktionsgleichung y = m x + b, heißt lineare Funktion. Ihr Graph G f ist eine Gerade mit der Steigung m
MehrÜberblick über multivariate Verfahren in der Statistik/Datenanalyse
Überblick über multivariate Verfahren in der Statistik/Datenanalyse Die Klassifikation multivariater Verfahren ist nach verschiedenen Gesichtspunkten möglich: Klassifikation nach der Zahl der Art (Skalenniveau)
MehrKorrelation und Regression
FB 1 W. Ludwig-Mayerhofer und 1 und FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren
Mehr