Statistik Einführung // Lineare Regression 9 p.2/72

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Statistik Einführung // Lineare Regression 9 p.2/72"

Transkript

1 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression 9 p.0/72 Lernziele 1. Beschreiben lineares Regressionsmodell. 2. Geben die einzelnen Modellierungsschritte an. 3. Erklären die (gewöhnliche) Methode der kleinsten Quadrate, (gewöhnliche Kleinste-Quadrate-Methode). 4. Berechnen Regressionskoeffizienten. 5. Prognostizieren die Antwort -Variable. Sie wird auch als Repsonse -, abhängige, zu erklärende Variable, oder Regressand bezeichnet. 6. Interpretieren einen Computerausdruck. Statistik Einführung // Lineare Regression 9 p.1/72 Modelle Statistik Einführung // Lineare Regression 9 p.2/72

2 1. Die Repräsentation einer Auswahl von Phänomenen. 2. Ein quantitatives Modell ist eine formale (mathematische) Darstellung einer Auswahl von Phänomenen. 3. Es beschreibt oft Zusammenhänge zwischen Variablen. 4. Tpen von Modellen: Deterministische Modelle Stochastische Modelle Statistik Einführung // Lineare Regression 9 p.3/72 Deterministische Modelle 1. Formulieren Hpothesen über eakte Zusammenhänge. 2. Sind geeignet, wenn der Prognosefehler vernachlässigbar ist. Beispiele: Kraft = Masse Beschleunigung F m a Energie = Masse Lichtgeschwindigkeit 2 E m c 2 Statistik Einführung // Lineare Regression 9 p.4/72 Stochastische Modelle 1. Formulieren Hpothesen über 2 Komponenten Deterministische Komponente Zufälligen Fehler 2. Beispiel: Das Verkaufsvolumen, Y, ist 10 mal so groß wie die Werbeausgaben, X, plus einem zufälligen Fehler, ɛ. Y 10 X ɛ Der zufällige Fehler, ɛ, wird durch Faktoren bestimmt, die nicht durch die Werbeausgaben beeinflusst werden: Wetter, Konkurrenzangebote, Konjunkturzklus, Änderungen im Distributionsnetz, Kunde Maer hat im Lotto gewonnen,.... Statistik Einführung // Lineare Regression 9 p.5/72

3 Stochastische Modelle Andere Modelle Statistik Einführung // Lineare Regression 9 p.6/72 Regressionsmodelle Statistik Einführung // Lineare Regression 9 p.7/72 Tpen von stochastischen Modellen Stochastische Modelle Regressionsmodelle Korrelationsmodelle Regressionsmodelle Korrelationsmodelle Andere Modelle Statistik Einführung // Lineare Regression 9 p.8/72

4 1. Beantworten die Frage: Wie sieht der Zusammenhang zwischen Variablen aus? 2. Die Gleichung besteht aus: Eine numerische, abhängige (Response-) Variable, Y. Was soll erklärt (prognostiziert) werden? Eine oder mehrere numerische oder kategoriale, unabhängige (erklärende) Variable, X 1, X 2,.... Was hilft Y zu erklären (prognostizieren)? 3. Hauptsächlich verwendet für: Schätzen und Testen: Gibt es einen Zusammenhg. zwischen den Variablen? Wie stark ist der Zusammenhang? Prognose Statistik Einführung // Lineare Regression 9 p.9/72 Regression // Modellierungsschritte 1. Hpothese über die deterministische Komponente. 2. Schätzen die unbekannten Parameter im Modell. 3. Spezifizieren die Wahrscheinlichkeitsverteilung des Fehlerterms. Schätzen die Standardabweichung des Fehlers. 4. Überprüfen das Modell. 5. Verwenden das Modell für die Prognose. Statistik Einführung // Lineare Regression 9 p.10/72 Modellspezifikation Statistik Einführung // Lineare Regression 9 p.11/72

5 Hpothese über die deterministische Komponente. 2. Schätzen die unbekannten Parameter im Modell. 3. Spezifizieren die Wahrscheinlichkeitsverteilung des Fehlerterms. Schätzen die Standardabweichung des Fehlers. 4. Überprüfen das Modell. 5. Verwenden das Modell für die Prognose. Statistik Einführung // Lineare Regression 9 p.12/72 Spezifikation eines Modells 1. Definieren die Variablen, die im Modell aufgenommen werden sollen. Konzeptuell Empirisch z.b., Werbeausgaben, Preis z.b., Listenpreis, tatsächlicher Verkaufspreis Messung c, Einheiten,... ; tägl., monatl., Hpothesen über die Art des Zusammenhangs Erwartete Effekte: Funktionale Form: Interaktionen Größe der Koeffizienten, Vorzeichen linear oder nicht-linear Statistik Einführung // Lineare Regression 9 p.13/72 Modellspezifikation basiert auf Theorie Theorie des Gebiets (Substanzwissenschaften): Verhaltenswissenschaften, Konsumtheorie, Theorie der Firma,.... Mathematische Theorie: Zur Quantifizierung, zur Modellierung von Maimierungsverhalten,.... Vorhergehende Forschung: Z.B., publizierte Arbeiten dazu. Plausibilität, Hausverstand, begründbare Erfahrung. Statistik Einführung // Lineare Regression 9 p.14/72

6 Verkäufe in Stk. positiv linear negativ linear Y a b log X logistische Sättigungsfunktion Werbeausgaben Statistik Einführung // Lineare Regression 9 p.15/72 Tpen von Regressionsmodellen Regressionsmodelle Einfache 1 erklärende Variable Multiple 2+ erklärende Variablen Linear Nichtlinear Linear Nichtlineare Statistik Einführung // Lineare Regression 9 p.16/72 Lineares Regressionsmodell Statistik Einführung // Lineare Regression 9 p.17/72

7 Regressionsmodelle Einfache 1 erklärende Variable Multiple 2+ erklärende Variablen Linear Nichtlinear Linear Nichtlineare Statistik Einführung // Lineare Regression 9 p.18/72 Linearer Zusammenhang a b Veränderung in Veränderung in -Interzept a 0 Steigung b Veränderung in Veränderung in Statistik Einführung // Lineare Regression 9 p.19/72 Lineares Regressionsmodell 1. Der Zusammenhang zwischen den Variablen ist eine lineare Funktion. Interzept in GG Steigung in GG Zufälliger Fehler Y i β 0 β 1 X i ɛ i Abhängige (Response-) Variable Unabhängige (erklärende) Variable Statistik Einführung // Lineare Regression 9 p.20/72

8 Grundgesamtheit Unbekannter Zusammenhang β 0, β 1 unbekannt Y i β 0 β 1 X i ɛ i Stichprobe (Zufallsauswahl) i ˆβ 0 ˆβ 1 i ˆɛ i Statistik Einführung // Lineare Regression 9 p.21/72 Lineares Modell in der Grundgesamtheit 0 ɛ i Y i Datenpunkte der Grundgesamtheit β 0 β 1 X i ɛ i Zufälliger Fehler E Y i X i β 0 β 1 X i Statistik Einführung // Lineare Regression 9 p.22/72 Lineares Modell in der Stichprobe 0 ˆɛ i Beobachtete Werte i ˆβ 0 ˆβ 1 i ˆɛ i Zufälliger Fehler ŷ i ˆβ 0 ˆβ 1 i Nicht in der Stichprobe Statistik Einführung // Lineare Regression 9 p.23/72

9 Schätzung der Parameter: Methode der kleinsten Quadrate Statistik Einführung // Lineare Regression 9 p.24/72 Regression // Modellierungsschritte 1. Hpothese über die deterministische Komponente. Schätzen die unbekannten Parameter im Modell. 3. Spezifizieren die Wahrscheinlichkeitsverteilung des Fehlerterms. Schätzen die Standardabweichung des Fehlers. 4. Überprüfen das Modell. 5. Verwenden das Modell für die Prognose. Statistik Einführung // Lineare Regression 9 p.25/72 Streudiagramm 1. Graphische Darstellung aller Paare i, i. 2. Gibt einen Eindruck über die Anpassungsgüte des Modells. 0 Statistik Einführung // Lineare Regression 9 p.26/72

10 Wie würden Sie eine Gerade durch die Punkte(wolke) legen? Wie bestimmt man die Gerade, die am besten passt? 0 Statistik Einführung // Lineare Regression 9 p.27/72 Methode der kleinsten Quadrate 1. Bester Fit (Beste Anpassung) bedeutet, dass die Differenz zwischen tatsächlichen -Werten und vorhergesagten (modellierten) Werten, ŷ, minimal ist. Aber: positive Differenzen löschen negative aus. Daher wird die quadratische Abweichung verwendet. n i 1 i ŷ i 2 n ɛi 2 i 1 min 2. Die Methode der kleinsten Quadrate minimiert die Summe der quadrierten Differenzen. (Engl.: (ordinar) least squares, (O)LS) Statistik Einführung // Lineare Regression 9 p.28/72 Kleinste-Quadrate (LS) graphisch LS minimiert n ˆɛ i 2 ˆɛ ˆɛ 2 6 i 1 3 ˆβ 0 ˆβ 1 3 ˆɛ 3 0 ˆɛ 1 ˆɛ 2 ˆɛ 3 ˆɛ 4 ˆɛ 5ˆɛ 6 ŷ i ˆβ 0 ˆβ 1 i Statistik Einführung // Lineare Regression 9 p.29/72

11 Vorhersagegleichung ŷ i ˆβ 0 ˆβ 1 i Schätzer für die Steigung ˆβ 1 n i i i i n i 2 i 2 Schätzer für den -Interzept ˆβ 0 ȳ ˆβ 1 Statistik Einführung // Lineare Regression 9 p.30/72 Berechnungstabelle n n 2 n 2 n n n i i 2 i 2 i i i Statistik Einführung // Lineare Regression 9 p.31/72 Interpretation der Koeffizienten 1. Steigung, ˆβ 1 Das geschätzte ändert sich um ˆβ 1, wenn um eine Einheit erhöht wird. Wenn ˆβ 1 2, dann steigen die Verkäufe,, um 2 Einheiten für jede Einheit mehr in den Werbeausgaben,. 2. -Interzept, ˆβ 0 ˆβ 0 ist der durchschnittliche Wert von, wenn 0. Ist ˆβ 0 4, so werden 4 Verkaufseinheiten erwartet, wenn keine Werbeausgaben gemacht werden. Statistik Einführung // Lineare Regression 9 p.32/72

12 Sie sind ein Marketinganalst für Haribo. Sie sammeln folgende Daten: Monat Werbeausgaben Verkäufe (1000 c) (Einheiten) Wie sieht die Beziehung zwischen Verkäufen und Werbeausgaben aus? Statistik Einführung // Lineare Regression 9 p.33/72 Streudiagramm: Werbung vs. Verkäufe Vorhersagegleichung ŷ i ˆβ 0 ˆβ 1 i... Verkäufe... Werbeausgaben in 1000 c 0 Statistik Einführung // Lineare Regression 9 p.34/72 Berechnungstabelle: Beispiel Statistik Einführung // Lineare Regression 9 p.35/72

13 Schätzer für die Steigung ˆβ 1 n i i n 2 i i i i Schätzer für den -Interzept ˆβ 0 ȳ ˆβ Statistik Einführung // Lineare Regression 9 p.36/72 Interpretation der Schätzung Das geschätzte Modell lautet: i ˆβ 0 ˆβ 1 i ˆɛ i bzw. ŷ i i 1. Steigung, ˆβ 1 Das Verkaufsvolumen,, steigt im Durchschnitt um 0.7 Einheiten pro eingesetzte Einheit Werbeausgaben,. 2. -Interzept, ˆβ 0 Das durchschnittliche Verkaufsvolumen ist die Werbeausgaben Null sind. 0.10, wenn (In der Prais erwartet man auch eine geringe Verkaufsmenge, wenn keine Werbung gemacht wird.) Statistik Einführung // Lineare Regression 9 p.37/72 Computer Output // R > =c(1,2,3,4,5) > =c(1,1,2,2,4) > lm( ) Call: lm(formula = ) Coefficients: (Intercept) ˆβ 0 ˆβ 1 Statistik Einführung // Lineare Regression 9 p.38/72

14 Wahrscheinlichkeitsverteilung des Fehlerterms Statistik Einführung // Lineare Regression 9 p.39/72 Regression // Modellierungsschritte 1. Hpothese über die deterministische Komponente. 2. Schätzen die unbekannten Parameter im Modell. Spezifizieren die Wahrscheinlichkeitsverteilung des Fehlerterms. Schätzen die Standardabweichung des Fehlers. 4. Überprüfen das Modell. 5. Verwenden das Modell für die Prognose. Statistik Einführung // Lineare Regression 9 p.40/72 Lineare Regression // Annahmen 1. Das Mittel der Wahrscheinlichkeitsverteilung des Fehlers ist Null. 2. Die Wahrscheinlichkeitsverteilung des Fehlers hat eine konstante Varianz. (Unabhängig von ) 3. Der Fehler ist normalverteilt. 4. Die Fehler sind unabhängig von einander. Statistik Einführung // Lineare Regression 9 p.41/72

15 f ˆɛ 1 2 Statistik Einführung // Lineare Regression 9 p.42/72 Variation im (Zufalls-) Fehler 1. Die Varianz des Fehlers ist die Varianz der Differenz zwischen aktuellem und modelliertem ŷ. 2. Die Variation im Fehler wird gemessen durch die Stichprobenstandardabweichung von ˆɛ, s ɛ. 3. Die Größe der Variation im Fehler beeinflusst: Parametersignifikanz Vorhersagegenauigkeit 4. Die Variation im Fehler steht für die Unsicherheit im Modell. Sie entsteht durch Effekte, die nicht durch das Modell erfasst werden. Statistik Einführung // Lineare Regression 9 p.43/72 Maße für die Variation in der Regression 1. Gesamtsumme der Abweichungsquadrate (in ) Variation der beobachteten -Werte um dessen Mittel ȳ. Dt.: Summe der quadratischen Abweichungen total, SQT. Engl.: Total sum of squares, SS. 2. Erklärte Variation Variation, die durch die Beziehung von und entsteht. Dt.: Erklärte Abweichungsquadratsumme, SQE. Engl.: Sum of squares in the regression, SSR. 3. Unerklärte Variation Variation, die nicht in der Regression erklärt wird. Dt.: Abweichungsquadratsumme der Residuen, SQR. Engl.: Sum of squares in the errors, SSE. Statistik Einführung // Lineare Regression 9 p.44/72

16 Unerklärte Abweichungsquadratsumme i i ŷ i 2 Gesamte Abweichungsquadratsumme i ȳ 2 0 ŷ i ˆβ 0 ˆβ 1 i Erklärte Abweichungsquadratsumme ŷ i ȳ 2 SQ-Gesamt = SQ-Erklärt + SQ-Unerklärt SS SSR SSE i ȳ 2 ŷ i ȳ 2 i ŷ i 2 ȳ Statistik Einführung // Lineare Regression 9 p.45/72 Bestimmtheitsmaß Anteil der Variation, die durch die Beziehung zwischen und erklärt wird. 0 r 2 1 r 2 erklärte Variation gesamte Variation SSR SS ŷ i ȳ 2 i ȳ 2 SQE SQT Eine andere Darstellung: r 2 1 unerklärte Variation gesamte Variation 1 SQR SQT 1 SSE SS 1 i ŷ i 2 i ȳ 2 r 2 1 i 2 ˆβ 0 i ˆβ 1 i i i 2 1 n i 2 Statistik Einführung // Lineare Regression 9 p.46/72 Bestimmtheitsmaß // Beispiele eakter linearer Zusammenhang r 2 1 eakter linearer Zusammenhang r 2 1 kein linearer Zusammenhang r 2 0 schwacher Zusammenhang r Statistik Einführung // Lineare Regression 9 p.47/72

17 Sie sind ein Marketinganalst für Haribo. Sie schätzen ŷ i i wobei... Verkäufe und... Werbeausgaben in 1000 c sind. Die Daten dazu sind: Monat Werbeausgaben Verkäufe (1000 c) (Einheiten) Statistik Einführung // Lineare Regression 9 p.48/72 Berechnungstabelle: Beispiel ŷ i ˆβ 0 ˆβ 1 i i r 2 1 i 2 ˆβ 0 i ˆβ 1 i i i 2 1 n i Wie ist das Bestimmtheitsmaß von r zu interpretieren? Statistik Einführung // Lineare Regression 9 p.49/72 Computer Output // R > summar(lm( )) Call: lm(formula = ) Residuals: r e e e e e-01 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * -- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 3 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 3 DF, p-value: Statistik Einführung // Lineare Regression 9 p.50/72

18 Modellüberprüfung Statistik Einführung // Lineare Regression 9 p.51/72 Regression // Modellierungsschritte 1. Hpothese über die deterministische Komponente. 2. Schätzen die unbekannten Parameter im Modell. 3. Spezifizieren die Wahrscheinlichkeitsverteilung des Fehlerterms. Schätzen die Standardabweichung des Fehlers. Überprüfen das Modell. 5. Verwenden das Modell für die Prognose. Statistik Einführung // Lineare Regression 9 p.52/72 Test des Steigungsparameters 1. ˆβ 1 ist ein Indikator für den linearen Zusammenhang zwischen und. 2. Hängt von der Steigung, β 1, in der Grundgesamtheit (wahrem Modell) ab. 3. Hpothesen H 0 : β 1 0 (Kein linearer Zusammenhang) H A : β 1 0 (Linearer Zusammenhang) 4. Theoretische Basis ist die Stichprobenverteilung der Steigung. Statistik Einführung // Lineare Regression 9 p.53/72

19 0 Stichprobenverteilung S β1 Alle möglichen Stichproben-Steigungen Stichpr Stichpr Stichpr Sehr große Anzahl von Steigungen. β 1 ˆβ 1 Statistik Einführung // Lineare Regression 9 p.54/72 Teststatistik für die Steigung t n 2 ˆβ 1 β 1 s ˆβ 1 wobei s 2ˆβ 1 s 2 ɛ i 2 und s 2 ɛ 1 n 2 ˆɛ 2 i t-verteilung, Freiheitsgrade: ν n 2 Zur Berechnung: s 2 ɛ 1 n 2 ˆɛ 2 i i 2 2 i 1 n 2 2 i 1 n i 2 ˆβ 0 i ˆβ 1 i i Statistik Einführung // Lineare Regression 9 p.55/72 Test auf den Steigungsparameter // Beispiel Sie sind ein Marketinganalst für Haribo. Sie schätzen ŷ i i und s ɛ wobei... Verkäufe und... Werbeausgaben in 1000 c sind. Gibt es eine Beziehung zwischen Werbeausgaben und Verkäufen? Testen Sie bei einem Signifikanzniveau von 10%. Monat Werbeausgaben Verkäufe Statistik Einführung // Lineare Regression 9 p.56/72

20 ŷ i ˆβ 0 ˆβ 1 i i s 2 ɛ 1 n 2 ɛ2 i n 2 2 i ˆβ 0 i ˆβ 1 i i i 2 2 i 1 n i s 2ˆβ 1 t n 2 s 2 ɛ i ˆβ 1 β 1 s ˆβ Statistik Einführung // Lineare Regression 9 p.57/72 Test auf den Steigungsparameter // Lösung H 0 : β 1 0 H A : β 1 0 α 0.10 ν Kritische Werte: Teststatistik: t ˆβ 1 β 1 s ˆβ Entscheidung: H 0 wird abgelehnt. H 0 ablehnen 5% H 0 ablehnen 5% 2.35 X Interpretation: Es gibt Evidenz für eine Beziehung zwischen Werbeausgaben und Verkäufen. Statistik Einführung // Lineare Regression 9 p.58/72 Computer Output // R > summar(lm( )) Call: lm(formula = ) Residuals: e e e e e-01 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) * s ˆβ 1 t ˆβ 1 s ˆβ 1 Statistik Einführung // Lineare Regression 9 p.59/72

21 Verwenden das Modell für die Prognose Statistik Einführung // Lineare Regression 9 p.60/72 Regression // Modellierungsschritte 1. Hpothese über die deterministische Komponente. 2. Schätzen die unbekannten Parameter im Modell. 3. Spezifizieren die Wahrscheinlichkeitsverteilung des Fehlerterms. Schätzen die Standardabweichung des Fehlers. 4. Überprüfen das Modell. Verwenden das Modell für die Prognose. Statistik Einführung // Lineare Regression 9 p.61/72 Prognose mit Regressionsmodellen Arten von Prognosen Punktprognose Intervallprognose Statistik Einführung // Lineare Regression 9 p.62/72

22 Wahres Modell: i β 0 β 1 i ɛ i Geschätztes Modell: ŷ i ˆβ 0 ˆβ 1 i Prognose: ŷ p p ŷ p ˆβ 0 ˆβ 1 p Statistik Einführung // Lineare Regression 9 p.63/72 Punktprognose // Beispiel Marketinganalst bei Haribo (ŷ i i ) 0 ŷ i ˆβ 0 ˆβ 1 i p 3.5 p 6.0 p 3.5 p 6.0 p p Statistik Einführung // Lineare Regression 9 p.64/72 Korrelationsmodelle Statistik Einführung // Lineare Regression 9 p.65/72

23 Stochastische Modelle Regressionsmodelle Korrelationsmodelle Andere Modelle Statistik Einführung // Lineare Regression 9 p.66/72 Korrelationsmodelle 1. Beantworten die Frage: Wie stark ist der lineare Zusammenhang zwischen 2 Variablen? 2. Korrelationskoeffizient Korrelationskoeffizient in der Grundgesamtheit wird als ρ (rho) bezeichnet. Er liegt immer zwischen 1 und 1: 1 ρ 1. Er misst den linearen Zusammenhang. Statistik Einführung // Lineare Regression 9 p.67/72 Stichprobenkorrelationskoeffizient Der Stichprobenkorrelationskoeffizient, r, zwischen und ist der Pearson sche Produktmoment Koeffizient der Korrelation: r Bestimmtheitsmaß aber mit einem Vorzeichen versehen. r i i ȳ i 2 i ȳ 2 Berechnung über die Arbeitstabelle: r 2 i i i n 2 n ȳ 2 i nȳ 2 Statistik Einführung // Lineare Regression 9 p.68/72

24 Perfekte negative Korrelation Keine Korrelation Perfekte positive Korrelation Statistik Einführung // Lineare Regression 9 p.69/72 Korrelationskoeffizient: Beispiele eakter linearer Zusammenhang r 1 kein linearer Zusammenhang r 0 eakter linearer Zusammenhang r 1 schwacher Zusammenhang r 0.56 Statistik Einführung // Lineare Regression 9 p.70/72 Test auf den Korrelationskoeffizienten 1. Wir testen auf einen linearen Zusammenhang zwischen zwei numerischen (quantitativen) Variablen. 2. Das ist das gleiche Problem, wie der Test auf die Steigung in der Grundgesamtheit, β 1, auf Null. 3. Hpothesen H 0 : ρ 0 (Keine Korrelation) H A : ρ 0 (Korrelation) Statistik Einführung // Lineare Regression 9 p.71/72

25 1. Beschrieben lineares Regressionsmodell. 2. Gaben die einzelnen Modellierungsschritte an. 3. Erklärten die (gewöhnliche) Methode der kleinsten Quadrate. 4. Berechneten und testeten Regressionskoeffizienten. 5. Prognostizieren die Antwort -Variable. 6. Interpretieren einen Computerausdruck. 7. Zeigten den Zusammenhang zwischen der Steigung der Regressionsgeraden und dem Korrelationskoeffizienten auf. Statistik Einführung // Lineare Regression 9 p.72/72

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Auswertung und Lösung

Auswertung und Lösung Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

Tutorial: Regression Output von R

Tutorial: Regression Output von R Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen

Mehr

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................

Mehr

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 *** Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Das Lineare Regressionsmodell

Das Lineare Regressionsmodell Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression. Woche 11: Multiple lineare Regression Patric Müller Teil XIII Multiple lineare Regression ETHZ WBL 17/19, 10.07.017 Wahrscheinlichkeit und Statistik Patric Müller WBL

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 1. Aufgabe: Für 25 der größten Flughäfen wurde die Anzahl der abgefertigten Passagiere in den Jahren 2009 und 2012 erfasst. Aus den Daten (Anzahl

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen

Breusch-Pagan-Test I auf Heteroskedastie in den Störgrößen Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.

Mehr

Eine Einführung in R: Varianzanalyse

Eine Einführung in R: Varianzanalyse Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2011 Bernd Klaus, Verena Zuber Das

Mehr

Lineare Modelle in R: Klassische lineare Regression

Lineare Modelle in R: Klassische lineare Regression Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)

Mehr

Empirische Wirtschaftsforschung in R

Empirische Wirtschaftsforschung in R Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre

Mehr

Einführung in die formale Demographie Übung

Einführung in die formale Demographie Übung Einführung in die formale Demographie Übung Roland Rau mailto:roland.rau@uni-rostock.de 03. November 2014 Inhaltsverzeichnis 1 Aufgaben vom 27. Oktober 2014 2 1.1 Schreiben von Funktionen............................

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression

Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Regression Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 39 Einfache lineare Regression Bestimmung der Regressionsgerade

Mehr

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

Lineare Regression in R, Teil 1

Lineare Regression in R, Teil 1 Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Fragen. Einführung in die induktive Statistik. Übersicht. Lineare Einfachregression

Fragen. Einführung in die induktive Statistik. Übersicht. Lineare Einfachregression Fragen Welche Unsicherheitsfaktoren beeinflussen die Schätzung einer Regressionsgeraden? Einführung in die induktive Statistik Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle

Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle Kap. 12: Regression mit Zeitreihendaten und Prognosemodelle Motivation Grundbegriffe Autoregressionen (AR-Modelle) Dynamische Regressionsmodelle (ADL-Modelle) Nichstationarität Ausblick 12.1 Motivation

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

epg = read.table(file.path(pfadu, "epg.txt")) amp = read.table(file.path(pfadu, "dbdauer.txt"))

epg = read.table(file.path(pfadu, epg.txt)) amp = read.table(file.path(pfadu, dbdauer.txt)) Kovarianz, Korrela-on, (lineare) Regression Jonathan Harrington & Ulrich Reubold library(laece) epg = read.table(file.path(pfadu, "epg.txt")) amp = read.table(file.path(pfadu, "dbdauer.txt")) Kovarianz,

Mehr

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.

Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam. Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr in Quantitative Methoden- 2.VO 1/47 Historisches Regression geht auf Galton

Mehr

Eine Einführung in R: Das Lineare Modell

Eine Einführung in R: Das Lineare Modell Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

2.3 Nichtlineare Regressionsfunktion

2.3 Nichtlineare Regressionsfunktion Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren

Mehr

Einleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse

Einleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse Einleitung Statistik Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Der Begriff Varianzanalyse (analysis of variance, ANOVA) taucht an vielen Stellen in der Statistik mit unterschiedlichen

Mehr

Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13

Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13 Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Grundidee: Eine abhängige Variable soll als Linearkombination mehrerer unabhängiger

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht

Mehr

Logistische Regression

Logistische Regression Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum

Mehr

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München Gemischte Modelle Fabian Scheipl, Sonja Greven Institut für Statistik Ludwig-Maximilians-Universität München SoSe 2011 Inhalt Amsterdam-Daten: LMM Amsterdam-Daten: GLMM Blutdruck-Daten Amsterdam-Daten:

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Korrelation und Regression

Korrelation und Regression FB 1 W. Ludwig-Mayerhofer und 1 und FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS)

Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Vorbereitungen Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Falls das R - Paket car noch nicht installiert wurde, kann dies mit der Funktion install.packages() erledigt werden. install.packages("car")

Mehr

Eine Einführung in R: Varianzanalyse

Eine Einführung in R: Varianzanalyse Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 13. Januar 2009 Bernd Klaus, Verena Zuber Das

Mehr

6.1 Grundbegriffe und historischer Hintergrund

6.1 Grundbegriffe und historischer Hintergrund Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS)

Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Es soll untersucht werden, ob und wie sich Rauchen während der Schwangerschaft auf den Gesundheitszustand des Neugeborenen auswirkt. Hierzu werden

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000 INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2 MODUL 13 EINFACHE LINEARE REGRESSION Erziehungswissenschaft/Haider

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr