Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse I: Lineare Regression

Größe: px
Ab Seite anzeigen:

Download "Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse I: Lineare Regression"

Transkript

1 Institut für Soziologie Methoden 2 Regressionsanalyse I: Lineare Regression

2 Inhalt 1. Grundidee und Vorgehen 2. Güte eines Regressionsmodells 3. Regressionskoeffizienten Signifikanz und Interpretation 4. Anwendungsbeispiel 5. Kategoriale Einflussgrößen 6. Zusammenfassung und Kochrezept 7. Übungsaufgaben # 2

3 Grundidee und Vorgehen Vergleich mit bisherigen Verfahren Mit Zusammenhangsanalysen, Mittelwertvergleichen und Varianzanalysen können Hypothesen getestet werden Vorhersagen zu individuellen Werten in der abhängigen Variable auf Basis der unabhängigen Größen können allerdings nicht gemacht werden. Während in bisherigen Verfahren einfacher Korrelationsanalysen die betrachteten Größen größtenteils symmetrisch waren, ist nun eine Unterscheidung in abhängige (AV) und unabhängige Variablen (UV) unabdingbar. # 3

4 Grundidee und Vorgehen Begriff und Skalenniveau Regressieren heißt zurückführen auf : Eine AV wird auf UVs zurückgeführt, sprich: eine AV wird auf UVs regressiert. Dabei ist die Kontrolle auf eine Vielzahl von verschiedenen Einflussgrößen möglich Regression ist in den Sozialwissenschaften das am weitesten verbreitete Analyseverfahren Bivariate lineare OLS-Regression untersucht den Zusammenhang zwischen: einer metrischen AV und einer. metrischen oder dichotomen UV. # 4

5 Grundidee und Vorgehen Keine Kausalanalyse! Trotz der Aufteilung in AV und UV kann mit einer Regressionsanalyse keine Kausalität nachgewiesen werden Theoretische Vorüberlegung unabdingbar Kausalität ist mit statistischen Verfahren alleine nicht nachzuweisen. Kausale Wirkungsvermutungen sollten immer theoretisch fundiert werden dies gilt auch für komplexere statistische Analyseverfahren # 5

6 Grundidee und Vorgehen Beispiele 1. Wie wirkt sich das Einkommen einer Person auf deren Lebenszufriedenheit aus? 2. Welche Einstellung gegenüber Homosexuellen erwartet man bei Personen bestimmten Alters? 3. Wie hoch ist der durchschnittlich erwartete BMI (Body-Mass-Index) einer Person, wenn diese ein mittelmäßig gesundes Ernährungsverhalten zeigt? Oder in gerichteter Form 1. Erhöht sich die Lebenszufriedenheit mit steigendem Einkommen? 2. Sind Ältere Homosexuellen gegenüber ablehnender eingestellt als Jüngere? 3. Steigt der BMI bei ungesunder Ernährung? # 6

7 Grundidee und Vorgehen Beispiele Oder als Forschungshypothese formuliert: H 1 : H 2 : H 3 : Je höher das Einkommen ist, desto höher ist die Lebenszufriedenheit. Je älter eine Person ist, desto ablehnender ist sie Homosexuellen gegenüber eingestellt. Je ungesünder die Ernährung ist, desto höher ist der BMI. Dies alles ist allgemein gültig formuliert es gilt für eine ganze Population. Von Interesse ist daher das bedingte Populationsmittel. # 7

8 Grundidee und Vorgehen Bedingtes Populationsmittel Das bedingte Populationsmittel wird geschrieben als E(y x) E steht für Erwartungswert Auf die Beispiele übertragen heißt das: 1. E(Lebenszufriedenheit Einkommen) Werte der abhängigen Variable Bei gegebenen Werten der unabhängigen Variable daher bedingter Erwartungswert 2. E(Einstellung zu Homosexuellen Alter) 3. E(BMI Ernährung) # 8

9 Grundidee und Vorgehen Grafische Darstellung Vorhergesagt wird also das bedingte Populationsmittel E(y x) Daher braucht man zur Berechnung der Vorhersage eine ganze Population. Jede Person dieser Population lässt sich als Punkt in einem Koordinatensystem darstellen. Auf der x-achse befindet sich die unabhängige Variable, auf der y-achse die abhängige Variable. # 9

10 Grundidee und Vorgehen Grafische Darstellung Berechnung der Variablen comp index_ernae= ((9-v21_1)+(9-v21_2)+v21_3 +v21_5+ v21_6+ v21_7)/6. comp bmi=v28/((v27/100)*(v27/100)). recode bmi (50 thru highest=-77). mis val bmi (-77). Streudiagramm graph /scatter index_ernae with bmi. # 10

11 Grundidee und Vorgehen Grafische Darstellung # 11

12 Grundidee und Vorgehen Populationsregressionsfunktion Diese Punktewolke soll von einer Geraden beschrieben werden (Populationsregressionsfunktion - PRF): y i = E(y x i ) + u i wobei u i die Abweichung der y i vom bedingten Populationsmittel angibt. u i nennt man auch Residuum oder stochastischer Fehlerterm. # 12

13 Grundidee und Vorgehen Populationsregressionsfunktion Im linearen bivariaten Fall heißt die Populationsregressionsfunktion : E(y x i ) = β 0 + β 1 x i β 0 und β 1 sind die Regressionskoeffizienten Die oben genannte Gleichung beschreibt einen linearen Zusammenhang (Gerade) zwischen X und Y β 0 gibt dabei an, an welcher Stelle die Gerade die Y-Achse schneidet β 1 gibt die Steigung der Geraden an # 13

14 Grundidee und Vorgehen Stichprobenregressionsfunktion Meist liegt nur eine Stichprobe vor. Daher schätzt man die PRF mit dieser Stichprobe und erhält eine Gleichung: Stichprobenregressionsfunktion (SRF). Schätzer werden durch Dach gekennzeichnet: Beispiel: Welchen durchschnittlich BMI hat eine Person, wenn der Ernährungsindex den Wert 4 annimmt? # 14

15 Grundidee und Vorgehen Stichprobenregressionsfunktion # 15

16 Grundidee und Vorgehen Stichprobenregressionsfunktion Steigungskoeffizient β 1 Residuum û Achsenabschnitt β 0 # 16

17 Grundidee und Vorgehen OLS-Schätzung Die Gerade wird so durch die Punktewolke gelegt, dass die Summe der quadrierten Residuen möglichst klein wird (sog. Kleinste-Quadrate- Methode oder auch Ordinary Least Squares (OLS)). Das zu lösende Problem lautet also: Die Residuen werden quadriert, weil sich sonst positive und negative Abweichungen ausgleichen stärkere Abweichungen stärker in die Berechnung einfließen sollen Der Erwartungswert der Residuen ist gleich 0, im Durchschnitt sind die Fehler also 0: E(u)=0. n min u i i 1 2 # 17

18 Güte eines Regressionsmodells R² Wie gut passt die Gerade zu den Daten? Berechnung des Bestimmtheitsmaßes R² R² basiert auf Zerlegung der Gesamtstreuung in Streuungskomponenten: Die Gesamtvariation der tatsächlichen Werte von Y lässt sich zerlegen in durch die Regression erklärte und unerklärte Variation: (Total Sum of Squares = Explained Sum of Squares + Residual Sum of Squares) TSS TSS ESS RSS ESS ( Yˆ Y) 2 ( Y 2 i Y) RSS u 2 i R² ergibt sich als der Anteil der erklärten Variation an der Gesamtvariation. ˆi # 18

19 Güte eines Regressionsmodells R² ESS Mittelwert RSS # 19

20 Güte eines Regressionsmodells R² R² ist also ein Anteil. Folglich liegt R² zwischen 0 und 1 R² entspricht bei nur einer unabhängigen Variable dem quadrierten Korrelationskoeffizienten Interpretation von R²: R² = 0 die Regressionsfunktion trägt nichts zur Erklärung von Y bei R² = 1 die Regressionsfunktion erklärt Y perfekt (alle Punkte liegen genau auf der Geraden) Beispielweise: R² = 0,35 35% der Varianz werden durch die unabhängige Variable erklärt. # 20

21 Güte eines Regressionsmodells F-Test Ebenfalls auf dieser Streuungszerlegung basiert der F-Test Dieser Test informiert darüber, ob die unabhängige(n) Variable(n) zur Erklärung der abhängigen Variable beitragen H 0 : Die unabhängigen Variablen tragen nicht zur Erklärung der abhängigen Variable bei H 1 : Mindestens eine unabhängige Variable trägt zur Erklärung der abhängigen Variable bei # 21

22 Güte eines Regressionsmodells F-Test Zunächst werden Freiheitsgrade berechnet: Freiheitsgrade gesamt: Fallzahl N - 1 Freiheitsgrade der Residuen: N-J-1 mit J = Zahl der unabhängigen Variablen Freiheitsgrade der Regression = Freiheitsgrade gesamt-freiheitsgrade der Residuen Dann werden jeweils Mittel der Quadrate berechnet: Mittel der Quadrate = Quadratsumme/Freiheitsgrade Die Prüfgröße F ergibt sich als: Mittel der Quadrate der Regression Mittel der Quadrate der Residuen # 22

23 Regressionskoeffizienten Signifikanz Neben der Gesamtgüte des Modells ist insbesondere von Interesse, ob einzelne Variablen einflussreich sind Dazu wird zunächst für jeden Koeffizienten (hier: 0 ˆ und ) der Standardfehler se(β j ) berechnet Diese entsprechen der Standardabweichung der Koeffizienten, wenn man immer wieder eine Stichprobe ziehen würde Stichprobenschwankung ˆ 1 # 23

24 Regressionskoeffizienten Signifikanz Mit dem Standardfehler kann bestimmt werden, wie treffsicher ein Koeffizient ist. Dafür werden die Koeffizienten durch die Standardfehler dividiert. Der resultierende T-Wert dient als Prüfgröße des T-Tests H 0 : Der Koeffizient ist nicht von 0 verschieden (die Variable hat keinen Einfluss) H 1 : Der Koeffizient ist von 0 verschieden (die Variable hat einen Einfluss) # 24

25 Regressionskoeffizienten Interpretation Interpretation von β 0 : Durchschnittlicher Wert der AV, wenn alle anderen Einflussgrößen gleich 0 sind. Interpretation von β 1 : Verändert sich die UV um eine Einheit, so verändert sich die AV um β 1 Einheiten. # 25

26 Anwendungsbeispiel Befehl regression /statistics coeff CI anova R /dependent BMI Abhängige Variable BMI /method=enter index_ernae. Unabhängige Variable Ernährung Man erhält drei Blöcke: 1. den Koeffizienten-Block 2. den Modell-Fit-Block und 3. den Anova-Block. Wie sieht die Gerade aus? Wie gut passt die Gerade zu den Daten? # 26

27 Anwendungsbeispiel Koeffizienten-Block Konstante β 0 (Achsenabschnitt) Standardfehler der Schätzer: se(β j ) Steigungskoeffizient β 1 Positiv positiver Zusammenhang Negativ negativer Zusammenhang. Der erwartete BMI steigt pro Indexpunkt um 0,464 # 27

28 Anwendungsbeispiel Koeffizienten-Block p-wert > 0,05 Zusammenhang ist nicht signifikant Aus den Koeffizienten ergibt sich folgender Schätzwert für eine Person mit einem Indexwert von 4: 24, ,464*4 = 26,644 # 28

29 Anwendungsbeispiel Anova-Block ESS ( Yˆ Y) 2 RSS uˆi i 2 p-wert > 0,05: Die Nullhypothese, keine UV hat Einfluss, kann nicht abgelehnt werden. TSS ( Y Y) i 2 # 29

30 Anwendungsbeispiel Model-Fit-Block R: Korrelationskoeffizient. Entspricht im bivariaten Fall dem Zusammenhangsmaß r. R 2 = 0,005 Durch die UV Ernährung werden 0,5% der Varianz der AV BMI erklärt. Sehr geringe Modellgüte Der Standardschätzfehler ist ein Maß dafür, wie stark die geschätzten y-werte von den tatsächlichen y-werten im Durchschnitt abweichen # 30

31 Kategoriale Einflussgrößen Einflussgrößen können nicht nur metrisch sein, sondern auch dummykodiert (0/1) Durch Dichotomisierung (= Bildung von Dummyvariablen) lassen sich auch nominale und ordinale Variablen als unabhängige Variablen untersuchen Eine Dummyvariable nimmt den Wert 1 an, wenn eine bestimmte Eigenschaft vorliegt, sonst den Wert 0 Hat eine Variable mehr als 2 Kategorien (k>2), werden k-1 davon in das Modell aufgenommen, die weggelassene Variable dient als Referenzkategorie Wichtig: Effekte von Dummy-Variablen sind immer im Hinblick auf eine sog. Referenzkategorie zu interpretieren: Verglichen mit der Referenzkategorie XY. # 31

32 Kategoriale Einflussgrößen Beispiel 1: Geschlecht Bilden der Variable: recode v55 (1=0)(2=1)(else=copy) into frau. mis val frau (-77). var lab frau "Geschlecht". val lab frau 0 "Männlich" 1 "Weiblich". cro frau by v55. Regression: regression /stat coeff CI anova R /dependent BMI /method=enter frau. Nur ein Dummy wird eingefügt. Als Referenz dient die 0-Kategorie, hier Männer. # 32

33 Kategoriale Einflussgrößen Beispiel 1: Geschlecht # 33

34 Kategoriale Einflussgrößen Beispiel 1: Geschlecht Erwarteter BMI Männer: 27,169+0*(-0,885)=27,169 Erwarteter BMI Frauen: 27,169+1*(-0,885)=26,284 # 34

35 Kategoriale Einflussgrößen Beispiel 2: Psychische Gesundheit Bilden von 2 Dummy-Variablen recode v14 ( =0)(3=1) into v14_rec1. recode v14 (1 2 3=0)(4 5=1) into v14_rec2. var lab v14_rec1 "Psychische Gesundheit: Mittelmäßig". var lab v14_rec2 "Psychische Gesundheit: Gut/Sehr gut". val lab v14_rec1 v14_rec2 0 "Keine Nennung" 1 "Nennung. cro v14_rec1 by v14. cro v14_rec2 by v14. Sehr schlecht und Schlecht dienen folglich als Referenzkategorie # 35

36 Kategoriale Einflussgrößen Beispiel 2: Psychische Gesundheit Schätzen des Modells regression /stat coeff CI anova R /dependent BMI /method=enter v14_rec1 v14_rec2. # 36

37 Kategoriale Einflussgrößen Beispiel 2: Psychische Gesundheit # 37

38 Kategoriale Einflussgrößen Beispiel 2: Psychische Gesundheit # 38

39 Zusammenfassung und Kochrezept Die einfache lineare Regression dient der Analyse des Einflusses einer metrischen oder dichotomen unabhängigen Variable auf eine metrische abhängige Variable Grundidee ist das Hindurchlegen einer Geraden durch eine Punktewolke Die Gerade wird dabei so bestimmt, dass die Summe der quadrierten Abstände der Beobachtungen von der Geraden möglichst klein wird Effekte in einer Regression lassen nicht zwingend auf kausale Wirkungszusammenhänge schließen # 39

40 Zusammenfassung und Kochrezept Kochrezept : Was muss mindestens interpretiert werden? 1. Ist der F-Test signifikant? Auskunft darüber, ob unabhängige Variable(n) zur Erklärung der abhängigen Variable beitragen 2. Wie groß ist R²? Anteil der Varianz der abhängigen Variable, der durch unabhängige Variable erklärt wird 3. Welche Variablen haben einen signifikanten Einfluss auf die abhängige Variable? T-Test der Koeffizienten 4. Wie ist dieser Einfluss beschaffen: positiv oder negativ, um wie viele Einheiten ändert sich die abhängige Variable bei Änderung der unabhängigen Variable um eine Einheit Interpretation der Koeffizienten 5. Hilfreich sind zudem Beispielrechnungen der Form Wie hoch ist das durch das Modell vorhergesagte Einkommen für eine Person, die 15 Bildungsjahre absolviert hat? # 40

41 Übungsaufgaben Aufgabe 1 Es wird vermutet, dass das Haushaltseinkommen die Qualität der Wohnumgebung und damit deren Bewertung beeinflusst. Bilden Sie aus den Variablen v11_1 bis v11_6 einen additiven Index zur Bewertung des Wohnumfelds. Prüfen Sie zuvor die Reliabilität des Index und die Brauchbarkeit der einzelnen Variablen anhand geeigneter Maßzahlen und wählen Sie ggf. nur geeignete Variablen aus. Erstellen Sie ein Streudiagramm inklusive einer Fit-Geraden. Berechnen Sie ein Regressionsmodell und interpretieren Sie die Resultate. Wie viel Varianz der Lebenszufriedenheit erklärt die psychische Belastung? Welche Bewertung wird für eine Person mit Haushaltseinkommen von 2500 Euro erwartet? # 41

42 Übungsaufgaben Aufgabe 2 Untersuchen Sie, ob die Bewertung des Wohnumfelds von der Einwohnerzahl abhängt. Berechnen Sie ein Regressionsmodell und interpretieren Sie die Koeffizienten des Modells. Wie viel Varianz erklärt die Einwohnerzahl? Was sagt in diesem Fall der Wert der Konstante aus? Wie unterscheiden sich die Ergebnisse, wenn die geringste Einwohnerzahl als Referenzkategorie gewählt wird, im Vergleich zu Kategorie 4 als Referenzkategorie? # 42

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154

Bivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154 Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch

Mehr

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression

Institut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen

Mehr

Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse I: Lineare Regression

Institut für Soziologie Andreas Schneck. Methoden 2. Regressionsanalyse I: Lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Lineare Regression Organisatorisches Hausarbeitsgruppen: Aktueller Stand der Gruppenbildung Bitte bis spätestens 03.07.2017 die Gruppenzusammensetzung

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

TEIL 13: DIE EINFACHE LINEARE REGRESSION

TEIL 13: DIE EINFACHE LINEARE REGRESSION TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen

Mehr

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167 Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine

Mehr

TEIL 13: DIE LINEARE REGRESSION

TEIL 13: DIE LINEARE REGRESSION TEIL 13: DIE LINEARE REGRESSION Dozent: Dawid Bekalarczyk GLIEDERUNG Dozent: Dawid Bekalarczyk Lineare Regression Grundlagen Prognosen / Schätzungen Verbindung zwischen Prognose und Zusammenhang zwischen

Mehr

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:

Mehr

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.

Instrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen. Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression

Mehr

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II 1.1 Durch welche Elemente lässt sich laut der Formel für die multiple Regression der Wert einer Person auf einer bestimmten abhängigen Variable Y vorhersagen? a)

Mehr

Methodik der multiplen linearen Regression

Methodik der multiplen linearen Regression Methodik der multiplen linearen Regression Sibel Aydemir Statistisches Amt, Direktorium Landeshauptstadt München Name, Stadt Regressionsanalyse: Schritt für Schritt Schritt 1 Schritt 2 Schritt 3 Schritt

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2 Martin-Luther-Universität Halle-Wittenberg Institut für Soziologie Dr. Wolfgang Langer 1 Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse Lösungsblatt zu Nr. 2 1. a) Je

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Das lineare Regressionsmodell Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

Das Lineare Regressionsmodell

Das Lineare Regressionsmodell Das Lineare Regressionsmodell Bivariates Regressionsmodell Verbrauch eines Pkw hängt vom Gewicht des Fahrzeugs ab Hypothese / Theorie: Je schwerer ein Auto, desto mehr wird es verbrauchen Annahme eines

Mehr

Das klassische Regressionsmodell: Ein Beispiel

Das klassische Regressionsmodell: Ein Beispiel 1 / 43 Das klassische Regressionsmodell: Ein Beispiel Kapitel 2 Ökonometrie I Michael Hauser 2 / 43 Inhalt Ein Beispiel für das klassische, bivariate Regressionsmodell: Okun s Gesetz Das bivariate, lineare

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13

Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13 Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Grundidee: Eine abhängige Variable soll als Linearkombination mehrerer unabhängiger

Mehr

Übungsblatt 10: Lineare Regression (Sitzung 11)

Übungsblatt 10: Lineare Regression (Sitzung 11) 1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der

Mehr

Tutorial: Regression Output von R

Tutorial: Regression Output von R Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Diagnostik von Regressionsmodellen (1)

Diagnostik von Regressionsmodellen (1) Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den

Mehr

Einführung in die Induktive Statistik: Varianzanalyse

Einführung in die Induktive Statistik: Varianzanalyse Einführung in die Induktive Statistik: Varianzanalyse Jörg Drechsler LMU München Wintersemester 2011/2012 Varianzanalyse bisher: Vergleich der Erwartungswerte für zwei normalverteilte Variablen durch t-test

Mehr

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen

Mehr

STATISTIK II. Hans-Otfried Müller Institut für Mathematische Stochastik.

STATISTIK II. Hans-Otfried Müller Institut für Mathematische Stochastik. STATISTIK II Hans-Otfried Müller Institut für Mathematische Stochastik http://www.math.tu-dresden.de/sto/mueller 1 Ausgewählte Verfahren der multivariaten Datenanalyse und Statistik Werden bei einer Analyse

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung

Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung Übung Formale Methoden der Ökonomik: Einführung in die empirische Wirtschaftsforschung BACHELOR FT 2013 (HSU) Übung Emp. WiFo FT 2013 1 / 1 Maßzahlen für den Zusammenhang zwischen Merkmalen Kontingenztabelle:

Mehr

Die Korrelation von Merkmalen

Die Korrelation von Merkmalen Die Korrelation von Merkmalen In der Analse von Datenmaterial ist eines der Hauptziele der Statistik eine Abhängigkeit bzw. einen Zusammenhang zwischen Merkmalen zu erkennen. Die Korrelation ermittelt

Mehr

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz. Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter

Mehr

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav.

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav. Kapitel 5 FRAGESTELLUNG 1 Öffne die Datei alctobac.sav. Zuerst werden wir ein Streudiagramm erstellen, um einen grafischen Überblick von diesem Datensatz zu erhalten. Gehe dazu auf Grafiken / Streudiagramm

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen. 0 sonst.

Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen. 0 sonst. Aufgabe 1 (2 + 4 + 2 + 1 Punkte) Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen X und Y : { 2x + 2y für 0.5 x 0.5, 1 y 2 f(x, y) = 3 0 sonst. a) Berechnen

Mehr

Statistik II: Signifikanztests /2

Statistik II: Signifikanztests /2 Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver

Mehr

Statistik II (Sozialwissenschaften)

Statistik II (Sozialwissenschaften) Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden http://www.math.tu-dresden.de/sto/mueller/ Statistik II (Sozialwissenschaften) 2. Konsultationsübung,

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression 2., Linear 2., lineare multiple 2., lineare 2.1 2.2 Lineare 2.1 2.2 Lineare 2.7 Partielle 2.7 Partielle 1 / 149 2., Linear 2., lineare 2.1 2.2 Lineare 2.1 2.7 Partielle 2 / 149 2.1 Beispiel: Arbeitsmotivation

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2 Programm Wiederholung der

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle

Mehr

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über

Mehr

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem

Mehr

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 29.10.2002 To err is human, to forgive is devine - but to include errors in your design is statistical Leslie Kish Dr. Wolfgang Langer

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN Bivariate Analyse für metrisch skalierte Variablen Grundlagen Verfahren für metrische Daten nutzen den vollen mathematischen Informationsgehalt

Mehr

Ziel der linearen Regression

Ziel der linearen Regression Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

5. Lektion: Einfache Signifikanztests

5. Lektion: Einfache Signifikanztests Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen

Mehr

Kurs Empirische Wirtschaftsforschung

Kurs Empirische Wirtschaftsforschung Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem

Mehr

VS PLUS

VS PLUS VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN

Mehr

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die Induktive Statistik: Regressionsanalyse Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung ach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Lineare Regression mit einem Regressor: Einführung

Lineare Regression mit einem Regressor: Einführung Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,

Mehr

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005 Universität Bielefeld 13. Juni 2005 Einführung Einführung Wie kann die Kenntnis der Wahrscheinlichkeitsverteilung der Parameter einer Stichprobe dazu verhelfen auf die wahren Werte der Grundgesamtheit

Mehr

Statistik II für Betriebswirte Vorlesung 8

Statistik II für Betriebswirte Vorlesung 8 Statistik II für Betriebswirte Vorlesung 8 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 3. Dezember 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 8 Version:

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr