6.1 Grundbegriffe und historischer Hintergrund

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "6.1 Grundbegriffe und historischer Hintergrund"

Transkript

1 Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften Grundidee der Interpretation bleibt in verwandter Weise bei vielen allgemeineren Modellen erhalten, die hier nicht betrachtet werden (können) Motivation: Wir betrachten zunächst zwei metrische Variablen X und Y Der Korrelationskoeffizient nach Bravais-Pearson misst die Stärke des linearen Zusammenhangs zwischen X und Y, beantwortet also die Frage Wie gut lassen sich Ausprägungen (x i, y i ), i = 1,, n durch eine Gerade beschreiben? Die Regression geht nun einen Schritt weiter: Wie sieht die am besten passende Gerade aus? Analyse und Beschreibung des Zusammenhangs Zusätzliches Ziel: Prognose, dh gegeben sei ein Punkt x Wo liegt im Durchschnitt das dazugehörige y? (zb x Erwerbsarbeit in Stunden einer neuen Person, wieviel Hausarbeit in Stunden ist zu erwarten?) Elastizität: Wie stark wirkt sich eine Änderung von X um eine Einheit auf Y aus? (Wird die Erwerbsarbeit um eine Stunde reduziert, wieviel mehr Hausarbeit ist zu erwarten?) Die Regression ist ein erster Schritt in die etwas höhere Statistik Fast alle gängigen elaborierten Verfahren sind im weiteren Sinne Regressionsmodelle (allerdings oft nicht linear) Viele Grundideen zur Interpretation gelten in verwandter Form auch für andere Regressionsmodelle 119

2 Grundbegriffe und historischer Hintergrund Bei der Regressionsanalyse wird die Symmetrie des Zusammenhangs ia aufgegeben, dh nun wird ein gerichteter Zusammenhang der Form X Y betrachtet Bezeichnungen: X unabhängige Variable exogene Variable erklärende Variable Prädiktor Stimulus Einflußgröße Kovariable Y abhängige Variable endogene Variable zu erklärende Variable Prädiktand Response Historischer Hintergrund: Ende des 19 Jahrhunderts beschäftigte sich Francis Galton ( ) mit Fragen der Vererbung, insbesondere der Frage, wie bestimmte Eigenschaften der Eltern auf die Nachkommen übertragen werden Beispiel: Zusammenhang zwischen Körpergröße der Eltern und Körpergröße der Kinder Kreuztabelle zwischen der Körpergröße von 928 erwachsenen Kindern und der Durchschnittsgröße ihrer 205 Elternpaare (gemessen in Zoll): Größe der Kinder Größe der Eltern Gesamt Gesamt Zugehöriges Streudiagramm: Galton machte folgende Beobachtung:

3 Kapitel 6 Regression 121 Bildet man zeilenweise die Durchschnittsgrößen der Kinder, so liegen diese annähernd auf einer Geraden mit Steigung 2/3 Eine Steigung kleiner als Eins ließ Galton schlussfolgern, dass Kinder besonders großer Eltern tendenziell kleiner sind als ihre Eltern und umgekehrt Kinder kleiner Eltern tendenziell größer In jedem Fall besteht eine Tendenz zum Populationsmittelwert Galton sprach von Regression (Rückkehr) zum Mittelwert Im Folgenden: Präzisierung und Erweiterung dieser Form der Zusammenhangsanalyse 62 Lineare Einfachregression: Grundmodell und Kleinste- Quadrate-Prinzip Idee: Versuche, Y als einfache Funktion f von X zu beschreiben: Y f(x) Einfachste Möglichkeit: f linear, also Y a + b X Für die beobachteten Datenpunkte soll also für jedes i = 1,, n gelten y i a + b x i Normalerweise besteht kein perfekter linearer Zusammenhang, so dass ein unerklärter Rest ε i in die Modellgleichung mit aufgenommen wird (In Statistik 2 werden wir ε i als zufälligen Fehler interpretieren): y i = a + b x i + ε i Dies ist das Modell der linearen Einfachregression a und b sind unbekannte Größen, die sogenannten Regressionsparameter, die anhand der Daten bestimmt werden müssen Bestimme â, ˆb so, dass der unerklärte Rest möglichst klein wird, dh so, dass die gesamte quadratische Differenz zur sich ergebenden Gerade ŷ i = â + ˆb x i minimal wird Dh minimiere das Kleinste Quadrate (KQ) Kriterium bezüglich â und ˆb (y i â ˆbx i ) 2

4 Lineare Einfachregression: Grundmodell und Kleinste-Quadrate-Prinzip y i ŷ i 2 ˆε i x i ˆε 2 i y 2 1 ˆε i g 2 εˆ 2 { εˆ 3 { εˆ 4 εˆ 1 { εˆ 2 ε3 ˆ g εˆ 1 1 x Definition: Gegeben seien zwei metrische Merkmale X und Y und das Modell der linearen Einfachregression y i = a + bx i + ε i, i = 1,, n Dann bestimme man â und ˆb so, dass mit ˆε i := y i ŷ i = y i (â + ˆbx i ) das Kleinste-Quadrate-Kriterium ˆε i 2

5 Kapitel 6 Regression 123 minimal wird Die optimalen Werte â und ˆb heißen KQ-Schätzungen, ˆε i bezeichnet das i-te (geschätzte) Residuum Bemerkungen: Durch das Quadrieren tragen sowohl positive als auch negative Abweichungen von der Regressionsgeraden zum KQ-Kriterium bei Das Quadrieren bewirkt außerdem, dass große Abweichungen überproportional stark berücksichtigt werden Die KQ-Schätzer sind in diesem Sinne ausreißeranfällig Satz: Für die KQ-Schätzer gilt (x i x)(y i ȳ) i) ˆb Cov(X, Y ) = = s 2 (x i x) 2 X ii) â = ȳ ˆb x, iii) n ˆε i = 0 = ϱ X,Y s Y s X, Bemerkungen: Hat man standardisierte Variablen X und Y (gilt also s X = s Y = 1), so ist ˆb genau ρ X,Y Die mittlere Abweichung von der Regressionsgeraden ist Null Diese Eigenschaft kann auch verwendet werden, um die korrekte Berechnung der KQ-Schätzer zu überprüfen Basierend auf den Schätzern â und ˆb kann der Wert der abhängigen Variablen Y auch für neue, unbeobachtete Werte der Kovariablen X berechnet werden: ŷ(x) = â + ˆbx In den Ingenieurwissenschaften heißt die geschätzte Gerade ŷ(x) Ausgleichsgerade Interpretation der Regressionsgeraden: y } ˆb 1 { â x

6 Lineare Einfachregression: Grundmodell und Kleinste-Quadrate-Prinzip â ist der Achsenabschnitt, also der Wert der Gerade, der zu x = 0 gehört Er lässt sich oft als glqq Grundniveau interpretieren ˆb ist die Steigung (Elastizität): Um wieviel erhöht sich y bei einer Steigerung von x um eine Einheit? y (Punkt auf der Gerade) ist der Prognosewert zu x Fiktives Ökonomisches Beispiel zur Klärung: Kaffeeverkauf auf drei Flohmärkten X Anzahl verkaufter Tassen Kaffee Y zugehöriger Gewinn (Preis Verhandlungssache) Man bestimme die Regressionsgerade und interpretiere die erhaltenen KQ-Schätzungen! Welcher Gewinn ist bei zwölf verkauften Tassen zu erwarten? i x i y i y i ȳ x i x (x i x) x = 10 ȳ = 10 = 0 = 0 ˆb = (x i x)(y i ȳ) = (x i x) 2 0 ( 1) ( 5) 2 = = 21 Mit der Erhöhung der Menge X um eine Einheit erhöht sich der Gewinn Y um 21 Einheiten, also ist ˆb so etwas wie der durchschnittliche Gewinn pro Tasse â = ȳ ˆb x = = 11 Grundlevel, Gewinn bei 0 Tassen, Fixkosten (zb Standgebühr) Vohergesagte Werte (ŷ = â + ˆbx) und Residuen (y ŷ): ŷ 1 = = 10 ˆε 1 = 1 ŷ 2 = = 205 ˆε 2 = 05 ŷ 3 = = 05 ˆε 3 = 05 Zur Kontrolle: ˆɛ 1 + ˆɛ 2 + ˆɛ 3 = 0 Prognose: x = 12 = ŷ = â + ˆb x = = 142

7 Kapitel 6 Regression Modellanpassung: Bestimmtheitsmaß und Residualplots Wie gut lässt sich die abhängige Variable Y durch die Kovariable X erklären? Wie gut passt der lineare Zusammenhang zwischen X und Y? PRE-Ansatz: Modell 1: Vorhersage von Y ohne X Prognostiziere für jede Beobachtung den Mittelwertȳ Dabei gemachter Gesamtfehler: SQT := (y i ȳ) 2 (Gesamtstreuung / Gesamtvariation der y i : sum of squares total ) Modell 2: Vorhersage von Y mit X Vorhersage basierend auf den KQ-Schätzern: Dabei gemachter Gesamtfehler: ŷ i = â + ˆb x i SQR := (ŷ i y i ) 2 (Residualstreuung / Residualvariation: sum of squared residuals ) Die Differenz SQE := SQT SQR nennt man die durch das Regressionsmodel erklärte Streuung ( sum of squares explained ) Man kann zeigen, dass gilt SQE = (ŷ i ȳ) 2 Streuungszerlegung: SQT = SQR + SQE (analog zur Streuungszerlegung bei gruppierten Daten)

8 Modellanpassung: Bestimmtheitsmaß und Residualplots Bestimmtheitsmaß: Der PRE-Ansatz liefert das Gütekriterium SQT SQR SQT = SQE SQT Diese Größe bezeichnet man als Bestimmtheitsmaß In der Tat gilt (nach etwas längerer Rechnung): SQE SQT = R2 XY dh dies ist genau das Bestimmtheitsmaß aus Definition (511) Es gibt also drei Arten, R 2 XY zu verstehen: 1 über den Korrelationskoeffizienten R 2 XY = (ρ(x, Y ))2 (vgl (511)), 2 als PRE-Maß gemäß obiger Herleitung, oder 3 als Verhältnis der durch die Regression erklärten Variation und der Gesamtvariation In der Tat gibt RXY 2 beschreiben lässt also tatsächlich an, wie gut sich der Zusammenhang durch die Gerade Eigenschaften: Es gilt: 0 RXY 2 1 RXY 2 = 0: Es wird keine Streuung erklärt, dh es gibt keinen (linearen) Zusammenhang zwischen X und Y RXY 2 = 1: Die Streuung wird vollständig erklärt Alle Beobachtungen liegen tatsächlich auf einer Geraden Residualplots Eine wichtige optische Möglichkeit, die Anpassung zu beurteilen, beruht auf dem Studium der geschätzten Residuen ˆε i Sie sollen unsystematisch um 0 streuen Zeigt sich eine Systematik, so war der lineare Ansatz unangemessen, und es ist größte Vorsicht bei der Interpretation geboten

9 Kapitel 6 Regression Linearisierende Transformationen: Sehr häufig wirkt die Variable X nicht direkt linear auf die Variable Y (Streudiagramm anschauen!) Akzeptanz Redezeit in Minuten sehr hohe/sehr niedrige Werte ungünstig; analog Herzinfarktrisiko und Proteinaufnahme Umsatz Zeit zyklische Wirkung (insb X Zeit, Y zb Umsatz Speiseeis) Ertrag Erstes Gossensches Gesetz: Abnehmender Grenznutzen Aufwand oder: Engelsches Gesetz: Aufwendungen für Lebensmittel in Abhängigkeit vom Einkommen Aggression Provokation Schwellenwertmodell Häufige Anwendung in der Epidemiologie (Belastung Wirkung) Viele (nicht alle) der auf den ersten Blick nichtlinearen Modelle lassen sich durch geeignete

10 Multiple lineare Regression Variablentransformationen in die lineare Regressionsrechnung einbetten Entscheidend ist, dass das Wirken der Parameter linear ist! Der Ansatz g(y i ) = a + b h(x i ) + ε i lässt sich auch völlig analog mit dem KQ-Prinzip behandeln: Definiere dazu die Merkmale Y = g(y ) und X = h(x) und betrachte y i = a + b x i + ε i b bzw ˆb geben dann allerdings nicht direkt die Stärke der Elastizität von Y bezüglich X an, sondern die von Y bezüglich X Eine geeignete Interpretation erhält man über den Ansatz: b = Y Änderung in Y = X Änderung in X So lassen sich auch die oben dargestellten Situationen mit linearen Regressionstechniken { 0 X τ lösen Man wählt etwa X = X 2, X = sin(x), X = ln X oder X = X τ X > τ mit bekanntem Schwellenwert τ Entscheidend ist die Linearität in den Parametern a und b Der Ansatz ist kein lineares Regressionsmodell Sehr häufiger Ansatz: (abflachender Einfluss von X) y i = a + b 2 x i + ε i Y = a + b ln X + ε Hier kann b wie folgt interpretiert werden: Erhöht man einen Wert von X um p Prozent, so erhöht sich der entsprechende Y -Wert etwa um b p Prozent, denn Y = b X = = b (ln((1 + p) x) ln(x)) = b (ln(1 + p) + ln(x) ln(x)) = b ln(1 + p) b p, falls p klein Echte nichtlineare Modelle ergeben sich aus der Theorie der generalisierten linearen Modelle, die insbesondere auch für kategoriales oder ordinales Y geeignet sind 64 Multiple lineare Regression Verallgemeinerung der linearen Einfachregression: Betrachte mehrere unabhängige metrische Variablen X 1, X 2,, X p gemeinsam, da typischerweise ja kein monokausaler Zusammenhang vorliegt

11 Kapitel 6 Regression 129 Modellgleichung: y = a + b 1 x 1i + b 2 x 2i + + b p x pi + ε i Dabei bezeichnet x i1 den für die i-te Beobachtung beobachteten Wert der Variablen X 1, x i2 den Wert der Variablen X 2, usw Interpretation: Die Interpretation von a und b 1,, b p erfolgt analog zu oben, insbesondere ist b j die Änderung in Y, wenn X j um eine Einheit vergrößert wird und alle anderen Größen gleich bleiben ( ceteris paribus Effekt ) Üblich ist allerdings eine andere Notation für die Regressionskoeffizienten: a β 0, b 1 β 1, b p β p, KQ-Prinzip: Die Schätzung von β 0, β 1,, β p erfolgt wieder über das KQ-Prinzip: Bestimme ˆβ 0, ˆβ 1, ˆβ 2,, ˆβ p so, dass mit ˆε i = y i ŷ i := y i ( ˆβ 0 + ˆβ 1 x 1i + ˆβ 2 x 2i + + ˆβ p x pi ) der Ausdruck minimal wird ˆε 2 i Die Schätzungen ˆβ 0, ˆβ 1,, ˆβ p sind nur mit Matrizenrechnung einfach darzustellen und insbesondere nur noch schwierig von Hand zu berechnen Analog zur linearen Einfachregression lässt sich ein Bestimmtheits- Bestimmtheitsmaß: maß R 2 = SQE SQT über die Streuungszerlegung definieren In der multiplen Regression verwendet man allerdings meistens das korrigierte Bestimmtheitsmaß R 2 := 1 n 1 n p 1 (1 R2 ) das die Anzahl der in das Modell mit einbezogenen Variablen mit berücksichtigt Das übliche R 2 steigt auch durch das Einführen irrelevanter Variablen an

12 Nominale Einflussgrößen SPSS-Output einer multiplen Regression: Coefficients a Unstandardized Coefficients Model B Std Error t Sig 1 (Constant) ˆβ0 ˆσ 0 T 0 p-wert X 1 ˆβ1 ˆσ 1 T 1 X 2 ˆβ2 ˆσ 2 T 2 X p ˆβp ˆσ p T p a Dependent Variable: Y Im Rahmen von Statistik 1 sind nur die ersten beiden Spalten relevant Anmerkung: SPSS gibt auch noch die standardisierten Koeffizienten aus, das sind die Schätzer, wenn man die Variablen vorher standardisiert Bei der linearen Einfachregression findet man hier den Korrelationskoeffizienten von Bravais Pearson wieder 65 Nominale Einflussgrößen 651 Dichotome Kovariable Bisher wurden Y, X 1, X 2,, X p als metrisch vorausgesetzt Ähnlich wie für Korrelationskoeffizienten können dichotome Variablen, sofern sie mit 0 und 1 kodiert sind, ebenfalls als Einflussgrößen zugelassen werden können Die zugehörigen Koeffizienten geben dann an, um wieviel sich Y ceteris paribus erhöht, wenn die entsprechende Kovariable den Wert 1 statt 0 hat Beispiel: Einfluss von Arbeitszeit und Geschlecht auf das Einkommen y i = β 0 + β 1 x 1i + β 2 x 2i + ε i mit X 1 = { 1 männlich 0 weiblich X 2 = (vertragliche) Arbeitszeit Y = Einkommen Interpretation: Die geschätzte Gerade für die Männer lautet: ŷ i = ˆβ 0 + ˆβ ˆβ 2 x 2i

13 Kapitel 6 Regression 131 Für die Frauen hingegen gilt ŷ i = ˆβ 0 + ˆβ ˆβ 2 x 2i = ˆβ 0 + ˆβ 2 x 2i y } ˆβ { β2 ˆ 1 ˆβ 0 { x 2 Um ˆβ 1 verschobene Geraden β 0 Grundlevel, β 2 durchschnittlicher Stundenlohn, β 1 Zusatzeffekt des Geschlechts auf Grundlevel Unterschiede im Stundenlohn zwischen Männern und Frauen können durch Interaktionseffekte berücksichtigt werden 652 Interaktionseffekte Wechselwirkung zwischen Kovariablen lassen sich durch den Einbezug des Produkts als zusätzliche Kovariable modellieren y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 1i x 2i } {{ } = x 3i + ε i β 3 gibt den Interaktions- oder Wechselwirkungseffekt an Dieser lässt sich insbesondere bei dichotomen Kovariablen einfach interpretieren Fortsetzung des Beispiels: Form Die geschätzte Regressionsgerade hat bei den Männern die und bei den Frauen die Form ŷ i = ˆβ 0 + ˆβ ˆβ 2 x 2i + ˆβ 3 1 x 2i = ˆβ 0 + ˆβ 1 + ( ˆβ 2 + ˆβ 3 ) x 2i ŷ i = ˆβ 0 + ˆβ ˆβ 2 x 2i + ˆβ 3 0 x 2i = ˆβ 0 + ˆβ 2 x 2i

14 Nominale Einflussgrößen y 1 ˆβ 2 + ˆβ 3 ˆβ2 + ˆβ 3 Stundenlohn der Männer 1 β 0 + β 1 { } ˆβ2 ˆβ 2 Stundenlohn der Frauen 1 β 0 { x 2 ˆβ 1 ist der Unterschied im Grundlevel, ˆβ 3 der Unterschied in der Steigung 653 Dummykodierung Betrachten wir nun ein nominales Merkmal X mit q Kategorien, zb Parteipräferenz 1 CDU/CSU oder FDP X = 2 SPD oder Grüne 3 Sonstige Man darf X nicht einfach mit Werten 1 bis 3 besetzen, da es sich um ein nominales Merkmal handelt Idee: mache aus der einen Variable mit k (hier 3) Ausprägungen k 1 (hier 2) Variablen mit den Ausprägungen ja/nein ( ˆ=0/1) Diese Dummyvariablen dürfen dann in der Regression verwendet werden { 1 CDU/CSU oder FDP X 1 = 0 andere { 1 SPD, Grüne X 2 = 0 andere Beachte, durch die Ausprägungen von X 1 und X 2 sind alle möglichen Ausprägungen von X vollständig beschrieben: Beispiel zur Interpretation: Y : Score auf Autoritarismusskala X bzw X 1, X 2 : Parteienpräferenz X 3 : Einkommen X Text X 1 X 2 1 CDU/CSU, FDP SPD, Grüne Sonstige 0 0

15 Kapitel 6 Regression 133 y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ε i β 0 : Grundniveau β 1 : ceteris paribus Effekt (Erhöhung des Grundniveaus) von CDU/CSU und FDP β 2 : ceteris paribus Effekt (Erhöhung des Grundniveaus) von SPD und Grünen β 3 : ceteris paribus Effekt des Einkommens 66 Varianzanalyse Ist ein nominales Merkmal X mit insgesamt k verschiedenen Ausprägungen die einzige unabhängige Variable, so führt die Regressionsanalyse mit den entsprechenden k 1 Dummyvariablen auf die sogenannte (einfaktorielle) Varianzanalyse Als Schätzwert ŷ i ergibt sich für jede Einheit i genau der Mittelwert aller Werte y i, die zu Einheiten l gehören, die dieselben Ausprägungen bei dem Merkmal X, also den zugehörigen Dummyvariablen X 1,, X k 1, haben Dh man bildet k Gruppen bezüglich X, und ŷ i ist der Mittelwert der Gruppe, zu der i gehört Beispiel: Y X Autoritarismusscore Parteienpräferenz X 1 CDU/CSU oder FDP, X 2 SPD oder Grün, X 3 Sonstiges Ist zb x i = 1, dh Einheit i ist CDU/CSU- oder FDP-Anhänger, dann ergibt sich ŷ i als Mittelwert des Scores aller CDU/CSU oder FDP Anhänger Typische Beispiele aus der Psychologie: verschiedene Treatments / Schulungsmaßnahmen / Reize Die Streuungszerlegung (y i ȳ) 2 = (ŷ i ȳ) 2 + (y i ŷ i ) 2 der linearen Regression vereinfacht sich in diesem Fall und hat eine ganz charakteristische Form: Indiziert man die Beobachtungen um und betrachtet die k Gruppen, so hat man in der j-ten Gruppe n j Beobachtungen y 1j, y 2j,, y nj j und den Gruppenmittelwert ȳ j Damit erhält man: n k j (y ij ȳ) 2 = j=1 k n j (ȳ j ȳ) 2 + j=1 n k j (y ij ȳ j ) 2 j=1

16 Varianzanalyse Dies ist genau die Streuungszerlegung aus Kapitel 321 Das zugehörige Bestimmtheitsmaß wird üblicherweise mit η 2 bezeichnet: η 2 = SQE SQT = k n j (ȳ j ȳ) 2 j=1 n j k (y ij ȳ j ) 2 j=1 η 2 und η = η 2 werden als Maße für Zusammenhang zwischen einer metrischen Variable und einer nominalen Variable verwendet Hier wurde eine Sichtweise gewählt, die die Varianzanalyse als Spezialfall der Regressionsanalyse sieht Oft (insb in der Psychologie) wird die Varianzanalyse auch als eigenständiges Konzept begriffen und wesentlich ausführlicher behandelt

6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammenhangsanalysestetiger Merkmale 6.1 Korrelationsanalyse 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig

Mehr

5.4.2 Kovarianz und Korrelation

5.4.2 Kovarianz und Korrelation 102 5.4. Zusammenhangsanalyse bivariater quasi-stetiger Merkmale 5.4.2 Kovarianz und Korrelation Wie misst man den Zusammenhang zwischen metrischen Merkmalen? Betrachte den Mittelpunkt der Daten ( x, ȳ)

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Eine zweidimensionale Stichprobe

Eine zweidimensionale Stichprobe Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

2.3 Nichtlineare Regressionsfunktion

2.3 Nichtlineare Regressionsfunktion Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren

Mehr

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j 1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b

Mehr

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch

Allgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Eine Einführung in R: Das Lineare Modell

Eine Einführung in R: Das Lineare Modell Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06. Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000

EINFACHE LINEARE REGRESSION MODUL 13 PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2000 INSTITUT FÜR ERZIEHUNGSWISSENSCHAFT - UNIVERSITÄT SALZBURG PROSEMINAR DESKRIPTIVE STATISTIK ANALYSE UND DARSTELLUNG VON DATEN I GÜNTER HAIDER WS 1999/2 MODUL 13 EINFACHE LINEARE REGRESSION Erziehungswissenschaft/Haider

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

6. Auswertung mehrdimensionaler Daten

6. Auswertung mehrdimensionaler Daten 6. Auswertung mehrdimensionaler Daten Bisher: Auswertungsmethoden für Daten eines einzelnen Merkmals, z.b. Diskrete Klassierung Grafische Darstellungen (Verteilungsfunktion) Lagemaße Streungsmaße Schiefemaße

Mehr

Statistische Versuchsplanung - zuverlässiger und schneller zu Ergebnissen" Dr. Uwe Waschatz

Statistische Versuchsplanung - zuverlässiger und schneller zu Ergebnissen Dr. Uwe Waschatz Statistische Versuchsplanung - zuverlässiger und schneller zu Ergebnissen" Dr. Uwe Waschatz Inhalt Problembeschreibung Multiple lineare Regressionsanalyse Statistische Versuchsplanung / Design of Experiments

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate

3.3 Das allgemeine lineare Modell (ALM), Methode der kleinsten Quadrate 31 und 31 und (), Methode der 33 Das allgemeine (), Methode der kleinsten Quadrate 37 Modelle mit Messwiederholungen 1 / 113 Eine grundsätzliche Bemerkung zu Beginn Es bestehen viele Ähnlichkeiten zwischen

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Lineare Modelle in R: Klassische lineare Regression

Lineare Modelle in R: Klassische lineare Regression Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

TEIL 13: DIE EINFACHE LINEARE REGRESSION

TEIL 13: DIE EINFACHE LINEARE REGRESSION TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen

Mehr

Wiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung

Wiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung Regression II Statistik I Sommersemester 2009 Statistik I Regression II (1/33) R 2 Root Mean Squared Error Statistik I Regression II (2/33) Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

6.2 Regressionsanalyse

6.2 Regressionsanalyse c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Klausur Wirtschaftsmathematik Lösungshinweise

Klausur Wirtschaftsmathematik Lösungshinweise Klausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 27. Juni 2015 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 1 16 Punkte Anton Arglos hat von seiner Großmutter 30 000 geschenkt

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die

Lösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2008 Aufgabe 1 I) Einige Mitarbeiter

Mehr

Trendlinien in Diagrammen (Excel 2010)

Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010)... 1 Allgemeines... 2 Informationen über Prognosen und das Anzeigen von Trends in Diagrammen... 3 AUSWÄHLEN DES PASSENDEN TRENDLINIETYPS

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.

In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

Die Einflußgrößenrechnung in Theorie und Praxis

Die Einflußgrößenrechnung in Theorie und Praxis Ernst Haller-Wedel Die Einflußgrößenrechnung in Theorie und Praxis Anwendung mehrdimensionaler statistischer Untersuchungs- Verfahren in Industrie, Wirtschaft und Verwaltung Mit 90 Bildern und 144 Tafeln

Mehr

? Unterscheiden sich Burschen und Mädchen im Ausmaß der Mithilfe im Haushalt?

? Unterscheiden sich Burschen und Mädchen im Ausmaß der Mithilfe im Haushalt? 341 i Metrische und kategoriale Merkmale An einer Beobachtungseinheit werden metrische und kategoriale Variable erhoben. Beispiel: Hausarbeit von Teenagern (Stunden/Woche) 25 15 STUNDEN 5-5 weiblich männlich?

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Lineare Regression mit einem Regressor: Einführung

Lineare Regression mit einem Regressor: Einführung Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

Crashkurs Einführung Biostatistik

Crashkurs Einführung Biostatistik Crashkurs Einführung Biostatistik Prof. Burkhardt Seifert Abteilung Biostatistik, ISPM Universität Zürich Deskriptive Statistik Wahrscheinlichkeitsrechnung, ersuchsplanung Statistische Inferenz Prinzip

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Herzlich Willkommen zur Vorlesung Statistik

Herzlich Willkommen zur Vorlesung Statistik Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Preismesszahl: Misst Preisveränderung eines einzelnen Gutes: Preis zum Zeitpunkt

Mehr

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)

Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff

Mehr

Taschenbuch Versuchsplanung

Taschenbuch Versuchsplanung Wilhelm Kleppmann Taschenbuch Versuchsplanung Produkte und Prozesse optimieren Praxisreihe Qualitätswissen Herausgegeben von Franz J. Brunner Carl Hanser Verlag München Wien VII Inhalt 1 Einführung 1 1.1

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr