Statistische Modellierung Merkblatt

Größe: px
Ab Seite anzeigen:

Download "Statistische Modellierung Merkblatt"

Transkript

1 Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC - effekt):...2 Ordinales Probit (PROC PROBIT - dummy):...3 Loglineares Modell (PROC CATMOD)...3 Effekt- oder Dummy-Codierung?...4 PROC LOGISTIC/PROBIT... 4 PROC GENMOD... 4 PROC CATMOD...5 Multinomiales Logit mit PROC LOGISTIC... 5 LOGIT mit PROC PROBIT ausrechnen... 5 Output... 5 Overdispersion/Skalenparameter...5 Wahrscheinlichkeiten in SAS ausrechnen... 6 Devianz...6 Likelihood-Ratio-Test (-verteilt)... 7 F-Test, wenn der Skalenparametergesch ä tzt wurde... 7 Residual-Analyse...7 Graphische Modelle...7 Effekt- & Dummy-Codierung... 7 Dummy-Codierung... 7 Effekt-Codierung...8 Offset-Variable...8 Welches Modell nimmt man wann? wenn y metrisch lineares Modell (irgendwelche Zahlen) wenn y 0/1-Variable (binär) Logit-Modell (einfach zu interpretieren -> e (...) wenn y 0/1-Variable (binär) Probit-Modell (Standardnormalverteilung) wenn y die Häufigkeit ist, mit der ein Ereignis in einem Zeitraum auftritt Poisson-Modell (mit proc genmod) y mehrkategorial & nominal skaliert multinomiales Logit, wenn Ausprägungen von Y > 2 y mehrkategorial & ordinal skaliert ordinales Logit y und alle Kovariaten kategorial loginlineares Modell (proc catmod)

2 Logit: Probit: Poisson: E [ y ] ln =X ' 1 E [Y ] 1 E[ y ] = X ' ln E [ y ] =X ' Loglinear: ln ij = X ' - erwartete Zellhäufigkeiten multinomiales Logit: (k-1) Logits werden geschätzt ln P y=1 X P =k X = X ' P y=2 X 1, ln P =k X =X ' 2 allgemein: exp X ' P y=r X = k 1 1 exp X ' letzte Kategorie: n=1 1 P y=k X = k 1 1 exp X ' n=1 P y=k 1 X ln = X ' P=k X k 1 oder wenn alle vorherigen Werte ausgerechnet wurden: P y=k X =1 P y=1 X P y=2 X P y=k 1 X Ordinales Logit (PROC LOGISTIC - effekt): ln P y 1 P 1 = 1 X ' ln P y 2 P 2 = 2 X ' ln P y 3 P 3 = 3 X ' ln P y k =1 X ' P k P y=1 X = exp 1 X ' 1 exp 1 X ' X'β ist bei allen Ausprägungen gleich. es werden (k-1) Konstanten geschätzt und die k-te Konstante ist 1 beim Schätzen mit proc logistic muss man nichts weiter angeben!

3 Test Proportional Odds: H 0 : alle β i sind gleich Globale Nullhypothese: H 0 : alle β i sind 0 Ordinales Probit (PROC PROBIT - dummy): P y k X =P y k P y k X =P X ' k P y k X =P k X ' P y k X = k X ' letzte Kategorie ausrechnen: P y=k X =1 P y 3 X bei SAS ist 1 =0 Loglineares Modell (PROC CATMOD) Alle Variablen sind kategorial. - ln ij = 0 i A j B ij AB Interpretation: Koeffizienten im Output positiv: dann kann man sagen, dass die jeweilige Kombination häufig auftritt. Koeffizienten im Output negativ: dann kann man sagen, dass die jeweilige Kombination nicht so häufig auftritt.

4 SAS MERKBLATT Effekt- oder Dummy-Codierung? proc logistic: Effekt-Codierung proc catmod: Effekt-Codierung proc genmod: Dummy-Codierung proc probit: Dummy-Codierung PROC LOGISTIC/PROBIT proc logistic/probit data=a.datensatz; class w x y z; model y = w x z; run; Darauf achten, was modelliert wird! P Y =1 P Y =0 oder P Y =0 P Y =1 bzw. was ist Y = 1, Y = 0? PROC GENMOD proc genmod <Data = a.datensatz>; class <alle kategorialen Variablen>; model y = x w z... /dist=normal link=identity; run; Logit: /dist=binomial link=logit; Probit: /dist=binomial link=probit; Poisson: /dist=poisson link=log; Linear: /dist=normal link=identity;

5 PROC CATMOD proc catmod <data=a.datensatz>; model B*E*F = _RESPONSE_; loglin B E F; loglin B E F; loglin B E B F; run; quit; Multinomiales Logit mit PROC LOGISTIC proc logistic <data=a.datensatz>; class...; model y = w x z /link=glogit; run; LOGIT mit PROC PROBIT ausrechnen proc probit <data=a.datensatz>; class...; model y = x /dist=logistic; run; Output proc xxx...;...; output out=a.datensatz p=pred; output out=a.datensatz p=pred STDRESCHI=reschi; nur bei genmod!! run; quit; Overdispersion/Skalenparameter model... /scale=pearson;

6 Overdispersion liegt vor, wenn die Daten mehr streuen als durch das Modell erklärt werden kann. Eigentlich nur relevant bei Poisson-Verteilung. wenn < 1 Underdispersion wenn = 1 keine wenn > 1 Overdispersion Im SAS-Output wird ausgewiesen. Man muss also die Zahl aus dem Output noch quadrieren! Durch den Skalen-Parameter werden die Standard-Fehler größer. Wahrscheinlichkeiten in SAS ausrechnen wkt = cdf ('CHISQUARE', Stelle, Freiheitsgrade) wkt = cdf ('NORMAL', Stelle, Erwartungswert, Varianz) wkt = cdf ('F', Stelle, p 1 p 0, n p 1 ) p-wert = 1 cdf (...) wkt = cdf (...) Devianz Die Devianz ist ein Maß für die Güte des Modells. Formel zur Berechnung: D=2 l y ; y l µ ; y y = saturiertes Modell, µ = kleineres Modell Hohe p-werte erwünscht. (kleine p-werte verwerfen die Nullhypothese) Man kann sie nur benutzen, wenn man ausschließlich kategoriale Variablen hat!

7 Likelihood-Ratio-Test ( 2 -verteilt) 2 Möglichkeiten: entweder man vergleicht mit dem saturierten Modell, oder man vergleicht 2 unterschiedliche Modelle miteinander LR=2 loglhood saturiert loglhood geschätzt H 0 : Modell passt H 1 : Modell passt nicht Hohe p-werte erwünscht. (kleine p-werte verwerfen die Nullhypothese) F-Test, wenn der Skalenparameter geschätzt wurde F= Dkl D gr p 1 p 0 Residual-Analyse zum überprüfen ob das Modell passt. Kleine Residuen => Modell passt! nur möglich bei proc genmod! Graphische Modelle bedeutet unabhängig bedeutet gegeben Effekt- & Dummy-Codierung Dummy-Codierung Dummyvariablen erzeugen -> für jedes Merkmal eine eigene Variable => aber eine (die Referenzkategorie) wird nicht ins Modell aufgenommen

8 Effekt-Codierung Referenzkategorie wird keine eigene Variable im Modell, es gibt immer eine Variable zu wenig. Diese wird berechnet durch p 1 p = i i=0 Beispiel: lagegut= Offset-Variable (die negative Summe der anderen Koeffizienten) 1 lage=2 gute Wohnlage 1 lage=1 Referenzkategorie 0 sonst Wenn man in einem Modell eine Rate als abhängige Variable hat, dann gilt: y ln months = X ' - Problem: die Rate ist dann nicht mehr so verteilt, wie Y! Lösung: ln y ln months =X ' ln y = X ' ln months Offset ist eine Variable, deren Koeffizient gleich 1 ist. Der Koeffizient wird nicht geschätzt.

5.Tutorium Generalisierte Regression

5.Tutorium Generalisierte Regression 5.Tutorium Generalisierte Regression - Multinomiales/Kummulatives Logit-Modell - Cynthia Huber: 09.12.2014 und 16.12.2014 Michael Hanselmann: 18.12.2014 Institut für Statistik, LMU München 1 / 16 Gliederung

Mehr

Logistische Regression in SAS

Logistische Regression in SAS Logistische Regression in SAS Oliver Kuß Medizinische Universitätsklinik, Abt. Klinische Sozialmedizin, Bergheimer Str. 58, 69115 Heidelberg, email: okuss@med.uni-heidelberg.de 3. Konferenz für SAS -Anwender

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Kontingentabellenanalyse

Kontingentabellenanalyse Kontingentabellenanalyse 1. Elementares Ausgangsbasis ist zunächst eine 2-dimensionale Kontingenztabelle mit den Häufigkeiten b 1 b j b l Summe a 1 n 11 n1j... n 1l n1* a i n i1 n ij n il n i* a k n k1

Mehr

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen.

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen. Fach: Prüfer: Mikroökonometrie Prof. Regina T. Riphahn, Ph.D. Masterprüfung Vorbemerkungen: Bearbeitungszeit: 60 Minuten. Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur

Mehr

Klassen diskreter Variablen

Klassen diskreter Variablen Modelle diskreter Variablen Klassen diskreter Variablen binär multinomial Weitere Klassifizierung multinomialer diskreter Variablen: kategorial y = 1, falls Einkommen < 3000 e. y = 2, falls Einkommen zw.

Mehr

Ordinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick

Ordinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick Kap. 6: Ordinale abhängige Variablen Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick 6.1 Einführung Typische ökonomische Beispiele für ordinale abhängige Variablen: Bildungsniveau

Mehr

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Bivariate Analyseverfahren

Bivariate Analyseverfahren Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs

Mehr

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)

Mehr

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung 1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen

Mehr

Logit-Analyse mit ordinalen und nominalen abhängigen Variablen

Logit-Analyse mit ordinalen und nominalen abhängigen Variablen Logit-Analyse mit ordinalen und nominalen abhängigen Variablen Regressionsmodelle für Politikwissenschaftler Übersicht Das multinomiale Logit-Modell Das konditionale Logit-Modell Regressionsmodelle für

Mehr

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

6. Multivariate Verfahren Übersicht

6. Multivariate Verfahren Übersicht 6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression

Mehr

Biometrie. Regressionsmodelle

Biometrie. Regressionsmodelle 1 Regressionsmodelle Einflussgrößen Zielgröße (Alter, Geschlecht Blutdruck) Zielgröße entscheidet über das Regressionsmodell stetige Zielgröße lineare Regression binäre Zielgröße logistische Regression

Mehr

Zahl der Kreditpunkte, die Sie erwerben möchten: 3 CP 4 CP 6 CP

Zahl der Kreditpunkte, die Sie erwerben möchten: 3 CP 4 CP 6 CP Klausur in Mikroökonometrie am 26.07.2006 Hinweise: (1) Teil 1 (90 Punkte) muss von allen gelöst werden, Teil 2 (30 Punkte) nur von denjenigen, die 4 oder 6 CP erwerben wollen. (2) Die Punktverteilung

Mehr

Häufigkeitsverteilungen

Häufigkeitsverteilungen Häufigkeitsverteilungen Eine Häufigkeitsverteilung gibt die Verteilung eines erhobenen Merkmals an und ordnet jeder Ausprägung die jeweilige Häufigkeit zu. Bsp.: 100 Studenten werden gefragt, was sie studieren.

Mehr

1.6 Der Vorzeichentest

1.6 Der Vorzeichentest .6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen

Mehr

Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13

Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13 Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression Robin Ristl Wintersemester 2012/13 1 Exakter Test nach Fisher Alternative zum Chi-Quadrat Unabhängigkeitstest

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung Institut für Soziologie Dipl.-Soz. Methoden 2 Ausblick; Darstellung von Ergebnissen; Wiederholung Ein (nicht programmierbarer) Taschenrechner kann in der Klausur hilfreich sein. # 2 Programm Ausblick über

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008 L. Fahrmeir, G. Walter Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 7. Februar 8 Hinweise:. Überprüfen

Mehr

VO Biostatistik im WS 2006/2007

VO Biostatistik im WS 2006/2007 VO Biostatistik im WS 2006/2007 1 Beispiel 1: Herzerkrankungsdaten aus Framingham für skoeffizienten : Leukemie-Daten 2 Beispiel 1: Herzerkrankungsdaten aus Framingham Stichprobe: 1329 männliche Bewohner

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Poisson Regression. Verallgemeinerte Lineare Modelle (GLMs)

Poisson Regression. Verallgemeinerte Lineare Modelle (GLMs) Poisson Regression Verallgemeinerte Lineare Modelle (GLMs) 28.11.2011 Poisson Regression Aus der Einführungsvorlesung Poisson-Verteilung ist in der Regel gut geeignet, um Anzahlen zu modellieren. Frage

Mehr

Logistische Regression

Logistische Regression Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum

Mehr

D-CHAB Frühlingssemester 2017 T =

D-CHAB Frühlingssemester 2017 T = D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Poisson Regression & Verallgemeinerte lineare Modelle

Poisson Regression & Verallgemeinerte lineare Modelle Poisson Regression & Verallgemeinerte lineare Modelle 20.11.2017 Motivation Ausgangslage Wir haben Anzahldaten (count data) Y i, cf. Vorlesung zu kategoriellen Variablen. Zu jeder Beobachtung Y i haben

Mehr

Aufgaben Klausur Statistik WiSe 2014/15 1. Termin (gesamt: 40 Punkte)

Aufgaben Klausur Statistik WiSe 2014/15 1. Termin (gesamt: 40 Punkte) Aufgaben Klausur Statistik WiSe 2014/15 1. Termin (gesamt: 40 Punkte) Aufgabe 1 (20 Punkte) Aufgabe 1: varibale/prädiktor 1 = soziale Situation (x). Kodiert in: "Situation1": situation mit den ausprägungen

Mehr

6.4 Der Kruskal-Wallis Test

6.4 Der Kruskal-Wallis Test 6.4 Der Kruskal-Wallis Test Der Test von Kruskal und Wallis, auch H-Test genannt, ist ein Test, mit dem man die Verteilungen von Teilstichproben auf Unterschiede untersuchen kann. Bei diesem Test geht

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen:

Pobeklausur: Einführung in die Ökonometrie. 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: Gesamtpunktzahl: 96 Pobeklausur: Einführung in die Ökonometrie 1. (20 Punkte) Wir betrachten 2 (in den Koeffizienten) lineare Modelle mit folgenden Variablen: cigs: gerauchte Zigaretten pro Tag educ: Bildung

Mehr

T-Test für unabhängige Stichproben

T-Test für unabhängige Stichproben T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa

Mehr

Logistische Regression (in SPSS)

Logistische Regression (in SPSS) Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Logistische Regression (in SPSS) Stand: April 2015 (V2.0) Inhaltsverzeichnis 1. Grundlagen 3 2. Logit-Funktion

Mehr

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode? Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage

Mehr

1 Einführung Ökonometrie... 1

1 Einführung Ökonometrie... 1 Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Analysen politikwissenschaftlicher Datensätze mit Stata

Analysen politikwissenschaftlicher Datensätze mit Stata Analysen politikwissenschaftlicher Datensätze mit Stata Sitzung 7: Komplexe Fehlerstrukturen, Interaktionen, Hypothesen über Koeffizienten, ordinale und nominale abhängige Variablen 1 Vorbereitung Bitte

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Die Regressionsanalyse

Die Regressionsanalyse Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige

Mehr

Wahrscheinlichkeit und Statistik: Zusammenfassung

Wahrscheinlichkeit und Statistik: Zusammenfassung HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1

Mehr

Nutzung der Wirkungsgradberechnung nach ABBOTT und HENDERSON-TILTON in der angewandten Agrarforschung

Nutzung der Wirkungsgradberechnung nach ABBOTT und HENDERSON-TILTON in der angewandten Agrarforschung Crop Protection Global Research and Development Nutzung der Wirkungsgradberechnung nach ABBOTT und HENDERSON-TILTON in der angewandten Agrarforschung Limburgerhof, 30.06.2011 Andreas Büchse (APR/PK) andreas.buechse@basf.com

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die Induktive Statistik: Regressionsanalyse Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse

Mehr

Statistik II für Betriebswirte Vorlesung 11

Statistik II für Betriebswirte Vorlesung 11 Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 08. Januar 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:

Mehr

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen Vorlesung: Multivariate Statistik für Psychologen 7. Vorlesung: 05.05.2003 Agenda 2. Multiple Regression i. Grundlagen ii. iii. iv. Statistisches Modell Verallgemeinerung des Stichprobenmodells auf Populationsebene

Mehr

Ein SAS -Makro zur Schätzung des Stereotype Regressionsmodells

Ein SAS -Makro zur Schätzung des Stereotype Regressionsmodells Ein SAS -Makro zur Schätzung des Stereotye Regressionsmodells Oliver Kuß Abt. Klinische Sozialmedizin, Universitätsklinikum Heidelberg, Bergheimer Str. 58, 69115 Heidelberg Oliver_Kuss@med.uni-heidelberg.de

Mehr

Tutorial:Unabhängigkeitstest

Tutorial:Unabhängigkeitstest Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

Datenanalyse mit Excel und Gretl

Datenanalyse mit Excel und Gretl Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen

Mehr

Multiple Lineare Regression (Forts.) Residualanalyse (1)

Multiple Lineare Regression (Forts.) Residualanalyse (1) 6. Multivariate Verfahren Lineare Regression Multiple Lineare Regression (Forts.) Residualanalyse (1) Studentisierte Residuen (Option R) r i = e i s 1 h ii e i = y i ŷ i (Residuen) sind korreliert, var

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilung diskreter Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Masterprüfung. Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Masterprüfung. Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung: Masterprüfung Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur besteht aus 4 Aufgaben,

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2 Programm Wiederholung der

Mehr

THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ

THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN  TORSTEN SCHOLZ W THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI W Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training Dr. Torsten Scholz

Mehr

W-Rechnung und Statistik für Ingenieure Übung 8

W-Rechnung und Statistik für Ingenieure Übung 8 W-Rechnung und Statistik für Ingenieure Übung 8 Aufgabe 1 : Motivation Anhand von Daten soll eine Aussage über die voraussichtliche Verteilung zukünftiger Daten gemacht werden, z.b. die Wahrscheinlichkeit

Mehr

Logistische Regression

Logistische Regression Logistische Regression Teil 2: Beispiel Dirk Enzmann Fortgeschrittene quantitative Methoden der Kriminologie 29.04.206 Universität Hamburg Dirk Enzmann (Hamburg) Logistische Regression UHH, 29.04.206 /

Mehr

Logistische Regression

Logistische Regression Logistische Regression 13.11.2017 Motivation Regressionsrechnung: Untersuchung des Zusammenhangs zwischen einer (oder mehreren) Zielvariablen und einer oder mehreren erklärenden Variablen. Bisher gesehen:

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr

Schätzung kumulativer Wahrscheinlichkeiten geordneter kategorialer Daten bei festgelegter Kategorienanzahl und unterschiedlich leeren Klassen

Schätzung kumulativer Wahrscheinlichkeiten geordneter kategorialer Daten bei festgelegter Kategorienanzahl und unterschiedlich leeren Klassen Mathematische Statistik Schätzung kumulativer Wahrscheinlichkeiten geordneter kategorialer Daten bei festgelegter Kategorienanzahl und unterschiedlich leeren Klassen Karen Höltl Katrin Thamm Martin-Luther-Universität

Mehr

Stochastik für die Naturwissenschaften

Stochastik für die Naturwissenschaften Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger 7. n (Konvergenz, LLN, CLT) Literatur Kapitel 7 n heisst für uns n gross * Statistik in Cartoons: Kapitel 5, Seite 114 in Kapitel 6 * Stahel:

Mehr

Das log-lineare Bradley-Terry Model

Das log-lineare Bradley-Terry Model Das log-lineare Bradley-Terry Model Eine Messung von wechselseitigen Erwartungen zwischen Universitätsbediensteten Daniela Weber, Maria Weiler Überblick 1 Grundidee Ordinalität und Unabhängige Variablen

Mehr

1 Analyse von Kontigenztafeln: Das loglineare Modell

1 Analyse von Kontigenztafeln: Das loglineare Modell Übung zur Vorlesung Kategoriale Daten Blatt 3 Gerhard Tutz, Moritz Berger WiSe 15/16 1 Analyse von Kontigenztafeln: Das loglineare Modell Aufgabe 12 Analyse des Datensatzes EyeColor (a) Visualisierung

Mehr

Kategorielle Daten. Seminar für Statistik Markus Kalisch

Kategorielle Daten. Seminar für Statistik Markus Kalisch Kategorielle Daten Markus Kalisch 1 Phase 3 Studie: Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Grundfrage: Sind Heilung und Medikamentengabe unabhängig?

Mehr

Logistische Regression: Reaktivierungsscore

Logistische Regression: Reaktivierungsscore Logistische Regression: Reaktivierungsscore Stand: April 2017 Prof. Dr. Oliver Schwarz Hochschule Heilbronn, diupp Philipp Gassen Hochschule Heilbronn, DYMATRIX 1 Agenda Methodik Problemstellung Anwenden

Mehr

Probeklausur für die Abschlussklausur Statistik II

Probeklausur für die Abschlussklausur Statistik II Georg-August-Universität Göttingen Methodenzentrum Sozialwissenschaften Probeklausur für die Abschlussklausur Statistik II Nachname: Vorname: Matrikelnummer: Studiengang bitte ankreuzen BA: Diplom: Magister:

Mehr

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen

Mehr

Epidemiologie / Biometrie

Epidemiologie / Biometrie Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Berechnung des LOG-RANK-Tests bei Überlebenskurven

Berechnung des LOG-RANK-Tests bei Überlebenskurven Statistik 1 Berechnung des LOG-RANK-Tests bei Überlebenskurven Hans-Dieter Spies inventiv Health Germany GmbH Brandenburger Weg 3 60437 Frankfurt hd.spies@t-online.de Zusammenfassung Mit Hilfe von Überlebenskurven

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Analyse kategorialer Variablen Schriftliche Ausarbeitung des Referats vom 23. Mai 2002

Analyse kategorialer Variablen Schriftliche Ausarbeitung des Referats vom 23. Mai 2002 Universität Tübingen Tübingen, im Mai 2002 Geographisches Institut Sommersemester 2002 Seminar Verarbeitung Geographischer Daten Dozent: Dr. H.-J. Rosner Referenten: Katrin Oehlkers, Helke Neuendorff,

Mehr

Wiederholungsübungen zu den Kapiteln 7 bis 11

Wiederholungsübungen zu den Kapiteln 7 bis 11 Mittelwert-Tests Übung Wiederholungsübungen zu den Kapiteln 7 bis 11 In dieser Übung wird der Datensatz 4 verwendet. In dem (fiktiven) Datensatz sind für 50 Personen vier Variablen erfasst: das Geschlecht,

Mehr

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt

Mehr

Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.

Mehr

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret.

Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. Grundlagen der Statistik 25.9.2014 7 Aufgabe 7 Welche der folgenden Aussagen sind richtig? (x aus 5) A Ein metrisches Merkmal, das überabzählbar viele Ausprägungen besitzt heißt diskret. B Ein Merkmal

Mehr