Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen

Größe: px
Ab Seite anzeigen:

Download "Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen"

Transkript

1 Workshop der AG Statistische Methoden in der Medizin Magdeburg, Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen Ulrich Gehrmann 1, Oliver Kuß 2, Jürgen Wellmann 3, Ralf Bender 1,4 1 Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen, Köln 2 Institut für medizinische Epidemiologie, Biometrie und Informatik der Universität Halle-Wittenberg 3 Institut für Epidemiologie und Sozialmedizin der Universität Münster 4 Medizinische Fakultät der Universität Köln

2 Übersicht NNEs und Risikodifferenzen Regressionsmodelle für Risikodifferenzen: - Linear Probability Model (mit Nebenbedingungen) - Klassische lineare Regression - Logistische Regression mit Average Risk Difference Approach Simulationsstudie der verschiedenen Modelle Einbezug von Interaktion ins lineare Modell 2 Fazit

3 NNEs und Risikodifferenzen Daten: Binäre Zielgröße Y (0/1, z.b. Herzinfarkt) Binäre Exposition E (0/1, z.b. Rauchen) 3 Ggf. weitere stetige Einflussgrößen X j (z.b. Alter, hier Beschränkung auf eine Kovariable X) Ziel: Geeignetes Effektmaß: Welchen Einfluss hat die Exposition auf die Zielgröße? Klassisches Effektmaß: Odds Ratio (OR), jedoch nicht leicht zu interpretieren. Anschaulichere Alternative: Risikodifferenz (RD = P(Y=1 E=1) P(Y=1 E=0))

4 NNEs und Risikodifferenzen Noch anschaulicher sind die Impact numbers, z.b. Number needed to be exposed (NNE) NNE = 1/RD 4 Interpretation des NNE z.b.: Unter durchschnittlich wie vielen Rauchern hat einer einen Herzinfarkt aufgrund des Rauchens bekommen? Das Konfidenzintervall für das NNE kann man aus den Konfidenzgrenzen für die RD herleiten: [NNE u ;NNE o ] = [1/RD o ;1/RD u ] Der statistische Test (p-wert) für das NNE ist äquivalent zum Test für die RD.

5

6 Risikodifferenzen im wahren Modell Neben den Regressionsmodellen wird ein wahres Modell angenommen, bei dem es für jedes e und x definierte Wahrscheinlichkeiten P(Y=1 E=e, X=x) gibt. Damit sind für jedes x auch RDs definiert: RD(x) = P(Y=1 E=1, X=x) P(Y=1 E=0, X=x) 6 Def: Die RD einer Gruppe (z.b. die Exponierten) ist der Mittelwert der RD(x) über alle x, die in dieser Gruppe vorkommen. Bei einem wahren logistischen Modell unterscheiden sich die RDs in der Regel zwischen den Gruppen. Bei einem wahren linearen Modell gibt es nur eine RD, und diese ist durch den Abstand der beiden Regressionsgeraden bestimmt.

7 Linear Probability Model (LPM) Def.: Ein LPM ist ein GLM mit: Y i ~ Bi(1,π i ) E(Y i ) = π i = α + e i β + x i γ NB: π i [0;1] i {1,,n} 7 Bem.: Abgrenzung zur linearen Regression: Binomialverteilung Abgrenzung zur logistischen Regression: Identische Linkfunktion RD = β

8 Linear Probability Model (LPM) Algorithmus: Maximiere die Log-Likelihood: n log(l( α, β, γ)) y log( α+ e β+ x γ ) + (1 y )log(1 ( α+ e β+ x γ)) i= 1 Unter der Nebenbedingung: 6 6 ( α+ eiβ+ x iγ) 10 ;1 10 i {1,..., n} i i i i i i Das geringfügige Verkleinern des Intervalls für die NB bewirkt, dass log(0) in der Berechnung vermieden wird. 8 Implementierung in SAS: Mit PROC IML und CALL NLPNRA (Nichtlineare Optimierung mit der Newton-Raphson- Methode und Nebenbedingungen)

9 Klassische lineare Regression (LM) Def.: Ein LM ist ein GLM mit: Y i ~ N(π i, σ 2 ) E(Y i ) = π i = α + e i β + x i γ Motivation: Zwar können dadurch die Schätzungen ŷ i für die Ränder des Kovariablen-Bereichs aus [0;1] herauslaufen. 9 Interessiert man sich jedoch nur für den Effekt der Exposition (RD bzw. NNE), kann man dies evtl. ignorieren (falls der Effektschätzer gut ist!).

10 Average Risk Difference Approach (ARDA) Def.: Das Modell des ARDA ist die logistische Regression: Y i ~ Bi(1,π i ) E(Y i ) = π i = π(α + e i β + x i γ) mit π(a) = exp(a) / (1 + exp(a)); a (logistische Funktion) Wähle eine Gruppe aus, z.b. die Nicht-Exponierten. Bestimme die RD(x i ) = π(α + β + x i γ) - π(α + x i γ) für alle x i, die in dieser Gruppe vorkommen. Der Mittelwert dieser RD(x i ) ist die gesuchte RD. 10 Hier gibt es 2 unterschiedliche RDs für Nicht-Exponierte, wenn sie exponiert gewesen wären Exponierte, wenn sie nicht exponiert gewesen wären Sinnvoll bei unterschiedlichen Kovariablen-Verteilungen der Exponierten und Nicht-Exponierten (Confounding).

11 Rohes Vergleichsmodell Def.: Das rohe Modell ist definiert: Y i ~ Bi(1,π i ) E(Y i ) = π i = α + e i β Die RD ist einfach die Differenz der beobachteten Risiken in den beiden Gruppen. 11

12 Simulationsstudie der verschiedenen Modelle Wahres logistisches Modell: Intercept = -10, OR e = 3, OR x = Exponierte (e i =1), 1000 Nicht-Exponierte (e i =0) X i ~ N(μ 0 ;σ 2 ) bzw. N(μ 1 ;σ 2 ), je nach Expositionsstatus 2 Situationen: μ 1 = μ 0 = 45 μ 1 = 40; μ 0 = 45 (Confounding) (RDs werden immer für Nicht-Exponierte berechnet.) In jeder Situation 5 Standardabweichungen σ (1, 2, 3, 5, 8). 12 Somit 10 Simulationsmodelle mit vorgegebenen e i und x i. Jeweils 1000 Simulationsläufe (Simulationen der y i ).

13 Simulationsstudie der verschiedenen Modelle Entsprechend: Wahres lineares Modell : Intercept = 0, RD e = 0.18, RD x = 0.01 Parameter hier so gewählt, dass: RD e die gleiche Größenordnung hat wie die durchschnittliche RD im wahren logistischen Modell die simulierten y i nicht aus [0;1] herauslaufen. 13

14 Simulationsstudie der verschiedenen Modelle Bemerkungen zu den Ergebnissen: Es wurden Wald sche Konfidenzintervalle berechnet. Es werden jeweils die Überdeckungswahrscheinlichkeit und der relative Bias (RD) dargestellt (alles in Prozent). Die Überdeckungswahrscheinlichkeit bezieht sich sowohl auf die RD als auch auf das NNE. 14 Der relative Bias des NNE unterscheidet sich grundsätzlich von dem der RD. In dieser Studie waren die Unterschiede jedoch gering, daher wird hier in der Regel nur der RD-Bias dargestellt. Bei gravierenden Abweichungen wird der relative Bias des NNE gesondert dargestellt, s. weiter unten.

15 Simulation logistischer Modelle ohne Confounding (μ 1 = μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung

16 Simulation logistischer Modelle mit Confounding (μ 1 = 40; μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung

17 Simulation linearer Modelle ohne Confounding (μ 1 = μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung

18 Simulation linearer Modelle mit Confounding (μ 1 = 40; μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung

19 Erste Zusammenfassung Im wahren linearen Modell sind LPM, LM und ARDA gleich gut. Für das wahre logistische Modell gilt: Das LPM hat erhebliche Probleme, insbesondere bei großen Varianzen der x-variablen. Wenn kein Confounding vorliegt, sind LM und ARDA gleich gut (!), und dabei vergleichbar mit dem rohen Modell, welches allerdings etwas breitere Konfidenzintervalle liefert. 19 Bei Confounding liefert nur der ARDA gute Ergebnisse.

20 Einbezug von Interaktion ins LM Ansatzpunkt zur Verbesserung des LM: Beim ARDA werden zwei unterschiedliche RDs für die Exponierten bzw. Nicht-Exponierten geschätzt, abhängig von der Kovariablen-Verteilung in der jeweiligen Gruppe. Vorteil des ARDA, falls das wahre Modell logistisch (oder zumindest nichtlinear) ist. Problem beim LM: Es wird eine einheitliche RD geschätzt. Abhilfe: Einführung eines Interaktions-Terms δ zwischen Expositionsstatus und Kovariable ins Modell: 20 E(y i ) = π i = α + e i β + x i γ + e i x i δ

21 Einbezug von Interaktion ins LM Berechnung einer RD analog zum ARDA: Wähle eine Gruppe aus, z.b. die Nicht-Exponierten. Für alle x i, die in dieser Gruppe vorkommen, gilt: RD(x i ) = β + x i δ Gesuchte RD dann einfacher zu bestimmen als im ARDA: Sei x NE der Mittelwert der x i der Nicht-Exponierten. Dann gilt für die Risikodifferenz RD NE der Nicht- Exponierten: RD NE = β + x NE δ 21 Einfache Implementierung in SAS: 1.) Berechnung von x NE, z.b. Einzeiler in PROC SQL. 2.) PROC GENMOD oder GLM mit ESTIMATE-Statement unter Angabe des berechneten x NE. Keine weiteren Berechnungen erforderlich!

22 Einbezug von Interaktion ins LM: Ergebnisse bei Simulation logistischer Modelle mit Confounding (μ 1 = 40; μ 0 = 45) LM ARDA LM+Interaktion LM ARDA LM+Interaktion Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung

23 Einbezug von Interaktion ins LM: NNE-Bias bei Simulation logistischer Modelle mit Confounding (μ 1 = 40; μ 0 = 45) 23 NNE-Bias zeigt hier für σ=1 eine andere Tendenz als sonst. Grund liegt in RD-Schätzungen nahe bei 0, was sehr große NNE-Schätzungen ergibt. Vier RD-Schätzungen waren sogar < 0 und mussten daher bei der Berechnung des NNE-Bias weggelassen werden. Für größere σ: Bestätigung der bisherigen Resultate. Relativer Bias des NNE LM ARDA LM+Interaktion Standardabweichung

24 Fazit Die logistische Regression mit ARDA hat sich als stabilster Ansatz zur RD- bzw. NNE-Schätzung erwiesen. Falls kein Confounding vorliegt, ist das klassische LM eine vollwertige Alternative. Im Confounding-Fall fällt auch das LM ab. Es kann zwar durch den Einbezug von Interaktionen verbessert werden, ist aber dem ARDA auch dann nicht ebenbürtig. Das LPM hat insgesamt deutlich schlechter abgeschnitten. 24 Ausblick: Simulationen mit mehr als einer stetigen Variablen. Transformation der Kovariablen im LM mit Interaktionen, z.b. durch fraktionale Polynome (um Unabhängigkeit von der Linkfunktion zu erreichen).

25 Literatur 1. Wacholder S, Binomial Regression in GLIM: Estimating Risk Ratios and Risk Differences. Am J Epidemiol 123: Bender R, Kuß O, Hildebrandt M, Gehrmann U, Estimating adjusted NNT measures in logistic regression analysis. Stat Med (accepted for publication) Gehrmann U, Bender R, Kuß O, Wellmann J, Vergleich von logistischen und linearen Regressionsmodellen zur Berechnung von adjustierten NNEs (number needed to be exposed). Abstract-Band der ersten gemeinsamen Tagung der Deutschen Arbeitsgemeinschaft Statistik: 113.

Logistische Regression in SAS

Logistische Regression in SAS Logistische Regression in SAS Oliver Kuß Medizinische Universitätsklinik, Abt. Klinische Sozialmedizin, Bergheimer Str. 58, 69115 Heidelberg, email: okuss@med.uni-heidelberg.de 3. Konferenz für SAS -Anwender

Mehr

Die Berechnung adjustierter NNTs in randomisierten kontrollierten Studien

Die Berechnung adjustierter NNTs in randomisierten kontrollierten Studien Klinische/Epidemiologische Anwendungen I Die Berechnung adjustierter NNTs in randomisierten kontrollierten Studien Ralf Bender Volker Vervölgyi Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen

Mehr

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle

Mehr

Berechnung von Konfidenzintervallen für Impact Numbers aus Fall-Kontroll und Kohorten-Studien

Berechnung von Konfidenzintervallen für Impact Numbers aus Fall-Kontroll und Kohorten-Studien Berechnung von Konfidenzintervallen für Impact Numbers aus Fall-Kontroll und Kohorten-Studien Mandy Hildebrandt 1,2, Ralf Bender 1 und Maria Blettner 2 1 Institut für Qualität und Wirtschaftlichkeit im

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Logistische Regression

Logistische Regression Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum

Mehr

Punkt- und Intervallschätzung adjustierter NNT-Maße im Cox-Modell mit Hilfe von SAS

Punkt- und Intervallschätzung adjustierter NNT-Maße im Cox-Modell mit Hilfe von SAS Punkt- und Intervallschätzung adjustierter NNT-Maße im Cox-Modell mit Hilfe von SAS Statistik I Anke Welz Ralf Bender RheinAhrCampus Remagen, Hochschule Koblenz Institut für Qualität und Wirtschaftlichkeit

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Logistische Regression

Logistische Regression Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation

Mehr

Vorschläge und Ansätze zur Darstellung von Studienergebnissen mithilfe des Effektmaßes Number Needed to Treat (NNT) Arbeitspapier

Vorschläge und Ansätze zur Darstellung von Studienergebnissen mithilfe des Effektmaßes Number Needed to Treat (NNT) Arbeitspapier IQWiG-Berichte Nr. 61 Vorschläge und Ansätze zur Darstellung von Studienergebnissen mithilfe des Effektmaßes Number Needed to Treat (NNT) Arbeitspapier Auftrag: GA05-03 Version: 1.0 Stand: IQWiG-Berichte

Mehr

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen Anhang 4 Bias durch Überdiagnose von papillären Mikrokarzinomen Bias durch Überdiagnose von papillären Mikrokarzinomen H. Bertelsmann AG Epidemiologie und Medizinische Statistik Universität Bielefeld Dezember

Mehr

Ein SAS -Makro zur Schätzung des Stereotype Regressionsmodells

Ein SAS -Makro zur Schätzung des Stereotype Regressionsmodells Ein SAS -Makro zur Schätzung des Stereotye Regressionsmodells Oliver Kuß Abt. Klinische Sozialmedizin, Universitätsklinikum Heidelberg, Bergheimer Str. 58, 69115 Heidelberg Oliver_Kuss@med.uni-heidelberg.de

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

After Work Statistics

After Work Statistics After Work Statistics Robert Röhle Institute of Biometry and Clinical Epidemiology robert.roehle@charite.de U N I V E R S I T Ä T S M E D I Z I N B E R L I N Institut für Biometrie und klinische Epidemiologie

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Lineare Regression. Kapitel Regressionsgerade

Lineare Regression. Kapitel Regressionsgerade Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau

Mehr

Datenabhängiges, modellbasiertes Gruppieren von binären longitudinalen Verläufen am Beispiel der Neurodermitis

Datenabhängiges, modellbasiertes Gruppieren von binären longitudinalen Verläufen am Beispiel der Neurodermitis Datenabhängiges, modellbasiertes Gruppieren von binären longitudinalen Verläufen am Beispiel der Neurodermitis Oliver Kuß*; Cora Gromann*; Thomas L. Diepgen**; *Institut für Medizinische Epidemiologie,

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die Induktive Statistik: Regressionsanalyse Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse

Mehr

19 Punkte. Aufgabe 1. Einkommen niedrig mittel hoch Männer Frauen Geschlecht. a) Bestimmen Sie die fehlenden Werte!

19 Punkte. Aufgabe 1. Einkommen niedrig mittel hoch Männer Frauen Geschlecht. a) Bestimmen Sie die fehlenden Werte! Aufgabe 1 19 Punkte Sie haben die Einkommensdaten von 369 Personen gegeben. Diese wurden in die Gehaltsgruppen niedrige, mittlere und hohe Einkommensklassen kategorisiert - jeweils nach Frauen und Männer

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

After Work Statistics

After Work Statistics After Work Statistics Maja Krajewska Institute of Biometry and Clinical Epidemiology maja.krajewska@charite.de U N I V E R S I T Ä T S M E D I Z I N B E R L I N Institut für Biometrie und klinische Epidemiologie

Mehr

8 Allgemeine Modelle & Robuste Regression

8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell 182 8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell a Modell. Y i F µ i, γ, g µ i = η i = x T i β b Weibull-Verteilung.

Mehr

VO Biostatistik im WS 2006/2007

VO Biostatistik im WS 2006/2007 VO Biostatistik im WS 2006/2007 1 Beispiel 1: Herzerkrankungsdaten aus Framingham für skoeffizienten : Leukemie-Daten 2 Beispiel 1: Herzerkrankungsdaten aus Framingham Stichprobe: 1329 männliche Bewohner

Mehr

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

limhatewerzeoelhiniii

limhatewerzeoelhiniii limhatewerzeoelhiniii Vorwort 13 Kapitel 1 Einleitung 15 1.1 Wozu brauchen wir Statistik? 16 1.2 Medizinische Statistik 16 1.3 Beschreibende und schließende Statistik 17 1.4 Das Buch in Kürze 17 Kapitel

Mehr

Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen

Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Alexander Siemer Abteilung Medizinische Statistik Universität Göttingen 47. Biometrisches Kolloquium

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeitsverteilungen Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet

Mehr

Einfache lineare Regression. Statistik (Biol./Pharm./HST) FS 2015

Einfache lineare Regression. Statistik (Biol./Pharm./HST) FS 2015 Einfache lineare Regression Statistik (Biol./Pharm./HST) FS 2015 Wdh: Korrelation Big picture: Generalized Linear Models (GLMs) Bisher: Population wird mit einer Verteilung beschrieben Bsp: Medikament

Mehr

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3. Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Multiple Regression III

Multiple Regression III Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen

Mehr

Stochastik Praktikum Lineare Modelle

Stochastik Praktikum Lineare Modelle Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte

Mehr

Logistische Regression

Logistische Regression Logistische Regression 13.11.2017 Motivation Regressionsrechnung: Untersuchung des Zusammenhangs zwischen einer (oder mehreren) Zielvariablen und einer oder mehreren erklärenden Variablen. Bisher gesehen:

Mehr

Klassen diskreter Variablen

Klassen diskreter Variablen Modelle diskreter Variablen Klassen diskreter Variablen binär multinomial Weitere Klassifizierung multinomialer diskreter Variablen: kategorial y = 1, falls Einkommen < 3000 e. y = 2, falls Einkommen zw.

Mehr

Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression

Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Regression Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 39 Einfache lineare Regression Bestimmung der Regressionsgerade

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Treatment-Evaluationsproblematik

Treatment-Evaluationsproblematik Treatment-Evaluationsproblematik Seminarvortrag Seminar: Statistische Herausforderungen im Umgang mit fehlenden bzw. fehlerbehafteten Daten 23.01.2015 Betreuer: Prof. Dr. Thomas Augustin Institut für Statistik

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS

Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS Birgit Hay Silvia Sander Schwabstraße 13 Schwabstraße 13 89070 Ulm 89070 Ulm Birgit.Hay@uni-ulm.de Silvia.Sander@uni-ulm.de

Mehr

Biometrie und Statistik

Biometrie und Statistik DEGRO: Refresher Biometrie und Statistik Universitätsklinik und Poliklinik für Strahlentherapie, Institut für Med. Epidemiologie, Biometrie und Informatik Martin-Luther-Universität Halle-Wittenberg Inhalt

Mehr

Ein relatives Überlebenszeitmodell für korrelierte Beobachtungen. Oliver Kuß

Ein relatives Überlebenszeitmodell für korrelierte Beobachtungen. Oliver Kuß Ein relatives Überlebenszeitmodell für korrelierte Beobachtungen Oliver Kuß Institut für Medizinische Epidemiologie, Biometrie und Informatik, Medizinische Fakultät, Martin-Luther-Universität Halle-Wittenberg,

Mehr

2.3 Intervallschätzung

2.3 Intervallschätzung 2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:

Mehr

Biometrie. Regressionsmodelle

Biometrie. Regressionsmodelle 1 Regressionsmodelle Einflussgrößen Zielgröße (Alter, Geschlecht Blutdruck) Zielgröße entscheidet über das Regressionsmodell stetige Zielgröße lineare Regression binäre Zielgröße logistische Regression

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Maximum-Likelihood Schätzung

Maximum-Likelihood Schätzung Maximum-Likelihood Schätzung VL Forschungsmethoden 1 Wiederholung Einführung: Schätzung 2 Likelihood-Schätzung und Generalisiertes Lineares Modell Zufallsverteilungen 3 Lernziele 1 Grundzüge der Likelihood-Schätzung

Mehr

Berechnung von Konfidenzintervallen für die Population Impact Number (PIN)

Berechnung von Konfidenzintervallen für die Population Impact Number (PIN) Berechnung von Konfidenzintervallen für die Population Impact Number (PIN) Ralf Bender Ulrich Grouven Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) Institut für Qualität und

Mehr

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte) Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf

Mehr

Der Gefoulte soll niemals selber schießen Empirische Untersuchung einer alten deutschen Fußballerweisheit

Der Gefoulte soll niemals selber schießen Empirische Untersuchung einer alten deutschen Fußballerweisheit Der Gefoulte soll niemals selber schießen Empirische Untersuchung einer alten deutschen Fußballerweisheit Kuß O 1, Kluttig A 1, Stoll O 2 1 Institut für Medizinische Epidemiologie, Biometrie und Informatik,

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Ordinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick

Ordinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick Kap. 6: Ordinale abhängige Variablen Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick 6.1 Einführung Typische ökonomische Beispiele für ordinale abhängige Variablen: Bildungsniveau

Mehr

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall

Mehr

Fortgeschrittene Ökonometrie: Maximum Likelihood

Fortgeschrittene Ökonometrie: Maximum Likelihood Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für

Mehr

Hypothesenbewertungen: Übersicht

Hypothesenbewertungen: Übersicht Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung

Mehr

Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1

Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1 2.1 Beispiele 2.2 Odds Ratio 2.3 Modell der logistischen Regression 2.3.1 Modellgleichung 2.3.2 Voraussetzungen 2.4 Schätzungen, Tests und Modellgüte 2.4.1 Schätzung der logistischen Regressionskoeffizienten

Mehr

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Statistik II für Betriebswirte Vorlesung 11

Statistik II für Betriebswirte Vorlesung 11 Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 08. Januar 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:

Mehr

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/ Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................

Mehr

Alternative Darstellung attributabler Risiken mit Hilfe von Impact Numbers

Alternative Darstellung attributabler Risiken mit Hilfe von Impact Numbers Alternative Darstellung attributabler Risiken mit Hilfe von Impact Numbers Mandy Hildebrandt 1,2, Ralf Bender 1 1 Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG), Köln 2 Institut

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

U N I V E R S I T Ä T S M E D I Z I N B E R L I N. After Work Statistics

U N I V E R S I T Ä T S M E D I Z I N B E R L I N. After Work Statistics U N I V E R S I T Ä T S M E D I Z I N B E R L I N After Work Statistics Institut für Biometrie und klinische Epidemiologie Wir sind Hilfsbereit und nett! als Wissenschaftler aktiv in der statistischen

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Stichproben und statistische Fehler

Stichproben und statistische Fehler Kapitel 0 Stichproben und statistische Fehler 0. Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung der Stichprobe soll dann

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Hypothesentesten, Fehlerarten und Güte 2 Literatur Kreyszig: Statistische Methoden und ihre Anwendungen, 7.

Mehr

Poisson Regression & Verallgemeinerte lineare Modelle

Poisson Regression & Verallgemeinerte lineare Modelle Poisson Regression & Verallgemeinerte lineare Modelle 20.11.2017 Motivation Ausgangslage Wir haben Anzahldaten (count data) Y i, cf. Vorlesung zu kategoriellen Variablen. Zu jeder Beobachtung Y i haben

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Schätzung im multiplen linearen Modell VI

Schätzung im multiplen linearen Modell VI Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung 0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Statistics, Data Analysis, and Simulation SS 2017

Statistics, Data Analysis, and Simulation SS 2017 Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler

Mehr

D-CHAB Frühlingssemester 2017 T =

D-CHAB Frühlingssemester 2017 T = D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme

Mehr