Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen
|
|
- Margarete Fleischer
- vor 5 Jahren
- Abrufe
Transkript
1 Workshop der AG Statistische Methoden in der Medizin Magdeburg, Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen Ulrich Gehrmann 1, Oliver Kuß 2, Jürgen Wellmann 3, Ralf Bender 1,4 1 Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen, Köln 2 Institut für medizinische Epidemiologie, Biometrie und Informatik der Universität Halle-Wittenberg 3 Institut für Epidemiologie und Sozialmedizin der Universität Münster 4 Medizinische Fakultät der Universität Köln
2 Übersicht NNEs und Risikodifferenzen Regressionsmodelle für Risikodifferenzen: - Linear Probability Model (mit Nebenbedingungen) - Klassische lineare Regression - Logistische Regression mit Average Risk Difference Approach Simulationsstudie der verschiedenen Modelle Einbezug von Interaktion ins lineare Modell 2 Fazit
3 NNEs und Risikodifferenzen Daten: Binäre Zielgröße Y (0/1, z.b. Herzinfarkt) Binäre Exposition E (0/1, z.b. Rauchen) 3 Ggf. weitere stetige Einflussgrößen X j (z.b. Alter, hier Beschränkung auf eine Kovariable X) Ziel: Geeignetes Effektmaß: Welchen Einfluss hat die Exposition auf die Zielgröße? Klassisches Effektmaß: Odds Ratio (OR), jedoch nicht leicht zu interpretieren. Anschaulichere Alternative: Risikodifferenz (RD = P(Y=1 E=1) P(Y=1 E=0))
4 NNEs und Risikodifferenzen Noch anschaulicher sind die Impact numbers, z.b. Number needed to be exposed (NNE) NNE = 1/RD 4 Interpretation des NNE z.b.: Unter durchschnittlich wie vielen Rauchern hat einer einen Herzinfarkt aufgrund des Rauchens bekommen? Das Konfidenzintervall für das NNE kann man aus den Konfidenzgrenzen für die RD herleiten: [NNE u ;NNE o ] = [1/RD o ;1/RD u ] Der statistische Test (p-wert) für das NNE ist äquivalent zum Test für die RD.
5
6 Risikodifferenzen im wahren Modell Neben den Regressionsmodellen wird ein wahres Modell angenommen, bei dem es für jedes e und x definierte Wahrscheinlichkeiten P(Y=1 E=e, X=x) gibt. Damit sind für jedes x auch RDs definiert: RD(x) = P(Y=1 E=1, X=x) P(Y=1 E=0, X=x) 6 Def: Die RD einer Gruppe (z.b. die Exponierten) ist der Mittelwert der RD(x) über alle x, die in dieser Gruppe vorkommen. Bei einem wahren logistischen Modell unterscheiden sich die RDs in der Regel zwischen den Gruppen. Bei einem wahren linearen Modell gibt es nur eine RD, und diese ist durch den Abstand der beiden Regressionsgeraden bestimmt.
7 Linear Probability Model (LPM) Def.: Ein LPM ist ein GLM mit: Y i ~ Bi(1,π i ) E(Y i ) = π i = α + e i β + x i γ NB: π i [0;1] i {1,,n} 7 Bem.: Abgrenzung zur linearen Regression: Binomialverteilung Abgrenzung zur logistischen Regression: Identische Linkfunktion RD = β
8 Linear Probability Model (LPM) Algorithmus: Maximiere die Log-Likelihood: n log(l( α, β, γ)) y log( α+ e β+ x γ ) + (1 y )log(1 ( α+ e β+ x γ)) i= 1 Unter der Nebenbedingung: 6 6 ( α+ eiβ+ x iγ) 10 ;1 10 i {1,..., n} i i i i i i Das geringfügige Verkleinern des Intervalls für die NB bewirkt, dass log(0) in der Berechnung vermieden wird. 8 Implementierung in SAS: Mit PROC IML und CALL NLPNRA (Nichtlineare Optimierung mit der Newton-Raphson- Methode und Nebenbedingungen)
9 Klassische lineare Regression (LM) Def.: Ein LM ist ein GLM mit: Y i ~ N(π i, σ 2 ) E(Y i ) = π i = α + e i β + x i γ Motivation: Zwar können dadurch die Schätzungen ŷ i für die Ränder des Kovariablen-Bereichs aus [0;1] herauslaufen. 9 Interessiert man sich jedoch nur für den Effekt der Exposition (RD bzw. NNE), kann man dies evtl. ignorieren (falls der Effektschätzer gut ist!).
10 Average Risk Difference Approach (ARDA) Def.: Das Modell des ARDA ist die logistische Regression: Y i ~ Bi(1,π i ) E(Y i ) = π i = π(α + e i β + x i γ) mit π(a) = exp(a) / (1 + exp(a)); a (logistische Funktion) Wähle eine Gruppe aus, z.b. die Nicht-Exponierten. Bestimme die RD(x i ) = π(α + β + x i γ) - π(α + x i γ) für alle x i, die in dieser Gruppe vorkommen. Der Mittelwert dieser RD(x i ) ist die gesuchte RD. 10 Hier gibt es 2 unterschiedliche RDs für Nicht-Exponierte, wenn sie exponiert gewesen wären Exponierte, wenn sie nicht exponiert gewesen wären Sinnvoll bei unterschiedlichen Kovariablen-Verteilungen der Exponierten und Nicht-Exponierten (Confounding).
11 Rohes Vergleichsmodell Def.: Das rohe Modell ist definiert: Y i ~ Bi(1,π i ) E(Y i ) = π i = α + e i β Die RD ist einfach die Differenz der beobachteten Risiken in den beiden Gruppen. 11
12 Simulationsstudie der verschiedenen Modelle Wahres logistisches Modell: Intercept = -10, OR e = 3, OR x = Exponierte (e i =1), 1000 Nicht-Exponierte (e i =0) X i ~ N(μ 0 ;σ 2 ) bzw. N(μ 1 ;σ 2 ), je nach Expositionsstatus 2 Situationen: μ 1 = μ 0 = 45 μ 1 = 40; μ 0 = 45 (Confounding) (RDs werden immer für Nicht-Exponierte berechnet.) In jeder Situation 5 Standardabweichungen σ (1, 2, 3, 5, 8). 12 Somit 10 Simulationsmodelle mit vorgegebenen e i und x i. Jeweils 1000 Simulationsläufe (Simulationen der y i ).
13 Simulationsstudie der verschiedenen Modelle Entsprechend: Wahres lineares Modell : Intercept = 0, RD e = 0.18, RD x = 0.01 Parameter hier so gewählt, dass: RD e die gleiche Größenordnung hat wie die durchschnittliche RD im wahren logistischen Modell die simulierten y i nicht aus [0;1] herauslaufen. 13
14 Simulationsstudie der verschiedenen Modelle Bemerkungen zu den Ergebnissen: Es wurden Wald sche Konfidenzintervalle berechnet. Es werden jeweils die Überdeckungswahrscheinlichkeit und der relative Bias (RD) dargestellt (alles in Prozent). Die Überdeckungswahrscheinlichkeit bezieht sich sowohl auf die RD als auch auf das NNE. 14 Der relative Bias des NNE unterscheidet sich grundsätzlich von dem der RD. In dieser Studie waren die Unterschiede jedoch gering, daher wird hier in der Regel nur der RD-Bias dargestellt. Bei gravierenden Abweichungen wird der relative Bias des NNE gesondert dargestellt, s. weiter unten.
15 Simulation logistischer Modelle ohne Confounding (μ 1 = μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung
16 Simulation logistischer Modelle mit Confounding (μ 1 = 40; μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung
17 Simulation linearer Modelle ohne Confounding (μ 1 = μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung
18 Simulation linearer Modelle mit Confounding (μ 1 = 40; μ 0 = 45): LPM LM ARDA Roh LPM LM ARDA Roh Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung
19 Erste Zusammenfassung Im wahren linearen Modell sind LPM, LM und ARDA gleich gut. Für das wahre logistische Modell gilt: Das LPM hat erhebliche Probleme, insbesondere bei großen Varianzen der x-variablen. Wenn kein Confounding vorliegt, sind LM und ARDA gleich gut (!), und dabei vergleichbar mit dem rohen Modell, welches allerdings etwas breitere Konfidenzintervalle liefert. 19 Bei Confounding liefert nur der ARDA gute Ergebnisse.
20 Einbezug von Interaktion ins LM Ansatzpunkt zur Verbesserung des LM: Beim ARDA werden zwei unterschiedliche RDs für die Exponierten bzw. Nicht-Exponierten geschätzt, abhängig von der Kovariablen-Verteilung in der jeweiligen Gruppe. Vorteil des ARDA, falls das wahre Modell logistisch (oder zumindest nichtlinear) ist. Problem beim LM: Es wird eine einheitliche RD geschätzt. Abhilfe: Einführung eines Interaktions-Terms δ zwischen Expositionsstatus und Kovariable ins Modell: 20 E(y i ) = π i = α + e i β + x i γ + e i x i δ
21 Einbezug von Interaktion ins LM Berechnung einer RD analog zum ARDA: Wähle eine Gruppe aus, z.b. die Nicht-Exponierten. Für alle x i, die in dieser Gruppe vorkommen, gilt: RD(x i ) = β + x i δ Gesuchte RD dann einfacher zu bestimmen als im ARDA: Sei x NE der Mittelwert der x i der Nicht-Exponierten. Dann gilt für die Risikodifferenz RD NE der Nicht- Exponierten: RD NE = β + x NE δ 21 Einfache Implementierung in SAS: 1.) Berechnung von x NE, z.b. Einzeiler in PROC SQL. 2.) PROC GENMOD oder GLM mit ESTIMATE-Statement unter Angabe des berechneten x NE. Keine weiteren Berechnungen erforderlich!
22 Einbezug von Interaktion ins LM: Ergebnisse bei Simulation logistischer Modelle mit Confounding (μ 1 = 40; μ 0 = 45) LM ARDA LM+Interaktion LM ARDA LM+Interaktion Überdeckungsw'keit Relativer Bias der RD Standardabweichung Standardabweichung
23 Einbezug von Interaktion ins LM: NNE-Bias bei Simulation logistischer Modelle mit Confounding (μ 1 = 40; μ 0 = 45) 23 NNE-Bias zeigt hier für σ=1 eine andere Tendenz als sonst. Grund liegt in RD-Schätzungen nahe bei 0, was sehr große NNE-Schätzungen ergibt. Vier RD-Schätzungen waren sogar < 0 und mussten daher bei der Berechnung des NNE-Bias weggelassen werden. Für größere σ: Bestätigung der bisherigen Resultate. Relativer Bias des NNE LM ARDA LM+Interaktion Standardabweichung
24 Fazit Die logistische Regression mit ARDA hat sich als stabilster Ansatz zur RD- bzw. NNE-Schätzung erwiesen. Falls kein Confounding vorliegt, ist das klassische LM eine vollwertige Alternative. Im Confounding-Fall fällt auch das LM ab. Es kann zwar durch den Einbezug von Interaktionen verbessert werden, ist aber dem ARDA auch dann nicht ebenbürtig. Das LPM hat insgesamt deutlich schlechter abgeschnitten. 24 Ausblick: Simulationen mit mehr als einer stetigen Variablen. Transformation der Kovariablen im LM mit Interaktionen, z.b. durch fraktionale Polynome (um Unabhängigkeit von der Linkfunktion zu erreichen).
25 Literatur 1. Wacholder S, Binomial Regression in GLIM: Estimating Risk Ratios and Risk Differences. Am J Epidemiol 123: Bender R, Kuß O, Hildebrandt M, Gehrmann U, Estimating adjusted NNT measures in logistic regression analysis. Stat Med (accepted for publication) Gehrmann U, Bender R, Kuß O, Wellmann J, Vergleich von logistischen und linearen Regressionsmodellen zur Berechnung von adjustierten NNEs (number needed to be exposed). Abstract-Band der ersten gemeinsamen Tagung der Deutschen Arbeitsgemeinschaft Statistik: 113.
Logistische Regression in SAS
Logistische Regression in SAS Oliver Kuß Medizinische Universitätsklinik, Abt. Klinische Sozialmedizin, Bergheimer Str. 58, 69115 Heidelberg, email: okuss@med.uni-heidelberg.de 3. Konferenz für SAS -Anwender
MehrDie Berechnung adjustierter NNTs in randomisierten kontrollierten Studien
Klinische/Epidemiologische Anwendungen I Die Berechnung adjustierter NNTs in randomisierten kontrollierten Studien Ralf Bender Volker Vervölgyi Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen
MehrEin exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann
Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle
MehrBerechnung von Konfidenzintervallen für Impact Numbers aus Fall-Kontroll und Kohorten-Studien
Berechnung von Konfidenzintervallen für Impact Numbers aus Fall-Kontroll und Kohorten-Studien Mandy Hildebrandt 1,2, Ralf Bender 1 und Maria Blettner 2 1 Institut für Qualität und Wirtschaftlichkeit im
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrLogistische Regression
Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum
MehrPunkt- und Intervallschätzung adjustierter NNT-Maße im Cox-Modell mit Hilfe von SAS
Punkt- und Intervallschätzung adjustierter NNT-Maße im Cox-Modell mit Hilfe von SAS Statistik I Anke Welz Ralf Bender RheinAhrCampus Remagen, Hochschule Koblenz Institut für Qualität und Wirtschaftlichkeit
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrLogistische Regression
Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation
MehrVorschläge und Ansätze zur Darstellung von Studienergebnissen mithilfe des Effektmaßes Number Needed to Treat (NNT) Arbeitspapier
IQWiG-Berichte Nr. 61 Vorschläge und Ansätze zur Darstellung von Studienergebnissen mithilfe des Effektmaßes Number Needed to Treat (NNT) Arbeitspapier Auftrag: GA05-03 Version: 1.0 Stand: IQWiG-Berichte
MehrAnhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen
Anhang 4 Bias durch Überdiagnose von papillären Mikrokarzinomen Bias durch Überdiagnose von papillären Mikrokarzinomen H. Bertelsmann AG Epidemiologie und Medizinische Statistik Universität Bielefeld Dezember
MehrEin SAS -Makro zur Schätzung des Stereotype Regressionsmodells
Ein SAS -Makro zur Schätzung des Stereotye Regressionsmodells Oliver Kuß Abt. Klinische Sozialmedizin, Universitätsklinikum Heidelberg, Bergheimer Str. 58, 69115 Heidelberg Oliver_Kuss@med.uni-heidelberg.de
MehrKategorielle Zielgrössen
Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische
MehrAfter Work Statistics
After Work Statistics Robert Röhle Institute of Biometry and Clinical Epidemiology robert.roehle@charite.de U N I V E R S I T Ä T S M E D I Z I N B E R L I N Institut für Biometrie und klinische Epidemiologie
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrLineare Regression. Kapitel Regressionsgerade
Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:
MehrVerallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen
Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau
MehrDatenabhängiges, modellbasiertes Gruppieren von binären longitudinalen Verläufen am Beispiel der Neurodermitis
Datenabhängiges, modellbasiertes Gruppieren von binären longitudinalen Verläufen am Beispiel der Neurodermitis Oliver Kuß*; Cora Gromann*; Thomas L. Diepgen**; *Institut für Medizinische Epidemiologie,
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
MehrEinführung in die Induktive Statistik: Regressionsanalyse
Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse
Mehr19 Punkte. Aufgabe 1. Einkommen niedrig mittel hoch Männer Frauen Geschlecht. a) Bestimmen Sie die fehlenden Werte!
Aufgabe 1 19 Punkte Sie haben die Einkommensdaten von 369 Personen gegeben. Diese wurden in die Gehaltsgruppen niedrige, mittlere und hohe Einkommensklassen kategorisiert - jeweils nach Frauen und Männer
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrAfter Work Statistics
After Work Statistics Maja Krajewska Institute of Biometry and Clinical Epidemiology maja.krajewska@charite.de U N I V E R S I T Ä T S M E D I Z I N B E R L I N Institut für Biometrie und klinische Epidemiologie
Mehr8 Allgemeine Modelle & Robuste Regression
8.1 Allgemeines Lineares Regressions-Modell 182 8 Allgemeine Modelle & Robuste Regression 8.1 Allgemeines Lineares Regressions-Modell a Modell. Y i F µ i, γ, g µ i = η i = x T i β b Weibull-Verteilung.
MehrVO Biostatistik im WS 2006/2007
VO Biostatistik im WS 2006/2007 1 Beispiel 1: Herzerkrankungsdaten aus Framingham für skoeffizienten : Leukemie-Daten 2 Beispiel 1: Herzerkrankungsdaten aus Framingham Stichprobe: 1329 männliche Bewohner
MehrLogistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios
Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
Mehrlimhatewerzeoelhiniii
limhatewerzeoelhiniii Vorwort 13 Kapitel 1 Einleitung 15 1.1 Wozu brauchen wir Statistik? 16 1.2 Medizinische Statistik 16 1.3 Beschreibende und schließende Statistik 17 1.4 Das Buch in Kürze 17 Kapitel
MehrEin Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen
Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Alexander Siemer Abteilung Medizinische Statistik Universität Göttingen 47. Biometrisches Kolloquium
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrWahrscheinlichkeitsverteilungen
Universität Bielefeld 3. Mai 2005 Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung Das Ziehen einer Stichprobe ist die Realisierung eines Zufallsexperimentes. Die Wahrscheinlichkeitsrechnung betrachtet
MehrEinfache lineare Regression. Statistik (Biol./Pharm./HST) FS 2015
Einfache lineare Regression Statistik (Biol./Pharm./HST) FS 2015 Wdh: Korrelation Big picture: Generalized Linear Models (GLMs) Bisher: Population wird mit einer Verteilung beschrieben Bsp: Medikament
MehrML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.
Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
MehrMultiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
MehrStochastik Praktikum Lineare Modelle
Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte
MehrLogistische Regression
Logistische Regression 13.11.2017 Motivation Regressionsrechnung: Untersuchung des Zusammenhangs zwischen einer (oder mehreren) Zielvariablen und einer oder mehreren erklärenden Variablen. Bisher gesehen:
MehrKlassen diskreter Variablen
Modelle diskreter Variablen Klassen diskreter Variablen binär multinomial Weitere Klassifizierung multinomialer diskreter Variablen: kategorial y = 1, falls Einkommen < 3000 e. y = 2, falls Einkommen zw.
MehrVorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression
Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Regression Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 39 Einfache lineare Regression Bestimmung der Regressionsgerade
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrTreatment-Evaluationsproblematik
Treatment-Evaluationsproblematik Seminarvortrag Seminar: Statistische Herausforderungen im Umgang mit fehlenden bzw. fehlerbehafteten Daten 23.01.2015 Betreuer: Prof. Dr. Thomas Augustin Institut für Statistik
Mehr2.5 Lineare Regressionsmodelle
2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrLogistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS
Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS Birgit Hay Silvia Sander Schwabstraße 13 Schwabstraße 13 89070 Ulm 89070 Ulm Birgit.Hay@uni-ulm.de Silvia.Sander@uni-ulm.de
MehrBiometrie und Statistik
DEGRO: Refresher Biometrie und Statistik Universitätsklinik und Poliklinik für Strahlentherapie, Institut für Med. Epidemiologie, Biometrie und Informatik Martin-Luther-Universität Halle-Wittenberg Inhalt
MehrEin relatives Überlebenszeitmodell für korrelierte Beobachtungen. Oliver Kuß
Ein relatives Überlebenszeitmodell für korrelierte Beobachtungen Oliver Kuß Institut für Medizinische Epidemiologie, Biometrie und Informatik, Medizinische Fakultät, Martin-Luther-Universität Halle-Wittenberg,
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:
MehrBiometrie. Regressionsmodelle
1 Regressionsmodelle Einflussgrößen Zielgröße (Alter, Geschlecht Blutdruck) Zielgröße entscheidet über das Regressionsmodell stetige Zielgröße lineare Regression binäre Zielgröße logistische Regression
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrMaximum-Likelihood Schätzung
Maximum-Likelihood Schätzung VL Forschungsmethoden 1 Wiederholung Einführung: Schätzung 2 Likelihood-Schätzung und Generalisiertes Lineares Modell Zufallsverteilungen 3 Lernziele 1 Grundzüge der Likelihood-Schätzung
MehrBerechnung von Konfidenzintervallen für die Population Impact Number (PIN)
Berechnung von Konfidenzintervallen für die Population Impact Number (PIN) Ralf Bender Ulrich Grouven Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) Institut für Qualität und
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)
Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf
MehrDer Gefoulte soll niemals selber schießen Empirische Untersuchung einer alten deutschen Fußballerweisheit
Der Gefoulte soll niemals selber schießen Empirische Untersuchung einer alten deutschen Fußballerweisheit Kuß O 1, Kluttig A 1, Stoll O 2 1 Institut für Medizinische Epidemiologie, Biometrie und Informatik,
MehrSo berechnen Sie einen Schätzer für einen Punkt
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung
MehrOrdinale abhängige Variablen. Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick
Kap. 6: Ordinale abhängige Variablen Einführung Regressionsmodelle für ordinale Variablen Empirisches Beispiel Ausblick 6.1 Einführung Typische ökonomische Beispiele für ordinale abhängige Variablen: Bildungsniveau
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
MehrFortgeschrittene Ökonometrie: Maximum Likelihood
Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für
MehrHypothesenbewertungen: Übersicht
Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung
MehrDr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1
2.1 Beispiele 2.2 Odds Ratio 2.3 Modell der logistischen Regression 2.3.1 Modellgleichung 2.3.2 Voraussetzungen 2.4 Schätzungen, Tests und Modellgüte 2.4.1 Schätzung der logistischen Regressionskoeffizienten
MehrKapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller
Mehr2.Tutorium Generalisierte Regression
2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrStatistik II für Betriebswirte Vorlesung 11
Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 08. Januar 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:
MehrRegressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/
Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................
MehrAlternative Darstellung attributabler Risiken mit Hilfe von Impact Numbers
Alternative Darstellung attributabler Risiken mit Hilfe von Impact Numbers Mandy Hildebrandt 1,2, Ralf Bender 1 1 Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG), Köln 2 Institut
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrU N I V E R S I T Ä T S M E D I Z I N B E R L I N. After Work Statistics
U N I V E R S I T Ä T S M E D I Z I N B E R L I N After Work Statistics Institut für Biometrie und klinische Epidemiologie Wir sind Hilfsbereit und nett! als Wissenschaftler aktiv in der statistischen
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrStichproben und statistische Fehler
Kapitel 0 Stichproben und statistische Fehler 0. Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung der Stichprobe soll dann
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Hypothesentesten, Fehlerarten und Güte 2 Literatur Kreyszig: Statistische Methoden und ihre Anwendungen, 7.
MehrPoisson Regression & Verallgemeinerte lineare Modelle
Poisson Regression & Verallgemeinerte lineare Modelle 20.11.2017 Motivation Ausgangslage Wir haben Anzahldaten (count data) Y i, cf. Vorlesung zu kategoriellen Variablen. Zu jeder Beobachtung Y i haben
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrPrüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:
MehrSchätzung im multiplen linearen Modell VI
Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung
0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrStatistics, Data Analysis, and Simulation SS 2017
Statistics, Data Analysis, and Simulation SS 2017 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Mainz, May 29, 2017 Dr. Michael O. Distler
MehrD-CHAB Frühlingssemester 2017 T =
D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme
Mehr