Imputationsverfahren

Größe: px
Ab Seite anzeigen:

Download "Imputationsverfahren"

Transkript

1 Minh Ngoc Nguyen Betreuer: Eva Endres München,

2 Einführung 2 / 45

3 Einführung 3 / 45

4 Imputation Prinzip: fehlende Werte sollen durch möglichst passenden Werte ersetzt werden Vorteil Erzeugen den vollständigen Datensatz Anwenden Standardmethode für den vervollständigten Datensatz Es gibt eine Vielzahl von Verfahren Man unterscheidet zwischen Single-Imputation und 4 / 45

5 Imputation Single-Imputation: jeder fehlende Wert wird durch einen Wert ersetzt Aber Berücksichtigen die Unsicherheit nicht Unterschätzen die Varianz Führen fälschlicherweise signifikante Ergebnisse möglich : jeder fehlende Wert wird durch mehrere Werte ersetzt 5 / 45

6 Notation Fehlendmechanismen Ignorierbarkeit Einführung 6 / 45

7 Notation Fehlendmechanismen Ignorierbarkeit Notation Y = (y ij ): vollständige (n p) Datenmatrix mit n Beobachtungen von p Variablen Y beob : beobachtete Teil u. Y fehl : fehlende Teil, d.h. Y = (Y beob, Y beob ) R = (r ij ): Indikatormatrix mit r ij = 0 falls y ij fehlt oder r ij = 1 falls y ij beobachtet ξ: unbekannter Parameter steuert den Fehlendmechanismus R θ: unbekannter Parameter steuert die Daten Y 7 / 45

8 Notation Fehlendmechanismen Ignorierbarkeit Fehlendmechanismen MCAR: Fehlende Werte sind missing completely at random, wenn gilt g(r Y, ξ) = g(r ξ) Y, ξ Unproblematischster, aber unwahrscheinlicher Fall MAR: Fehlende Werte sind missing at random, wenn gilt g(r Y, ξ) = g(r Y beob, ξ) Y fehl, ξ Mäßig problematisch und wahrscheinlicher Fall MNAR: Fehlende Werte sind missing not at random, wenn gilt g(r Y, ξ) = g(r Y beob, Y fehl, ξ) Y, ξ Sehr problematisch und nicht unwahrscheinlicher Fall 8 / 45

9 Notation Fehlendmechanismen Ignorierbarkeit Ignorierbarkeit Ignorieren des Fehlendmechanismus möglich, wenn die Daten MAR oder MCAR sind θ und ξ voneinander unabhängig sind Das Vorliegen eines ignorierbaren Fehlendmechanismus ist Voraussetzung für die meisten 9 / 45

10 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Einführung 10 / 45

11 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Grundkonzepte der Jeder fehlende Werte wird durch m Werte ersetzt (mit m > 1) m vervollständigte Datensätze erhalten gleichen beobachteten Werte aber unterschiedlichen imputierten Werten 11 / 45

12 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Kombinationsregeln (Little und Rubin, 2002) ˆQ: Schätzung interessierender Parameter (z.b: Mittelwert, Regressionskoeffizienten) ˆV : Schätzung der Varianz Für i = 1,, m ˆQi : Schätzung aus i-ten Datensatz ˆVi : zugehörige geschätzte Varianz aus i-ten Datensatz 12 / 45

13 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Kombinationsregeln (Little und Rubin, 2002) Schätzwert Gesamtvarianz Q = 1 m m ˆQ i i=1 T = (1 + 1 m )B + V mit Within-Varianz V = 1 m ˆV m i=1 i Between-Varianz B = 1 m m 1 i=1 ( ˆQ i Q) 2 13 / 45

14 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Kombinationsregeln (Little und Rubin, 2002) Standardabweichung T Konfidenzintervall mit KI = Q ± t 1 1 T α t 1 1 : Quantil der t-verteilung α df = (m 1)(1 + m V (m+1)b )2 14 / 45

15 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Multipe-Imputation: Vorteil Unsicherheit durch Variabilität der m Schätzwert wird berücksichtigt Verwendung von sämtlicher zur Verfügung stehender Information (beobachtete Daten) Analyse der vollständigen Daten mit beliebiger Standardmethode Schätzer haben hohen Effizienz bei bereits niedrigem m 15 / 45

16 Grundkonzepte der Kombinationsregeln Multipe-Imputation: Vorteil und Nachteil Multipe-Imputation: Nachteil Aufwendige Vorgehen zur Erzeugung der vervollständigten Datensätze Benötigen größere Rechen- und Speicherkapazität Steigern die Analysezeit bei separaten Betrachtung jeder einzelnen imputierten Datensatz erheblich Ist der Anteil der fehlenden Werte groß, so muss auch m gesteigert werden und der Aufwand steigt ebenfalls 16 / 45

17 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Einführung 17 / 45

18 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Maximum-Likelihood Theorie Falls die fehlenden Daten ignorierbar sind, kann die Likelihood der beachteten Daten wie folgt L(θ Y beob ) = f (Y beob, Y fehl θ)dy fehl bei normaler Maximum-Likelihood gilt es hier das Maximum dieser Funktion zu finden bei Fälle von fehlenden Daten sind kompliziert Verwendung des Expectation-Maximization Algorithmus 18 / 45

19 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Expectation-Maximization Algorithmus EM Algorithmus nach Dempster (1977) Iteratives Verfahren zur Bestimmung von Maximum Likelihood Schätzwerten Grundidee Ersetze fehlende Werte durch plausible Startwerte Schätze die Parameter Ersetze die fehlende Werte unter Verwendung des jeweilig zuvor geschätzten Parameter aktualisiert Die fehlende Werte und die Parameter werden so lange neu geschätzt bis es zur Konvergenz kommt 19 / 45

20 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes EM Algorthimus Verwende Startwert θ (0), z.b. Mittelwerte und Kovarianzen Es besteht aus 2 Schritten E-Schritt: Berechne Q(θ θ (t) ) = E(l(Y θ) Y beob, θ (t) ) M-Schritt: Wähle θ (t+1) so, dass Q(θ (t+1) θ (t) ) Q(θ θ (t) ) Dieser iterative Prozess wird solange fortgeführt, bis es konvergiert 20 / 45

21 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes EM Algorithmus Vorteil In jedem Iteration-Schritt wird Likelihood der beobachteten Daten erhöht EM Algorithmus einfach zu konstruieren jeder Schritt sich leicht interpretieren lässt Parameter-Restriktionen sind meist automatisch erfüllt Nachteil Langsame Rate der Konvergenz (hängt von dem Anteil der fehlenden Daten ab) Schwierig die Varianz zu bestimmen 21 / 45

22 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Bayes Ansatz Erzeuge m unabhängige Zufallsziehungen für die fehlenden Daten aus ihren a-posteriori prädiktive Verteilung. Unter Annahmen des ignorierbaren Fehlendmechanismus f (Y fehl Y beob ) = f (Y fehl Y beob, θ)f (θ Y beob )dθ mit f (Y fehl Y beob, θ): bedingte prädiktive Verteilung f (θ Y beob ): a-posteriori Verteilung 22 / 45

23 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Bayes Ansatz Realisation direkt durch 1. Zufallszüge für θ aus den a-posteriori Verteilung f (θ Y beob ) 2. Zufallszüge für Y fehl aus ihren bedingten prädiktiven Verteilung f (Y fehl Y beob, θ) für aktuelle θ Anschließend werden zwei Algorithmus zur Beschaffung solcher Zufallsziehungen vorgestellt: Data-Augmentation Multivariate Imputation by Chained Equations 23 / 45

24 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Data-Augmentation Algorithmus Datenmehrung nach Tanner und Wong (1987) Iteratives Verfahren zur der a-posteriori Verteilung von θ Bayesianische Variante des bereits EM Algorithmus Häufig für Imputation verwendete Markov Chain Monte Carlo (MCMC) Methode Eine gemeinsame Verteilung aller Variable wird vorgenommen (z.b. multivariate Normalverteilung) 24 / 45

25 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes DA Algorithmus Verwende Startwert θ (0), z.b ML durch EM-Algorithmus Es besteht aus 2 Schritten: I-Schritt: Ziehe P-Schritt: Ziehe Y (t+1) fehl f (Y fehl Y beob, θ (t) ) θ (t+1) f (θ Y beob, Y (t+1) fehl ) Die { Ergebnis des Verfahren } ist eine Markov Kette (θ (t), Y (t) fehl ), t = 1, 2, mit der stationären Verteilung f (θ, Y fehl Y beob ) 25 / 45

26 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes DA Algorithmus Konvergenz Benötigen viele Iterationen bis zur Konvergenz Bestimmung der Konvergenz mit Hilfe grafischer Darstellung und einfacher Kennwerte wie Autokorrelationen oder Varianzen Konvergenzgeschwindigkeit hängt von ab. dem Anteil der fehlenden Werten Startwerte 26 / 45

27 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes Multivariate Imputation durch Chained Equations Bekannt auch unter anderen Namen wie Full Conditional Specification oder Chained Equations Beim MICE Vermeiden die gemeinsame Verteilung aller Variablen Spezifizieren separat für jede Variable eine bedingte Verteilung 27 / 45

28 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes MICE Algorithmus Multivariate Imputationen stellen eine Kette von univariaten Imputationen dar Für jede Variablen lassen sich verschiedene Modelle spezifizieren (je nach Skalierung) Iterative Mit Hilfe der iterativen Ziehungen aus den bedingten Verteilungen kann die gemeinsame Verteilung modelliert werden Idee des Gibbs-Sampler 28 / 45

29 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes MICE Algorithmus θ (t) 1 f (θ 1 Y beob,1, Y (t 1) 2,, Y (t 1) p ) Y (t) fehl,1 f (Y fehl,1 Y beob,1, Y (t 1) θ (t) p. 2,, Y p (t 1) f (θ p Y beob,p, Y (t) 1,, Y (t) p 1 ), θ (t) 1 ) Y (t) fehl,p f (Y fehl,p Y beob,p, Y (t) 1,, Y (t) p 1, θ(t) p ) Die wird bis zu einer vorgegebenen Anzahl der Iteration weiter durchgeführt. 29 / 45

30 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes MICE Algorithmus MICE-Algorithmus bietet den Vorteil, dass komplexe Datenstrukturen berücksichtigt werden können Zählvariable: Poisson Regression Stetige Variable: normale lineare Regressionsmodell Kategoriale Variable: logistisches oder verallgemeinertes logistisches Modell 30 / 45

31 Verfahren basierend auf Maximum-Likelihood Verfahren basierend auf Bayes DA- vs. MICE- Algorithmus Gemeinsamkeit iterative Algorithmus als MCMC-Methode Zufallszug von Parameter aus der a-posteriori Verteilung Unterschied DA modelliert eine gemeinsame Verteilung während MICE Zug um Zug bedingte Verteilungen konstruieren Bei dem MICE-Algorithmus kommt Konvergenz meist schnell zustande, aber bei dem DA-Algorithmus nicht 31 / 45

32 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit Einführung 32 / 45

33 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit sdesign Insgesamt werden die drei Variablen X 1, X 2 und Y mit jeweils Beobachtungen generiert. Es sei ( ) ( ) (X 1, X 2 ) N(, ) mit β 1 = β 2 und ɛ N(0, 1) Y = β 1 X 1 + β 2 X 2 33 / 45

34 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit sdesign Datensatz mit fehlenden Werten MCAR: Beobachtungen in X 2 fehlen mit einer Wahrscheinlichkeit von γ unabhängig von Y und X 1 MAR abhängig von X 1 : Beobachtungen in X 2 fehlen wenn X 1 kleiner als das γ Quantil von X 1 ist MNAR: Beobachtungen in X 2 fehlen wenn X 2 kleiner als das γ Quantil von X 2 ist. Verschiedene Anteile der fehlenden Werte werden betrachtet, mit γ = 30, 50, 70, 90% 34 / 45

35 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit Verwendung des DA Algorithmus auf Basis des Data-Augmentation Algorithmus m = 5 mit 20 Iteration Verwendung von Paket norm der Software R 35 / 45

36 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit DA Augmentation: MCAR γ β 2 SD µ X2 σx 2 2 ρ X1 X β 2 treffen den wahren Wert von 1 sehr gut mit geringen Standardfehler β 2 und SD steigen mit zunehmenden Fehlwertanteil leicht an µ X2, σ 2 X 2, ρ X1 X 2 bleiben annähernd 36 / 45

37 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit DA Augmentation: MAR γ β 2 SD µ X2 σx 2 2 ρ X1 X β 2 sind unverzerrt Standardfehler sind auch niedrig Struktur der Daten bleibt nach der Imputation durch µ X2, σ 2 X 2, ρ X1 X 2 nahezu 37 / 45

38 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit DA Augmentation: MNAR γ β 2 SD µ X2 σx 2 2 ρ X1 X β 2 sind stark verzerrt SD sind erhöht µ X2, σx 2 2 weichen stark vom wahren Wert ab 38 / 45

39 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit Verwendung des MICE Algorithmus auf Basis des MICE Algorithmus m = 5 Imputationen auf der Basis eines linearen Modells Verwendung von Paket mice der Software R 39 / 45

40 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit MICE Algorithmus: MCAR γ β 2 SD µ X2 σx 2 2 ρ X1 X β 2 sind unverzerrt bei geringen SD µ X2, σx 2 2 werden gut die Daten widerspiegelt ρ X1 X 2 werden durch diesem Algorithmus zudem korrekt nachgebildet 40 / 45

41 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit MICE Algorithmus: MAR γ β 2 SD µ X2 σx 2 2 ρ X1 X Parameterschätzer sind unverzerrt bei geringen SD µ X2, σx 2 2 können nicht exakt wiedergeben, aber diese Werte liegen noch nahe den wahren Wert 41 / 45

42 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit MICE Algorithmus: MNAR γ β 2 SD µ X2 σx 2 2 ρ X1 X Bei erhöhten SD sind Schätzer stark verzerrt µ X2, σ 2 X 2 werden nicht korrekt wiedergegeben 42 / 45

43 sdesign Verwendung des Data-Augmentation Algorithmus Verwendung des MICE Algorithmus Fazit Fazit Für MCAR und MAR Fehlendmechanismus Unverzerrte Parameterschätzung mit geringen Standardfehler Mittelwert und Varianz bleiben gut mit dem wahren Wert Für MNAR Fehlendmechanismus Stark verzerrt 43 / 45

44 Literatur & Software B.Rubin, D. (1987). Multiple Imputation for Nonresponse in Surveys. New York, USA: John Wiley & Sons. Dempster, A. P., N. M. Laird, and D. B. Rubin (1977). Maximum likelihood from incomplete data via the em algorithm. Journal of the Royal Statistical Society,Series B 39(1), 138. Little, R. and D. Rubin (2002). Statistical Analysis with Missing Data. Hoboken, USA: Wiley & Sons. Novo, A. A. (2013). Package norm: Analysis of multivariate normal datasets with missing values. Tanner, M. A. and W. Wong (1987). The calculation of posterior distributions by data augmentation. Journal of the American Statistical Association 39(1), 138. van Buuren, S. and K. Groothuis-Oudshoorn (2011). mice: Multivariate imputation by chained equations in r. Journal of Statistical Software 45(3), 167.

45 Vielen Dank für die Aufmerksamkeit!

Imputationsverfahren

Imputationsverfahren Ludwig-Maximilians-Universität München Institut für Statistik Seminararbeit Imputationsverfahren Autorin: Minh Ngoc Nguyen Betreuerin: Eva Endres 15. März 2015 Seminararbeit Imputationsverfahren Autorin:

Mehr

Fehlende Daten. Seminarvortrag im Rahmen des Seminars: Statistische Herausforderungen sozialwissenschaftlicher Studien.

Fehlende Daten. Seminarvortrag im Rahmen des Seminars: Statistische Herausforderungen sozialwissenschaftlicher Studien. Fehlende Daten Seminarvortrag im Rahmen des Seminars: Statistische Herausforderungen sozialwissenschaftlicher Studien Julia Schiele Betreuer: Professor Augustin Institut für Statistik LMU 22. Dezember

Mehr

Imputation (Ersetzen fehlender Werte)

Imputation (Ersetzen fehlender Werte) Imputation (Ersetzen fehlender Werte) Gliederung Nonresponse bias Fehlende Werte (missing values): Mechanismen Imputationsverfahren Überblick Mittelwert- / Regressions Hot-Deck-Imputation Row-Column-Imputation

Mehr

Missing Data. VL Forschungsmethoden

Missing Data. VL Forschungsmethoden Missing Data VL Forschungsmethoden Missing Data VL Forschungsmethoden VL Forschungsmethoden Missing Data (0/27) Übersicht Missing Data: Typen Vor- und Nachteile : Ansatz Implementation VL Forschungsmethoden

Mehr

Missing Data. Missing Data. VL Forschungsmethoden. VL Forschungsmethoden. Missing Data: Typen Strategien Fazit

Missing Data. Missing Data. VL Forschungsmethoden. VL Forschungsmethoden. Missing Data: Typen Strategien Fazit Missing Data VL Forschungsmethoden Missing Data VL Forschungsmethoden VL Forschungsmethoden Missing Data (0/27) Übersicht 1 2 Vor- und Nachteile : Ansatz Implementation 3 VL Forschungsmethoden Missing

Mehr

Umgang mit fehlenden Werten in der psychologischen Forschung

Umgang mit fehlenden Werten in der psychologischen Forschung Umgang mit fehlenden Werten in der psychologischen Forschung Oliver Lüdtke Max-Planck-Institut für Bildungsforschung Alexander Robitzsch Institut zur Qualitätsentwicklung im Bildungswesen Programm Montag

Mehr

Statistische Matching-Verfahren

Statistische Matching-Verfahren Statistische Matching-Verfahren Erste Statistik-Tage 2012 Bamberg Fürth 26./27. Juli 2012 in Bamberg Prof. Dr. Susanne Rässler Lehrstuhl für Statistik und Ökonometrie in den Sozial- und Wirtschaftswissenschaften

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Missing Data. Regressionsmodelle für Politikwissenschaftler

Missing Data. Regressionsmodelle für Politikwissenschaftler Regressionsmodelle für Politikwissenschaftler TSCS Regression in Stata Struktur definieren:. xtset id year panel variable: id (strongly balanced) time variable: year, 1996 to 2004, but with gaps delta:

Mehr

Übersicht zu fehlenden Daten

Übersicht zu fehlenden Daten Übersicht zu fehlenden Daten Seminar: Statistische Herausforderungen im Umgang mit fehlenden bzw. fehlerbehafteten Daten Alexander Pokatilo Betreuerin: Eva Endres Seminarleiter: Prof. Dr. Thomas Augustin

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

Schätzung im multiplen linearen Modell VI

Schätzung im multiplen linearen Modell VI Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,

Mehr

Das Rasch-Modell und seine zentralen Eigenschaften

Das Rasch-Modell und seine zentralen Eigenschaften Das Rasch-Modell und seine zentralen Eigenschaften Stella Bollmann Seminar Psychometrische Modelle: Theorie und Anwendungen Institut für Statistik, LMU München München, 27. Mai 2014 Stella Bollmann Das

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:

Mehr

Bachelorarbeit. Vergleich verschiedener Verfahren zur Datenimputation

Bachelorarbeit. Vergleich verschiedener Verfahren zur Datenimputation Ludwig-Maximilians-Universität München Institut für Statistik Bachelorarbeit Vergleich verschiedener Verfahren zur Datenimputation Autor: Susanne Rubenbauer Betreuer: Prof. Dr. Christian Heumann Datum:

Mehr

BZQ II: Stochastikpraktikum

BZQ II: Stochastikpraktikum BZQ II: Stochastikpraktikum Block 5: Markov-Chain-Monte-Carlo-Verfahren Randolf Altmeyer February 1, 2017 Überblick 1 Monte-Carlo-Methoden, Zufallszahlen, statistische Tests 2 Nichtparametrische Methoden

Mehr

Fortgeschrittene Ökonometrie: Maximum Likelihood

Fortgeschrittene Ökonometrie: Maximum Likelihood Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Übersicht zu fehlenden Daten

Übersicht zu fehlenden Daten Übersicht zu fehlenden Daten Seminar: Statistische Herausforderungen im Umgang mit fehlenden bzw. fehlerbehafteten Daten Alexander Pokatilo Betreuerin: Eva Endres Seminarleiter: Prof. Dr. Thomas Augustin

Mehr

Allgemeine lineare Modelle

Allgemeine lineare Modelle 262 Merkpunkte Allgemeine lineare Modelle Multiple lineare Regression mit nicht-normalen Zufallsabweichungen bilden eine harmlose" Verallgemeinerung der multiplen lin. Regr. Beispiele: Gumbel-Regression,

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

10 Statistisches Schätzen

10 Statistisches Schätzen 10 Statistisches Schätzen 620 10 Statistisches Schätzen 10.1 Punktschätzung 623 10.1.1 Schätzer und ihre Gütekriterien 623 10.1.2 Erwartungstreue 627 10.1.3 Erwartete quadratische Abweichung (MSE) 634

Mehr

Das empirische VaR bzw. CVaR

Das empirische VaR bzw. CVaR Das empirische VaR bzw. CVaR Sei x 1, x 2,..., x n eine Stichprobe der unabhängigen identischverteilten ZV X 1, X 2,..., X n mit Verteilungsfunktion F (Notation: Die ZV X 1, X 2,..., X n sind i.i.d. Empirische

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Eine Methode zum Umgang mit fehlenden Todesursachen in Kohortenstudien. Gaël P. Hammer, Jochem König, Ingo Langner, Hajo Zeeb

Eine Methode zum Umgang mit fehlenden Todesursachen in Kohortenstudien. Gaël P. Hammer, Jochem König, Ingo Langner, Hajo Zeeb Eine Methode zum Umgang mit fehlenden Todesursachen in Kohortenstudien Gaël P. Hammer, Jochem König, Ingo Langner, Hajo Zeeb 1 Hintergrund Probleme historischer Kohortenstudien Verluste beim Follow up

Mehr

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/ Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte

Mehr

Missing Data. Regressionsmodelle für Politikwissenschaftler. Wiederholung Missing Data

Missing Data. Regressionsmodelle für Politikwissenschaftler. Wiederholung Missing Data Regressionsmodelle für Politikwissenschaftler TSCS Regression in Stata Struktur definieren:. xtset id year panel variable: time variable: delta: id (strongly balanced) year, 1996 to 2004, but with gaps

Mehr

Frequentisten und Bayesianer. Volker Tresp

Frequentisten und Bayesianer. Volker Tresp Frequentisten und Bayesianer Volker Tresp 1 Frequentisten 2 Die W-Verteilung eines Datenmusters Nehmen wir an, dass die wahre Abhängigkeit linear ist, wir jedoch nur verrauschte Daten zur Verfügung haben

Mehr

Der Metropolis-Hastings Algorithmus

Der Metropolis-Hastings Algorithmus Der Algorithmus Michael Höhle Department of Statistics University of Munich Numerical Methods for Bayesian Inference WiSe2006/07 Course 30 October 2006 Markov-Chain Monte-Carlo Verfahren Übersicht 1 Einführung

Mehr

Übersicht. 1 Einführung in Markov-Chain Monte-Carlo Verfahren. 2 Kurze Wiederholung von Markov-Ketten

Übersicht. 1 Einführung in Markov-Chain Monte-Carlo Verfahren. 2 Kurze Wiederholung von Markov-Ketten Markov-Chain Monte-Carlo Verfahren Der Algorithmus Michael Höhle Department of Statistics University of Munich Numerical Methods for Bayesian Inference WiSe2006/07 Course 30 October 2006 Übersicht 1 Einführung

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)

Mehr

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

9 Robuste Methoden. 9.1 Einfluss und Robustheit. i (x i x) 2 = i x iy i. c 1 = x 2 + i (x i x) 2. Einfache Regression: 9.1 Einfluss und Robustheit 205

9 Robuste Methoden. 9.1 Einfluss und Robustheit. i (x i x) 2 = i x iy i. c 1 = x 2 + i (x i x) 2. Einfache Regression: 9.1 Einfluss und Robustheit 205 9.1 Einfluss und Robustheit 205 9 Robuste Methoden 9.1 Einfluss und Robustheit a Sensitivität. Eine Beobachtung hinzufügen. Effekt? Einfache Regression: β = i(x i x)y i i (x i x) 2 = i x iy i β = β+ x,

Mehr

3.2 Maximum-Likelihood-Schätzung

3.2 Maximum-Likelihood-Schätzung 291 Die Maximum-Likelihood-Schätzung ist die populärste Methode zur Konstruktion von Punktschätzern bei rein parametrischen Problemstellungen. 292 3.2.1 Schätzkonzept Maximum-Likelihood-Prinzip: Finde

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Maximum-Likelihood Schätzung

Maximum-Likelihood Schätzung Maximum-Likelihood Schätzung VL Forschungsmethoden 1 Wiederholung Einführung: Schätzung 2 Likelihood-Schätzung und Generalisiertes Lineares Modell Zufallsverteilungen 3 Lernziele 1 Grundzüge der Likelihood-Schätzung

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Stochastik Praktikum Lineare Modelle

Stochastik Praktikum Lineare Modelle Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Der Umgang mit fehlenden Werten in Verlaufsstudien im Falle von Drop-outs

Der Umgang mit fehlenden Werten in Verlaufsstudien im Falle von Drop-outs Der Umgang mit fehlenden Werten in Verlaufsstudien im Falle von Drop-outs Statistik II Benjamin Mayer Institut für Epidemiologie und Medizinische Biometrie Schwabstraße 13 89075 Ulm benjamin.mayer@uni-ulm.de

Mehr

Stochastik Praktikum Markov Chain Monte Carlo Methoden

Stochastik Praktikum Markov Chain Monte Carlo Methoden Stochastik Praktikum Markov Chain Monte Carlo Methoden Humboldt-Universität zu Berlin 14.10.2010 Problemstellung Wie kann eine Zufallsstichprobe am Computer simuliert werden, deren Verteilung aus einem

Mehr

Vorlesung: Lineare Modelle

Vorlesung: Lineare Modelle Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen

Mehr

Modellanpassung und Parameterschätzung. A: Übungsaufgaben

Modellanpassung und Parameterschätzung. A: Übungsaufgaben 7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit

Mehr

Bayesian analysis of spatial point processes in the neighbourhood of Voronoi. networks

Bayesian analysis of spatial point processes in the neighbourhood of Voronoi. networks Bayesian analysis of spatial point processes in the neighbourhood of Voronoi networks Judith Schmidt und Bettina Hund 02 Juli 2008 Seminar: Stochastische Geometrie und ihre Anwendungen - Zufa llige Netzwerke

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer

John Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage

Mehr

6. Schätzverfahren für Parameter

6. Schätzverfahren für Parameter 6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen

Mehr

Auswertung und Lösung

Auswertung und Lösung Dieses Quiz soll Ihnen helfen, Kapitel 4.6 und 4.7 besser zu verstehen. Auswertung und Lösung Abgaben: 59 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 4.78 1 Frage

Mehr

Resampling. in»statistische Methoden in der Physik« Referent: Alex Ortner. Studenten-Seminar Sommersemester 2007

Resampling. in»statistische Methoden in der Physik« Referent: Alex Ortner. Studenten-Seminar Sommersemester 2007 Resampling in»statistische Methoden in der Physik«Referent: Studenten-Seminar Sommersemester 2007 Gliederung 1 Resampling Prinzip Einleitung Resampling Methoden 2 3 4 Einleitung intuitv Resampling Prinzip

Mehr

Lineare Klassifikationsmethoden

Lineare Klassifikationsmethoden Verena Krieg Fakultät für Mathematik und Wirtschaftswissenschaften 08. Mai 2007 Inhaltsverzeichnis 1. Einführung 2. Lineare Regression 3. Lineare Diskriminanzanalyse 4. Logistische Regression 4.1 Berechnung

Mehr

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik

Statistik. Sommersemester Stefan Etschberger. für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Stefan Etschberger für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2017 Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X)

Mehr

Lineare Regression. Kapitel Regressionsgerade

Lineare Regression. Kapitel Regressionsgerade Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell

Mehr

Verzerrung und Unsicherheit von Quantilschätzern

Verzerrung und Unsicherheit von Quantilschätzern Verzerrung und Unsicherheit von Quantilschätzern Henning Rust, Malaak Kallache, Jürgen Kropp Potsdam-Institut für Klimafolgenforschung p.1/31 Motivation Festlegung von Bemessungsgrößen für die Wasserwirtschaft

Mehr

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 13. Juli 2011 Ziel der Vorlesung Vermittlung von Grundkenntnissen der Statistik, Simulationstechnik und numerischen Methoden (Algorithmen) Aufgabe:

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Nachholklausur zur Vorlesung Schätzen und Testen I. 04. April Bitte ausfüllen und unterschreiben!!!

Nachholklausur zur Vorlesung Schätzen und Testen I. 04. April Bitte ausfüllen und unterschreiben!!! Nachholklausur zur Vorlesung Schätzen und Testen I 04. April 2013 Volker Schmid, Ludwig Bothmann, Julia Sommer Aufgabe 1 2 3 4 5 6 Punkte Note Bitte ausfüllen und unterschreiben!!! Name, Vorname: Matrikelnummer:

Mehr

Simulationsergebnisse zum Vergleich von Ersetzungsmethoden fehlender Werte von kategorialen Variablen in SAS mit PROC MI

Simulationsergebnisse zum Vergleich von Ersetzungsmethoden fehlender Werte von kategorialen Variablen in SAS mit PROC MI Simulationsergebnisse zum Vergleich von Ersetzungsmethoden fehlender Werte von kategorialen Variablen in SAS mit PROC MI Kathrin Hohl Institut für Biometrie, Universität Ulm Schwabstr. 13 89070 Ulm kathrin.hohl@uni-ulm.de

Mehr

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn

Statistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:

Mehr

x t2 y t = 160, y = 8, y y = 3400 t=1

x t2 y t = 160, y = 8, y y = 3400 t=1 Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =

Mehr

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler

Konfirmatorische Faktorenanalyse. Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse Regressionsmodelle für Politikwissenschaftler Was ist ein Faktor? Faktor oder latente Variable Regressionsmodelle für Politikwissenschaftler Konfirmatorische Faktorenanalyse

Mehr

Wahrscheinlichkeitsrechnung und schließende Statistik

Wahrscheinlichkeitsrechnung und schließende Statistik Springer-Lehrbuch Wahrscheinlichkeitsrechnung und schließende Statistik Bearbeitet von Karl Mosler, Friedrich Schmid 4., verb. Aufl. 2010. Taschenbuch. XII, 347 S. Paperback ISBN 978 3 642 15009 8 Format

Mehr

Zusammenfassung: Einfache lineare Regression I

Zusammenfassung: Einfache lineare Regression I 4 Multiple lineare Regression Multiples lineares Modell 41 Zusammenfassung: Einfache lineare Regression I Bisher: Annahme der Gültigkeit eines einfachen linearen Modells y i = β 0 + β 1 x i + u i, i {1,,

Mehr

1 Einführung Ökonometrie... 1

1 Einführung Ökonometrie... 1 Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

Grundlagen der schließenden Statistik

Grundlagen der schließenden Statistik Grundlagen der schließenden Statistik Schätzer, Konfidenzintervalle und Tests 1 46 Motivation Daten erhoben (Umfrage, Messwerte) Problem: Bei Wiederholung des Experiments wird man andere Beobachtungen

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

Stochastik-Praktikum

Stochastik-Praktikum Stochastik-Praktikum Markov Chain Monte Carlo Peter Frentrup Humboldt-Universität zu Berlin 16. Januar 2018 (Humboldt-Universität zu Berlin) Markov Chain Monte Carlo 16. Januar 2018 1 / 17 Übersicht 1

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten

Mehr

Probeklausur - Statistik II, SoSe 2017

Probeklausur - Statistik II, SoSe 2017 Probeklausur - Statistik II, SoSe 2017 Aufgabe 1: Mehrdimensionale Zufallsvariablen (15 Punkte) Gegeben sei ein zweidimensionaler stetiger Zufallsvektor X = (X 1, X 2 ) T mit der gemeinsamen Dichtefunktion

Mehr

7. Stochastische Prozesse und Zeitreihenmodelle

7. Stochastische Prozesse und Zeitreihenmodelle 7. Stochastische Prozesse und Zeitreihenmodelle Regelmäßigkeiten in der Entwicklung einer Zeitreihe, um auf zukünftige Entwicklung zu schließen Verwendung zu Prognosezwecken Univariate Zeitreihenanalyse

Mehr

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die Induktive Statistik: Regressionsanalyse Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr