Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur
|
|
- Charlotte Armbruster
- vor 6 Jahren
- Abrufe
Transkript
1 Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur
2 2.1 Lineare und generalisierte lineare Modelle Das klassische lineare Regressionsmodell y i x i N (x i β, σ 2 ) (restriktiver als in Ökonometrie 1!) ist gegeben durch folgende Elemente: (1) linearer Prädiktor η i = x i β, (2) (bedingte) Verteilung der abhängigen Variablen y i x i ist N (µ i, σ 2 ), (3) Verbindung zwischen erwartetem Wert µ i = E(y i x i ) der abhängigen Variablen und linearem Prädiktor ist Identität, d.h. µ i = η i. Die Klasse der generalisierten linearen Modelle (GLMs) erweitert (2) und (3) auf allgemeinere Verteilungen für y und allgemeinere Beziehungen zwischen E(y i x i ) und dem linearen Prädiktor. Damit erweitern GLMs die Ideen hinter dem linearen Modell auf Daten, deren abhängige Variablen binär oder Zähldaten sind (u.a.). Ursprünge: statistische Literatur (Nelder und Wedderburn, 1972), in Ökonometrie (leider) wenig gebräuchlich. C. Kleiber: Mikroökonometrie Kap. 2-1 U Basel, HS 2009
3 2.1 Lineare und generalisierte lineare Modelle GLM gegeben durch (1) linearer Prädiktor η i = x i β, (2) (bedingte) Verteilung der abhängigen Variablen y i x i hat Dichte des Typs ( ) yθ b(θ) f(y i ; θ, φ) = exp + c(y; φ), φ dabei θ von linearem Prädiktor abhängig und Dispersionsparameter φ oft bekannt. Für festes φ ist dies eine (lineare) Exponentialfamilie (Spezialfälle: Normal-, Poisson-, Binomialverteilung) mit kanonischem (oder natürlichem) Parameter θ/φ, (3) monotone Transformation g verbindet erwarteten Wert µ i der abhängigen Variablen und linearen Prädiktor η i, d.h. g(e(y i x i )) = g(µ i ) = η i. Die Funktion g heisst Link-Funktion. (Vorsicht: manche Autoren nennen g 1 die Linkfunktion.) C. Kleiber: Mikroökonometrie Kap. 2-2 U Basel, HS 2009
4 2.1 Lineare und generalisierte lineare Modelle Beispiele für Exponentialfamilien: (a) Bernoulli-Verteilung (y {0, 1}) f(y; p) = p y (1 p) 1 y = exp (b) Poisson-Verteilung (y N 0 ) { y log p 1 p } + log(1 p), p (0, 1). f(y; λ) = λy e λ y! = exp {y log λ λ log y!}, λ > 0. (c) Normalverteilung (y R) { f(y; µ, σ 2 1 ) = exp 1 } 2πσ 2 2σ2(y µ)2 ) = exp {(yµ µ2 1 2 σ 2 1 ( )} y 2 2 σ 2 + log(2πσ2 ), µ R. C. Kleiber: Mikroökonometrie Kap. 2-3 U Basel, HS 2009
5 2.1 Lineare und generalisierte lineare Modelle GLMs mit g(x) x sind also lineare Modelle für eine Transformation von µ i, nämlich g(µ i ), und damit nichtlineare Modelle für µ i selbst. In einem anderen Zweig der Literatur heissen Modelle der Form E(y i x i ) = h(x i β) auch Single-Index-Modelle. Typischerweise ist h unbekannt, also zu schätzen, so dass Modell semiparametrisch (unbekannte [inverse] Link-Funktion und linearer Prädiktor). In dieser Terminologie sind das LRM und GLMs parametrische Single-Index-Modelle (denn h = g 1 ist bekannt). Wenn Dispersionsparameter φ unbekannt, kann Verteilung eine zweiparametrige Exponentialfamilie sein, muss aber nicht. Für einige klassische GLMs ist φ bekannt, da die zugrundeliegende Verteilung nur einen Parameter hat (Bernoulli, Poisson). Die Link-Funktion, die durch den natürlichen Parameter θ der Exponentialfamilie gegeben ist, heisst natürlicher oder kanonischer Link. C. Kleiber: Mikroökonometrie Kap. 2-4 U Basel, HS 2009
6 2.1 Lineare und generalisierte lineare Modelle Der natürliche Parameter θ ist nicht immer der Parameter aus der üblichen Darstellung der Verteilung, sondern i.d.r. eine Transformation. Bei Poisson bspw. θ = log λ. da Verteilung voll spezifiziert: Schätzung mittels Maximum Likelihood (ML) naheliegend. Bsp.: für GLM mit y i x i N (µ i, σ 2 ) und η i = µ i ist ML = KQ nichts Neues! Im allg. keine geschlossene Form des ML-Schätzers, nur numerische Lösung. Standard-Algorithmus für GLMs heisst iterative weighted least squares (IWLS), eine für GLMs adaptierte Version von Fisher-Scoring ( Likelihood-Methodik). Annahmen implizieren E(y i x i ) = µ i = b (θ i ), Var(y i x i ) = φ b (θ i ) Die Funktion V (µ i ) = b (θ i ) b (θ(µ i )) heisst Varianzfunktion. Bsp.: Poisson-GLM hat θ = log(µ), φ = 1 und b(θ) = µ = e θ, also V (µ) = µ. Analogien zum linearen Regressionsmodell suggerieren, dass Funktion zur Schätzung solcher Modelle aussehen kann wie Funktion zur KQ-/ML-Schätzung im linearen Regressionsmodell in Programmpaketen wie R, S-PLUS oder Stata ist dies der Fall. C. Kleiber: Mikroökonometrie Kap. 2-5 U Basel, HS 2009
7 2.1 Lineare und generalisierte lineare Modelle GLMs in R: glm(formula, family = gaussian(link = "identity"), data, weights,...) gegenüber lm() neu: Argumente family und link Ausgewählte GLMs und ihre kanonischen Links Familie Kanonischer Link Name binomial log(µ/(1 µ)) logit gaussian µ identity poisson log µ log Funktion glm liefert Objekt der Klasse "glm". Für Objekte dieser Klasse existieren i.w. dieselben Methoden wie für Objekte der Klasse "lm": residuals(), fitted(), coef(), vcov(), anova(), plot(), summary(), predict(),... C. Kleiber: Mikroökonometrie Kap. 2-6 U Basel, HS 2009
8 2.2 Schätzung und Inferenz in GLMs Schätzung in GLMs beruht auf Likelihood. Für unabhängige Daten y i, i = 1,..., n, Oft praktischer: Log-Likelihood L(θ) = [L(θ, y) =] n f(y i ; θ) i=1 Bei Unabhängigkeit gilt l(θ) = [l(θ, y) =] log L(θ) ML-Schätzer definiert durch l(θ) = n l i (θ) i=1 ˆθ ML := max L(θ) (= max l(θ)) C. Kleiber: Mikroökonometrie Kap. 2-7 U Basel, HS 2009
9 2.2 Schätzung und Inferenz in GLMs Inferenz in GLMs: wie bisher (approximative) t-tests zum Testen einzelner Regressoren statt F -Test nun Likelihood-Quotienten-Test mit anova() R> anova(fm1, fm2) oder über Funktion lrtest() aus Paket lmtest R> lrtest(fm1, fm2) oder von Hand: R> 2 * (loglik(fm2) - loglik(fm1)) Modellwahl: Informationskriterien: Die (generische) Funktion AIC() hat ein Argument, mit dem sich die Form des Straftems wählen lässt (AIC, BIC,... ). C. Kleiber: Mikroökonometrie Kap. 2-8 U Basel, HS 2009
10 2.2 Schätzung und Inferenz in GLMs Spezielle Terminologie in GLM-Literatur im Zusammenhang mit Likelihood-Methoden: LQ-Statistik zum Vergleich zweier Modelle ist 2{l 1 l 2 } Sei l(y, y) Log-Likelihood des saturierten Modells (Modell mit maximaler Parameterzahl, i.d.r. dann Zahl Parameter = Zahl Beobachtungen). skalierte Deviance: D (y, θ) = 2{l(y, y) l(θ, y)} Deviance: D(y, θ) = φ D (y, θ) Saturiertes Modell liefert bestmögliche Anpassung in der gegebenen Modellklasse. Deviance misst dann, wie nahe ein kleineres Modell an diesen Idealzustand kommt. C. Kleiber: Mikroökonometrie Kap. 2-9 U Basel, HS 2009
11 2.2 Schätzung und Inferenz in GLMs Deviance ist eine Verallgemeinerung der Fehlerquadratsumme (RSS) aus dem linearen Regressionsmodell: Für Normalverteilung ist der Beitrag zur Log-Likelihood für eine Beobachtung Damit ist die skalierte Deviance l i (µ, σ 2 ) = log( 2πσ 2 ) 1 2σ 2(y i µ i ) 2 D (y, µ, σ 2 ) = 2{l(y, y) l(µ, y)} = 2 1 2σ 2(y i µ i ) 2 = 1 σ 2(y i µ i ) 2 und mit φ = σ 2 ist D(y, µ, σ 2 ) = φ 1 σ 2(y i µ i ) 2 = (y i µ i ) 2 = RSS Somit kann man OLS hier als minimum deviance -Schätzer auffassen. C. Kleiber: Mikroökonometrie Kap U Basel, HS 2009
12 2.2 Schätzung und Inferenz in GLMs Deviance: Für die hier interessierenden Verteilungen ergibt sich Familie (skalierte) Deviance Bernoulli/Binomial 2 {y i log(y i /ˆµ i ) + (1 y i ) log((1 y i )/(1 ˆµ i ))} Normal (yi ˆµ i ) 2 Poisson 2 {y i log(y i /ˆµ i ) (y i ˆµ i )} Deviance ist additiv für hierarchische Modelle, nenne deshalb Verallgemeinerung der Streuungszerlegung/ANOVA: analysis of deviance. C. Kleiber: Mikroökonometrie Kap U Basel, HS 2009
13 2.2 Schätzung und Inferenz in GLMs Residuen: Im linearen Regressionsmodell waren die Residuen definiert über y i ŷ i = y i ˆµ i Dies ist eine sinnvolle Definition, da dort (oft) Homoskedastie angenommen wird. GLMs sind typischerweise heteroskedastisch, deshalb ist es naheliegend, dort mit der Standardabweichung zu gewichten. Die Art der Gewichtung ist dabei durch die Varianzfunktion des GLMs festgelegt. Die gewichteten Residuen y i ˆµ i V (ˆµi ) heissen auch Pearson-Residuen. Die gebräuchlichsten Varianzfunktionen sind V (µ) = 1 (Normalverteilung) V (µ) = µ(1 µ) (Bernoulli-Verteilung) V (µ) = µ (Poisson-Verteilung) C. Kleiber: Mikroökonometrie Kap U Basel, HS 2009
14 2.2 Schätzung und Inferenz in GLMs Verschiedene Definitionen von Residuen in GLMs: Anderer Zugang zu Pearson-Residuen: die Pearson-Statistik ( Chi-Quadrat- Anpassungstest) ist X 2 := (y i ˆµ i ) 2 /V (ˆµ i ). Definiere deshalb Pearson-Residuen r P i := (y i ˆµ i )/ V (ˆµ i ) Deviance D(y, θ) = n i=1 d i führt auf Deviance-Residuen r D i := sign(y i ˆµ i ) d i In der Ökonometrie sind Pearson-Residuen unter dem Namen standardisierte Residuen weit verbreitet, Deviance-Residuen aber weitgehend unbekannt. In nichtlinearen Modellen wie GLMs ist nicht mehr offensichtlich, was die richtige Definition von Residuen ist, deswegen gibt es zahlreiche Varianten. C. Kleiber: Mikroökonometrie Kap U Basel, HS 2009
15 2.3 Literatur de Jong, P., and Heller, G.Z. (2008). Generalized Linear Models for Insurance Data. Cambridge University Press. Dobson, A.J. und Barnett, A.G. (2008). Introduction to Generalized Linear Models, 3rd ed. Chapman & Hall. McCullagh, P. und Nelder, J.A. (1989). Generalized Linear Models, 2nd ed. Chapman & Hall. Nelder, J.A. und Wedderburn, R.W.M. (1972). Generalized linear models. Journal of the Royal Statistical Society, Series A, 135, Wood, S.N. (2006). Generalized Additive Models. An Introduction with R. Chapman & Hall. [erste 120 S. über lineare Modelle und GLMs] C. Kleiber: Mikroökonometrie Kap U Basel, HS 2009
Kap. 9: Regression mit einer binären abhängigen Variablen
Kap. 9: Regression mit einer binären abhängigen Variablen Motivation Lineares Wahrscheinlichkeitsmodell Probit- und Logit-Regression Maximum Likelihood Empirisches Beispiel: Analyse der HMDA-Daten Ausblick:
MehrKapitel 4: Binäre Regression
Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,
MehrGeneralisierte lineare Modelle. Statistik 3 im Nebenfach. Binäre Regressionsmodelle. 4.1 Binäre Regression
Generalisierte lineare Modelle Statistik 3 im Nebenfach Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München WS 2010/2011 basierend auf Fahrmeir, Kneib & Lang (2007) 4 Generalisierte
MehrTechnische Universität München. Zentrum Mathematik
Technische Universität München Zentrum Mathematik Modellwahl bei der KFZ Haftpflicht-Versicherung mit Hilfe von GLMs Diplomarbeit von Ivonne Siegelin Themenstellerin: Prof. Dr. C. Czado, Dr. G. Sussmann
MehrDie Tarifierung in der Autohaftpflichtversicherung mittels verallgemeinerter linearer Modelle
Diplomarbeit Die Tarifierung in der Autohaftpflichtversicherung mittels verallgemeinerter linearer Modelle von Patricia Siedlok betreut von PD Dr. Volkert Paulsen Mathematisches Institut für Statistik
MehrKlausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik
Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:
MehrSemiparametrisches Kredit Scoring
Semiparametrisches Kredit Scoring Marlene Müller Fraunhofer Institut für Techno- und Wirtschaftsmathematik (ITWM) Kaiserslautern Bernd Rönz, Wolfgang Härdle Center for Applied Statistics and Economics
Mehr2.Tutorium Generalisierte Regression
2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte
MehrGeneralisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren
Generalisierte Additive Modelle im Credit Rating: Eine Fallstudie zum Vergleich verschiedener Verfahren Marlene Müller Beuth Hochschule für Technik Berlin, Fachbereich II Luxemburger Str. 10, D 13353 Berlin
Mehrε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?
BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions
MehrSeminar im Sommersemester 2012 Modellierung kategorialer Daten
LMU München, Institut für Statistik, Seminar für angewandte Stochastik Seminar im Sommersemester 2012 Modellierung kategorialer Daten Prof. Dr. G. Tutz; Dipl.-Stat. M. Oelker; Dipl.-Stat. F. Heinzl; Dipl.-Stat.
Mehr8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.
L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:
MehrKorrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrGeneralisierte lineare Modelle und GEE-Modelle in SPSS Statistics
Universität Trier Zentrum für Informations-, Medienund Kommunikationstechnologie (ZIMK) Trier, den 237215 Bernhard Baltes-Götz Generalisierte lineare Modelle und GEE-Modelle in SPSS Statistics Inhaltsverzeichnis
Mehr6.0 Logistische Regression. 6 Logistische Regression. 6.1 Das binäre Modell. 6 Logistische Regression
6.0 Logistische Regression 6.1 Das binäre Modell 6.1 Das binäre Modell Sei x der Vektor der Einflussgrößen mit einem Eins-Element, um die Regressionskonstante zu modellieren. Angenommen, es gilt das Regressionsmodell:
MehrKategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell
MehrKategoriale abhängige Variablen:
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II
MehrOliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**
Effektschätzung in Cluster-Randomized Trials mit binärer Zielgröße: Eine Sensitivitätsanalyse mit numerischer Integration, MCMC und NPMLE am Beispiel der DHP Oliver Kuß*; Dorothee Twardella**; Maria Blettner***;
MehrGENERALISIERTE LINEARE MODELLE MIT SAS 8e. Andreas Christmann
GENERALISIERTE LINEARE MODELLE MIT SAS 8e Andreas Christmann Universität Dortmund A.Christmann@hrz.uni-dortmund.de KSFE 2003, Potsdam 20.-21. Februar 2003 1/39 INHALT 1. Anwendungen 2. Generalisierte Lineare
MehrRegressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )
Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels
Mehr1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen
Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders
MehrParametrische Statistik
Statistik und ihre Anwendungen Parametrische Statistik Verteilungen, maximum likelihood und GLM in R Bearbeitet von Carsten F. Dormann 1. Auflage 2013. Taschenbuch. xxii, 350 S. Paperback ISBN 978 3 642
MehrTeil II. Nichtlineare Optimierung
Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene
MehrWas sind Paneldaten? Datenquellen Vor- und Nachteile von Paneldaten Historische Bemerkungen Beispiel Software Literatur Programm
Kap. 1: Einführung Was sind Paneldaten? Datenquellen Vor- und Nachteile von Paneldaten Historische Bemerkungen Beispiel Software Literatur Programm 1.1 Was sind Paneldaten? Aus Arellano (2003, p. 2):...
MehrAllgemeine Regressionsanalyse. Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl. deterministisch
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 9.1 Allgemeine Regressionsanalyse Daten (X j, Y j ), j = 1,..., N unabhängig Kovariablen / Prädiktoren / unabhängige Variablen X j R d, evtl.
MehrBinäre abhängige Variablen
Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen
MehrUnsupervised Kernel Regression
9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung
MehrNichtlebenversicherungsmathematik Aus welchen Teilen besteht eine Prämie Zufallsrisiko, Parameterrisiko, Risikokapital Risikomasse (VaR, ES) Definition von Kohärenz Zusammengesetze Poisson: S(i) CP, was
MehrRating. { 0 = kein Ausfall des Kreditnehmers i
Jörg Lemm Vorlesung Finanzmathematik, WS 06/07 Universität Münster 25.1.2007, 1.2.2007, 8.2.2007 Rating Ratingverfahren versuchen, die Wahrscheinlichkeit dafür zu schätzen, dass ein Kreditnehmer seinen
MehrBinäre Auswahlmodelle (Logit, Probit,...)
Binäre Auswahlmodelle (Logit, Probit,...) 27. November 204 In diesem Kapitel führen wir eine Klasse von Modellen für binäre Auswahlprobleme ein, deren wichtigste Vertreter das Logit- und das Probit-Modell
MehrKlausur STATISTIK 2 für Diplom VWL
Klausur STATISTIK 2 für Diplom VWL Name, Vorname: Matrikel-Nr. Die Klausur enthält zwei Typen von Aufgaben: Teil A besteht aus Fragen mit mehreren vorgegebenen Antwortvorschlägen, von denen mindestens
MehrMultinomiale logistische Regression
Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable
MehrTextmining Klassifikation von Texten Teil 1: Naive Bayes
Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive
MehrTitel anhand der der Präsentation. nicht fett geschrieben
Schätzung von Vollzeitäquivalenten Titel anhand der der Präsentation AHV-Lohndaten wenn nötig Jann Potteratmit und Monique Untertitel Graf Bundesamt für Statistik, Statistische Methoden METH nicht fett
MehrAufabe 7: Baum-Welch Algorithmus
Effiziente Algorithmen VU Ausarbeitung Aufabe 7: Baum-Welch Algorithmus Florian Fest, Matr. Nr.0125496 baskit@generationfun.at Claudia Hermann, Matr. Nr.0125532 e0125532@stud4.tuwien.ac.at Matteo Savio,
MehrNichtlineare Optimierung ohne Nebenbedingungen
Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt
MehrDie Anwendung von Generalisierten Linearen Modellen in der Lebensversicherung
Die Anwendung von Generalisierten Linearen Modellen in der Lebensversicherung Versicherungsmathematisches Kolloquium der LMU München Dr. Frank Schiller 13. Juli 2009 Pricing und Valuation in der Lebensversicherung
MehrModellierung des Stornos nach Beitragsanpassung in der PKV
ierung des Stornos nach Beitragsanpassung in der PKV 02.07.2013 Alexander Küpper Central Krankenversicherung AG Inhaltsverzeichnis Einführung Gesetzlicher Rahmen Stornomodell Anwendung Ausblick und Weiterentwicklung
MehrProbeklausur Zeitreihenökonometrie (Sommersemester 2014) 1
Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die
MehrMonte Carlo Methoden in Kreditrisiko-Management
Monte Carlo Methoden in Kreditrisiko-Management P Kreditportfolio bestehend aus m Krediten; Verlustfunktion L = n i=1 L i; Die Verluste L i sind unabhängig bedingt durch einen Vektor Z von ökonomischen
MehrLog-lineare Analyse I
1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln
MehrVersuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann
Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................
MehrEinführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.
Einführung in die Geostatistik (7) Fred Hattermann (Vorlesung), hattermann@pik-potsdam.de Michael Roers (Übung), roers@pik-potsdam.de 1 Gliederung 7 Weitere Krigingverfahren 7.1 Simple-Kriging 7.2 Indikator-Kriging
MehrComputer Vision: Optische Flüsse
Computer Vision: Optische Flüsse D. Schlesinger TUD/INF/KI/IS Bewegungsanalyse Optischer Fluss Lokale Verfahren (Lukas-Kanade) Globale Verfahren (Horn-Schunck) (+ kontinuierliche Ansätze: mathematische
MehrEinfache Modelle für Paneldaten. Statistik II
Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)
MehrWeitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression
Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen
MehrWeiterbildungskurs Stochastik
Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen
MehrDie Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist
Frage Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist k a F (x) =1 k>0,x k x Finden Sie den Erwartungswert und den Median der Dichte für a>1. (Bei
MehrLineare Modelle in R: Einweg-Varianzanalyse
Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der
MehrStatistik Einführung // Lineare Regression 9 p.2/72
Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression
MehrStatistische Thermodynamik I Lösungen zur Serie 1
Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen
Mehrν = z Hy, S = HPH + R, W = PH S 1 Q 1 = P 1 + H R 1 H. independent of x Interpret N ( z; Hx, R ) N ( x; y, P ) as a joint density: ) ( ) )!
= N ( z; Hy, S independent of x N ( z; Hx, R N ( x; y, P N ( x; y + Wν, P WSW N ( x; Q(P 1 y + H R 1 z, Q ν = z Hy, S = HPH + R, W = PH S 1 Q 1 = P 1 + H R 1 H. Interpret N ( z; Hx, R N ( x; y, P as a
MehrPRAKTIKUM Experimentelle Prozeßanalyse 2. VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge)
FACHGEBIET Systemanalyse PRAKTIKUM Experimentelle Prozeßanalyse 2 VERSUCH AS-PA-2 "Methoden der Modellbildung statischer Systeme" Teil 2 (für ausgewählte Masterstudiengänge) Verantw. Hochschullehrer: Prof.
MehrDIE ANWENDUNG VON GLM IN DER LEBENSVERSICHERUNG. Graduiertenkolleg Universität Ulm
DIE ANWENDUNG VON GLM IN DER LEBENSVERSICHERUNG Graduiertenkolleg Universität Ulm Dr. Frank Schiller 30.10.2009 PRICING UND VALUATION IN DER LEBENSVERSICHERUNG Produkte in der deutschen Lebensversicherung
MehrElementare Bildverarbeitungsoperationen
1 Elementare Bildverarbeitungsoperationen - Kantenerkennung - 1 Einführung 2 Gradientenverfahren 3 Laplace-Verfahren 4 Canny-Verfahren 5 Literatur 1 Einführung 2 1 Einführung Kantenerkennung basiert auf
Mehra) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.
Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html
MehrBiostatistische Studienplanung II. Dr. Matthias Kohl SIRS-Lab GmbH
Biostatistische Studienplanung II Dr. Matthias Kohl SIRS-Lab GmbH Inhalt Lineare Modelle: Definition und Beispiele KQ- und robuste Schätzer Diagnostik Ausblick: Mixed-Effects Definition des linearen Modells
MehrFortgeschrittene Computerintensive Methoden
Fortgeschrittene Computerintensive Methoden Einheit 8: Gradient Boosting (basierend auf einer VL-Einheit von B. Bischl in Dortmund) Bernd Bischl Matthias Schmid, Manuel Eugster, Bettina Grün, Friedrich
MehrKommentierter SPSS-Ausdruck zur logistischen Regression
Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer
MehrLineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA)
Interdisziplinäres Seminar Lineare Strukturgleichungsmodelle (LISREL) Konfirmatorische Faktorenanalyse (CFA) WS 2008/09 19.11.2008 Julia Schiele und Lucie Wink Dozenten: Prof. Dr. Bühner, Prof. Dr. Küchenhoff
MehrStatistik - Fehlerrechnung - Auswertung von Messungen
2013-11-13 Statistik - Fehlerrechnung - Auswertung von Messungen TEIL I Vorbereitungskurs F-Praktikum B (Physik), RWTH Aachen Thomas Hebbeker Literatur Eindimensionaler Fall: Grundbegriffe Wahrscheinlichkeitsverteilungen:
MehrElemente der Analysis II
Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel
MehrKapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung
Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion
MehrRegressionsmodelle für kategoriale Daten und Zähldaten
Kapitel 8 Regressionsmodelle für kategoriale Daten und Zähldaten Das Modell der linearen Regression und Varianzanalyse (vgl. Abschn. 6.3, 7.3, 12.9.1) lässt sich zum verallgemeinerten linearen Modell (GLM,
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion
Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit
MehrAbschlussklausur (60 Minuten), 15. Juli 2014
Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit
MehrStochastische Eingangsprüfung, 17.05.2008
Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)
MehrKorrelation (II) Korrelation und Kausalität
Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen
MehrVorlesung 3 MINIMALE SPANNBÄUME
Vorlesung 3 MINIMALE SPANNBÄUME 72 Aufgabe! Szenario: Sie arbeiten für eine Firma, die ein Neubaugebiet ans Netz (Wasser, Strom oder Kabel oder...) anschließt! Ziel: Alle Haushalte ans Netz bringen, dabei
MehrDas Rasch-Modell: Modellprüfung & Informationskriterien. Vortrag von Manuela Gärtner, Jörg-Henrik Heine und Sarah Hofer
Das Rasch-Modell: Modellprüfung & Informationskriterien Vortrag von Manuela Gärtner, Jörg-Henrik Heine und Sarah Hofer 1 Gliederung 1. Einführung 2. Vorstellung des Beispieldatensatzes: I-S-T 2000 R 3.
MehrPR Statistische Genetik und Bioinformatik
PR Statistische Genetik und Bioinformatik Johanna Bertl Institut für Statistik und OR, Universität Wien Oskar-Morgenstern-Platz 1/6.344, 1090 Wien, Tel.: 01-4277-38617 johanna.bertl@univie.ac.at, homepage.univie.ac.at/johanna.bertl
MehrLernen von Entscheidungsbäumen. Volker Tresp Summer 2014
Lernen von Entscheidungsbäumen Volker Tresp Summer 2014 1 Anforderungen an Methoden zum Datamining Schnelle Verarbeitung großer Datenmengen Leichter Umgang mit hochdimensionalen Daten Das Lernergebnis
MehrGemischte Lineare Modelle
Gemischte Lineare Modelle Linear Mixed Effect Models Fritz Günther SFB833, Projekt Z2 March 20, 2015 Fritz Günther Gemischte Lineare Modelle Übersicht Lineare Modelle allgemein Gemischte Lineare Modelle
MehrÜber statistische Probleme bei der Analyse von Daten aus dem Bereich der Kraftfahrzeugversicherung
Statistik Über statistische Probleme bei der Analyse von Daten aus dem Bereich der Kraftfahrzeugversicherung Andreas Christmann Universität Dortmund Fachbereich Statistik 44221 Dortmund christmann@statistik.uni-dortmund.de
MehrFAKTORIELLE VERSUCHSPLÄNE. Andreas Handl
FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei
MehrAlgorithmische Modelle als neues Paradigma
Algorithmische Modelle als neues Paradigma Axel Schwer Seminar über Philosophische Grundlagen der Statistik, WS 2010/11 Betreuer: Prof. Dr. Thomas Augustin München, den 28. Januar 2011 1 / 29 LEO BREIMAN
MehrBeispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen
4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.
MehrSolvency II und die Standardformel
Fakultät Mathematik und Naturwissenschaften Institut für Mathematische Stochastik Solvency II und die Standardformel Festkolloquium 20 Jahre (neue) Versicherungsmathematik an der TU Dresden Sebastian Fuchs
MehrDie Technik und Logik von linearen Strukturgleichungsmodellen
Die Technik und Logik von linearen Strukturgleichungsmodellen Empfehlenswerte Einführungen in die Arbeit mit Strukturgleichungsmodellen ( structural equation modeling ) finden sich in Byrne (1994) (spezifisch
MehrModerne Monte Carlo Methoden für Anwendungen in Finanz- und Versicherungsmathematik
Fraunhofer ITWM Kaiserslautern, 4..009 Moderne Monte Carlo Methoden für Anwendungen in Finanz- und Versicherungsmathematik Ralf Korn (TU Kaiserslautern & Fraunhofer ITWM) 0. Einige praktische Probleme
MehrKapitel 18. Die Maximum-Likelihood Methode. 18.1 Grundidee
Kapitel 18 Die Maximum-Likelihood Methode 18.1 Grundidee Wir haben bisher (fast) ausschließlich die OLS-Methode angewandt um Schätzer für die Parameter eines Regressionsmodells zu bestimmen. Obwohl die
Mehr12. Bivariate Datenanalyse. In den Kapiteln 4-11 wurden univariate Daten betrachtet:
12. Bivariate Datenanalyse Während einer nur Zahlen im Kopf hat, kann er nicht auf den Kausalzusammenhang kommen Anonymus In den Kapiteln 4-11 wurden univariate Daten betrachtet: Von univariaten Daten
MehrMÖGLICHKEITEN UND GRENZEN DER VORHERSAGBARKEIT VON EPIDEMIEN IN FRÜHEN STADIEN
MÖGLICHKEITEN UND GRENZEN DER VORHERSAGBARKEIT VON EPIDEMIEN IN FRÜHEN STADIEN Mario Ziller Friedrich-Loeffler-Institut Bundesforschungsinstitut für Tiergesundheit Institut für Epidemiologie Seestr. 55,
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Anne Neumann 21. Oktober 2015 Anne Neumann EWF 21. Oktober 2015 1 / 9 Inhaltsverzeichnis 1 Grobgliederung 2 Grundlagen Anne Neumann EWF 21. Oktober 2015 2 / 9 Grobgliederung
MehrKlausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung
Universität Augsburg Wirtschaftswissenschaftliche Fakultät Lehrstuhl für Finanz und Bankwirtschaft Matrikelnummer Klausur zur Vorlesung Methoden der empirischen Kapitalmarktforschung Prof. Dr. Marco Wilkens
MehrWas kann die Statistik zur Bankenkrise beitragen?
Was kann die Statistik zur Bankenkrise beitragen? Rafael Weißbach Lehrstuhl für Statistik, insbesondere demografischer Wandel Institut für Volkswirtschaftslehre Wirtschafts- und Sozialwissenschaftliche
MehrStochastische Analysis. Zufallsmatrizen. Roland Speicher Queen s University Kingston, Kanada
Stochastische Analysis für Zufallsmatrizen Roland Speicher Queen s University Kingston, Kanada Was ist eine Zufallsmatrix? Zufallsmatrix = Matrix mit zufälligen Einträgen A : Ω M N (C) Was ist eine Zufallsmatrix?
MehrS=[n] Menge von Veranstaltungen J S kompatibel mit maximaler Größe J
Greedy-Strategie Definition Paradigma Greedy Der Greedy-Ansatz verwendet die Strategie 1 Top-down Auswahl: Bestimme in jedem Schritt eine lokal optimale Lösung, so dass man eine global optimale Lösung
MehrLösung des Kleinste-Quadrate-Problems
Lösung des Kleinste-Quadrate-Problems Computergestützte Statistik Lisakowski, Christof 15.05.2009 Lisakowski, Christof ()Lösung des Kleinste-Quadrate-Problems 15.05.2009 1 / 34 Themen 1 Problemstellung
MehrHaskell zur Constraint-Programmierung HaL8
Haskell zur Constraint-Programmierung HaL8 Alexander Bau 2. Mai 2013 Wir benutzen eine Teilmenge von Haskell zur Spezifikation von Constraint- Systemen über Haskell-Datentypen. Ein Constraint-Compiler
MehrStochastik für WiWi - Klausurvorbereitung
Dr. Markus Kuze WS 2013/14 Dipl.-Math. Stefa Roth 11.02.2014 Stochastik für WiWi - Klausurvorbereitug Gesetz der totale Wahrscheilichkeit ud Satz vo Bayes (Ω, F, P) Wahrscheilichkeitsraum, E 1,..., E F
MehrMultidimensionale Paarvergleiche. Experten
Multidimensionale Paarvergleiche V l i h d Ri ik h h Kl i l d Vergleich der Risikowahrnehmung von Kleinanlegern und Experten Agenda Theoretischer Hintergrund Studiendesign Forschungsergebnisse 2 Überblick
MehrInhalt 1 Einführung... 1 2 Ausgewählte Begriffe... 10 3 Vorgehensweise im Überblick... 14
VII 1 Einführung... 1 1.1 Warum Versuche?... 1 1.2 Warum Statistik?... 1 1.3 Warum Versuchsplanung?... 4 1.4 Welche Art von Ergebnissen kann man erwarten?... 6 1.5 Versuche oder systematische Beobachtung?...
MehrTutorial 2: Simulationen
Tutorial 2: Simulationen Andrea Wiencierz Institut für Statistik, LMU München Andrea.Wiencierz@stat.uni-muenchen.de Abschlussarbeiten-Kolloquium, AG Augustin A. Wiencierz (LMU Munich) Literature & LATEX
MehrInhalt. Vorwort... 1 Einführung... 1. 2 Ausgewählte Begriffe... 11. 3 Vorgehensweise im Überblick... 17
Inhalt Vorwort.................................................................. V Inhalt.................................................................... VII 1 Einführung..........................................................
MehrLasso in LMs und GLMs
Lasso in LMs und GLMs Seminar Regularisierungstechniken und strukturierte Regression, Prof. Dr. Gerhard Tutz, Institut für Statistik, Ludwig-Maximilians-Universität München Referent: Patrick Schenk Betreuer:
Mehr