Raschmodelle und generalisierte Regression. Sven Hilbert
|
|
- Alwin Messner
- vor 5 Jahren
- Abrufe
Transkript
1 Raschmodelle und generalisierte Regression Sven Hilbert
2 Generalisiertes lineares Modell () Bestandteile generalisierter linearer Modelle Zufällige Komponente Y mit zugehöriger Wahrscheinlichkeitsverteilung Mit unabhängigen Beobachtungen (y,, y N ) Sytematische Komponente (erklärende Größe) θ Benutzt in linearer Vorhersagefunktion Linkfunktion spezifiziert die Funktion von E(Y), die das Modell mit der systematischen Komponente verbindet 2/28
3 Generalisiertes lineares Modell (2) Allgemeine Form Wahrscheinlichkeitsfunktion von Y (Exponentialfamilie): f ( y i ;θ i ) = a(θ i )b( y i )exp[ y i Q(θ i )] Q(θ i ) wird natürlicher Parameter genannt Systematische Komponente verbindet einen Vektor (η,, η N ) mit den erklärenden Variablen durch ein lineares Modell mit Prädiktoren j (j =, 2,, p): η i = p j= β j x ij Die Linearkombination der erklärenden Variablen wird linearer Prädiktor genannt 3/28
4 Generalisiertes lineares Modell (3) Linkfunktion: g ( µ ) i = η i µ i = E(Y i ) mit i =,, N Verbindet zufälligen mit systematischen Komponenten Identitätslink : g ( µ ) = µ Kanonische (natürliche) Linkfunktion: Q(θ i ) = β j x ij = η i = g(µ i ) Transformiert µ in den natürlichen Parameter η j= Abhängig von Verteilung der y i p 4/28
5 Bernoulliverteilung Wahrscheinlichkeitsfunktion der Bernoulliverteilung: (y; ) y y f π = π ( π) P(Y = ) = π und P(Y = 0) = - π mit E(Y) = π π Kanonischer Link: Q( π ) = ln π Für Logistische Regression folgt: Hierbei P(Y = ) = π(x) Gilt für Bernoulli- und Binomialverteilung exp( η) π ( x) = exp( η) 5/28
6 Beispiel Anwendung Rasch Modell Zweidimensionale Kontingenztafel Testung Unabhängigkeitshypothese Systematische kategoriale Quanitität Multiple binäre Quantitäten Eisaffinität abhängig von Studiengang? Drei Eissorten Binärer Response (ja / nein) Zwei Studiengänge 2- dimens. Studiengänge Eissorten 6/28
7 Kontingenztafel 2x3 Kontingenztafel Studiengang systematische Variable 2 Level Kreuzklassifiziert mit Eissorte Jeder Student kann 0 3 Sorten kaufen Randsummen Reihen Eissorten in Tabelle Anzahl Studenten Eissorte Studiengang Schokolade (A) Kirsche (B) Gummibär (C) Anzahl Studenten Statistik Psychologie Total /28
8 Abhängigkeit prüfen Spalten schließen sich nicht gegenseitig aus Pearson χ²-test kann nicht angewandt werden Durch Kreuzklassifikation kann 2 x 2 x 2 Tabelle für beide Studiengänge erstellt werden Jeweils 2 3 = 8 Zellen Möglichkeiten: 000; 00; 00; ; - 0 = nein, = ja Jeweils 6 Randsummen (3 Sorten Eis x ja / nein ) 8/28
9 Randsummentabelle Tabelle enthält also eigentlich Randsummen ja -Responses für beide Schultypen Unabhängigkeitshypothese bezieht sich auf Randsummen Marginal Independence Studiengang Schokolade (A) Eissorte Kirsche (B) Gummibär (C) Anzahl Studenten Statistik Psychologie Total /28
10 Marginales Logit Modell Zufällige Variable: Eissorte Level: i =, 2, 3 Systematische Variable: Studiengang Level: j =, 2 Annahme: Alle Antwortmuster unabhängig multinomial verteilt Ø Gemeinsame Verteilung der Häufigkeiten der Antwortmuster ist produkt-multinomial verteilt 0/28
11 Parameter und Modelle π ij bezeichnet Randwahrscheinlichkeit Person aus Studiengang j kauft Sorte i Parameter der Binomialverteilung, welcher Häufigkeit modelliert Marginales Logit Modell: Unabhängig (Modell ): Abhängig (Modell 2): π i βi = ln π i β ij π ij = ln π ij /28
12 Parameterschätzung Zwei grundlegende Methoden für marginales Modell. Likelihood basiert Restriktion: Randwahrscheinlichkeiten genügen marginalem Modell Produkt-multinomiale Likelihood Funktion wird maximiert Erlaubt wenn alle möglichen Responsemuster unabhängig multinomialverteilt sind Ø Allerdings sind In den vorgestellten Modellen sind Responsemuster abhängig 2. Quasi-Likelihood basiert Keine Annahmen zur Verteilung nötig Nur erste beide Momente werden genutzt (Mean-Variance Relationship) Bei Annahme einer aus der Exponentialfamilie bekannten Mean- Variance-Relatioship äquivalent zur vollständigen Likelihood 2/28
13 Vergleich Likelihood und Quasi-Likelihood Parameterschätzung bei ML: var(y i ) ist aufgrund der angenommenen Verteilung der Exponentialfamilie bekannt l i = ( y µ )x i i ij µ i, j =,..., p β j var(y i ) η i Parameterschätzung bei QML l i = ( y µ )x i i ij µ i, j =,..., p β j υ(µ i ) η i Varianz wird nur über die angenommenen Mean-Variance- Relationship var(y i ) = υ(µ i ) spezifiziert 3/28
14 Multivariate Erweiterung der Quasi Likelihood Parameterschätzung bei GEE: mit Δ i = D i µ = β θit η i i it i β = D 'V (y i i i µ i (β)) als Diagonalemente, B i = b (θ it ) als Diagonalelemente, /2 /2, R(α) als Arbeitskovarianzmatrix und V = B R( α) B. Eigenschaften: Multivariate Erweiterung der Quasi-Likelihood i i i φ Computational leichter aber weniger effizient als Likelihood Likelihood basierte Tests können nicht verwendet werden # 4
15 Schätzung am Beispiel von Modell () Generalisierte Schätzgleichung (GEE) wird verwendet " n % ˆβ i = ln i $ # N n ' i & und Werte aus Randsummentabelle: Studiengang Schokolade (A) se i =! " N ˆπ i ( ˆπ i )# $ Eissorte Kirsche (B) mit Gummibär (C) exp( ˆ βi ) ˆ π i = exp( ˆ β ) Anzahl Studenten Statistik Psychologie Total i 5/28
16 Schätzung am Beispiel von Modell () Resultierende Parameter für Modell (): " 9 % ˆβ = ln$ # 380 9& ' 2 ˆ 23 β = ln ˆ ln 243 β3 = Studiengang Schokolade (A) Eissorte Kirsche (B) Gummibär (C) Anzahl Studenten Statistik Psychologie Total /28
17 Geschätzte Parameter Parameter und Standardfehler für Modelle () und (2): Modell () Modell (2) Eis Statistik Psychologie Schokolade (A) (.) (.98) (.38) Kirsche (B).254 (.03) (.6).72 (.44) Gummibär (C).573 (.07).50 (.58).93 (.49) Wald-Test: W = df = k (l - ) = 3 p =.85 * 0-0 à Eiskauf ist abhängig vom Studiengang 7/28
18 Anwendung Rasch Modell Erweiterte Fragestellung Gibt es eine andere Erklärung für den gefundenen Unterschied? Ø Könnte Eitelkeit die entscheidende Rolle spielen? Eitelkeit als zweite systematische Variable aufnehmen Verschwindet der Effekt Studiengang bedingt auf Eitelkeit? Eitelkeit ist nicht-beobachtbare (latente) Größe Ø Fragebogen ( 4 Punkte) 8/28
19 Formalisierung Modell (3) mit zwei Einflussgrößen: π vi θv βi = ln π vi π vi ist Wahrscheinlichkeit dass Studierender v Sorte i wählt Bedingtes Modell Kauf der Eissorten darf von Eitelkeit abhängen 9/28
20 Bedingtes Modell Vorteil: Modell determiniert die gemeinsame Verteilung der Responses aller Items (Eissorten) Gegeben β,, β k und θ,, θ k sind alle Bernoulli Variablen (Antworten) lokal unabhängig Ø cml Schätzung kann verwendet werden Gemeinsame Verteilung ist gegeben durch das Produkt der Studierenden-spezifischen Wahrscheinlichkeiten aus Modell (3) Über alle Eissorten und Studierende 20/28
21 Eigenschaften bedingtes Modell Bedeutung des Fehlens von Studiengangsindex j : Gegeben β i hängt die Wahrscheinlichkeit ein Eis zu kaufen von der Eitelkeit ab Ø Unabhängig vom Studiengang Hypothese ist simultane (auf Eitelkeit) bedingte Unabhängigkeit zwischen Schultyp und Response (Eiskauf) 2/28
22 Problem Eitelkeit ist unbeobachtete latente Größe und muss für jeden Studierenden geschätzt werden Ø Neyman-Scott Problem Ø Lösung von Andersen (970) wird angewandt à Anzahl der gekauften Eissorten ist suffizient für jeden Studierenden r ϵ {0,,k} ist Anzahl der gekauften Eissorten Wird als Eismenge definiert mit k Level Ersetzt die angenommene stetige latente Variable Eisaffinität 22/28
23 Bedingte Wahrscheinlichkeit Modell (4) (bedingtes Rasch Modell): π ir = exp( β ) γ γ i r () i r i =,, k und r =,, k- mit β k = 0 zur Modellidentifizierung γ r bezeichnet symmetrische Grundfunktion der Ordnung r der Parameter exp(β ),, exp(β k ) γ (i) r- bezeichnet die erste partielle Ableitung von γ r nach β i 23/28
24 Parameterschätzung mit cml Durch Bedingen auf Eismenge r kann die bedingte Wahrscheinlichkeitsverteilung hergeleitet werden Anteil, den die Wahrscheinlichkeit für ein bestimmtest Antwortmuster an der Gesamtwahrscheinlichkeit aller Muster mit Summenscore r hat Bed. Likelihood (cml) ist Funktion der Parameter β,, β k Also nicht mehr abhängig von θ,, θ k Theoretisch könnte auch umgekehrt bedingt werden Analog zu den bisher bekannten Personen- und Itemparametern im Rasch Modell 24/28
25 Alternatives Modell In Modell (4) wird implizit festgelegt: πir =... = πirl = πir à Studiengang j spielt keine Rolle Alternativ kann folgendes Modell (5) aufgestellt werden: ˆ π irj = exp( β ) γ γ ij r ( ij) r Abgeleitet wird hier nach den β ij à cml Schätzung à Studiengang j wird ebenfalls modelliert 25/28
26 Hypothesentest Aufgrund der cml Schätzung können der Andersen Likelihood Ratio Test und der Wald Test angewendet werden Vergleich der Parameter der Modell (4) und (5): Modell (4) Modell (5) Eis Statistik Psychologie Schokolade (A) Kirsche (B) (.60) -.96 (.253) -.87 (.20) Gummibär (C) (.64) (.256) (.25) G² =.67 p =.558 W =.220; p =.390 mit df = 2 à Bedingt auf Eitelkeit ist Eisaffinität unabh. vom Studiengang 26/28
27 Zusammenfassung Erweiterung der Anwendbarkeit des Rasch Modells Rasch Modell wird nicht als Messmodell sondern als Logit Modell für die Analyse von Häufigkeiten von zweidimensionalen Kontingenztafeln verwendet Bedingte Unabhängigkeit wird getestet Hypothese der simultanen bedingten Unabhängigkeit wird getestet Zwischen systematischer (Studiengang) und dem binären Response auf multiple Items, gegeben eine zweite Variable (Eitelkeit) 27/28
28 Literatur Agresti, A. (2002). Categorical data analysis. Hoboken: John Wiley & Sons. Agresti, A., & Liu, I. (999). Modeling a categorical variable allowing arbitrarily many category choices. Biometrics, 55, Andersen, E.B. (970). Asymptotic properties of conditional maximum likelihood estimators. Journal of the Royal Statistical Society, Series B, 32, Draxler, C. (20). Logit models for the analysis of two-way categorial data. Educational Research and Evaluation, 7(5), /28
29 Appendix Zusatzmaterial zur Erklärung und Weiterführung # 29/28
30 Beweis der Suffizienten Statistik p(0,,0) r = ß Bedingte Wahrscheinlichkeit Ø Nur noch der Itemparameter () ist in der Formel enthalten # 30 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) = =
31 Angewandt auf das Rasch- Modell
32 Die symmetrische Grundfunktion Die Symmetrische Grundfunktion: (zur Erinnerung: i = exp(-β k ) # 32
33 Symmetrische Grundfunktion Formel: k exp( x ) iσ i xr i= Kurzform: γr (exp( σ)) Eingesetzt im Nenner der cml: cl = exp( N i= vi i v= γr (exp( σ)) k x σ # 33
34 Generalized Linear Mixed Model Linearer Prädiktor: y it ist Beobachtung t in cluster i u i ~ N(0,Σ) angenommen var(y it u i ) = Φ it υ(µ it ) Bedingt auf u i, behandelt das Modell y it unabhänging über i und t Als logit Modell: g ( µ ) = x' β z' u it it it i ( ) logit[ PY = u = β u it i t i u i wird im Raschmodell zwar als fester Effekt behandelt, allerdings durch cml eliminiert Andere Autoren: Random Effects Modell mit Probit-Link # 34
Klassen diskreter Variablen
Modelle diskreter Variablen Klassen diskreter Variablen binär multinomial Weitere Klassifizierung multinomialer diskreter Variablen: kategorial y = 1, falls Einkommen < 3000 e. y = 2, falls Einkommen zw.
MehrDas Rasch-Modell und seine zentralen Eigenschaften
Das Rasch-Modell und seine zentralen Eigenschaften Stella Bollmann Seminar Psychometrische Modelle: Theorie und Anwendungen Institut für Statistik, LMU München München, 27. Mai 2014 Stella Bollmann Das
MehrVarianzkomponentenschätzung
Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler
MehrPoisson Regression & Verallgemeinerte lineare Modelle
Poisson Regression & Verallgemeinerte lineare Modelle 20.11.2017 Motivation Ausgangslage Wir haben Anzahldaten (count data) Y i, cf. Vorlesung zu kategoriellen Variablen. Zu jeder Beobachtung Y i haben
MehrPoisson Regression. Verallgemeinerte Lineare Modelle (GLMs)
Poisson Regression Verallgemeinerte Lineare Modelle (GLMs) 28.11.2011 Poisson Regression Aus der Einführungsvorlesung Poisson-Verteilung ist in der Regel gut geeignet, um Anzahlen zu modellieren. Frage
MehrMaximum-Likelihood Schätzung. VL Forschungsmethoden
Maximum-Likelihood Schätzung VL Forschungsmethoden Wiederholung Einführung: Schätzung Likelihood-Schätzung und Generalisiertes Lineares Modell Zufallsverteilungen Lernziele 1. Grundzüge der Likelihood-Schätzung
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrEin exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann
Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle
MehrStatistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrNachholklausur zur Vorlesung Schätzen und Testen I. 04. April Bitte ausfüllen und unterschreiben!!!
Nachholklausur zur Vorlesung Schätzen und Testen I 04. April 2013 Volker Schmid, Ludwig Bothmann, Julia Sommer Aufgabe 1 2 3 4 5 6 Punkte Note Bitte ausfüllen und unterschreiben!!! Name, Vorname: Matrikelnummer:
Mehr5.Tutorium Generalisierte Regression
5.Tutorium Generalisierte Regression - Multinomiales/Kummulatives Logit-Modell - Cynthia Huber: 09.12.2014 und 16.12.2014 Michael Hanselmann: 18.12.2014 Institut für Statistik, LMU München 1 / 16 Gliederung
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für
MehrMaximum-Likelihood Schätzung
Maximum-Likelihood Schätzung VL Forschungsmethoden 1 Wiederholung Einführung: Schätzung 2 Likelihood-Schätzung und Generalisiertes Lineares Modell Zufallsverteilungen 3 Lernziele 1 Grundzüge der Likelihood-Schätzung
MehrEinführung in die Induktive Statistik: Regressionsanalyse
Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse
MehrRegressionsmodelle für diskrete Zielgrößen und korrelierte Beobachtungen. Oliver Kuß*; Uwe Hasenbein**;
Regressionsmodelle für diskrete Zielgrößen und korrelierte Beobachtungen Oliver Kuß*; Uwe Hasenbein**; *Institut für Medizinsche Epidemiologie, Biometrie und Informatik, Martin-Luther-Universität Halle-Wittenberg,
MehrKap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur
Kap. 2: Generalisierte lineare Modelle (GLMs) Lineare und generalisierte lineare Modelle Schätzung und Inferenz in GLMs Literatur 2.1 Lineare und generalisierte lineare Modelle Das klassische lineare Regressionsmodell
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
MehrEinfache lineare Regression. Statistik (Biol./Pharm./HST) FS 2015
Einfache lineare Regression Statistik (Biol./Pharm./HST) FS 2015 Wdh: Korrelation Big picture: Generalized Linear Models (GLMs) Bisher: Population wird mit einer Verteilung beschrieben Bsp: Medikament
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrDWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr
2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.
Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die
Mehr1 Gemischte Lineare Modelle
1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrKategorielle Zielgrössen
Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische
MehrLogistische Regression
Logistische Regression 13.11.2017 Motivation Regressionsrechnung: Untersuchung des Zusammenhangs zwischen einer (oder mehreren) Zielvariablen und einer oder mehreren erklärenden Variablen. Bisher gesehen:
MehrLogistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios
Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)
MehrPrüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:
Mehr(G)LM. 24. November 2009
(G)LM 24 November 29 Dies ist eine kurze Zusammenfassung der Grundlagen von linearen Modellen, sowie aufbauend darauf von generalisierten linearen Modellen Sie dient lediglich zum Einstieg und zur knappen
MehrVorlesung: Lineare Modelle
Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen
MehrStatistik für Ingenieure und Naturwissenschaftler
Sheldon M. Ross Statistik für Ingenieure und Naturwissenschaftler 3. Auflage Aus dem Amerikanischen übersetzt von Carsten Heinisch ELSEVIER SPEKTRUM AKADEMISCHER VERLAG Spektrum Inhalt Vorwort zur dritten
Mehr2.5 Lineare Regressionsmodelle
2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]
MehrMathematische Statistik Aufgaben zum Üben. Schätzer
Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrFortgeschrittene Ökonometrie: Maximum Likelihood
Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,
MehrNicht-kontinuierliche abhängige Variablen: Das generalisierte lineare Modell und die Parameterschätzung via Maximum Likelihood
Nicht-kontinuierliche abhängige Variablen: Das generalisierte lineare Modell und die Parameterschätzung via Maximum Likelihood Interaktionseffekte Varianz-Kovarianz-Matrix Interaktionseffekte Varianz-Kovarianz-Matrix
MehrSeminar: Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften. Institut für Statistik, LMU München
Seminar: Statistische Modellierung latenter Strukturen in den Lebens-, Sozial- und Wirtschaftswissenschaften Institut für Statistik, LMU München 18.01.2014 Grundfrage der Psychometrie Wie kann man Eigenschaften,
MehrZusammenfassung 11. Sara dos Reis.
Zusammenfassung 11 Sara dos Reis sdosreis@student.ethz.ch Diese Zusammenfassungen wollen nicht ein Ersatz des Skriptes oder der Slides sein, sie sind nur eine Sammlung von Hinweise zur Theorie, die benötigt
MehrSignifikanztests Optimalitätstheorie
Kapitel Signifikanztests Optimalitätstheorie Randomisierte Tests In einem statistischen Modell M, A, P ϑ sei ein Testproblem gegeben: H : ϑ Θ gegen H : ϑ Θ ; wobei also durch Θ Θ Θ eine Zerlegung des Parameterbereichs
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation
MehrMultivariate Statistik
Multivariate Statistik von Univ.-Prof. Dr. Rainer Schlittgen Oldenbourg Verlag München I Daten und ihre Beschreibung 1 1 Einführung 3 1.1 Fragestellungen 3 1.2 Datensituation 8 1.3 Literatur und Software
MehrMehrdimensionale Zufallsvariablen
Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrSchätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk
Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC
MehrEinführung in die Maximum Likelihood Methodik
in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood
MehrRegressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/
Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................
MehrLogistische Regression
Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum
MehrBinomialverteilung. Häufigkeit, mit der Ereignis A bei n unabhängigen Versuchen eintritt. Träger von X : X = {0, 1, 2,..., n}.
Binomialverteilung Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder nicht. X = Häufigkeit, mit
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrWahrscheinlichkeit und Statistik: Zusammenfassung
HSR Hochschule für Technik Rapperswil Wahrscheinlichkeit und Statistik: Zusammenfassung beinhaltet Teile des Skripts von Herrn Hardy von Lukas Wilhelm lwilhelm.net 12. Januar 2007 Inhaltsverzeichnis 1
Mehr3.4 Bayes-Verfahren Begrifflicher Hintergrund. Satz 3.22 (allgemeines Theorem von Bayes)
3.4 Bayes-Verfahren 203 3.4.1 Begrifflicher Hintergrund Satz 3.22 (allgemeines Theorem von Bayes) Seien X und U zwei Zufallsvariablen mit gemeinsamer Wahrscheinlichkeitsfunktion f X,U ( ) bzw. Dichte f
Mehr5 Allgemeine Verfahren zum Testen von Hypothesen
5 Allgemeine Verfahren zum Testen von Hypothesen 5.1 Likelihood Schätzung für multivariate Daten Statistisches Modell: Einfache Zufallsstichprobe X 1,..., X n (unabhängige Wiederholungen von X IR d ).
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrDie Maximum-Likelihood-Methode
Vorlesung: Computergestützte Datenauswertung Die Maximum-Likelihood-Methode Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft
MehrAllgemeine lineare Modelle
262 Merkpunkte Allgemeine lineare Modelle Multiple lineare Regression mit nicht-normalen Zufallsabweichungen bilden eine harmlose" Verallgemeinerung der multiplen lin. Regr. Beispiele: Gumbel-Regression,
MehrZufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential
Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:
MehrPermutationstests II.
Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Permutationstests II. 1. Zwei-Stichprobentest auf Variabilität 2. Mehrere Stichproben: Vergleich von Mittelwerten 3. Kurzer Exkurs: Präzision von Monte
MehrLogistische Regression
Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation
MehrSemiparametrische Multinomiale Logit-Modelle zur Markenwahl-Analyse
Semiparametrische Multinomiale Logit-Modelle zur Markenwahl-Analyse Thomas Kneib Institut für Statistik Ludwig-Maximilians-Universität München gemeinsam mit Bernhard Baumgartner Universität Regensburg
Mehr7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.
7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe
MehrStatistik II für Betriebswirte Vorlesung 11
Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 08. Januar 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
Mehry = b 0 + b 1 x 1 x 1 ε 1. ε n b + b 1 1 x n 2) Hat die Größe x einen Einfluss auf y, d.h. gilt die Hypothese: H : b 1 = 0
8 Lineare Modelle In diesem Abschnitt betrachten wir eine spezielle Klasse von statistischen Modellen, in denen die Parameter linear auftauchen Wir beginnen mit zwei Beispielen Beispiel 8 (lineare Regression)
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
MehrModellanpassung und Parameterschätzung. A: Übungsaufgaben
7 Modellanpassung und Parameterschätzung 1 Kapitel 7: Modellanpassung und Parameterschätzung A: Übungsaufgaben [ 1 ] Bei n unabhängigen Wiederholungen eines Bernoulli-Experiments sei π die Wahrscheinlichkeit
MehrEin Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen
Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Alexander Siemer Abteilung Medizinische Statistik Universität Göttingen 47. Biometrisches Kolloquium
Mehr6. Multivariate Verfahren Übersicht
6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression
MehrWahrscheinlichkeitsfunktion. Binomialverteilung. Binomialverteilung. Wahrscheinlichkeitshistogramme
Binomialverteilung Wahrscheinlichkeitsfunktion Konstruktionsprinzip: Ein Zufallsexperiment wird n mal unabhängig durchgeführt. Wir interessieren uns jeweils nur, ob ein bestimmtes Ereignis A eintritt oder
MehrWahrscheinlichkeitsrechnung und Statistik
10. Vorlesung - 2018 Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.b. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten
MehrStochastik Praktikum Lineare Modelle
Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:
MehrInhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27
Inhalt I Einführung Kapitel 1 Konzept des Buches........................................ 15 Kapitel 2 Messen in der Psychologie.................................. 27 2.1 Arten von psychologischen Messungen....................
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrStatistik Einführung // Kategoriale Daten 10 p.2/26
Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten
MehrMasterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen.
Fach: Prüfer: Mikroökonometrie Prof. Regina T. Riphahn, Ph.D. Masterprüfung Vorbemerkungen: Bearbeitungszeit: 60 Minuten. Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur
Mehr2.Tutorium Generalisierte Regression
2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte
MehrStatistische Datenanalyse
Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise
MehrKapitel 4. Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection
Kapitel 4 Zensierte (censored) und gestutzte (truncated) abhängige Variablen, Sample Selection In den vorhergehenden Abschnitten haben wir uns mit Fällen beschäftigt, in denen die abhängige Variable y
MehrProf. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56
MehrGemischte Modelle zur Schätzung geoadditiver Regressionsmodelle
Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle Thomas Kneib & Ludwig Fahrmeir Institut für Statistik, Ludwig-Maximilians-Universität München 1. Regressionsmodelle für geoadditive Daten
MehrStatistik in Geodäsie, Geoinformation und Bauwesen
Wilhelm Benning Statistik in Geodäsie, Geoinformation und Bauwesen 2., überarbeitete und erweiterte Auflage Herbert Wichmann Verlag Heidelberg Matrix-Theorie 1 1.1 Matrizen und Vektoren 1 1.2 Matrixverknüpfungen
MehrKindern mit Leukämie in Deutschland,
Raum-zeitliche Analyse von Kindern mit Leukämie in Deutschland, 1987-2007 Arbeitstagung Bayes-Methodik, räumliche Statistik, Ökologie und Umwelt Sven Schmiedel, Peter Kaatsch, Maria Blettner, Joachim Schüz
Mehrε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?
BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions
MehrEinleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse
Einleitung Statistik Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Der Begriff Varianzanalyse (analysis of variance, ANOVA) taucht an vielen Stellen in der Statistik mit unterschiedlichen
MehrHypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15
Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp
MehrKapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
MehrPrüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:
MehrLineare Regression. Kapitel Regressionsgerade
Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell
MehrÖkonometrische Modelle
Ökonometrische Modelle Stichwörter: Dynamische Modelle Lagstrukturen Koyck sche Lagstruktur Zeitreihenmodelle Mehrgleichungsmodelle Strukturform reduzierte Form o1-13.tex/0 Lüdeke-Modell für die BRD C
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester Namensschild
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester 2010 Namensschild Prof. Dr. Ralph Friedmann / Dr. Martin Becker Hinweise für die Klausurteilnehmer ˆ
Mehr