Analyse longitudinaler Daten in PROC MIXED und PROC GENMOD

Größe: px
Ab Seite anzeigen:

Download "Analyse longitudinaler Daten in PROC MIXED und PROC GENMOD"

Transkript

1 Analyse longitudinaler Daten in PROC MIXED und PROC GENMOD Guido Büscher Kristina Unnebrink Universität Dortmund Abbott GmbH & Co. KG Vogelpothsweg 87 Knollstraße Dortmund Ludwigshafen Martina Kron Abbott GmbH & Co. KG Knollstraße Ludwigshafen Zusammenfassung In klinischen Studien werden häufig pro Patient zu verschiedenen Zeitpunkten medizinische Daten erhoben. Sollen diese longitudinalen Daten analysiert werden, kommen dafür nur Regressionsmodelle in Betracht, die die Abhängigkeit zwischen den erhobenen Daten berücksichtigen. Um bei stetiger Zielgröße Messwiederholungen in Linearen Modellen [1] zu berücksichtigen, steht in SAS die PROC MIXED zur Verfügung. Es werden Optionen vorgestellt, wie die Abhängigkeit der Beobachtungen durch die Wahl einer geeigneten Kovarianzstruktur unterschiedlich berücksichtigt werden können. Außerdem werden verschiedene Methoden zur Parameterschätzung betrachtet, die diese Abhängigkeit berücksichtigen, und verschiedene Methoden vorgestellt, mit denen die Freiheitsgrade für die Berechnung von Konfidenzintervallen und Tests bestimmt werden können. Soll dagegen bei kategorieller Zielgröße eine Logistische Regression [1] durchgeführt werden, bietet sich die Prozedur PROC GENMOD an. Bei dieser Prozedur werden bei polytomer Zielgröße Proportional Odds Modelle angepasst. Die Parameter werden mit der GEE-Methode geschätzt. Für die Korrelationsmatrix innerhalb der GEE-Methode können verschiedene Strukturen gewählt werden. Die verschiedenen Möglichkeiten der Modellierung werden gegenübergestellt und diskutiert und die Konsequenzen daraus an einem Beispiel illustriert. Es werden Entscheidungshilfen für die Wahl der Optionen und Empfehlungen für die Art der Modellierung gegeben. Schlüsselwörter: Messwiederholungen, Longitudinale Daten, MIXED Prozedur, GENMOD Prozedur, Freiheitsgrade, REML, GEE, ML, Kovarianzstrukturen 1 Einleitung In vielen Fragestellungen ist es sinnvoll, bei denselben Patienten mehrfach Daten zu erheben, z. B. um den Verlauf einer Krankheit zu beobachten. Es ist davon auszugehen, 71

2 G. Büscher, K. Unnebrink, M. Kron dass die so erhobenen Beobachtungen nicht unabhängig voneinander sind. Die Unabhängigkeit der Beobachtungen ist aber bei einem Großteil der vorhandenen Standardverfahren eine wichtige Voraussetzung so z. B. auch bei den klassischen Linearen Modellen. Im Rahmen dieser Arbeit werden Methoden vorgestellt, mit deren Hilfe die Abhängigkeit der Beobachtungen berücksichtigt werden kann. Die Abhängigkeit der Beobachtungen spiegelt sich in der Struktur der Kovarianzmatrix wider. Wird in den Linearen Modellen eine Diagonalmatrix mit identischen Einträgen auf der Hauptdiagonalen verwendet, wird von Unabhängigkeit der Messungen ausgegangen. Liegen die Daten dagegen als Messwiederholungen vor, ist zu vermuten, dass es ein Muster für die Korrelation zwischen den Beobachtungen an denselben Patienten im Verlauf der Zeit gibt. Je nach Zielgröße ist es z. B. möglich, dass der Grad der Korrelation zweier Beobachtungen im Laufe der Zeit abnimmt. Aus diesem Grund sollte je nach Datensituation eine passende Kovarianzmatrix gewählt werden. In dieser Arbeit werden zwei Strukturen der Kovarianzmatrix bei Messwiederholungen erläutert: die Autoregressive Struktur erster Ordnung und die unstrukturierte Kovarianzmatrix. Diese beiden Strukturen werden verglichen, diskutiert und anhand eines Beispiels illustriert. Die Wahl der Kovarianzstruktur hat einen Einfluss auf die Ergebnisse der Parameterschätzung, der Konfidenzintervalle und der p-werte der t- und F-Tests. Auf Grund der Abhängigkeiten der Beobachtungen sind andere Schätzmethoden als die üblicherweise in den klassischen Linearen Modellen verwendete Kleinste-Quadrate- Schätzung notwendig. Bei dieser Methode wird davon ausgegangen, dass die Kovarianzmatrix eine einfache Struktur besitzt, d. h. die Daten als unabhängige Beobachtungen vorliegen. Diese Voraussetzung ist bei Messungen an denselben Patienten nicht erfüllt. Deswegen sollten Schätzmethoden verwendet werden, welche die korrelierte Datenstruktur einbeziehen. In einem solchen Fall bietet sich für die Schätzung des Parametervektors eine Verallgemeinerung der Kleinste-Quadrate-Methode an. Auch bei der Maximum-Likelihood-Methode ist es möglich, die Korrelation zwischen den Beobachtungen zu berücksichtigen. Beide Methoden werden in dieser Arbeit vorgestellt und bieten Möglichkeiten, die Kovarianzmatrix zu schätzen. Außerdem werden die verallgemeinerten Schätzgleichungen zur Schätzung des Parametervektors vorgestellt. Auch diese Methode berücksichtigt die Korrelation der Beobachtungen. Mit der Restricted- Maximum-Likelihood-Methode wird eine weitere Methode zur Schätzung der Kovarianzmatrix vorgestellt. Die Abhängigkeit der Daten wirkt sich auch auf die Berechnung der Freiheitsgrade aus. Im klassischen Linearen Modell wird für die Berechnung der Freiheitsgrade die Residual-Methode verwendet. Es wird gezeigt, dass diese Methode bei Messwiederholungen ungeeignet ist, da sie die Abhängigkeit der Daten nicht berücksichtigt. Deswegen werden in dieser Arbeit die Methode von Satterthwaite sowie die Methode von Kenward und Roger erläutert. Diese beiden Methoden sind in der Lage, die Struktur der Kovarianzmatrix zu berücksichtigen. Außerdem wird auf die Between-Within-Methode eingegangen. Alle Methoden werden einander gegenübergestellt und an einem Beispiel illustriert. Ist die Zielgröße nicht normalverteilt, sondern liegt als eine binäre Variable vor, bietet sich die Logistische Regression an. Auch hier muss im Fall von Messwiederholungen 7

3 die Korrelation zwischen den Beobachtungen beachtet und spezifiziert werden. Die Parameterschätzung erfolgt mit der Methode der verallgemeinerten Schätzgleichungen. An einem Beispiel wird die Anwendung dieser Methode demonstriert. Lineare Regression.1 Programmcode Sollen longitudinale Daten mit Hilfe einer Linearen Regression analysiert werden, ist es nötig, Verfahren zu verwenden, welche die Abhängigkeit der Messungen berücksichtigen, da bei Messwiederholungen nicht davon auszugehen ist, dass die einzelnen Beobachtungen unabhängig voneinander sind. In SAS sind diese Methoden in der Prozedur PROC MIXED implementiert. Diese Prozedur lässt sich mit den einzelnen Statements und ihren Optionen darstellen durch PROC MIXED DATA= daten METHOD =... ; CLASS... ; MODEL... / DDFM =... ; REPEATED / TYPE =... SUBJECT =... R ; RUN ; Mit der Option SUBJECT im REPEATED-Statement wird angegeben, welche Variable die Versuchseinheit definiert, und mit der Option R wird die geschätzte Kovarianzmatrix ausgegeben. In den folgenden Abschnitten wird nun auf Optionen zur Spezifikation der Kovarianzmatrix und der Schätzmethode sowie auf Optionen zur Berechnung der Freiheitsgrade eingegangen, welche in SAS implementiert sind. Details zu weiteren Optionen und Statements in der Prozedur können dem Handbuch [] entnommen werden.. Kovarianzmatrix Mit Hilfe der Option TYPE im REPEATED-Statement wird eine Struktur vorgegeben, die für die Kovarianz der Daten verwendet werden soll. In SAS sind verschiedene Strukturen implementiert. Für die Analyse von longitudinalen Daten bieten sich an: die Autoregressive Struktur erster Ordnung (AR(1)) (TYPE = AR(1)), die unstrukturierte Matrix (TYPE = UN). Die AR(1)-Struktur eignet sich, wenn Daten mit äquidistanten Zeitabständen analysiert werden sollen. Diese Struktur lässt sich für k Messwiederholungen darstellen durch 1 k 1 σ σ ρ K σ ρ 1 σ ρ M k σ ρ 1 σ σ M ρ k K O K σ ρ M σ k ; 73

4 G. Büscher, K. Unnebrink, M. Kron dabei bezeichnet σ die Varianz und ρ die Korrelation zwischen benachbarten Messwiederholungen. Bei dieser Struktur müssen zwei unbekannte Parameter geschätzt werden. Liegen ausreichend Beobachtungen vor, bietet sich die sehr flexible unstrukturierte Kovarianzmatrix an. Diese Matrix lässt sich darstellen durch σ 11 σ 1 K σ 1k σ 1 σ K σ k. M M O M σ 1k σ k K σ kk Bei dieser Struktur müssen sehr viele unbekannte Varianzen und Kovarianzen geschätzt werden. Dafür kann diese Struktur die wahre Kovarianzmatrix am besten abbilden. Weitere Strukturen sind bereits in SAS implementiert und können dem SAS-Handbuch entnommen werden. Für die Wahl einer den Daten am besten angepassten Kovarianzmatrix wird empfohlen, Modelle mit verschiedenen Strukturen zu berechnen und die Modelle mit einem Gütemaß, wie z. B. dem AIC-Kriterium, miteinander zu vergleichen. Eine ausführliche Diskussion zu verschiedenen Kovarianzstrukturen ist z. B. in [1] zu finden..3 Schätzmethoden Auch bei der Parameterschätzung müssen Methoden verwendet werden, welche die Abhängigkeit der Daten berücksichtigen. Für den Parametervektor wird in PROC MIXED der Verallgemeinerte-Kleinste-Quadrate-Schätzer verwendet (Generalized-Least- Squares GLS). Der Schätzer berechnet sich durch βˆ = ( X' V X) X' V y, wobei X ' die Transponierte der Designmatrix und y den Beobachtungsvektor bezeichnet. Die Kovarianzmatrix V ist unbekannt und muss geschätzt werden. Zum Schätzen der Kovarianzmatrix stehen verschiedene Methoden zur Verfügung, welche mit Hilfe der Option METHOD im PROC-Statement ausgewählt werden können: Maximum-Likelihood-Methode (ML-Methode) (METHOD = ML), Restricted-Maximum-Likelihood-Methode (REML-Methode) (METHOD = REML) Der Vorteil der REML-Methode ist, dass sie einen kleineren Schätzfehler aufweist als die ML-Methode. Der ML-Schätzer für die Kovarianzmatrix ergibt sich durch das Maximum der logarithmierten Likelihood 1 n log V logr' V r const.. (1) Dabei ist V die Determinante der unbekannten Kovarianzmatrix und ( ' X) X V y r = y X X V '. Mit r ' sei die Transponierte des Vektors r bezeichnet. Mit V ist eine generalisierte Inverse der Matrix V gemeint. Mit const. wird ein konstanter Term bezeichnet, der bei der Maximierung nicht berücksichtigt werden muss. Der REML-Schätzer ergibt sich durch Maximieren der logarithmierten Likelihood 74

5 1 n p 1 log V logr' V r log X' V X const.. () Die Likelihoodgleichung in () unterscheidet sich von der in (1) durch die Berücksichtigung der Anzahl der Parameter p im zweiten Term, durch den additiven Term 1 log X' V X und in der jeweiligen Konstante [3]..4 Berechnung der Freiheitsgrade Im klassischen Linearen Modell wird die Residual-Methode für die Berechnung der Freiheitsgrade verwendet; dabei wird von der Unabhängigkeit der Beobachtungen ausgegangen. Die Freiheitsgrade berechnen sich bei dieser Methode durch n Rang X. Neben dieser Residual-Methode, die in PROC MIXED mit der Option DDFM = RESIDUAL im MODEL-Statement implementiert ist, stehen weitere Methoden zur Verfügung. Bei der Between-Within-Methode (DDFM = BETWITHIN) werden zur Berechnung der Freiheitsgrade die Residualen Freiheitsgrade aufgeteilt: in einen Anteil für zeitkonstante Effekte, welche sich im Laufe der Zeit bei einem Patienten nicht ändern und einen für Effekte, welche sich im Laufe der Zeit ändern. Die Freiheitsgrade für den t-test bzw. F- Test zu einer Einflussgröße, welche sich im Laufe der Zeit nicht ändert, sind zu berechnen aus einem Modell mit allen zeitkonstanten Effekten und der Regressionskonstante, in dem für jeden Patienten genau eine Beobachtung vorliegt. Für dieses reduzierte Modell werden nun die Residualen Freiheitsgrade berechnet und für die Tests der zeitkonstanten Variablen verwendet. Die Residualen Freiheitsgrade des gesamten Modells minus die Freiheitsgrade für die zeitkonstanten Einflussgrößen ergeben die Freiheitsgrade für die nicht zeitkonstanten Einflussgrößen. Bei der Satterthwaite-Methode (DDFM = SATTERTH) berechnen sich die Freiheitsgrade für einen t-test zur Hypothese H : c' β = 0 durch 0 ( c' Vc ˆ ) [ Var( c' Vc ˆ )] υ =, (3) wobei der Vektor c den zu testenden Kontrast definiert. Die Nennerfreiheitsgrade für einen F-Test zur Hypothese H0 : Cβ = 0 berechnen sich durch E( Q) υ = ; E ( Q) q dabei bezeichnet q den Rang der Matrix C, welche den zu testenden Kontrast definiert, E ( Q) den Erwartungswert von = q υm Q und υ m die zum m -ten Zeilenvektor aus m= 1υm C mit der Formel (3) berechnete Anzahl von Freiheitsgraden. Eine ausführliche Beschreibung und Herleitung dieser Methode ist [4] zu entnehmen. Eine weitere Methode für die Approximation der Freiheitsgrade, welche ebenfalls auf dem Ansatz von Satterthwaite beruht, ist die Methode von Kenward und Roger (DDFM = KENWARDROGER). Bei dieser Methode wird zunächst der Schätzer für die Kovarianzmatrix korrigiert, so dass der Schätzfehler bei kleinen Stichproben geringer 75

6 G. Büscher, K. Unnebrink, M. Kron ist; dieser korrigierte Schätzer sei mit ˆV * bezeichnet. Des Weiteren wird eine Adjustierung der Teststatistik durch den Skalierungsparameter δ, definiert als υ δ = * * (4) E ( F ) ( υ ) * vorgenommen. Die adjustierte Teststatistik F lässt sich durch δ F angeben. Die Freiheitsgrade berechnen sich dann durch q + υ = 4 + ; qγ 1 wobei γ definiert ist als * * Var ( F ) γ = (5) * * E ( F ) * * Die Berechnung des korrigierten Erwartungswerts ( E ( F )) und der korrigierten Varianz ( Var * * ( F ) ) aus den Formeln (4) und (5) ist in [5] beschrieben. Dort ist auch eine ausführlichere Motivation dieser Methode zu finden..5 Diskussion In PROC MIXED wird der Parametervektor mit Hilfe der Verallgemeinerten-Kleinste- Quadrate-Methode geschätzt. Für die Schätzung der Kovarianzmatrix sind sowohl die ML-Methode als auch die REML-Methode implementiert. Die REML-Methode ist der ML-Methode vorzuziehen, da bei der REML-Methode der Schätzfehler kleiner ist. Für die Berechnung der Freiheitsgrade bietet sich bei der Analyse von Messwiederholungen die Residual-Methode und die Between-Within-Methode nicht an, da bei diesen beiden Methoden die Struktur der Kovarianzmatrix nicht berücksichtigt wird. Die Methode von Satterthwaite und die Methode von Kenward und Roger berücksichtigen dagegen die Struktur der Kovarianzmatrix. Durch die Korrektur des Varianzschätzers und der Teststatistik eignet sich die Methode von Kenward und Roger vor allem bei kleinen Stichprobenumfängen (n < 100). Simulationsstudien [6] zeigen, dass diese Methode das vorgegebene Niveau besser einhält als die Methode von Satterthwaite. Bei größeren Stichproben haben diese Korrekturen nur geringe Konsequenzen, sodass die Methode von Satterthwaite angewendet werden kann. Bei sehr großen Stichproben (n > 400) ist die Wahl der Methode nicht von Bedeutung, da die Verteilung der Teststatistik beim t- Test durch die Normalverteilung approximiert werden kann. Die Verteilung von q F, wobei F die F q,n -verteilte F-Statistik ist, kann durch eine χ q -Verteilung approximiert werden. 76

7 3 Logistische Regression 3.1 Programmcode Um eine Logistische Regression für Daten mit Messwiederholungen durchzuführen, bietet sich die Prozedur PROC GENMOD an. Bei dieser Prozedur besteht wie auch schon bei PROC MIXED die Möglichkeit, eine Kovarianzstruktur anzugeben, um die Abhängigkeit der Daten bei der Analyse zu berücksichtigen. Die Prozedur lässt sich in SAS aufrufen durch PROC GENMOD DATA = daten ; CLASS...; MODEL... / DIST = BIN WALD WALDCI ; REPEATED SUBJECT =... / TYPE =... CORRW ; RUN ; Dabei wird mit der Option SUBJECT im REPEATED-Statement wie auch schon in der MIXED-Prozedur angegeben, welche Variable den Patienten definiert, an dem mehrere Beobachtungen gemessen wurden. Mit TYPE wird eine Struktur für die Korrelationsmatrix vorgegeben. Hier stehen auch die Strukturen zur Verfügung, welche bei der MIXED-Prozedur vorgestellt wurden. Die Korrelationsmatrix kann mit der Option CORRW im REPEATED-Statement ausgegeben werden. Mit der Option DIST wird die Verteilung der Zielgröße festgelegt. Im Falle einer Logistischen Regression ist dies die Binomialverteilung (DIST = BIN). Einige weitere Verteilungen, die in SAS implementiert sind, sind die Multinomial- (DIST = MULT), die Negativbinomial- (DIST = NEGBIN) und die Poissonverteilung (DIST = POI). Abhängig von der Verteilung der Zielgröße wird von SAS eine Standard-Link-Funktion verwendet. Bei einer Binomialverteilung ist dies die Logit-Funktion, bei einer Multinomial- die kumulative Logitfunktion und bei einer Negativbinomial- oder einer Poissonverteilung die Logfunktion. Mit der Option LINK im Model-Statement kann eine Linkfunktion auch direkt angewählt werden. Details zu weiteren Optionen und Statements in der Prozedur können dem Handbuch [] entnommen werden. 3. Schätzmethode In PROC GENMOD werden der Parametervektor und die Korrelationsmatrix mit der Generalized-Estimating-Equations-Methode (GEE-Methode) geschätzt. Bei dieser Schätzmethode wird zunächst ein Modell auf der Basis der Generalisierten Linearen Modelle aufgestellt. In einem zweiten Schritt wird die Struktur der Korrelationsmatrix R festgelegt. Dabei sollte eine Struktur gewählt werden, die der wahren Struktur möglichst ähnlich ist. Da die Komponenten dieser Korrelationsmatrix unbekannt sind, muss diese geschätzt werden. Dies geschieht mit der Momentenmethode. Die Kovarianzmatrix V von y lässt sich angeben durch 1 1 V = ϕc RC ; 77

8 G. Büscher, K. Unnebrink, M. Kron 1 dabei bezeichnet R die Korrelationsmatrix, C eine Diagonalmatrix mit den Werten der Varianzfunktion auf der Hauptdiagonalen und ϕ den Skalierungsparameter im Generalisierten Linearen Modell. Im Falle einer Logistischen Regression hat dieser den Wert Eins. Der Schätzer für den Parametervektor ergibt sich durch Lösen von D ' V ( y µ ) = 0 ; ˆ µ dabei bezeichnet D die Matrix, welche durch geschätzt wird und µˆ den geschätzten β Erwartungswertvektor. Die Lösung erfolgt mittels eines iterativen Verfahrens, welches sich beschreiben lässt durch: 1. berechne einen Anfangsschätzer für den Parametervektor durch den Verallgemeinerten-Kleinste-Quadrate-Schätzer unter der Annahme von unabhängigen Beobachtungen;. berechne die Korrelationsmatrix basierend auf dem Schätzer für den Parametervektor; 3. berechne den Schätzer für die Kovarianzmatrix V ; 4. berechne den Schätzer für den Parametervektor neu durch βˆ βˆ Dˆ Vˆ ' Dˆ Dˆ ' Vˆ = y µ {[ ] [ ( i i )] } ( m+ 1) ( m). βˆ m Die Schritte -4 werden so lange wiederholt, bis der Schätzer konvergiert. Eine ausführliche Diskussion dieser Methode ist in z. B. in [7] oder [8] zu finden. 3.3 Alternative zu PROC GENMOD Alternativ zu PROC GENMOD kann auch die CATMOD Prozedur verwendet werden. Bei dieser Prozedur können allerdings keine quantitativen Einflussgrößen berücksichtigt werden. Die Schätzmethode, die bei dieser Prozedur verwendet wird, ist die Verallgemeinerte-Kleinste-Quadrate-Methode. Bei dieser Methode wird von einer unstrukturierten Kovarianzmatrix ausgegangen. 4 Beispiel 4.1 Lineare Regression: PROC MIXED Es seien die in Tabelle 1 dargestellten fiktiven Daten gegeben. Es sei vorausgesetzt, dass die Zielgröße normalverteilt ist. Die Zielgröße wurde bei jedem Patienten an drei Zeitpunkten gemessen. Die Patienten wurden in zwei Altersklassen eingeteilt. Bei der Variable Score handelt es sich um eine quantitative Variable, die Variablen Altersklasse ( Klassen) und Geschlecht ( Klassen) sind dagegen qualitativ. 78

9 Tabelle 1: Gegebener Beispieldatensatz für das Lineare Modell Patientennummer Zeitpunkt Altersklasse Geschlecht Score Zielgröße ,8, ,6 3, , 1,44 1 8,6 4,9 9,3 4,15 3 3,5 6, ,4, ,8 0, ,7 1, , 3, ,3 5, , 4, ,7 4,16 5 3,5 1, ,5 1, ,8, ,1 4, , 4, ,8, ,1 1, , 4, ,7 3, ,5 4, ,5 4,0 Die Kovarianzmatrix wird mit der REML-Methode geschätzt. Es ergeben sich die folgenden geschätzten Kovarianzmatrizen bei einer Autoregressiven Struktur erster Ordnung und für eine unstrukturierte Kovarianzmatrix,43 1,3 0,6 0,19 0,76 0,69 COV AR(1) = 1,3,43 1,3, COV UN = 0,76 4,15 3,19 0,6 1,3,43 0,69 3,19 4,1 Bei beiden Kovarianzmatrizen ist zu sehen, dass die Stärke der Kovarianz mit größerem Abstand der Beobachtungen schwächer wird. Die geschätzten Kontraste bei einer AR(1)-Struktur und bei einer unstrukturierten Matrix sind in Tabelle angegeben. 79

10 G. Büscher, K. Unnebrink, M. Kron Tabelle : Geschätzte Kontraste bei AR(1)-Struktur und bei unstrukturierter Kovarianzmatrix AR(1)-Struktur Unstrukturiert Schätzer Standardfehler Schätzer Standardfehler Regressionskonstante 4,661 1,08 5,36 0,4437 Gruppe 1 vs. -0, ,87-1,6631 0,1855 Score -0,0501 0,1530-0, ,05606 Geschlecht 1 vs. -1,0764 0,8663-1,3797 0,035 Das AIC-Kriterium bei dem Modell mit AR(1)-Struktur ist 84. Für das Modell mit unstrukturierter Kovarianzmatrix ist das AIC-Kriterium 76, d. h. dass mit der unstrukturierten Kovarianzmatrix eine besserer Modellfit erreicht wird. Die Freiheitsgrade, Werte der t-statistik und die p-werte sind bei AR(1)-Struktur bzw. unstrukturierter Kovarianzmatrix in Tabelle 3 und 4 dargestellt. Tabelle 3: Freiheitsgrade, Wert der t-statistik und p-wert bei AR(1)-Struktur für verschiedene Methoden zur Berechnung der Freiheitsgrade Residual Betweeen-Within FG 1 t-statistik p-wert FG 1 t-statistik p-wert Regressionskonstante 0 3,55 0, ,55 0,0164 Gruppe 1 vs. 0-0,00 0, ,00 0,9993 Score 0-0,34 0, ,34 0,7386 Geschlecht 1 vs. 0-1,4 0,84 5-1,4 0,691 Satterthwaite Kenward und Roger FG 1 t-statistik p-wert FG 1 t-statistik p-wert Regressionskonstante 18,6 3,55 0,00 18,6 3,41 0,0030 Gruppe 1 vs. 6,4-0,00 0,9993 6,4-0,00 0,9993 Score 16-0,34 0, ,31 0,7583 Geschlecht 1 vs. 6,06-1,4 0,599 6,06-1,9 0,444 1 Freiheitsgrade Es ist zu sehen, das bei der Residual-Methode bei allen Kontrasten die Zahl der Freiheitsgrade gleich 0 ist. Bei der Between-Within-Methode sind die Freiheitsgrade unterschiedlich, je nachdem ob es sich bei dem Kontrast um einen zeitkonstanten oder nichtzeitkonstanten Kontrast handelt. Die Freiheitsgrade sind bei der Methode von Satterthwaite und bei der Methode von Kenward und Roger identisch, allerdings unterscheiden sich bei diesen beiden Methoden die Werte der t-statistik, da bei der Methode von Kenward und Roger wie beschrieben auch eine Adjustierung der Teststatistik erfolgt. 80

11 Tabelle 4: Freiheitsgrade, Wert der t-statistik und p-wert bei unstrukturierter Kovarianzmatrix für verschiedene Methoden zur Berechnung der Freiheitsgrade Residual Betweeen-Within FG 1 t-statistik p-wert FG 1 t-statistik p-wert Regressionskonstante 0 11,77 < 0, ,77 < 0,0001 Gruppe 1 vs. 0-8,96 < 0, ,96 0,00003 Score 0-1,3 0, ,3 0,750 Geschlecht 1 vs. 0-6,78 < 0, ,78 0,0011 Satterthwaite Kenward und Roger FG 1 t-statistik p-wert FG 1 t-statistik p-wert Regressionskonstante 5,58 11,77 < 0,0001 5,58-7,54 0,004 Gruppe 1 vs. 4,9-8,96 0,0006 4,9-5,8 0,0035 Score 5,63-1,3 0,69 5,63-0,79 0,4641 Geschlecht 1 vs. 4,58-6,78 0,0015 4,58-4,37 0, Freiheitsgrade Die Ergebnisse bei unstrukturierter Kovarianzmatrix sind ähnlich wie bei AR(1)-Struktur. Allerdings ist festzuhalten, dass die Freiheitsgrade für die Between-Within-Methode bei allen Kontrasten gleich 5 sind, obwohl die Anzahl der Freiheitsgrade laut Berechnungsvorschrift gemäß SAS-Handbuch genauso groß sein müsste wie bei AR(1)- Struktur. 4. Logistische Regression: PROC GENMOD Für die Logistische Regression wurde die Zielgröße dichotomisiert in Werte größer gleich und Werte kleiner. Für die Korrelationsmatrix ergibt sich bei AR(1)-Struktur und bei unstrukturierter Korrelationsmatrix: 1 0,13 0,0 1 0,33 0,35 COR AR(1) = 0,13 1 0,13, COR UN = 0,33 1 0,79 0,0 0,13 1 0,35 0,79 1 Die Schätzwerte für die Kontraste mit der GEE-Methode, die Standardfehler und die p- Werte sind in Tabelle 5 zu finden. Tabelle 5: Geschätzte Kontraste, Standardfehler und p-wert bei AR(1)-Struktur und unstrukturierter Kovarianzmatrix AR(1)-Struktur Unstrukturiert Schätzer Standardfehlefehler p-wert Schätzer Standard- p-wert Regressionskonstante -0,310 1,48 0,834-0,615 1,03 0,55 Gruppe 1 vs. -0,830 0,91 0,361-0,740 0,88 0,403 Score -0,073 0,15 0,636-0,076 0,09 0,404 Geschlecht 1 vs. -0,00 1,09 0,999-0,01 0,97 0,998 81

12 G. Büscher, K. Unnebrink, M. Kron 5 Empfehlungen Für ein Lineares Modell bietet sich in SAS die Prozedur PROC MIXED an, um Lineare Modelle mit Messwiederholungen anzupassen. Dabei besteht die Möglichkeit, verschiedene Strukturen für die Kovarianzmatrix anzugeben. Für die Analyse sollten verschiedene Kovarianzstrukturen ausprobiert und dann das Modell verwendet werden, welches das kleinste AIC-Kriterium aufweist. Als Schätzmethode für die unbekannten Parameter der Kovarianzmatrix sollte die REML-Methode verwendet werden, da sie einen kleineren Schätzfehler aufweist als die ML-Methode. Für die Berechnung der Freiheitsgrade bieten sich die Residual- und die Between- Within-Methode nicht an, da diese beiden Methoden nicht die Abhängigkeit der Daten berücksichtigen. Bei einem kleinen Stichprobenumfang ( n < 100) sollte die Methode von Kenward und Roger verwendet werden, da diese Methode das vorgegebene Niveau besser einhält als die Methode von Satterthwaite. Bei einem mittleren Stichprobenumfang sollte die Methode von Satterthwaite angewendet werden. Bei großen Stichproben ( n > 400) ist die Wahl der Methode zu Berechnung der Freiheitsgrade nicht von Bedeutung, da in diesem Fall die Verteilung der t-statistik durch die Normalverteilung und die Verteilung von q F, wobei F die F-Statistik ist, durch eine χ -Verteilung approximiert werden kann. Im Fall einer Logistischen Regression bietet sich die GENMOD-Prozedur in SAS an. Bei dieser Prozedur besteht ebenfalls die Möglichkeit, eine Struktur der Korrelationsmatrix anzugeben. Diese Matrix und der Parametervektor werden dann mit der GEE- Methode geschätzt. Literatur [1] Davis, C.S., Statistical Methods for the Analysis of Repeated Measurements, Springer-Verlag, 00. [] SAS Institute Inc. SAS/STAT 9.1 User s Guide. SAS Institute Inc [3] Littell, R.C., Milliken, G.A., Stroup, W.W. und Wolfinger, R.D., SAS System for Mixed Models, SAS Institute Inc [4] Fai, A.H.T. und Cornelius, P.L., Approximation F-tests of Multiple Degree of Freedom Hypotheses in Generalized Least Squares Analyses of Unbalanced Splitplot Experiment, Journal of Statistical Computing and Simulation, 54, , [5] Kenward, M.G. und Roger, J.H., Small Sample Inference for Fixed Effects from Restricted Maximum Likelihood, Biometrics, 53, , [6] Schaalje, G.B., McBride, J.B. und Fellingham, G.W., Approximation to Distribution of Test Statistics in Complex Mixed Linear Models Usind SAS Proc Mixed, In 8

13 Proceedings of the Twenty-Sixth Annual SAS User Group International Conference, 001. [7] Liang, K.Y. und Zeger, S.C., Longitudinal Data Analysis Using Generalized Linear Models, Biometrika, 73, 13-, [8] Diggle, P.J., Liang, K.Y. und Zeger, S.L. Analysis of Longitudinal Data, Oxford University Press,

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Vorlesung: Lineare Modelle

Vorlesung: Lineare Modelle Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen

Mehr

Varianzkomponentenschätzung

Varianzkomponentenschätzung Qualitas AG Varianzkomponentenschätzung Peter von Rohr Qualitas AG Peter von Rohr Folien ZL I+II LFW C11 October 29, 2015 2 / 23 Multiple Lineare Regression Annahmen Modell y = Xb + e Varianz der Fehler

Mehr

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen

Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Ein Vergleich von 2-Stichproben-Verfahren mit Berücksichtigung von Baselinewerten bei ordinalen Zielvariablen Alexander Siemer Abteilung Medizinische Statistik Universität Göttingen 47. Biometrisches Kolloquium

Mehr

Logistische Regression in SAS

Logistische Regression in SAS Logistische Regression in SAS Oliver Kuß Medizinische Universitätsklinik, Abt. Klinische Sozialmedizin, Bergheimer Str. 58, 69115 Heidelberg, email: okuss@med.uni-heidelberg.de 3. Konferenz für SAS -Anwender

Mehr

5 Allgemeine Verfahren zum Testen von Hypothesen

5 Allgemeine Verfahren zum Testen von Hypothesen 5 Allgemeine Verfahren zum Testen von Hypothesen 5.1 Likelihood Schätzung für multivariate Daten Statistisches Modell: Einfache Zufallsstichprobe X 1,..., X n (unabhängige Wiederholungen von X IR d ).

Mehr

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Schätzung im multiplen linearen Modell VI

Schätzung im multiplen linearen Modell VI Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,

Mehr

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38

Dynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38 Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate

Mehr

Untersuchungen zur Einhaltung des statistischen Risikos 1. Art in Alpha-Gittern eine Simulationsstudie

Untersuchungen zur Einhaltung des statistischen Risikos 1. Art in Alpha-Gittern eine Simulationsstudie Untersuchungen zur Einhaltung des statistischen Risikos 1. Art in Alpha-Gittern eine Simulationsstudie Joachm Spilke 1) ; Xiyuan Hu 1) ; Hans-Peter Piepho 2) ; Uwe Meyer 3) 1) Martin-Luther-Universität

Mehr

Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS

Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS Logistische Regression mit Messwiederholungen: Anwendung von PROC GENMOD in SAS Birgit Hay Silvia Sander Schwabstraße 13 Schwabstraße 13 89070 Ulm 89070 Ulm Birgit.Hay@uni-ulm.de Silvia.Sander@uni-ulm.de

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

x t2 y t = 160, y = 8, y y = 3400 t=1

x t2 y t = 160, y = 8, y y = 3400 t=1 Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Lineare Regression. Kapitel Regressionsgerade

Lineare Regression. Kapitel Regressionsgerade Kapitel 5 Lineare Regression 5 Regressionsgerade Eine reelle Zielgröße y hänge von einer reellen Einflussgröße x ab: y = yx) ; zb: Verkauf y eines Produkts in Stückzahl] hängt vom Preis in e] ab Das Modell

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Poisson Regression & Verallgemeinerte lineare Modelle

Poisson Regression & Verallgemeinerte lineare Modelle Poisson Regression & Verallgemeinerte lineare Modelle 20.11.2017 Motivation Ausgangslage Wir haben Anzahldaten (count data) Y i, cf. Vorlesung zu kategoriellen Variablen. Zu jeder Beobachtung Y i haben

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Fortgeschrittene Ökonometrie: Maximum Likelihood

Fortgeschrittene Ökonometrie: Maximum Likelihood Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,

Mehr

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann

Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten. Oliver Kuß, Cora Gromann Ein exakter Test für die Meta-Analyse von Studien mit binären Endpunkten Oliver Kuß, Cora Gromann Institut für Medizinische Epidemiologie, Biometrie und Informatik, Universität Halle-Wittenberg, Halle

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Poisson Regression. Verallgemeinerte Lineare Modelle (GLMs)

Poisson Regression. Verallgemeinerte Lineare Modelle (GLMs) Poisson Regression Verallgemeinerte Lineare Modelle (GLMs) 28.11.2011 Poisson Regression Aus der Einführungsvorlesung Poisson-Verteilung ist in der Regel gut geeignet, um Anzahlen zu modellieren. Frage

Mehr

Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen

Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen Workshop der AG Statistische Methoden in der Medizin Magdeburg, 22.11.2007 Anwendung logistischer und linearer Regressionsmodelle zur Berechnung von adjustierten NNEs und Risikodifferenzen Ulrich Gehrmann

Mehr

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematische Statistik Aufgaben zum Üben. Schätzer Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch

Mehr

Zusammenfassung: Einfache lineare Regression I

Zusammenfassung: Einfache lineare Regression I 4 Multiple lineare Regression Multiples lineares Modell 41 Zusammenfassung: Einfache lineare Regression I Bisher: Annahme der Gültigkeit eines einfachen linearen Modells y i = β 0 + β 1 x i + u i, i {1,,

Mehr

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)

Mehr

Schweizer Statistiktage, Aarau, 18. Nov. 2004

Schweizer Statistiktage, Aarau, 18. Nov. 2004 Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der

Mehr

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Repeated Measures unter Nicht-Normalverteilung

Repeated Measures unter Nicht-Normalverteilung Robuste Verfahren für strukturierte Repeated Measures unter Nicht-Normalverteilung Abteilung für Medizinische Statistik Universität Göttingen 19. November 2009 Übersicht Beispiel e Bekannte Verfahren für

Mehr

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Stetige Zufallsvariable Verteilungsfunktion: Dichtefunktion: Integralrechnung:

Mehr

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,

Mehr

Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel

Mehr

4 Statistik normalverteilter Daten

4 Statistik normalverteilter Daten 4 Statistik normalverteilter Daten 4.1 Eine Stichprobe a Die drei Grundfragen. Die schliessende Statistik bildet die Brücke zwischen den Wahrscheinlichkeitsmodellen, die unser Denken strukturieren, und

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Statistik für Ingenieure und Naturwissenschaftler

Statistik für Ingenieure und Naturwissenschaftler Sheldon M. Ross Statistik für Ingenieure und Naturwissenschaftler 3. Auflage Aus dem Amerikanischen übersetzt von Carsten Heinisch ELSEVIER SPEKTRUM AKADEMISCHER VERLAG Spektrum Inhalt Vorwort zur dritten

Mehr

Lösung Übungsblatt 5

Lösung Übungsblatt 5 Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von

Mehr

Einführung in die Induktive Statistik: Regressionsanalyse

Einführung in die Induktive Statistik: Regressionsanalyse Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

6.4 Der Kruskal-Wallis Test

6.4 Der Kruskal-Wallis Test 6.4 Der Kruskal-Wallis Test Der Test von Kruskal und Wallis, auch H-Test genannt, ist ein Test, mit dem man die Verteilungen von Teilstichproben auf Unterschiede untersuchen kann. Bei diesem Test geht

Mehr

Stochastik Praktikum Lineare Modelle

Stochastik Praktikum Lineare Modelle Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte

Mehr

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014

11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/ Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................

Mehr

Mixed Effects Models: Wachstumskurven

Mixed Effects Models: Wachstumskurven Mixed Effects Models: Wachstumskurven Markus Kalisch 07.10.2014 1 Überblick Wiederholte Messungen (z.b. Wachstumskurven): Korrelierte Beobachtungen Random Intercept Model (RI) Random Intercept and Random

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

Lineare Regression und Varianzanalyse

Lineare Regression und Varianzanalyse Lineare Regression und Varianzanalyse Von Prof. Dr. Fritz Pokropp Universität der Bundeswehr Hamburg R. Oldenbourg Verlag München Wien Inhaltsverzeichnis 1 Einleitung 1 1.1 Grundstruktur linearer Modelle

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode? Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Einfache lineare Regression. Statistik (Biol./Pharm./HST) FS 2015

Einfache lineare Regression. Statistik (Biol./Pharm./HST) FS 2015 Einfache lineare Regression Statistik (Biol./Pharm./HST) FS 2015 Wdh: Korrelation Big picture: Generalized Linear Models (GLMs) Bisher: Population wird mit einer Verteilung beschrieben Bsp: Medikament

Mehr

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3. Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die

Mehr

Flussdiagramm der ökonometrischen Methode

Flussdiagramm der ökonometrischen Methode Flussdiagramm der ökonometrischen Methode z.b Sättigungs modell Parameter schätzung Daten Sach verhalt oder Spezifikation des ökonometrischen Modells geschätztes Modell phäno menologische Modellierung

Mehr

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne). Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9. 7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe

Mehr

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536 fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung

Mehr

Bachelorprüfung: Statistik (1 Stunde)

Bachelorprüfung: Statistik (1 Stunde) Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!

Mehr

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) PROC NPAR1WAY zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) Allgemeine Form: PROC NPAR1WAY DATA=name Optionen ; VAR variablenliste ; CLASS

Mehr

Strukturgleichungsmodellierung

Strukturgleichungsmodellierung Strukturgleichungsmodellierung FoV Methodenlehre FSU-Jena Dipl.-Psych. Norman Rose Parameterschätzung, Modelltest & Fit Indizes bei SEM Forschungsorientierte Vertiefung - Methodenlehre Dipl.-Psych. Norman

Mehr

10 Statistisches Schätzen

10 Statistisches Schätzen 10 Statistisches Schätzen 620 10 Statistisches Schätzen 10.1 Punktschätzung 623 10.1.1 Schätzer und ihre Gütekriterien 623 10.1.2 Erwartungstreue 627 10.1.3 Erwartete quadratische Abweichung (MSE) 634

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56

Mehr

6.2 Lineare Regression

6.2 Lineare Regression 6.2 Lineare Regression Einfache lineare Regression (vgl. Kap. 4.7) Y i = θ 0 + θ 1 X i + ǫ i ǫ i (0, σ 2 ) ˆθ 1 ˆθ 0 = S XY S 2 X = 1 ( Yi n ˆθ ) 1 Xi als Lösung der Minimumaufgabe n (Y i θ 1 X 1 θ 0 )

Mehr

Allgemeine lineare Modelle

Allgemeine lineare Modelle 262 Merkpunkte Allgemeine lineare Modelle Multiple lineare Regression mit nicht-normalen Zufallsabweichungen bilden eine harmlose" Verallgemeinerung der multiplen lin. Regr. Beispiele: Gumbel-Regression,

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Entwicklung des Auswertungsmodells

Entwicklung des Auswertungsmodells Workshop On-Farm-Experimente 23./24.11.2011 Kassel Entwicklung des Auswertungsmodells Joachim Spilke Martin-Luther-Universität Halle-Wittenberg, Institut für Agrar- und Ernährungswissenschaften Arbeitsgruppe

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Deskriptive Beschreibung linearer Zusammenhänge

Deskriptive Beschreibung linearer Zusammenhänge 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,

Mehr

Statistische Datenanalyse

Statistische Datenanalyse Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

Goethe-Universität Frankfurt

Goethe-Universität Frankfurt Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre

Mehr

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Aufgabe 1 U t bedeute weißes Rauschen und B den Backshift

Mehr

Statistik I für Betriebswirte Vorlesung 13

Statistik I für Betriebswirte Vorlesung 13 Statistik I für Betriebswirte Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 4. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

3.2 Maximum-Likelihood-Schätzung

3.2 Maximum-Likelihood-Schätzung 291 Die Maximum-Likelihood-Schätzung ist die populärste Methode zur Konstruktion von Punktschätzern bei rein parametrischen Problemstellungen. 292 3.2.1 Schätzkonzept Maximum-Likelihood-Prinzip: Finde

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

(G)LM. 24. November 2009

(G)LM. 24. November 2009 (G)LM 24 November 29 Dies ist eine kurze Zusammenfassung der Grundlagen von linearen Modellen, sowie aufbauend darauf von generalisierten linearen Modellen Sie dient lediglich zum Einstieg und zur knappen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr