Die SAS-Prozedur MIXED

Größe: px
Ab Seite anzeigen:

Download "Die SAS-Prozedur MIXED"

Transkript

1 Die SAS-Prozedur MIXED Hans-Peter Altenburg Deutsches Krebsforschungszentrum Heidelberg Inhalt: Prozedur MIXED verwandte SAS-Prozeduren: GLM, VARCOMP, NESTED Schätzverfahren Varianzkomponenten Syntax Beispiele 1 2 Feste Effekte: Faktoren, bei denen die Stufen der Faktoren diejenigen Stufen sind, die im Experiment gerade betrachtet werden. Modell mit festen Effekten Zufällige Effekte: Faktoren, bei denen die Stufen, die gerade betrachtet werden, eine Zufallsauswahl aus einer unendlichen Population von möglichen Stufen darstellen. Inferenzaussage für die gesamte Population der Faktorstufen. Modell mit zufälligen Effekten Gemischtes Modell (Mixed Model): enthält feste und zufällige (random) Effekte. Varianz-Schätzungen assoziiert mit den zufälligen Effekten werden als Varianzkomponenten bezeichnet. Kombination: gemischte (mixed) Modelle 3 4 Completely Random Model: Jeder erwartete MS (expected mean square) ist eine Funktion der Varianzen der zufälligen Effekte Mixed Model: Jeder erwartete MS (expected mean square) ist eine Funktion der Varianzen der zufälligen Effekte plus quadratische Funktionen der Parameter der festen Effekte. 5 Beispiel: Studie über die Wirkung einer Chemotherapie Effekte: Behandlung: Chemo- / Radio-Therapie fester Effekt Alter: Kind / Erwachsener fester Effekt Klinik: 5 beteiligte Kliniken fester Effekt: nur Interesse an der Variabil. der 5 Kl. zufälliger Effekt: falls Interesse an der Pop. der Klein. Patient: zufälliger Effekt, da zugrunde gelegt wird, daß die Patientenstichprobe aus einer unendlichen GG stammt. 6 SAS-Benutzertreff Heidelberg,

2 Konzept ist/war nicht unumstritten: z.b. die Kontroverse zwischen Yates und Nelder: Arbeit von Nelder (1977) wurde als The great mixed model muddle bezeichnet. Kommentar zu Mixed Models: To a Non-Baysian, all things are BLUPs. 7 Prozedur GLM: Feste Effekte Normalfall: feste Effekte Prozedur GLM Modell: y=xβ + ε y=vektor der beobachteten Daten X=bekannte Versuchsdesignmatrix β =Vektor der unbekannten festen Effektparameter ε =Vektor der nicht beobachtbaren Zufallsfehler Voraussetzung: Komponenten von ε sind unkorreliert, normal verteilt mit Varianz σ 2 und Erw. null 8 Prozedur GLM: Feste Effekte Prozedur MIXED: Modell: y=xβ + ε d.h. es gilt E[ε]=0 und VAR[ε]= σ 2 I, I=Einheitsmatrix und somit E[y] = Xβ und VAR[y] = σ 2 I Wichtig: Die Prozedur GLM modelliert stets alle Effekte als feste Effekte, auch wenn das RANDOM-Statement benutzt wurde. RANDOM liefert nur expected mean squares. CLASS- und MODEL-Statement spezifizieren gemeinsam X. 9 Erweitertes Modell: feste und zufällige Effekte Prozedur MIXED Modell: y=xβ + Zν + ε y=vektor der beobachteten Daten X, Z=bekannte Versuchsdesign-Matrizen β =Vektor der unbekannten festen Effektparameter ν = Vektor der unbek. zufälligen Effektparameter ε =Vektor der nicht beobachtbaren Zufallsfehler 10 Prozedur MIXED: Erweitertes Modell: y=xβ + Zν + ε ν und ε normal verteilt: (mit µ = (ν, ε ) T ) E[µ] = 0 und Var[µ] = Diag{G,R} Das allgemeine lineare Modell ist ein Spezialfall des gemischten Modells mit Z=0 und R= σ 2 I. Prozedur MIXED: SAS Proceduren mit RANDOM-Statement: GLM MIXED SAS Prozeduren assoziiert mit Random Effects: NESTED VARCOMP MIXED NLMIXED (Vs 8) Die Prozedur MIXED erlaubt es verschiedene Kovarianzstrukturen für G und R zu spezifizieren SAS-Benutzertreff Heidelberg,

3 Verallgemeinerung von GLM ähnliche Syntax gleiche Parametrisierung, manchmal unterschiedliche CLASS Level MIXED bietet nur die Typ III Teste für feste Effekte (dagegen GLM Typ I, II, III und IV) MIXED nur LSMEANS (GLM auch noch MEANS) RANDOM- und REPEATED-Statements werden unterschiedlich benutzt Varianzkomponentenschätzung: REML, ML, MM oder MIVQUE0, GLM dagegen nur Momentenmethode (MM) 13 Wahl der Prozedur: GLM oder MIXED Zufällige Effekte vorhanden: GLM: Standardfehler sind falsch SE der LS Means falsch Einfluß auf: Hypothesentesten, Schätzen der Differenzen von LS means / Konfidenzintervalle Schätzverfahren: GLM benutzt LS, Varianzkomponenten für zufällige Effekte müssen per Hand berechnet werden anhand der ausgegebenen GLM-Schätzwerte GLM: keine Unterscheidung zwischen festen und zuf. Effekten Hypothesenprüfung stets über F=MS/MSE Mixed Modell: erwartete MS um herauszufinden welcher MS im Zähler für die Prüfung eines best. Effektes erforderlich ist. Manchmal existiert kein geeigneter MS und muß entsprechend synthetisiert werden. 14 Wahl der Prozedur: GLM oder MIXED Zufällige Effekte vorhanden: GLM: Annahme alle Fehler iid GLM für Mixed Modelle: Annahme alle Var.-Komp. unabhängig und innerhalb VK ident. Verteilt, Verfeinerung durch Annahme einer sehr einfachen Abhängigkeitsstruktur unter den Fehlern (insbes. bei Repeated Measurements). MIXED dagegen, keine Annahme Fehler oder Var.-Komp. iid, Struktur und Beziehungen der Fehler und Var.-Komps werden ins Modell einbezogen. 15 Varianzkomponenten Eine Varianzkomponente ist, vereinfacht gesprochen, eine Quelle weißen Rauschens, die die Beobachtungswerte beeinflusst. Die Bezeichnung Varianzkomponente wird i.d.r. verwendet, wenn unterschiedliche Komponenten einer Variabilität unabhängig sind. Beispiel: Zweifache Varianzanalyse Reagentgruppe \ Wdh Teste \ y y33 y Varianzkomponenten - Beispiel Zwei Variationsursachen: Reagent- / Testeffekt Varianzkomponenten: assoziierte Varianzen Ziel eines statistischen Modells: Erfasse Struktur und Einfluß des Nicht-Beobachtbaren Varianzkomponenten Modell für die Struktur des Nichtbeobachtbaren: Zwei oder mehrere Variationskomponenten Praktische Fragen verlangen meist ein konzeptionelles Verständnis der Variations-Komponenten SAS-Benutzertreff Heidelberg,

4 Variationsursachen: Varianzkomponenten Messung: Kalibrierung, Operator-to-Operator Differenz, Variation bzgl. Temperaturschwankungen, Ablesefehler,... Stichprobenvariabilität: Unterscheidet sich das beobachtete Material vom nicht beobachteten? Kann z.b. reduziert werden durch Vergrößern der Stichprobe Wechselwirkung: zwischen Behandlung / Faktor und den äußeren Umständen Varianzkomponentenschätzung MM: Momentenmethode, vergleicht erwartete Werte mit den Stichprobenschätzwerten Varianzkomponenten: Varianzen, die mit der Variationsursache oder Zufälligkeit in den Daten assoziiert sind kann u.u. negative Schätzwerte der Varianz liefern Varianzkomponentenschätzung MIVQUE0: ein bestimmter Typ von Momentenmethode, Schätzer sind invariant bzgl. fester Effekte, Mittelwertquadrate, die mit den zufälligen Effekten assoziiert sind, werden nach den festen Effekten adjustiert Varianzkomponentenschätzung ML: Maximum Likelihood-Methode, iteratives Verfahren zur Schätzung von Parameterwerten, maximiert die Likelihoodfunktion negative Varianzen werden bei der Prozedur MIXED auf null gesetzt Varianzkomponentenschätzung REML: restricted / residual Maximum Likelihood, Likelihoodfunktion wird in zwei Teilen konstruiert (ein Teil feste Effekte, der andere frei von festen Effekten) liefert ML-Schätzung der Varianzkomponenten aus dem Anteil des Modells, der frei von festen Effekten ist negative Varianzen werden bei der Prozedur MIXED auf null gesetzt Beispiel 1: Prozedur MIXED Experiment zur Überprüfung der Wirksamkeit eines Antibiotikas, das zwei Jahre gelagert worden war. Aus acht Behältern wurden jeweils zwei Proben gezogen und die Konzentration der aktiven Komponente gemessen. Fragestellung: 1) Schätzung der (overall) mittleren Gesamtkonzentration. 2) Hat die zufällige Auswahl der Behälter einen Einfluß auf die Variabilität der Responsen? SAS-Benutzertreff Heidelberg,

5 Daten Beispiel 1 %HK½OWHU %DWFK Beispiel 1: Einfaktorielles Modell Start von Beispielprogramm Beispiel 1: Prozedur MIXED - zufällige Effekte Beispiel 1: Prozedur MIXED - feste Effekte Modell 1(Behälter: Zufallsauswahl aus allen Behältern): y ij = µ + β i + ε ij µ = overall Mittel (fixed Effekt), β i = zufälliger (random) Effekt, ε ij = Zufallsfehler für Beobachtung j in Batch i. β i ~ iid N(0, σ 2 b ) ε ij ~ iid N(0, σ 2 ), unabhängig voneinander E[y ij ]= µ, Modell 2 (Behälter sind alle möglichen gewesen): y ij = µ + β i + ε ij µ = overall Mittel (fixed Effekt), β i = Haupt-Effekt für Behälter i (fixed Effekt), ε ij = Zufallsfehler für Beobachtung j in Batch i. ε ij ~ iid N(0, σ 2 ), unabhängig voneinander E[y ij ]= µ+β i, i=1,...,8 (Jeder Behälter hat seinen speziellen Erwartungswert) 27 Varianzkomponenten: Var[y ij ]= σ 2 b + σ2 (σ 2 << σ 2 b ). Varianz: Var[y ij ]= σ 2 (Nur eine Quelle für die Variabilität) 28 Gegen die Prozedur VARCOMP: MIXED verallgemeinert VARCOMP VARCOMP berechnet auch Typ I ANOVA Varianzkomponenten beide erlauben als Schätzverfahren: REML, ML und MIVQUE0 beide erlauben feste und zufällige Effekte VARCOMP erlaubt keine stetigen unabh. Variabl. Std-Schätzverfahren: MIVQUE0 (MIXED:REML) 29 Verwende VARCOMP um Schätzungen für Varianzkomponenten zu erhalten, die assoziiert sind mit den zufälligen Effekten 30 SAS-Benutzertreff Heidelberg,

6 Die Prozedur NESTED: berechnet Varianzkomponenten und Schätzwerte nach der Momentenmethode erlaubt keine stetigen Effekte in X schätzt zufällige Effekte Modelle nur für Experimente mit einer geschachtelten Struktur 31 Weitere Prozeduren: CALIS: erlaubt nur feste Effekte ARIMA / AUTOREG: passen Zeitreihenfehlerstrukturen an aber keine Varianzkomponenten und nur feste Effekte RSCREG: Zeitreihenquerschnittmodelle, Park s Fehlerstruktur (nicht in MIXED möglich) 32 Einsatz der Prozedur MIXED Wann kann die Prozedur MIXED benutzt werden? Repeated Measurements (Wachstumskurvenmodell) Zufällige Effekte (Varianzkomponentenmodell, z.b. Split-Plot-Design) Zufällige Koeffizienten (spezielles Wachstumskurvenmodell bei dem die Spalten von Z stetige Variablen und keine Dummy-Variablen) Räumliche Daten (Landwirtschaft, Geostatistik) Heterogene Varianzen (Anova mit ungleichen Gruppenvarianzen) Metaanalyse (Studie als zufälliger Effekt) Verallgem. Lin. Mixed Models (Macros GLIMMIX, Syntax Prozedur MIXED PROC MIXED < options > ; BY variables ; CLASS variables ; ID variables ; MODEL dependent = < fixed-effects > < / options > ; RANDOM random-effects < / options > ; REPEATED < repeated-effect > < / options > ; PARMS (value-list)... < / options > ; PRIOR < distribution > < / options > ; CONTRAST 'label'< fixed-effect values...> < random-effect values...> < / options>; ESTIMATE 'label' < fixed-effect values... > < random-effect values...>< / options >; LSMEANS fixed-effects < / options > ; MAKE 'table' OUT=SAS-data-set ; WEIGHT variable ; NLINMIX / Vs 6.12, ab Vs 8: PROC NLMIXED) Statements Prozedur MIXED CLASS variables ; Spezifiziert die Namen der Klassifikationsvariablen; die Werte dieser Variablen identifizieren die Levels. MODEL dependent = < fixed-effects > < / options > ; Spezifiziert die Namen der abhängigen und unabhängigen Variablen (feste Effekte und Kovariablen). RANDOM random-effects < / options > ; Spezifiziert die zufälligen Effekte, die mit dem Vektor ν assoziiert sind, die Matrix Z sowie die Struktur der Matrix G. 35 Statements Prozedur MIXED REPEATED < repeated-effect > < / options > ; Spezifiziert die Wiederholungseffekte und die Matrix R; Effekte, die hier aufgelistet sind, müssen im CLASS- Statement auch gelistet sein. PARMS (value-list)... < / options > ; Spezifiziert die Anfangswerte für Kovarianzparameter PRIOR < distribution > < / options > ; Bayes Analyse für die Varianzkomponentenmodelle CONTRAST 'label'< fixed-effect values...> < random-effect values...> < / options>; Lineare Kontraste für Hypothsenteste 36 SAS-Benutzertreff Heidelberg,

7 Statements Prozedur MIXED ESTIMATE 'label' < fixed-effect values... > < random-effect values...>< / options >; Schätzt Linearkombinationen von festen und zufälligen Effekten LSMEANS fixed-effects < / options > ; Liefert verallgemeinerte Kleinste-Quadrate Mittelwerte für die festen Effekte. MAKE 'table' OUT=SAS-data-set ; Konvertiert jede Tabelle der Ausgabe in SAS-Data Set WEIGHT variable ; Beispiel 2: Zweifache Varianzanalyse Geprüft werden soll die Tauglichkeit von drei Wachstumsmethoden für fünf verschiedene Grassamensorten (n=6 Wdh.): Methoden: A, B, C Sorte: 1,2,3,4,5 Zielgröße: Ertrag nach vier Wochen Vollständig randomisiertes Experiment mit 2 Fakt. Unterschiede beim Ertrag? Unterschiede bei der Methode pro Sorte? Spezifiziert die Gewichtungsvariable für R Beispiel 2: Zweifache Varianzanalyse Sorte: zufälliger Effekt (Zufallsauswahl aus größerer Pop.) Methode: fester Effekt (nur die drei Methoden interessieren) gemischtes Modell Ziel: Hypothesenteste zum Vergleich der Methoden, die Sorte als zufälligen Effekt zulassen. 39 Beispiel 2: gemischtes Modell Mixed Modell: y ijk = µ + α i + β j + (αβ) ij + ε ijk µ = overall Mittel (fixed Effekt), α i = Effekt der i-ten Methode (fester Effekt), β i = Effekt der j-ten Sorte (zufälliger Effekt), (αβ) ij =Wechselwirkung zwischen i-ter Methode und j-ter W ε ijk = Zufallsfehler für Beobachtung j in Batch i. (αβ) ij ~ iid N(0, σ 2 ab ) β j ~ iid N(0, σ 2 b ) 40 ε ijk ~ iid N(0, σ 2 ), unabhängig voneinander Beispiel 2: gemischtes Modell Beispiel 2: gemischtes Modell Mixed Modell: y ijk = µ + α i + β j + (αβ) ij + ε ijk Erwartungswert von Methode i (über alle Sorten): E[y ijk ]= µ + α i, Varianzkomponenten: Var[y ijk ]= σ 2 b + σ2 ab + σ2. 41 Mixed Modell in Matrix-Schreibweise: y=xβ + Zν + ε y= 90 1 Vektor der beobachteten Erträge β= 4 1 Vektor (µ, α 1, α 2, α 3 ) ν=20 1Vektor der zufälligen Effekte (5 Sorten, 15 WW) ε= 90 1 Vektor der Fehler X=90 4 Design-Matrix (aufgeteilt in I 30 -Matrizen) Z= Design-Matrix (aufgeteilt in I 6 -Matrizen) G=Diag{σ 2 b I 5, σ2 ab I 15 } und R= σ2 I SAS-Benutzertreff Heidelberg,

8 Beispiel 2: gemischtes Modell Start von Beispielprogramm 2 Beispiel 3: Wachstumskurvenmodell Wachstumskurve mit zusammengesetzter Symmetrie (Compound symmetry): Gegeben: drei Wachstumskurvenmessungen bei s Individuen Problem: Anpassung eines overall linearen Trends in der Zeit (Lineares Regressionsmodell) Beispiel 3: Wachstumskurvenmodell Prozedur-Aufruf: PROC MIXED DATA=dset ; CLASS indiv ; MODEL y = time ; REPEATED / TYPE=cs SUBJECT=indiv ; RUN ; Option TYPE definiert dabei die Kovarianzstruktur: vc (=variance components, Default) cs (=compound symmetry) un (=unstructered) 45 Beispiel 3: Wachstumskurvenmodell -2- Alternative: spezifiziere die Matrizen Z und G wie auf der Folie angegeben und R= σ 2 I 3s 46 Beispiel 3: Wachstumskurvenmodell -2- Prozedur-Aufruf: Beispiel 3: Wachstumskurvenmodell -2- Prozedur-Aufruf: PROC MIXED DATA=dset ; CLASS indiv ; MODEL y = time ; RANDOM indiv ; RUN ; PROC MIXED DATA=dset ; CLASS indiv ; MODEL y = time ; RANDOM intercept / SUBJECT=indiv ; RUN ; SAS-Benutzertreff Heidelberg,

9 Beispiel 3: Wachstumskurvenmodell -2- Alle drei Prozedur-Aufrufe passen das gleiche Modell an: RANDOM-Statement: Einschänkung der Korrelationen auf positive Korr s REPEATED-Statement: Korr s nicht eingeschränkt 49 Zusammenfassung Verwende MIXED für Random Effekte: Varianzkomponentenmodelle Random Koeffizienten: best. Typ von Wachstumskurvenmodellen in denen die Spalten von Z stetige Variablen sind, nicht Dummyvariablen Repeated Measures: multiple Measurements bei Subjekten und Growth-Kurven-Modellen Heterogenenen Varianzen: ANOVA mit ungleichen Gruppen-Varianzen Meta-Analysen: Studie als random Effekt 50 MIXED: Literaturhinweise Gert Verbeke / Geert Molenberghs (eds.): Linear Mixed Models in Practice - A SASoriented Approach. Springer Lecture Notes in Statistics No 126, 1997 SAS V8 Online Dokumentation MIXED: Literaturhinweise - 2 Littell, R.C., Milliken, G.A., Stroup, W.W. and Wolfinger, R.D. (1996): SAS System for Mixed Models. SAS Institute Inc. Cary, NC, USA SUGI-Proceedings Zur Prozedur MIXED Any Questions? ;-) 53 SAS-Benutzertreff Heidelberg,

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

ANalysis Of VAriance (ANOVA) 2/2

ANalysis Of VAriance (ANOVA) 2/2 ANalysis Of VAriance (ANOVA) 2/2 Markus Kalisch 22.10.2014 1 Wdh: ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor X). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich

Mehr

THEMA: MAßGESCHNEIDERTE TESTS IN DER VARIANZANALYSE" TORSTEN SCHOLZ

THEMA: MAßGESCHNEIDERTE TESTS IN DER VARIANZANALYSE TORSTEN SCHOLZ WEBINAR@LUNCHTIME THEMA: MAßGESCHNEIDERTE TESTS IN DER VARIANZANALYSE" TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI WEBINAR@LUNCHTIME Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant

Mehr

Multivariate Lineare Modelle SS Varianzanalyse. 1. T -Statistiken. 2. ANOVA einfaktoriell. 3. ANOVA zweifaktoriell 4. MANOVA 5.

Multivariate Lineare Modelle SS Varianzanalyse. 1. T -Statistiken. 2. ANOVA einfaktoriell. 3. ANOVA zweifaktoriell 4. MANOVA 5. Multivariate Lineare Modelle SS 2010 3 Varianzanalyse 1. T -Statistiken 2. ANOVA einfaktoriell 3. ANOVA zweifaktoriell 4. MANOVA 5. ANCOVA 1 3.1 T -Statistiken Varianzanalyse kategorielle erklärende Variablen

Mehr

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten

Mehr

Eine Einführung in R: Varianzanalyse

Eine Einführung in R: Varianzanalyse Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2011 Bernd Klaus, Verena Zuber Das

Mehr

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen**

Oliver Kuß*; Dorothee Twardella**; Maria Blettner***; Thomas L. Diepgen** Effektschätzung in Cluster-Randomized Trials mit binärer Zielgröße: Eine Sensitivitätsanalyse mit numerischer Integration, MCMC und NPMLE am Beispiel der DHP Oliver Kuß*; Dorothee Twardella**; Maria Blettner***;

Mehr

Einführung in die Varianzanalyse mit SPSS

Einführung in die Varianzanalyse mit SPSS Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen

Mehr

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Die Berücksichtigung hierarchischer Datenstruktur in quantitativen Untersuchungen

Die Berücksichtigung hierarchischer Datenstruktur in quantitativen Untersuchungen Die Berücksichtigung hierarchischer Datenstruktur in quantitativen Untersuchungen Andreas Hartinger Kurzpräsentation im Rahmen des Doktorandenkolloquiums Regensburg, 15. Februar 2016 Agenda 1. Wo liegt

Mehr

Lineare Regression 1 Seminar für Statistik

Lineare Regression 1 Seminar für Statistik Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken

Mehr

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen

Mehr

Tests einzelner linearer Hypothesen I

Tests einzelner linearer Hypothesen I 4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen

Mehr

o o o o o o o o o o o o

o o o o o o o o o o o o Klumpen-Stichproben = Cluster Sampling Obs.: Bei einer uneingeschränkten Zufallsauswahl wird pro Randomisierungs- Schritt genau eine Beobachtung gemacht. Ein ganz wesentlicher Punkt : Jedes zufällig ausgewählte

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen Prof Dr Rainer Dahlhaus Statistik 1 Wintersemester 2016/2017 Vorbereitung auf Übungsblatt (Präsenzübungen) - Lösungen Aufgabe P9 (Prognosen und Konfidenzellipsoide in der linearen Regression) Wir rekapitulieren

Mehr

Vergleich von Gruppen I

Vergleich von Gruppen I Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik

Mehr

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Aufgabe 1 U t bedeute weißes Rauschen und B den Backshift

Mehr

Versuchsplanung. Inhalt. Grundlagen. Faktor-Effekt. Allgemeine faktorielle Versuchspläne. Zweiwertige faktorielle Versuchspläne

Versuchsplanung. Inhalt. Grundlagen. Faktor-Effekt. Allgemeine faktorielle Versuchspläne. Zweiwertige faktorielle Versuchspläne Inhalt Versuchsplanung Faktorielle Versuchspläne Dr. Tobias Kiesling Allgemeine faktorielle Versuchspläne Faktorielle Versuchspläne mit zwei Faktoren Erweiterungen Zweiwertige

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 31. Mai 2011 4. Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der

Mehr

Wiederholung. Seminar für Statistik

Wiederholung. Seminar für Statistik Wiederholung 17.12.2014 1 Prüfung: 2 Kohorten 2 Kohorten alphabetisch nach Nachname sortiert: Kohorte 1: A bis und mit Müller Kohorte 2: Müllhaupt bis und mit Z 17.12.2014 2 Prüfung: 2 Kohorten Kohorte

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und

Mehr

Grundgesamtheit und Stichprobe

Grundgesamtheit und Stichprobe Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U

Mehr

Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke

Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten. Frank Konietschke Nichtparametrische Analyse longitudinaler Daten in faktoriellen Experimenten Frank Konietschke Abteilung für Medizinische Statistik Universität Göttingen 1 Übersicht Beispiele CGI (repeated measures) γ-gt

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Klausur zu Statistik II

Klausur zu Statistik II GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

5.8 Anpassungstests. W. Kössler (IfI HU Berlin) Werkzeuge der empirischen Forschung 389 / 419

5.8 Anpassungstests. W. Kössler (IfI HU Berlin) Werkzeuge der empirischen Forschung 389 / 419 5.8 8.1 Einführung empirische Verteilungsfunktion 8.2 EDF- Kolmogorov-Smirnov-Test Anderson-Darling-Test Cramer-von Mises-Test 8.3 Anpassungstest auf Normalverteilung - Shapiro-Wilk-Test 8.4. auf weitere

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Eine Einführung in R: Das Lineare Modell

Eine Einführung in R: Das Lineare Modell Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber

Mehr

Lineare Modelle in R: Klassische lineare Regression

Lineare Modelle in R: Klassische lineare Regression Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)

Mehr

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest. Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht

Mehr

ANalysis Of VAriance (ANOVA) 1/2

ANalysis Of VAriance (ANOVA) 1/2 ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?

Mehr

Grundgesamtheit und Stichprobe

Grundgesamtheit und Stichprobe Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U

Mehr

Strukturgleichungsmodellierung

Strukturgleichungsmodellierung Strukturgleichungsmodellierung FoV Methodenlehre FSU-Jena Dipl.-Psych. Norman Rose Parameterschätzung, Modelltest & Fit Indizes bei SEM Forschungsorientierte Vertiefung - Methodenlehre Dipl.-Psych. Norman

Mehr

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (90 Minuten) Dr. M. Kalisch Probeprüfung Statistik 1 Sommer 2014 Schriftliche Prüfung (90 Minuten) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten!

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

6.1 Definition der multivariaten Normalverteilung

6.1 Definition der multivariaten Normalverteilung Kapitel 6 Die multivariate Normalverteilung Wir hatten die multivariate Normalverteilung bereits in Abschnitt 2.3 kurz eingeführt. Wir werden sie jetzt etwas gründlicher behandeln, da die Schätzung ihrer

Mehr

6. Statistische Schätzung von ARIMA Modellen

6. Statistische Schätzung von ARIMA Modellen 6. Statistische Schätzung von ARIMA Modellen Vorschau: ARIMA Modelle Modellidentifikation verschiedene Schätzverfahren Modelldiagnostik Fallstudien Zeitreihenanalyse 1 6.1 ARIMA Modelle Bisher: ARMA(p,q)-Modelle:

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Mehrebenenanalyse Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Inhalt } Einführung } Fragestellung } Das Programm HLM } Mögliche Modelle } Nullmodell } Random

Mehr

Bestimmung von allgemeiner und spezifischer Kombinationseignung in diallelen Kreuzungen bei Erdbeeren

Bestimmung von allgemeiner und spezifischer Kombinationseignung in diallelen Kreuzungen bei Erdbeeren Bestimmung von allgemeiner und spezifischer Kombinationseignung in diallelen Kreuzungen bei Erdbeeren Jens Möhring, Markus Bestfleisch Dummerstorf, 8.06.01 1 Übersicht Problemstellung Zielvariablen Modell

Mehr

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004

Mehr

Berechnung des LOG-RANK-Tests bei Überlebenskurven

Berechnung des LOG-RANK-Tests bei Überlebenskurven Statistik 1 Berechnung des LOG-RANK-Tests bei Überlebenskurven Hans-Dieter Spies inventiv Health Germany GmbH Brandenburger Weg 3 60437 Frankfurt hd.spies@t-online.de Zusammenfassung Mit Hilfe von Überlebenskurven

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette Ruhr-Universität Bochum 30. März 2011 1 / 46 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30 10.00

Mehr

Die Maximum-Likelihood-Methode

Die Maximum-Likelihood-Methode Vorlesung: Computergestützte Datenauswertung Die Maximum-Likelihood-Methode Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

Statistische Modellierung Merkblatt

Statistische Modellierung Merkblatt Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC

Mehr

Zweistufige Schätzung in der Meta-Analyse

Zweistufige Schätzung in der Meta-Analyse Statistik Zweistufige Schätzung in der Meta-Analyse Annette Böckenhoff, Joachim Hartung Universität Dortmund Fachbereich Statistik 44221 Dortmund boecken@statistik.uni-dortmund.de hartung@statistik.uni-dortmund.de

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung

Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung Systematische Stichprobe Rel. große Gruppe von Stichprobenverfahren. Allgemeines Merkmal: es existiert ein festes, systematisches Muster bei der Auswahl. Wie passt das zur allgemeinen Forderung nach Randomisierung

Mehr

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 3.1 3.1 Punktschätzer für Mittelwert µ und Varianz σ 2 Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden

Mehr

Zeitreihenanalyse. Seminar Finanzmathematik. Andreas Dienst SS Einleitung - Begrüßung - Motivation - Inhaltsangabe. 2.

Zeitreihenanalyse. Seminar Finanzmathematik. Andreas Dienst SS Einleitung - Begrüßung - Motivation - Inhaltsangabe. 2. Seminar Finanzmathematik - Begrüßung - Motivation - Inhaltsangabe 3. Zusammen - fassung Zeitreihenanalyse Andreas Dienst SS 2006 Zeitreihen: Definition und Motivation - Begrüßung - Motivation - Inhaltsangabe

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle

Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle Gemischte Modelle zur Schätzung geoadditiver Regressionsmodelle Thomas Kneib & Ludwig Fahrmeir Institut für Statistik, Ludwig-Maximilians-Universität München 1. Regressionsmodelle für geoadditive Daten

Mehr

Statistik für das Psychologiestudium

Statistik für das Psychologiestudium Dieter Rasch / Klaus D. Kubinger Statistik für das Psychologiestudium Mit Softwareunterstützung zur Planung und Auswertung von Untersuchungen sowie zu sequentiellen Verfahren ELSEVIER SPEKTRUM AKADEMISCHER

Mehr

Einführung in die (induktive) Statistik

Einführung in die (induktive) Statistik Einführung in die (induktive) Statistik Typische Fragestellung der Statistik: Auf Grund einer Problemmodellierung sind wir interessiert an: Zufallsexperiment beschrieben durch ZV X. Problem: Verteilung

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

Aufgaben zu Kapitel 7:

Aufgaben zu Kapitel 7: Aufgaben zu Kapitel 7: Aufgabe 1: In einer Klinik sollen zwei verschiedene Therapiemethoden miteinander verglichen werden. Zur Messung des Therapieerfolges werden die vorhandenen Symptome einmal vor Beginn

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik

Mehr

Mehr-Ebenen-Modelle. Übersicht. VL Forschungsmethoden. VPC/Intra-Class-Correlation. 1 Einführung Strukturierte Daten Einfache Lösungen

Mehr-Ebenen-Modelle. Übersicht. VL Forschungsmethoden. VPC/Intra-Class-Correlation. 1 Einführung Strukturierte Daten Einfache Lösungen VL Forschungsmethoden Übersicht 1 Strukturierte Daten Einfache Lösungen 2 Random & Fixed Typen von Modellen 3 4 (Quelle: Kawachi/Subramanian 2007) VL Forschungsmethoden (MLA 1/27) Strukturierte Daten Einfache

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:

Mehr

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler

Mehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse Tobias Scheffer Thomas Vanck Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a)

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 7 a) LÖSUNG 7 a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Aufrufen der Varianzanalyse: "Analysieren", "Mittelwerte vergleichen", "Einfaktorielle ANOVA ", "Abhängige Variablen:" TVHOURS;

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Informationen zur KLAUSUR am

Informationen zur KLAUSUR am Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67 Kapitel 2.1: Die stochastische Sicht auf Signale 215 Georg Dorffner 67 Stochastische Prozesse Stochastische Prozesse sind von Zufall geprägte Zeitreihen x n f x, n 1 xn2,... n vorhersagbarer Teil, Signal

Mehr

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung

Mehr

1 (2π) m/2 det (Σ) exp 1 ]

1 (2π) m/2 det (Σ) exp 1 ] Multivariate Normalverteilung: m=1: Y N(µ; σ 2 ) Erwartungswert: µ Varianz: σ 2 f Y (y) = f Y1 Y 2...Y m (y 1,y 2,...,y m ) = [ 1 exp 1 ] 2πσ 2 2 (y µ)2 /σ 2 Σ: m m-matrix, symmetrisch, positiv definit.

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Einführung in Panel-Verfahren

Einführung in Panel-Verfahren Einführung in Panel-Verfahren Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Drei Arten von Datensätzen Cross-Section

Mehr

Zufallsvariablen [random variable]

Zufallsvariablen [random variable] Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden

Mehr

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Prof. Dr. Rainer Schwabe 08.07.2014 Otto-von-Guericke-Universität Magdeburg Institut für Mathematische Stochastik Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Name:, Vorname: Matr.-Nr.

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 28. August 2009 28. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Korrelation vs. Regression 2. Ziel der Regressionsanalyse 3. Syntax für den

Mehr

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Mehr

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Versuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling

Versuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling Versuchsplanung Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling Gliederung Grundlagen der Varianzanalyse Streuungszerlegung und Modellschätzer Modellannahmen und Transformationen

Mehr