Wirkung von UV-B Strahlung auf Mikroorganismen

Größe: px
Ab Seite anzeigen:

Download "Wirkung von UV-B Strahlung auf Mikroorganismen"

Transkript

1 Wirkung von UV-B Strahlung auf Mikroorganismen Herwig Friedl Februar 2002 Zusammenfassung Ziel der vorliegenden Studie ist die statistische Untersuchung der Abnahme der Keimanzahl in Wasser von der Dauer sowie Intensität einer UV-B Bestrahlung. Unter anderem wird dabei der Einfluss der Wassertrübung analysiert sowie das unterschiedliche Absterbeverhalten diverser Keimtypen näher betrachtet. Verwendet werden dafür Generalisierte Lineare Regressionsmodelle. Es wird gezeigt, dass die Überlebensperformance von Mikroorganismen im trüben Wasser signifikant besser ist als im klaren Wasser. Weiters ergibt sich, dass die Anzahl kolonienbildender Einheiten mit steigender Intensität der Bestrahlung signifikant abnimmt. Die Keimtypen E.Coli und Enterococcus faecalis weisen im Vergleich mit Staphylococcus aureus und Pseudomonas aeruginosa eine weitaus bessere Resistenz gegen die UV- B Bestrahlung auf. Dieses Projekt wurde in Zusammenarbeit mit dem Büro des Landeshygienikers für Steiermark durchgeführt. 1 Absterberaten und Wassertrübung In diesem ersten Teil wird untersucht, ob und wie sich die Überlebensrate von Mikroorganismen durch andauerndes Einwirken von Sonnenlicht ändert und ob diese Änderung von der Wasserqualität und Trübung abhängt. Dazu liegen Keimgehaltsmessungen von Wasserproben in der Steiermark vor. Diese sind die Badegewässer in Schwanberg, Gleinstätten, Waldschach, Bad Gams, der Freibacher Stausee, sowie der Schotterteich Tillmitsch. Alle Messungen erfolgten bei direkter Sonneneinstrahlung, wolkenlosem Himmel, und einer Luxzahl größer als Nach der ersten Messung um 13:05 wurden alle 10 Minuten bis 14:35 neun weitere Messungen durchgeführt. Außer der Trübung bestimmte man die Anzahl kolonienbildender Einheiten (cfu s) in 1 ml Wasser. Der gesamte Datensatz beinhaltet somit 60 Beobachtungen. Für die folgende statistische Auswertung werden diese Daten zuerst einmal reduziert. Sobald nach einer gewissen Zeit keine cfu s mehr nachweisbar sind, müssen natürlich Institut für Statistik, Technische Universität Graz, Steyrergasse 17, A-8010 Graz 1

2 1 ABSTERBERATEN UND WASSERTRÜBUNG 2 Uhrzeit Gleinstätten Waldschach Bad Gams Freibach Tillmitsch 13: : : : : : : : : : Trübung (Stufe) 80 (stark) 45 (stark) 5.5 (leicht) 0.3 (leicht) 1.4 (leicht) Tabelle 1: Beobachtete cfu Werte pro ml Wasser sowie Wassertrübung zusammengefasst im Datensatz uvb. auch alle nachfolgenden Messungen dasselbe Ergebnis liefern. Um diese Abhängigkeit nicht überzubewerten, werden von den Daten nur jene verwendet, bis erstmals eine Null auftritt. Dadurch ergibt sich eine Datenreduktion auf 54 Beobachtungen. Weiters verhält sich sich das Badegewässer Schwanberg nicht homogen zu den restlichen fünf Gewässern, weshalb auf diese Serie von Beobachtungen gänzlich verzichtet wird. Die nachfolgenden statistischen Ergebnisse beziehen sich daher nur auf die Daten in der Tabelle 1. Es wird nun untersucht, ob sich die Absterberaten in stark und leicht trüben Gewässern unterscheiden. Dazu wird ein zweistufiger Faktor trueb generiert, der den Wert 0 für leichte Trübung (< 10) und 1 für starke Trübung (> 10) zugewiesen bekommt. Die Variable zeit beschreibt seit wie vielen Minuten die Keime der Sonnenlichteinwirkung ausgesetzt sind, und erstreckt sich somit über die Werte 0, 10,..., 90. Obwohl es sich bei den Daten um nicht-negative Anzahlen handelt, passt wegen der resultierenden viel zu großen Deviance die Standardannahme einer Poissonverteilung nicht. Die Variabilität in den cfu s scheint in den beiden Gruppen eher konstant über die Zeit zu sein, weshalb auch als Verteilungsannahme die Normalverteilung verwendet wird, d.h. y it N(µ it, σ 2 ), wobei y it, i = 1,..., 5, t 0 den cfu Wert im Gewässer i nach t minütiger Bestrahlung bezeichnet. Um die nicht-negativen Erwartungswerte µ it dieser Anzahlen auf der passenden Skala zu modellieren, wird ein log-lineares Modell (Generalisiertes Lineares Modell) eingesetzt, also log µ it = x it β mit dem Parametervektor β. Probleme mit Nullbeobachtungen und diesem log-link werden umgangen, indem zu jeder cfu Beobachtung künstlich der Wert 1 addiert wird, was jedoch zu vernachlässigen ist. Das Hauptaugenmerk ist die Untersuchung, ob für die beiden Trübungsstufen (stark/leicht) unterschiedliche Zeiteffekte benötigt werden, d.h. ob

3 1 ABSTERBERATEN UND WASSERTRÜBUNG 3 sich die zeitliche Abnahme der cfu Anzahlen bei verschieden trüben Gewässern unterscheidet. Im folgenden Modell werden für jede der beiden Trübungsstufen eigene konstante, lineare sowie auch quadratische Zeiteffekte für x verwendet. Die Notwendigkeit all dieser Parameter wird erst später getestet. Als Ergebnis erhält man mrz2tfac <- glm(kbe1 ~ trueb zeit*trueb I(zeit**2)*trueb, data = uvb, family=gaussian(link="log")); summary(mrz2tfac) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** trueb zeit I(zeit**2) *** trueb1:zeit trueb1:i(zeit**2) ** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for gaussian family taken to be ) Null deviance: e10 on 43 degrees of freedom Residual deviance: e08 on 38 degrees of freedom AIC: Das geschätzte Modell lautet somit { exp( t t ˆµ it = 2 ) für leicht trüb, exp(( ) ( )t ( )t 2 ) für stark trüb. Interpretation der Ergebnisse: Verschiedene quadratische Zeitterme für die beiden Trübungsstufen sind notwendig, da zu trueb1:i(zeit**2) ein p-value von gehört. Die beiden linearen Zeitterme unterscheiden sich nicht signifikant, denn der p-value zu trueb1:zeit ist mit 0.69 viel zu groß. Da zu zeit ein p-value von 0.56 gehört, scheint überhaupt kein linearer Zeitterm im Modell notwendig zu sein. Diese Hypothese wird nun auch varianzanalytisch getestet. m1wol <- glm(kbe1 ~ trueb I(zeit**2)*trueb, data = uvb, family=gaussian(link="log")) anova(mrz2tfac, m1wol, test="chisq") Model 1: kbe 1 ~ trueb zeit * trueb I(zeit^2) * trueb Model 2: kbe 1 ~ trueb I(zeit^2) * trueb

4 1 ABSTERBERATEN UND WASSERTRÜBUNG 4 Man würde sich zwei Parameter ersparen und dabei nur um Devianceeinheiten anwachsen was einem p-value von entspricht. Auf dem 5% Niveau kann man also auf die beiden linearen Zeitterme verzichten. Offen ist noch, ob unterschiedliche Modellkonstanten (Intercepts) benötigt werden. anova(m1wol, glm(kbe1 ~ I(zeit**2) I(zeit**2):trueb, data = uvb, family=gaussian(link="log")), test="chisq") Model 1: kbe 1 ~ trueb I(zeit^2) * trueb Model 2: kbe 1 ~ I(zeit^2) I(zeit^2):trueb Dies ist also der Fall. Das Modell mit nur einer gemeinsamen Konstante unterscheidet sich von jenem mit zwei unterschiedlichen Konstanten bzgl. eines p-values von Somit erlaubt das endgültige Modell vier Parameter und lautet summary(m1wol) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** trueb ** I(zeit**2) e-12 *** trueb1:i(zeit**2) e-10 *** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for gaussian family taken to be ) Null deviance: e10 on 43 degrees of freedom Residual deviance: e09 on 40 degrees of freedom AIC: 884 also { exp( t ˆµ it = 2 ) für leicht trüb, exp(( ) ( )t 2 für stark trüb. Als Schätzer für die Standardabweichung der cfu s erhält man unter diesem Modell ˆσ = = Grafisch veranschaulicht ist dieses Modell in der Abbildung 1. Man erkennt dabei deutlich, wie sich im trüben Wasser die Mikroorganismen länger am Leben halten als dies im klaren Wasser der Fall ist. Weiters zeigt das Modell auch, dass in den Daten die Ausgangsskonzentrationen unterschiedlich waren. Diese ist bei den Proben im trübem Wasser im Mittel geringer als im weniger trüben Wasser.

5 2 ÜBERLEBENSRATEN UND UV-STRAHLUNGSINTENSITÄT 5 cfu low turbidity high turbidity minutes Abbildung 1: Regressionsmodell für die Abnahme der Anzahl von Mikroorganismen (cfu) in zeitlicher Abhängigkeit (minutes) vom Trübungsgrad (low/high turbidity). 2 Überlebensraten und UV-Strahlungsintensität Verwendet werden hier die 27 Messungen aus Tabelle 2. Diese Daten beschreiben, wie viele cfu s nach einer gewissen Bestrahlung mit UV-B von einer Anfangsmenge übrig bleiben. Da es sich hier um Häufigkeiten handelt, sollte ein logistisches Regressionsmodell mit der erklärenden Variablen UV-B Intensität (uvb) die Kurve für die Absterberate hinreichend genau beschreiben können. Für dieses Modell wird wie üblich die Binomialverteilung und der Logitlink angenommen. Bezeichnen r i, i = 1,..., 27 die restlichen von a i verbleibenden cfu s, so wird angenommen, dass r i B(a i, π i ); mit E(r i ) = a i π i und var(r i ) = a i π i (1 π i ) mit der Überlebenswahrscheinlichkeit π i für eine cfu aus der iten Versuchseinheit. Weiters modelliert man π i log = x i β. 1 π i Da aber die r i eine höhere Variabilität aufweisen als dies durch die Binomialverteilung erklärt werden kann, wird der Quasi-Likelihood Ansatz verwendet mit der Annahme, dass die Varianz proportional zur Binomialvarianz ist, d.h. var(r i ) = φa i π i (1 π i ). Dies führt zu den folgenden Schätzern

6 3 ÜBERLEBENSRATEN UNTERSCHIEDLICHER KEIME 6 UV-B Anfang Rest UV-B Anfang Rest UV-B Anfang Rest Tabelle 2: Beobachtete absolute Anfangs- und Restanzahlen an cfu s nach einer Strahlungsintensität von UV-B zusammengefasst im Datensatz uvb2. Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) uvb * --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for quasibinomial family taken to be ) Null deviance: on 26 degrees of freedom Residual deviance: on 25 degrees of freedom Als geschätztes Modell für die Überlebensrate erhält man ˆπ i = exp( uvb i) 1 exp( uvb i ). Diese nimmt mit zunehmender Strahlungsintensität ab, was aus dem negativen Vorzeichen des UV-B Parameters zu erkennen ist und auf dem 1.2% Niveau signifikant ist. Die Abbildung 2 vergleicht die beobachteten relativen Häufigkeiten r i /a i (durch ein gekennzeichnet) mit den Modellwerten ˆπ i (survival rate) für die UV-B Intensitäten. Ersichtlich ist auch die große Datenvariabilität für kleine UV-B Werte sowie der abnehmende Trend in der geschätzten Überlebenskurve. 3 Überlebensraten unterschiedlicher Keime Sind die Absterberaten verschiedener Keimtypen bei UV-B Strahlung unterschiedlich? Dafür liegen Messungen für E.Coli, Enterococcus faecalis, Staphylococcus aureus, und Pseudomonas aeruginosa in Institutswasser vor. Da diese Fragestellung der in Abschnitt 1 analysierten Problematik sehr ähnlich ist, basiert auch die statistische Analyse auf ein

7 3 ÜBERLEBENSRATEN UNTERSCHIEDLICHER KEIME 7 survival rate Abbildung 2: Logistisches Regressionsmodell für Überlebensrate der Mikroorgamismen in Abhängigkeit von der Intensität der UV-B Bestrahlung (uvb). uvb vergleichbares Datenmaterial. Wiederum werden nur Messungen bis zum ersten Auftreten einer Null verwendet, wodurch eine Stichprobe mit 36 Messungen resultiert. Zu hinterfragen ist die leichte Zunahme der Enterococcen um 14:30 von auf Wie zuvor wird ein log-lineares Regressionsmodell mit Normalverteilungsannahme für die cfu Werte eingesetzt. Der vierstufige Faktor typ beschreibt dabei den Keimtyp. Zuerst wird ein passender linearer Prediktor gesucht, in dem nur die Variable zeit (in Minuten) eingehen soll. Um eine Variablenselektion durchzuführen, werden einige Modelle geschätzt. Dazu zählt das volle Modell mfull mit keimtypspezifischen Intercepts, linearen und quadratischen Zeittermen, das Submodell mwoq mit nur einem gemeinsamen quadratischen Zeitterm, das Modell mwol mit einem linearen Zeitterm, das Modell mwol ohne lineare Zeitterme, und das Modell mwoi ohne unterschiedliche Intercepts aber mit typspezifischen quadratischen Zeittermen. mfull <- glm(kbe1 ~ type zeit I(zeit**2) zeit:type I(zeit**2):type, data = uvb3, family=gaussian(link="log")) mwoq <- glm(kbe1 ~ type zeit I(zeit**2) zeit:type, data = uvb3, family=gaussian(link="log")) mwol <- glm(kbe1 ~ type zeit I(zeit**2) I(zeit**2):type, data = uvb3, family=gaussian(link="log")) mwol <- glm(kbe1 ~ type I(zeit**2) I(zeit**2):type, data = uvb3, family=gaussian(link="log"))

8 3 ÜBERLEBENSRATEN UNTERSCHIEDLICHER KEIME 8 Uhrzeit E.coli Pseudomonas Enterococcus Staphylococcus aeruginosa faecalis aureus 14: : : : : : : : : : : Tabelle 3: Beobachtete cfu Werte pro ml Institutswasser für vier verschiedene Keimtypen zusammengefasst im Datensatz uvb3. mwoi <- glm(kbe1 ~ I(zeit**2) I(zeit**2):type, data = uvb3, family=gaussian(link="log")) Zuerst wird varianzanalytisch auf die Notwendigkeit unterschiedlicher quadratischer Zeitterme im Modell getestet, d.h. die Modellanpassung von mfull mit der von mwoq verglichen. anova.glm(mfull, mwoq, test="chisq") Model 1: kbe 1 ~ type zeit I(zeit**2) zeit:type I(zeit**2):type Model 2: kbe 1 ~ type zeit I(zeit**2) zeit:type e e e Fazit ist also, dass individuelle quadratische Terme signifikant (p = ) notwendig sind. Im nächsten Schritt wird auf unterschiedliche lineare Zeitterme getestet. anova.glm(mfull, mwol, test="chisq") Model 1: kbe 1 ~ type zeit I(zeit**2) zeit:type I(zeit**2):type Model 2: kbe 1 ~ type zeit I(zeit**2) I(zeit**2):type Wie in Abschnitt 1 sind auch hier keine individuellen Linearterme notwendig (p-value = 1). Ein zusätzlicher Test auf die Notwendigkeit eines gemeinsamen linearen Zeitterms

9 3 ÜBERLEBENSRATEN UNTERSCHIEDLICHER KEIME 9 anova.glm(mwol, mwol, test="chisq") Model 1: kbe 1 ~ type zeit I(zeit^2) I(zeit^2):type Model 2: kbe 1 ~ type I(zeit^2) I(zeit^2):type ergibt, dass auf lineare Terme überhaupt verzichtet werden kann (p-value = 1). Wir können uns daher weiterhin auf ein Modell ohne jeglichen linearen Zeiteffekt, jedoch mit unterschiedlichen quadratischen Zeittermen, beschränken. Testet man auf unterschiedliche Intercepts, so erhält man anova.glm(mwol, mwoi, test="chisq") Model 1: kbe 1 ~ type I(zeit^2) I(zeit^2):type Model 2: kbe 1 ~ I(zeit^2) I(zeit^2):type e e e e-61 Wieder sind individuelle Intercepts unbedingt (p-value = 0) notwendig. Diese Variablenselektion entspricht also genau dem Ergebnis der Studie im ersten Abschnitt. Verwendet wird daher das Modell mwol mit vier individuellen Intercepts und mit vier quadratischen Zeittermen. summary(mwol) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** typeentero e-08 *** typepseudo typestaphylo e-11 *** I(zeit**2) ** typeentero:i(zeit**2) * typepseudo:i(zeit**2) * typestaphylo:i(zeit**2) Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for gaussian family taken to be ) Null deviance: e12 on 35 degrees of freedom Residual deviance: e10 on 28 degrees of freedom AIC:

10 3 ÜBERLEBENSRATEN UNTERSCHIEDLICHER KEIME 10 cfu fitted 0 e00 2 e05 4 e05 6 e05 0 e00 2 e05 4 e05 6 e05 cfu observed Abbildung 3: Durch das Modell mwol angepasste cfu Werte (fitted) gegen die beobachteten cfu Anzahlen (observed). Das geschätzte Modell lautet somit exp( t 2 ) exp(( ) ( )t ˆµ it = 2 ) exp(( ) ( )t 2 ) exp(( ) ( )t 2 ) für E.coli, für Entero, für Pseudo, für Staphylo. Als geschätzte Standardabweichung resultiert ˆσ = = Der Diagnostic- Plot in Abbildung 3 zeigt die gute Modellanpassung und keine auffälligen Muster. Das Verhalten dieses Modells ist für die vier Keimtypen in der Abbildung 4 gezeigt. Der Abfall bei Pseudomonas und Staphylococcus ist signifikant steiler als bei E.coli und Enterococcus. Die Enterococcen haben die beste Überlebensfähigkeit während bei Pseudomonas die schlechteste vorliegt. Auch die unterschiedlichen Ausgangskonzentrationen werden deutlich. Obwohl dieses Modell nur acht Parameter enthält, spiegeln die Modellkurven fast genau das Verhalten der Beobachtungen wieder.

11 3 ÜBERLEBENSRATEN UNTERSCHIEDLICHER KEIME 11 cfu 0 e00 2 e05 4 e05 6 e05 Entero Staphylo Ecoli Pseudo minutes Abbildung 4: Durch das Modell mwol angepasste cfu Werte gegen den Zeit.

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Lineare Modelle in R: Klassische lineare Regression

Lineare Modelle in R: Klassische lineare Regression Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

Eine Einführung in R: Das Lineare Modell

Eine Einführung in R: Das Lineare Modell Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber

Mehr

4 Binäre Regressionsmodelle, Folien 2

4 Binäre Regressionsmodelle, Folien 2 4 Binäre Regressionsmodelle, Folien 2 Ludwig Bothmann (basierend auf Unterlagen von Nora Fenske) Statistik III für Nebenfachstudierende WS 2014/2015 4.5 Hypothesentests Lineare Hypothesen Betrachtet werden

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

6. Statistische Schätzung von ARIMA Modellen

6. Statistische Schätzung von ARIMA Modellen 6. Statistische Schätzung von ARIMA Modellen Vorschau: ARIMA Modelle Modellidentifikation verschiedene Schätzverfahren Modelldiagnostik Fallstudien Zeitreihenanalyse 1 6.1 ARIMA Modelle Bisher: ARMA(p,q)-Modelle:

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Berechnung des LOG-RANK-Tests bei Überlebenskurven

Berechnung des LOG-RANK-Tests bei Überlebenskurven Statistik 1 Berechnung des LOG-RANK-Tests bei Überlebenskurven Hans-Dieter Spies inventiv Health Germany GmbH Brandenburger Weg 3 60437 Frankfurt hd.spies@t-online.de Zusammenfassung Mit Hilfe von Überlebenskurven

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Einführung in die Maximum Likelihood Methodik

Einführung in die Maximum Likelihood Methodik in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood

Mehr

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG

STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Tutorial: Regression Output von R

Tutorial: Regression Output von R Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen

Mehr

Ein- und Zweistichprobentests

Ein- und Zweistichprobentests (c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008 L. Fahrmeir, G. Walter Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 7. Februar 8 Hinweise:. Überprüfen

Mehr

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Mehrebenenanalyse Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Inhalt } Einführung } Fragestellung } Das Programm HLM } Mögliche Modelle } Nullmodell } Random

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Übungsaufgaben zu Statistik II

Übungsaufgaben zu Statistik II Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben

Mehr

8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme)

8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme) 8. Keine Normalverteilung der Störgrößen (Verletzung der B4-Annahme) Annahme B4: Die Störgrößen u i sind normalverteilt, d.h. u i N(0, σ 2 ) Beispiel: [I] Neoklassisches Solow-Wachstumsmodell Annahme einer

Mehr

Statistiken deuten und erstellen

Statistiken deuten und erstellen Statistiken deuten und erstellen Dipl. Ök. Jens K. Perret, M.Sc. Evgenija Yushkova, M.A. Schumpeter School of Business and Economics Bergische Universität Wuppertal Gaußstraße 20 42097 Wuppertal Inhalt

Mehr

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg

Übungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen

Mehr

Regressionsanalyse in R

Regressionsanalyse in R Regressionsanalyse in R Session 6 1 Einfache Regression Lineare Regression ist eines der nützlichsten Werkzeuge in der Statistik. Regressionsanalyse erlaubt es Zusammenhänge zwischen Parametern zu schätzen

Mehr

Zeit zum Kochen [in min] [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50,60[ [60, 100] Hi

Zeit zum Kochen [in min] [10, 20[ [20, 30[ [30, 40[ [40, 50[ [50,60[ [60, 100] Hi 1. Susi und Fritzi bereiten ein Faschingsfest vor, dazu gehört natürlich ein Faschingsmenü. Ideen haben sie genug, aber sie möchten nicht zu viel Zeit fürs Kochen aufwenden. In einer Zeitschrift fanden

Mehr

Lösungen zu den Übungsaufgaben in Kapitel 10

Lösungen zu den Übungsaufgaben in Kapitel 10 Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert

Mehr

Diagnose und Prognose: Kurzfassung 4

Diagnose und Prognose: Kurzfassung 4 Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Verbindung zwischen inhaltlicher Statistisches Konzept / Problemstellung Problemstellung und statistischem statistische Methode Konzept/Methode

Mehr

10. Übung (Korrelation und lineare Regressionsanalyse)

10. Übung (Korrelation und lineare Regressionsanalyse) 10. Übung (Korrelation und lineare Regressionsanalyse) Es wird untersucht, ob ein linearer Zusammenhang zwischen zwei Variablen besteht. Mit anderen Worten: ob ein solcher Zusammenhang gibt, wenn der beobachteter

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

Klausur Stochastik und Statistik 31. Juli 2012

Klausur Stochastik und Statistik 31. Juli 2012 Klausur Stochastik und Statistik 31. Juli 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf

Mehr

3. Das einfache lineare Regressionsmodell

3. Das einfache lineare Regressionsmodell 3. Das einfache lineare Regressionsmodell Ökonometrie: (I) Anwendung statistischer Methoden in der empirischen Forschung in den Wirtschaftswissenschaften Konfrontation ökonomischer Theorien mit Fakten

Mehr

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j 1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b

Mehr

Musterlösung zu Serie 14

Musterlösung zu Serie 14 Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen

Mehr

Einfache Varianzanalyse für unabhängige Stichproben

Einfache Varianzanalyse für unabhängige Stichproben Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,

Mehr

Anpassungstests VORGEHENSWEISE

Anpassungstests VORGEHENSWEISE Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel

Mehr

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest. Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Stochastische Eingangsprüfung, 17.05.2008

Stochastische Eingangsprüfung, 17.05.2008 Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)

Mehr

1 Gemischte Lineare Modelle

1 Gemischte Lineare Modelle 1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst

Mehr

Übung zur Vorlesung Statistik II SoSe Übungsblatt 7

Übung zur Vorlesung Statistik II SoSe Übungsblatt 7 Übung zur Vorlesung Statistik II SoSe 2014 Übungsblatt 7 2. Juni 2014 ufgabe 24 (4 Punkte): (1.5 Punkte) Berechnen Sie für die folgenden Wahrscheinlichkeiten die zugehörigen Odds: (a) 0.6 (b) 0.2 (c) 0.02

Mehr

K8 Stetige Zufallsvariablen Theorie und Praxis

K8 Stetige Zufallsvariablen Theorie und Praxis K8 Stetige Zufallsvariablen Theorie und Praxis 8.1 Theoretischer Hintergrund Wir haben (nicht abzählbare) Wahrscheinlichkeitsräume Meßbare Funktionen Zufallsvariablen Verteilungsfunktionen Dichten in R

Mehr

Statistik Einführung // Lineare Regression 9 p.2/72

Statistik Einführung // Lineare Regression 9 p.2/72 Statistik Einführung Lineare Regression Kapitel 9 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Ledold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Lineare Regression

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer

3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer 3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws11/r-kurs/

Mehr

Statistik, Geostatistik

Statistik, Geostatistik Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.

Mehr

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es

Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle

Mehr

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg PROGNOSE II - Vertiefung Aufgaben und Lösungen Sommersemester 2004 Aufgabe 1 U t bedeute weißes Rauschen und B den Backshift

Mehr

Einführung in die statistische Testtheorie II

Einführung in die statistische Testtheorie II 1 Seminar: Simulation und Bildanalyse mit Java Einführung in die statistische Testtheorie II Guntram Seitz Sommersemester 2004 1 WIEDERHOLUNG 2 1 Wiederholung Grundprinzip: Annahme: Beobachtungen bzw.

Mehr

Testen von Hypothesen

Testen von Hypothesen Elke Warmuth Humboldt-Universität zu Berlin Sommersemster 2010 1 / 46 2 / 46 1 Testen von Hypothesen 3 / 46 Signifikant, signifikant, signifikant,... 4 / 46 Signifikant, signifikant, signifikant,... 5

Mehr

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie! Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Hypothesentesten, Fehlerarten und Güte 2 Literatur Kreyszig: Statistische Methoden und ihre Anwendungen, 7.

Mehr

Graphische Verfahren in der Statistik: Q-Q- und P-P-Plots

Graphische Verfahren in der Statistik: Q-Q- und P-P-Plots Prof. Dr. Dietmar Pfeifer Institut für Mathemati Graphische Verfahren in der Statisti: Q-Q- und P-P-Plots Bei den üblichen parametrischen Testverfahren in der Statisti wird in der Regel eine Annahme über

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne

Mehr

Bivariate Analyseverfahren

Bivariate Analyseverfahren Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs

Mehr

4 Statistik der Extremwertverteilungen

4 Statistik der Extremwertverteilungen In diesem Kapitel beschäftigen wir uns mit statistischen Anwendungen der Extremwerttheorie. Wir werden zwei verschiedene Zugänge zur Modellierung von Extremwerten betrachten. Der erste Zugang basiert auf

Mehr

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen

Mehr

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Prof. Dr. Rainer Schwabe 08.07.2014 Otto-von-Guericke-Universität Magdeburg Institut für Mathematische Stochastik Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Name:, Vorname: Matr.-Nr.

Mehr

Lineare Regression II

Lineare Regression II Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen

Mehr

Kapitel VIII - Tests zum Niveau α

Kapitel VIII - Tests zum Niveau α Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Tests zum Niveau α Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh Testsituationen

Mehr

1 Dichte- und Verteilungsfunktion

1 Dichte- und Verteilungsfunktion Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen Yannick.Schroer@rub.de 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die

Mehr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2012/13. Aufgabe 1

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2012/13. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2012/13 Aufgabe 1 Die Firma

Mehr

Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen

Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen

Mehr

Anleitung: Standardabweichung

Anleitung: Standardabweichung Anleitung: Standardabweichung So kann man mit dem V200 Erwartungswert und Varianz bzw. Standardabweichung bei Binomialverteilungen für bestimmte Werte von n, aber für allgemeines p nach der allgemeinen

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen Prof Dr Rainer Dahlhaus Statistik 1 Wintersemester 2016/2017 Vorbereitung auf Übungsblatt (Präsenzübungen) - Lösungen Aufgabe P9 (Prognosen und Konfidenzellipsoide in der linearen Regression) Wir rekapitulieren

Mehr

Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops

Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops Auswertung: Irina Zamfirescu Auftraggeber: Mag. Klaus Brehm Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops Fragestellung: Wirkt sich

Mehr

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Datenanalyse mit Excel und Gretl

Datenanalyse mit Excel und Gretl Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen

Mehr

Statistik-Klausur vom

Statistik-Klausur vom Statistik-Klausur vom 27.09.2010 Bearbeitungszeit: 60 Minuten Aufgabe 1 Ein international tätiges Unternehmen mit mehreren Niederlassungen in Deutschland und dem übrigen Europa hat seine überfälligen Forderungen

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13

Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13 Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression Robin Ristl Wintersemester 2012/13 1 Exakter Test nach Fisher Alternative zum Chi-Quadrat Unabhängigkeitstest

Mehr

Grundlegende Eigenschaften von Punktschätzern

Grundlegende Eigenschaften von Punktschätzern Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur

Mehr

Auswahl von Schätzfunktionen

Auswahl von Schätzfunktionen Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung

Mehr

3.3 Methoden zur Evaluierung von Schätzern

3.3 Methoden zur Evaluierung von Schätzern 3.3 Methoden zur Evaluierung von Schätzern Bis jetzt haben wir nur glaubwürdige Techniken zur Konstruktion von Punktschätzern besprochen. Falls unterschiedliche Schätzer für einen Parameter resultieren,

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Die Varianz (Streuung) Definition

Die Varianz (Streuung) Definition Die (Streuung) Definition Diskrete Stetige Ang., die betrachteten e existieren. var(x) = E(X EX) 2 heißt der Zufallsvariable X. σ = Var(X) heißt Standardabweichung der X. Bez.: var(x), Var(X), varx, σ

Mehr

Kapitel 13. Grundbegriffe statistischer Tests

Kapitel 13. Grundbegriffe statistischer Tests Kapitel 13 Grundbegriffe statistischer Tests Oft hat man eine Vermutung über die Verteilung einer Zufallsvariablen X. Diese Vermutung formuliert man als Hypothese H 0.Sokönnte man daran interessiert sein

Mehr

1. Lösungen zu Kapitel 7

1. Lösungen zu Kapitel 7 1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.

Mehr