Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13

Größe: px
Ab Seite anzeigen:

Download "Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13"

Transkript

1 Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression Robin Ristl Wintersemester 2012/13 1

2 Exakter Test nach Fisher Alternative zum Chi-Quadrat Unabhängigkeitstest für 2x2 Tafeln. Benötigt nicht die Voraussetzung einer gewissen erwarteten Häufigkeit pro Zelle. Grundprinzip: Betrachte Vierfeldertafel, z.b. Behandlung A Behandlung B Summe Wirkung keine Wirkung Summe Als Teststatistik dient der Eintrag in der ersten Zelle. (Konvention, natürlich kann jede beliebige Zelle gewählt werden.) Wenn wir die Randsummen als gegeben annehmen, folgt die beobachtete Häufigkeit in der gewählten Zelle einer Hypergeometrischen Verteilung. 2

3 Hypergeometrische Verteilung m...zahl der Erfolge in der Gesamtpopulation, hier m=11 n...zahl der Versuche, hier n=13 (wir beziehen uns auf Behandlung A) k...zahl der Erfolge, hier k=8 N...Größe der Gesamtpopulation, hier N=19 Die Wahrscheinlichkeit genau unsere Zahl an Erfolgen in Behandlung A zu erhalten ist also 3

4 Kritische Grenzen und p-wert Wir sehen uns für jede Anzahl k von 0 bis n=13 die dazugehörende Wahrscheinlichkeit an, dass die Teststatistik unter der Nullhypothese genau diesen Wert annimmt, also P(T=k). Die Nullhypothese lautet kein Zusammenhang oder gleiche Anteile an Erfolgen in beiden Gruppen. Einen p-wert bei einer zweiseitigen Alternativhypothese kann man als Summe aller Wahrscheinlichkeiten erhalten, die kleiner oder gleich der Wahrscheinlichkeit sind, die zur Teststatistik gehört. Hier ist demnach der p-wert = 1. Kritische Grenzen, die den Annahmebereich der Nullhypothese abgrenzen lassen, sich so bestimmen, dass unter der Nullhypothese gilt: und Um H0 Kein Zusammenhang abzulehnen, müsste t>c o oder t<c u sein. Hier liegt t innerhalb der Grenzen (α=0,05). k P(T=k) α/ c u t c o α/

5 Maximum Likelihood Schätzung eines Anteilswertes Bsp: Wir fragen 10 zufällig ausgewählte Personen, ob sie Vegetarier sind. 2 antworten mit ja (x=1), 8 mit nein (x=0). Unsere Stichprobe ist also Wie hoch ist der wahre Anteil p an Vegetariern in der Grundgesamtheit, der dieses Ergebnis am wahrscheinlichsten macht? Das ist der Maximum-Likelihood Schätzer für den Anteilswert. Die Wahrscheinlichkeit, dass eine Person mit ja antwortet ist p. Die Wahrscheinlichkeit genau unsere Stichprobe zu erhalten ist daher die Likelihood oder etwas formaler, mit a= Anzahl der x=1 und b= Anzahl der x=0 Gesucht ist also der Wert für p, für den diese Likelihoodfunktion maximal wird! 5

6 Log-Likelihood Wir wollen für p maximieren. Leichter ist es oft, die Likelihoodfunktion zuerst zu logarithmieren. Das Maximum ändert sich dadurch nicht! (Weil logarithmieren eine monotone Transformation ist.) also Jetzt leiten wir die Log-Likelihood nach p ab und setzen die Ableitung gleich 0: Wenn wir diese Gleichung umformen erhalten wir und daraus Der Maximum-Likelihood Schätzer ist also ganz einfach der Anteil an x=1 in der Stichprobe 6

7 Odds Wir betrachten ein binäres Zufallsereignis Die Wahrscheinlichkeit, dass das Ereignis eintritt ist wieder die Gegenwahrscheinlichkeit ist Das Verhältnis aus Wahrscheinlichkeit und Gegenwahrscheinlichkeit nennen wir Odds: Beachte: p liegt immer im Intervall, die Odds liegen im Intervall, und natürlich je größer p, desto größer die Odds. 7

8 Odds Ratio Das Odds Ratio ist das Verhältnis der Odds aus zwei unterschiedlichen Gruppen. In der einen Gruppe tritt das Ereignis mit Wahrscheinlichkeit p 1 ein, in der anderen mit Wahrscheinlichkeit p 2. Sind p 1 und p 2 identisch ist OR=1 für p 1 > p 2 wird OR größer als 1, für p 1 < p 2 wird OR kleiner als 1. 8

9 Bsp: Betrachte folgende Vier-Felder Tafel in der beobachtete Häufigkeiten eingetragen sind: Diabetes Bluthochdruck ja nein ja 10 5 nein In der Gruppe mit Bluthochdruck schätzen wir den Anteil der Diabetiker aufgrund dieser Daten mit. Und in der anderen Gruppe Odds in der Gruppe mit Bluthochdruck: Oder einfacher direkt aus den Häufigkeiten: Also 9

10 Bsp. Fortsetzung Diabetes Bluthochdruck ja nein ja 10 5 nein Gruppe mit Bluthochdruck: Und für die Gruppe ohne Bluthochdruck: Das Odds-Ratio: Wir können daher vermuten, dass in der Gruppe mit Bluthochdruck ist das Risiko für Diabetes erhöht ist. 10

11 Bsp. Fortsetzung Also, und, Stichprobengröße:, Können wir testen, ob das Unterschiedlich Anteil an Diabetikern in den Gruppen Bluthochdruck ja und nein signifikant verschieden ist? Ja: Wir kennen bereits drei passende Methoden! 1) z-test für Differenz von zwei Anteilswerten (benutzt Normalverteilungsapproximation): Testet die Nullhypothese Die wahren Anteile sind in beiden Gruppen gleich., mit ( ist einfach der Gesamtanteil der Diabetiker, also eine Schätzung für den wahren Anteil, wenn beide Gruppen gleich sind.) Daher 11

12 Unter der Nullhypothese gilt. Daher p-wert (Anmerkung: Das Umkehren von in ist formal nicht ganz korrekt, bei einer stetigen Verteilung wie hier ändert sich das Ergebnis aber nicht.) ist die Verteilugnsfunktion der Standardnormalverteilung. Hier können wir den p-wert aus der Normalverteilungstabelle ablesen! Verteilungsfunktion der Standardnormalverteilung. Ф(z) = P(Z<=z) z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z) z Ф(z) Also p-wert (ohne Rundungen ) Wir sehen p-wert = 0,1236 > =0,05 daher können wir die Nullhypothese nicht verwerfen! Wir können also nicht sagen, dass die Unterschiede im Diabetikeranteil zwischen den Gruppen Bluthochdruck ja/nein signifikant sind! 12

13 2) Wir können auch einen Chi-Quadrat Unabhängigkeitstest ausführen (siehe Folien der vorigen Stunde). Die Nullhypothse ist hier Die Verteilung der Diabetiker ist in beiden Bluthochdruck Gruppen gleich. Die Teststatistik für diesen Test ist (Berechnung wie in den Folien der vorigen Stunde.) Diese Teststatistik folgt unter der Nullhypothese annähernd einer Chi-Quadrat Verteilung. Hier mit Freiheitsgrad. Dieser Test ist immer einseitig! Die Teststatistik gegen die Nullhpothese ist immer positiv und große Werte sprechen Der p-wert ist hier oder wobei eine mit 1 Freiheitsgrad Chi-Quadradat verteilte Zufallszahl ist und die entsprechende Verteilungsfunktion ist. Für die Chi-Quadrat Verteilung haben wir keine so umfassende Tabelle zur Verfügung, die Berechnung ist aber mit Hilfe eines Computerprogramms (hier R) kein Problem: p-wert = 0,1228 Also identisch mit dem Ergebnis des z-tests. Und diese Tests sind auch tatsächlich äquivalent! 13

14 3) Auch der exakte Test nach Fisher wäre hier anwendbar. Die Nullhypothese wird hier oft als Wahre Odds Ratio = 1 formulier, was natürlich gleichbedeutend mit den oben formulierten Hypothesen ist. Wir benutzen wieder R und erhalten den Output: Fisher's Exact Test for Count Data data: m p-value = alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: sample estimates: odds ratio Hier erhalten wir also p-wert= 0,2165. Also kein identisches Ergebnis wie oben, aber mit der selben Entscheidung. Der Unterschied im Anteil der Diabetiker ist nicht signifikant. 14

15 Logistische Regression Vielleicht wollen wir aber eine binäre Zielgröße nicht mit der Zugehörigkeit zu einer Gruppe erklären, sondern durch mehrere unabhängige Einflussgrößen! Dann können wir die logistische Regression benutzen. Ziel der logistischen Regression ist es, die Eintrittswahrscheinlichkeit für ein binäres Ereignis durch eine oder mehrere unabhängige Größen zu erklären. Die Modellgleichung lautet Der Ausdruck ist der Logarithmus der Odds, er wird oft mit log-odds oder logit bezeichnet. ist der Vektor der erklärenden Größen für Beobachtung i, ist der Vektor der Regressionskoeffizienten, also wie im linearen Regressionsmodell. 15

16 Link-Funktion Wir haben schon bemerkt: p liegt immer im Intervall. Die Linearkombination von erklärenden Variablen kann aber grundsätzlich beliebig große positive und negative Werte annehmen. Es wäre daher ungünstig, zu versuchen, p direkt durch eine Linearkombination von unabhängigen Größen zu erklären. Wir brauchen eine Funktion von p, die Werte im Intervall annehmen kann. Die Odds liegen im Intervall, das ist ein erster Schritt Die log-odds liegen im Intervall. Dies ist daher eine geeignete Link-Funktion! erhalten wir durch Umformen der Modellgelichung zu 16

17 Grafische Darstellung der Modellfunktion in einem Beispiel mit einer unabhängen Größe x. Die Punkte stellen die Beobachtungen dar, die Linie das Modell. Die Koeffizienten haben hier die Werte und 17

18 Beispiel: Wir wollen das Auftreten von Laktoseintoleranz durch Alter und Land erklären. Die Zielgröße wird am besten mit 0/1 kodiert: 0=nein, 1=ja Land ist eine kategorial Größe mit drei Stufen, Alter ist eine metrische Größe. Die Daten: i Laktoseintoleranz Land Alter 1 0 EU EU EU EU EU USA USA USA USA USA Jap Jap Jap Jap Jap 49 18

19 Wir wählen EU als Referenzgruppe für den Faktor Land und benutzen die Dummyvariablen USA und Japan: i Laktoseintoleranz (y) USA Japan Alter Unser Modell lautet also ist die Wahrscheinlichkeit für Individuum i, Laktoseintoleranz zu zeigen. 19

20 Maximum Likelihood Schätzung für Die Likelihood für Beobachtung i ist die Wahrscheinlichkeit, dass laut Modell das Ereigniss eintritt, das wir beobachtet haben. Also: Wenn Laktoseintoleranz gleich 1 ist ( Wenn Laktoseintoleranz gleich 0 ist ( ) und ist die Likelihood gleich ) und ist die Likelihood gleich Die Likelihood für die gesamte Stichprobe ist das Produkt der individuellen Likelihoods: bzw. log-likelihood: (Beachte: die Hochzahlen und sind entweder 0 oder 1, sie bestimmen also einfach, ob mit oder multipliziert wird.) 20

21 In die Log-Likelihood Gleichung setzen wir bzw. ein und erhalten Der Parametervektor soll jetzt so gewählt werden, dass die log-likelihood maximal wird! Dazu wird ein iterativer Algorithmus, das Newton-Raphson Verfahren, verwendet um den Vektor als Nullstelle der ersten Ableitung der log-likelihood zu finden Die Berechnung überlassen wir dem Computer und erhalten die Koeffizienten: (Intercept) LandUSA LandJap Alter β 0 = β 1 =1.682 β 2 =2.849 β 3 =

22 Interpretation der Regressionskoeffizienten Am einfachsten ist es, die Ergebnisse über Odds-Ratios zu interpretieren, denn für eine Änderung entsprechende Einflussgröße um 1. Unser Modell stellt ja den Zusammenhang dar daher Wie groß ist das Verhältnis der Odds für einen Japaner zu einem gleichaltrigen Euopäer? Alle Koeffizienten außer fallen weg! 22

23 Wir berechnen also: Das heißt wir schätzen aus dem Modell, dass die Odds für Laktoseintolerant in Japan 17,3 mal so hoch sind wie in Europa. Ebenso können das Odds-Ratio für einen Altersanstieg um 1 Jahr berechnen: Oder für einen Altersunterschied von 10 Jahren: Wie sieht es mit dem Odds Ratio für Japan gegen USA aus? Man muss also bei kategorialen Einflussgrößen die gewählte Kodierung beachten. 23

24 Verteilung der Maximum Likelihood Schätzer und Tests für die Koeffizienten Maximum Likelihood Schätzern folgen (zumindest asymptotisch) einer Normalverteilung mit dem wahren Parameter als Erwartungswert! Die Varianz-Kovarianzmatrix für die Maximum Likelihood Schätzer lässt sich als -1*Inverse der Matrix der zweiten Ableitungen der Log-Likelihood Funktion an der Stelle Jetzt haben wir alles, was wir brauchen um wie gewohnt Hypothesen der Form schätzen. zu testen. Hier ist es sogar einfacher als im linearen Regressionsmodell, weil wir direkt die Normalverteilung und nicht die t-verteilung benutzen. Also Teststatistik: H0 ablehnen wenn oder p-wert berechnen wie oben beim Test für Anteilswerte erklärt p-wert =, und H0 ablehnen, wenn. 24

25 Vollständiger Computer-Output für unser Modell Softwareprogramme führen alle diese Berechnungen standardmäßig aus: Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) LandUSA LandJap Alter Wir sehen: Alter hat keinen Einfluss auf das Auftreten von Laktoseintoleranz (p-wert=0,548). Der Koeffizient für USA ist nicht signifikant verschieden von 0, das heißt ein Unterschied zwischen USA und Europa ist nicht zu erkennen. Der Test für den Koeffizient von Japan ergibt einen p- Wert=0,082. Nicht klein genug, um bei einem Signifikanzniveau 0,05 einen Unterschied als signifikant anzugeben, aber unter Umständen ein Hinweis auf einen Zusammenhang. 25

26 Konfidenzintervalle für die Odds Ratios Durch die Normalverteilugnsapproximation ist es sehr leicht, Konfidenzintervalle für die Parameter und durch exponieren für die Odds Ratios zu erhalten. Konfidenzintervall für : Konfidenzintervall für OR: Zum Beispiel 95% Konfidenzintervall für 26

27 Likelihood-Ratio Test Wie testen wir, ob das Modell insgesamt oder eines bestimmer Faktor, wie hier Land, signifikante Erklärungskraft hat? Im linearen Regressionsmodell haben wir F-Tests benutzt. Bei der logistischen Regression steht uns der Likelihood-Ratio Test zur Verfügung. Dazu wird zuerst die log-likelihood des vollen Modells (Modell mit allen Einflussfaktoren) berechnet. Für unser Modell ist diese Dann wird ein Modell berechnet, in dem die Faktoren fehlen, deren Einfluss getestet werden soll, zum Beispiel Land, und man berechnet wieder die Log-Likelihood Hier wäre das Ergebnis Die Likelihood-Ratio Teststatistik lautet nun 27

28 Die Likelihood-Ratio Teststatistk folgt (asymptotisch) einer Chi-Quadrat Verteilung Die Zahl der Freiheitsgrade dieser Verteilung ist die Differenz der Zahl der Parameter im vollen und im reduzierten Modell. Hier sind das die Parameter die zum Faktor Land gehören, also und. Die verteilung hat also df=2 Freiheitsgrade. Die kritische Grenze ist das 95% Quantil dieser Verteilung bzw. p-wert = 0,144 bzw. Wir können also keinen signifikanten Einfluss des Faktors Land auf das Auftreten von Laktoseintoleranz finden. 28

29 Für eine Globalen Test berechnen wir ein Modell das nur den Intercept enthält. Die loglikelihood für diese Nullmodell ist Die Likelihood-Ratio Teststatisitk ist dann Die Nullhypothese ist Alle parameter außer dem Intercept sind 0. Die Verteilung unter der Nullhypothese ist die Chi-Quadratverteilung mit df=3 Freiheitsgraden. Das 95% Quantil dieser verteilung ist c=7.815, Wir können also keinen signifikanten Zusammenhang zwischen einem der Faktoren und der Zielgröße Laktoseintoleranz finden. 29

30 Achtung bei vollständiger Separation! i Laktoseintoleranz Land Alter 1 0 EU EU EU EU EU USA USA USA USA USA Jap Jap Jap Jap Jap 49 In diesem Datensatz haben zeigen alle Japaner Laktoseintoleranz. Wenn in einer Klasse nur identische Beobachtungen vorkommen sprechen wir von vollständiger Separation. (Auch wenn für eine metrische Größe im Datensatz in Bezug auf die abhängige Größe eindeutig unterteilt ist, z.b.: x= 1,2,3,4 und y = 0,0,1,1) 30

31 Vollständige Separation ist für die Berechnung des zu dieser Klasse gehörenden Regressionskoeffizienten ein Problem: Estimate Std. Error z value Pr(> z ) (Intercept) LandJap LandUSA Alter Aus den Daten würde hier der Anteil an Japanern mit Laktoseintoleranz auf p=1 geschätzt werden. Die Odds müssten dann gegen unendlich gehen. Der Algorithmus findet einen hohen Wert für den entsprechenden Parameter, aber mit einem extrem hohen Standardfehler! Merke: Extrem hoher Standardfehler weist auf Separation hin. Das Problem kann man durch zusammenlegen von Klassen umgangen werden. Wenn das nicht sinnvoll ist (wie hier) gibt es Berechnungsmethoden mit penalized maximum likelihood (Firth logistic Regression). 31

32 Zum Schluss... Was kommt heraus, wenn wir die logistische Regression auf unser Beispiel über den Zusammenhang von Diabetes und Bluthochdruck anwenden?: Estimate Std. Error z value Pr(> z ) (Intercept) ** Bluthochdr Wir erhalten einen p-wert der fast identisch ist mit dem p-wert aus dem Chi-Quadrat Test bzw. z- Test. Das Odds Ratio ist gleich wie oben: 32

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9. 7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe

Mehr

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel

Mehr

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios

Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen

Mehr

Musterlösung zu Serie 8

Musterlösung zu Serie 8 Prof. Dr. W. Stahel, Dr. J. Ernest Regression HS 2017 Musterlösung zu Serie 8 1. Im Data Frame http://stat.ethz.ch/teaching/datasets/wbl/umwelt.dat sind die Ergebnisse einer Umfrage zum Umweltschutz gegeben.

Mehr

Vorlesung Wirtschaftsstatistik 2 (FK ) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren. Dipl.-Ing.

Vorlesung Wirtschaftsstatistik 2 (FK ) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren. Dipl.-Ing. Vorlesung Wirtschaftsstatistik 2 (FK 040637) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Vorlesungsinhalte Wiederholung:

Mehr

Prüfung aus Statistik 2 für SoziologInnen

Prüfung aus Statistik 2 für SoziologInnen Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.

Mehr

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test) Hypothesen Tests Fragestellungen stab.glu 82 97 92 93 90 94 92 75 87 89 hdl 56 24 37 12 28 69 41 44 49 40 ratio 3.60 6.90 6.20 6.50 8.90 3.60 4.80 5.20 3.60 6.60 glyhb 4.31 4.44 4.64 4.63 7.72 4.81 4.84

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen Proportions-Tests Proportions Tests Proportions Test können in zwei Fällen benutzt werden Vergleich von beobachteten vs. erwarteten Proportionen Test der Unabhängigkeit von 2 Faktoren kann auch zum Vergleich

Mehr

Logistische Regression

Logistische Regression Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum

Mehr

Tutorial: Anpassungstest

Tutorial: Anpassungstest Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen

Verallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X

Mehr

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***

Lean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 *** Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

Auswertung und Lösung

Auswertung und Lösung Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden

Mehr

Tutorial:Unabhängigkeitstest

Tutorial:Unabhängigkeitstest Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung

Mehr

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................

Mehr

D-CHAB Frühlingssemester 2017 T =

D-CHAB Frühlingssemester 2017 T = D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme

Mehr

Statistik II. Statistische Tests. Statistik II

Statistik II. Statistische Tests. Statistik II Statistik II Statistische Tests Statistik II - 5.5.2006 1 Ausgangslage Wir können Schätzen (z.b. den Erwartungswert) Wir können abschätzen, wie zuverlässig unsere Schätzungen sind: In welchem Intervall

Mehr

Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13

Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression. Dipl.-Ing. Robin Ristl Wintersemester 2012/13 Vorlesung Wirtschaftsstatistik 2 (FK 040637) Multiple lineare Regression Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Grundidee: Eine abhängige Variable soll als Linearkombination mehrerer unabhängiger

Mehr

Tutorial: χ 2 -Test auf vorgegebene Verteilung

Tutorial: χ 2 -Test auf vorgegebene Verteilung Tutorial: χ 2 -Test auf vorgegebene Verteilung Das Management eines Kaufhauses will durch eine Werbekampagne eine Verjüngung der Kundschaft erreichen. Bisher war die Verteilung (in %) auf Altersschichten

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte

Mehr

Bachelorprüfung: Statistik (1 Stunde)

Bachelorprüfung: Statistik (1 Stunde) Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!

Mehr

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte) Aufgabe 3 (9 + 5 + 7 + 7 + 3 + 9 + 7 + 10 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Zu Beginn der Studienjahre 2011 und 2012 wurden Studienanfänger an

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler 20. Mai 2010 Inhaltsverzeichnis

Mehr

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Wichtige Definitionen und Aussagen

Wichtige Definitionen und Aussagen Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Tutorial: Vergleich von Anteilen

Tutorial: Vergleich von Anteilen Tutorial: Vergleich von Anteilen Die Sicherung des Pensionssystems ist in vielen Ländern ein heikles Thema. Noch stärker als der Streit, wer wann welche Pension beziehen können soll, tobt ein Streit, welche

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test

Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =

Mehr

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)

Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) 3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie

Mehr

Prognoseintervalle für y 0 gegeben x 0

Prognoseintervalle für y 0 gegeben x 0 10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

1. Grundbegri e der Stochastik

1. Grundbegri e der Stochastik Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt

Mehr

Musterlösung. Kind Blume (beredet) Blume (nicht beredet)

Musterlösung. Kind Blume (beredet) Blume (nicht beredet) Prüfung Statistik Sommer 2012 Musterlösung 1. (9 Punkte) F. Lauer möchte das Gerücht überprüfen, dass Blumen schneller wachsen, wenn man mit ihnen redet. Daher kauft sie acht identische Blumenzwiebeln,

Mehr

Schriftliche Prüfung (1 Stunde)

Schriftliche Prüfung (1 Stunde) Prüfung Statistik Herbstsemester 2011 Schriftliche Prüfung (1 Stunde) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten! Lesen Sie zuerst

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

VO Biostatistik im WS 2006/2007

VO Biostatistik im WS 2006/2007 VO Biostatistik im WS 2006/2007 1 Beispiel 1: Herzerkrankungsdaten aus Framingham für skoeffizienten : Leukemie-Daten 2 Beispiel 1: Herzerkrankungsdaten aus Framingham Stichprobe: 1329 männliche Bewohner

Mehr

Biostatistik 101 Korrelation - Regressionsanalysen

Biostatistik 101 Korrelation - Regressionsanalysen Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander

Mehr

Statistischer Rückschluss und Testen von Hypothesen

Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall

Mehr

Beispiel: Multiples Modell/Omitted Variable Bias I

Beispiel: Multiples Modell/Omitted Variable Bias I 4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss

Mehr

DWT 314/460 csusanne Albers

DWT 314/460 csusanne Albers 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schatzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schatzvariablen fur Parameter von Verteilungen. Sei ~X = (X 1 ; : : : ; X n ):

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Statistik II für Betriebswirte Vorlesung 11

Statistik II für Betriebswirte Vorlesung 11 Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 08. Januar 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben

Prüfung im Fach Mikroökonometrie im Sommersemester 2014 Aufgaben Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Mikroökonometrie im Sommersemester 014 Aufgaben Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Mehr

Beipiele zum Üben und Wiederholen Wirtschaftsstatistik 2 (Kurs 3) Lösungen

Beipiele zum Üben und Wiederholen Wirtschaftsstatistik 2 (Kurs 3) Lösungen Beipiele zum Üben und Wiederholen Wirtschaftsstatistik 2 (Kurs 3) Lösungen 1.1 (Das Beispiel 1.1 entspricht dem Beispiel 7.1 aus dem Buch Brannath/Futschik/Krall) a) Streudiagramm mit Regressionsgerade.

Mehr

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test

Biostatistik, WS 2017/18 Der zwei-stichproben-t-test 1/28 Biostatistik, WS 2017/18 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 15.12.2017 und 22.12.2017 2/28 Inhalt

Mehr

Fortgeschrittene Ökonometrie: Maximum Likelihood

Fortgeschrittene Ökonometrie: Maximum Likelihood Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Musterlösung. Modulklausur Multivariate Verfahren

Musterlösung. Modulklausur Multivariate Verfahren Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn

Mehr

Logistische Regression

Logistische Regression Logistische Regression 13.11.2017 Motivation Regressionsrechnung: Untersuchung des Zusammenhangs zwischen einer (oder mehreren) Zielvariablen und einer oder mehreren erklärenden Variablen. Bisher gesehen:

Mehr

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests. 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:

Mehr

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (90 Minuten) Dr. M. Kalisch Prüfung Statistik I Winter 2016 Schriftliche Prüfung (90 Minuten) Bemerkungen: Erlaubte Hilfsmittel: 10 hand- oder maschinengeschriebene A4 Seiten (=5 Blätter). Taschenrechner ohne Kommunikationsmöglichkeit.

Mehr

Tests einzelner linearer Hypothesen I

Tests einzelner linearer Hypothesen I 4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.

Mehr

Bereiche der Statistik

Bereiche der Statistik Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden

Mehr

Statistik I für Betriebswirte Vorlesung 14

Statistik I für Betriebswirte Vorlesung 14 Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli

Mehr

Statistik für Ingenieure Vorlesung 13

Statistik für Ingenieure Vorlesung 13 Statistik für Ingenieure Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6. Februar 2018 5.1.4. Weitere ausgewählte statistische Tests a) Binomialtest Der Binomialtest

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven

Mehr

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min Klausur, Analyse mehrdimensionaler Daten, WS 2010/2011, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 21.02.2011 Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte,

Mehr

2.5 Lineare Regressionsmodelle

2.5 Lineare Regressionsmodelle 2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]

Mehr

Kategorielle Daten. Seminar für Statistik Markus Kalisch

Kategorielle Daten. Seminar für Statistik Markus Kalisch Kategorielle Daten Markus Kalisch 1 Phase 3 Studie: Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Grundfrage: Sind Heilung und Medikamentengabe unabhängig?

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 PD Dr. Thomas Friedl Klinik für Frauenheilkunde und Geburtshilfe, Universitätsklinikum Ulm München, 23.11.2012 Inhaltsübersicht Allgemeine

Mehr

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X. Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im

Mehr

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung

Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter 2014 Musterlösung 1. (11 Punkte) a) Für welchen Parameter ist X ein geeigneter Schätzer? X ist ein geeigneter Schätzer für den Erwartungswert µ

Mehr

Inferenz im multiplen Regressionsmodell

Inferenz im multiplen Regressionsmodell 1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall

Mehr

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests

Teil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests Woche 8: Hypothesentests für eine Stichprobe Teil X Patric Müller Hypothesentests für eine Stichprobe ETHZ WBL 17/19, 19.06.2017 Wahrscheinlichkeit und Statistik Patric

Mehr

T-Test für unabhängige Stichproben

T-Test für unabhängige Stichproben T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa

Mehr

Übung zur Vorlesung Statistik I WS Übungsblatt 9

Übung zur Vorlesung Statistik I WS Übungsblatt 9 Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 9 17. Dezember 2012 Aufgabe 26 (4 Punkte): In einer Studie mit n = 10 Patienten soll die Wirksamkeit eines Medikaments gegen Bluthochdruck geprüft

Mehr

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers 4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis

Mehr

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen.

Masterprüfung. Die Klausur besteht aus 3 Aufgaben, die alle bearbeitet werden müssen. Fach: Prüfer: Mikroökonometrie Prof. Regina T. Riphahn, Ph.D. Masterprüfung Vorbemerkungen: Bearbeitungszeit: 60 Minuten. Anzahl der Aufgaben: Bewertung: Erlaubte Hilfsmittel: Wichtige Hinweise: Die Klausur

Mehr

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)

Aufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte) Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf

Mehr

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test

Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test 1/22 Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 20.12.2013 Motivation 4/22 Bei (ungefähr) glockenförmigen und symmetrisch

Mehr