BSc Bioinformatik Wintersemester 2013/2014 Klausur zur Statistik I Freie Universität Berlin

Ähnliche Dokumente
BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin

Übung zur Vorlesung Statistik I WS Übungsblatt 12

Wahrscheinlichkeit und Statistik BSc D-INFK

Wahrscheinlichkeit und Statistik: Zusammenfassung

Übung zur Vorlesung Statistik I WS Übungsblatt 9

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Statistik und Wahrscheinlichkeitsrechnung

Fit for Abi & Study Stochastik

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Mathematik 3 für Informatik

Übungsscheinklausur,

Mathematik für Biologen

Probeklausur zu Mathematik 3 für Informatik Lösungshinweise (ohne Garantie auf Fehlefreiheit)

5. Spezielle stetige Verteilungen

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

2 Aufgaben aus [Teschl, Band 2]

Übung zur Vorlesung Statistik I für Biowissenschaften WS Übungsblatt 3

Übung zur Vorlesung Statistik I für Biowissenschaften WS Übungsblatt 7

Wahrscheinlichkeitsverteilungen

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Statistisches Testen

Kapitel 3 Schließende Statistik

Wichtige Definitionen und Aussagen

Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008

5. Seminar Statistik

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Anhang: Statistische Tafeln und Funktionen

Willkommen zur Vorlesung Statistik (Master)

Biomathematik für Mediziner

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Klassifikation von Signifikanztests

Vorlesung 4b. Die Varianz

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Statistische Tests (Signifikanztests)

Musterlösung. Modulklausur Multivariate Verfahren

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Bereiche der Statistik

Klausur zur Vorlesung

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Willkommen zur Vorlesung Statistik (Master)

Statistische Tests für unbekannte Parameter

Mathematik für Biologen

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Stichproben Parameterschätzung Konfidenzintervalle:

1 Dichte- und Verteilungsfunktion

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Klausur vom

Klausur zur Vorlesung

Biomathematik für Mediziner, Klausur WS 2003/2004 Seite 1

Zufallsgröße X : Ω R X : ω Anzahl der geworfenen K`s

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

1 Stochastische Konvergenz 2

Statistik I für Betriebswirte Vorlesung 14

Mathematik für Biologen

Grundgesamtheit, Merkmale, Stichprobe. Eigenschaften der Stichprobe. Klasseneinteilung, Histogramm. Arithmetisches Mittel, empirische Varianz

KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008

Mathematik für Biologen

Statistik II für Betriebswirte Vorlesung 1

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Schriftliche Prüfung (90 Minuten)

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Klausur zu Statistik II

4.4 Punktschätzung. E(X 1 )+ +E(X n ) Var(ˆµ) = 1 n 2 ( Var(X1 )+ +Var(X n ) ) = 1 n 2nσ2 = σ2

Biostatistik, Winter 2011/12

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002

Vorlesung 4b. Die Varianz

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Abbildung 1: Dieses Quiz soll Ihnen helfen, die Residuenplots besser zu verstehen. Am Schluss kommen noch vermischte Aufgaben zur Wiederholung.

7.2 Mittelwert einer Stichprobe

Mathematische Statistik Aufgaben zum Üben. Schätzer

Test auf den Erwartungswert

Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion

Zufallsvariable: Verteilungen & Kennzahlen

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Übung zur Vorlesung Statistik I für Biowissenschaften WS Übungsblatt 4

Klausur zu Statistik II

Kapitel 3 Schließende Statistik

Statistische Methoden in den Umweltwissenschaften

Lösungen zu den Übungsaufgaben in Kapitel 10

Aufgabe Punkte

Mathematik für Biologen

Klausur Stochastik und Statistik 31. Juli 2012

Einführung in Quantitative Methoden

Stetige Verteilungen Rechteckverteilung

Chi-Quadrat-Verteilung

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Grundlagen der Statistik

Statistische Methoden in den Umweltwissenschaften

3 Grundlagen statistischer Tests (Kap. 8 IS)

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Jost Reinecke. 7. Juni 2005

Fallzahlplanung bei unabhängigen Stichproben

4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

1.5 Erwartungswert und Varianz

Schließende Statistik

Transkript:

Sc ioinformatik Wintersemester 013/014 Klausur zur Statistik I Freie Universität erlin 1. Februar 014 Matrikelnummer Nachname Vorname Unterschrift ufgabe 1 (4 Punkte): Eine faire Münze werde 10 mal unabhängig voneinander geworfen. Wie groß ist die Wahrscheinlichkeit, genau zweimal Kopf zu werfen? Wie groß ist die Wahrscheinlichkeit, dass der erste, der neunte und der zehnte Wurf Kopf zeigen und unter den restlichen sieben Würfen genau einmal Kopf geworfen wird? Man kann direkt die Formel für die inomialverteilung anwenden. Hier ist k =, n = 10 und p = 1. ( 10 ) ( 1 ) ( ) 8 1 = ( 10 ) ( 1 ) 10 = 9 10 1 104 = 45 104 Die Wahrscheinlichkeit, dass der erste, der neunte und der zehnte Wurf Kopf sind, beträgt 1 3 = 1. Die Wahrscheinlichkeit, dass unter den restlichen sieben Würfen genau einmal Kopf geworfen wird, kann wieder mit 8 der inomialformel mit k = 1, n = 7 und p = 1 ausgerechnet werden. Da die Würfe unabhängig sind, ergibt sich insgesamt: ( ) 3 ( ) ( 1 7 1 1 ) 7 = 7 1 ( ) 10 1 = 7 104

ufgabe (4 Punkte): Ein Insekt bewegt sich auf einer Linie in jeder Sekunde entweder 1mm nach rechts oder 1mm nach links. Die ewegung nach rechts erfolgt mit Wahrscheinlichkeit 1, die nach links mit Wahrscheinlichkeit 4 3. 4 Geben Sie die Wahrscheinlichkeit P n an, dass sich das Insekt nach n Sekunden wieder am usgangspunkt befindet. Geben Sie P 4 explizit an. Um nach n Sekunden wieder am usgangspunkt anzulangen, muss das Insekt genauso viele Schritte nach rechts wie nach links machen. Die Reihenfolge spielt keine Rolle. Zunächst ist klar, dass nach einer ungeraden nzahl von Sekunden das Insekt unmöglich wieder am usgangspunkt sein kann, die Wahrscheinlichkeit also 0 ist. Ist n gerade, kann die Wahrscheinlichkeit mit Hilfe der inomialformel mit k = n und p = 1 4 ausgerechnet werden. { 0 für n ungerade P n = ( n ( 1 ) n n/) 4 ( 3 4 ) n = ( ) n n 3 für n gerade n/ n enutze die eben hergeleitete Formel für n = 4: P 4 = 4! 9!! 56 = 7 18 ufgabe 3 (4 Punkte): Erwartungswert und Standardabweichung (=Quadratwurzel aus der Varianz) einer inomialverteilung (n, p) seien gleich. Drücken Sie p durch n aus. egründen Sie Ihre ntwort durch Herleitung des Ergebnisses. Standardabweichung und Erwartungswert der inomialverteilung (n, p) betragen np(1 p) bzw. np. Setzt man beide Größen gleich, ergibt sich die estimmungsgleichung für p: np(1 p) = np Nach Quadrieren dieser Gleichung kann p ausgerechnet werden: np(1 p) = n p (1 p) = np 1 = (n + 1)p p = 1 n + 1. ufgabe 4 (4 Punkte): Seien Ω = {1,, 3, 4} ein Laplaceraum und = {1,, 3} ein Ereignis von Ω.

Welche Wahrscheinlichkeit hat? Geben Sie Ereignisse 1,, 3 und 4 an, so dass (a) P( 1 ) = /3 (b) P( ) = 1/ (c) P( 3 ) = 1 (d) P( 4 ) = 0 gelten. Da Ω ein Laplaceraum ist, haben alle Elemente die gleiche Wahrscheinlichkeit. Die Wahrscheinlichkeit von ist daher die nzahl der Elemente von geteilt durch die nzahl der Elemente in Ω: P() = 3/4 us der Definition P( ) = P( ) P() (a) Es gilt erhält man durch Probieren: 1 = {, 3, 4} (b) = {3, 4} Es gilt P( 1 ) = P( 1) P( 1 ) = P({, 3}) P({, 3, 4}) = 4 = 3. 3 4 P( ) = P( ) P( ) = P({3}) 1 P({3, 4}) = 4 = 1. 4 (c) 3 = {1,, 3} Es gilt P( 3 ) = P( 3) P( 3 ) = P({1,, 3}) P({1,, 3}) = 1. (d) 4 = {4} Es gilt P( 4 ) = P( 4) P( 4 ) = P( ) P({4}) = 0, da P( ) = 0 gilt. Die angegeben Lösungen sind nicht die einzigen möglichen Lösungen! 3

ufgabe 5 (4 Punkte): Sei X eine poissonverteilte Zufallsvariable mit Erwartungswert λ. C Geben Sie die Wahrscheinlichkeit für P(1 X ) an. Geben Sie die bedingte Wahrscheinlichkeit P(1 X X > 0) an. Gegen welche Grenzwerte streben (a) P(1 X ) (b) P(1 X X > 0), wenn λ gegen Null geht? eachten Sie e λ 1+λ für betragsmäßig kleine λ. Da X nur ganzzahlige Werte annehmen kann ist P(1 X ) = P(X = 1) + P(X = ). Damit folgt direkt aus der Formel für die Poissonverteilung P(1 X ) = (λ + λ /)e λ. Mit der Definition der bedingten Wahrscheinlichkeit gilt P(1 X X > 0) = P(1 X und X > 0) P(X > 0) = P(X = 1) + P(X = ) 1 P(X = 0) eachte P(1 X und X > 0) = P(1 X ), da X > 0 aus 1 X folgt. Mit der Formel für die Poissonverteilung folgt weiter P(1 X X > 0) = (λ + λ /)e λ 1 e λ. Es wurde P(X > 0) = 1 P(X = 0) benutzt. C (a) (b) lim (λ + λ 0 λ /)e λ = 0, da e λ gegen 1 und λ + λ / gegen 0 strebt. (λ + λ /)e λ (λ + λ /)e λ lim = lim λ 0 1 e λ λ 0 1 1 + λ da der erste und zweite Faktor gegen 1 streben. = lim λ 0 [(1 + λ/) e λ ] = 1, ufgabe 6 (4 Punkte): Ein Gen komme in einer Population mit nur zwei llelen a und vor. Die Häufigkeit des llels in der Gesamtpopulation sei P() = p. Die Population soll sich im Hardy-Weinberg Gleichgewicht befinden. 4

Geben Sie die Wahrscheinlichkeiten für die Genotypen, aa und a an. Man nehme nun weiter an, dass das llel a rezessiv eine schwere Erbkrankheit verursacht. Wie groß ist die Wahrscheinlichkeit, vom Genotyp zu sein, wenn man nicht an dieser Erbkrankheit leidet? P() = p P(aa) = (1 p) P(a) = p(1 p) Gefragt ist nach der bedingten Wahrscheinlichkeit P( aa C ) = P( a oder ). Damit ergibt sich P( a oder ) = = P( und (a oder )) = P(a oder ) p p(1 p) + p = p p. P() P(a) + P() ufgabe 7 (4 Punkte): Für eine Zufallsvariable X sei Z = X 3. 5 Es sei bekannt, dass E(Z) = 5 und Var(Z) = 9 gelte. Geben Sie Erwartungswert und Varianz von X an. Geben Sie die standardisierte Zufallsvariable zu X an. us folgt ( ) X 3 5 = E(Z) = E 5 E(X) = 8. = 1 (E(X) 3) 5 Für die Varianz gilt ( ) X 3 9 = Var(Z) = Var = 1 5 5 Var(X) und damit Var(X) = 9 5 = 5. Es wurden E(X + a) = E(X) + a und Var(X + a) = Var(X) benutzt. 5

Die Standardisierte zu X ist X E(X) = X 8. Var(X) 15 ufgabe 8 (4 Punkte): Sei X eine Zufallsvariable, deren Verteilungsfunktion folgenden Graph hat: Verteilungsfunktion 0.0 0. 0.4 0.6 0.8 1.0 0 1 3 4 5 X Geben Sie P(X = r) für eine beliebige reelle Zahl r an. Die kumulierte Verteilungsfunktion F (r) ist durch F (r) := P(X r) definiert. ei r = 1,, 3, 4 macht sie einen Sprung um 1/4. Damit gilt { 1/4 für r = 1,, 3, 4 P(X = r) = 0 sonst. ufgabe 9 (6 Punkte): Die Qualität eines diagnostischen Tests in der Medizin wird durch spezielle Größen charakterisiert. Definieren Sie die egriffe (a) Sensitivität 6

(b) Spezifität (c) Prävalenz (d) positiver prädiktiver Wert und (e) negativer prädiktiver Wert. Ein diagnostischer Test habe eine Sensitivität von 80% und eine Spezifität von 90%. (a) Wie groß muss die Prävalenz mindestens sein, damit der positive prädiktive Wert mindestens 90% beträgt? (b) Wie groß darf die Prävalenz höchstens sein, damit der negative prädiktive Wert mindestens 90% beträgt? Hinweis: Geben Sie die Ergebnisse als gekürzte rüche an. Definitionen: (a) Sensitivität: Wahrscheinlichkeit positiv getestet zu werden, wenn man krank ist. (b) Spezifität: Wahrscheinlichkeit negativ getestet zu werden, wenn man gesund ist. (c) Prävalenz: Wahrscheinlichkeit krank zu sein. (d) Positiver prädiktiver Wert: Wahrscheinlichkeit krank zu sein, wenn man positiv getestet wurde. (e) Negativer prädiktiver Wert: Wahrscheinlichkeit gesund zu sein, wenn man negativ getestet wurde. (a) Sei P die Prävalenz der Erkrankung. Der positive prädiktive Wert (PPW) hängt über die ayessche Formel von Sensitivität, Spezifität und Prävalenz folgendermaßen ab: PPW = P 0.8 P 0.8 + (1 P ) 0.1 0.9 P 0.8 P 0.7 + 0.09 P 0.09 P 9 17 (b) Entsprechend gilt für den negativen prädiktiven Wert (NPW): NPW = (1 P ) 0.9 (1 P ) 0.9 + P 0. 0.9 (1 P ) 0.9 (1 P ) 0.81 + P 0.18 P 0.7 0.09 P 1 3 7

ufgabe 10 (4 Punkte): In einer klinischen Studie werden Patienten zufällig zwei Studiengruppen (Placebo- und Medikamentengruppe) zugeordnet. C D Für jeden Patienten wird nur Erfolg bzw. kein Erfolg betrachtet. Mit welchem Test können die Erfolgsraten in beiden Gruppen verglichen werden? ei Studienbeginn wird bei jedem Patienten der diastolische lutdruck gemessen. In beiden Gruppen erscheinen die Messwerte normalverteilt. Mit welchem Test können die beiden Gruppen bezüglich des diastolischen lutdrucks verglichen werden? Nach zwei Wochen wird bei jedem Patienten wieder der lutdruck gemessen. Mit welchem Test kann geprüft werden, ob es eine signifikante Veränderung in der Medikamentengruppe zwischen der Messung bei Studienbeginn und der nach zwei Wochen gegeben hat. Die Differenzen der beiden Messungen erscheinen nicht normalverteilt. Mit welchem statistischen Test können die beiden Gruppen bezüglich des lutdrucks, der zwei Wochen nach Studienbeginn gemessen wurde, verglichen werden. C D Es sollen die Erfolgsraten (Prozentsätze) in beiden Studienarmen verglichen werden. Dazu verwendet man den χ -Test. t-test für unabhängige Stichproben. Vorzeichentest oder Wilcoxon-Vorzeichenrangtest. Mann-Whitney-U Test, da Daten wohl nicht normalverteilt. ufgabe 11 (4 Punkte): Seien S 1 und S zwei unabhängige Stichproben aus einer normalverteilten Population mit Erwartungswert µ und Varianz σ. eide Stichproben haben das gleiche arithmetische Mittel. Der Stichprobenumfang von S sei aber viermal so groß wie der von S 1. Der zweiseitige Einstichproben Z-Test (H 0 : µ = 0) ergebe für S 1 einen P-Wert von P = 0.4. Ist der zweiseitige Einstichproben Z-Test (H 0 : µ = 0) für S signifikant auf dem Niveau 10%? enutzen Sie folgende R usgabe und begründen Sie Ihre ntwort. > qnorm(c(0.8, 0.85, 0.9, 0.95)) [1] 0.84161 1.0364334 1.815516 1.6448536 Für ein Signifikanzniveau α wird die Grenze des rechten Teils des blehnungsbereichs durch Φ 1 (1 α ) berechnet. Φ bezeichnet die (kumulative) Verteilungsfunktion der Standardnormalverteilung und Φ 1 ihre Umkehrfunktion. In R sind diese Funktionen in pnorm bzw. qnorm implementiert. In der R 8

usgabe werden daher die Grenzen des rechten Teils der blehnungsbereiche für die Signifikanzniveaus α = 0.4, 0.3, 0. und 0.1 berechnet. Da der P-Wert das kleinste Signifikanzniveau ist, auf dem der Test gerade noch signifikant ist, muss die Statistik Z 1 des Z-Tests für S 1 auf dem Rand des blehnungsbereichs für α = 0.4 liegen. Damit folgt Z 1 = 0.84161. Da S den gleichen Mittelwert wie S 1 hat und beide Stichproben aus einer Population mit bekannter Varianz σ stammen, ist der Wert der Z-Statistik Z für S doppelt so groß wie der für S 1 (die Fallzahl n geht als Faktor n in die erechnung der Statistik ein!). Wegen 0.84161 > 1.6448536 liegt deshalb Z im blehnungsbereich für α = 0.1 und die Nullhypothese kann auf dem 10% Niveau abgelehnt werden. ufgabe 1 (4 Punkte): Sei S = (1, 3) eine Stichprobe (n = ) aus einer normalverteilten Population. erechnen Sie die Statistik T des Einstichproben t-tests für die Nullhypothese H 0 : µ = 5. Welcher R efehl berechnet den zweiseitigen P-Wert? Mehrere oder auch keine ntwort können richtig sein. (a) *pt(t, df=1) (b) *pt(t, df=) (c) *pt(-abs(t), df=1) (d) *pt(-t, df=1) (e) *pt(-t, df=) Zunächst berechnet man Mittelwert und die empirische Varianz der Stichprobe: ˆµ = 1 (1 + 3) = 1 ˆσ = 1 ((1 ) + (3 ) ) = Setz man diese Größen in die Formel für den Einstichprroben t-test ein, erhält man: T = 5 = 3 Da n = ist, ist T unter Nullhypothese t-verteilt mit einem Freiheitsgrad. Man erhält den zweiseitige P-Wert durch den R usdruck in (c). Da T < 0 ist, kommt bei (a) das Gleiche wie bei (c) heraus. Die anderen Möglichkeiten benutzen entweder die falsche nzahl von Freiheitsgraden ((b) und (e)) oder werten die Verteilungsfunktion bei 3 statt bei -3 aus ((d)). Somit sind genau (a) und (c) richtig. 9

Wahrscheinlichkeitsdichte der t Verteilung mit einem Freiheitsgrad 0.00 0.05 0.10 0.15 0.0 0.5 0.30 6 4 0 4 6 ufgabe 13 (4 Punkte): Mit dem Mann-Whitney-U Test werden zwei unabhängige Stichproben S 1 = (X 1,..., X n ) und S = (Y 1,..., Y m ) verglichen. Die Werte in beiden Stichproben seien positiv. Der P-Wert betrage P = 0.651. Nun werden beide Stichproben logarithmiert und anschließend wieder mit dem Mann-Whitney-U Test verglichen. Der P-Wert dieses Tests sei P. Was kann über den P-Wert P ausgesagt werden? Mehrere ntworten können richtig sein. (a) P < P (b) P > P (c) P = P (d) P 0.5 (e) Es ist keine allgemeine ussage möglich. Geben Sie eine kurze egründung Ihrer Wahl. c ist richtig. Der Logarithmus ist eine streng monoton steigende Funktion. Logarithmieren hat deshalb auf die Ränge keinen Einfluss. Da in die Statistik des Mann-Whitney-U Tests nur die Ränge eingehen, ändert sich am Wert der Statistik, und damit auch am P-Wert, nichts. 10

ufgabe 14 (4 Punkte): Sei S = (1, 1,.4, 5, 0, 6) eine Stichprobe aus einer normalverteilten Population. Welche der Werte 1.1, 6.7, 14 und -14 liegen innerhalb, welche außerhalb des zweiseitigen 90%, 95% oder 99% Konfidenzintervalls? Markieren Sie das entsprechende Feld in folgender Tabelle mit i für innerhalb und a für außerhalb: 1.1 6.7 14-14 90% 95% 99% Lösen Sie die ufgabe mit Hilfe folgender R- usgabe: > S <- c(1, 1,.4,-5, 0,6) > mean(s) [1] 0.9 > t.test(s,mu=1.1)$p.value [1] 0.8963481 > t.test(s,mu=6.7)$p.value [1] 0.0105985 > t.test(s,mu=14)$p.value [1] 0.000869 90% 95% 99% 1.1 i i i 6.7 a a i 14 a a a -14 a a a Eine reelle Zahl µ 0 liegt genau dann im zweiseitigen (1 α)100% Konfidenzintervall, wenn die Nullhypothese H 0 : µ = µ 0 des Einstichproben t-tests auf dem Niveau α nicht abgelehnt werden kann. Da der P-Wert des Einstichproben t-tests für µ 0 = 1.1 mit P = 0.8963481 größer als α = 0.1, 0.05, 0.01 ist, kann 11

H 0 : µ = 1.1 auf allen drei Signifikanzniveaus nicht abgelehnt werden. 1.1 ist daher in allen drei Konfidenzintervallen enthalten. Für µ 0 = 6.7 kann die Nullhypothese H 0 : µ = 6.7 für α = 0.1, 0.05 abgelehnt, für α = 0.01 jedoch nicht abgelehnt werden. Damit liegt 6.7 außerhalb des 90% und 95%, aber innerhalb des 99% Konfidenzintervalls. Da die Nullhypothese H 0 : µ = 14 mit P = 0.000869 auch auf dem Niveau α = 0.01 abgelehnt werden kann, liegt 14 außerhalb aller drei Konfidenzintervalle. Schließlich muss auch 14 außerhalb aller drei Konfidenzintervalle liegen, da 14 vom Mittelwert 0.9 weiter entfernt liegt als 14. ufgabe 15 (4 Punkte): etrachten Sie folgende Kreuztabelle: Responder ja Responder Nein Gruppe 1 55 45 Gruppe 45 55 erechnen Sie die vier erwarteten Häufigkeiten für die Kreuztabelle. erechnen Sie die χ -Statistik X. C Formulieren Sie die Nullhypothese, die durch den χ -Test geprüft wird. D Kann diese Nullhypothese für diese Kreuztabelle auf dem Niveau α = 0.05 abgelehnt werden? Entscheiden Sie mit Hilfe folgender R usgabe: > pchisq(1:4, df=1) [1] 0.686895 0.847008 0.9167355 0.9544997 In der gesamten Stichprobe gibt es 100 Responder und 100 Non-Responder. Die geschätzte Wahrscheinlichkeit für Response (z.. nsprechen auf eine Therapie) beträgt damit ˆp = 1/. Da sich in beiden Gruppen jeweils 100 Patienten befinden, erwartet man sowohl in Gruppe 1 wie in Gruppe genau 100 1/ = 50 Responder und genauso viele Non-Responder. Die erwarteten Häufigkeiten sind damit: Responder ja Responder Nein Gruppe 1 50 50 Gruppe 50 50 us den erwarteten und beobachteten Häufigkeiten berechnet man die Statistik des χ Tests: X = (55 50) 50 + (45 50) 50 + (45 50) 50 + (55 50) 50 = 1

C Die Wahrscheinlichkeit für einen Responder in der Population, aus der die Gruppe 1 gezogen wurde, sei p 1, die entsprechende Wahrscheinlichkeit für Gruppe sei p. Die gesuchte Nullhypothese ist dann H 0 : p 1 = p. D Sei F χ,1 die Verteilungsfunktion der χ Verteilung mit einem Freiheitsgrad. Da es beim χ Test nur einen rechten blehnungsbereich gibt, gilt P = 1 F χ,1(x). In R ist F χ,1 in pchisq(.,df=1) implementiert. Der P-Wert für den χ Test der Kreuztabelle kann daher mit der R usgabe aus dem Wert der Statistik X = zu 1 0.847008 = 0.15799 bestimmt werden. Der χ -Test ist deshalb nicht signifikant auf dem Niveau 5%. Ist f χ,1 die Wahrscheinlichkeitsdichte der χ Verteilung mit einem Freiheitsgrad, dann ist der P-Wert die Fläche unter f χ,1 von X = bis : Wahrscheinlichkeitsdichte der Chiquadratverteilung mit einem Freiheitsgrad 0.0 0.5 1.0 1.5.0.5 3.0 0 1 3 4 5 6 ufgabe 16 (4 Punkte): In der gewöhnlichen linearen Regressionsanalyse werden die Geradenparameter a und b der Geraden L a,b : y = a + bx 13

so bestimmt, dass eine bestimmte Quadratsumme minimal wird. erechnen Sie diese Quadratsumme Q für die Punkte und die Gerade L : y = x. (1, ), (, 5), (3, 10) Die Quadratsumme Q ist die Summe der Quadrate der vertikalen bstände der Punkte zur Geraden L. Für die Punkte (1, ), (, 5), (3, 10) und L : y = x. ist das Q = ( 1) + (5 ) + (10 3) 3 = 59. 0 4 6 8 10 0 4 6 8 10 Q= Summe der Flächen des roten, blauen und grünen Quadrats. 14

Nützliche Formeln: inomialverteilung: b(k, n, p) = ( ) n p k (1 p) n k k Erwartungswert: np Varianz: np(1 p) Poissonverteilung: λ λk p(k, λ) = e k! Erwartungswert und Varianz sind λ. Formel von ayes: P( ) = P( )P() P( )P() + P( C )P( C ) Statistik des Z-Tests: Z = x µ 0 n σ x ist das arithmetische Mittel der Stichprobe. Einstichproben t-test: mit T = x µ 0 n ˆσ ˆσ = 1 n 1 n (x i x). i=1 Statistik des χ -Tests: X = (N 11 E 11 ) E 11 + (N 1 E 1 ) E 1 + (N 1 E 1 ) E 1 + (N E 1 ) Die N ij sind die beobachteten und die E ij die erwarteten Häufigkeiten. E 15