Klausur zur Vorlesung Biomathematik WS 2003/04. Mittwoch, den 11. Februar 2004

Ähnliche Dokumente
Klausur in "Biomathematik" WS 2007 / 2008 Montag, den 28. Januar 2008

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001

KLAUSUR IN BIOMATHEMATIK WS 2007/08 MONTAG, DEN 28. JANUAR 2008

Biomathematik für Mediziner

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

MaReCum Klausur in Biomathematik WS 2006 / 2007 Freitag, den 27. Oktober 2006

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Bereiche der Statistik

Die mit * gekennzeichneten Abschnitte beinhalten Themen, die über die Anforderungen des Gegenstandskatalogs hinausgehen.

Biomathematik für Mediziner, Klausur SS 2000 Seite 1

5. Seminar Statistik

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Klassifikation von Signifikanztests

Parametrische vs. Non-Parametrische Testverfahren

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Epidemiologie / Biometrie

Klausur zur Vorlesung

Kapitel III: Einführung in die schließende Statistik

Klausur zur Vorlesung

Chi-Quadrat Verfahren

Klausur in Epidemiologie SS 2006 Freitag, den 14. Juli 2006

Konkretes Durchführen einer Inferenzstatistik

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Statistisches Testen

Stichproben Parameterschätzung Konfidenzintervalle:

Statistische Tests für unbekannte Parameter

1 EINLEITUNG Allgemeines Kapitelübersicht Gebrauch dieses Buches Verwenden zusätzlicher Literatur...

Mathematik für Biologen

2.3 Intervallschätzung

Biomathematik für Mediziner

BSc Bioinformatik Wintersemester 2013/2014 Nachklausur zur Statistik I Freie Universität Berlin

Vorlesung: Statistik II für Wirtschaftswissenschaft

Biomathematik für Mediziner, Klausur WS 2003/2004 Seite 1

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Wahrscheinlichkeitsrechnung und Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Statistische Tests für unbekannte Parameter

Schließende Statistik

2.3 Intervallschätzung

Statistical Coaching. Thomas Forstner

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

1. Einführung in die induktive Statistik

Angewandte Statistik 3. Semester

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Statistik I für Betriebswirte Vorlesung 14

Wahrscheinlichkeitsverteilungen

Grundbegriffe. Allgemein. Merkmale. Verschiedene Variablen

Übung zur Vorlesung Statistik I WS Übungsblatt 12

Statistische Tests (Signifikanztests)

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

7.2 Mittelwert einer Stichprobe

Fit for Abi & Study Stochastik

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Klassifikation von Signifikanztests

Nachklausur zur Vorlesung

Inhaltsverzeichnis. 0 Einleitung 1

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Statistische Methoden in den Umweltwissenschaften

Fallzahlplanung bei unabhängigen Stichproben

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Klausurvorbereitung - Statistik

(A) Alle Frauen hatten die gleiche Anzahl von Schwangerschaften; über den spezifischen Wert m kann nichts ausgesagt werden.

Grundlagen der Statistik

Jost Reinecke. 7. Juni 2005

Normalverteilung. Erwartungswert, Median und Modus sind identisch. Symmetrieeigenschaft um den Erwartungswert

Statistik-Klausur A WS 2009/10

Brückenkurs Statistik für Wirtschaftswissenschaften

I. Deskriptive Statistik 1

Wahrscheinlichkeitsrechnung und schließende Statistik

Auswertung und Lösung

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

4.1. Nullhypothese, Gegenhypothese und Entscheidung

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

Stichwortverzeichnis. Symbole

Einfache Varianzanalyse für unabhängige Stichproben

Glossar und Formelsammlung. Hazard Rate. Hazard Ratio =

Lösungen Klausur Statistik 2/re/soz

Mathematische und statistische Methoden II

Test auf den Erwartungswert

Wahrscheinlichkeit und Statistik BSc D-INFK

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

SozialwissenschaftlerInnen II

Wichtige Definitionen und Aussagen

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2

Anpassungstests VORGEHENSWEISE

SozialwissenschaftlerInnen II

Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

3 Grundlagen statistischer Tests (Kap. 8 IS)

Wahrscheinlichkeitsrechnung mathematische Statistik und statistische Qualitätskontrolle

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n (2k 1) = n 2.

Die Familie der χ 2 (n)-verteilungen

FERNUNIVERSITÄT IN HAGEN WIRTSCHAFTSWISSENSCHAFT

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Klausur vom

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Transkript:

Klausur zur Vorlesung Biomathematik WS 2003/04 Mittwoch, den 11. Februar 2004 1: Induktive Statistik (1) Welche Aussage ist richtig? A. Je kleiner der ß-Fehler, desto geringer ist die Power eines Tests. Falsch. Die Power ist 1 ß. Das heißt: Je kleiner der ß-Fehler, desto größer ist die Power und umgekehrt. B. Der ß-Fehler ist vom α-fehler abhängig: Je kleiner der α-fehler festgelegt wird, desto größer wird der ß-Fehler und umgekehrt. Richtig. C. Der ß-Fehler ist unabhängig vom Stichprobenumfang. Falsch. Den ß-Fehler kann man durch den Stichprobenumfang sehr wohl beeinflusse. Je größer dieser ist, umso geringer ist der ß-Fehler. D. Wenn der p-wert kleiner ist als ein zuvor festgelegtes, wird die Nullhypothese beibehalten. Falsch. Wenn p, nimmt man die Alternativhypothese an. Der p-wert quantifiziert die exakte Größe des α-fehlers. E. Ein -Fehler wird gemacht, wenn man fälschlicherweise die Nullhypothese beibehält. Falsch. Das ist ein ß-Fehler oder Fehler 2. Art. Den α-fehler macht man, wenn man fälschlicherweise die Alternativhypothese annimmt. 2: Induktive Statistik (2) In einer Studie wurde die Wirksamkeit von Johanniskraut gegen ein klassisches Antidepressivum (Maprotilin) mit Referenzstatus geprüft. Die Patienten wurden 4 Wochen lang behandelt; im Vorfeld wurde definiert, unter welchen Voraussetzungen die Behandlung als erfolgreich eingestuft werden kann. Von 44 Patienten, die mit Johanniskraut behandelt wurden, zeigte sich bei 27 ein Erfolg (61 %). Mit Maprotilin wurden 42 Patienten behandelt, davon 28 erfolgreich (67 %). Mit dem Chi 2 2 -Vierfeldertest erhält man die Prüfgröße 0, 2621 und den p-wert p 0,6087. Getestet wurde auf dem Niveau 5%. Wie ist das Testergebnis zu interpretieren? A. Der p-wert quantifiziert die Erfolgsrate der Therapie mit Referenzstatus. Falsch. Der p-wert quantifiziert die Irrtumswahrscheinlichkeit, dass das Testergebnis unter der Nullhypothese zustande kommt. Wenn der p-wert klein ist (genauer: wenn p ), ist das Testergebnis schwer mit der Nullhypothese zu vereinbaren. Deshalb nimmt man die Alternativhypothese an. B. Die mit Maprotilin behandelten Patienten weisen eine signifikant höhere Erfolgsrate auf als die mit Johanniskraut behandelten. Falsch. Der Unterschied ist nicht signifikant, da p ( 0,6087 0,05 ) C. Die beiden Therapien sind äquivalent. Falsch. Man kann zwar keinen Unterschied zwischen den beiden Therapien nachweisen. Das bedeutet aber nicht unbedingt, dass die Therapien äquivalent sind. 1

D. Mit 60,87%-iger Wahrscheinlichkeit unterscheiden sich die Therapien; über die Richtung des Unterschieds besagt das Testergebnis allerdings nichts. Falsch. Ein Unterschied lässt sich nicht nachweisen, und der p-wert hat eine gänzlich andere Bedeutung (siehe unter Antwort A). E. Keine der Aussagen (A) bis (D) kann geschlussfolgert werden. Richtig! 3: Induktive Statistik (3) Ein Medikament A steht unter Verdacht, Leberschäden zu verursachen. Im Rahmen einer klinischen Studie werden 10 Patienten mit Therapie A und 9 Patienten mit Therapie B behandelt. Der Versuch wird randomisiert und doppelblind geplant. Bei jedem Patient wird das Ferment γ-gt im Serum als Zielgröße gemessen. Die Verteilung dieses Merkmals ist unbekannt. Welcher statistische Test erscheint Ihnen am besten geeignet? A. Der t-test für 2 unverbundene Stichproben ist immer besser geeignet, weil er eine höhere Power hat. Falsch. Die höhere Power ist nicht allein ausschlaggebend; man sollte auch darauf achten, dass die Voraussetzungen annähernd erfüllt sind. B. Man sollte den U-Test anstelle des t-tests verwenden, weil dessen Voraussetzungen eher erfüllt sind. Richtig. Bei einem großen Stichprobenumfang ist der t-test robust gegenüber Verletzungen von seinen Voraussetzungen. Da aber hier kleine Stichprobenumfänge vorliegen und die Voraussetzungen des t-tests nicht überprüft werden können (die Verteilung des Merkmals ist unbekannt wie sollte man die Normalverteilung nachweisen?), sollte man den U-Test nehmen. C. Beide Tests sind gleichermaßen geeignet. Falsch. Der U-Test ist in diesem Fall besser geeignet; siehe Antworten A und B. D. Man sollte mit einem Anpassungstest die Normalverteilung in beiden Stichproben überprüfen. Falls dieser Test zur Beibehaltung der Nullhypothese führt, sollte man den t-test verwenden. Falsch. Das wird zwar häufig so gemacht; aber eigentlich ist diese Vorgehensweise nicht sinnvoll. Bei einem kleinen Stichprobenumfang wird der Anpassungstest immer zur Beibehaltung der Nullhypothese führen. Damit ist die Normalverteilung keineswegs nachgewiesen; es kann nur nicht das Gegenteil nachgewiesen werden. E. Keiner der beiden Tests ist geeignet, da die Stichprobenumfänge der beiden Gruppen ungleich sind. Falsch. Die Stichprobenumfänge brauchen weder beim t-test noch beim U-Test exakt gleich zu sein. 4: Wahrscheinlichkeitsrechnung (1) Bei einer Therapie betrage das Risiko einer schwerwiegenden Nebenwirkung im Einzelfall 10%. Es werden 50 Patienten behandelt. X sei die Anzahl der Patienten, bei denen diese Nebenwirkung auftritt. Welche der folgenden Aussagen ist falsch? A. Die Wahrscheinlichkeit, dass bei maximal 3 Patienten die Nebenwirkung auftritt, ist 2

50 3 47 P( X 3) 0,10 0,90 0,139 3 Falsch. Dies ist die Wahrscheinlichkeit, dass genau 3 Patienten eine Nebenwirkung zeigen. Die Wahrscheinlichkeit für maximal drei Patienten ist: 3 50 k 50 k PX ( 3) 0,10 0,90 0, 251 k 0 k B. Die Wahrscheinlichkeit, dass bei keinem einzigen Patienten die Nebenwirkung auftritt, ist P ( X 0) 0,90 50 0, 005. Richtig. Dies kann man sich ganz einfach mit dem Multiplikationssatz ausrechnen, wenn man zugrunde legt, dass die Nebenwirkung bei den einzelnen Patienten unabhängig auftritt. C. Der Binomialkoeffizient in Antwort A beträgt 19.600 und quantifiziert die Anzahl der Möglichkeiten, von 50 Patienten genau 3 auszuwählen. 50 50 49 48 Richtig. 19.600 3 123 D. Theoretisch gilt für jede natürliche Zahl k zwischen 0 und 50 (Grenzen eingeschlossen): P( X k) 0 Richtig. Die Wahrscheinlichkeiten sind zwar unterschiedlich und teilweise sehr klein; aber sie sind alle größer als 0. E. Der Erwartungswert von X beträgt 5; die Varianz ist 50 0,90 0,10 4, 5. Richtig. Bei einer Binomialverteilung ist der Erwartungswert n p 50 0,1 5 2 und die Varianz n p q 50 0,1 0,9 4,5 5: Deskriptive Statistik (1) Zur Datenerfassung und -analyse quantitativer Daten ist es manchmal zweckmäßig, bei jedem Stichprobenwert eine konstante Zahl a zu subtrahieren (z. B. bei der Körperlänge von Erwachsenen a 100 cm ). Die ursprünglichen Daten haben den Mittelwert x und die Standardabweichung s. Wie ändern sich x und s, wenn bei jedem Messwert a subtrahiert wird? A. Beide Kenngrößen bleiben unverändert. Falsch. Anhand der bekannten Formeln leitet man für die Werte xi a einfach her: Mittelwert: Varianz: n n ( x a)/ n x / n na/ n x a i i i 1 i 1 n n 2 2 2 (( xi a) ( x a)) /( n 1) ( xi a) /( n 1) s i 1 i 1 Die Variabilität der Daten ändert sich durch die Transformation nicht; also bleiben die Varianz (und damit auch die Standardabweichung) die selbe. B. x x a, s s a Falsch. Siehe Antwort A. C. x x a, s a s Falsch. Siehe Antwort A. Dass diese Aussage falsch sein muss, wird deutlich, wenn man a 0 setzt. Dann würde die Standardabweichung s 0 resultieren und das kann nicht stimmen, da die Standardabweichung der Originaldaten s beträgt. D. x x a, s a s Falsch. Siehe unter Antworten A und C. 3

E. x x a, s ändert sich nicht Richtig. Siehe Antwort A. 6: Induktive Statistik (4) Basierend auf der t-verteilung wird aus den Daten einer Stichprobe ein 2-seitiges Konfidenzintervall für den Erwartungswert mit 5% berechnet. Welche Aussage ist falsch? A. Der Mittelwert liegt genau in der Mitte des Intervalls. Richtig. Das geht aus der Formel für das Intervall hervor: x tn 1;1 / 2 s/ n. B. Bei kleinerer Irrtumswahrscheinlichkeit wird das Intervall schmaler. Falsch. Wenn die Irrtumswahrscheinlichkeit sehr klein sein soll, wird das Intervall größer. Man kann das leicht nachvollziehen: Ein Intervall, bei dem man mit 99%-iger Sicherheit (1 % Irrtumswahrscheinlichkeit) annehmen kann, dass es den Erwartungswert enthält, muss breiter sein als ein Intervall, bei dem 5 % Irrtumswahrscheinlichkeit zugrunde liegt. C. Mit 4-fachem Stichprobenumfang halbiert sich die Breite des Intervalls. Richtig. Die Breite ist (siehe Formel in A) 2 tn 1;1 / 2 s/ n. Wenn n durch 4n ersetzt wird, halbiert sich die Breite (wegen n im Nenner). D. Eine geringe Streuung der Daten trägt dazu bei, dass das Intervall schmal wird. Richtig. Bei geringer Streuung werden das s und damit auch die Breite kleiner. E. Die Standardabweichung der Grundgesamtheit wird für die Berechnung des Intervalls nicht benötigt. Richtig. Das geht aus der Formel (unter A) hervor. Nur s ist erforderlich, nicht (das ja normalerweise auch wirklich unbekannt ist). 7: Wahrscheinlichkeitsrechnung (2) Bei einer Screening-Untersuchung werden Patienten ohne nennenswerte Beschwerden mit Hilfe des Hämokulttests auf Darmkrebs untersucht. Die Prävalenz bei dieser Population liegt bei 0,3 %. Der Test fällt bei der Hälfte der erkrankten Personen positiv aus. Wenn eine Person keinen Darmkrebs hat, fällt der Test mit einer Wahrscheinlichkeit von 3 % ebenfalls positiv aus. Ergänzen Sie die Häufigkeiten in der folgenden Tabelle. Welche Aussage ist falsch? Testbefund Darmkrebs Positiv negativ vorhanden 15 15 30 nicht vorhanden 300 9.670 (gerundet) 9.970 315 9.685 10.000 A. Die Spezifität dieses Tests beträgt 50 %. Falsch. Die Spezifität beträgt 9.670 / 9.970 0,9699. Die Sensitivität beträgt 50 % (15/30). B. Der Anteil der falsch negativen Ergebnisse liegt bei 50 %. Richtig. Dieser Anteil ist 15/30 ( = 1 Sensitivität). C. Der positive Vorhersagewert ist unter 5 %. 4

Richtig. Der positive Vorhersagewert ist 15/ 315 0,0476. D. Bei einem negativen Befund kann man mit hoher Wahrscheinlichkeit davon ausgehen, dass die betreffende Person keinen Darmkrebs hat. Richtig. Der negative Vorhersagewert beträgt nämlich 15/ 9.685 0,0015. In Worten: Von 9.685 negativen Testergebnissen sind nur 15 falsch negativ. E. Wenn der selbe Test in einer anderen Population mit einer höheren Prävalenz durchgeführt wird, ändern sich die Vorhersagewerte. Richtig. Wenn die Prävalenz eine andere ist, ändern sich auch die Vorhersagewerte (nur die Sensitivität und Spezifität bleiben konstant). 8: Deskriptive Statistik (2) Um den Zusammenhang zweier quantitativer Merkmale x und y zu beschrieben, werden der Korrelationskoeffizient r und die Regressionsgerade y a bx bestimmt. Was ändert sich, wenn x und y vertauscht werden? (1) der Korrelationskoeffizient r 2 (2) das Bestimmtheitsmaß r (3) das Vorzeichen von b (4) die Regressionsgerade (beide Parameter a und b) A. Alle Parameter bleiben unverändert. Falsch. Der Korrelationskoeffizient (1) ändert sich nicht (es spielt dabei keine Rolle, welches das x- und welches das y-merkmal ist). Demzufolge ändert sich auch das Bestimmtheitsmaß (2) nicht. Da das Vorzeichen von der Geradensteigung b mit dem Vorzeichen von r übereinstimmt, bleibt auch (3) unverändert. Die Regressionsgerade ändert sich aber, wenn man x und y vertauscht. B. Nur (1) und (2) ändern sich nicht. Falsch. Siehe unter A. C. Nur (4) ändert sich; (1) (3) bleiben unverändert. Richtig. Siehe unter A. D. Es ändert sich lediglich das Vorzeichen von r. Falsch. r ändert sich nicht auch nicht das Vorzeichen. Siehe unter A. E. Alle Parameter ändern sich und müssen neu berechnet werden. Falsch. Siehe unter A. 5

9: Induktive Statistik (5) Welche Voraussetzungen müssen beim t-test für 2 unverbundene Stichproben (theoretisch) erfüllt sein? 1. die Daten beider Stichproben entstammen normalverteilten Grundgesamtheiten 2. die Varianzen der beiden Grundgesamtheiten sind gleich 3. der -Fehler beträgt maximal 5% 4. es wird 2-seitig getestet 5. die Stichprobenumfänge stimmen überein A. alle Voraussetzungen müssen erfüllt sein Falsch. Der α-fehler kann beliebig je nach Fragestellung festgelegt werden. Es kann 1-seitig getestet werden; die Stichprobenumfänge müssen keineswegs übereinstimmen. B. alle Voraussetzungen außer 4 müssen erfüllt sein - Falsch. Siehe unter A. C. nur 1 3 - Falsch. Siehe unter A. D. nur 1 und 2 - Richtig. Der t-test für unverbundene Stichproben setzt normalverteilte Grundgesamtheiten mit gleichen Varianzen voraus. E. nur 1 - Falsch. Die Varianzen müssen streng genommen übereinstimmen. Der Welch- Test ist eine Modifikation dahingehend, dass diese Bedingung nicht enthalten ist. 10: Deskriptive Statistik (3) In einer dermatologischen Klinik werden 30 Patienten mit Botulinumtoxin behandelt (zur Verminderung der Falten). Vor der Behandlung wird die Faltenbildung mittels eines Scores folgendermaßen beurteilt (0 = keine Falten, 1 = leichte, 2 = mäßige, 3 = starke Faltenbildung): Ordnen Sie zu: Score 0 1 2 3 Anzahl 3 12 9 6 1. Mittelwert a. 3,0 2. Median b. 1,6 3. Modus c. 1,5 4. Standardabweichung d. 1,0 5. Spannweite e. 0,93 f. Berechnung ist nicht sinnvoll Es handelt sich um ein ordinal-skaliertes Merkmal; also ist die Berechnung von Mittelwert und Standardabweichung nicht sinnvoll (1f, 4f). Der Median kann berechnet werden. Er ist 1,5 der Durchschnitt aus x(15) 1 und x(16) 2 (2c). Der Modus ist die Ausprägung mit der größten Häufigkeit, also D 1 (3d). Die Spannweite ist 3 0 3, also 5a. A. 1b, 2c, 3d, 4e, 5a - Falsch (wegen 1b, 4e und 5a) B. 1b, 2d, 3d, 4e, 5d - Falsch (wegen 1b, 2d, 4e und 5d). C. 1f, 2f, 3d, 4f, 5a - Falsch (wegen 2f) D. 1f, 2d, 3d, 4f, 5a - Falsch (wegen 2d) E. 1f, 2c, 3d, 4f, 5a - Richtig 6

11: Wahrscheinlichkeitsrechnung (3) Bei einer Infektionskrankheit beträgt der Kontagionsindex (Wahrscheinlichkeit, dass sich eine mit dem Erreger in Kontakt gekommene Person infiziert) 0,9. Der Manifestationsindex (Wahrscheinlichkeit, dass eine infizierte Person manifest erkrankt) liegt bei 0,8. Wie groß ist dann die Wahrscheinlichkeit, dass eine mit dem Erreger in Kontakt getretene Person latent erkrankt? Lösung: Nach dem Multiplikationssatz ist die Wahrscheinlichkeit, dass sich eine Person infiziert (Ereignis I) und manifest erkrankt (Ereignis M), gleich: PI ( M) PI ( ) PM ( I) 0,9 0,8 0,72. Die Wahrscheinlichkeit, dass eine infizierte Person latent erkrankt (Ereignis L), ist nach dem Satz von der totalen Wahrscheinlichkeit, 0,2. Dann ist PI ( L) PI ( ) PL ( I) 0,9 0,2 0,18. Also Antwort C. A. 72 % - falsch B. 20 % - falsch C. 18 % - richtig D. 10 % - falsch E. 8 % - falsch 12: Wahrscheinlichkeitsrechnung (4) In der erwachsenen Bevölkerung hat der Cholesteringehalt des Serums eine Verteilung mit einem Erwartungswert 180 und eine Standardabweichung von 20 (mit den Maßeinheiten mg / 100 ml). Wie sind die (theoretisch denkbaren) Mittelwerte verteilt, die sich aus zufälligen Stichproben des Umfangs 16 ergeben? Lösung: Nach dem zentralen Grenzwertsatz sind die Mittelwerte normalverteilt mit x 180 und / n 20/ 16 5. Also ist D die richtige Lösung. x A. normalverteilt mit x 180 und x 20 - falsch B. normalverteilt mit x 180 und unbekannter Standardabweichung - falsch C. normalverteilt mit x 180 und x 1, 25 - falsch D. normalverteilt mit x 180 und x 5 - richtig E. die Mittelwerte folgen derselben Verteilung wie der Cholesteringehalt des Serums - falsch 13: Versuchsplanung (1) Welche Aussage bezüglich Fall-Kontroll-Studien ist falsch? A. Es handelt sich um retrospektive Studien. - Richtig. B. Die Studien dienen zum Nachweis, dass ein ätiologischer Faktor in Zusammenhang mit einer Krankheit steht. - Richtig. C. Man kann die Odds Ratio berechnen. Diese Maßzahl ist eine Näherung für das relative Risiko, falls die Inzidenz der Krankheit gering ist. - Richtig. 7

D. Die Studien haben gegenüber Kohortenstudien den Vorteil, dass die Ergebnisse schneller vorliegen. - Richtig. E. Die Studien haben experimentellen Charakter. Falsch. Es werden nur Daten ausgewertet, die bereits dokumentiert sind oder durch Befragungen erhoben werden müssen. Niemand greift modifizierend in das Geschehen ein. Daher sind alle retrospektiven Studien beobachtend, nicht experimentell. 14: Deskriptive Statistik (4) Bei Patienten mit Diabetes mellitus ergibt sich bezüglich des Zusammenhangs zwischen dem mittleren arteriellen Blutdruck (unabhängiges Merkmal, gemessen in mmhg) und dem Hämoglobingehalt (in %) folgende Regressionsgerade: y 20,19 0,12 x. Der Korrelationskoeffizient r hat den Betrag 0,84. Welche Aussage lässt sich aus diesen Angaben nicht herleiten? A. Der Korrelationskoeffizient ist negativ. Richtig. Da die Regressionsgerade negative Steigung hat, muss der Korrelationskoeffizient ebenfalls negativ sein. B. Etwa 70 % der Varianz des Hämoglobingehalts ist auf den Einfluss des Blutdrucks zurückzuführen. Richtig. Das Bestimmtheitsmaß ist r 2 0,84 2 0,70. Daraus lässt sich die Aussage unter B herleiten. C. Patienten mit einem Blutdruck von 100 mmhg haben einen durchschnittlich 1,2% niedrigeren Hämoglobingehalt als Patienten mit einem Blutdruck von 90 mmhg. Richtig. Das ergibt sich aus der Gleichung der Regressionsgeraden. D. Für einen Bluthochdruckpatienten mit einem Blutdruck von 150 mmhg ist ein Hämoglobingehalt von 2,19 % zu erwarten. Richtig. Man muss nur in die Gleichung der Regressionsgeraden x 150 einsetzen. E. Der beschriebene Zusammenhang ist schwach, da die Regressionsgerade eine geringe Steigung aufweist. Falsch. Die Steigung der Regressionsgeraden sagt nichts darüber aus, ob der Zusammenhang stark oder schwach ist. Wegen r 0,84 ist der Zusammenhang eher stark. 15: Wahrscheinlichkeitsrechnung (5) Die Wahrscheinlichkeit, bei einem Bronchialkarzinom die richtige Diagnose zu stellen, sei 0,8 bei zytologischer Sputumuntersuchung und 0,9 bei histologischer Untersuchung von Material einer Probeexcision. Wir nehmen an, dass die Ergebnisse der beiden Diagnoseverfahren unabhängig voneinander sind. Mit welcher Wahrscheinlichkeit wird ein vorhandenes Karzinom entdeckt, wenn beide Verfahren angewandt werden? Lösung: Es wird der Additionssatz angewandt: P( A B) PA ( ) PB ( ) PA ( B) (wobei A das Ereignis mit Sputumuntersuchung richtige Diagnose stellen und B das Ereignis mit histologischer Unetrsuchung richtige Diagnsoe stellen ). Da A und B unabhängig voneinander sind, ist P( A B) P( A) P( B). Also ist: PA ( B) PA ( ) PB ( ) PA ( ) PB ( ) 0,8 0,9 0,8 0,9 1,70 0,72 0,98 8

A. 0,9 falsch, das ist P( B) B. 0,8 falsch, das ist P( A) C. 0,72 falsch, das ist P( A B) P( A) P( B) D. 1,7 falsch, das ist P( A) P( B) E. 0,98 richtig, siehe oben 16: Versuchsplanung (2) Ein Arzt war beteiligt an der Entwicklung einer neuen Therapie. Er ist persönlich davon überzeugt, dass diese neue Therapie der bisher verwendeten Standardtherapie bezüglich ihrer Wirkung überlegen ist. Sie wurde im Tierversuch, bei einzelnen gesunden Probanden und kranken Patienten erfolgreich getestet und zeigte vielversprechende Ergebnisse. Der Arzt will nun nachweisen, dass die neue Therapie besser ist als die bisher verwendete. Welches Studiendesign ist zweckmäßig? A. Um keinen seiner Patienten zu benachteiligen, behandelt der Arzt fortan alle Patienten mit der neuen Therapie. Wenn genügend Ergebnisse bezüglich des Behandlungserfolgs vorliegen, vergleicht er diese mit den Ergebnissen von Patienten, die von ihm in früherer Zeit behandelt worden waren. Falsch. Dies wäre ein historischer Vergleich; dabei sind die beiden Gruppen nicht beobachtungsgleich. B. Er klärt die Patienten auf und behandelt jeden einzelnen Patienten mit der von ihm gewünschten Therapie. Danach vergleicht die beiden Therapiegruppen. Falsch. In diesem Fall kann man nicht annehmen, dass die Gruppen strukturgleich sind. C. Um ein möglichst geringes Risiko einzugehen, behandelt er nur die leichteren Fälle mit der neuen Therapie. Patienten, deren Schweregrad höher eingestuft wird oder die zusätzliche Risiken aufweisen, erhalten sicherheitshalber die Standardtherapie. Danach werden die beiden Gruppen miteinander verglichen. Falsch. Die beiden Gruppen unterscheiden sich bezüglich eienr sehr wichtigen Einflussgröße und sind damit nicht strukturgleich. D. Er behandelt alle seine Patienten mit der neuen Therapie und bittet einen Kollegen in einer anderen Klinik, dass dieser seine Patienten zeitgleich mit der Standardtherapie behandelt. Diese beiden Gruppen werden dann miteinander verglichen. Falsch. Die Gruppen sind nicht beobachtungsgleich; auch Strukturgleichheit kann nicht vorausgesetzt werden. E. Er lässt durch einen Prüfarzt jeden Patienten seiner Klinik zufällig einer der beiden Therapieformen zuweisen und führt eine doppelblinde Studie durch, um danach Vergleiche ziehen zu können. Richtig. Durch die Randomisation ist die Sturkturgleichheit gewährt; durch die Doppelblindheit die Beobachtungsgleichheit. 17: Wahrscheinlichkeitsrechnung (6) Der diastolische Blutdruck bei einer Gruppe von jungen Männern ist normalverteilt mit einem Erwartungswert von 70 mmhg und einer Standardabweichung von 10 mmhg. Welche Aussage folgt daraus? 9

A. Etwa die Hälfte dieser Männer hat einen Blutdruck zwischen 60 und 80 mmhg. Falsch. Das Intervall 60 bis 80 mmhg entspricht. In diesem Bereich liegen etwa 68 % aller Messwerte. B. Es ist ausgeschlossen, dass ein Mann aus dieser Population einen diastolischen Blutdruck von mehr als 100 mmhg hat. Falsch. Es ist zwar extrem unwahrscheinlich, dass ein Wert außerhalb des 3σ-Bereichs liegt, aber nicht unmöglich. C. Etwa 95 % der jungen Männer haben einen Blutdruck zwischen 50 und 90 mmhg. Richtig. In diesem Bereich 2 liegen etwa 95 % aller Messwerte. D. Der Median dieser Verteilung kann mit den vorliegenden Informationen nicht bestimmt werden. Falsch. Der Median einer Normalverteilung entspricht deren Erwartungswert und ist in diesem Fall 70 mmhg. E. Wenn man eine Standardabweichung von 14 mmhg zugrunde legt, wird die Glockenkurve schmaler und höher. Falsch. Bei einer größeren Streuung wird die Kurve breiter und niedriger. 18: Induktive Statistik (6) Um die Erfolgsraten 2er Therapien zu vergleichen, eignet sich der Chi 2 -Vierfeldertest. Dabei wird basierend auf 4 beobachteten Häufigkeiten a, b, c und d eine Prüfgröße mit einem dazugehörenden p-wert berechnet ( 5% ). Wie ändern sich die folgenden Kenngrößen, wenn jede der 4 Häufigkeiten verdoppelt wird? 2 2 ( ad bc) n Lösung: Die Prüfgröße wird berechnet als oder allgemein als (wobei E die erwarteten und B die beobachteten Häufigkeiten ( a b) ( c d) ( a c) ( b d) 2 2 ( E B) E sind). Daraus ergibt sich: Wenn man alle Häufigkeiten verdoppelt, verdoppelt sich auch die Prüfgröße. Der p-wert wird dadurch kleiner. Das Ergebnis tendiert also mehr zur Alternativhypothese. A. Die Prüfgröße und der p-wert bleiben unverändert. - Falsch. Siehe oben. B. Die Prüfgröße verdoppelt sich, der p-wert wird kleiner. - Richtig. Siehe oben. C. Die Prüfgröße und der p-wert verdoppeln sich. - Falsch. Siehe oben. D. Die Prüfgröße wird viermal so groß; der p-wert wird kleiner. - Falsch. Siehe oben. E. Diese Frage lässt sich mit den vorliegenden Informationen nicht beantworten. Falsch. Siehe oben. 19: Deskriptive Statistik (5) Im Rahmen einer klinischen Studie mit Neugeborenen werden folgende Merkmale erfasst: (1) Geburtsgewicht in Gramm (2) Alter der Mutter bei der Entbindung (3) Geschlecht des Neugeborenen (1 = männlich, 2 = weiblich) (4) Apgar-Score (0 bis maximal 10 Punkte) (5) Anzahl der vorangegangenen Schwangerschaften der Mutter (6) ID des Säuglings (durchnummeriert nach dem Alphabeth des Nachnamens) 10

Welche(s) dieser Merkmale ist (sind) quantitativ? A. alle Merkmale Falsch. Quantitativ sind (1), (2) und (5). Nur bei diesen Merkmalen ist die Berechnung des Mittelwerts erlaubt. Das Geschlecht ist ein Alternativmerkmal und damit qualitativ. Auch die ID ist qualitativ; die Nummerierung dient nur zur Codierung und erlaubt nicht die Berechnung eines Mittelwerts, der vollkommen unsinig wäre. Der Apgar-Score ist ordinal-skaliert und damit ebenfalls qualitativ. B. kein Merkmal - Falsch. Siehe unter A. C. nur (1) und (2) - Falsch. Auch (5) ist quantitativ. (5) unterscheidet sich von (1) und (2) dadurch, dass es diskret ist. D. nur (1), (2) und (5) - Richtig. Siehe unter A. E. nur (1), (2), (4) und (5) - Falsch. (4) ist nur ordinal-skaliert. Die Unterschiede zwischen jeweils 2 Ausprägungen sind nicht definiert. 20: Deskriptive Statistik (6) Welche der folgenden Aussagen ist falsch? A. Für die empirische Verteilungsfunktion gilt allgemein: F ( x) 0, 50 (wobei x den Mittelwert bezeichnet). Falsch. Es gilt allgemein: F( x ) 0,50. B. Der Vergleich zwischen Mittelwert und Median ist nützlich zur Beurteilung, ob die Verteilung symmetrisch oder schief ist. Richtig. Wenn Mittelwert und Median ähnlich groß sind, ist die Verteilung symmetrisch ansonsten ist sie schief. C. Bei Überlebenszeitstudien kann der Median für die Zielgröße Überlebenszeit vor dem Ende der Studie berechnet werden. Richtig. Der Median kann schon berechnet werden, wenn die Hälfte (oder einer mehr) der Patienten verstorben ist. D. Der Mittelwert wird stärker von Ausreißern beeinflusst als der Median. Richtig. E. Wenn bei Überlebenszeitstudien zensierte Daten vorliegen, ist die Berechnung des Mittelwerts auch nach Beendigung der Studie nicht möglich. Richtig. Die mittlere Überlebenszeit kann nur dann berechnet werden, wenn alle Patienten verstorben sind. Bei zensierten Daten ist die genaue Überlebenszeit jedoch unbekannt. 11