Wahrscheinlichkeitsaussagen in der Medizin



Ähnliche Dokumente
geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Kreativ visualisieren

Informationsblatt Induktionsbeweis

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Tutorial: Homogenitätstest

Zahlenoptimierung Herr Clever spielt optimierte Zahlen

Südbaden-Cup. Ausstieg Champions

Anleitung. Empowerment-Fragebogen VrijBaan / AEIOU

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Patienteninformation: Gentestung bei familiärem Brust- und Eierstockkrebs (Basis-Information):

Was ist Sozial-Raum-Orientierung?

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Professionelle Seminare im Bereich MS-Office

Das Persönliche Budget in verständlicher Sprache

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

Der Vollstreckungsbescheid. 12 Fragen und Antworten

Statistische Auswertung:

Primzahlen und RSA-Verschlüsselung

Alle gehören dazu. Vorwort

Statuten in leichter Sprache

Die Invaliden-Versicherung ändert sich

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Ist Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken?

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Die Post hat eine Umfrage gemacht

WAS finde ich WO im Beipackzettel

Vorlesung - Medizinische Biometrie

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Gründe für fehlende Vorsorgemaßnahmen gegen Krankheit


Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11

Zeichen bei Zahlen entschlüsseln

Brustkrebs und Mammographie

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Hautkrebsscreening. 49 Prozent meinen, Hautkrebs sei kein Thema, das sie besorgt. Thema Hautkrebs. Ist Hautkrebs für Sie ein Thema, das Sie besorgt?

Der Klassenrat entscheidet

Das Thema von diesem Text ist: Geld-Verwaltung für Menschen mit Lernschwierigkeiten

Fragebogen für Hauptamtliche im Konfi 3. Falls derzeit kein Konfi 3 läuft, bitte Zahlen des vorherigen Jahrgangs eintragen.

Beispiel Zusammengesetzte Zufallsvariablen

Das Leitbild vom Verein WIR

Welche Staatsangehörigkeit(en) haben Sie?... Mutter geboren?...

Multicheck Schülerumfrage 2013

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Anleitung über den Umgang mit Schildern

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird.

Leichte-Sprache-Bilder

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

9. Schätzen und Testen bei unbekannter Varianz

Kinderarmut. 1. Kapitel: Kinderarmut in der Welt

1. Weniger Steuern zahlen

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Vortrag zum Thema. Zugang zum Recht. oder. Wie bekomme ich meinem Recht?

Was ich als Bürgermeister für Lübbecke tun möchte

Kulturelle Evolution 12

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Wir arbeiten mit Zufallszahlen

von Dr. med. Wolfgang Rechl, Vizepräsident der Bayerischen Landesärztekammer (BLÄK)

Dame oder Tiger (Nach dem leider schon lange vergriffenen Buch von Raymond Smullyan)

Studieren- Erklärungen und Tipps

Umfrage der Klasse 8c zum Thema "Smartphones"

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Was meinen die Leute eigentlich mit: Grexit?

B: bei mir war es ja die X, die hat schon lange probiert mich dahin zu kriegen, aber es hat eine Weile gedauert.

Data Mining: Einige Grundlagen aus der Stochastik

M03a Lernstraße für den Unterricht in Sekundarstufe I

Mind Mapping am PC. für Präsentationen, Vorträge, Selbstmanagement. von Isolde Kommer, Helmut Reinke. 1. Auflage. Hanser München 1999

Zeit lässt sich nicht wie Geld für schlechte Zeiten zur Seite legen. Die Zeit vergeht egal, ob genutzt oder ungenutzt.

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

Diese 36 Fragen reichen, um sich zu verlieben

Berechnung der Erhöhung der Durchschnittsprämien

Lernerfolge sichern - Ein wichtiger Beitrag zu mehr Motivation

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Meet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten

Modul 2 Nur eine Unterschrift, nur ein Klick?! Verträge- Rechte und Pflichten

Dazu gilt Folgendes: : Hier kannst du bis zum 6. Stich problemlos abwerfen und

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Patientenverfügung. Was versteht man genau unter einer Patientenverfügung? Meine persönliche Patientenverfügung

Ich kann auf mein Einkommen nicht verzichten. Die BU PROTECT Berufsunfähigkeitsversicherung.

Papa - was ist American Dream?

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

Es gilt das gesprochene Wort. Anrede

Mobile Intranet in Unternehmen

Im Folgenden werden einige typische Fallkonstellationen beschrieben, in denen das Gesetz den Betroffenen in der GKV hilft:

Studienkolleg der TU- Berlin

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Sollsaldo und Habensaldo

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Informationen zum Ambulant Betreuten Wohnen in leichter Sprache

1 MIO ÖSTERREICHISCHE SKIFAHRER SCHÜTZEN SICH BEREITS MIT HELM - UM MEHR ALS IM VORJAHR

Gutes Leben was ist das?

1. Welche Tiere sind hier versteckt? 4P/

Einkaufen im Internet. Lektion 5 in Themen neu 3, nach Übung 10. Benutzen Sie die Homepage von:

Transkript:

Wahrscheinlichkeitsaussagen in der Medizin Eröffnungsvortrag Wilhelm Gaus Universität Ulm Institut für Biometrie Schwabstr. 13 89075 Ulm wilhelm.gaus@uni-ulm.de Zusammenfassung Nach einer kurzen Einführung in den Begriff der Wahrscheinlichkeit und der bedingten Wahrscheinlichkeit werden die Eigentümlichkeiten von Wahrscheinlichkeitsaussagen in der Medizin mit vielen Beispielen illustriert. Das Prinzip des statistischen Tests und die Wahrscheinlichkeiten für eine richtige Testentscheidung werden im Detail dargestellt. Schließlich zeigt sich, dass ein einziger Test nicht abschließend über einen Sachverhalt entscheiden kann, weil die Wahrscheinlichkeit, dass der Test richtig entschieden hat, auch erheblich davon abhängt, welche Wahrscheinlichkeiten vor Studienbeginn galten. Schlüsselwörter: Wahrscheinlichkeit, statistischer Test, Medizin Eine Wahrscheinlichkeit ist ein Maß für das Eintreten eines bestimmten Ereignisses unter definierten Bedingungen. Man schreibt Wsk (Ereignis) = 0 1 Eine Wahrscheinlichkeit ist eine Zahl zwischen 0 und 1 oder zwischen 0% und 100%. Ist die Wahrscheinlichkeit genau 0, so ist dies ein unmögliches Ereignis, ein Ereignis, das nie eintreten wird. Ist die Wahrscheinlichkeit genau 1, so ist dies ein sicheres Ereignis, das immer eintritt. Unmögliche und sichere Ereignisse sind aus Sicht der Statistik langweilig, die Statistik beschäftigt sich mit Wahrscheinlichkeiten die > 0 und < 1 sind. Beispiel: Die Wahrscheinlichkeit, dass ich innerhalb eines Jahres versterbe, ist 0.026 oder 2.6%. Diese Wahrscheinlichkeit entstammt dem Statistischen Jahrbuch und gilt für 67jährige deutsche Männer. Chancen und Risiken. Wahrscheinlichkeiten für erwünschte Ereignisse werden als Chancen, Wahrscheinlichkeiten für unerwünschte Ereignisse werden als Risiken bezeichnet. Emotional überschätzt werden meist die Chancen, z.b. bei Glücksspielen, sonst würde kaum noch jemand Lotto spielen. Emotional überschätzt werden meist auch Risiken, denen man zwangsläufig ausgesetzt wird, z.b. der persönliche Schaden durch ein benachbartes Atomkraftwerk oder durch die Feinstaubbelastung in der Stadtluft. Dagegen werden Risiken, denen man sich freiwillig aussetzt, emotional meist unter- 1

W. Gaus schätzt, dazu gehören z.b. Motorrad fahren, Ski fahren und rauchen sowie die Feinstaubbelastung in der Kneipe oder in der Disko. A priori definierte Wahrscheinlichkeiten. A priori bedeutet vor der Erfahrung, vorab festgesetzt. Die Mathematik hat seit Jahrhunderten Zufallsmodelle: der Wurf einer Münze, eines Würfels oder das Ziehen von Kugeln aus einer Urne mit oder ohne zurücklegen. Wird eine ideale Münze geworfen, so ist die Wahrscheinlichkeit, dass Zahl erscheint, gleich 0.5, die Wahrscheinlichkeit, dass Wappen erscheint, ebenfalls 0.5. Wird dies mit einer gegebenen Münze in der Praxis nachgeprüft, und es zeigt sich, dass diese Wahrscheinlichkeitsangaben nicht stimmen, dann ist aus mathematischer Sicht die verwendete Münze keine ideale Münze. Um nachzuprüfen, ob eine gegebene Münze in diesem Sinne ideal ist, muss man allerdings schon viele hunderte Male diese Münze werfen und eine Häufigkeitsstatistik erstellen. Diese a-priori-definition der Wahrscheinlichkeit ist in der Medizin nicht brauchbar. Die in der Medizin betrachteten Prozesse sind viel zu kompliziert als dass sie sich in einem mathematischen Modell vollständig darstellen lassen. Wir haben in diesem Sinne keine idealen Patienten. Trotzdem benutzen wir die gesamte Mathematik, die im Laufe der Jahrhunderte unter dieser a-priori-definition der Wahrscheinlichkeit entwickelt wurde. A posteriori definierte Wahrscheinlichkeiten. Die Medizin benutzt a posteriori definierte Wahrscheinlichkeiten, d.h. Wahrscheinlichkeiten, die im Nachhinein festgelegt werden. Dabei wird eine relative Häufigkeit bei ausreichend großer Fallzahl unter bekannten Bedingungen als Wahrscheinlichkeit interpretiert. Beispiele sind: Die Rezidivrate nach Operation eines Leistenbruches ist etwa 1% oder die Re-Stenose innerhalb von 2 Jahren nach Implantation eines Stents in ein Herzkranzgefäß beträgt etwa 30%. Johann Peter Süßmilch. Das älteste medizinische Beispiel für a posteriori definierte Wahrscheinlichkeiten stammt von Johann Peter Süßmilch (* 3.9.1707 in Zehlendorf, 22.3.1767 in Berlin). Süßmilch war Theologe und zählte in den Taufbüchern der einzelnen Jahre die Anzahl der neu geborenen Mädchen und die Anzahl der neu geborenen Knaben. In praktisch allen Geburtsjahrgängen war die Anzahl der Mädchen kleiner als die Anzahl der Knaben. In seinem 1740 erschienenen dreibändigen Buch Die göttliche Ordnung in den Veränderungen des menschlichen Geschlechts [4] gibt er als Wahrscheinlichkeit für ein Mädchen 0.48, als Wahrscheinlichkeit für einen Knaben 0.52 an. Diese Wahrscheinlichkeiten gelten bei Geburt. Sie gelten nicht bei Empfängnis. Die Wahrscheinlichkeit für einen männlich determinierten Embryo liegt bei etwa 0.58, die Wahrscheinlichkeit für einen weiblich determinierten Embryo bei 0.42. Bei männlich determinierten Embryonen kommt es häufiger zu einem Spontanabort. Die günstigeren Lebenschancen für Frauen zeigen sich spätestens im Altersheim. Die Wahrscheinlichkeit, ob ein Kind ein Mädchen oder ein Knabe wird, hängt auch vom Alter der Mutter, vom Alter des Vaters und von einigen anderen Bedingungen ab. H. Baitsch hat in einem Isolat, das ist ein kleines Gebiet, in dem über Jahrhunderte kaum jemand von außen zugezogen ist und die Bevölkerung nur intern geheiratet hat, eine Wahrscheinlichkeit für 2

Eröffnungsvortrag Mädchen von etwa zwei Dritteln, die Wahrscheinlichkeit für Knaben von etwa einem Drittel gefunden [3]. Fazit 1: Selbst so einfache Sachen wie das Geschlecht eines Kindes hängen von vielerlei Bedingungen ab. Fazit 2: Wahrscheinlichkeitsangaben in der Medizin sind ziemlich ungenau, selbst bei so einfachen Dingen wie Normwerten für Körpergröße und Gewicht. Axiomatische Definition der Wahrscheinlichkeit. Eine mathematisch saubere Definition für Wahrscheinlichkeit gab Andrey Nikolagevich Kolmogorov in seinem 1933 im Springer-Verlag in deutscher Sprache unter dem harmlosen Titel Grundbegriffe der Wahrscheinlichkeitsrechnung erschienenen Buch [2]. Durch diese Definition der Wahrscheinlichkeit erhielt das in der Mathematik in Jahrhunderten aufgebaute Wahrscheinlichkeitsgebäude ein solides Fundament. Zu diesem Wahrscheinlichkeitsgebäude gehören z.b. Unabhängigkeit, Wahrscheinlichkeitsdichte, Normalverteilung und andere theoretische Verteilungen, Konfidenzintervalle für Schätzwerte und statistische Tests. In der Medizin benutzen wir viele Verfahren aus diesem Wahrscheinlichkeitsgebäude. Wahrscheinlichkeit und Einzelfall. Zunächst möchte ich wiederholen, dass in der Medizin eine Wahrscheinlichkeit eine relative Häufigkeit bei ausreichend großer Fallzahl ist. Beispiel: Die Wahrscheinlichkeit, dass es bei einer Pertussis-Impfung (Impfung gegen Keuchhusten) zu einem schweren Impfzwischenfall kommt, liegt bei etwa 10-5 = 0.001%. Wenn nun eine Mutter ihr Kind zum Impfen bringt und zum Arzt sagt: Herr Doktor, bei meinem Jakoble passiert doch nichts (?), was wird der Arzt dann antworten? Im Einzelfall treten Ereignisse ein oder nicht, im Beispiel, es tritt ein Impfschaden auf oder er tritt nicht auf. Auch seltene Risiken (wie z.b. ein schwerer Impfzwischenfall bei einer Pertussis-Impfung) müssen sich irgendwo realisieren, so wie sich auch kleinste Chancen (wie z.b. beim Lotto) irgendwo realisieren müssen. Vorab gilt die Wahrscheinlichkeit, aber danach ist das Ereignis eingetreten oder nicht. Aus epidemiologischer Sicht ist die Pertussis-Impfung sehr nützlich: Wir können mit statistischen Methoden sehr überzeugend aufzeigen, dass durch diese Impfung in vielen Fällen Krankheiten vermieden werden und dadurch sehr viel mehr Schaden verhütet wird als Schaden durch Impfschäden gesetzt wird. Die Statistik gibt Aussagen über Gruppen mit vielen Personen, gibt Aussagen auf längere Sicht. Dagegen ist die Statistik für den Einzelfall nur eingeschränkt brauchbar. Ein Beispiel sei das Rauchen: Einzelne Raucher leben sehr lange und werden hoch betagt, umgekehrt können Nichtraucher früh sterben. Aber im Mittel gesehen bei großer Fallzahl sterben die Raucher viele Jahre früher als die Nichtraucher. Bedingte Wahrscheinlichkeiten. Bisher haben wir unbedingte Wahrscheinlichkeiten behandelt. Bei der bedingten Wahrscheinlichkeit wird vorausgesetzt, dass eine be- 3

W. Gaus stimmte Bedingung erfüllt ist. Geschrieben wird eine bedingte Wahrscheinlichkeit folgendermaßen: Wsk (Ereignis Bedingung) = 0 1 Beispiele: Die (unbedingte) Wahrscheinlichkeit, dass Sie sich gerade langweilen, sei 50%. Wenn Sie aber ein Neuling in Statistik sind und noch dazu lernen wollen, dann ist die bedingte Wahrscheinlichkeit für Langeweile vielleicht nur 30%. Wsk (Langeweile Neuling in Statistik) = 30% Sind Sie dagegen ein alter Hase in Statistik und das, was ich Ihnen sage, ist Ihnen längst bekannt, so ist die bedingte Wahrscheinlichkeit, dass Sie sich langweilen, vielleicht 80%. Wsk (Langeweile Alter Hase in Statistik) = 80% Klinische Studien und statistischer Test. Soweit einige elementare Grundlagen. Abbildung 1 zeigt in sehr vereinfachter Darstellung das Prinzip einer klinischen Studie und des statistischen Tests, der die Studie auswertet. Sinn der Randomisation, d.h. der streng zufälligen Zuteilung der Patienten in die Therapiegruppen, ist, dass sich die Gruppen bei Therapiebeginn möglichst wenig jedoch höchstens zufällig unterscheiden. Am Ende der Studie wird mit einem statistischen Test untersucht, ob der Therapieerfolg in der einen Gruppe mehr als zufällig besser ist als in der anderen Gruppe. z.b. 100 Patienten mit einer bestimmten Krankheit Randomisation 50 Patienten erhalten neue Therapie 50 Patienten erhalten Standardtherapie Therapieerfolg beurteilen Therapieerfolg beurteilen Statistischer Test entscheidet: Neue Therapie besser als Standardtherapie: ja oder nein Abbildung 1: Klinische Studie und statistischer Test 4

Eröffnungsvortrag Der statistische Test ist eine Entscheidung. Praktisch alle von Ihnen werden schon viele statistische Tests mit SAS gerechnet haben. Der Test entscheidet zwischen Nullhypothese H 0 und Alternative H 1. Die Bezeichnungen Nullhypothese und Alternative sind traditionelle Bezeichnungen. Nullhypothese und Alternative behaupten das Gegenteil, beide zusammen müssen alle Möglichkeiten abdecken. Die Nullhypothese H 0 behauptet das Unerwünschte, typischerweise: die neue Behandlung ist auch nicht besser als die bisherige, oder der Effekt der Behandlung ist 0 (daher die Bezeichnung Nullhypothese), oder es besteht zwischen den Gruppen A und B kein Unterschied im Outcome. Die Alternative H 1 behauptet das Erwünschte, typisch ist: die neue Behandlung ist erfolgreicher als die bisherige, die Behandlung hat den erwünschten Effekt (d.h. der Effekt ist ungleich 0, also vorhanden) oder zwischen den Gruppen A und B ist der Outcome unterschiedlich. Der Test ist eine Wahrscheinlichkeitsrechnung. Berechnet wird die Überschreitungswahrscheinlichkeit, die meist kurz als p-wert bezeichnet wird. Die Überschreitungswahrscheinlichkeit ist die Wahrscheinlichkeit, dass die tatsächlich beobachteten Daten - oder ein noch extremeres Ergebnis - rein zufällig unter der Nullhypothese entstanden sein können. Es handelt sich also um die bedingte Wahrscheinlichkeit Überschreitungswahrscheinlichkeit = Wsk (tatsächlich beobachtete Daten H 0 ) Man tut also zunächst so, als ob die Nullhypothese gelten würde. Das ist so ähnlich, wie Sie etwa im Alter von 12 Jahren mit der Algebra begonnen haben: Man tut so, als ob man schon am Anfang das Ergebnis wüsste, bezeichnet das Gesuchte mit x (oder einem anderen Buchstaben), rechnet damit, und wenn alles gut geht, dann steht zum Schluss z.b. da x = 18.3. So geht es auch beim statistischen Test. Angenommen, die Nullhypothese würde gelten, wie groß ist dann die Wahrscheinlichkeit, dass wir solche Daten erhalten, wie wir sie tatsächlich beobachtet haben. Wenn diese Überschreitungswahrscheinlichkeit (p-wert) sehr klein ist, kleiner als eine vorab gewählte Grenzwahrscheinlichkeit, die als Signifikanzniveau bezeichnet wird, dann glaubt man nicht an den Zufall, sondern nimmt an, dass die unerwünschte H 0, die man in die Rechnung hineingesteckt hat, falsch ist und das Erwünschte (die H 1 ) richtig ist. Als Signifikanzniveau wird meist 5% oder 1% gewählt. Legende. Es gibt eine Legende, wie der statistische Test entstanden ist. Ein Mathematiker ging auf die Spielbank und verlor mit verhältnismäßig wenig Spielen verhältnismäßig viel Geld. Darüber hat sich der Mathematiker verständlicherweise geärgert. Er hat sich zu Hause an seinen Schreibtisch gesetzt und die Wahrscheinlichkeit errechnet, dass man mit so wenigen Spielen, wie er gespielt hat, soviel Geld verliert, wie er verloren hat. Diese Wahrscheinlichkeit hat er unter der Annahme wir sagen heute unter der Nullhypothese berechnet, dass die Spielbank fair spielt. Die von ihm errechnet Wahrscheinlichkeit war sehr klein, deshalb glaubte er nicht an sein Pech, sondern nahm die Alternative zur Nullhypothese an, nämlich Die Spielbank betrügt. 5

W. Gaus Ergebnis eines statistischen Tests. Eine Studie wurde durchgeführt, die Daten der Studie werden in den Test hineingesteckt und SAS berechnet den p-wert. Ist dieser p- Wert (Überschreitungswahrscheinlichkeit) kleiner als das gewählte Signifikanzniveau, so sagt man, der Test ist signifikant, H 1 wird angenommen und das Erwünschte trifft zu (behauptet der Test). Ist dagegen der p-wert (Überschreitungswahrscheinlichkeit) größer gleich das gewählte Signifikanzniveau, so sagt man, der Test ist nicht signifikant, die H 0 wird beibehalten und das Erwünschte konnte leider nicht nachgewiesen werden. Ist der Test nicht signifikant, hatte er aber genügend Power, d.h. es liegt eine ausreichend große Fallzahl vor, so kann man auch sagen, dass das Erwünschte nicht zutrifft, zumindest ist der Effekt schwächer, kleiner, schlechter als bei der Fallzahlplanung angenommen wurde. Testfehler. Wie jeder, der Entscheidungen trifft, entscheidet auch der statistische Test manchmal falsch. Wir unterscheiden folgende vier, in Abbildung 2 dargestellte Situationen: Wirklichkeit Testergebnis Fazit Das Unerwünschte (H 0 ) stimmt Das Erwünschte (H 1 ) stimmt Das Unerwünschte (H 0 ) stimmt Das Erwünschte (H 1 ) stimmt nicht sign. signifikant signifikant nicht sign. richtige Entscheidung richtige Entscheidung α-fehler = Fehler 1. Art β-fehler = Fehler 2. Art Abbildung 2: Testfehler Fehlerwahrscheinlichkeiten. Die fehlerhaften Entscheidungen eines statistischen Tests treten mit gewissen Wahrscheinlichkeiten auf. Die Wahrscheinlichkeit für einen α- Fehler heißt α-risiko. Dies ist die bedingte Wahrscheinlichkeit, dass der Test signifikant wird unter der Bedingung, dass die unerwünschte H 0 stimmt (siehe Abb.3). Das α- Risiko ist gleich der errechneten Überschreitungswahrscheinlichkeit und damit kleiner als das gewählte Signifikanzniveau. Die Wahrscheinlichkeit für einen β-fehler heißt β-risiko. Das β-risiko ist die bedingte Wahrscheinlichkeit, dass der Test nicht signifikant wird unter der Bedingung, dass die erwünschte H 1 stimmt. Meist betrachtet man jedoch nicht das β-risiko, sondern das Gegenteil, nämlich die Power: Power (1 - β-risiko) = Wsk (Test signifikant erwünschte H 1 stimmt) 6

Eröffnungsvortrag Die Berechnung der Power ist schwieriger als die Berechnung des α-risikos, ist aber unter bestimmten Bedingungen möglich. Hoffentlich hat eine Studie so viele Patienten, dass der statistische Test eine Power von z.b. 80% erreicht. Interpretation des Testergebnisses. Ist der Test signifikant, so ist das Erwünschte (die H 1 ) richtig (so behauptet der Test). Die Wahrscheinlichkeit, dass wir uns irren, ist klein. Wie klein sie ist, darauf will ich noch zurückkommen. Ist dagegen der Test nicht signifikant, so können müssen aber nicht die beobachteten Daten unter H 0 entstanden sein. Das Unerwünschte (die H 0 ) kann richtig sein muss es aber nicht. Wir müssen weich formulieren und sagen das Erwünschte (die H 1 ) konnte leider nicht nachgewiesen werden. Falls der Test genügend Power hatte, können wir behaupten, das Erwünschte trifft nicht zu, zumindest ist es schwächer als bei der Fallzahlberechnung angenommen. Hat der Test genügend Power, so ist die Wahrscheinlichkeit, dass wir uns bei der Aussage irren, klein. Wie klein, darauf werde ich noch zurückkommen. Wiederholung. Abbildung 3 fasst die bisherigen Wahrscheinlichkeitsaussagen zum statistischen Test zusammen. Bitte beachten Sie, dass bei α-risiko und Power einerseits und bei den letzten Wahrscheinlichkeiten der Abbildung 3 andererseits Ereignis und Bedingung ausgetauscht sind. α - Risiko Power (1 - β) = Wsk (Test falsch sign. unerwünschte H0 stimmt) = meist kleiner als 5% = Wsk (Test richtig sign. erwünschte H1 stimmt) = hoffentlich 80% oder mehr Wenn ein Test signifikant geworden ist: Wsk (erwünschte H1 stimmt Test signifikant) =? Wenn ein Test nicht sign. geworden ist: Wsk (unerwünschte H0 stimmt Test nicht sign.) =? Abbildung 3: Wahrscheinlichkeiten bei einem statistischen Test Wsk (Testergebnis richtig). Die Formel zur Berechnung der Wahrscheinlichkeit, dass das Testergebnis richtig signifikant oder richtig nicht signifikant ist, wird hier nicht angegeben. Der Rechengang dafür ist aber für einen Mathematiker harmlos. Das Ergebnis ist in Tabelle 1 dargestellt. Für Tabelle 1 gilt, dass eine klinische Studie mit konfirmatorischem Test durchgeführt wurde, als Signifikanzniveau wurde 5% gewählt und die Fallzahl der Studie war so groß, dass der Test eine Power von 80% hatte. Wir sehen, 7

W. Gaus dass die Wahrscheinlichkeit, dass das Testergebnis richtig ist, auch stark von der Vorab- Wahrscheinlichkeit abhängt, d.h. von der Wahrscheinlichkeit, dass das Erwünschte zutrifft vor der Durchführung der Studie. Tabelle1: Bei einem statistischen Test hängt die Richtigkeit des Testergebnisses auch davon ab, wie wahrscheinlich die Alternative vor Studienbeginn war. Die Fallzahl ermöglichte eine Power von 80%, als Signifikanzniveau wurden 5% gewählt. Vorab-Wsk = Test-Ergebnis Wsk, dass Ergebnis richtig ist a priori Wsk signifikant 97% 70% nicht signifikant 67% signifikant 94% 50% nicht signifikant 83% signifikant 91% 40% nicht signifikant 88% signifikant 87% 30% nicht signifikant 92% signifikant 80% 20% nicht signifikant 95% signifikant 64% 10% nicht signifikant 98% signifikant 46% 5% nicht signifikant 99% signifikant 14% 1% nicht signifikant 100% Anmerkung: Beim Vortrag wurde anstatt dieser Tabelle eine Serie von 8 Bildern gezeigt. Die Bildsequenz zeigte wie diese Tabelle, dass mit abnehmender Vorab-Wahrscheinlichkeit für das erwünschte Ergebnis die Wahrscheinlichkeit, dass ein signifikantes Ergebnis richtig ist, abnimmt und die Wahrscheinlichkeit, dass ein nicht signifikantes Ergebnis richtig ist, zunimmt [1]. Ein Test verringert die Unsicherheit. Eine klinische Studie und der statistische Test, mit dem sie ausgewertet wird, stehen nicht einsam und alleine im informationsleeren Raum. Vielmehr verändert die klinische Studie und ihr Test die Vorab-Wahrscheinlichkeit: Ist der Test signifikant, so wird die Wahrscheinlichkeit, dass das erwünschte Ergebnis tatsächlich stimmt, erhöht, wird dagegen der Test nicht signifikant, so wird die Wahrscheinlichkeit, dass die nicht erwünschte Nullhypothese gilt, erhöht. 8

Eröffnungsvortrag Beispiel. Jemand hat eine völlig neue Therapie entwickelt und nehmen wir an, die Wahrscheinlichkeit, dass sie wirksam ist, sei etwa 1%. Wird dann eine klinische Studie durchgeführt und das Ergebnis wird signifikant, so ist die Wahrscheinlichkeit, dass diese Signifikanz richtig ist und die neue Therapie tatsächlich wirksam ist, bescheidene 14% (siehe Tabelle 1). Wird dagegen bei dieser vorab wenig aussichtsreichen Therapie der Test nicht signifikant, so ist die Wahrscheinlichkeit, dass die Therapie tatsächlich nicht wirksam ist, gerundet 100% (Tabelle 1). Eine Schwalbe macht noch keinen Sommer. Leider sind die Vorab-Wahrscheinlichkeiten in aller Regel unbekannt. Um zu einigermaßen sicheren Entscheidungen zu kommen, bedarf es nicht einer Studie, sondern einer Serie von zwei, drei oder sogar vier Studien. Mit jedem signifikanten Ergebnis nimmt die Wahrscheinlichkeit, dass das Erwünschte tatsächlich gilt, zu. Die Mathematik dazu ist, wie bereits gesagt, harmlos. Trotzdem steht dieser Sachverhalt in keinem Lehrbuch und ist vielen SAS-Anwendern nicht bewusst. Medizinische Statistik ist notwendig. Jeder Mensch ist ein einmaliges Individuum. Darauf dürfen wir stolz sein. Wir können aber nicht erwarten, dass alle Menschen genau gleich reagieren. Wegen der Individualität des Menschen ist in der Medizin fast nichts sicher und fast alles möglich. Alles ist mit einer Wahrscheinlichkeit behaftet, z.b. die Richtigkeit der Diagnose, das Auftreten einer Komplikation, das Eintreten eines Rezidivs oder die Entstehung einer unerwünschten Arzneimittelwirkung. Der von manchen Ärzten und Heilpraktikern vertretene Standpunkt Wer heilt, hat Recht ist oft großer Unsinn. Nur wer besser als Placebo heilt hat eine wirksame Therapie und nur wer besser heilt als die Standardtherapie hat einen Therapiefortschritt erreicht. Im Einzelfall kann unklar sein, ob ein Patient wegen oder trotz ärztlicher Behandlung gesund geworden ist oder gestorben ist. Leider sind die Wahrscheinlichkeiten in der Medizin meist nur ansatzweise bekannt. Allerdings würden genaue Wahrscheinlichkeiten dem Einzelfall ohnehin kaum helfen. Mit zuverlässigen Wahrscheinlichkeitsangaben könnten aber bessere Public-Health-Entscheidungen getroffen werden. Haben Sie Vertrauen. Zwar ist wie eben ausgeführt jeder medizinisch-biologische Ablauf mit einer Wahrscheinlichkeit behaftet. Andererseits gibt es extrem zuverlässige biologische Abläufe, z.b. die Schwangerschaft. Die Anzahl der Prozesse und Vorgänge, die von der befruchteten Eizelle zum geborenen Kind führen, ist ungeheuer groß. Diese Prozesse laufen mit extrem großen Wahrscheinlichkeiten richtig ab, sonst wäre die Menschheit längst ausgestorben. Auch wenn in der Medizin fast alles möglich und fast nichts sicher ist, empfehle ich Ihnen doch, Vertrauen zu haben. 9

W. Gaus Literatur [1] Gaus W. (2005): Medizinische Statistik Mathematik oder Orakel? Abschiedsvorlesung am 16. Juli 2004. GMS Med Inform Biom Epidemiol.; 1(2):Doc08 (http://www.egms.de/en/journals/mibe/2005-1/mibe000008.shtml). [2] Kolmogorov A. N. (1933): Grundbegriffe der Wahrscheinlichkeitsrechnung. Springer-Verlag, Berlin. [3] Sponholz G., Baitsch H., Schmidt H.D. (1996): Approaches to risk analysis of infant mortality in the 19th century in 2 adjacent South Germany rural communities. Anthropologischer Anzeiger; 54: 45-55. [4] Süßmilch J. P. (Neuausgabe 1988): Die göttliche Ordnung in den Veränderungen des menschlichen Geschlechts, aus der Geburt, dem Tode und der Fortpflanzung desselben erwiesen. WiSoMed-Verlag, Augsburg. 10