Medizinische Statistik

Ähnliche Dokumente
Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master)

Wahrscheinlichkeitsrechnung und schließende Statistik

Grundkurs Statistik für Politologen und Soziologen

Die Unternehmergesellschaft

Vorkurs Mathematik. Ein Übungsbuch für Fachhochschulen. Bearbeitet von Michael Knorrenschild

Filme der Kindheit Kindheit im Film

Prozessoptimierung mit statistischen Verfahren

2.3 Intervallschätzung

2.3 Intervallschätzung

Medizinische Statistik mit R und Excel

Medizinische Statistik mit R und Excel

Wahrscheinlichkeitsrechnung und Statistik für Biologen 2. Der Standardfehler

Statistik I für Betriebswirte Vorlesung 14

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

Biostatistik, WS 2017/18 Der Standardfehler

Stichproben Parameterschätzung Konfidenzintervalle:

Wahrscheinlichkeitsverteilungen

Jost Reinecke. 7. Juni 2005

Statistik für Dummies

Basiswissen Mathematik, Statistik und Operations Research für Wirtschaftswissenschaftler

Elementare Stochastik

10 Konfidenzintervall für µ

Statistik I für Betriebswirte Vorlesung 14

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Zentraler Grenzwertsatz/Konfidenzintervalle

Elementare Stochastik

Übungsblätter zu Methoden der Empirischen Sozialforschung III: Inferenzstatistik. Lösungsblatt zu Nr. 5

3 Konfidenzintervalle

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Statistische Methoden der Qualitätssicherung

Vorkurs Mathematik. Ein Übungsbuch für Fachhochschulen. Bearbeitet von Michael Knorrenschild

Vorlesung: Statistik II für Wirtschaftswissenschaft

Handelt es sich bei den folgenden um diskrete oder stetige Zufallsvariablen?

Bauaufsichtliche Zulassungen - Teil IV: Gewässerschutz (BAZ IV)

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Enthospitalisierung und Lebensqualität

Auswertung und Lösung

Stochastik für Informatiker

Statistische Methoden in den Umweltwissenschaften

Empirische Wirtschaftsforschung

Mathematik für Biologen

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Statistik im Forschungsprozess

8 Stichprobenkennwerteverteilung

Prüfungsklausur zur Stochastik (LMG)/ Elementare Wahrscheinlichkeitstheorie und Statistik

Übungen mit dem Applet

Statistiktutorium (Kurs Frau Jacobsen)

Konfidenzintervall für den Anteilswert θ. Konfidenzintervalle. Jost Reinecke. Universität Bielefeld. 13. Juni 2005

Übung 2 im Fach "Biometrie / Q1"

Strategie und Technik der Werbung

Das lineare Komplementaritätsproblem

Fitness-Training fürs Gesicht

Maß und Wahrscheinlichkeit

Wiederholung. Statistik I. Sommersemester 2009

Übungen zu Public Health und Gesundheitsökonomie

Statistik K urs SS 2004

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Mehrsprachigkeit türkischer Schüler in Frankreich und Deutschland

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Eine Ausrede findet sich immer!

Übungen mit dem Applet Rangwerte

Beschreibende Statistik Deskriptive Statistik. Schließende Statistik Inferenzstatistik. Schluss von der Stichprobe auf die Grundgesamtheit

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Anwendungen der Linearen Algebra

Wissensmanagement im Innovationsprozess

Übungen mit dem Applet x /s-regelkarte nach Shewhart

Das Konfidenzintervall (Confidence Interval CI) Vertrauen schaffen, Signifikanz erkennen Autor: Beat Giger

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Statistik Einführung // Stichprobenverteilung 6 p.2/26

Theodor Storm - Constanze Esmarch

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik

= 3. Kapitel 4: Normalverteilung.. und Standardnormalverteilung und: das Konfidenzintervall..

Statistisches Testen

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Klausur zur Vorlesung

Teil II. Der Weg zur schließenden Statistik: Von den Daten zu Wahrscheinlichkeiten. StatSoz 127

Inferenzstatistik (=schließende Statistik)

Analyse von Querschnittsdaten. Signifikanztests I Basics

IT-Projektmanagement im Gesundheitswesen

Nachklausur zur Vorlesung

Biostatistik, WS 2013/2014 Konfidenzintervalle

p = h n (K)= Juli vl smart vp qk notebook Praktische Lösung des Problems: mit den Werten

Maurizio Musso, Universität Salzburg, ver Physikalische Grundlagen der Meßtechnik. Teil 2

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Grundwissen Mathematik

Figur und Handlung im Märchen

Elisabeth Aufhauser, unveröffentlichter Text Unterrichtsmaterial Statistik-UE für Soziologie

Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung IV: Konfidenzintervalle // Normalverteilungstests

Chi-Quadrat-Verteilung

Zwischen fristgerechter und verspäteter Einschulung

Lehrbücher der Erziehungswissenschaft - ein Spiegel der Disziplin?

Zeitung als Zeichen. Identität und Mediennutzung nationaler Minderheiten in Deutschland. Bearbeitet von Swea Starke

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter

Transkript:

Medizinische Statistik Angewandte Biometrie für Ärzte und Gesundheitsberufe Bearbeitet von Wilhelm Gaus, Rainer Muche 1. Auflage 2013. Buch. 640 S. Hardcover ISBN 978 3 7945 2931 5 Format (B x L): 16,5 x 24 cm Weitere Fachgebiete > Medizin > Human-Medizin, Gesundheitswesen > Medizinische Mathematik, Informatik & Statistik Zu Inhaltsverzeichnis schnell und portofrei erhältlich bei Die Online-Fachbuchhandlung beck-shop.de ist spezialisiert auf Fachbücher, insbesondere Recht, Steuern und Wirtschaft. Im Sortiment finden Sie alle Medien (Bücher, Zeitschriften, CDs, ebooks, etc.) aller Verlage. Ergänzt wird das Programm durch Services wie Neuerscheinungsdienst oder Zusammenstellungen von Büchern zu Sonderpreisen. Der Shop führt mehr als 8 Millionen Produkte.

13 Konfidenzintervalle 13.1 Schätzgenauigkeit Schätzen heißt Fehler machen sagt der Volksmund. Aber damit ist mehr das Raten als das Schätzen im statistischen Sinne gemeint. Schätzen in der Statistik heißt, Kenngrößen aus einer Stichprobe anstatt aus der Grundgesamtheit zu ermitteln. Schätzfehler. Schätzwerte haben immer einen zufälligen Fehler, jedoch so wird gehofft keinen systematischen Fehler. Unbekannter Zufallsfehler. Die Größe des Zufallsfehlers eines einzelnen Schätzwertes ist prinzipiell unbekannt sonst könnte man den Schätzwert um den Schätzfehler korrigieren und hätte dann den wahren Wert. Aus Stichproben können die wahren Werte prinzipiell nicht ermittelt, sondern nur geschätzt werden. Stichprobenumfang (sample size). Die Größe des Schätzfehlers hängt ab vom Stichprobenumfang, d.h. von der Anzahl der Fälle in der Stichprobe. Je mehr Fälle die Stichprobe umfasst, desto genauer wird die Schätzung. Wird der Stichprobenumfang immer größer und erreicht schließlich die Fallzahl der Grundgesamtheit (die endlich oder unendlich sein kann), so geht der Schätzwert in den wahren Wert (Parameter) über. Homogenität der Grundgesamtheit. Die Größe des Schätzfehlers hängt auch von der Streuung innerhalb der Grundgesamtheit ab. Bei homogenen Grundgesamtheiten sind die Schätzungen genauer als bei inhomogenen, einfach weil die Streuung innerhalb der Grundgesamtheit an die Stichprobe weitergegeben wird. 13.2 Prinzip des Konfidenzintervalls Abschätzung, wie groß der Zufallsfehler mit einer gewählten Wahrscheinlichkeit höchstens ist. Wie erwähnt, kann die Größe des Zufallsfehlers nicht bestimmt werden. Mit statistischen Verfahren lässt sich aber abschätzen, welche Größe des Zufallsfehlers mit welcher Wahrscheinlichkeit auftritt. Dann muss man sich entscheiden, welches Risiko man bereit ist zu tragen, und eine Vertrauenswahrscheinlichkeit wählen. Damit lässt sich abschätzen, wie groß der Zufallsfehler mit der gewählten Wahrscheinlichkeit höchstens ist. Das Konfidenzintervall wird errechnet aus dem Schätzwert plus maximaler Zufallsfehler nach oben und dem Schätzwert minus maximaler Zufallsfehler nach unten. Damit ist ein Bereich angegeben, in dem der unbekannte wahre Wert mit der gewählten Wahrscheinlichkeit liegt. Namen. Das Konfidenzintervall heißt auch Konfidenzbereich, Vertrauensbereich oder Mutungsintervall, englisch confidence interval. Lateinisch heißt confidere vertrauen.

248 13 Konfidenzintervalle Konfidenzwahrscheinlichkeit. Die Wahrscheinlichkeit, mit der der wahre Wert irgendwo im Konfidenzbereich liegt, heißt Konfidenzwahrscheinlichkeit oder Vertrauenswahrscheinlichkeit. Die Konfidenzwahrscheinlichkeit wird gewählt. Meist wird 0.95 gewählt, gelegentlich aber auch 0.90 oder 0.99. Die Wahrscheinlichkeit, dass der wahre Wert nicht im Konfidenzbereich liegt, heißt Irrtumswahrscheinlichkeit und wird oft mit α bezeichnet. Es gilt Irrtumswahrscheinlichkeit = 1 Konfidenzwahrscheinlichkeit Konfidenzwahrscheinlichkeit = 1 Irrtumswahrscheinlichkeit Darstellung von Konfidenzintervallen. Der wahre Wert, der Parameter, ist fest, aber unbekannt. Der Schätzwert und sein Konfidenzbereich enthalten Zufallsfehler. Dies wird meist folgendermaßen dargestellt: Wobei der Kreis der Schätzwert ist und der Konfidenzbereich durch den Strich dargestellt wird. Nach wie vor ist die Position des wahren Werts unbekannt. Er liegt aber mit der gewählten Konfidenzwahrscheinlichkeit innerhalb des Intervalls. Formelschreibweise. Wsk {ug KI wahrer Wert og KI} = 1 α In Worten: Die Wahrscheinlichkeit, dass der wahre Wert zwischen der unteren Grenze des Konfidenzintervalls (ug KI) und der oberen Grenze des Konfidenzintervalls (og KI) liegt, ist die gewählte Konfidenzwahrscheinlichkeit (1 α). Das Zeichen α wird auch an anderen Stellen für Irrtumswahrscheinlichkeit verwendet. Beispiel für Konfidenzintervall des Medians. An einer Stichprobe vom Umfang n = 100 wurde eine mediane Überlebenszeit von 27.5 Monaten berechnet. Mit 95% Konfidenzwahrscheinlichkeit reicht das Konfidenzintervall von 20.2 bis 37.0 Monaten. Damit ist die wahre mediane Überlebenszeit in der Grundgesamtheit weiterhin unbekannt, jedoch liegt sie mit der gewählten Konfidenzwahrscheinlichkeit von 95% irgendwo zwischen 20.2 und 37.0 Monaten. Mit 95% Wahrscheinlichkeit hat die Stichprobe die mediane Überlebenszeit um nicht mehr als 7.3 Monate überschätzt und um nicht mehr als 9.5 Monate unterschätzt. Die Größe des Konfidenzintervalls hängt ab von der Anzahl der Fälle in der Stichprobe (Stichprobenumfang), der Streuung innerhalb der Grundgesamtheit und von der gewählten Konfidenzwahrscheinlichkeit. Je größer die Konfidenzwahrscheinlichkeit gewählt wird, desto größer wird auch der Konfidenzbereich. Möchte man ganz sicher gehen und wählt als Konfidenzwahrscheinlichkeit 1.0, so erstreckt sich der Konfidenzbereich z.b. des Mittelwerts von minus unendlich bis plus unendlich. Es hilft somit nicht weiter, auf völlige Sicherheit zu gehen. Kenngrößen. Ein Konfidenzintervall kann für nahezu jede statistische Maßzahl berechnet werden. In diesem Buch werden Konfidenzintervalle für Mittelwert, Standardabweichung, Anteile und relative Häufigkeiten und für den Korrelationskoeffizienten vorgestellt. Für die anderen statistischen Kenngrößen sind auch Konfidenzintervalle bekannt und können in der Literatur nachgeschlagen oder mit einer Statistiksoftware berechnet werden. Symmetrie des Konfidenzintervalls. Bei Merkmalen, die im Prinzip von bis + definiert sind, ist das Konfidenzintervall meistens symmetrisch und lässt sich dann darstellen als Schätzwert ± maximaler Zufallsfehler, z.b. 25.3 ± 1.8. Bei Merkmalen, die nur einen bestimmten Definitionsbereich haben, wie z.b. ein Anteil, der nur zwischen 0 und 1 variieren kann, ist das Konfidenzintervall meist asymmetrisch. Vor allem an den Definitionsgrenzen des Merkmals, bei einem Anteil also knapp über 0 und knapp unter 1, wird das Konfidenzintervall stark asymmetrisch.

13.3 Konfidenzintervall des Mittelwerts 249 Punkt- und Intervallschätzer. Die Größe des Konfidenzintervalls wird aus der Stichprobe berechnet und ist deshalb auch nur ein Schätzwert. Der eigentliche Schätzwert wird als Punktschätzer und sein Konfidenzintervall als Intervallschätzer bezeichnet. Kurzschreibweise. Konfidenzintervalle werden sehr häufig verwendet, deshalb gibt es die Kurzschreibweise mit z.b. 95% KI = 10.5 bis 20.1. Dabei geben die 95% die Konfidenzwahrscheinlichkeit an und 10.5 bis 20.1 ist das Konfidenzintervall. Bei symmetrischen Konfidenzintervallen ist auch die Kurzschreibweise 95% KI = 15.3 ± 4.8 üblich. Grenzen des Konfidenzintervalls. Der Konfidenzbereich berücksichtigt nur den Zufallsfehler der Stichprobe sonst nichts! Der Konfidenzbereich deckt nicht ab die systematischen Fehler der Stichprobe, eine falsche Formel, Rechenfehler und sonstige Fehler. Der Konfidenzbereich kann für nahezu alle statistischen Kenngrößen berechnet werden, z.b. für Prävalenzschätzer, Sensitivitätsschätzer, Risikoschätzer, Regressionskoeffizienten usw. 13.3 Konfidenzintervall des Mittelwerts Gedankenversuch zur Verteilung der Mittelwerte aus vielen Stichproben. Man nehme eine unendlich große Grundgesamtheit, ziehe daraus viele Stichproben jeweils vom Umfang n, z.b. n = 100 Fälle und berechne aus jeder der vielen Stichproben den Mittelwert. Natürlich werden die vielen Stichproben leicht unterschiedliche Mittelwerte liefern. Nun betrachten wir die Häufigkeitsverteilung dieser Stichproben-Mittelwerte. Nach dem zentralen Grenzwertsatz (Kap.11.3, S.211) ist es eine Normalverteilung. Der Mittelwert dieser Verteilung der Mittelwerte ist der beste verfügbare Schätzer für den wahren Mittelwert. Die Standardabweichung der Verteilung der Mittelwerte ist aber viel kleiner als die Standardabweichung der Daten. Mit zunehmender Fallzahl in den Stichproben werden die Mittelwerte der einzelnen Stichproben immer genauer geschätzt, sie variieren mit zunehmendem Stichprobenumfang immer weniger. Demzufolge ist die Standardabweichung der Verteilung der Mittelwerte viel kleiner als die Standardabweichung der Daten. Standardfehler des Mittelwerts = standard error of the mean = SEM. Mathematiker können zeigen, dass sich bei diesem Gedankenversuch die Standardabweichung der Verteilung der Mittelwerte nach folgender Formel berechnet: s SEM = n Der SEM lässt sich nach dieser Formel auch berechnen, wenn nicht viele, sondern nur eine einzige Stichprobe vorliegt. Von dieser Stichprobe lässt sich die Standardabweichung s der Daten bestimmen, die Fallzahl n dieser Stichprobe ist ohnehin gegeben, und damit kann der SEM berechnet werden. Bedeutung des SEM. Der SEM ist viel kleiner als die Standardabweichung s der Daten. Eitle Forscher und Autoren geben deshalb lieber den SEM an als die Standardabweichung s, einfach weil die Streuungsbalken kleiner und damit schöner sind. Der Standardfehler eines Schätzers ist eine wichtige theoretische Größe, aber nicht ganz einfach zu interpretieren (siehe obigen Gedankenversuch), da er sowohl von s als auch von n abhängt. Wenn Sie in medizinischer (nicht in mathematischer!) Fachliteratur den SEM finden und Sie finden ihn häufig und daraus schließen, dass der Autor eitel ist und herzlich wenig von Statistik versteht, so ist Ihre Schlussfolgerung fast immer richtig. Im medizinischen Kontext ist die Angabe des SEM fast nie sinnvoll. Ein Spaßvogel ist, wer einen medizinischen Vortragenden, der in seinen Abbildungen den SEM verwendet, bittet, doch den SEM zu erläutern und zu interpretieren, und, wenn der Vortragende nur erklären kann, der SEM werde oft verwendet, anmerkt, dass Vortragende und Autoren ihre eigenen Abbildungen doch verstehen sollten.

250 13 Konfidenzintervalle Verteilung der Mittelwerte. Nachdem bekannt ist, dass die Verteilung der Mittelwerte eine Normalverteilung ist und Schätzwerte für deren Mittelwert und Streuung (SEM) vorliegen, lassen sich die Wahrscheinlichkeiten für die einzelne Mittelwerte ermitteln. Am einfachsten nimmt man die Tabelle der Standardnormalverteilung (Box 11.7, S.219) vom Typ (1 2α) und ermittelt z.b., dass 95% der Werte (hier der Mittelwerte) im Intervall µ ± 2.58 σ liegen, weil 95% aller Werte zwischen z = 2.58 und z = +2.58 liegen. Der Schätzwert für µ ist der Stichprobenmittelwert, der Schätzwert für σ ist der SEM. Das bedeutet, 95% aller Stichprobenmittelwerte liegen zwischen M ± 2.58 SEM. t-verteilung. Aus theoretischen Überlegungen, die hier nicht ausgeführt sind und die damit zusammenhängen, dass M und SEM aus der gleichen Stichprobe geschätzt werden und deshalb nicht unabhängig voneinander sind, ergibt sich, dass für kleinere Fallzahlen anstatt der Normalverteilung eine andere theoretische Verteilung verwendet werden muss, die Student t-verteilung, kurz t-verteilung. Die t-verteilung wurde von William Gosset (1876 bis 1937) unter dem Pseudonym Student eingeführt. Die t-verteilung hat nur einen Parameter, der als Anzahl Freiheitsgrade (Fg) bezeichnet wird, wobei Fg = n 1 ist. Für größere Fallzahlen geht die t-verteilung in die Standard- Normalverteilung über. Für das Konfidenzintervall des Mittelwerts wird sowohl bei kleineren als auch bei größeren Fallzahlen die t-verteilung verwendet. Die t-verteilung ist in Box 13.1 tabelliert. Vertrauens- versus Irrtumswahrscheinlichkeit. Meist wird bei der t-verteilung nicht die hier benötigte Vertrauens- oder Konfidenzwahrscheinlichkeit, sondern die mit α bezeichnete Irrtumswahrscheinlichkeit angegeben. Die Umrechnung ist aber einfach Vertrauenswahrscheinlichkeit = 1 2α. Wurde als Vertrauenswahrscheinlichkeit z.b. 95% gewählt, so ist die Irrtumswahrscheinlichkeit 1 0.95 = 0.05. Die Zahl 2 bei der Irrtumswahrscheinlichkeit α bedeutet zweiseitig und kommt daher, dass das Konfidenzintervall sowohl Unterschätzungen als auch Überschätzungen abdeckt. Konfidenzintervall des Mittelwerts ist Konfidenzintervall = M ± t * SEM wobei M = Stichprobenmittelwert s = Standardabweichung der Stichprobe n = Fallzahl, Stichprobenumfang t kommt aus der t-verteilung (Box 13.1) Wird der SEM nicht als eigene Größe betrachtet, sondern in diese Formel eingesetzt, so ergibt sich: s Konfidenzintervall = M ± t * n wobei M = Stichprobenmittelwert s = Standardabweichung der Stichprobe n = Fallzahl, Stichprobenumfang t kommt aus der t-verteilung (Box 13.1) Für den t-wert wird die gewählte Konfidenzwahrscheinlichkeit (z.b. 95%) beziehungsweise die zweiseitige Irrtumswahrscheinlichkeit (im Bsp. 5%) benötigt und Fg = n 1. Dabei ist n die Fallzahl. Mit diesen zwei Angaben kann der t-wert aus Tabelle in Box 13.1 entnommen oder von einem Programm errechnet werden. Wird ein Programm verwendet, so wird man sich nicht den t-wert, sondern gleich das Konfidenzintervall des Mittelwerts errechnen lassen. Wird das ± aufgelöst, so ergibt sich untere Grenze des Konfidenzintervalls = M t obere Grenze des Konfidenzintervalls = M + t Dabei ist M der (empirische) Mittelwert, s die (empirische) Standardabweichung, n die Fallzahl und t kommt aus der t-tabelle mit der gewählten Konfidenzwahrscheinlichkeit und den (n 1) Freiheitsgraden.