Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Ähnliche Dokumente
Mögliche Fehler beim Testen

Beurteilende Statistik

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Analytische Statistik II

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

8. Konfidenzintervalle und Hypothesentests

Jost Reinecke. 7. Juni 2005

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Chi-Quadrat Verfahren

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Lösungen zu den Übungsaufgaben in Kapitel 10

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

TESTEN VON HYPOTHESEN

methodenlehre ll Grenzen des Signifikanztests methodenlehre ll Grenzen des Signifikanztests

Chi Quadrat-Unabhängigkeitstest

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

1. rechtsseitiger Signifikanztest

Statistik II. Statistische Tests. Statistik II

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001

Hypothesentest, ein einfacher Zugang mit Würfeln

Eine Einführung in R: Statistische Tests

e) Beim klassischen Signifikanztest muß die Verteilung der Prüfgröße unter der Nullhypothese

Testentscheidungen. Worum geht es in diesem Modul? Kritische Werte p-wert

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0

Angewandte Statistik 3. Semester

Mathematik für Biologen

Dipl.-Volksw. Markus Pullen Wintersemester 2012/13

Tutorial: Vergleich von Anteilen

Bivariate Zusammenhänge

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Biometrische Planung von Versuchsvorhaben

Kapitel 5: Einfaktorielle Varianzanalyse

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

6. Übung Statistische Tests Teil 1 (t-tests)

Test auf einen Anteilswert (Binomialtest) Vergleich zweier Mittelwerte (t-test)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Mathematik für Biologen

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Fehlerwahrscheinlichkeiten

Mathematische und statistische Methoden II

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Hypothesentests mit SPSS. Beispiel für einen t-test

Aufgaben zu Kapitel 9

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Scheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik

an, anderfalls wird sie verworfen. Bestimmen Sie den Fehler 1. und 2. Art. Bestimmen Sie zu obigem Beispiel jeweils den Anahmebereich a 0; 1;...

Grundlegende Eigenschaften von Punktschätzern

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Test auf Varianzgleichheit (F-Test) (einseitiger Test!!)

Übung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell

9. Schätzen und Testen bei unbekannter Varianz

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Statistik. Jan Müller

Übungsaufgaben zu Statistik II

8. G*Power. power3/ 8. Stichprobenumfang, Effekt- und Teststärke

Statistik-Übungsaufgaben

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende

Ein möglicher Unterrichtsgang

11 Tests zur Überprüfung von Mittelwertsunterschieden

I. Deskriptive Statistik 1

Aufgaben zu Kapitel 7:

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße

Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Stichprobenauslegung. für stetige und binäre Datentypen

Statistische Signifikanz versus Klinische Relevanz der Sch(l)uss von der Studie in die Realität

Tutorial: Rangkorrelation

Literatur: Glantz, S.A. (2002). Primer of Biostatistics. New York: McGraw-Hill.

Mammographie-Screening in der Diskussion um Nutzen und Schaden: Was glauben wir und was wissen wir über den Nutzen?

Zur Statistik im neuen Genehmigungsantrag

Das Konfidenzintervall (Confidence Interval CI) Vertrauen schaffen, Signifikanz erkennen Autor: Beat Giger

Diskrete Wahrscheinlichkeitstheorie - Probeklausur

Was bedeutet p<0.05?

9. StatistischeTests. 9.1 Konzeption

DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

12.1 Wie funktioniert ein Signifikanztest?

6. Faktorenanalyse (FA) von Tests

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Willkommen zur Vorlesung Statistik (Master)

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

Statistik für SozialwissenschaftlerInnen II p.85

Übungsbuch Statistik für Dummies

15 Wahrscheinlichkeitsrechnung und Statistik

Anhang 4. Bias durch Überdiagnose von papillären Mikrokarzinomen

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Grenzen für x -s-regelkarten

Kapitel 5: Einfaktorielle Varianzanalyse

Statistik II. Aufgabe 1

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Transkript:

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1 PD Dr. Thomas Friedl Klinik für Frauenheilkunde und Geburtshilfe, Universitätsklinikum Ulm München, 23.11.2012

Inhaltsübersicht Allgemeine Bemerkungen Begriffsklärungen: Testhypothesen, Prüfgröße, p-wert, Signifikanzniveau, Fehler 1. und 2. Art Fallzahlberechnung Beispiel einer einfachen Fallzahlberechnung Statistische Überlegungen: Inhaltsübersicht

Zu empfehlen: Statistische Überlegungen

Allgemeine Bemerkungen Statistische Tests machen meist Aussagen zum Vergleich zwischen zwei oder mehr Stichproben Diese Aussagen werden aufgrund der Daten der Stichproben getroffen, sollen aber für die Grundgesamtheiten gelten Stichprobe: Menge aller Beobachtungseinheiten, die im Versuch tatsächlich beobachtet werden Grundgesamtheit: Menge der Beobachtungseinheiten, über die anhand der Ergebnisse eines Versuchs Aussagen gemacht werden sollen Mit Hilfe der schließenden Statistik sollen anhand einer Stichprobe Aussagen über die Grundgesamtheit gemacht werden. Die berechneten Parameter der Stichprobe liefern dabei eine Schätzung für die wahre Verteilung in der Grundgesamtheit Statistische Überlegungen: Allgemeine Bemerkungen

Formulieren von Hypothesen Diejenige Hypothese, auf Grund derer eine Untersuchung überhaupt durchgeführt wird, bezeichnet man als Alternativhypothese H 1 (meist ein postulierter Unterschied bzw. Behandlungseffekt, welcher mit der Studie belegt werden soll) Die dazu komplementäre Hypothese (kein Unterschied, kein Behandlungseffekt) bezeichnet man als Nullhypothese H 0 Statistische Überlegungen: Formulieren von Hypothesen

Prüfgröße und p-wert Berechnen der Prüfgröße aus den vorliegenden Daten mit einem für die Fragestellung und die Daten geeigneten statistischen Test Bestimmung des durch die Prüfgröße gegebenen p-werts (anhand von Tabellen oder mit einer Statistiksoftware) p-wert Irrtumswahrscheinlichkeit (Die Wahrscheinlichkeit, mit der man einem Irrtum unterliegt, wenn man die Nullhypothese ablehnt) Statistische Überlegungen: Prüfgröße und p-wert

Signifikanzniveau α Legt fest, ab welchem p-wert (also ab welcher Irrtumswahrscheinlichkeit) die Nullhypothese abgelehnt werden kann ( Wenn die Wahrscheinlichkeit gering ist, mich zu irren, wenn ich die Nullhypothese ablehne, kann ich sie ablehnen und damit die Alternativhypothese annehmen. ) In Biologie und Medizin legt man normalerweise das Signifikanzniveau auf α = 0.05 (bzw. α = 5%) fest. das Risiko einer Fehlentscheidung bei der Ablehnung der Nullhypothese beträgt dann 5% Statistische Überlegungen: Signifikanzniveau α

Testentscheidung Wirklichkeit Testentscheidung H 0 richtig H 1 richtig für H 0 für H 1 Richtige Entscheidung 1 - α Falsch positiv Fehler 1. Art α Falsch negativ Fehler 2. Art β Richtige Entscheidung 1 - β Statistische Überlegungen: Testentscheidung

Fehler 1. und 2. Art Fehler 1. Art (α Fehler, falsch positive Entscheidung): Annahme der Alternativhypothese (d.h. Postulierung eines Unterschieds bzw. Effekts) wenn in Wirklichkeit die Nullhypothese richtig ist (also kein Unterschied bzw. Effekt existiert) Fehler 2. Art (β Fehler, falsch negative Entscheidung): Beibehaltung der Nullhypothese (kein Unterschied bzw. Effekt) obwohl in Wirklichkeit die Alternativhypothese richtig ist (also tatsächlich ein Unterschied bzw. Effekt existiert); Teststärke ( Power ) = 1 - β Statistische Überlegungen: Fehler 1. und 2. Art

Fallzahlberechnungen Internationale Standards zur Durchführung von klinischen Studien mit Medikamenten/Medizinprodukten schreiben Fallzahlplanungen vor. Gesucht wird jeweils die notwendige Fallzahl (= Stichprobengröße), um einen vorher bestimmten medizinisch relevanten Unterschied auf einem vorher bestimmten Signifikanzniveau (α) mit einer vorher bestimmten Teststärke (1 - β) nachweisen zu können. Statistische Überlegungen: Fallzahlberechnungen

Fallzahlberechnungen - Beispiel In einer zweiarmigen klinischen Studie soll an Patienten mit akutem Herzinfarkt eine neue Therapie mit der Standardtherapie verglichen werden (zwei unabhängigen Gruppen: Patienten mit Standardtherapie oder mit neuer Therapie) Zielkriterium ist die Hospitalmortalität nach 28 Tagen (dichotomes Merkmal gestorben ja / nein) χ 2 -Vierfelder-Test Statistische Überlegungen: Fallzahlberechnungen - Beispiel

Exkurs - Prinzip des χ 2 -Vierfelder-Tests: Vergleich der beobachteten Häufigkeiten mit den unter der Nullhypothese H 0 zu erwartenden Häufigkeiten Tod innerhalb von 28 Tagen ja nein Randsummen Standardtherapie a b n 1 = a + b Neue Therapie c d n 2 = c + d Randsummen a + c b + d n = a + b + c + d Statistische Überlegungen: Exkurs χ 2 -Vierfelder-Test

Statistische Überlegungen: Fallzahlberechnungen - Beispiel

Fallzahlberechnungen - Beispiel Mortalität unter Standardtherapie 20% P 2 = 0.2 Medizinisch relevanter Unterschied, den man mit der Studie nachweisen will: Senkung der Hospitalmortalität um 8% P 2 - P 1 = 0.08 P 1 = 0.12 Q 1 = 1 P 1 Q 1 = 0.88 Q 2 = 1 P 2 Q 2 = 0.8 P = (P 1 + P 2 )/2 P = 0.16 Q = 1 P Q = 0.84 Statistische Überlegungen: Fallzahlberechnungen - Beispiel

Fallzahlberechnungen - Beispiel Statistische Überlegungen: Fallzahlberechnungen - Beispiel

Fallzahlberechnungen - Beispiel Formulierung dieser Fallzahlkalkulation für das Studienprotokoll: Es wird angenommen, dass die Hospitalmortalität nach einem Herzinfarkt bei Behandlung mit der Standardtherapie bei etwa 20% liegt (Referenz). In dieser Studie soll mit einem vorgegebenen Signifikanzniveau von α = 5% eine Verringerung der Hospitalmortalität bei Behandlung mit der neuen Therapie um 8% auf 12% mit einer Teststärke von 80% entdeckt werden können. Zur Überprüfung der Hypothese mittels eines χ 2 -Vierfelder-Tests ist eine Fallzahl von ca. 328 Patienten pro Behandlungsarm erforderlich. Statistische Überlegungen: Fallzahlberechnungen - Beispiel

Fallzahlberechnungen Folgende Faktoren beeinflussen den Stichprobenumfang: Signifikanzniveau α: Je kleiner α desto größer n (meist α = 0.05 bzw. 0.01) Teststärke 1 - β: Je größer die Teststärke 1 - β desto größer n (meist 0.8 bzw. 0.9) Mittelwertsunterschied: je kleiner der klinisch relevante Unterschied desto größer n. Statistische Überlegungen: Fallzahlberechnungen

P1 (Wahrscheinlichkeit für Ereignis nach neuer Therapie) Fallzahlberechnungen P2 (Wahrscheinlichkeit für Ereignis nach Standardtherapie) Benötigtes n pro Gruppe 0.05 0.10 435 0.08 0.10 3210 0.10 0.20 200 0.12 0.20 328 0.15 0.20 904 0.18 0.20 6032 0.80 0.90 200 0.85 0.90 686 0.88 0.90 3840 Statistische Überlegungen: Fallzahlberechnungen