Statistik Teil 6 - Statistisches Testen

Ähnliche Dokumente
Primärer Endpunkt Fallzahlkalkulation...

Tutorial: Homogenitätstest

Grundlagen der Inferenzstatistik

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Statistik II für Betriebswirte Vorlesung 2

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Statistische Auswertung:

Auswertung mit dem Statistikprogramm SPSS:

The promotion of perceived physical ability via an intervention using internal teacher frame of reference in

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Kostenreduktion durch Prävention?

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Ein möglicher Unterrichtsgang

9. Schätzen und Testen bei unbekannter Varianz

Einführung Physiotherapie

Tools in a Clinical Information System Supporting Clinical Trials at a Swiss University Hospital (Clin Trials, published online 12 August 2014)

Eine Einführung in R: Statistische Tests

Statistik für Studenten der Sportwissenschaften SS 2008

Überblick über die Verfahren für Ordinaldaten

Übungen zur Veranstaltung Statistik 2 mit SPSS

Academic Skills - Befragung und Auswertung

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Einkommensaufbau mit FFI:

Klausur BWL V Investition und Finanzierung (70172)


Security Patterns. Benny Clauss. Sicherheit in der Softwareentwicklung WS 07/08

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Einstellungen zu Gesundheitssystemen und Ungleichheiten in der Inanspruchnahme von Gesundheitsleistungen im internationalen Vergleich

1.1 IPSec - Sporadische Panic

Survival Analysis (Modul: Lebensdaueranalyse)

Ein Schritt von zu Hause zur Arbeit

Abitur 2007 Mathematik GK Stochastik Aufgabe C1

Academic Careers In Medicine Which Factors Influence Academic Career Interest in Medical Doctoral Graduates?

Zertifikate: Nutzen für wen?

Medizinische Klinik II Medizinische Klinik IV

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

miditech 4merge 4-fach MIDI Merger mit :

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

SCHÖNE ZÄHNE. Lebensqualität mit Zahnimplantaten 1

The promotion of perceived physical ability via an intervention using internal teacher frame of reference in physical education

Biochemical relapse after local treatment for prostate cancer: isolated or systemic relapse?

Für AX 4.0, den letzten Hotfix rollup einspielen. Der Hotfix wurde das erste Mal im Hotfix rollup eingeschlossen:

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Statistische Thermodynamik I Lösungen zur Serie 1

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

A-CERT CERTIFICATION SERVICE

Risk of Suicide after Bariatric Surgery

TalkIT: Internet Communities Tiroler Zukunftsstiftung Donnerstag,


Personalisierte Medizin Ende der Solidarität? Heiner Raspe Seniorprofessur für Bevölkerungsmedizin

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Business Value Launch 2006

Zum Download von ArcGIS 10, 10.1 oder 10.2 die folgende Webseite aufrufen (Serviceportal der TU):

Mit Legacy-Systemen in die Zukunft. adviion. in die Zukunft. Dr. Roland Schätzle

Klinische Forschung. Klinische Forschung. Effectiveness Gap. Versorgungsforschung und evidenzbasierte Medizin. Conclusion

Teil VIII Hypothesentests für zwei Stichproben

Wissenschaftliche Dienste. Sachstand. Payment of value added tax (VAT) (EZPWD-Anfrage ) 2016 Deutscher Bundestag WD /16

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Publikation 2: Predictive Validity of Pressure Ulcer Risk Assessment Tools in Intensive Care Patients

Preisliste für The Unscrambler X

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Studentische Versicherung. Kathrin Cuber AOK Südlicher Oberrhein

KURZANLEITUNG. Firmware-Upgrade: Wie geht das eigentlich?

1.1 VoIP - Kein Notruf möglich. 1.2 VoIP - Vorrang von Notrufen

Englisch. Schreiben. 18. September 2015 HTL. Standardisierte kompetenzorientierte schriftliche Reife- und Diplomprüfung. Name: Klasse/Jahrgang:

Das neue Volume-Flag S (Scannen erforderlich)

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Stichprobenauslegung. für stetige und binäre Datentypen

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird.

2013 Dr. Dietmar Bayer 1

Rolle und Aktivitäten der ICRP und von UNSCEAR

Wenn Russland kein Gas mehr liefert

Darstellung eines VAR(p)-Prozesses als VAR(1)-Prozess

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Stellvertretenden Genehmiger verwalten. Tipps & Tricks

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Die chemische Natur der Pigmente aus photosynthetischen Reaktionszentren von Rhodospirillum ruhrum G-9+

Algorithms & Datastructures Midterm Test 1

Mitglied der Leibniz-Gemeinschaft

Inequality Utilitarian and Capabilities Perspectives (and what they may imply for public health)

Critical Chain and Scrum

Anleitung für Lehramtsstudierende. Anmeldung von Abschlussarbeiten

p^db=`oj===pìééçêíáåñçêã~íáçå=

Umfrage BKK Umfrage Themen: Chronisch Kranke Krankenhausversorgung. Erhebungszeitraum: Juli 2015

Semantic Web. RDF, RDFS, OWL, and Ontology Engineering. F. Abel, N. Henze, and D. Krause IVS Semantic Web Group

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Händler Preisliste Trade Price List 2015

Die Suche nach dem geeigneten Arzt Nutzbarkeit von Arztbewertungs- und Krankenhausvergleichsportalen. Prof. Dr. Uwe Sander

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Study guide written by René Koglbauer

Transkript:

Statistik Teil 6 - Statistisches Testen Ulrich Schrader http://info.ulrich-schrader.de Statistisches Testen Situation 2 Populationen aus denen jeweils eine Stichprobe gezogen wird. Ein Merkmal X wird in beiden Stichproben beobachtet. Frage Unterscheidet sich der Erwartungswert des Merkmals in den beiden Populationen? 2 Hypothesen "Die Erwartungswerte unterscheiden sich nicht in den beiden Populationen." - Nullhypothese H 0 "Die Erwartungswerte unterscheiden sich in den beiden Populationen." - Alternativhypothese H 1 1

z.b. Therapie A Population A E A (X) Population B E B (X) Frage : E Stichprobe A (X) E ( X A B H ) oder EA(X) EB ( X ) oder 1 H0 z.b. Unterscheidet sich das erwartete Ergebnis bei Therapie A von dem bei Therapie B? z.b. Therapie B Stichprobe B Entscheidungsmatrix Es liegt tatsächlich vor Entscheidung für H 0 kein Unterschied H 1 Unterschied H 0 kein Unterschied H 1 Unterschied richtige Entscheidung (1 - ) falsch positive Entscheidung Fehler 1. Art falsch negative Entscheidung Fehler 2. Art richtige Entscheidung (1 - ) Ein statistischer Test ist eine Entscheidungsregel, welche die Wahrscheinlichkeit für einen Fehler 1. Art kleiner als einen vorgegebenen Wert hält und die Wahrscheinlichkeit für einen Fehler 2. Art möglichst gering hält. 1- : Signifikanzniveau : Irrtumswahrscheinlichkeit 1- : Güte/Mächtigkeit des Tests 2

Vorgehen beim statistischen Testen 1. Schritt Formulierung der Hypothesen Alternativhypothese und Nullhypothese Festlegung der noch zulässigen Irrtumswahrscheinlichkeit α (Fehler 1. Art) Wahrscheinlichkeit eines Fehlers im Fall der Entscheidung für die Alternativhypothese H 1 ) Bestimmt sich aus den möglichen Folgen einer Fehlentscheidung Auswahl eines geeigneten Tests Fehler 2. Art β möglichst klein bei vorgegebenem Signifikanzniveau (1 - α) (Möglichst mächtiger Test) Vorgehen beim statistischen Testen 2. Schritt Annahme (willkürlich) H 0 gilt (kein Unterschied) (Konservativ: Die neue Therapie macht keinen Unterschied) Berechnung einer Prüfgröße, deren Verteilung bekannt ist, wenn die Annahme H 0 erfüllt ist, aus den Werten der Stichproben. 3

Vorgehen beim statistischen Testen 3. Schritt Verwerfen der ursprünglichen (willkürlichen) Annahme, H 0 soll gelten, wenn der Wert für die Prüfgröße gemäß der bekannten Verteilung nicht erwartet wird. Dann Alternativhypothese H 1 annehmen. Sonst H 0 beibehalten. Konservativer Ansatz. Statistischer Test Verteilung der Prüfgröße - H 0 gilt 2 Werte lassen sich gut durch die Annahme H 0 gilt erklären. 1 2 H 0 wird beibehalten Unerwartete Werte H 0 wird verworfen H 1 wird angenommen Unerwartete Werte H 0 wird verworfen H 1 wird angenommen 4

p-wert Oft als Ergebnis eines statistischen Tests angegeben. Geringste Irrtumswahrscheinlichkeit, deren Festlegung mit den beobachteten Stichprobenwerten gerade noch zur Verwerfung der Nullhypothese geführt hätte. 5

Beispiel IM Rosen, et al. : Prenatal breastfeeding education and breastfeeding outcomes. MCN. The American Journal of Maternal Child Nursing, Vol. 33, No. 5. (008), pp. 315-319. PURPOSE: To examine the impact of various breastfeeding outcomes of three cohorts receiving different methods of prenatal breastfeeding education. METHODS: Retrospective cohort design with patients attending a breastfeeding education class at an Army medical center. Controls were matched for sponsor rank, marital status, and smoking status. One hundred ninety-four mothers who expressed intent to breastfeed received breastfeeding education as follows: (a) a class that used video demonstration and group teaching by a lactation consultant, (b) a new mothers' support group with one-on-one teaching prenatally and weekly meetings postpartum, taught by a lactation consultant and a pediatrician, and (c) a control group educated at prenatal visits only. Descriptive statistics, chi-square, ANOVA, unpaired t test, and logistic regression were used to analyze the data. RESULTS: Women who attended prenatal breastfeeding classes had significantly increased breastfeeding at 6 months when compared to controls (p =.01). There was no significant difference in rates between types of classes offered (p =.45). CLINICAL IMPLICATIONS: Prenatal breastfeeding education can influence the amount of time women breastfeed. All providers of prenatal care should consider offering such classes in order to improve breastfeeding rates. Tests mit unabhängigen/paarigen Stichproben Unabhängige Stichproben Beobachtungseinheiten der einen Stichprobe haben keinen Beziehung zu Beobachtungseinheiten der anderen Stichprobe Indiz: Stichprobenanzahlen unterschiedlich Paarige Stichproben Jede Beobachtungseinheit der einen Stichprobe hat genau eine korrespondierende Beobachtungseinheit in der anderen Stichprobe. Typisch: Vorher/Nachher Mutter in der einen, Kind in der anderen Stichprobe Zwillinge Notwendig: Stichprobenanzahlen gleich 6

Paarige Stichproben Stichprobe A Stichprobe B Übersicht über wichtige statistische Testverfahren Merkmal Prüfgröße Unabhängige SP Paarige SP Quantitativ, normalverteilt, ähnl. Streuung Quantitativ, beliebig verteilt Ordinal Nominal (dichotom, zweiwertig) Häufigkeiten t-verteilt χ 2 -verteilt Student's t-test für unabh. SP Wilcoxon Rang-Test für unabh. SP Wilcoxon Rang-Test für unabh. SP standardnormalverteilt standardnormalverteilt Chi-Quadrat- Vierfeldertest Student's t-test für paarige SP Wilcoxon Rang-Test für paarige SP Wilcoxon Rang-Test für paarige SP Vorzeichentest 7

Beispiel MY Chang, CH Chen, KF Huang: Effects of music therapy on psychological health of women during pregnancy. Journal of clinical nursing, Vol. 17, No. 19. (October 2008), pp. 2580-2587. AIMS AND OBJECTIVES: The purpose of this study was to examine the effects of music therapy on stress, anxiety and depression in Taiwanese pregnant women. BACKGROUND: The value of music therapy is slowly being realized by nurses in various clinical areas, including obstetrics. Previous studies have demonstrated a high prevalence of psychological stress during pregnancy. [...] DESIGN: A randomized experimental study design was developed and implemented. METHODS: Two hundred and thirty-six pregnant women were randomly assigned to music therapy (n = 116) and control (n = 120) groups. The music therapy group received two weeks of music intervention. The control group received only general prenatal care. Psychological health was assessed using three self-report measures: Perceived Stress Scale (PSS), State Scale of the State- Trait Anxiety Inventory (S-STAI) and Edinburgh Postnatal Depression Scale (EPDS). RESULTS: In a paired t-test, the music therapy group showed significant decrease in PSS, S-STAI and EPDS after two weeks. The control group only showed a significant decrease in PSS after two weeks. This decrease was not as substantial as in the experimental group. [...] CONCLUSIONS: This controlled trial provides preliminary evidence that two-week music therapy during pregnancy provides quantifiable psychological benefits. RELEVANCE TO CLINICAL PRACTICE: The findings can be used to encourage pregnant women to use this cost-effective method of music in their daily life to reduce their stress, anxiety and depression. Further research is needed to test the long-term benefits. Beispiel CL Dennis, et al.: Effect of peer support on prevention of postnatal depression among high risk women: multisite randomised controlled trial. BMJ (Clinical research ed.), Vol. 338 (2009) OBJECTIVE: To evaluate the effectiveness of telephone based peer support in the prevention of postnatal depression. DESIGN: Multisite randomised controlled trial. SETTING: Seven health regions across Ontario, Canada. PARTICIPANTS: 701 women in the first two weeks postpartum identified as high risk for postnatal depression with the Edinburgh postnatal depression scale and randomised with an internet based randomisation service. I NTERVENTION: Proactive individualised telephone based peer (mother to mother) support, initiated within 48-72 hours of randomisation, provided by a volunteer recruited from the community who had previously experienced and recoveredfrom self reported postnatal depression and attended a four hour training session. MAIN OUTCOME MEASURES: Edinburgh postnatal depression scale, structured clinical interview-depression, state-traitanxiety inventory, UCLA loneliness scale, and use of health services. RESULTS: After web based screening of 21 470 women, 701 (72%) eligible mothers were recruited. A blinded researchnurse followed up more than 85% by telephone, including 613 at 12 weeks and 600 at 24 weeks postpartum. At 12 weeks, 14% (40/297) of women in the intervention group and 25% (78/315) in the control group had an Edinburgh postnatal depression scale score >12 (chi(2)=12.5, P<0.001; number need to treat 8.8, 95% confidence interval 5.9 to 19.6; relativerisk reduction 0.46, 95% confidence interval 0.24 to 0.62). [...] Of the 221 women in the intervention group who received and evaluated their experience of peer support, over 80% were satisfied and would recommend this support to a friend. CONCLUSION: Telephone based peer support can be effective in preventing postnatal depression among women at high risk. 8