Bereiche der Statistik

Ähnliche Dokumente
Schließende Statistik

Statistik II: Signifikanztests /1

Statistische Tests für unbekannte Parameter

Beurteilende Statistik

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Einführung in Quantitative Methoden

Wahrscheinlichkeitsrechnung und schließende Statistik

8. Konfidenzintervalle und Hypothesentests

Jost Reinecke. 7. Juni 2005

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

R. Brinkmann Seite

Mögliche Fehler beim Testen

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Kapitel 3 Schließende Statistik

Hypothesentest, ein einfacher Zugang mit Würfeln

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Einführung in die Induktive Statistik: Testen von Hypothesen

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Analyse von Querschnittsdaten. Signifikanztests I Basics

Allgemeines zu Tests. Statistische Hypothesentests

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Testen von Hypothesen:

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Pflichtlektüre: Kapitel 12 - Signifikanztest Wie funktioniert ein Signifikanztest? Vorgehensweise nach R. A. Fisher.

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Chi-Quadrat Verfahren

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Analytische Statistik II

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Mathematische und statistische Methoden II

Übungsaufgaben zu Statistik II

Angewandte Statistik 3. Semester

Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Lösungen zu den Übungsaufgaben in Kapitel 10

10 Der statistische Test

1 Dichte- und Verteilungsfunktion

Ablaufschema beim Testen

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Statistik II: Grundlagen und Definitionen der Statistik

Exakter Binomialtest als Beispiel

Übungen mit dem Applet Vergleich von zwei Mittelwerten

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Kapitel VII. Punkt- und Intervallschätzung bei Bernoulli-Versuchen

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

11. Nichtparametrische Tests

Testen von Hypothesen

Willkommen zur Vorlesung Statistik (Master)

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

9 Prinzipien der statistischen Hypothesenprüfung

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Glossar Biometrie / Statistik. Auszug für Fragebogen Fallzahlberechnung/-begründung

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Übungsaufgaben zu Kapitel 5

Statistik und Wahrscheinlichkeitsrechnung

Eine Einführung in R: Statistische Tests

Statistik II. Statistische Tests. Statistik II

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Überblick Hypothesentests bei Binomialverteilungen (Ac)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Zufallsvariablen [random variable]

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Statistik. Jan Müller

Hypothesentests mit SPSS. Beispiel für einen t-test

Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001

Einführung in die computergestützte Datenanalyse

Kapitel 13. Grundbegriffe statistischer Tests

Testen von Hypothesen

Grundlagen der Statistik

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Schließende Statistik: Hypothesentests (Forts.)

1.6 Der Vorzeichentest

Biostatistik, Winter 2011/12

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Statistische Tests zu ausgewählten Problemen

VS PLUS

I. Deskriptive Statistik 1

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

R. Brinkmann Seite

Grundlagen der Inferenzstatistik

Hypothesenbasierende Untersuchungen. Hypothesenbasierende Untersuchungen

Testen von Hypothesen, Beurteilende Statistik

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Mathematik für Biologen

3 Konfidenzintervalle

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Ein- und Zweistichprobentests

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Transkript:

Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden und exploratorischen Statistik auf und ermöglicht den Schluss von einer (oder mehreren) Stichprobe auf eine zugehörige Grundgesamtheit. Basis ist die Wahrscheinlichkeitsrechnung Schätzverfahren statistische Testverfahren Zusammenhangsanalysen Einflussgrößenermittlung

Schließende Statistik Typische Aufgabenstellungen sind: das Schätzen von Parametern, Angabe von Konfidenzintervallen Konfidenzintervalle dienen dem Zweck, die Genauigkeit von Zählungen und Messungen zu bestimmen das Testen von Hypothesen. Wahrscheinlichkeitsverteilung Wie bei Häufigkeitsverteilungen kann die in einer Wahrscheinlichkeitsverteilung enthaltene Information durch Kenngrößen (Parameter) beschrieben werden. Die Parameter der Grundgesamtheit werden meist mit griechischen Buchstaben bezeichnet: z.b. Populationsmittelwert (Erwartungswert) und Varianz 2. Die wichtigsten Wahrscheinlichkeitsverteilungen unter den diskreten sind die Binomialverteilung und die Poissonverteilung, unter den stetigen Verteilungen ist es die Normalverteilung.

Normalverteilung Diese Verteilung hat in der Statistik eine zentrale Bedeutung: Eine Summe von vielen unabhängigen, beliebigen Zufallsvariablen ist angenähert normalverteilt; das bedeutet in der Praxis, dass viele Probleme unter Verwendung der Normalverteilungsannahme gelöst werden können - vorausgesetzt, die Stichprobe ist groß genug. Sie wird häufig verwendet um die Lage und Streuung von Meßwerten zu beschreiben. Die Standardnormalverteilung hat einen Mittelwert von und eine Standardabweichung von Schätzen von Parametern Da man nicht die gesamte Population erfasst, sondern so gut wie immer auf Stichproben von begrenzten Umfang angewiesen ist, muß man sogenannte Schätzungen für die Populationsparameter angeben. Die Kennzahlen, die wir in der deskriptiven Statistik kennengelernt haben, stellen Schätzungen für die Populationsparameter dar. Im Falle der Normalverteilung (oder zumindest eingipfligen, symmetrischen Verteilung) sind das arithmetische Mittel und die Stichprobenvarianz s 2 gute Schätzer für Erwartungswert und Varianz 2 der Population.

Konfidenzintervall Die Punktschätzung liefert einen einzelnen Wert für den unbekannten Parameter. Um Anhaltspunkte für die Genauigkeit der Schätzung (Güte des Mittelwerts der Stichprobe im Vergleich zum wahren Mittelwert zu gewinnen, konstruiert man aus den Daten der Stichprobe ein sogenanntes (1- )-Konfidenzintervall, welches mit einer vorgegebenen Wahrscheinlichkeit 1- den wahren Parameter überdeckt. Dabei gibt die Irrtumswahrscheinlichkeit an, dass das geschätzte Intervall den wahren Parameter nicht überdeckt ( = 5% (bzw. 1%)). Konfidenzintervall Schätzt man beispielsweise den Erwartungswert bei vorausgesetzter Normalverteilung durch den Mittelwert und die Standardabweichung durch s, so bestimmen sich die Grenzen eines (1- ) Konfidenzintervalls für durch x t n 1s / n x t1 / 2, n 1s / 1 / 2, n

Bemerkungen zum Konfidenzintervall Generell sind 3 Faktoren für die Präzision der Schätzung von Bedeutung: Die Irrtumswahrscheinlichkeit : Für = 5% ergibt sich ein schmaleres Intervall als für = 1%. Die Standardabweichung s: Je homogener die Grundgesamtheit, desto kleiner die Standardabweichung und die Breite des Konfidenzintervalls. Der Stichprobenumfang n: Die Schätzung ist umso präziser, je höher der Stichprobenumfang n ist. Allerdings geht dieser Umfang nur als Wurzel von n in die Formel ein - d.h. es ist der 4fache Stichprobenumfang erforderlich, um die Breite des Intervalls zu halbieren. Einführung - Statistischer Test

Statistischer Test Kann ein Unterschied rein zufällig entstanden sein oder können wir davon ausgehen, dass es einen tatsächlichen Unterschied gibt. Kontrollmaßnahme: Konfidenzintervall / Statistischer Test Statistischer Test Mit statistischen Testverfahren kann man überprüfen, ob sich die beobachteten Daten durch zufallsbedingte Abweichungen erklären lassen - weichen nur zufällig von Null ab - Nullhypothese (H 0 ) oder ob die erhobenen Daten für die Vermutung, dass es einen wahren Effekt gibt, sprechen - Alternativhypothese (H 1 ) objektive und nachvollziehbare Entscheidung

Einführungsbeispiel Ein Spieler hat den Verdacht, dass ein Würfel nicht in Ordnung ist. Er würfelt 12mal und zählt die Anzahl der 6er. Nullhypothese (Würfel ist ideal) H 0 : p = 1/6 Alternativhypothese (Würfel ist nicht ideal) H 1 : p 1/6 Unter der Nullhypothese Annahme der Würfel ist ideal Berechnung der Wahrscheinlichkeit für das Auftreten der Augenzahl 6 bei 12 Würfen (Binomialverteilung) Einführungsbeispiel k 0 1 2 3 4 5 >5 P (X = k) 0,11 0,27 0,30 0,20 0,09 0,03 <0,01 P (X k) 0,11 0,38 0,68 0,87 0,96 0,99 Annahmebereich Entscheidung für die Nullhypothese kritischer Bereich Entscheidung für die Alternativhypothese k: Anzahl gewürfelter 6er P(X = k): Wahrscheinlichkeit für k gewürfelte 6er

Einführungsbeispiel Entscheidungsregel: Falls 0 k 4, wird die Nullhypothese nicht abgelehnt Falls k>4, entscheidet man sich für die Alternativhypothese Es wird angenommen, dass das Ergebnis nicht allein auf zufällige Abweichungen zurückgeführt werden kann Anmerkung: Falls die Nullhypothese richtig ist, wird mit einer Wahrscheinlichkeit von 96% eine richtige Entscheidung getroffen. Das Risiko einer Fehlentscheidung beträgt 4%. Fehlentscheidungen beim Testen Fehler 1. Art (Signifikanzniveau): das unberechtigte Ablehnen der Nullhypothese P (Fehler 1. Art) = Fehler 2. Art : das unberechtigte Beibehalten der Nullhypothese P (Fehler 2. Art) =

Fehlentscheidungen beim Testen Entscheidung des Tests H 0 abgelehnt H 0 beibehalten H 0 wahr Fehler 1. Art (α) Richtige Entscheidung (1 α) Wirklichkeit H 0 falsch Richtige Entscheidung (Power) (1 β) Fehler 2. Art (β) p - Wert, signifikantes Ergebnis Der p-wert gibt die Wahrscheinlichkeit an, die vorliegenden oder extremere Studienergebnisse zu beobachten, wenn die Nullhypothese zutrifft. Ein Testergebnis heißt statistisch signifikant, wenn der p-wert unterhalb des vorgegebenen Fehlers 1. Art (meist 0,05) liegt (p ). Signifikant bedeutet also im statistischen Sinne, dass das betreffende Ergebnis nicht durch den Zufall allein erklärbar ist, allerdings unter dem Vorbehalt des Fehlers 1. Art.

Power der Studie Erkennen eines bedeutsamen Effektes d.h. Wahrscheinlichkeit für korrektes Verwerfen der Nullhypothese Geplante Studie: Fallzahlberechnung Ein Effekt vorgegebener Größe soll, wenn er vorhanden ist z.b. mit einer Wahrscheinlichkeit von 90% als signifikant durch den Test beurteilt werden Signifikanz Merke: Vorliegende Signifikanz heißt nicht klinische Relevanz: bei großen Stichprobenumfängen wird auch jeder irrelevante Effekt signifikant. Fehlende Signifikanz heißt nicht: kein Effekt. Bei kleinen Stichprobenumfängen kann auch der Nachweis eines tatsächlich vorhandenen relevanten Effektes misslingen. Die Signifikanz drückt lediglich das Vertrauen aus, dass man darin haben kann, dass ein Effekt nicht vom Zufall vorgegaukelt wird.

Beispiel Unterschied hinsichtlich des Auftretens einer rezidivierende Venethrombose im Zeitraum von 4 Jahren bei 6 monatiger Antikoagulation bzw. 4 jähriger Antikoagulation Rezidiv ja nein Summe 6 Mo 23 88 111 Therapie Indefinite 3 113 116 Summe 26 201 227 Beispiel Chi-Quadrat Test Erwartete Werte unter der Nullhypothese (es gibt keinen Zusammenhang- es besteht Unabhängigkeit): Rezidiv ja nein Summe 6 Mo 23 111 Therapie Indefinite 1. Zelle: 26*111/227 = 12,7 Summe 26 227

Beispiel Chi-Quadrat Test ( O E E 2 2 ) O: observed (beobachtete Werte); E: expected (erwartete Werte) In unserem Fall: 2 (23 12,7) 12,7 2 (3 13,3) 13,3 2 (88 98,3) 98,3 2 (113 102,7) 102,7 Kritischer Wert von 2 bei 2x2 Tafeln: 3,84 bei =0,05 2 18,4 p<0,001 Interpretation Wenn die Nullhypothese wahr ist, ist die Wahrscheinlichkeit kleiner als 0,001 einen gleichen oder größeren Chi-Quadrat Wert als den aus den Beobachtungen berechneten zu erhalten. Unser Ergebnis spricht gegen die Nullhypothese wir gehen davon aus, dass es einen Unterschied gibt

Prinzipielle Vorgehensweise Formulierung der Hypothesen Nullhypothese - Alternativhypothese (innovativer Ansatz) Wahl des Signifikanzniveaus (üblich =5%) Wahl des Testverfahrens Durchführung des Tests und Entscheidung Auswahl der Testverfahren Merkmalsart: quantitativ / qualitativ Verteilungstyp: parametrisch (Normalverteilung) nicht-parametrisch (verteilungsunabhängig) Anzahl der Stichproben: eine, zwei, mehrere unabhängige oder abhängige (verbundene) Stichproben!!! Testverfahren haben Voraussetzungen!!!

Tests auf Lageunteschiede Anzahl und Art der Stichproben parametrische Testverfahren (Normalverteilung) quantitative Zielgröße nichtparametrische Testverfahren eine Stichprobe Einstichproben t-test Wilcoxon-Vorzeichen Rangsummentest 2 verbundene t-test für verbundene Wilcoxon-Vorzeichen- Stichproben Stichproben Rangsummentest 2 unabhängige Stichproben > 2 verbundene Stichproben >2 unabhängige Stichproben t-test für unabhängige Stichproben (Gleichheit der Varianzen), Welch-Test Varianzanalyse (randomisierte Blockanlage) Varianzanalyse Wilcoxon Rangsummentest (U-Test von Mann und Whitney) Friedman Test Kruskal-Wallis Test qualitative Zielgröße Binomialtest Mc Nemar Test Chi-Quadrat Test Fishers Exakter Test für 2x2 Tafel T-Test für 2 unabhängige Stichproben t-test für 2 unabhängige Stichproben: Hypothesen: H 0 : 1 = 2 H 1 : 1 2 Voraussetzungen: Die Beobachtungen der beiden Gruppen stammen aus unabhängigen normalverteilten Beobachtungen mit Mittelwerten µ 1 und µ 2 und die Standardabweichungen sind gleich 1 = 2, aber unbekannt.