Mögliche Fehler beim Testen

Ähnliche Dokumente
Stochastik in G8. Wichtige Grundlagen dafür werden schon in den Standards 10 gelegt. Welche Möglichkeiten bietet der GTR?

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Beurteilende Statistik

Hypothesentest, ein einfacher Zugang mit Würfeln

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Testen von Hypothesen, Beurteilende Statistik

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Einführung in Quantitative Methoden

Hypothesentest. Ablehnungsbereich. Hypothese Annahme, unbewiesene Voraussetzung. Anzahl Kreise

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Allgemeines zu Tests. Statistische Hypothesentests

Beurteilende Statistik

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

9 Prinzipien der statistischen Hypothesenprüfung

Kapitel III: Einführung in die schließende Statistik

Typ I und Typ II Fehler

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistische Tests (Signifikanztests)

Stochastik: Hypothesentest Stochastik Testen von Hypothesen (einseitiger Test) allgemein bildende Gymnasien J1/J2

Serie 9, Musterlösung

2) Ihr Chef schlägt vor, dass die Firma nicht Lieferant werden soll, wenn

R. Brinkmann Seite

R. Brinkmann Seite

Signifikanztest zum Testen einer Nullhypothese H 0

9 Prinzipien der statistischen Hypothesenprüfung

Statistik II für Betriebswirte Vorlesung 1

5. Seminar Statistik

Bereiche der Statistik

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Mathematik für Biologen

R. Brinkmann Seite

1,64 1,96 2,56. Statistik. Cusanus-Gymnasium Wittlich Faustregeln

Grundlagen der schließenden Statistik

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Jost Reinecke. 7. Juni 2005

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen

So berechnen Sie einen Schätzer für einen Punkt

Bereiche der Statistik

Methodenlehre. Vorlesung 13. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Alternativtest Einführung und Aufgabenbeispiele

Abitur 2015 Mathematik NT Stochastik S I

Lösungen zum Aufgabenblatt 14

Kapitel VIII - Tests zum Niveau α

Schließende Statistik

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Wahrscheinlichkeitsrechnung und Statistik

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Grundlagen der Statistik

Statistik-Notfallkit für Schüler und Lehrer

Statistische Tests für unbekannte Parameter

Analytische Statistik II

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Abiturvorbereitung Alkoholsünder, bedingte Wahrscheinlichkeit, Hypothesentest Aufgabenblatt

Statistische Tests für unbekannte Parameter

Testen von Hypothesen:

SozialwissenschaftlerInnen II

3 Grundlagen statistischer Tests (Kap. 8 IS)

Statistisches Testen: Signifikanz und Relevanz Christiane Spiel

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Fit for Abi & Study Stochastik

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Grundlagen der Statistik

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

Kugelschreiber-Aufgabe Bayern LK 1986

Mögliche Einstiege und Grundprinzip

"Korrelation" bei Nominaldaten: Kontingenz

TESTEN VON HYPOTHESEN

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Biostatistik, Winter 2011/12

Schließende Statistik: Hypothesentests (Forts.)

WB 11 Aufgabe: Hypothesentest 1

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Analyse von Querschnittsdaten. Signifikanztests I Basics

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Testen von Hypothesen

Auswertung und Lösung

Statistik II. IV. Hypothesentests. Martin Huber

T-Test für unabhängige Stichproben

Kapitel 3 Schließende Statistik

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Wahrscheinlichkeit und Statistik BSc D-INFK

Statistische Tests Übersicht

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Macht des statistischen Tests (power)

Güteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer

Statistische Tests Version 1.2

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

How To Find Out If A Ball Is In An Urn

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Ablaufschema beim Testen

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Transkript:

Mögliche Fehler beim Testen Fehler. Art (Irrtumswahrscheinlichkeit α), Zusammenfassung: Die Nullhypothese wird verworfen, obwohl sie zutrifft. Wir haben uns blamiert, weil wir etwas Wahres abgelehnt haben. Dieser Fehler ist kontrollierbar. Signifikanzniveau: Obere Schranke für die Irrtumswahrscheinlichkeit. Statistische Signifikanz: In der Statistik heißen Unterschiede oder Zusammenhänge signifikant, wenn die Wahrscheinlichkeit gering ist, dass sie durch Zufall zustande gekommen sind. Fehler 2. Art (β): Der ehemalige Mitarbeiter verrät dem Kommissar, dass die Wahrscheinlichkeit für eine 6 sogar nur /8 beträgt. Der Kommissar kommt ins Grübeln: Stichprobenumfang: 00; Stichprobenergebnis: 0 Sechsen Signifikanzniveau: 5 %; Ablehnungsbereich: {0; ; ; 0} Entscheidung: Ich halte den Würfel für gefälscht, die Irrtumswahrscheinlichkeit beträgt 4,3%. Wie groß war die Gefahr, dass ich solch einen gefälschten Würfel nicht entdecke? Die Anzahl der Sechsen ist bei dem gefälschten Würfel B00;/8-verteilt. Bei einem Stichprobenergebnis ; 2; ; 00 hätte ich den gefälschten Würfel nicht entdeckt. Fester Ablehnungsbereich {0; ; ; 0}! Verteilung gemäß Nullhypothese mit p = /6 Tatsächliche Verteilung mit p = /8

Mit einer Wahrscheinlichkeit von etwa 72 % wird ein gefälschter Würfel nicht entdeckt! Mit einer Wahrscheinlichkeit von etwa 72 % wird die Nullhypothese nicht abgelehnt, obwohl sie falsch ist! (Fehler 2. Art) Rechnerische Bestimmung des Fehlers 2. Art Die Anzahl der Sechsen ist bei dem gefälschten Würfel B00;/8-verteilt. Bei einem Stichprobenergebnis ; 2; ; 00 wird der gefälschte Würfel nicht entdeckt. Nullhypothese H 0 : Der Würfel ist in Ordnung. Alternativhypothese H : Der Würfel ist gefälscht. Es gelte die Annahme p ' =. 8 Gesucht: Die Wahrscheinlichkeit β dafür, dass nicht abgelehnt wird, obwohl H falsch ist. H0 0 X ': Anzahl der Sechsen beim gefälschten Würfel. β = PX ( ' > 0) mit p ' =. 8 β = PX ( ' > 0) = PX ( ' 0) 0, 79. X ' ist -verteilt. B 00;/8 Mit einer Wahrscheinlichkeit von 72 % wird ein gefälschter Würfel nicht entdeckt. Mit einer Wahrscheinlichkeit von 72 % wird also die Nullhypothese nicht verworfen, obwohl sie falsch ist. Der Fehler 2. Art beträgt 72 % Fehler 2. Art (β): Die Nullhypothese wird nicht verworfen, obwohl sie falsch ist. Der Fehler 2. Art hängt ab a) von der Wahl des Signifikanzniveaus, b) von der tatsächlichen Trefferwahrscheinlichkeit p, c) vom Stichprobenumfang n. Die Einflüsse von p und n sollen im Folgenden näher untersucht werden. 2

Einfluss der tatsächlichen Trefferwahrscheinlichkeit p auf den Fehler 2. Art Ein stärker verfälschter Würfel müsste zuverlässiger entdeckt werden! Mit abnehmendem p wandert die Verteilung nach links. Der Ablehnungsbereich bleibt fest. Nimmt p ab, dann nimmt auch β ab. Linksseitiger Test: Für p 0 gilt: β 0. Für p /6 gilt: β α. Bestimmung von β mit Hilfe des GTR: 0 k = 0 ( p k) β ( p') = B 00, ', = binomcdf (00, X,0) Einfluss des Stichprobenumfangs auf den Fehler 2. Art Mit dem Stichprobenumfang wächst auch die Menge der Information über die Grundgesamtheit. p = /6; tatsächliche Wahrscheinlichkeit p = /8 Stichprobenumfang n Signifikanzniveau Ablehnungsbereich α β 50 5 % {0; ; 2; 3} 2,4 % 88,6 % 00 5 % {0; ; ; 0} 4,3 % 7,9 % 000 5 % {0; ; ; 46} 4,2 % 2,2 % Fehler 2. Art in Abhängigkeit von der tatsächlichen Trefferwahrscheinlichkeit p für n = 50; 00; 000 bei einem Signifikanzniveau von 5 % 3

Die Ursache hierfür liegt darin, dass die Trefferzahlen bei größeren Stichprobenumfängen weniger stark um den Erwartungswert streuen: n = 00; p = /6; p = /8 Ablehnungsbereich: {0; ; ; 0} Verteilungen (GTR): n = 000; p = /6; p = /8 Ablehnungsbereich: {0; ; ; 46} Verteilungen (GTR): α = 4,3 %; β = 72 % Geringe Teststärke Für p = /6 gilt: μ = 6,7; σ = 3,7 (starke Streuung um den Erwartungswert). α = 4,2 %; β = 2 % Hohe Teststärke (hohe Trennschärfe) Für p = /6 gilt: μ = 67 ; σ =,8 (schwache Streuung um den Erwartungswert). (Es gilt: μ = n p und σ = n p ( p) ; d.h. μ n und σ n ) Fehler 2. Art (β), Zusammenfassung: Die Nullhypothese wird nicht abgelehnt, obwohl sie falsch ist. Wir sind reingefallen, weil wir etwa Falsches akzeptiert haben. β hängt ab von der Irrtumswahrscheinlichkeit α, von der tatsächlichen Trefferwahrscheinlicheit p und vom Stichprobenumfang n. Dieser Fehler ist i.a. nicht kontrollierbar. Eine Beibehaltung der Nullhypothese kann mit einem sehr hohen Fehler behaftet sein. Die Tatsache, dass eine Nullhypothese nicht abgelehnt wird, kann also nicht als Beleg für deren Gültigkeit angesehen werden! ( Freispruch aus Mangel an Beweisen ) Aus einer Annahme über p kann β abgeschätzt werden. Mit Hilfe des Fehlers 2. Art kann dann entschieden werden, ob ein Test sinnvoll ist (Teststärke). (Auch aus diesem Grund ist die Alternativhypothese erforderlich.) 4

Ein Fehler ist also immer möglich! Bei festem Stichprobenumfang bewirkt ein Verkleinerung von α eine Vergrößerung von β und umgekehrt. Ein Verkleinerung der Summe α + β kann nur durch Vergrößern des Stichprobenumfangs erreicht werden. Nur die Kenntnis beider Fehler erlaubt eine Einschätzung der Konsequenzen bei einer Fehlentscheidung! Dies ist bei Wahl der Nullhypothese zu berücksichtigen. (Für Wirksamkeitsstudien medizinischer Behandlungen schlägt Cohen (969) für β einen 4-mal so hohen Wert vor wie für das Signifikanzniveau α. (Wikipedia)) 5