Stichprobenumfang Für die Fragestellung auf Gleichheit von ein oder zwei Stichproben wird auf Basis von Hypothesentests der notwendige Stichprobenumfang bestimmt. Deshalb werden zunächst die Grundlagen von Hypothesentests beschrieben. - Die Nullhypothese H o behauptet: Es besteht Gleichheit (z.b. die zweier Stichproben sind gleich, oder der Mittelwert einer angelieferten Charge entspricht der Vorgabe des Kunden, oder der Verbrauch zweier Fahrzeuge ist gleich, etc. ). - Die Alternativ-Hypothese H 1 behauptet: Es gibt einen Unterschied (z.b. die zweier Stichproben sind ungleich, oder die angelieferte Ware ist fehlerhaft, etc.). Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird. Bei der Durchführung eines statistischen Tests können zwei Arten von Fehlern gemacht werden: 1. Die Nullhypothese Ho ist richtig und wird abgelehnt! diesen Fehler bezeichnet man als Fehler 1. Art, oder den α-fehler, oder das Produzentenrisiko. 2. Die Nullhypothese Ho wird angenommen, obwohl sie falsch ist! diesen Fehler bezeichnet man als Fehler 2. Art, oder den -Fehler, oder das Konsumentenrisiko. Insgesamt gibt es folgende vier Situationen: Wirklichkeit H o H1 Entscheidung H o richtig -Fehler (2. Art) H1 α-fehler (1. Art) richtig Ho : Nullhypothese; H 1 oder H A : Alternativhypothese
Bestimmung des α-fehlers am Beispiel Mittelwertvergleich Es ist die Nullhypothese H o zu prüfen : die zweier Stichproben sind gleich. x 2 Der Abstand der wird normiert auf eine gemeinsame Standardabweichung s d t pr x 1 s d x 2 2 2 s1 + s2 s d n (für gleiche Stichprobenumfänge, n n 1 n 2 ) Mit Hilfe der t-verteilung (Studentverteilung) erhält man den gesuchten Wert für den α-fehler. α /2 t-verteilung Hinweis: Die Fläche α/2 lässt sich nicht in das obere Diagramm übertragen, wie oft zu sehen ist. α 2 VertlgStudent( - ; f ) Freiheitsgrad f n 1 + n 2-2 für gleiche Standardabw. der Stichproben. Der p-value Man legt für den Fehler 1. Art einen zulässigen Grenzwert für α fest, in der Regel 5%. Den tatsächlich vorhandenen Wert nennt man den p-value. Verteilung für x 2 liegen enger zusammen p-val/2 α/2 2,5% p-val > α H o wird nicht x 2 liegen weiter auseinander α/2 2,5% p-val < α H o wird p-val/2 Merke: If p-val is low, H o must go
Bestimmung des -Fehlers am Beispiel Mittelwertvergleich Es ist H 1 zu prüfen, die zweier Stichproben sind ungleich. Vob Bestimmung eines Vertrauensbereiches für der ersten Daten V x 1 ob + t1 α / 2 s d t 1-α Wert aus der t-verteilung für α 5% Mit Hilfe der t-verteilung (Studentverteilung) erhält man den gesuchten Wert für den -Fehler. t-verteilung Hinweis: Die Fläche lässt sich nicht in das obere Diagramm übertragen, wie oft zu sehen ist. : um wieviel ragt in den Vertrauensbereich von V ob t pr s d x 2 x 1 dieser Abstand wird normiert auf eine gemeinsame Standardabweichung (siehe α) VertlgStudent( - ; f ) Freiheitsgrad f n 1 + n 2-2 für gleiche Standardabw. der Stichproben (hier wird nicht auf die Hälfte gerechnet) Man legt für den Fehler 2. Art einen zul. Grenzwert fest Limit, in der Regel 10-20%*. Vob liegen enger zusammen Limit < Limit H 1 wird Vob liegen weiter auseinander > Limit Limit H 1 wird nicht Hinweis: Ein Gegenstück zum p-value gibt es hier nicht.
Die Teststärke Die Teststärke beschreibt in der Statistik die Aussagekraft eines statistischen Tests. Sie gibt an, mit welcher Wahrscheinlichkeit ein Test zugunsten einer Alternativhypothese H 1 (zum Beispiel Es gibt einen Unterschied ) entschieden wird. Es gilt: 1 - t-verteilung 1 - Hinweis: Ein Gegenstück zum α-fehler gibt es hier nicht. Da über 1- mit dem Fehler 2. Art t zusammenhängt, laufen die Fragestellungen letztlich immer auf die Alternativhypothese raus. Legt man vorher fest, in der Regel auf 0,8 ( 0,2), so lässt sich hieraus ein notwendiger Stichprobenumfang bestimmen, der notwendig ist, einen Unterschied festzustellen. wird auch die Teststärke bzw. Trennschärfe genannt. Ermittlung der Stichprobengröße mit Hilfe der -Funktion Für eine zweiseitige Fragestellung (H o : µµ o ; H 1 : µ<>µ o ) gilt folgende Beziehung, auch Gütefunktion genannt: Φ z µ µ o + n + Φ z 1 α / 2 1 α / 2 µ µ o n mit Φ Verteilungsfkt. der Normalverteilung 1 n 2 n1 n 2 > n 1 α µ o µ Ist der Mittelwert µ gleich der Vorgabe µ o, so ist α. Je größer der Abstand zur Vorgabe wird, umso mehr steigt, d.h. die Aussagewahrscheinlichkeit, dass ein Unterschied da ist, nimmt zu. Wie im Bild zu sehen ist, steigt bei gleichem Abstand auch, wenn die Stichprobengröße zunimmt (Schnittpunkt für Senkrechte bei Kurve für n 2 liegt höher). Die Ermittlung der Stichprobengröße n muss iterativ erfolgen.
Beispiel Messung eines Durchmessers: Es soll die Abweichung eines Durchmessers mit Sollwert 15mm überprüft werden. Ab wann wird diese Abweichung entdeckt, wenn man mit einem Messschieber eine Genauigkeit von ±0,1mm hat. Der Effekt muss also mindestens 0,1mm betragen um dies wahrzunehmen. µ o 15,0 mm µ 15,1 mm (es reicht die Betrachtung der Abw. nach oben aus) 0,5 mm (bekannt aus Voruntersuchungen) α 0,05 (Signifikanzniveau bzw. Vertrauensbereich 95%) 0,80 Ergebnis: n 197 Interpretation: Mit einer Stichprobe von mindestens n 197 wird mit 80%tiger Wahrscheinlichkeit aufgedeckt, dass bei 95% der produzierten Teile (1-α Vertrauensbereich) eine Abweichung von ±0,1mm entdeckt wird. In diesem Zusammenhang spricht man auch von Trennschärfe anstelle von Folgende einfache Beziehung wird häufig angewendet: n z µ µ o 1 α / 2 1 / 2 α 2 z 2 für α 5% ist z 1, 96 1 α / 2 Sie gilt jedoch nur für eine von 0,5, was oft nicht ausreichend ist. Im vorherigem Beispiel wären damit der Stichprobenumfang n nur 97 Teile (aufgerundet). Für eine einseitige Fragestellung gelten folgende Berechnungen: H o : µ µ o gegen H 1 : µ < µ o µ µ o Φ zα n Darstellung für H o : µ µ o (für H o : µ µ o spiegelbildlich) µ Verteilung der Grundgesamtheit H o : µ µ o gegen H 1 : µ > µ o α µ µ o 1 Φ z1 α n µ µ o n z 1-α Bei dem vorherigen Beispiel würde für µ 15,1 als einseitige Fragestellung H o : µ µ o anzuwenden sein, H o soll ja möglichst abgelehnt werden. Es werden n 155 Teile benötigt. Für diskrete Daten, z.b. für die Fehlerquote p eines Herstellprozesses, gibt es folgende Näherungsformel für die zweiseitige Fragestellung H o : p p o ; H 1 : p<>p o :
1 Φ / ( )/ +Φ / ( )/ ( )/ ( )/ Für die einseitige Betrachtung gilt für H o : p p o ; H 1 : p > p o : 1 Φ δ+z p (1 p )/n p(1 p)/n bzw. für H o : p p o ; H 1 : p < p o : Φ δ z p (1 p )/n p(1 p)/n Beispiel Fehleranteil in einem Arbeitsprozess Der Fehleranteil eine Arbeitsprozesses liegt normalweise bei p 0,01. wird somit auf 0,099 geschätzt. Wir sollen sicherstellen, dass der Fehleranteil nicht größer als 0,015 wird. Wie groß muss die Stichprobe sein, um dies sicherzustellen? Für diese einseitige Fragestellung ist H 1 : p > p o anzuwenden. Für 0,8 würden 2830 Teile benötigt
Anwendung in Visual-XSel 12.0 /XSel12Inst.exe Visual-XSel ist ein eingetragenes Warenzeichen