Mathematik 2 Dr. Thomas Zehrt

Ähnliche Dokumente
Statistik II für Betriebswirte Vorlesung 1

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Vorlesung: Statistik II für Wirtschaftswissenschaft

Klassifikation von Signifikanztests

Motivation. Benötigtes Schulwissen. Wirtschaftswissenschaftliches Zentrum 12 Universität Basel. Statistik

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Klassifikation von Signifikanztests

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

3 Grundlagen statistischer Tests (Kap. 8 IS)

Wichtige Definitionen und Aussagen

Statistisches Testen

Klassifikation von Signifikanztests

3) Testvariable: T = X µ 0

Klassifikation von Signifikanztests

Kapitel 3 Schließende Statistik

Vorlesung: Statistik II für Wirtschaftswissenschaft

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Grundlagen der Statistik

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Biostatistik, Winter 2011/12

Statistische Tests für unbekannte Parameter

Statistik II für Betriebswirte Vorlesung 2

Allgemeines zu Tests. Statistische Hypothesentests

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Wahrscheinlichkeitsrechnung und Statistik

Lösungen zum Aufgabenblatt 14

Kapitel 13. Grundbegriffe statistischer Tests

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Statistik II. Statistische Tests. Statistik II

Statistische Tests für unbekannte Parameter

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Statistische Tests (Signifikanztests)

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Mathematik für Biologen

Statistik II für Betriebswirte Vorlesung 1

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Statistik II. Statistische Tests. Statistik II

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

Statistische Tests Version 1.2

Mathematik für Biologen

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

8. Konfidenzintervalle und Hypothesentests

5. Seminar Statistik

Stochastik Praktikum Testtheorie

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Mathematik für Biologen

11. Parametrische Tests 11.1 Konzeption von statistischen Tests

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

R. Brinkmann Seite

Kapitel XIV - Anpassungstests

Beurteilende Statistik

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Schließende Statistik: Hypothesentests (Forts.)

Kapitel 3 Schließende Statistik

Fit for Abi & Study Stochastik

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Bereiche der Statistik

R. Brinkmann Seite

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Statistik I für Betriebswirte Vorlesung 14

Statistik II. IV. Hypothesentests. Martin Huber

Biomathematik für Mediziner

Je genauer und sicherer, desto größer muss der Stichprobenumfang sein

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/453

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Mathematik 2 Probeprüfung 1

Stochastik Musterlösung 10

Test auf den Erwartungswert

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Ablaufschema beim Testen

Biostatistik, Winter 2011/12

Jost Reinecke. 7. Juni 2005

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Beurteilende Statistik

Grundlagen der Statistik

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Statistik II für Studierende der Soziologie und Nebenfachstudierende

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Schließende Statistik

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Klausur zur Vorlesung

Wahrscheinlichkeit und Statistik BSc D-INFK

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Wahrscheinlichkeit und Statistik BSc D-INFK

1. Grundbegri e der Stochastik

Transkript:

Wirtschaftswissenschaftliches Zentrum 1 Universität Basel Mathematik Dr. Thomas Zehrt Testen Benötigtes Vorwissen: Der Stoff der Vorlesung,,Statistik wird als bekannt vorausgesetzt, insbesondere Kapitel 11,,(Punkt)schätzen und Kapitel 1,,Testen Inhaltsverzeichnis 1 Grundbegriffe der Testtheorie 1.1 Übersicht.................................... 1. Parametrische Testprobleme.......................... Wichtige parametrische Tests 6.1 Der einfache Gaußtest............................. 6. Weitere Tests.................................. 9 3 *Nichtparametrische Tests* 15 3.1 Anpassungstests................................. 15 3.1.1 Der χ -Anpassungstest......................... 15 3.1. Der Kolmogorov-Smirnov Anpassungstest.............. 17 4 Übungsaufgaben 18

1 Grundbegriffe der Testtheorie 1.1 Übersicht Test parametrischer Test bekannter Verteilungstyp mit unbekanntem Parameter, Hypothese betrifft diesen Parameter nichtparametrischer Test unbekannte Verteilung(en) Einstichproben problem Zweistichproben problem Anpassungs test wie gut passt die beobachtete zur hypothetischen Verteilung Homogenitäts test Verteilung zweier Zufallsvariablen wird verglichen 1. Parametrische Testprobleme Sei X eine Zufallsvariable mit den möglichen Verteilungen { } Hypothesenraum: Ω = = P θ (X = x) : θ Θ P θ Bei einem (parametrischen) Testproblem wird der Hypothesenraum in zwei Teilmengen aufgeteilt: die zu testende Nullhypothese H 0 : θ Θ 0 und die Alternative H 1 : θ Θ 1 entscheiden soll. Die Nullhypothese H 0 ist diejenige Hypothese, welche auf ihren Wahrheitsgehalt hin überprüft werden soll. Sie beinhaltet den Zustand des Parameters der Grundgesamtheit, der bis zum jetzigen Zeitpunkt bekannt ist oder als allgemein akzeptiert gilt. Die Alternativhypothese H 1 ist ein Teil der zur Nullhypothese entgegengesetzten Aussage. Sie ist die eigentliche Forschungshypothese und drückt aus, was mittels der statistischen Untersuchung gezeigt werden soll. Es gilt stets: Θ 0 Θ 1 = und bei Signifikanztests (die wir im weiteren ausschliesslich behandeln werden) auch Θ 0 Θ 1 = Θ. Die typischen Situationen dabei sind: H 0 H 1 1. H 0 : θ = θ 0 H 1 : θ = θ 1, θ 0 θ 1 einfache Hypothese. H 0 : θ = θ 0 H 1 : θ θ 0 zweiseitigen Fragestellung 3. H 0 : θ θ 0 H 1 : θ > θ 0 einseitige Fragestellung 4. H 0 : θ θ 0 H 1 : θ < θ 0 einseitige Fragestellung

3 Eine Funktion T (X) = T (X 1,..., X n ) der Stichprobenvariablen X = (X 1,..., X n ) heisst Testgrösse. Für die konkrete Stichprobe (x 1,..., x n ) ergibt sich t = T (x 1,..., x n ) als Realisierung der Testgösse. Der Wertebereich der Zufallsgrösse T (X) wird in folgende zwei Teile zerlegt: Verwerfungsbereich (oder auch kritischer Bereich bzw. Ablehnbereich) R Annahmebereich R = R c. Aufgrund der Realisierung (x 1,..., x n ) wird dann folgende Testentscheidung getroffen: H 0 ablehnen, falls t = T (x 1,..., x n ) R H 0 beibehalten, falls t = T (x 1,..., x n ) R = R c Innerhalb des gewählten Modells gibt es nun vier Möglichkeiten, wie die Realität und die Testentscheidung zusammentreffen können. Realität H 0 ist richtig H 0 ist falsch Testentscheidung H 0 Fehler. Art, beibehalten ok β-fehler H 0 Fehler 1. Art, verwerfen α-fehler ok Bei der Testkonstruktion gibt man die Wahrscheinlichkeit α eines Fehlers 1. Art vor. Diese Schranke bezeichnet man als Signifikanzniveau und der Test heisst Signifikanztest zum Niveau α. Der kritische Bereich R wird dann so konstruiert, dass die Wahrscheinlichkeit eines Fehlers 1. Art nicht grösser als α wird: P (H 0 verwerfen H }{{} 0 richtig ) α T (X) R Dabei sollte aber die Wahrscheinlichkeit eines Fehlers. Art P (H 0 beibehalten H 0 falsch ) nicht zu gross werden.

4 Beim Testen wird nur die Wahrscheinlichkeit eines Fehlers 1. Art durch α kontrolliert. Wenn also H 0 wirklich gilt, werden wir sicher nur in α 100% der durchführten Tests für H 1 entscheiden. Die Entscheidung für H 1 ist somit statistisch gesichert und wir sprechen dann von einem signifikanten Ergebnis. Die Wahrscheinlichkeit für einen Fehler. Art wird dagegen nicht kontrolliert und die Entscheidung H 0 beizubehalten ist statistisch nicht abgesichert. Es spricht nur nichts gegen H 0. Allgemeines Vorgehen: 1. Verteilungsannahme über die Zufallsvariable X (bzw. über deren Verteilungsfunktion F ) machen. Formulieren der Nullhypothese und der Alternative. 3. Vorgabe der Irrtumswahrscheinlichkeit α 4. Konstruktion einer geeigneten Testgrösse T (X) = T (X 1,..., X n ) als Funktion der Stichprobenvariablen X, deren Verteilung unter der Nullhypothese vollständig bekannt sein muss. 5. Wahl eines kritischen Bereichs R aus dem möglichen Wertebereich von T (X), so dass P (T (X) R H 0 richtig ) α gilt. 6. Bestimmung der Realisierung t = T (x 1,..., x n ) der Testgrösse T (X) anhand einer konkreten Stichprobe. 7. Entscheidungsregel: Liegt t in R, so wird die Nullhypothese abgelehnt, sonst beibehalten.

5 Der p-wert Beim Einsatz von Statistiksoftware zum Hypothesentest wird der kritische Bereich meist nicht angezeigt. Stattdessen wird der konkrete Wert t der Stichprobe zusammen mit dem zugehörigen p-wert angezeigt. Definition 1.1 Der p-wert ist definiert als die Wahrscheinlichkeit unter Gültigkeit von H 0, dass die Testgrösse T den konkreten Wert t oder einen im Sinne der Alternativhypothese noch extremeren Wert annimmt. Konkret bedeutet das: rechtsseitiger Test: p-wert = P ( T t H 0 stimmt ) linksseitiger Test: p-wert = P ( T t H 0 stimmt ) zweiseitiger Test: p-wert = P ( T t H 0 stimmt ) Der p-wert kann ebenfalls als Entscheidungskriterium für das Verwerfen der Nullhypothese genutzt werden. Je kleiner der p-wert ist, desto stärker sprechen die Daten gegen die Nullhypothese und damit für die Alternativhypothese. Gebräuchliche Grenzen sind: p-wert > 0.100 : schwache Beweislast gegen H 0 0.050 < p-wert 0.100 : mässige Beweislast gegen H 0 0.010 < p-wert 0.050 : moderate Beweislast gegen H 0 0.001 < p-wert 0.010 : starke Beweislast gegen H 0

6 Wichtige parametrische Tests.1 Der einfache Gaußtest Prüfen des Mittelwertes bei bekannter Varianz (einfacher Gaußtest) Gegeben: X N(µ, σ ) mit σ = σ0 bekannt Zu prüfen: Besitzt µ (unbekannt) einen bestimmten Wert µ = µ 0? 1. Verteilungsannahme: X N(µ, σ 0). Festlegen von H 0 und H 1 I: H 0 : µ = µ 0 gegen H 1 : µ µ 0 II: H 0 : µ µ 0 gegen H 1 : µ > µ 0 III: H 0 : µ µ 0 gegen H 1 : µ < µ 0 3. Vorgabe von α: α = 0.05 4. Konstruktion der Testgrösse: Stichprobenmittelwert X = 1 n n i=1 H X 0 i N(µ0, σ0/n) Standardisierung T (X) = X µ 0 σ 0 n H 0 N(0, 1) 5. Kritischer Bereich: H 0 H 1 R I: µ = µ 0 µ µ 0 (, z 1 α ) (z 1 α, ) II: µ µ 0 µ > µ 0 (z 1 α, ) III: µ µ 0 µ < µ 0 (, z α ) 6. Realisierung der Testgrösse: Aus einer konkreten Stichprobe x 1,..., x n wird der Stichprobenmittelwert x = 1 n n i=1 x i und daraus die Realisierung der Testgrösse ermittelt t = x µ 0 n σ 0 7. Testentscheidung: Liegt t in R, so muss die Nullhypothese verworfen werden. Daraus folgt insgesamt: Lehne H 0 ab, wenn I. t > z 1 α II. t > z 1 α III. t < z 1 α = z α

7 Beispiel.1 Für den zweiseitigen Test H 0 : µ = µ 0 und H 1 : µ µ 0 wissen wir also, dass die Testgrösse T unter der Nullhypothese standardnormalverteilt ist. Wir kennen also die Wahrscheinlichkeiten, mit denen T bestimmte Werte realisiert. Natürlich werden wir die Nullhypothese µ = µ 0 verwerfen, wenn der Stichprobenmittelwert X (der den Erwartungswert µ 0 hat) viel kleiner oder viel grösser als µ 0 ist. Das ist gleichbedeutend damit, dass die Testgrösse T einen zu kleinen oder einen zu grossen Wert realisiert. Zu klein bedeutet dabei, dass t < z 1 α, zu gross bedeutet t > z 1 α Wegen der Symmetrie der Standardglockenkurve gilt auch noch: z 1 α = z α

8 Aufgabe.1 Bei der Produktion von Bolzen beträgt der Sollwert für den Duchmesser 10 mm. Der Bolzendurchmesser X sei dabei normalverteilt mit dem unbekannten Erwartungswert µ und der durch die Konstruktion der Maschine festgelegten Standardabweichung σ = 0.5 mm. Zur Überprüfung der Einstellung werden 100 Teile entnommen und daraus der mittlere Duchmesser x = 10.15 mm berechnet. Prüfen Sie die Hypothese H 0 : µ = 10 mm mit der Irrtumswahrscheinlichkeit α = 0.05. Lösung: 1. H 0 : µ = 10 = µ 0. H 1 : µ 10 3. Test(Name): Gauss-Test 4. T (allgemein): T = X µ 0 n σ 0 5. t (speziell): t = 10.15 10 100 = 3 0.5 6. vollständiger Verwerfungsbereich: R = (, z 1 α 1 α, ) = (, z 0.975 ) (z 0.975, ) = (, 1.96) (1.96, ) 7. Entscheidung: H 0 ablehnen, da 3 R

9. Weitere Tests Signifikanztests für µ und σ einer normalverteilten Grundgesamtheit (Signifikanzniveau α) Hypothesen Voraussetzungen Testgrösse T Verteilung von T Kritischer Bereich H 0 H 1 Gauß-Test µ = µ 0 µ µ 0 t > z 1 α µ µ 0 µ > µ 0 σ = σ0 bekannt X µ 0 n N(0, 1)-Verteilung t > z1 α σ 0 µ µ 0 µ < µ 0 t < z 1 α Einfacher t-test µ = µ 0 µ µ 0 t > t n 1;1 α µ µ 0 µ > µ 0 σ unbekannt X µ 0 n S X tn 1 -Verteilung t > t n 1;1 α µ µ 0 µ < µ 0 t < t n 1;1 α χ -Streuungstest σ = σ 0 σ σ 0 t > χ n 1;1 α oder t < χ n 1; α σ σ0 σ > σ0 (n 1) SX µ unbekannt σ0 χ n 1 -Verteilung t > χ n 1;1 α σ σ0 σ < σ0 t < χ n 1;α Ergänzung (nicht prüfungsrelevant) σ = σ0 σ σ0 t > χ n;1 α σ σ0 σ > σ0 n SX µ bekannt σ0 χ n-verteilung t > χ n;1 α σ σ0 σ < σ0 t < χ n;α oder t < χ n; α

10 Signifikanztests zum Vergleich zweier Erwartungswerte µ X und µ Y und Varianzen σx und σ Y von normalverteilten Grundgesamtheiten (Signifikanzniveau α) Hypothesen Voraussetzungen Testgrösse T Verteilung von T Kritischer Bereich H 0 H 1 Doppelter t-test µ X = µ Y µ X µ Y (X 1,.., X n1 ), (Y 1,.., Y n ) unabh. Stichproben X Y S n1 n n 1 + n mit t > t n1 +n ;1 α µ X µ Y µ X > µ Y σ X = σ Y S = t n1 +n -Verteilung t > t n1 +n ;1 α µ X µ Y µ X < µ Y X N(µ X, σx ) (n 1 1)S X +(n 1)S Y n 1 +n Y N(µ Y, σy ) t < t n1 +n ;1 α Welch-Test µ X = µ Y µ X µ Y (X 1,.., X n1 ), (Y 1,.., Y n ) X Y S X n1 t m-verteilung t > t m;1 α + S Y n unabh. Stichproben m = µ X µ Y µ X > µ Y σ X σ Y ( (SX /n 1+SY /n ) ) t > t m;1 α (S X /n 1 ) + (S Y /n ) n 1 1 n 1 µ X µ Y µ X < µ Y X N(µ X, σx ) ganzzahlig gerundet t < t m;1 α Y N(µ Y, σy ) F-Test σx = σ Y σx σ Y (X 1,.., X n1 ), (Y 1,.., Y n ) SX /S Y F n1 1,n 1-Verteilung t > F n1 1,n 1;1 α oder unabh. Stichproben t < F n1 1,n 1; α σ X σ Y σ X > σ Y µ X, µ Y unbekannt S X /S Y F n1 1,n 1-Verteilung t > F n1 1,n 1;1 α σx σ Y σx < σ Y X N(µ X, σx ) S Y /S X F n 1,n 1 1-Verteilung t > F n 1,n 1 1;1 α Y N(µ Y, σy ) Beachte: Gilt X F m,n, so ist 1/X F n,m und für die Quantile folgt F m,n;α = 1 F n,m;1 α.

11 Hypothesen Voraussetzungen Testgrösse T Verteilung von T Kritischer Bereich H 0 H 1 paired t-test µ X = µ Y µ X µ Y (X 1,.., X n), (Y 1,.., Y n) (verbundene) Stichproben D S D n mit t > tn 1;1 α µ X µ Y µ X > µ Y D = X Y N(0, σ D ) S D = 1 n 1 n (D i D) t n 1 -Verteilung t > t n 1;1 α µ X µ Y µ X < µ Y t < t n 1;1 α i=1

1 Aufgabe. Zur Überprüfung einer Produktionsanlage, die Kilotüten mit Mehl abfüllt, werden 0 Tüten entnommen, gewogen und daraus das mittlere Gewicht x = 998.9 g und die Standardabweichung s = 0.738 g berechnet. Es kann davon ausgegangen werden, dass das Gewicht normalverteilt ist. Prüfen Sie, ob die Anlage im Mittel wesentlich weniger (α = 0.05) als 1000 g abfüllt. Lösung: 1. H 0 :. H 1 : 3. Test(Name): 4. T (allgemein): 5. t (speziell): 6. vollständiger Verwerfungsbereich: 7. Entscheidung: (H 0 wird abgelehnt, denn t = 6.58 < 1.73 = t 19;0.95 )

13 Aufgabe.3 Zur Überprüfung einer Produktionsanlage, die Kilotüten mit Mehl abfüllt, werden 0 Tüten entnommen, gewogen und daraus das mittlere Gewicht x = 998.9 g und die Standardabweichung s = 0.738 g berechnet. Es kann davon ausgegangen werden, dass das Gewicht normalverteilt ist. Unterscheidet sich die empirische Streuung s wesentlich (α = 0.05) von σ 0 = 0.3 (g ) Lösung: 1. H 0 :. H 1 : 3. Test(Name): 4. T (allgemein): 5. t (speziell): 6. vollständiger Verwerfungsbereich: 7. Entscheidung: (H 0 wird abgelehnt, denn t = 34.49 > 3.85 = χ 19;0.975)

14 Aufgabe.4 In einer landwirtschaftlichen Versuchsanstalt erhielten 9 von Masttieren (Gruppe I) Grünfutterzumischungen, während die übrigen 13 Tiere (Gruppe II) ausschliesslich mit dem proteinhaltigen Mastfutter gefüttert wurden. Nach einer gewissen Zeit wurden folgende Gewichtszunahmen in kg bei den Tieren festgestellt. Gruppe I: 7.0, 11.8, 10.1, 8.5, 10.7, 13., 9.4, 7.9, 11.1 und Gruppe II: 13.4, 14.6, 10.4, 11.9, 1.7, 16.1, 10.7, 8.3, 13., 10.3, 11.3, 1.9, 9.7 Testen Sie die Nullhypothese σ I = σ II Lösung: 1. H 0 : mit Hilfe des F-Tests (für α = 0.1).. H 1 : 3. Test(Name): 4. T (allgemein): 5. t (speziell): 6. vollständiger Verwerfungsbereich: 7. Entscheidung: (H 0 wird nicht abgelehnt)

15 3 *Nichtparametrische Tests* 3.1 Anpassungstests Bei einem Anpassungstest wird untersucht, wie gut sich eine beobachtete Verteilung der hypothetischen Verteilung,,anpasst. Die Nullhypothese ist hier stets die Vermutung, dass eine ganz bestimmte (hypothetische) Verteilung vorliegt. Es kann also (statistisch) nur bewiesen werden, dass dieser bestimmte Verteilungstyp nicht vorliegt. 3.1.1 Der χ -Anpassungstest Gegeben: Zufallsvariable X (ordinal oder stetig) Zu prüfen: Besitzt X die Verteilungsfunktion F 0? 1. Verteilungsannahme: X hat die Verteilungsfunktion F 0. Festlegen von H 0 und H 1 H 0 :,,Die Verteilungsfunktion F einer Stichprobe stimmt mit F 0 überein: F (x) = F 0 (x) H 1 : F (x) F 0 (x) 3. Vorgabe von α: α = 0.05 4. Konstruktion der Testgrösse: Eine Stichprobe X = (X 1,..., X n ) wird in k Klassen eingeteilt: Klasse 1... k Total Anz. Beobacht. n 1 n... n k n T (X) = k i=1 (N i n p i ) n p i H 0 χ k 1 r N i absolute Häufigkeit der Stichprobe für die Klasse i (das sind Zufallsvariablen mit den Realisierungen n i ) p i die mit Hilfe der (hypothetischen) Verteilungsfunktion F 0 berechneten Wahrscheinlichkeiten dafür, dass X einen Wert in der Klasse i annimmt n p i die unter H 0 erwartete Häufigkeit in der Klasse i r Anzahl Parameter von F 0 5. Kritischer Bereich: (χ k 1 r;1 α, ) 6. - 7. Testentscheidung: Lehne H 0 ab, wenn t > χ k 1 r;1 α

16 Aufgabe 3.1 Eine Versuchsreihe mit n = 50 Würfen einer belgischen 1-Euromünze zeigt 140-mal den (massigen) Kopf des belgischen Königs Albert und nur 110-mal die Zahl. Entscheiden Sie mittels χ -Anpassungstest (und mit α = 0.05), ob die Münze fair ist. Lösung: 1. Verteilungsannahme: Ausgang 1 sei,,kopf und Ausgang sei,,zahl, dann ist X (Anzahl,,Kopf ) gleichverteilt mit p(x = 1) = p(x = ) = 1/. H 0 : Verteilung der Stichprobe entspricht der Gleichverteilung 3. Vorgabe von α: α = 0.05 4./6. k = Verteilung von T : χ 1 0 = χ 1 Klasse 1 Anz. Beobacht. n 1 = 140 n = 110 t = i=1 (n i n p i ) n p i = (140 50 1/) 50 1/ + (110 50 1/) 50 1/ = 3.6 5. Kritischer Bereich: Es gilt c 1;0.95 = 3.84 also K = (3.84, ) 7. Testentscheidung: t = 3.6 < χ 1;0.95 = 3.84 also kann die Nullhypothese nicht verworfen werden.

17 3.1. Der Kolmogorov-Smirnov Anpassungstest Ein Nachteil beim χ -Anpassungstest ist die (willkürliche) Klasseneinteilung, die (insbesondere bei kleinen Stichproben) das Testergebnis beeinflusst. Hier ist der Kolmogorov- Smirnov Anpassungstest besser geeignet! Gegeben: Zufallsvariable X (ordinal oder stetig) Zu prüfen: Besitzt X die Verteilungsfunktion F 0? 1. Verteilungsannahme: X hat die Verteilungsfunktion F 0. Festlegen von H 0 und H 1 H 0 :,,Die Verteilungsfunktion F einer Stichprobe stimmt mit F 0 überein: F (x) = F 0 (x) H 1 : F (x) F 0 (x) 3. Vorgabe von α: α = 0.05 4. Konstruktion der Testgrösse: Eine Stichprobe (x 1,..., x n ) wird geordnet x (1)... x (n) und die Verteilungsfunktion konstruiert. Testgrösse: 0 für < x < x (1) ˆF (x) := i/n für x (i) x < x (i+1) 1 für x (n) x < D = sup x R F 0 (x) ˆF (x) 5. Kritischer Bereich: (d n;1 α, ) wobei 6. - n 3 4 5 6 7 8 9 d n;1 α 0.708 0.64 0.563 0.519 0.483 0.454 0.430 n 10 15 0 5 30 40 > 40 d n;1 α 0.409 0.338 0.94 0.64 0.4 0.10 1.36/ n 7. Testentscheidung: Lehne H 0 ab, wenn t > d n;1 α gilt.

18 4 Übungsaufgaben 1. In einem verregneten Land beträgt die Regenwahrscheinlichkeit in den Herbstmonaten 50%. Jeden Morgen im Herbst fragt sich Susi, ob sie einen Regenschirm mitnehmen soll oder nicht. Um zu einer Entscheidung zu kommen, wirft sie eine faire Münze. Wirft sie Kopf, nimmt sie einen Regenschirm mit, ansonsten lässt sie den Schirm zu Hause. (a) Betrachten Sie die Situation wie einen statistischen Test. Wie müssen die Hypothesen gewählt werden, damit der Fehler 1.Art die schlimmere Auswirkung darstellt? (b) Bestimmen Sie die Wahrscheinlichkeit für den Fehler 1. Art.. Bei der Produktion von Bolzen beträgt der Sollwert für den Durchmesser 10 mm. Der Bolzendurchmesser X sei dabei normalverteilt mit dem unbekannten Erwartungswert µ und der durch die Konstruktion der Maschine festgelegten Standardabweichung σ = 0.5 mm. Zur Überprüfung der Einstellung werden 100 Teile entnommen und daraus der mittlere Duchmesser x = 10.15 mm berechnet. Prüfen Sie die Hypothese H 0 : µ = 10 mm mit der Irrtumswahrscheinlichkeit α = 0.05. 3. Zur Überprüfung einer Produktionsanlage, die Kilotüten mit Mehl abfüllt, werden 0 Tüten entnommen, gewogen und daraus das mittlere Gewicht x = 998.9 g und die Standardabweichung s = 0.738 g berechnet. Es kann davon ausgegangen werden, dass das Gewicht normalverteilt ist. Prüfen Sie, ob die Anlage im Mittel wesentlich weniger (α = 0.05) als 1000 g abfüllt. 4. Zur Überprüfung einer Produktionsanlage, die Kilotüten mit Mehl abfüllt, werden 0 Tüten entnommen, gewogen und daraus das mittlere Gewicht x = 998.9 g und die Standardabweichung s = 0.738 g berechnet. Es kann davon ausgegangen werden, dass das Gewicht normalverteilt ist. Unterscheidet sich die empirische Streuung s wesentlich (α = 0.05) von σ 0 = 0.3 (g )? 5. In einer landwirtschaftlichen Versuchsanstalt erhielten 9 von Masttieren (Gruppe I) Grünfutterzumischungen, während die übrigen 13 Tiere (Gruppe II) ausschliesslich mit dem proteinhaltigen Mastfutter gefüttert wurden. Nach einer gewissen Zeit wurden folgende Gewichtszunahmen in kg bei den Tieren festgestellt. Gruppe I: 7.0, 11.8, 10.1, 8.5, 10.7, 13., 9.4, 7.9, 11.1 und Gruppe II: 13.4, 14.6, 10.4, 11.9, 1.7, 16.1, 10.7, 8.3, 13., 10.3, 11.3, 1.9, 9.7 Testen Sie die Nullhypothese σi = σ II mit Hilfe des F-Tests (für α = 0.1).

19 Lösungen einiger Übungsaufgaben 1. (a) Testproblem: Regen oder kein Regen Entscheidungsregel: Ich glaube, dass es regnen wird, wenn Münzwurf,Kopf, zeigt. Entscheidung / Realität Regen kein Regen,,Kopf Regen Schirm trocken Schirm umsonst,,zahl kein Regen kein Schirm nass trocken Mögliche Fehler: Schirm umsonst mitgenommen bzw. nass werden(ist wohl die schlimmere Konsequenz) Damit der Fehler 1. Art die schlimmere Konsequenz darstellt, müssen die Hypothesen wie folgt gewählt werden: H 0 : Regen H 1 : kein Regen (b) P ( H 0 verworfen H 0 stimmt ) = 0.5. 3 = t > z 0.975 = 1.96, H 0 wird abgelehnt 3. 6.54 = t < t 19;0.95 = 1.73, H 0 wird abgelehnt 4. 34.49 = t > χ 19;0.975 = 3.85, H 0 wird abgelehnt 5. t = 0.85 0.3 und.85, H 0 wird nicht abgelehnt