T-Test für den Zweistichprobenfall t-test (unbekannte, gleiche Varianzen) Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten, aber gleichen Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Zwei Stichproben wurden im Labor zufällig zwei Merkmale und gezogen und sollen miteinander verglichen werden. Wir wissen, dass - die beiden Stichproben unabhängig voneinander sind, - dass die interessierenden Größen normalverteilt sind und - dass beide Grundgesamtheiten dieselbe Varianz haben. Die Ziehungen ergaben folgende Realisierungen: Wollen wir nun auf Lageunterschied testen, können wir den Gauß-Test nicht verwenden, denn hier kennen wir die Varianzen nicht, sondern müssen sie erst aus den Daten schätzen. Diese zusätzliche Unsicherheit muss ein Test natürlich mit einbeziehen. t-test (unbekannte, gleiche Varianzen) Annahmen Für den t-test mit unbekannten, aber gleichen Varianzen gelten folgende Annahmen: Annahmen 1) Grundgesamtheit 1 Page 1
normalverteilt mit unabhängig und identisch Grundgesamtheit 2 unabhängig und identisch 2) normalverteilt mit Die Stichproben und sind voneinander 3) unabhängig und untereinander ebenfalls 4), unbekannt, aber Wie Sie die obigen Annahmen überprüfen können, erfahren Sie hier in einem kompakten Überblick über die Annahmenüberprüfung für den t-test ( : a8e.pdf ) oder Sie lesen das. Hypothesen Der t-test beruht auf der gleichen Fragestellung wie der : Es soll ein Lageunterschied zwischen zwei normalverteilten Grundgesamtheiten entdeckt werden. Der Gauß-Test setzt jedoch voraus, dass die Varianzen der Grundgesamtheiten bekannt sind. Das ist aber äußerst selten der Fall. In der Regel trifft eher das Gegenteil zu: Die Varianzen müssen aus den Daten geschätzt werden. Dieser Unterschied spiegelt sich vorerst noch nicht in den Hypothesen wider, die über die Erwartungswerte formuliert werden: Nullhypothese Alternativhypothese Test A Test B Test C Page 2
Prüfgröße Ersetzen wir nun durch den gepoolten Varianzschätzer als, ergibt sich die Prüfgröße Unter der Nullhypothese folgt die Teststatistik einer t-verteilung mit Freiheitsgraden. Die Berechnung des gepoolten Varianzschätzers und die Herleitung der Prüfgröße können Sie im Exkurs Herleitung der Prüfgröße nachlesen. Applet Das Applet t-verteilung (b26.jar) zeigt Ihnen, wie sich die Form der t-verteilung durch unterschiedliche Freiheitsgrade verändert. Zusätzliche Theorie finden Sie im. Testentscheidung Die Regeln für die Testentscheidung ergeben sich entsprechend zu den obigen Testproblemen: Test A Test B Test C Verwirf H0, wenn Ausblick Der ist ein t-test, der nicht mehr die Gleichheit der Varianzen in den zugrunde liegenden Grundgesamtheiten voraussetzt, sondern auch unterschiedliche Varianzen handhaben kann. Anleitung zur Programmierung des t-tests im Statistiklabor: Laboranleitung T-Test ( b7d.spf ). Beispiel: Motivation - Berechnung Testproblem Wir legen das Zahlenmaterial aus der Motivation zugrunde. Da die Daten zufällig gezogen wurden und kein inhaltlicher Grund besteht, setzen wir keine Richtungsannahme bei der Hypothesenformulierung voraus. Es wird daher das folgende Testproblem aufgestellt (mit ): Wir veranschlagen ein Signifikanzniveau von Page 3
Prüfgröße In der Tabelle stehen die notwendigen Schätzer für die Berechnung der Prüfgröße. Der gepoolte Varianzschätzer setzt sich aus den Stichprobenvarianzen und den Stichprobengrößen zusammen. Berechnen wir nun die Prüfgröße, ergibt sich folgender Wert: Testentscheidung Für das zweiseitige Testproblem ergibt sich folgender kritischer Wert: Der berechnete Prüfwert beträgt Vergleichen wir den Prüfwert mit dem kritischen Wert, ist Die Nullhypothese kann damit knapp verworfen werden. Öffnen Sie das Applet t-verteilung und geben Sie die entsprechenden Freiheitsgrade ein. Sie können das Beispiel selber im Labor nachrechnen: Labordatei öffnen ( bc6.spf ) Beispiel: Tägliche Fernsehdosis In einer Umfrage zum täglichen Fernsehverhalten der EU-Staaten hat das festgestellt, dass in Deutschland durchschnittlich Minuten/Tag und in Spanien Minuten/Tag ferngesehen wird. Kann man aufgrund von behaupten, dass Spanier länger fernsehen als Deutsche? Setzen Sie voraus, dass die Fernsehdauer normalverteilt ist mit gleichen Varianzen der Grundgesamtheiten. Öffnen Sie die Datei TV ( be2.zmpf ) und schauen Sie sich dort das Beispiel weiter an. Berechnen Sie im Labor für die unteren kritischen Werte der Standardnormalverteilung und der t-verteilungen mit den Freiheitsgraden 5, 30 und100. Was erkennen Sie in Bezug auf die Testentscheidung, wenn folgendes Testproblem gegeben ist: Zwei Medikamente A und B sollen hinsichtlich ihrer blutdrucksenkenden Wirkung miteinander verglichen werden. Von 20 Bluthochdruckpatienten werden 10 zufällig ausgewählt und mit Medikament A therapiert, die restlichen 10 mit Medikament B. An jedem Patienten wird der systolische Blutdruck vor und nach jeder Behandlung gemessen. Die Differenzen zwischen diesen beiden Blutdruckwerten sind in der Tabelle abgetragen: Gehen Sie von der Normalverteilung der Blutdrucksenkungen aus, wobei die Varianz der Blutdrucksenkung unter den beiden Medikamenten als gleich angenommen werden Page 4
mit einem geeigneten Test, ob sich die beiden Medikamente in ihrer Wirkung unterscheiden. Interpretieren Sie Ihr Ergebnis. Labordatei öffnen ( c04.zmpf ) Quelle: Für die Hühnermast wurde ein Futter mit einer speziellen Hormonzugabe entwickelt. Es soll getestet werden, ob das Hormon das Muskelwachstum unterstützt und damit auch das Gewicht der Hähnchen erhöht. In einem Experiment wird der Versuchsgruppe das Hormonfutter verabreicht und einer Kontrollgruppe normales Standardfutter. Überprüfen Sie zu einem Signifikanzniveau von, ob sich die Hormon-Hähnchengruppen nach dem Experiment in ihrem Gewicht signifikant um +0.2 kg von der Kontrollgruppe unterscheidet. Labordatei öffnen ( c19.zmpf ) Wie schon beim gilt auch hier, dass die Differenz der Stichprobenmittel die Grundlage für die Prüfgröße bilden soll. Als Schätzer für die unbekannten Varianzen und ist die Verwendung der Stichprobenvarianzen und nahe liegend. Allerdings liegt über die Varianzen ein zusätzliches Wissen vor, nämlich dass Varianzhomogenität herrscht, also (Siehe Annahmen.) Diese Information wollen wir uns natürlich zunutze machen. Wir suchen daher einen erwartungstreuen Schätzer, der die Streuung beider Stichproben einbezieht und sie entsprechend nach den jeweiligen Stichprobenumfängen gewichtet. Mit diesen Forderungen erhalten wir den gepoolten Varianzschätzer: Um standardisieren zu können, wird aber der Schätzer für die Varianz der Differenz benötigt. Mit, und den Annahmen, dass und sind und, erhält man unabhängig Ersetzt man durch den gepoolten Varianzschätzer hat man also einen Schätzer für Page 5
gefunden. In einer Untersuchung über das Ernährungsverhalten nahmen 92 zufällig ausgewählte Personen teil. Ein Aspekt der Untersuchung war der Vergleich von fleischloser und nichtfleischloser Ernährung. Dabei lautete die Forschungshypothese, dass Personen mit fleischloser Ernährung im Mittel weniger Kalorien am Tag zu sich nehmen als Menschen, die sich nicht fleischlos ernähren. Man kann davon ausgehen, dass die Kalorienmenge, die eine Person am Tag zu sich nimmt, eine normalverteilte Zufallsgröße ist. Außerdem nimmt man an, dass die Varianz dieser Zufallsgröße in beiden Größen übereinstimmt. Fleisch oder fleischlos? Formulieren Sie für die obige Forschungshypothese das statistische Testproblem, und überprüfen Sie dieses zum Niveau Berechnen Sie zuerst Mittelwerte und die empirische Standardabweichungen. Interpretieren Sie das Ergebnis! Labordatei öffnen ( c8b.zmpf ) Die Schätzwerte, und sind zwar erwartungstreue Schätzer für die wahren Varianzen, doch gerade bei kleinen Stichprobenumfängen weichen die Schätzer möglicherweise stark von ihren wahren Werten ab. Diese Ungenauigkeit kompensiert die t-verteilung mit ihren breiteren Enden, unter denen mehr Wahrscheinlichkeitsmasse liegt als bei der Normalverteilung. Im Gegensatz zu der normalverteilten Teststatistik muss die t-verteilte Prüfgröße einen extremeren Wert annehmen, um die Nullhypothese ablehnen zu können. Für wachsende Stichprobenumfänge und somit für wachsende Freiheitsgrade d.h. mit, nähert sich die t-verteilung der Standardnormalverteilung sehr gut an. (Beim t-test mit homogenen Varianzen ist ) Für große Stichproben ist approximativ standardnormalverteilt. Die Approximation gilt bereits für Stichproben mit mehr als 30 Beobachtungen pro Gruppe. Der Grund dafür ist, dass die Schätzungen und für größer werdende und immer näher an ihren wahren Werten und liegen. Abgetragen sind das 5%-Quantil der Standardnormalverteilung (blau) und der t-verteilung mit 5 Freiheitsgraden (orange). Applet Probieren Sie selber aus, wann die t-verteilung eine gute Approximation der Normalverteilung darstellt. Öffnen Sie hierfür das Applet t-versus-nv (cdc.jar). gepoolten Varianzschätzer Erklärungt-Test ErklärungVarianzhomogenität Erklärung (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: http://www.neuestatistik.de Page 6