T-Test für den Zweistichprobenfall

Ähnliche Dokumente
Statistik II. Weitere Statistische Tests. Statistik II

Gauß-Test für den Zweistichprobenfall

Ablaufschema beim Testen

Testentscheidungen. Worum geht es in diesem Modul? Kritische Werte p-wert

3 Grundlagen statistischer Tests (Kap. 8 IS)

Statistik II. Statistische Tests. Statistik II

T-Test für unabhängige Stichproben

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Statistisches Testen

Ein- und Zweistichprobentests

4.1. Nullhypothese, Gegenhypothese und Entscheidung

So berechnen Sie einen Schätzer für einen Punkt

Statistische Tests für unbekannte Parameter

Fallzahlplanung bei unabhängigen Stichproben

Statistik II für Betriebswirte Vorlesung 1

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Vergleich von Parametern zweier Stichproben

Statistische Tests für unbekannte Parameter

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

t-differenzentest bei verbundener Stichprobe

Statistik II. Statistische Tests. Statistik II

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Auswertung und Lösung

Klassifikation von Signifikanztests

5. Seminar Statistik

Statistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik

Einführung in die Induktive Statistik: Testen von Hypothesen

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Idee des Testens. Heuristische Verfahren

Marcel Dettling. GdM 2: LinAlg & Statistik FS 2017 Woche 13. Winterthur, 24. Mai Institut für Datenanalyse und Prozessdesign

Allgemeines zu Tests. Statistische Hypothesentests

Vorlesung: Statistik II für Wirtschaftswissenschaft

Klausur zur Vorlesung

8. Konfidenzintervalle und Hypothesentests

3) Testvariable: T = X µ 0

Test auf den Erwartungswert

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Wahrscheinlichkeitsrechnung und Statistik

Mathematik für Biologen

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Grundlagen der schließenden Statistik

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Empirische Wirtschaftsforschung

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

Mathematik für Biologen

Mathematik für Biologen

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Testen von Hypothesen:

Macht des statistischen Tests (power)

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Kapitel 3 Schließende Statistik

Grundlegende Eigenschaften von Punktschätzern

Einfaktorielle Varianzanalyse

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik II. Regressionsanalyse. Statistik II

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Statistische Tests (Signifikanztests)

Wichtige Definitionen und Aussagen

P-Test Motivation: Einsatz des Tests auf p im Krankenhausmanagement Theorie zum Test auf p

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

Prüfung aus Statistik 2 für SoziologInnen

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Wahrscheinlichkeitsrechnung und Statistik

Kapitel 3 Schließende Statistik

Einführung in Quantitative Methoden

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Grundlagen der Statistik

1. Grundbegri e der Stochastik

Statistik I für Betriebswirte Vorlesung 14

0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1

Probleme bei kleinen Stichprobenumfängen und t-verteilung

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Liegen 2 Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen

Klassifikation von Signifikanztests

Das Zweistichprobenproblem

Klausur zu Statistik II

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Klassifikation von Signifikanztests

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Vorzeichentest. Motivation: Vorzeichentests in der Erfolgskontrolle von Medikamenten

Nachklausur zur Vorlesung

Auswahl von Schätzfunktionen

Chi-Quadrat-Verteilung

Jost Reinecke. 7. Juni 2005

Statistik II. IV. Hypothesentests. Martin Huber

Mathematische und statistische Methoden II

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Wahrscheinlichkeitsrechnung und Statistik

Macht des statistischen Tests (power)

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Transkript:

T-Test für den Zweistichprobenfall t-test (unbekannte, gleiche Varianzen) Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit unbekannten, aber gleichen Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Zwei Stichproben wurden im Labor zufällig zwei Merkmale und gezogen und sollen miteinander verglichen werden. Wir wissen, dass - die beiden Stichproben unabhängig voneinander sind, - dass die interessierenden Größen normalverteilt sind und - dass beide Grundgesamtheiten dieselbe Varianz haben. Die Ziehungen ergaben folgende Realisierungen: Wollen wir nun auf Lageunterschied testen, können wir den Gauß-Test nicht verwenden, denn hier kennen wir die Varianzen nicht, sondern müssen sie erst aus den Daten schätzen. Diese zusätzliche Unsicherheit muss ein Test natürlich mit einbeziehen. t-test (unbekannte, gleiche Varianzen) Annahmen Für den t-test mit unbekannten, aber gleichen Varianzen gelten folgende Annahmen: Annahmen 1) Grundgesamtheit 1 Page 1

normalverteilt mit unabhängig und identisch Grundgesamtheit 2 unabhängig und identisch 2) normalverteilt mit Die Stichproben und sind voneinander 3) unabhängig und untereinander ebenfalls 4), unbekannt, aber Wie Sie die obigen Annahmen überprüfen können, erfahren Sie hier in einem kompakten Überblick über die Annahmenüberprüfung für den t-test ( : a8e.pdf ) oder Sie lesen das. Hypothesen Der t-test beruht auf der gleichen Fragestellung wie der : Es soll ein Lageunterschied zwischen zwei normalverteilten Grundgesamtheiten entdeckt werden. Der Gauß-Test setzt jedoch voraus, dass die Varianzen der Grundgesamtheiten bekannt sind. Das ist aber äußerst selten der Fall. In der Regel trifft eher das Gegenteil zu: Die Varianzen müssen aus den Daten geschätzt werden. Dieser Unterschied spiegelt sich vorerst noch nicht in den Hypothesen wider, die über die Erwartungswerte formuliert werden: Nullhypothese Alternativhypothese Test A Test B Test C Page 2

Prüfgröße Ersetzen wir nun durch den gepoolten Varianzschätzer als, ergibt sich die Prüfgröße Unter der Nullhypothese folgt die Teststatistik einer t-verteilung mit Freiheitsgraden. Die Berechnung des gepoolten Varianzschätzers und die Herleitung der Prüfgröße können Sie im Exkurs Herleitung der Prüfgröße nachlesen. Applet Das Applet t-verteilung (b26.jar) zeigt Ihnen, wie sich die Form der t-verteilung durch unterschiedliche Freiheitsgrade verändert. Zusätzliche Theorie finden Sie im. Testentscheidung Die Regeln für die Testentscheidung ergeben sich entsprechend zu den obigen Testproblemen: Test A Test B Test C Verwirf H0, wenn Ausblick Der ist ein t-test, der nicht mehr die Gleichheit der Varianzen in den zugrunde liegenden Grundgesamtheiten voraussetzt, sondern auch unterschiedliche Varianzen handhaben kann. Anleitung zur Programmierung des t-tests im Statistiklabor: Laboranleitung T-Test ( b7d.spf ). Beispiel: Motivation - Berechnung Testproblem Wir legen das Zahlenmaterial aus der Motivation zugrunde. Da die Daten zufällig gezogen wurden und kein inhaltlicher Grund besteht, setzen wir keine Richtungsannahme bei der Hypothesenformulierung voraus. Es wird daher das folgende Testproblem aufgestellt (mit ): Wir veranschlagen ein Signifikanzniveau von Page 3

Prüfgröße In der Tabelle stehen die notwendigen Schätzer für die Berechnung der Prüfgröße. Der gepoolte Varianzschätzer setzt sich aus den Stichprobenvarianzen und den Stichprobengrößen zusammen. Berechnen wir nun die Prüfgröße, ergibt sich folgender Wert: Testentscheidung Für das zweiseitige Testproblem ergibt sich folgender kritischer Wert: Der berechnete Prüfwert beträgt Vergleichen wir den Prüfwert mit dem kritischen Wert, ist Die Nullhypothese kann damit knapp verworfen werden. Öffnen Sie das Applet t-verteilung und geben Sie die entsprechenden Freiheitsgrade ein. Sie können das Beispiel selber im Labor nachrechnen: Labordatei öffnen ( bc6.spf ) Beispiel: Tägliche Fernsehdosis In einer Umfrage zum täglichen Fernsehverhalten der EU-Staaten hat das festgestellt, dass in Deutschland durchschnittlich Minuten/Tag und in Spanien Minuten/Tag ferngesehen wird. Kann man aufgrund von behaupten, dass Spanier länger fernsehen als Deutsche? Setzen Sie voraus, dass die Fernsehdauer normalverteilt ist mit gleichen Varianzen der Grundgesamtheiten. Öffnen Sie die Datei TV ( be2.zmpf ) und schauen Sie sich dort das Beispiel weiter an. Berechnen Sie im Labor für die unteren kritischen Werte der Standardnormalverteilung und der t-verteilungen mit den Freiheitsgraden 5, 30 und100. Was erkennen Sie in Bezug auf die Testentscheidung, wenn folgendes Testproblem gegeben ist: Zwei Medikamente A und B sollen hinsichtlich ihrer blutdrucksenkenden Wirkung miteinander verglichen werden. Von 20 Bluthochdruckpatienten werden 10 zufällig ausgewählt und mit Medikament A therapiert, die restlichen 10 mit Medikament B. An jedem Patienten wird der systolische Blutdruck vor und nach jeder Behandlung gemessen. Die Differenzen zwischen diesen beiden Blutdruckwerten sind in der Tabelle abgetragen: Gehen Sie von der Normalverteilung der Blutdrucksenkungen aus, wobei die Varianz der Blutdrucksenkung unter den beiden Medikamenten als gleich angenommen werden Page 4

mit einem geeigneten Test, ob sich die beiden Medikamente in ihrer Wirkung unterscheiden. Interpretieren Sie Ihr Ergebnis. Labordatei öffnen ( c04.zmpf ) Quelle: Für die Hühnermast wurde ein Futter mit einer speziellen Hormonzugabe entwickelt. Es soll getestet werden, ob das Hormon das Muskelwachstum unterstützt und damit auch das Gewicht der Hähnchen erhöht. In einem Experiment wird der Versuchsgruppe das Hormonfutter verabreicht und einer Kontrollgruppe normales Standardfutter. Überprüfen Sie zu einem Signifikanzniveau von, ob sich die Hormon-Hähnchengruppen nach dem Experiment in ihrem Gewicht signifikant um +0.2 kg von der Kontrollgruppe unterscheidet. Labordatei öffnen ( c19.zmpf ) Wie schon beim gilt auch hier, dass die Differenz der Stichprobenmittel die Grundlage für die Prüfgröße bilden soll. Als Schätzer für die unbekannten Varianzen und ist die Verwendung der Stichprobenvarianzen und nahe liegend. Allerdings liegt über die Varianzen ein zusätzliches Wissen vor, nämlich dass Varianzhomogenität herrscht, also (Siehe Annahmen.) Diese Information wollen wir uns natürlich zunutze machen. Wir suchen daher einen erwartungstreuen Schätzer, der die Streuung beider Stichproben einbezieht und sie entsprechend nach den jeweiligen Stichprobenumfängen gewichtet. Mit diesen Forderungen erhalten wir den gepoolten Varianzschätzer: Um standardisieren zu können, wird aber der Schätzer für die Varianz der Differenz benötigt. Mit, und den Annahmen, dass und sind und, erhält man unabhängig Ersetzt man durch den gepoolten Varianzschätzer hat man also einen Schätzer für Page 5

gefunden. In einer Untersuchung über das Ernährungsverhalten nahmen 92 zufällig ausgewählte Personen teil. Ein Aspekt der Untersuchung war der Vergleich von fleischloser und nichtfleischloser Ernährung. Dabei lautete die Forschungshypothese, dass Personen mit fleischloser Ernährung im Mittel weniger Kalorien am Tag zu sich nehmen als Menschen, die sich nicht fleischlos ernähren. Man kann davon ausgehen, dass die Kalorienmenge, die eine Person am Tag zu sich nimmt, eine normalverteilte Zufallsgröße ist. Außerdem nimmt man an, dass die Varianz dieser Zufallsgröße in beiden Größen übereinstimmt. Fleisch oder fleischlos? Formulieren Sie für die obige Forschungshypothese das statistische Testproblem, und überprüfen Sie dieses zum Niveau Berechnen Sie zuerst Mittelwerte und die empirische Standardabweichungen. Interpretieren Sie das Ergebnis! Labordatei öffnen ( c8b.zmpf ) Die Schätzwerte, und sind zwar erwartungstreue Schätzer für die wahren Varianzen, doch gerade bei kleinen Stichprobenumfängen weichen die Schätzer möglicherweise stark von ihren wahren Werten ab. Diese Ungenauigkeit kompensiert die t-verteilung mit ihren breiteren Enden, unter denen mehr Wahrscheinlichkeitsmasse liegt als bei der Normalverteilung. Im Gegensatz zu der normalverteilten Teststatistik muss die t-verteilte Prüfgröße einen extremeren Wert annehmen, um die Nullhypothese ablehnen zu können. Für wachsende Stichprobenumfänge und somit für wachsende Freiheitsgrade d.h. mit, nähert sich die t-verteilung der Standardnormalverteilung sehr gut an. (Beim t-test mit homogenen Varianzen ist ) Für große Stichproben ist approximativ standardnormalverteilt. Die Approximation gilt bereits für Stichproben mit mehr als 30 Beobachtungen pro Gruppe. Der Grund dafür ist, dass die Schätzungen und für größer werdende und immer näher an ihren wahren Werten und liegen. Abgetragen sind das 5%-Quantil der Standardnormalverteilung (blau) und der t-verteilung mit 5 Freiheitsgraden (orange). Applet Probieren Sie selber aus, wann die t-verteilung eine gute Approximation der Normalverteilung darstellt. Öffnen Sie hierfür das Applet t-versus-nv (cdc.jar). gepoolten Varianzschätzer Erklärungt-Test ErklärungVarianzhomogenität Erklärung (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: http://www.neuestatistik.de Page 6