Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Ähnliche Dokumente
Jost Reinecke. 7. Juni 2005

So berechnen Sie einen Schätzer für einen Punkt

Allgemeines zu Tests. Statistische Hypothesentests

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Statistische Tests für unbekannte Parameter

5. Seminar Statistik

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Statistische Tests für unbekannte Parameter

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Kapitel III: Einführung in die schließende Statistik

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Statistische Tests (Signifikanztests)

SozialwissenschaftlerInnen II

3 Grundlagen statistischer Tests (Kap. 8 IS)

3) Testvariable: T = X µ 0

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Statistisches Testen

Bereiche der Statistik

Statistik II für Betriebswirte Vorlesung 1

9 Prinzipien der statistischen Hypothesenprüfung

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Statistik I für Betriebswirte Vorlesung 14

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Grundlagen der Statistik

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Mathematik für Biologen

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Statistik II. Statistische Tests. Statistik II

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Klassifikation von Signifikanztests

9 Prinzipien der statistischen Hypothesenprüfung

3.Wiederholung: Toleranzbereiche Für EX Geg:

Beurteilende Statistik

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Statistische Tests Version 1.2

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

8. Konfidenzintervalle und Hypothesentests

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Statistiktutorium (Kurs Frau Jacobsen)

Fit for Abi & Study Stochastik

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Schließende Statistik

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Chi-Quadrat-Verteilung

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

T-Test für unabhängige Stichproben

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

1. Einführung in die induktive Statistik

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Kapitel 3 Schließende Statistik

Aufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:

R. Brinkmann Seite

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

Macht des statistischen Tests (power)

Wahrscheinlichkeitsrechnung und Statistik

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Mathematik für Biologen

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Lösungen zum Aufgabenblatt 14

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Statistik Einführung // Tests auf einen Parameter 8 p.2/74

Klassifikation von Signifikanztests

Willkommen zur Vorlesung Statistik (Master)

Prüfung aus Statistik 2 für SoziologInnen

Hypothesen über die Grundgesamtheit. Aufgabenstellung der Testtheorie Hypothesen (Annahmen, Vermutungen oder

Lösungen zu den Übungsaufgaben in Kapitel 10

Macht des statistischen Tests (power)

Statistische Tests Übersicht

2.3 Intervallschätzung

Grundlagen der schließenden Statistik

Auswertung und Lösung

6. Schätzverfahren für Parameter

T-Test für den Zweistichprobenfall

R. Brinkmann Seite

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Testen von Hypothesen:

2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:

Statistik II. IV. Hypothesentests. Martin Huber

Bereiche der Statistik

Empirische Wirtschaftsforschung

Handelt es sich bei den folgenden um diskrete oder stetige Zufallsvariablen?

Analytische Statistik II

Einführung in die Induktive Statistik: Testen von Hypothesen

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.

Statistisches Testen

Aussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.

Mathematik für Biologen

Mathematische und statistische Methoden II

Tutorial:Unabhängigkeitstest

Konkretes Durchführen einer Inferenzstatistik

Statistik II für Betriebswirte Vorlesung 1

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Transkript:

Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression

Einführung Aus praktischen Gründen ist es in vielen Fällen nicht möglich, bei Untersuchungen die Daten in Form einer Kompletterfassung (Grundgesamtheit) zu erheben. Statt dessen werden Stichproben erhoben und diese untersucht. Man hat eine Stichprobe erhoben und dafür gewisse Parameter bestimmt. Mit deren Hilfe soll nun auf die entsprechenden Parameter der Grundgesamtheit geschlossen und diese geschätzt werden. Dazu werden Hypothesen über die Parameter der Grundgesamtheit aufgestellt und Entscheidungen hinsichtlich der tatsächlichen Werte getroffen. Test einer Stichprobe ob diese ein Verteilungsmuster, etwa eine Normalverteilung, aufweist.

Fragestellungen Man hat etwa die Hypothese, dass eine normalverteilte Grundgesamtheit den wahren Mittelwert µ = 18 hat, in einer Stichprobe ermittelt man jedoch einen Mittelwert x = 19.5. Mit Hilfe des Tests kann nun entschieden werden, ob diese Abweichung von µ nun geringfügig oder so groß ist, dass die Hypothese vom Mittelwert µ = 18 verändert werden muss.

Schätzstatistik In der Schätzstatistik bedient man sich Schätzfunktionen, die einer STP eine reelle Zahl zuordnet, welche als Schätzwert für den zugehörigen unbekannten wahren GG-Parameter verwendet wird. Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C). Punktschätzung: Erfolgt das Schätzen eines wahren Parameters der Grundgesamtheit auf der Grundlage von Stichproben, so ist dies das Konzept der Punktschätzung. Intervallschätzung: Wird gefragt, in welchem Intervall ein gesuchter Parameter mit einer vorgegebenen Wahrscheinlichkeit zu finden ist, so wird eine Intervallschätzung vorgenommen. Konfidenzintervall, Vertrauensbereich: Das Intervall (der Intervallschätzung), in dem ein Parameter mit vorgegebener Wahrscheinlichkeit liegt, nennt man Konfidenzintervall oder auch Vertrauensbereich. Aufgabe der Intervallschätzung ist es also, auf der Grundlage einer STP die untere und obere Grenze eines solchen Konfidenzintervalls zu schätzen.

Schätzstatistik Signifikanzniveau: Ist die Irrtumswahrscheinlichkeit mit der man das Konfidenzintervall schätzen will. Eine Irrtumswahrscheinlichkeit von α = 0.05 (also 5%) wird als signifikant, eine von α = 0.01 (1%) als eindeutigsignifikant und eine von α = 0.001 (0.1%) als hochsignifikant bezeichnet. Sicherheitswahrscheinlichkeit: Ist diejenige Wahrscheinlichkeit p = 1 - α für das Konfidenzintervall, so dass dieses den wahren Parameter enthält. Erwartungstreue: Ein Schätzfunktion ist erwartungstreu, wenn für alle Stichprobenumfänge und alle Werte des Parameters, das arithmetische Mittel der gewonnenen Werte gleich dem zu schätzenden Parameter ist. Bei wiederholtem Schätzen (aus Stichproben derselben Grundgesamtheit) muss also der Schätzwert den gesuchten Parameter im Mittel genau treffen.

Schätzstatistik Bestmögliche Schätzfunktion: Eine Schätzfunktion heißt bestmöglich, wenn sie eine Reihe von Voraussetzungen erfüllt, von denen die wichtigsten sind: Erwartungstreue. Konsistenz: Je größer der STP-Umfang n ist, desto bessere Schätzwerte liefert die Schätzfunktion. Effizienz: Die Schätzfunktion mit dem kleinsten mittleren Schätzfehler ist diejenige mit der geringsten möglichen Varianz.

Schätzstatistik Schätzfunktion für das arithmetische Mittel der Grundgesamtheit: Werden aus einer GG mehrere Wiederholungen von Stichproben vorgenommen, so bekommt man mehrere Schätzungen für das wahre arithmetische Mittel µ der GG (Punktschätzung). Die geeignete Schätzung von µ ist dann: 1 X = m m X i = 1 i mit X j 1 = n j n j j = 1 x j und m, n j Umfang der jeweiligen Stichproben. Einzelwerte der GG Mittelwerte der STP µ x i X X j

Schätzstatistik Schätzfunktion für das arithmetische Mittel der Grundgesamtheit: Werden aus einer GG mehrere Wiederholungen von Stichproben vorgenommen, so bekommt man mehrere Schätzungen für das wahre arithmetische Mittel µ der GG (Punktschätzung). Die geeignete Schätzung von µ ist dann: 1 X = m m X i = 1 i mit X j 1 = n j n j j = 1 x j und m, n j Umfang der jeweiligen Stichproben. Eigenschaften: Wird bei jeder Stichprobe immer die gleiche Anzahl von Stichproben entnommen und daraus die Mittelwertschätzungen berechnet, so zeigt die Häufigkeitsverteilung der unterschiedlichen Mittelwertsschätzungen X j eine Normalverteilung mit dem zentralen Mittelwert X. Der Mittelwert X aus den STP stellt somit den geeignetsten Schätzwert für den Parameter µ der GG dar. Beim genauen Vergleich von X mit µ wird allerdings eine Differenz bestehen, die durch einen Schätzfehler ausgedrückt wird.

Schätzstatistik Standardfehler des arithmetischen Mittels einer Grundgesamtheit: Stellt den mittleren Fehler bei der Schätzung des arithmetischen Mittels einer GG dar. Der Standardfehler σ x gibt an, wie groß die Streuung der X j um den wahren Mittelwert µ der Grundgesamtheit ist mit: σ = x σ n, mit σ Standardabweichung der GG und n Umfang der STP. Eigenschaften: Die Mittelwerte streuen dabei umso weniger, je größer der Stichprobenumfang ist. σ Sind die Mittelwerte X j normalverteilt mit N(µ, ), dann besitzt die Zufallsvariable σ n Z = (X - µ)/ eine Standardnormalverteilung. n

Schätzstatistik Schätzfunktion für die Varianz der Grundgesamtheit: Für eine geeignete Schätzung der Varianz σ 2 einer Grundgesamtheit wird σˆ 2 verwendet mit: 1 σˆ² = n 1 n 2 ( ) mit = i = 1 X i X i X j 1 n j n j j = 1 x j und n, n j Umfang der jeweiligen Stichprobe. Oftmals sind bei zu untersuchenden Daten einer Grundgesamtheit weder µ noch σ bekannt. Für Fragestellungen etwa nach dem Konfidenzintervall wird dann µ durch X und σ durch σ x geschätzt, jeweils also lediglich auf die STP bezogen.

Schätzstatistik Konfidenzintervall: Sind anhand mehrerer Stichproben einer GG die Mittelwerte X j normalverteilt mit zentralem Mittelwert X und Streuung σ, so ist mit der X geforderten Wahrscheinlichkeit p = 1 - α, mit α Signifikanzniveau, das (zweiseitige) Konfidenzintervall für den wahren Mittelwert µ der GG: [ X t α, 2 FG σ X n ; X + t α, 2 FG σ X ] n, mit n Anzahl der Stichproben (der Ziehungen) und t α,fg Wert der Students t-verteilung in Abhängigkeit von der geforderten Wahrscheinlichkeit und dem Freiheitsgrad n-1. Eigenschaften: Die Vertrauenswürdigkeit hängt von der Streuung der STP ab, je größer die Streuung, desto größer ist die Unsicherheit der Schätzung (Standardfehler). Die Vertrauenswürdigkeit hängt von der Anzahl der Stichproben ab, je größer die Stichprobenzahl, desto geringer wird die Unsicherheit der Schätzung und desto kleiner ist das Konfidenzintervall. Je größer man die statistische Sicherheit wählt, desto breiter ist das Konfidenzintervall und damit desto unschärfer die Schätzung.

Schätzstatistik Konfidenzintervall: Sind anhand mehrerer Stichproben einer GG die Mittelwerte X j normalverteilt mit zentralem Mittelwert X und Streuung σ, so ist mit der X geforderten Wahrscheinlichkeit p = 1 - α, mit α Signifikanzniveau, das (zweiseitige) Konfidenzintervall für den wahren Mittelwert µ der GG: [ X t α, 2 FG σ X n ; X + t α, 2 FG σ X ] n, mit n Anzahl der Stichproben (der Ziehungen) und t α,fg Wert der Students t-verteilung in Abhängigkeit von der geforderten Wahrscheinlichkeit und dem Freiheitsgrad n-1. X t α, 2 FG σ X n X + t X α, FG 2 σ X n

Schätzstatistik Beispiel: Kaufkraft von Personen. Anhand einer Untersuchung von n = 30 Haushalten wird festgestellt, dass mittlere monatliche Ausgaben von X = 850 anfallen bei einer Streuung von σ X = 400. Die Frage ist, ob aus diesen Angaben auf die Situation der GG geschlossen werden kann. Man fordert dabei eine Irrtumswahrscheinlichkeit von p = 5% (zweiseitig), demzufolge also eine Sicherheitswahrscheinlichkeit von 95%. Der t α/2,fg -Wert für α = 0.05 bei 29 Freiheitsgraden ist 2.045. Daraus ergibt sich das Konfidenzintervall zu [700.6; 999.3 ]. Innerhalb dieses Intervalls liegt mit 95% Wahrscheinlichkeit der wahre Mittelwert µ der Grundgesamtheit.

Schätzstatistik - Students t-verteilung

Mit Hilfe von Testverfahren ist es möglich, aufgrund von Zufallsstichproben Hypothesen über ansonsten unbekannte Grundgesamtheiten zu testen. Weil diese Entscheidung nur auf der Basis der STP erfolgt, kann sie immer nur mit einer Irrtumswahrscheinlichkeit getroffen werden. Hypothesentests haben damit die Aufgabe, die Frage nach der Zufälligkeit beobachteter Abweichungen zu beantworten. Fragestellungen: Sind die mittleren Jahrestemperaturen heute tatsächlich höher als noch vor 100 Jahren? Unterscheiden sich die mittleren Jahrestemperaturen in der Stadt von denen im Freiland? Ist der Ernteertrag nach Einführung einer neuen Düngemethode signifikant größer als vorher?

Solche statistischen Testverfahren sind nicht auf beliebig formulierte Arbeitshypothesen, sondern nur auf bestimmte Formen anwendbar, von denen die Nullhypothesen für praktische Anwendungen in den Geowissenschaften besonders wichtig sind. Grundlage der Einschätzung ist die Verwendung von Prüfparametern, die eine Normalverteilung (t-test, z-test) oder eine asymmetrische Verteilung (Chi- Quadrat-Test, F-Verteilung) haben und mit Tabellenwerten verglichen werden.

Nullhypothese, Alternativhypothese: Eine Nullhypothese H 0 ist eine Behauptung über die Gleichheit statistischer Eigenschaften von STP und GG. Die Verneinung von H 0 wird Alternativhypothese H A genannt. Die Nullhypothese wird auf der Basis der Irrtumswahrscheinlichkeit α überprüft, die den Vertrauensbereich der Nullhypothese einseitig oder zweiseitig begrenzt. Ein statistischer Test liefert also genau genommen eine Entscheidung darüber, ob die Nullhypothese zu verwerfen ist und damit die Alternativhypothese mit einer gegebenen Irrtumswahrscheinlichkeit angenommen werden kann. Das Beibehalten einer Nullhypothese bedeutet aber nicht, dass diese damit nachgewiesen wäre: Sie ist unter den gegebenen Testbedingungen nur nicht widerlegbar.

Beispiel: Mittelwert der Körpergrößen von Populationen. H 0 : Der Mittelwert einer STP gleicht dem bereits bekannten Mittelwert einer anderen Population. H A : Die Alternativhypothese besagt dann, dass der Mittelwert der STP sich signifikant von dem bekannten Vergleichswert unterscheidet, er gehört zu einer anderen Population. Die Nullhypothese nimmt also an, dass die Abweichungen der Mittel rein zufällig, d.h. stochastischer Natur sind, während die Alternativhypothese diese Zufälligkeit ablehnt und sie einem oder mehreren unbekannten Faktoren zuschreibt.

Beispiel: Mittelwert. Man hat die Hypothese, dass eine normalverteilte GG den wahren Mittelwert µ = 18 hat, in einer Stichprobe ermittelt man jedoch einen Mittelwert X = 19.5. Mit Hilfe des Tests kann nun entschieden werden, ob diese Abweichung von µ nun geringfügig ist oder so groß ist, dass die Hypothese vom Mittelwert µ = 18 verändert werden muss.

Beispiel: Ernteertrag und neue Düngemethode. Bei der Fragestellung ob der mittlere Ernteertrag X nach Einführung einer neuen Düngemethode signifikant größer ist als vorher mit dem mittleren Ernteertrag µ, lassen sich die Hypothesen formulieren: H 0 : Die unterschiedlichen Ernteerträge sind rein zufällig, also µ = X. H A : Die durch die Düngemethode erzielten Erträge sind signifikant größer als vorher (hier einseitige Formulierung), also µ < X.

Fehlerwahrscheinlichkeiten: Die Teststatistik kann nur statistische Aussagen über den Wahrheitsgehalt von Hypothesen machen, dabei treten Irrtumswahrscheinlichkeiten bei der Entscheidung auf. Mit der Nullhypothese H 0 und der Alternativhypothese H A sind dabei mehrere Fälle zu unterscheiden, wobei mit Hilfe eines Stichprobenschätzwertes geklärt werden soll, ob der wahre Wert eines Sachverhaltes bestätigt oder abgelehnt wird. Für die Ablehnung der Nullhypothese wird eine Irrtumswahrscheinlichkeit (Signifikanzniveau) gewählt, zumeist α = 0.05. In 5% der Fälle ist man also bereit die Nullhypothese abzulehnen, obwohl sie dennoch stimmen könnte. Es ist auch möglich, dass die Nullhypothese beibehalten wird obwohl sie falsch ist, dafür wird eine Wahrscheinlichkeit β angenommen.

Fehlerwahrscheinlichkeiten: α und β - Fehler. Wahrer Sachverhalt Wahre Wert x ist gleich 0 Wahre Wert x ist ungleich 0 Annehmen von H 0 : x ist gleich 0 Richtige Entscheidung, wahre Sachverhalt stimmt mit Testergebnis überein, P = 1 - α Falsche Entscheidung, H A wäre richtig, Testergebnis führt aber zu H 0, P = β (β-fehler) Entscheidung des Tests Annehmen von H A : x ist ungleich 0 Falsche Entscheidung, H 0 wäre richtig, Testergebnis führt aber zu H A, P = α (α-fehler, Irrtumswahrscheinlichkeit) Richtige Entscheidung, wahre Sachverhalt stimmt mit Testergebnis überein, P = 1 - β

Fehlerwahrscheinlichkeiten: In dem Maße, in dem man das Signifikanzniveau verringert, nimmt die Wahrscheinlichkeit des β-fehlers zu. Man läuft also zunehmend Gefahr, die Alternativhypothese zu widerlegen, obwohl sie eigentlich richtig ist. Geringe Werte von α sind daher mit größeren Werten von β verbunden und umgekehrt. Wenn die Nullhypothese abgelehnt wird, kann nur der Fehler mit Wahrscheinlichkeit α auftreten. Das Testergebnis kann dann entsprechend sicher formuliert werden, dass H 0 mit vorgegebener Irrtumswahrscheinlichkeit verworfen wird.

Vorgehensweise des Hypothesentests (zweiseitiger Test): Frage nach dem statistischen Zusammenhang zweier Sachverhalte A und B. Formulierung der Nullhypothese H 0 und der Alternativhypothese H A. H 0 : Es besteht kein Unterschied zwischen A und B. H A : Es besteht ein signifikanter Unterschied zwischen A und B. Festlegung einer Irrtumswahrscheinlichkeit α (Signifikanzniveau) und Ermittlung der Freiheitsgrade FG. Auswahl eines geeigneten statistisches Testverfahrens passend zur Fragestellung (mit Normalverteilung, t-verteilung, χ² -Verteilung). Berechnung der Prüfgröße t mit Hilfe einer Schätzfunktion durch die empirischen Werte der STP.

Vorgehensweise des Hypothesentests (zweiseitiger Test): Frage nach dem statistischen Zusammenhang zweier Sachverhalte A und B. Bestimmung der Schwellenwerte des Signifikanzniveaus anhand von Tabellen, etwa t α 1 und t α2 mit t α1 < t α2 und Vergleich der Prüfgröße t mit diesen Werten: Ist t < t α 1 oder t > t α 2, so ist die Nullhypothese abzulehnen und die Alternativhypothese anzunehmen, die Prüfgröße liegt außerhalb der Grenzwahrscheinlichkeit, also im Bereich der Irrtumswahrscheinlichkeit. Andernfalls ist die Nullhypothese anzunehmen und die Alternativhypothese abzulehnen, die Prüfgröße liegt also innerhalb der Grenzwahrscheinlichkeit. α 2 t α1 µ 1 - α t α2 α 2 Ablehnungsbereich Annahmebereich Ablehnungsbereich

Vorgehensweise des Hypothesentests (einseitiger Test): Bei der Hypothesentestung muss lediglich ein Schwellenwert bestimmt und mit der Prüfgröße verglichen werden. Bei dieser Fragestellung kann Überschreitung oder Unterschreitung auftreten. Eigenschaften des Hypothesentests (einseitig, zweiseitig): Je niedriger das Signifikanzniveau gewählt wird, desto kleiner ist der Ablehnungsbereich der Nullhypothese und umso extremere Werte muss die Prüfgröße t des jeweiligen Tests aufweisen, damit die Nullhypothese widerlegt werden kann. Man ist dann also nur noch etwa in 1% (vorher 5%) der Fälle bereit die Nullhypothese abzulehnen und die Alternativhypothese anzunehmen. Die Wahrscheinlichkeit, die Nullhypothese abzulehnen sinkt daher.

Beispiel: Ernteertrag und neue Düngemethode. Für ein Untersuchungsgebiet soll bestimmt werden, ob der Ernteertrag nach der Einführung einer neuen Düngemethode signifikant größer ist als vorher. Der Ertrag vor Einführung der neuen Düngemethode lag im Mittel bei µ = 1100 kg/ha. Bei einem Versuchsprogramm werden in einer Stichprobe n = 30 Felder untersucht. Die Messungen ergaben einen mittleren Ertrag von X = 1300 kg/ha mit einer Streuung von σ X = 500 kg/ha. Frage: Ist dieser Mehrertrag zufällig oder ist er signifikant größer als der Ernteertrag vorher?

Beispiel: Ernteertrag und neue Düngemethode. Formulierung der Nullhypothese H 0 und der Alternativhypothese H A : H 0 : Die unterschiedlichen Ernteerträge sind rein zufällig, also µ = X. H A : Die durch die Düngemethode erzielten Erträge sind signifikant größer als vorher (hier einseitige Formulierung), also µ < X. Aufgrund der Fragestellung wird ein Signifikanzniveau von 5% verwendet, also α = 0.05. Aufgrund des Stichprobenumfangs n = 30 wird eine Studentsche t-verteilung zugrunde gelegt.

Beispiel: Ernteertrag und neue Düngemethode. Die Prüfgröße soll Unterschiede der Mittelwerte erfassen und ist daher bestimmt durch: t = (X - µ)/ σ X n, mit X mittlerer Ertrag nach und µ Mittelwert vor Einführung der neuen Methode, σ X Streuung und n Umfang der Stichproben. Die Prüfgröße steht in engem Zusammenhang mit der Angabe der Intervallgrenzen des Konfidenzintervalls. Es ist t = 2.19. Aus der t-tabelle für einen einseitigen Test mit n-1 Freiheitsgraden und α = 0.05 ergibt sich für den Schwellenwert des Signifikanzniveaus der Wert t α2 = 1.7.

Beispiel: Ernteertrag und neue Düngemethode. Wegen t α2 < t bei der geforderten Irrtumswahrscheinlichkeit von 5% liegt die Prüfgröße im Bereich des Ablehnungsbereiches, also oberhalb des aus der Tabelle bestimmten Schwellenwertes für den Vertrauensbereich. Daher wird die Nullhypothese H o abgelehnt und die Alternativhypothese H A angenommen. Die durch die Düngemethode erzielten Erträge sind daher signifikant größer als vorher.

Eigenschaften des Hypothesentests (einseitig, zweiseitig): Ist der Tabellenwert t α 1 und die Prüfgröße t bereits bestimmt, dann führt eine nachträgliche Änderung des Signifikanzniveaus auch zu einer Änderung des Tabellenwertes t α1 und damit möglicherweise auch zu einer Änderung in der Entscheidung über die Annahme der Hypothese. Damit verbunden sind dann allerdings auch veränderte Annahmebedingungen. Ist etwa t < t α 1 bei 10% (H 0 wird beibehalten) aber t α1 < t bei 20% (H 0 wird abgelehnt), so bedeutet dies, dass man nun in 20% der Fälle bereit ist, die Nullhypothese abzulehnen, obwohl sie dennoch stimmen könnte. Ist etwa t α 1 < t bei 10% (H 0 wird abgelehnt) aber t < t α1 bei 5% (H 0 wird beibehalten), so bedeutet dies, dass man nun die Nullhypothese nicht mehr ablehnen kann, was eigentlich beabsichtigt war.

Beispiel: Temperaturdaten. Als STP stehen die mittleren jährlichen Lufttemperaturen an n = 30 Messstationen zur Verfügung. Die beiden NVT-Parameter µ und σ sind zwar nicht bekannt, können aber durch die entsprechenden STP-Kennwerte geschätzt werden. Der Mittelwert ist X = 7,6 C und die Standardabweichung σ X = 0,74 C. Die STP stützen die Annahme, dass die Grundgesamtheit normalverteilt ist. Fragen: Innerhalb welches Konfidenzintervalls liegt der tatsächliche Mittelwert µ der Grundgesamtheit mit 95% (99%) Wahrscheinlichkeit? Weichen die mittleren jährlichen Lufttemperaturen mit einer Irrtumswahrscheinlichkeit von 5% von 7 C ab?

Beispiel: Temperaturdaten. Mit einer statistischen Sicherheit von 95% liegt der unbekannte Mittelwert µ der GG innerhalb des Intervalls [7.32; 7.87]. Als Nullhypothese H 0 wird formuliert: Die Abweichung von 7 C ist nur zufällig bedingt. Die Alternativhypothese H A lautet: Die Abweichung ist signifikant.

Beispiel: Temperaturdaten. Für die Prüfgröße t für Mittelwerte erhält man t = 4.4. Aus der Tabelle für einen zweiseitigen Test mit n-1 Freiheitsgraden und α = 0.05 ergibt sich für den Schwellenwert t α des Signifikanzniveaus der Wert t α = 2.045. Wegen t α < t bei der geforderten Irrtumswahrscheinlichkeit kann angenommen werden, dass die Temperatur im Mittel von 7 C verschieden ist.

t-anpassungstest (gepaart): Prüft die Daten zweier gepaarter Stichproben X 1 und X 2 (jedem x i1 ist ein x i2 zugeordnet) mit Hilfe der Prüfgröße t, ob sie ähnlich zueinander sind, oder ob signifikante Unterschiede festzustellen sind. Die geeignete Prüfgröße t ist: t = n i = 1 ( x 1 x 2 ) X 1 i σ σ n i X 2, mit x i1 und x i2 Häufigkeiten der beiden STP, n Anzahl der jeweiligen STP, σ X1, σ X2 Standardabweichungen, Freiheitsgrad 2n-2.

t-anpassungstest (ungepaart): Prüft die Daten zweier gepaarter Stichproben X 1 und X 2 (die x i1 haben keinen festen Bezug zu den x i2 ) mit Hilfe der Prüfgröße t, ob sie ähnlich zueinander sind, oder ob signifikante Unterschiede festzustellen sind. Die geeignete Prüfgröße t ist: t = X 1 2 X X σ σ 1 n 2 X 2 2, mit X 1 und X 2 arithmetische Mittel der beiden STP, n Anzahl der jeweiligen STP, σ X1, σ X2 Standardabweichungen, Freiheitsgrad 2n-2.

F-Test: Prüft mit Hilfe der Prüfgröße F, ob zwei Stichproben X 1 und X 2 ähnliche Varianz haben, oder ob signifikante Unterschiede festzustellen sind. Die geeignete Prüfgröße F ist: σ X F = σ X 1 2 2 2, mit σ X12 < σ X22 Varianzen, Freiheitsgrad n-2.

Chi-Quadrat Anpassungstest (zwei n 1- Matrizen): Prüft die Daten einer Stichprobe mit Hilfe der Prüfgröße χ 2, ob eine beobachtete Häufigkeitsverteilung H beo ähnlich zu der einer erwarteten Häufigkeitsverteilung H erw ist, oder ob signifikante Unterschiede festzustellen sind. Die geeignete Prüfgröße χ 2 ist: χ = n 2 2 ( hi,beo hi,erw) i= 1 h, i,erw, mit h erw erwarteten und h beo beobachteten Häufigkeiten, n Anzahl der Daten, Freiheitsgrad n-1. Eigenschaften: Damit lässt sich feststellen, welcher Verteilung (Normalverteilung, t-verteilung, Chi 2 -Verteilung) die beobachtete Häufigkeitsverteilung H beo am ähnlichsten ist. Aus unterschiedlichen Klasseneinteilungen resultieren unterschiedliche Ergebnisse.

Beispiel: Vergleich der Häufigkeit von Ergebnissen. Bei einer Messung der Anzahl von eingetretenen verschiedenen Ereignisse ergibt sich folgende Verteilung: H beo H erw A 40 50 B 55 50 C 51 50 D 49 50 E 46 50 F 59 50 Summe 300 300

Beispiel: Vergleich der Häufigkeit von Ergebnissen. Die Formulierung der Nullhypothese H o besagt, dass die Abweichung nur zufällig bedingt ist. Mit der Prüfgröße χ 2 ergibt sich: H beo H erw (H beo -H erw ) 2 /H erw A 40 50 2 B 55 50 0.5 C 51 50 0.02 D 49 50 0.02 E 46 50 0.32 F 59 50 1.62 Summe 300 300 4.48

Beispiel: Vergleich der Häufigkeit von Ergebnissen. Die Prüfgröße χ 2 besitzt den Wert 4.48, der kritische Schwellenwert χ α,fg2 in Abhängigkeit vom geforderten Signifikanzniveau α = 0.05 und n-1 = 5 Freiheitsgraden ist χ α,fg2 = 11.1. Wegen χ 2 < χ α,fg2 ist daher die Nullhypothese H o anzunehmen, die gemessene Streuung ist daher nur zufällig bedingt.

- Chi Quadrat-Verteilung

Chi-Quadrat Anpassungstest (zwei n m- Matrizen): Prüft die Daten einer Stichprobe mit Hilfe der Prüfgröße χ 2, nachdem eine beobachtete Häufigkeitsverteilung H beo ähnlich zu der einer erwarteten Häufigkeitsverteilung H erw ist, oder ob signifikante Unterschiede festzustellen sind. Die geeignete Prüfgröße χ 2 ist: χ 2 = m n ( ) h ij, beo h h j= 1 i= 1 ij, erw ij, erw 2, mit h ij,erw erwarteten und h ij,beo beobachteten Häufigkeiten, n Anzahl der Merkmale, m Anzahl der Klassen, Freiheitsgrad (n-1) (m-1).

Beispiel: Vergleich der Häufigkeit von Ergebnissen. beobachtet erwartet Männer Frauen Männer Frauen Zustimmung 58 35 45.35 47.65 Unentschieden 11 25 17.56 18.11 Ablehnung 10 23 16.09 16.91