Klassifikation von Signifikanztests

Ähnliche Dokumente
Klassifikation von Signifikanztests

Statistische Tests (Signifikanztests)

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Wichtige Definitionen und Aussagen

Einführung in die Induktive Statistik: Testen von Hypothesen

Schließende Statistik

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Analyse von Kontingenztafeln

Statistik II für Betriebswirte Vorlesung 3

Die Familie der χ 2 (n)-verteilungen

Kapitel XIV - Anpassungstests

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

Grundgesamtheit, Merkmale, Stichprobe. Eigenschaften der Stichprobe. Klasseneinteilung, Histogramm. Arithmetisches Mittel, empirische Varianz

Statistik II. Statistische Tests. Statistik II

3 Grundlagen statistischer Tests (Kap. 8 IS)

Statistik I für Betriebswirte Vorlesung 14

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Statistische Tests Übersicht

5. Seminar Statistik

Blockpraktikum zur Statistik mit R

Parametrische und nichtparametrische Tests

Lösungen zum Aufgabenblatt 14

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Zufallsvariablen [random variable]

Ein- und Zweistichprobentests

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Fit for Abi & Study Stochastik

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Statistik und Wahrscheinlichkeitsrechnung

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Arbeitsbuch zur deskriptiven und induktiven Statistik

Statistische Tests zu ausgewählten Problemen

Bereiche der Statistik

Statistische Tests für unbekannte Parameter

KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert

Statistisches Testen

5. Stichproben und Statistiken

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Grundlagen der Statistik

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Test auf den Erwartungswert

Statistik II. IV. Hypothesentests. Martin Huber

Lehrinhalte Statistik (Sozialwissenschaften)

3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/453

Schließende Statistik

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

Statistik II für Betriebswirte Vorlesung 1

2.3 Intervallschätzung

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

Klausur zu Statistik II

8. Konfidenzintervalle und Hypothesentests

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

2.1 Einführung in das Testen von Hypothesen

1 wenn Erfolg im j-ten Versuch

Anhang: Statistische Tafeln und Funktionen

Testen von Hypothesen, Beurteilende Statistik

Mathematische Statistik Aufgaben zum Üben. Schätzer

Mathematik für Biologen

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Häufigkeitsverteilungen

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Chi-Quadrat-Verteilung

10. Die Normalverteilungsannahme

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Klausur zu Statistik II

Es sei x 1. Zeigen Sie mittles vollständiger Induktion, dass dann für jede natürliche Zahl n 0 gilt: n x k = 1 xn+1 1 x.

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

SozialwissenschaftlerInnen II

Statistische Methoden in den Umweltwissenschaften

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

STATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik

Beziehungen zwischen Verteilungen

Allgemeines zu Tests. Statistische Hypothesentests

Statistik II. IV. Hypothesentests. Martin Huber

Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

10 Der statistische Test

Statistik II. Weitere Statistische Tests. Statistik II

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Werkzeuge der empirischen Forschung

5. Schließende Statistik Einführung

Stichproben Parameterschätzung Konfidenzintervalle:

Konkretes Durchführen einer Inferenzstatistik

1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Einfaktorielle Varianzanalyse

Wahrscheinlichkeitsverteilungen

Vergleich zweier Stichproben

Beurteilende Statistik

4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

DWT 334/460 csusanne Albers

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Vorlesung: Statistik II für Wirtschaftswissenschaft

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Klausur zur Vorlesung

Transkript:

Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests werden im Modell Voraussetzungen über die Verteilung des interessierenden Merkmals in der Grundgesamtheit gemacht (z.b. Normalverteilung) und Hypothesen über Parameter dieser Verteilung getestet. Bei nichtparametrischen Tests wird dagegen keine spezielle Verteilung vorausgesetzt (aber ggf. Voraussetzungen wie: stetige Verteilung). 1

Nichtparametrische Tests sind i.a. weniger mächtig als parametrische, d.h. Unterschiede (Abweichungen von der Nullhypothese) werden seltener aufgedeckt (H 0 wird seltener abgelehnt), erfordern jedoch schwächere Voraussetzungen im Modell (bei Ablehnung H 0 von ist eine Aussage über die Population zuverlässiger). 2

Nach der Anzahl der Stichproben: eine Stichprobe: Einstichprobenproblem zwei Stichproben: Zweistichprobenproblem k Stichproben: Mehrstichprobenproblem (k 2) Nach der Art der Erhebung der Stichproben: abhängige (gepaarte [paired samle], verbundene) Stichproben unabhängige [independent] Stichproben 3

Abhängige (gepaarte, verbundene) Stichproben: An jedem Objekt (Probanden) werden mehrere Merkmale untersucht. Damit betrachten wir 2 (oder mehr) Zufallsvariablen über der gleichen Grundgesamtheit gemeinsam. ( ) (X 1, Y 1 ),..., (X n, Y n ) zwei verbundene Stichproben vom Umfang n Beispiele: Blutdruck von PatientInnen vor und nach der Behandlung mit einem Medikament Einkommen einer Person in den Jahren 2003, 2004, 2005 Bildung und Einkommen einer Person 4

Unabhängige Stichproben: An jedem Objekt (Probanden) wird nur ein Merkmal untersucht. Untersucht werden verschiedene, disjunkte (sich nicht überschneidende) Gruppen von Probanden (z.b. zwei Gruppen mit n 1 und n 2 Mitgliedern) aus verschiedenen Schichten der Grundgesamtheit (Subpopulationen). Gesamte Stichprobe mit Stichprobenumfang n 1 + n 2 : (X 1,..., X n1, Y 1,..., Y n2 ) Geschichtete Stichproben: 1. Schicht mit Stichprobenumfang n 1 : (X 1,..., X n1 ) 2. Schicht mit Stichprobenumfang n 2 : (Y 1,..., Y n2 ) Die beiden geschichteten Stichproben sind unabhängig. 5

Beispiele: Blutdruck von PatientInnen aus zwei unterschiedlich behandelten Gruppen mit unterschiedlichen Personen Einkommen von Männern, Einkommen von Frauen 6

Einstichprobenprobleme Einfacher t Test (t Test bei einer Stichprobe) siehe Einführungsbeispiel [t-test, Student s test ] Binomialtest (Test einer Wahrscheinlichkeit) [testing about a population proportion] Anliegen: Sei A ein zufälliges Ereignis mit unbekannter Wahrscheinlichkeit P (A) = ϑ, ϑ [0, 1]. Überprüfung einer Hypothese über diese Wahrscheinlichkeit ϑ anhand von n unabhängigen Versuchen und der daraus ermittelten absoluten Häufigkeit des Eintretens von A. 7

Die mathematische Stichprobe (X 1, X 2,..., X n ) beschreibt, in welchen der n Versuche das Ereignis A eingetreten ist (Bernoulli Schema): 1, falls A im i ten Versuch eintritt X i = 0, falls A im i ten Versuch nicht eintritt 8

Hypothesen: H 0 : ϑ = ϑ 0 H A : ϑ ϑ 0 (1) H A : ϑ < ϑ 0 (2) H A : ϑ > ϑ 0 (3) Testgröße: T = n i=1 X i (absolute Häufigkeit des Eintretens von A) Unter H 0 ist T binomialverteilt mit den Parametern n und ϑ 0. 9

p Wert: p = k {0,...,n} mit P (T =k) P (T =t) P (T = k) bei (1) p = P (T t) = p = P (T t) = t P (T = k) bei (2) k=0 n P (T = k) bei (3) k=t Entscheidungsregel: Ablehnung von H 0, falls p α. 10

SPSS berechnet bei Anwendung des Binomialtest die Überschreitungswahrscheinlichkeit für die zweiseitige Alternativhypothese (1) nur im Spezialfall ϑ 0 = 1/2. In diesem Fall ergeben sich auf Grund der Symmetrie der Verteilung die p Werte für die einseitigen Alternativen durch halbieren des p Wertes für die zweiseitige Alternative. Für ϑ 0 1/2 gibt SPSS nur die p Werte für eine der einseitigen Alternativen aus, und zwar im Fall t/n < ϑ 0 für die Alternative (2) und im Fall t/n > ϑ 0 für die Alternative (3). 11

Für große n (n > 30) werden die Überschreitungswahrscheinlichkeiten nicht exakt mit Hilfe der Binomialverteilung berechnet, sondern näherungsweise mit Hilfe der Normalverteilung (Zentraler Grenzwertsatz). 12

Beispiel: Im Beispiel Verkehrsmittel (n = 100) wurde 53 mal PKW als Verkehrsmittel angegeben. Also ist t = 53. Beim Test der Nullhypothese H 0 : ϑ = ϑ 0 = 0.4 gegen die Alternativhypothese H A : ϑ > ϑ 0 = 0.4 errechnet SPSS (nach (3)) die Überschreitungswahrscheinlichkeit p = P (T 53) = 100 k=53 P (T = k) = 0.006. Bei einem gewählten Signifikanzniveau von α = 0.05 wird die Nullhypothese also abgelehnt. Bemerkung: Für dieses Beispiel hatten wir für den Anteil in der Grundgesamtheit das Konfidenzintervall [0.432, 0.628] zum Konfidenzniveau 0.95 = 1 0.05 berechnet. 13

χ 2 Anpassungstest [goodness of fit test] Anliegen: Nichtparametrischer Test zum Überprüfen der (parametrischen) Modellannahme, dass eine gegebene konkrete Stichprobe (x 1, x 2,..., x n ) aus einer Grundgesamtheit mit einer bestimmten Verteilung F X = F 0 stammt. Dabei bezeichnet F X die Verteilung des interessierenden Merkmales X in der Grundgesamtheit. Der Test wird z.b. auch zum Prüfen von Voraussetzungen für andere (parametrische) Tests verwendet. Hypothesen: H 0 : F X = F 0 H A : F X F 0 14

Vorgehen: Falls keine kategorialen Daten vorliegen, zunächst Klasseneinteilung für die Daten in k Klassen (vgl. Histogramme) K i = (a i, a i+1 ] p i = P 0 (X K i ) = F 0 (a i+1 ) F 0 (a i ) H i : absolute Klassenhäufigkeit Dann ist np i die theoretische, unter der Nullhypothese erwartete Häufigkeit und H i die beobachtete Häufigkeit der i ten Klasse. 15

Testgröße: T = k i=1 (H i np i ) 2 np i Unter H 0 ist T asymptotisch, d.h. näherungsweise für hinreichend große Stichproben, χ 2 verteilt mit k 1 Freiheitsgraden. Enthält F 0 noch r unbekannte Parameter (z.b. Normalverteilung r = 2: falls Erwartungswert µ und Varianz σ 2 unbekannt), so sind diese aus der Stichprobe, basierend auf der Klasseneinteilung, zu schätzen. Die χ 2 Verteilung besitzt dann k r 1 Freiheitsgrade. 16

p Wert: p = P (T t) Entscheidungsregel: Ablehnung von H 0, falls p α. 17

Achtung: Beim Testen von Modellannahmen will man eigentlich H 0 annehmen, dann bleibt der i.a. unbekannte Fehler 2. Art. Mit genügend großen Datenmengen sollte jede Modellannahme widerlegbar sein. Man sollte also zunächst gute Gründe für die Modellannahme haben und will sich mit dem Test lediglich vor Fehlinterpretationen schützen. 18

Bemerkungen: Für die Asymptotik, also für eine gute Näherung durch die χ 2 Verteilung, Klasseneinteilung so, dass np i 5 gilt; also ggf. Klassen zusammenfassen, Randklassen beachten. SPSS bietet auch die Möglichkeit, exakte Überschreitungswahrscheinlichkeiten zu berechnen. Klasseneinteilung willkürlich, Möglichkeit zur Manipulation (vgl. Histogramme) Für sehr große n fast immer Ablehnung von H 0. 19

Kolmogorov Smirnov Test Anliegen: wie beim χ 2 Anpassungstest Voraussetzungen: Verteilungsfunktion F X von X ist stetig und unter H 0 vollständig bekannt (keine Parameter zu schätzen) Hypothesen: H 0 : F X = F 0 H A : F X F 0 20

Testgröße: T = sup x R F n (x) F 0 (x) (größte Abweichung der empirischen Verteilungsfunktion F n von F 0 ) Unter H 0 ist T Kolmogorov verteilt mit n Freiheitsgraden. p Wert: p = P (T t) Entscheidungsregel: Ablehnung von H 0, falls p α. 21

Bemerkungen: Test ist von Hand praktisch nicht durchführbar Computer. Sind Parameter zu schätzen Korrektur der p Werte (z.b: Lilliefors Test für Test auf Normalverteilung) Für den Test auf Normalverteilung existieren bessere spezielle Tests (z.b. Shapiro Wilk Test) 22