Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests werden im Modell Voraussetzungen über die Verteilung des interessierenden Merkmals in der Grundgesamtheit gemacht (z.b. Normalverteilung) und Hypothesen über Parameter dieser Verteilung getestet. Bei nichtparametrischen Tests wird dagegen keine spezielle Verteilung vorausgesetzt (aber ggf. Voraussetzungen wie: stetige Verteilung). 1

Nichtparametrische Tests sind i.a. weniger mächtig als parametrische, d.h. Unterschiede (Abweichungen von der Nullhypothese) werden seltener aufgedeckt (H 0 wird seltener abgelehnt), erfordern jedoch schwächere Voraussetzungen im Modell (bei Ablehnung H 0 von ist eine Aussage über die Population zuverlässiger). 2

Nach der Anzahl der Stichproben: eine Stichprobe: Einstichprobenproblem zwei Stichproben: Zweistichprobenproblem k Stichproben: Mehrstichprobenproblem (k 2) Nach der Art der Erhebung der Stichproben: abhängige (gepaarte [paired samle], verbundene) Stichproben unabhängige [independent] Stichproben 3

Abhängige (gepaarte, verbundene) Stichproben: An jedem Objekt (Probanden) werden mehrere Merkmale untersucht. Damit betrachten wir 2 (oder mehr) Zufallsvariablen über der gleichen Grundgesamtheit gemeinsam. ( ) (X 1, Y 1 ),..., (X n, Y n ) zwei verbundene Stichproben vom Umfang n Beispiele: Blutdruck von PatientInnen vor und nach der Behandlung mit einem Medikament Einkommen einer Person in den Jahren 2003, 2004, 2005 Bildung und Einkommen einer Person 4

Unabhängige Stichproben: An jedem Objekt (Probanden) wird nur ein Merkmal untersucht. Untersucht werden verschiedene, disjunkte (sich nicht überschneidende) Gruppen von Probanden (z.b. zwei Gruppen mit n 1 und n 2 Mitgliedern) aus verschiedenen Schichten der Grundgesamtheit (Subpopulationen). Gesamte Stichprobe mit Stichprobenumfang n 1 + n 2 : (X 1,..., X n1, Y 1,..., Y n2 ) Geschichtete Stichproben: 1. Schicht mit Stichprobenumfang n 1 : (X 1,..., X n1 ) 2. Schicht mit Stichprobenumfang n 2 : (Y 1,..., Y n2 ) Die beiden geschichteten Stichproben sind unabhängig. 5

Beispiele: Blutdruck von PatientInnen aus zwei unterschiedlich behandelten Gruppen mit unterschiedlichen Personen Einkommen von Männern, Einkommen von Frauen 6

Einstichprobenprobleme Einfacher t Test (t Test bei einer Stichprobe) siehe Einführungsbeispiel [t-test, Student s test ] Binomialtest (Test einer Wahrscheinlichkeit) [testing about a population proportion] Anliegen: Sei A ein zufälliges Ereignis mit unbekannter Wahrscheinlichkeit P (A) = ϑ, ϑ [0, 1]. Überprüfung einer Hypothese über diese Wahrscheinlichkeit ϑ anhand von n unabhängigen Versuchen und der daraus ermittelten absoluten Häufigkeit des Eintretens von A. 7

Die mathematische Stichprobe (X 1, X 2,..., X n ) beschreibt, in welchen der n Versuche das Ereignis A eingetreten ist (Bernoulli Schema): 1, falls A im i ten Versuch eintritt X i = 0, falls A im i ten Versuch nicht eintritt 8

Hypothesen: H 0 : ϑ = ϑ 0 H A : ϑ ϑ 0 (1) H A : ϑ < ϑ 0 (2) H A : ϑ > ϑ 0 (3) Testgröße: T = n i=1 X i (absolute Häufigkeit des Eintretens von A) Unter H 0 ist T binomialverteilt mit den Parametern n und ϑ 0. 9

p Wert: p = k {0,...,n} mit P (T =k) P (T =t) P (T = k) bei (1) p = P (T t) = p = P (T t) = t P (T = k) bei (2) k=0 n P (T = k) bei (3) k=t Entscheidungsregel: Ablehnung von H 0, falls p α. 10

SPSS berechnet bei Anwendung des Binomialtest die Überschreitungswahrscheinlichkeit für die zweiseitige Alternativhypothese (1) nur im Spezialfall ϑ 0 = 1/2. In diesem Fall ergeben sich auf Grund der Symmetrie der Verteilung die p Werte für die einseitigen Alternativen durch halbieren des p Wertes für die zweiseitige Alternative. Für ϑ 0 1/2 gibt SPSS nur die p Werte für eine der einseitigen Alternativen aus, und zwar im Fall t/n < ϑ 0 für die Alternative (2) und im Fall t/n > ϑ 0 für die Alternative (3). 11

Für große n (n > 30) werden die Überschreitungswahrscheinlichkeiten nicht exakt mit Hilfe der Binomialverteilung berechnet, sondern näherungsweise mit Hilfe der Normalverteilung (Zentraler Grenzwertsatz). 12

Beispiel: Im Beispiel Verkehrsmittel (n = 100) wurde 53 mal PKW als Verkehrsmittel angegeben. Also ist t = 53. Beim Test der Nullhypothese H 0 : ϑ = ϑ 0 = 0.4 gegen die Alternativhypothese H A : ϑ > ϑ 0 = 0.4 errechnet SPSS (nach (3)) die Überschreitungswahrscheinlichkeit p = P (T 53) = 100 k=53 P (T = k) = 0.006. Bei einem gewählten Signifikanzniveau von α = 0.05 wird die Nullhypothese also abgelehnt. Bemerkung: Für dieses Beispiel hatten wir für den Anteil in der Grundgesamtheit das Konfidenzintervall [0.432, 0.628] zum Konfidenzniveau 0.95 = 1 0.05 berechnet. 13

χ 2 Anpassungstest [goodness of fit test] Anliegen: Nichtparametrischer Test zum Überprüfen der (parametrischen) Modellannahme, dass eine gegebene konkrete Stichprobe (x 1, x 2,..., x n ) aus einer Grundgesamtheit mit einer bestimmten Verteilung F X = F 0 stammt. Dabei bezeichnet F X die Verteilung des interessierenden Merkmales X in der Grundgesamtheit. Der Test wird z.b. auch zum Prüfen von Voraussetzungen für andere (parametrische) Tests verwendet. Hypothesen: H 0 : F X = F 0 H A : F X F 0 14

Vorgehen: Falls keine kategorialen Daten vorliegen, zunächst Klasseneinteilung für die Daten in k Klassen (vgl. Histogramme) K i = (a i, a i+1 ] p i = P 0 (X K i ) = F 0 (a i+1 ) F 0 (a i ) H i : absolute Klassenhäufigkeit Dann ist np i die theoretische, unter der Nullhypothese erwartete Häufigkeit und H i die beobachtete Häufigkeit der i ten Klasse. 15

Testgröße: T = k i=1 (H i np i ) 2 np i Unter H 0 ist T asymptotisch, d.h. näherungsweise für hinreichend große Stichproben, χ 2 verteilt mit k 1 Freiheitsgraden. Enthält F 0 noch r unbekannte Parameter (z.b. Normalverteilung r = 2: falls Erwartungswert µ und Varianz σ 2 unbekannt), so sind diese aus der Stichprobe, basierend auf der Klasseneinteilung, zu schätzen. Die χ 2 Verteilung besitzt dann k r 1 Freiheitsgrade. 16

p Wert: p = P (T t) Entscheidungsregel: Ablehnung von H 0, falls p α. 17

Achtung: Beim Testen von Modellannahmen will man eigentlich H 0 annehmen, dann bleibt der i.a. unbekannte Fehler 2. Art. Mit genügend großen Datenmengen sollte jede Modellannahme widerlegbar sein. Man sollte also zunächst gute Gründe für die Modellannahme haben und will sich mit dem Test lediglich vor Fehlinterpretationen schützen. 18

Bemerkungen: Für die Asymptotik, also für eine gute Näherung durch die χ 2 Verteilung, Klasseneinteilung so, dass np i 5 gilt; also ggf. Klassen zusammenfassen, Randklassen beachten. SPSS bietet auch die Möglichkeit, exakte Überschreitungswahrscheinlichkeiten zu berechnen. Klasseneinteilung willkürlich, Möglichkeit zur Manipulation (vgl. Histogramme) Für sehr große n fast immer Ablehnung von H 0. 19

Kolmogorov Smirnov Test Anliegen: wie beim χ 2 Anpassungstest Voraussetzungen: Verteilungsfunktion F X von X ist stetig und unter H 0 vollständig bekannt (keine Parameter zu schätzen) Hypothesen: H 0 : F X = F 0 H A : F X F 0 20

Testgröße: T = sup x R F n (x) F 0 (x) (größte Abweichung der empirischen Verteilungsfunktion F n von F 0 ) Unter H 0 ist T Kolmogorov verteilt mit n Freiheitsgraden. p Wert: p = P (T t) Entscheidungsregel: Ablehnung von H 0, falls p α. 21

Bemerkungen: Test ist von Hand praktisch nicht durchführbar Computer. Sind Parameter zu schätzen Korrektur der p Werte (z.b: Lilliefors Test für Test auf Normalverteilung) Für den Test auf Normalverteilung existieren bessere spezielle Tests (z.b. Shapiro Wilk Test) 22