Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen 5.2 Zwei metrische (oder ordinale) Variablen 5.3 Vergleich einer metrischen (oder ordinalen) Variable zu einem festen Wert 5.4 Vergleich von zwei Gruppen einer metrischen (oder ordinalen) Variable 5.5 Vergleich von mehr als zwei Gruppen einer metrischen (oder ordinalen) Variable 5.6 Vergleich von zwei Messwiederholungen einer metrischen (oder ordinalen) Variable 5.7 Vergleich von mehr als zwei Messwiederholungen einer metrischen (oder ordinalen) Variable 5.8 Vergleich der Überlebenszeit zwischen Gruppen Zusammenfassung Umsetzungsaufgabe Die meisten Fragestellungen können mit einfachen Signifikanztests untersucht werden. Mit einfachen Signifikanztests meine ich hier statistische Testverfahren, die die Beziehung zwischen zwei Variablen (eventuell auch nur einer Variable und einem festen Wert) untersuchen. Ich stelle Dir hier die verschiedenen Methoden mit den Voraussetzungen dazu vor. Die passende Methode hängt ab vom Variablentyp, bei kategorialen Variablen von der Anzahl der Kategorien, bei metrischen Variablen von der Verteilung und davon, ob es sich um verbundene Messungen (Messwiederholung) oder unverbundene Messungen (Gruppen) handelt. Was die einzelnen Voraussetzungen bedeuten und wie Du sie prüfen kannst, findest Du später in der Bonus-Lektion Voraussetzungen und Transformationen.
5.1 Zwei kategoriale Variablen Seite 2 von 7 Wenn Du eine Hypothese formuliert hast, die den Zusammenhang zwischen zwei kategorialen Variablen betrifft (oder auch den Unterschied einer kategorialen Variablen in den Kategorien der anderen kategorialen Variable), dann hast Du in der deskriptiven Analyse Kreuztabellen erstellt. Als Test wird auf dieser Kreuztabelle dann entweder ein Chi-Quadrat-Test oder ein Fishers Exakter Test gerechnet. Fishers Exakter Test verwendest Du für den Zusammenhang zweier kategorialer Variablen, wenn beide Variablen genau zwei Ausprägungen haben (2x2- Kreuztabelle). Weitere Voraussetzungen hat Fishers Exakter Test nicht. Chi- Quadrat-Test verwendest Du für den Zusammenhang zweier kategorialer Variablen, wenn mindestens eine Variable mehr als zwei Ausprägungen hat. Eine zusätzliche Voraussetzung des Chi-Quadrat-Tests ist, dass die Zellen der Kreuztabelle nicht zu schwach besetzt sind. Es sollen mindestens 25 % der Zellen eine erwartete Häufigkeit von mindestens 5 haben, damit der Test verlässlich ist. 5.2 Zwei metrische (oder ordinale) Variablen Wenn Du mit Deiner Hypothese den Zusammenhang zwischen zwei metrischen oder ordinalen Variablen untersuchst, berechnest Du für die deskriptive Analyse den Korrelationskoeffizienten. Dieser Korrelationskoeffizient wird noch auf Signifikanz getestet, um zu untersuchen, ob er sich signifikant von 0 unterscheidet. Das heißt, ob es einen signifikanten Zusammenhang gibt. Als passende Methoden stelle ich Dir hier zwei Korrelationen vor: die Korrelation nach Pearson und die Korrelation nach Spearman: Pearson-Korrelation Die Pearson-Korrelation folgendes zutrifft: beide Variablen sind metrisch und normalverteilt es besteht kein nicht-linearer Zusammenhang zwischen den beiden Variablen (Voraussetzung Linearität).
Spearman-Korrelation Seite 3 von 7 Die Spearman-Korrelation wird dann verwendet, wenn die Pearson-Korrelation nicht erlaubt ist, nämlich wenn eine oder beide Variablen ordinal sind oder nicht normalverteilt oder wenn es einen nicht-linearen Zusammenhang zwischen den Variablen gibt. Anmerkung zu parametrischen und nichparametrischen Verfahren: Die Spearman-Korrelation ist eine so genannte nichtparametrische Methode. Das bedeutet, sie rechnet nicht mit den Messwerten an sich sondern mit den Rängen. Deshalb ist es für die Rechnung egal, ob eine Normalverteilung vorliegt oder nicht. Das heißt, dass für alle nichtparametrischen Methoden (auch für die Du später noch kennenlernen wirst) gilt, dass hier auch die Verwendung von normalverteilten Daten erlaubt ist. Nichtparametrische Methoden haben aber eine etwas geringere Teststärke, deshalb wählt man wenn möglich - die parametrischen Methoden, die Normalverteilung voraussetzen. 5.3 Vergleich einer metrischen (oder ordinalen) Variable zu einem festen Wert Wenn Du für Deine Hypothese eine metrische oder ordinale Variable zu einem festen Wert vergleichen willst, dann sind folgende Methoden passend: t-test für eine Stichprobe die Variable metrisch und normalverteilt ist und der Vergleichswert mit dem Mittelwert verglichen wird. Wilcoxon-Test für eine Stichprobe die Variable ordinal oder nicht normalverteilt ist und der Vergleichswert mit dem Median verglichen wird. 5.4 Vergleich von zwei Gruppen einer metrischen (oder ordinalen) Variable
zwei Gruppen (eine dichotome Gruppenvariable) vergleichen willst, dann wählst Du folgendermaßen den passenden Test aus: t-test für unabhängige Stichproben in beiden Gruppen normalverteilt ist und die Varianzen gleich sind (= Voraussetzung Varianzhomogenität). Seite 4 von 7 Liegt keine Varianzhomogenität vor, so wird die Welch-Anpassung des t- Tests verwendet. Mann-Whitney-U-Test für unabhängige Stichproben Es gibt keine Anforderung an die Verteilung und an die Varianzen. 5.5 Vergleich von mehr als zwei Gruppen einer metrischen (oder ordinalen) Variable mehr als zwei Gruppen (eine kategoriale Gruppenvariable) vergleichen willst, dann wählst Du folgendermaßen den passenden Test aus: Varianzanalyse (ANOVA) in allen Gruppen normalverteilt ist und die Varianzen gleich sind (= Voraussetzung Varianzhomogenität). Liegt keine Varianzhomogenität vor, so wird die Welch-Anpassung der ANOVA verwendet. Kruskal-Wallis-Test Es gibt keine Anforderung an die Verteilung und an die Varianzen.
5.6 Vergleich von zwei Messwiederholungen einer metrischen (oder ordinalen) Variable Seite 5 von 7 zwei Messwiederholungen (zwei verbundene Stichproben) vergleichen willst, dann wählst Du folgendermaßen den passenden Test aus: Gepaarter t-test (oder t-test für verbundene Stichproben) in beiden Messwiederholungen normalverteilt ist. Wilcoxon-Test für verbundene Stichproben Es gibt keine Anforderung an die Verteilung. 5.7 Vergleich von mehr als zwei Messwiederholungen einer metrischen (oder ordinalen) Variable mehr als zwei Messwiederholungen (mehrere verbundene Stichproben) vergleichen willst, dann wählst Du folgendermaßen den passenden Test aus: Varianzanalyse mit Messwiederholung in allen Messwiederholungen normalverteilt ist und Sphärizität vorliegt. Wenn keine Sphärizität vorliegt, verwendest Du eine Anpassung der Messwiederholungs-ANOVA, z.b. die Greenhouse- Geisser- oder Huynh- Feldt-Korrektur. Friedman-Test Es gibt keine Anforderung an die Verteilung.
5.8 Vergleich der Überlebenszeit zwischen Gruppen Seite 6 von 7 Wenn Du für Deine Hypothese die Überlebenszeit zwischen Gruppen vergleichst, rechnest Du als Signifikanztest dazu den Lograng-Test. Er hat keine Voraussetzung an die Verteilung der Daten. Zusammenfassung Fishers Exakter Test: bei zwei dichotomen Variablen Chi- Quadrat-Test: bei zwei kategorialen Variablen Pearson-Korrelation: bei zwei metrischen normalverteilten Variablen Spearman-Korrelation: bei zwei metrischen nicht-normalverteilten oder ordinalen Variablen t-test für eine Stichprobe: beim Vergleich einer metrischen normalverteilten Variable zu einem festen Wert Wilcoxon-Test für eine Stichprobe: beim Vergleich einer metrischen nicht-normalverteilten oder ordinalen Variable zu einem festen Wert t-test für unabhängige Stichproben: beim Vergleich einer metrischen normalverteilten Variable zwischen zwei Gruppen Mann-Whitney-U-Test für unabhängige Stichproben : beim Vergleich einer metrischen nicht-normalverteilten oder ordinalen Variable zwischen zwei Gruppen Varianzanalyse: beim Vergleich einer metrischen normalverteilten Variable zwischen mehr als zwei Gruppen Kruskal-Wallis-Test: beim Vergleich einer metrischen nichtnormalverteilten oder ordinalen Variable zwischen mehr als zwei Gruppen gepaarter t-test: beim Vergleich zweier metrischer normalverteilter Messwiederholungen Wilcoxon-Test für verbundene Stichproben: beim Vergleich zweier metrischer nicht-normalverteilter oder ordinaler Messwiederholungen Messwiederholungs-ANOVA: beim Vergleich von mehr als zwei metrischen normalverteilten Messwiederholungen Friedman-Test: beim Vergleich von mehr als zwei metrischen nichtnormalverteilten oder ordinalen Messwiederholungen Lograng-Test: beim Vergleich von Überlebenszeiten
Seite 7 von 7 Umsetzungsaufgabe für Dich: Wähle anhand des Arbeitsblatts Fragestellung und Hypothesen für jede Hypothese den hier vorgestellten passenden einfachen Signifikanztest aus und vermerke die zu prüfenden Voraussetzungen, falls es welche gibt. Wenn Du statt dieser einfachen Signifikanztest ein komplexes Modell benötigst (wenn mehr als 1 Faktor im Spiel ist), dann lässt Du diesen Abschnitt aus und füllst nach der nächsten Lektion den Abschnitt Komplexeres Modell aus.