Kapitel 30 Nichtparametrische Tests

Ähnliche Dokumente

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest

Kapitel 35 Histogramme

Kapitel 38 Verteilungsdiagramme

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Kapitel 22 Partielle Korrelationen

Einfache statistische Auswertungen mit dem Programm SPSS

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Kapitel 39 Sequenzdiagramme

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation

LÖSUNG 2C a. Bei HHEINK handelt es sich um eine metrische Variable.

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Kapitel 8: Verfahren für Rangdaten

Kapitel 41 Interaktive Diagramme

Hypothesentests mit SPSS

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Angewandte Statistik 3. Semester

Parametrische vs. Non-Parametrische Testverfahren

Univariate Kennwerte mit SPSS

Statistische Tests (Signifikanztests)

Kapitel 11 Verschmelzen und Aggregieren von Datendateien

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

So berechnen Sie einen Schätzer für einen Punkt

Hypothesentests mit SPSS. Beispiel für einen t-test

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

Statistisches Testen

Aufgaben zu Kapitel 8

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Statistik II Übung 3: Hypothesentests

Statistik K urs SS 2004

Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Statistische Tests

Statistik II. IV. Hypothesentests. Martin Huber

12 Rangtests zum Vergleich zentraler Tendenzen

Statistik. Jan Müller

Sommersemester Marktforschung

Aufgaben zu Kapitel 8

3. Lektion: Deskriptive Statistik

Tabelle 4 : Berechnete Konzeptionen pro Monat aus den Ausgangsdaten Lebendgeburten pro Monat am Beispiel der gesamten Kontrollen.

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

5. Lektion: Einfache Signifikanztests

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Nicht-parametrische Statistik Eine kleine Einführung

PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)

Ergebnisse VitA und VitVM

Klassifikation von Signifikanztests

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

3.Wiederholung: Toleranzbereiche Für EX Geg:

6.4 Der Kruskal-Wallis Test

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Online Statistik-Coaching

Statistische Messdatenauswertung

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

VU mathematische methoden in der ökologie: räumliche verteilungsmuster 1/5 h.lettner /

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Aufgaben zu Kapitel 9

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Chi-Quadrat Verfahren

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test

3) Testvariable: T = X µ 0

Statistische Methoden in den Umweltwissenschaften

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Die ungeliebten Verwandten: nicht-parametrische Alternativen

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

SBP Mathe Aufbaukurs 1 # 0 by Clifford Wolf. SBP Mathe Aufbaukurs 1

Analyse von Kontingenztafeln

Kapitel 5: Einfaktorielle Varianzanalyse

Bereiche der Statistik

Statistische Datenanalyse mit SPSS für Windows

Hypothesentests mit SPSS

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Kurzanleitung für SPSS Statistics 22

Statistik II: Signifikanztests /1

Nicht-parametrische Verfahren 2 unabhängige Stichproben: Mediantest 1/7

1 Univariate Statistiken

Skript 6 Häufigkeiten und Deskriptive Statistiken einer Variablen

Statistik II Übung 3: Hypothesentests Aktualisiert am

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Statistik Prüfung 24. Jänner 2008

Statistische Methoden in den Umweltwissenschaften

Bitte am PC mit Windows anmelden!

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

1.5 Berechnung von Rangzahlen

Statistik II: Grundlagen und Definitionen der Statistik

Einführung in Quantitative Methoden

Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Transkript:

Kapitel 30 Nichtparametrische Tests 30.1 Überblick Nichtparametrische Tests dienen dazu, aufgrund der Daten einer Stichprobe Rückschlüsse auf die Eigenschaften der Werte in der Grundgesamtheit zu ziehen. Dies haben sie mit allen anderen Testverfahren auf stichprobentheoretischer Grundlage wie beispielsweise dem T-Test oder den Varianzanalysen (ANOVA) gemeinsam. Auch in dem konkret zu untersuchenden Sachverhalt unterscheiden sich die nichtparametrischen Tests häufig nicht von anderen Testverfahren. So kann zum Beispiel anstatt des T-Tests grundsätzlich auch stets der nichtparametrische Mann- Whitney-Test durchgeführt werden. (Umgekehrt gilt jedoch nicht, daß der Mann- Whitney-Test jederzeit durch den T-Test ersetzt werden kann.) Der wesentliche Unterschied zwischen nichtparametrischen Tests und den übrigen Testverfahren besteht darin, daß die nichtparametrischen Tests wesentlich geringere Anforderungen an die Verteilung der Werte in der Grundgesamtheit stellen. Während zum Beispiel der T-Test verlangt, daß die zu vergleichenden Stichproben jeweils einer annähernd normalverteilten Grundgesamtheit entstammen und gleiche Varianzen aufweisen, müssen diese Voraussetzungen für den Mann-Whitney-Test nicht erfüllt sein. Zudem stellen nichtparametrische Tests häufig weniger starke Anforderungen an das Skalenniveau der zu untersuchenden Variablen. Dies hängt damit zusammen, daß ein Großteil der nichtparametrischen Tests auf der Betrachtung von Rangzahlen basiert und daher oftmals ein Ordinalskalenniveau genügt, wenn bei alternativen Tests intervallskalierte Daten erforderlich sind. Aus dem bisher Gesagten ergibt sich unmittelbar das primäre Anwendungsgebiet nichtparametrischer Tests: Sie kommen insbesondere dann zur Anwendung, wenn die stärkeren Voraussetzungen alternativer Tests von den zugrundeliegenden Daten nicht erfüllt werden. Der Preis für das Ausweichen auf Tests mit schwächeren Anforderungen an die Daten besteht allerdings darin, daß sich mit nichtparametrischen Tests auch nur weniger scharfe und klare Hypothesen testen lassen. Die aus diesen Tests abgeleiteten Aussagen sind häufig weniger fundiert, da bei den Tests nur ein geringerer Teil der verfügbaren Informationen ausgenutzt wird. Wird bei-

740 Kapitel 30 Nichtparametrische Tests spielsweise eine intervallskalierte Variable mit einem nichtparametrischen Test untersucht, der auf der Betrachtung von Rangwerten basiert, werden die verfügbaren Informationen über die Größe von Wertdifferenzen nicht verwendet. Daher kann der Test auch keine so starken Ergebnisse liefern, wie es parametrische Tests vermögen. Dies ist der Grund dafür, daß im allgemeinen den parametrischen Verfahren der Vorzug gegeben wird, sofern von den zu untersuchenden Daten die entsprechenden Voraussetzungen erfüllt werden. Umgekehrt sind nichtparametrische Tests vor allem dann sinnvoll, wenn die Variablen ein zu niedriges Skalenniveau für parametrische Tests aufweisen oder die Verteilungsannahmen der parametrischen Verfahren nicht hinreichend erfüllt sind. Insgesamt stehen bei SPSS 16 nichtparametrische Testverfahren zur Verfügung, die in acht Unterbefehlen des Menüs STATISTIK NICHTPARAMETRISCHE TESTS zusammengefaßt sind. Es folgt eine Übersicht über die zur Verfügung stehenden Testverfahren unter Angabe der jeweils zugrundeliegenden Fragestellung, des erforderlichen Skalenniveaus, des Unterbefehls, mit dem der Test angefordert werden kann, und der Seitenzahl, bei der die jeweilige Prozedur ausführlicher beschrieben wird. ¾ Chi-Quadrat: Stimmen die beobachteten Häufigkeiten einer Variablen mit vorgegebenen erwarteten Häufigkeiten überein? Nominalskalenniveau. CHI- QUADRAT (S. 741). ¾ Binomial: Stimmen die beobachteten Häufigkeiten einer dichotomen Variablen mit vorgegebenen erwarteten Häufigkeiten überein? Dichotome Variable. BINOMIAL (S. 748). ¾ Sequenz: Sind die Werte einer dichotomen Variablen in einer Folge von Werten zufällig angeordnet? Dichotome Variable. SEQUENZEN (S. 751). ¾ Kolmogorov-Smirnov bei einer Stichprobe: Folgen die Werte in der Grundgesamtheit einer bestimmten Verteilung? Getestet werden kann auf Normalverteilung, Gleichverteilung, Poissonverteilung und Exponentialverteilung. Intervallskalenniveau. K-S BEI EINER STICHPROBE (S. 754). ¾ Mann-Whitney: Entstammen zwei unabhängige Stichproben derselben Grundgesamtheit? Der Test erfolgt auf der Basis von Rangunterschieden. Ordinalskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757). ¾ Kolmogorov-Smirnov-Z: Entstammen zwei unabhängige Stichproben derselben Grundgesamtheit? Der Test basiert auf einem Vergleich der Verteilungen. Intervallskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757). ¾ Moses: Ist die Spannweite der Werte in den Grundgesamtheiten zweier unabhängiger Stichproben gleich groß? Ordinalskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757).

30.2 Chi-Quadrat-Test 741 ¾ Wald-Wolfowitz: Entstammen zwei unabhängige Stichproben derselben Grundgesamtheit? Der Test basiert auf einer Sequenzanalyse für die Gruppenzugehörigkeiten in einer Rangfolge. Ordinalskalenniveau. ZWEI UNAB- HÄNGIGE STICHPROBEN (S. 757). ¾ Kruskal-Wallis: Entstammen mehrere unabhängige Stichproben derselben Grundgesamtheit? Hierbei werden die mittleren Rangwerte verglichen. Ordinalskalenniveau. K UNABHÄNGIGE STICHPROBEN (S. 764). ¾ Median: Weisen mehrere unabhängige Stichproben in der Grundgesamtheit den gleichen Median auf? Ordinalskalenniveau. K UNABHÄNGIGE STICHPRO- BEN (S. 764). ¾ Wilcoxon: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPROBEN (S. 770). ¾ Vorzeichen: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPRO- BEN (S. 770). ¾ McNemar: Erfolgen Änderungen zwischen zwei verbundenen Variablen in beiden Richtungen gleichermaßen? Dichotome Variablen. ZWEI VERBUNDENE STICHPROBEN (S. 770). ¾ Friedman: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit? Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774). ¾ Kendall: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit? Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774). ¾ Cochran: Haben mehrere verbundene dichotome Variablen die gleiche Verteilung. Dichotome Variablen. K VERBUNDENE STICHPROBEN (S. 774). 30.2 Chi-Quadrat-Test Mit diesem χ 2 -Test können Sie überprüfen, ob die Häufigkeiten der Werte einer Variablen in der Grundgesamtheit vorgegebenen erwarteten Häufigkeiten entsprechen. Dabei können auch Variablen untersucht werden, die lediglich Nominalskalenniveau aufweisen. Per Voreinstellung wird getestet, ob die unterschiedlichen Werte der Variablen in der Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung können Sie jedoch ändern und die erwartete Häufigkeit für jeden Wert manuell vorgeben. Der Test untersucht dann, ob aus den empirischen Häufigkeiten, die in der vorliegenden Stichprobe beobachtet wurden, geschlossen werden kann, daß die angegebenen erwarteten Häufigkeiten in der Grundgesamtheit tatsächlich gelten. 343 343 Zur Berechnung des χ 2 -Wertes und zur Teststatistik vgl. Abschnitt 16.2, Chi-Quadrat- Test, S. 402.

742 Kapitel 30 Nichtparametrische Tests 30.2.1 Interpretation eines Chi-Quadrat-Tests Die Datendatei allbus.sav von der Begleit-CD enthält Daten einer 1996 in Deutschland durchgeführten Bevölkerungsbefragung. 344 Im folgenden sollen ausschließlich die Personen aus den neuen Bundesländern betrachtet werden. Für jeden Befragten ist unter anderem in der Variablen v35 sein Geburtsmonat angegeben. Mit dem Chi-Quadrat-Test wird nun untersucht, ob die Anzahl der Geburten in den einzelnen Monaten in der Grundgesamtheit gleich ist. Hierzu sind die folgenden Einstellungen erforderlich: ¾ Fälle auswählen: Zunächst ist der Test auf die Befragten aus den neuen Bundesländern zu beschränken. Hierzu wird der Befehl DATEN FÄLLE AUSWÄHLEN... verwendet. In dem damit geöffneten Dialogfeld wird die Option Falls Bedingung zutrifft ausgewählt und anschließend auf die zu dieser Option gehörenden Schaltfläche Falls geklickt. In dem damit geöffneten Dialogfeld wird in das große Eingabefeld die Bedingung v3 = 2 geschrieben. Anschließend wird dieses Dialogfeld mit der Schaltfläche Weiter und das Hauptdialogfeld mit der Schaltfläche OK geschlossen. Achten Sie vor dem Schließen des Hauptdialogfeldes darauf, daß in der Gruppe Nicht ausgewählte Fälle die Option Filtern eingestellt ist. ¾ Fälle nicht gewichten: Anders als in vielen anderen Kapiteln werden im folgenden Beispiel nicht gewichtete Fälle betrachtet. Sollten die Fälle in der Datendatei gewichtet sein, muß die Gewichtung zuvor ausgeschaltet werden. Dies geschieht mit dem Befehl DATEN FÄLLE GEWICHTEN... Wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle nicht gewichten, und schließen Sie das Dialogfeld mit OK. ¾ Chi-Quadrat-Test aufrufen: Um den Chi-Quadrat-Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS CHI-QUADRAT... ¾ Einstellungen: Verschieben Sie die Variable v35 in das Feld Testvariable. Bei allen übrigen Optionen werden die Voreinstellungen beibehalten. Abbildung 30.2, S. 745 zeigt die hier verwendeten Dialogfeldeinstellungen. Durch die voreingestellten Optionen wurde unter anderem festgelegt, daß untersucht werden soll, ob angenommen werden kann, daß die 12 Monate als Geburtsmonate in der Grundgesamtheit mit der gleichen Häufigkeit vorkommen. Abwei- 344 Siehe hierzu im einzelnen Kapitel 1, Überblick.

30.2 Chi-Quadrat-Test 743 chend von dieser Voreinstellung hätte auch untersucht werden können, ob beispielsweise die Hypothese vertreten werden kann, daß die Sommermonate in der Grundgesamtheit mit einer 10% höheren Häufigkeit vertreten sind als die Wintermonate. Der mit den hier verwendeten Einstellungen erzeugte Output ist in Abbildung 30.1 wiedergegeben. Häufigkeiten 1 2 3 4 5 6 7 8 9 10 11 12 Gesamt Kategorie V35 Beobachtetes N Erwartete Anzahl Residuum Januar 27 28,9-1,9 Februar 22 28,9-6,9 März 30 28,9 1,1 April 32 28,9 3,1 Mai 32 28,9 3,1 Juni 29 28,9,1 Juli 31 28,9 2,1 August 35 28,9 6,1 September 38 28,9 9,1 Oktober 21 28,9-7,9 November 20 28,9-8,9 Dezember 30 28,9 1,1 347 Statistik für Test Chi-Quadrat a df Asymptotische Signifikanz V35 11,720 11,385 a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 28,9. Abbildung 30.1: Ergebnisse des Chi-Quadrat-Tests für die Variable v35 (Geburtsmonat der Befragten) Die betrachtete Stichprobe umfaßt 347 Personen aus den neuen Bundesländern, deren Geburtsmonat bekannt ist. Dieser Wert wird in der Tabelle Häufigkeiten und dort in der Zeile Gesamt angegeben. Wäre nun in der Stichprobe jeder Geburtsmonat mit der gleichen Häufigkeit vertreten, müßten in jedem Monat ein Zwölftel der 347 Personen geboren sein. Dies wären 28,9 Personen in jedem Monat. Auch dieser Wert wird in der Tabelle Häufigkeiten in der Spalte Erwartete Anzahl für jeden Monat mitgeteilt. Daß diese Häufigkeit von 28,9 Personen in jedem Monat als erwartete Häufigkeit bezeichnet wird, hat folgenden Hintergrund: Werden in jedem Monat tatsächlich gleich viele Personen geboren, wäre in einer Zufallsstichprobe von 347 Personen zu erwarten, daß (rein rechnerisch) 28,9 von den insgesamt 347 Personen im Januar geboren wurden. Die gilt ebenso für den Monat Februar, den März etc.

744 Kapitel 30 Nichtparametrische Tests Die tatsächlich beobachteten Häufigkeiten der einzelnen Monate, die in der Spalte Beobachtetes N ausgewiesen werden, weichen mehr oder weniger stark von den erwarteten Häufigkeiten ab. So wurden nicht 29 (als gerundeter Wert von 28,9) Personen im Januar geboren, sondern lediglich 27. Die Monate April und Mai sind dagegen mit jeweils 32 Personen etwas stärker vertreten, als es den erwarteten Häufigkeiten entsprochen hätte. Diese Abweichungen der beobachteten von den erwarteten Häufigkeiten lassen jedoch noch nicht den Schluß zu, die Hypothese, in der Grundgesamtheit seien alle Monate mit der gleichen Häufigkeit als Geburtsmonate vertreten, sei falsch. Vielmehr ist es durchaus möglich, daß die Hypothese vollkommen richtig ist und die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten lediglich auf zufällige Einflüsse bei der Stichprobenziehung zurückzuführen sind. Die Tatsache, daß entsprechende Abweichungen auch bei Gültigkeit der Nullhypothese auftreten, ergibt sich schon daraus, daß die erwarteten Häufigkeiten ein Wert mit Dezimalstellen sind, tatsächlich aber immer nur ganzzahlige Häufigkeiten beobachtet werden können. Der Chi-Quadrat-Test untersucht nun, ob die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten so groß sind, daß angenommen werden kann, sie seien nicht durch zufällige Einflüsse entstanden, sondern auf entsprechend unterschiedliche Häufigkeiten der Geburtsmonate in der Grundgesamtheit zurückzuführen. Das Ergebnis des Chi-Quadrat-Tests wird in der unteren Tabelle Statistik für Test mitgeteilt. Der zentrale Wert bei diesen Ergebnissen ist die Signifikanz, die in diesem Fall 0,385 beträgt. Dieser Wert ist die Irrtumswahrscheinlichkeit, die mit einem Zurückweisen der Nullhypothese verbunden ist. Er ist in diesem Fall also folgendermaßen zu interpretieren: Weist man die Nullhypothese zurück, derzufolge in der Grundgesamtheit jeder Monat mit der gleichen Häufigkeit als Geburtsmonat vertreten ist, begeht man mit einer Wahrscheinlichkeit von 38,5% einen Irrtum. Diese Irrtumswahrscheinlichkeit ist derart hoch, daß man die Nullhypothese nicht zurückweisen wird. 345 Die Tatsache, daß die Nullhypothese aufgrund der hohen Irrtumswahrscheinlichkeit nicht zurückgewiesen werden kann, läßt nicht umgekehrt den Schluß zu, die Nullhypothese sei richtig. Vielmehr ist das Ergebnis lediglich so zu interpretieren, daß sich aus den vorhanden Daten keine handfesten Anhaltspunkte dafür ergeben, daß die Nullhypothese falsch ist. Man kann also zunächst einmal weiter an der Nullhypothese festhalten, hat sie damit aber nicht verifiziert. 345 Üblicherweise wird die Nullhypothese bei einer Irrtumswahrscheinlichkeit von 5% oder weniger zurückgewiesen. Je nach zugrundeliegender Fragestellung kann man auch beliebige andere Grenzen als die 5%-Grenze verwenden, eine Irrtumswahrscheinlichkeit von 38% ist jedoch derart hoch, daß man die Nullhypothese unter keinen ersichtlichen Umständen zurückweisen kann.

30.2 Chi-Quadrat-Test 745 30.2.2 Einstellungen des Chi-Quadrat-Tests bei SPSS Um einen Chi-Quadrat-Test durchzuführen, öffnen Sie das Dialogfeld aus Abbildung 30.2 mit dem Befehl STATISTIK NICHTPARAMETRISCHE TESTS CHI-QUADRAT... Abbildung 30.2: Dialogfeld des Befehls STATISTIK, NICHTPARAMETRISCHE TESTS, CHI-QUADRAT Variablen Die Variablenliste führt lediglich alle numerischen Variablen der Datendatei auf. Textvariablen können Sie mit dem χ 2 -Test daher nicht untersuchen, obwohl es für eine sinnvolle Interpretation des Tests genügt, wenn die Variablen nominalskaliert sind. Daher müssen Sie Textvariablen ggf. zunächst in eine numerische Variable umcodieren. 346 Verschieben Sie die Variablen, für deren Werte Sie die Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten vergleichen möchten, in das Feld Testvariablen. Wenn Sie mehrere Variablen auswählen, wird für jede der Variablen ein eigener Test durchgeführt. Wenn Sie nicht davon ausgehen, daß die Werte in der Testvariablen alle mit der gleichen Häufigkeit vorkommen und daher die erwarteten Häufigkeiten in der Gruppe Erwartete Werte manuell festlegen (s.u.), müssen diese für alle Testvariablen identisch sein. Ist dies nicht der Fall, müssen Sie die Variablen nacheinander durch wiederholtes Aufrufen der Prozedur untersuchen. 346 Hierzu können Sie zum Beispiel den Befehl TRANSFORMIEREN, UMKODIEREN, IN ANDERE VARIABLEN verwenden.

746 Kapitel 30 Nichtparametrische Tests Erwarteter Bereich Per Voreinstellung werden die Häufigkeiten aller in der Testvariablen vorkommenden gültigen Werte miteinander verglichen. Abweichend von dieser Voreinstellung können Sie jedoch auch einen Wertebereich vorgeben, um nur die Werte innerhalb dieses Bereichs in den Test einzubeziehen. Dies bewirkt zugleich, daß die Werte in der Testvariablen zu ganzzahligen Werten zusammengefaßt werden: ¾ Aus den Daten: Diese Option ist voreingestellt. Damit werden die Häufigkeiten für alle gültigen Werte der Testvariablen miteinander verglichen. Dabei werden auch Dezimalstellen berücksichtigt. Zwischen den Werten 7,53 und 7,52 wird also unterschieden. ¾ Angegebenen Bereich verwenden: Sie können einen Bereich der zu berücksichtigenden Werte vorgeben. Dies bewirkt gegenüber der Voreinstellung zwei Veränderungen. Zum einen werden nur die Werte innerhalb des Bereichs - einschließlich der angegebenen Grenzen - berücksichtigt. Werte, die nicht in den Bereich fallen, werden von dem Test ausgeschlossen. Zum zweiten werden die Dezimalstellen der Werte aus der Testvariablen nicht mehr berücksichtigt. Vielmehr werden die Dezimalstellen abgeschnitten, so daß nur der ganzzahlige Teil eines Wertes Berücksichtigung findet. Die Werte 7,01 und 7,99 werden somit beide als 7 interpretiert. Zudem werden auch solche ganzzahligen Werte berücksichtigt, die zwar im vorgegebenen Wertebereich, nicht aber in der Testvariablen enthalten sind. Für diese Werte wird eine beobachtete Häufigkeit von null zugrunde gelegt. Auch die Grenzen des zu berücksichtigenden Wertebereichs müssen durch ganzzahlige Werte in den Feldern Minimum und Maximum angegeben werden. Wenn Sie beispielsweise ein Minimum von -1 und ein Maximum von 2 angeben, werden die Häufigkeiten der Werte -1, 0, 1 und 2 betrachtet. Erwartete Werte Per Voreinstellung wird angenommen, daß alle Werte der Testvariablen in der Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung können Sie mit den folgenden Optionen ändern: ¾ Alle Kategorien gleich: Diese Option ist voreingestellt. Damit wird angenommen, daß alle Werte der Testvariablen in der Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Die absoluten erwarteten Häufigkeiten der einzelnen Werte ergeben sich damit aus der Anzahl der berücksichtigten Fälle, dividiert durch die Anzahl der unterschiedlichen Werte in der Testvariablen. ¾ Werte: Wenn Sie nicht von gleichen erwarteten Häufigkeiten für alle Werte der Testvariablen ausgehen, können Sie die erwartete Häufigkeit für jeden Wert einzeln festlegen. Hierzu müssen Sie für jeden Wert der Testvariablen einen Wert vorgeben, es darf also kein Wert unberücksichtigt bleiben. Sollten Sie in der Gruppe Erwarteter Bereich einen Wertebereich festgelegt haben, müssen Sie für jeden ganzzahligen Wert aus dem Bereich eine erwartete Häu-

30.2 Chi-Quadrat-Test 747 figkeit angeben, auch wenn einzelne Werte in der Testvariablen gar nicht vorkommen. Um die erwarteten Häufigkeiten festzulegen, gehen Sie folgendermaßen vor: y Legen Sie als erstes die erwartete Häufigkeit für den kleinsten in der Testvariablen vorkommenden Wert fest. 347 Schreiben Sie den Wert in das Eingabefeld, und klicken Sie auf die Schaltfläche Hinzufügen. Daraufhin wird der Wert in das Listenfeld übertragen. y Legen Sie nun auf die gleiche Weise die erwarteten Häufigkeiten der übrigen Werte fest. Beachten Sie hierbei, daß die Häufigkeiten in aufsteigender Reihenfolge der Werte aus der Testvariablen zugeordnet werden. y Um einen bereits in das Listenfeld eingefügten Wert zu ändern, markieren Sie den betreffenden Eintrag, ändern Sie den Wert in dem Eingabefeld, und wählen Sie anschließend die Schaltfläche Ändern. Um einen Wert aus der Liste zu löschen, markieren Sie ihn, und wählen Sie die Schaltfläche Entfernen. Beachten Sie hierbei jedoch, daß die verbleibenden Werte in der Liste am Ende in ihrer Reihenfolge den Werten aus der Testvariablen entsprechen müssen. Optionen Mit der Schaltfläche Optionen öffnen Sie das Dialogfeld aus Abbildung 30.3. Dort können Sie ergänzenden Output mit deskriptiven Maßzahlen und den Quartilen der Testvariablen anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Abbildung 30.3: Dialogfeld der Schaltfläche Optionen Statistiken: Mit den beiden folgenden Optionen können Sie ergänzenden Output anfordern: ¾ Deskriptive Statistik: Hiermit werden die Anzahl der Fälle mit gültigen Werten, der Mittelwert, die Standardabweichung sowie der kleinste und der größte 347 Es genügt, wenn die Häufigkeiten die Relationen richtig widerspiegeln. Sie können also wahlweise die erwarteten relativen Häufigkeiten oder ein beliebiges Vielfaches der erwarteten relativen Häufigkeiten angeben.

748 Kapitel 30 Nichtparametrische Tests Wert angegeben. Beachten Sie, daß der Mittelwert und die Standardabweichung nur bei Variablen mit Intervallskalenniveau sinnvoll interpretiert werden können. ¾ Quartile: Es werden das 25%-, das 50%- und das 75%-Perzentil sowie die Anzahl der Fälle mit gültigen Werten mitgeteilt. Fehlende Werte: Wenn Sie mehr als eine Testvariable ausgewählt haben, können Sie mit den beiden folgenden Optionen den Ausschluß von Fällen mit fehlenden Werten steuern. Wenn Sie nur eine Testvariable betrachten, haben beide Optionen den gleichen Effekt. ¾ Fallausschluß Test für Test: Diese Option ist voreingestellt. Bei der Untersuchung der einzelnen Testvariablen werden nur jeweils die Fälle ausgeschlossen, die in der betreffenden Variablen einen fehlenden Wert aufweisen. Fälle mit fehlenden Werten in anderen Testvariablen werden dagegen in den Test einbezogen. ¾ Listenweiser Fallausschluß: Alle Fälle, die in mindestens einer der Testvariablen einen fehlenden Wert aufweisen, werden aus der gesamten Prozedur ausgeschlossen. 30.3 Binomial-Test Mit einem Binomial-Test können Sie für eine dichotome Variable - dies ist eine Variable mit nur zwei unterschiedlichen Wertausprägungen - untersuchen, ob die beobachteten Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten vereinbar sind. Hierbei ist es nicht erforderlich, daß die Testvariable tatsächlich nur zwei unterschiedliche Werte enthält. Vielmehr können die Werte der Variablen beim Binomial-Test dichotomisiert, also zu zwei Gruppen zusammengefaßt, werden. 30.3.1 Interpretation eines Binomial-Tests In der Datei allbus.sav ist unter anderem das Geschlecht der Befragten (Variable v141) angegeben. Hierbei handelt es sich naturgemäß um eine dichotome Variable. Im folgenden soll die Hypothese getestet werden, in der Grundgesamtheit der Allbus-Daten seien Männer und Frauen zu gleichen Anteilen vertreten. Hierzu wird mit Hilfe eines Binomial-Tests untersucht, ob die in der Stichprobe beobachteten Häufigkeiten dieser Hypothese widersprechen. Um diesen Test durchzuführen, sind die folgenden Einstellungen erforderlich: ¾ Daten: Die Daten entstammen der Datendatei allbus.sav. Auch hier werden wie bei dem im vorhergehenden Abschnitt durchgeführten Chi-Quadrat-Test

30.3 Binomial-Test 749 nur die Personen aus den neuen Bundesländern betrachtet, und es werden ungewichtete Daten verwendet. 348 ¾ Binomial-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS BINOMIAL... ¾ Einstellungen: Fügen Sie die Variable v141 in das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen verwendet (siehe Abbildung 30.5, S. 750). Damit wird die Hypothese getestet, in der Grundgesamtheit seien Männer und Frauen mit der gleiche Häufigkeit vertreten. Mit diesen Einstellungen erhalten Sie den Output aus Abbildung 30.4. In der Spalte N werden zunächst die beobachteten Häufigkeiten der beiden Kategorien mitgeteilt. Die Stichprobe umfaßt 160 Männer und 189 Frauen aus den neuen Bundesländern. Damit sind die beiden Gruppen in der Stichprobe offensichtlich nicht zu gleichen Anteilen vertreten. Die relativen Häufigkeiten aus der Stichprobe werden in der Spalte Beobachteter Anteil ausgewiesen. Da die Stichprobe insgesamt 349 Personen aus den neuen Ländern umfaßt, stellen die 189 Frauen einen Anteil von 54% dar. Entsprechend beträgt der Anteil der Männer 46%. Bei Gültigkeit der Nullhypothese wäre dagegen ein Anteil von jeweils 50% zu erwarten gewesen. Von diesem erwarteten Anteil können sich durch die Stichprobenbetrachtung zufällige Abweichungen ergeben. Ob sich die Abweichungen der beobachteten von den erwarteten Häufigkeiten plausibel durch Zufallseinflüsse erklären lassen und folglich mit der Nullhypothese, in der Grundgesamtheit seien beide Gruppen zu gleichen Anteilen vertreten, vereinbar sind, wird mit dem Binomial- Test untersucht. Die Wahrscheinlichkeit dafür, daß sich bei Gültigkeit der Nullhypothese mindestens so große Abweichungen ergeben wie in der vorliegenden Stichprobe, beträgt 0,134 bzw. 13,4%. Dieser Wert wird in der Spalte Asymptotische Signifikanz mitgeteilt. Der Wert läßt sich auch folgendermaßen interpretieren: Weist man die Nullhypothese, in der Grundgesamtheit seien Männer und Frauen zu gleichen Anteilen vertreten, zurück, begeht man mit einer Wahrscheinlichkeit von 13,4% einen Irrtum. V141 Gruppe 1 Gruppe 2 Gesamt Test auf Binomialverteilung Asymptotische Beobachteter Signifikanz Kategorie N Anteil Testanteil (2-seitig) MANN 160,46,50,134 a FRAU 189,54 349 1,00 a. Basiert auf der Z-Approximation. Abbildung 30.4: Ergebnis des Binomial-Tests für die Variable v434 348 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen und Fälle nicht gewichten, S. 742.

750 Kapitel 30 Nichtparametrische Tests 30.3.2 Einstellungen des Binomial-Tests bei SPSS Die Einstellungen zum Durchführen eines Binomial-Tests werden in dem Dialogfeld aus Abbildung 30.5 vorgenommen. Um dieses Dialogfeld zu öffnen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS BINOMIAL... Abbildung 30.5: Dialogfeld des Befehls STATISTIK, NICHTPARAMETRISCHE TESTS, BINOMIAL Variablen In der Variablenliste werden lediglich die numerischen Variablen der Datendatei aufgeführt. Um Textvariablen mit einem Binomial-Test zu untersuchen, müssen Sie diese daher zuvor in eine numerische Variable umcodieren. Fügen Sie die zu untersuchenden Variablen in das Feld Testvariablen ein. Wenn Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test durchgeführt. Per Voreinstellung wird die Hypothese untersucht, die beiden Werte der Testvariablen seien in der Grundgesamtheit mit der gleichen Häufigkeit vertreten. Sie können einen anderen Testanteil zugrunde legen (s.u., Abschnitt Testanteil), dieser gilt dann jedoch für alle Testvariablen gleichermaßen. Dichotomie definieren Sie können auch Testvariablen untersuchen, die mehr als zwei unterschiedliche Werte enthalten, diese müssen dann jedoch zu zwei Gruppen zusammengefaßt werden: ¾ Aus den Daten: Behalten Sie diese voreingestellte Option bei, wenn die Testvariable nur zwei unterschiedliche Werte enthält. Es werden dann die Häufigkeiten dieser beiden Werte untersucht.

30.4 Sequenzanalyse 751 ¾ Trennwert: Enthält die Testvariable mehr als zwei unterschiedliche Werte, wählen Sie diese Option, und geben Sie einen Trennwert an, der die Werte in zwei Gruppen unterteilt. Alle Werte, die kleiner oder gleich dem Trennwert sind, bilden die eine Gruppe, Werte über dem Trennwert werden zu der zweiten Gruppen zusammengefaßt. Der Trennwert kann insgesamt fünf Zeichen (einschließlich Dezimaltrennzeichen) umfassen. Die Gruppe mit den kleineren Werte wird als erste Gruppe angesehen. Auf diese beziehen sich die Angaben über die erwarteten und realisierten Häufigkeiten. Testanteil Per Voreinstellung wird für die beiden Werte bzw. für die Wertegruppen jeweils eine relative Häufigkeit von 0,5 erwartet. Um diese Voreinstellung zu ändern, geben Sie die erwartete Häufigkeit des ersten Wertes an. Dies ist der Wert, der in der Datendatei als erstes aufgeführt wird. Bei gruppierten Werten ist es dagegen die Gruppe mit den niedrigeren Werten. Sie können eine erwartete Häufigkeit zwischen 0,001 und 0,999 angeben. Der Wert darf insgesamt nur vier Zeichen umfassen, Sie können jedoch die führende null vor dem Dezimaltrennzeichen weglassen. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S. 747. 30.4 Sequenzanalyse Mit der Sequenzanalyse können Sie für eine dichotome Variable - eine Variable mit nur zwei unterschiedlichen Wertausprägungen - bzw. für eine dichotomisierte Variable testen, ob die Werte in zufälliger Reihenfolge auftreten oder ob sie ein Muster aufweisen. 30.4.1 Interpretation einer Sequenzanalyse Die Erfahrung legt die Vermutung nahe, daß Sonnen- und Regentagen nicht zufällig aufeinanderfolgen. Hat es einen Tag lang geregnet, ist es nicht unplausibel, auch für den kommenden Tag eher Regen als Sonnenschein zu erwarten, sofern nicht bessere Informationen über das Wetter vorliegen. In einem fiktiven Beispiel sei das Wetter an 40 Tagen beobachtet und mit den Werten 0 (Sonnenschein) und 1 (Regen) codiert worden, wobei sich die folgende Sequenz von Sonnen- und Regentagen ergeben habe: 1 0 1 1 0 1 0 1 1 0 0 1 0 0 0 1 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1

752 Kapitel 30 Nichtparametrische Tests Die Datendatei Wetter.sav von der Begleit-CD enthält lediglich eine einzige Variable, die ebenfalls den Namen wetter hat und die dargestellte Wertefolge enthält. Im folgenden soll mit einem Sequenztest untersucht werden, ob vor dem Hintergrund der (fiktiven) Beobachtungen an der Hypothese zufällig aufeinanderfolgender Sonnen- und Regentage festgehalten werden kann. Zum Durchführen des Tests werden die folgenden Einstellungen vorgenommen: ¾ Befehl: Um eine Sequenzanalyse durchzuführen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS SEQUENZEN... ¾ Einstellungen: Verschieben Sie in dem Dialogfeld Sequenzentest die Variable Wetter in das Feld Testvariablen. In der Gruppe Trennwert wird die Option Anderer gewählt und der Wert 1 in das zugehörige Eingabefeld eingegeben. Die übrigen Optionen der Gruppe Trennwert werden abgewählt. Abbildung 30.7, S. 753 zeigt das Dialogfeld mit diesen Einstellungen. Als Ergebnis wird die Tabelle aus Abbildung 30.6 ausgegeben. In der Zeile Testwert wird noch einmal der Wert mitgeteilt, den wir im Dialogfeld als Testwert vorgegeben haben. Die untersuchte Gesamtsequenz umfaßt 40 Werte (Gesamtzahl der Fälle), die sich in 27 Sequenzen unterteilen. Eine Sequenz in diesem Sinne ist eine Folge gleicher Werte. Die ersten fünf Werte der Gesamtsequenz lauten 1 0 1 1 0 (s.o.). Diese fünf Werte bilden die vier Sequenzen 1-0 - 1 1-0. Entsprechend läßt sich die Gesamtsequenz in 27 derartige Sequenzen unterteilen. Sequenzentest Testwert a Gesamte Fälle Anzahl der Sequenzen Z Asymptotische Signifikanz (2-seitig) a. Benutzerdefiniert WETTER 1 40 27 1,783,075 Abbildung 30.6: Ergebnis der Sequenzanalyse Auf der Basis dieser Werte wird die Nullhypothese getestet, die Sonnen- und Regentage und damit die Werte 0 und 1 würden in der Grundgesamtheit rein zufällig aufeinanderfolgen. In der Zeile Asymptotische Signifikanz wird das Ergebnis dieses Tests mitgeteilt. Ist die Nullhypothese wahr, ergibt sich eine Folge von Sonnen- und Regentagen, wie sie in der Stichprobe vorliegt, nur mit einer Wahrscheinlichkeit von 0,075 bzw. 7,5%. Umgekehrt bedeutet dies: Weist man die Nullhypothese zurück, begeht man mit einer Wahrscheinlichkeit von 7,5% einen Fehler. Diese Wahrscheinlichkeit ist zwar sehr gering, aber vermutlich noch nicht gering genug, um die Nullhypothese tatsächlich abzulehnen.

30.4 Sequenzanalyse 753 Ergibt sich bei einem Test eine noch geringere Irrtumswahrscheinlichkeit, so daß die Nullhypothese zurückgewiesen wird, besagt dies noch nichts über das wahre Muster der untersuchten Daten, das in diesem Fall in dem tatsächlichen Zusammenhang zwischen Sonnen- und Regentagen bestehen würde. Eine geringe Irrtumswahrscheinlichkeit ergibt sich sowohl dann, wenn aufeinanderfolgende Beobachtungen häufig den gleichen Wert aufweisen, als auch in dem Fall, daß sich die Werte häufig abwechseln und damit benachbarte Beobachtungen unterschiedliche Werte enthalten. 30.4.2 Einstellungen der Sequenzanalyse bei SPSS Zum Durchführen einer Sequenzanalyse dient das Dialogfeld aus Abbildung 30.7. Um das Dialogfeld zu öffnen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS SEQUENZEN... Abbildung 30.7: Dialogfeld des Befehls STATISTIK, NICHTPARAMETRISCHE TESTS, SEQUENZEN Variablen In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt. Textvariablen können Sie mit einer Sequenzanalyse daher nicht untersuchen, ohne sie zuvor in eine numerische Variable umzucodieren. Verschieben Sie die Variablen, für die eine Sequenzanalyse durchgeführt werden soll, in das Feld Testvariablen. Wenn Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test durchgeführt, die Ergebnisse werden jedoch gemeinsam in einer Pivot-Tabelle dargestellt.

754 Kapitel 30 Nichtparametrische Tests Trennwert Sie können mit der Sequenzanalyse auch Variablen untersuchen, die mehr als zwei unterschiedliche Werte enthalten. In diesem Fall müssen die Werte jedoch dichotomisiert, also in zwei Gruppen zusammengefaßt werden. Anstatt der Folge einzelner Werte wird dann die Folge der Gruppenzugehörigkeiten untersucht. Um die Werte zu dichotomisieren, müssen Sie einen Trennwert angeben. Alle Werte der Variablen, die größer oder gleich dem Trennwert sind, werden dann zu einer Gruppe zusammengefaßt, alle Werte, die kleiner sind als der Trennwert, bilden die zweite Gruppe. Die Angabe eines Trennwertes ist auch dann erforderlich, wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält. Die folgenden vier Optionen stehen zur Verfügung, um den Trennwert zu definieren. Die Optionen schließen sich nicht gegenseitig aus. Wenn Sie mehr als eine Option ankreuzen, wird für jeden Trennwert ein eigener Sequenztest durchgeführt. ¾ Median: Das 50%-Perzentil der Variablen bildet den Trennwert. ¾ Modalwert: Der Modus, also der am häufigsten in der Variable vorkommende Wert, wird als Trennwert verwendet. ¾ Mittelwert: Das arithmetische Mittel der Variablen bildet den Trennwert. ¾ Anderer: Mit dieser Option können Sie den Trennwert frei festlegen, indem Sie ihn in das zugehörige Eingabefeld schreiben. Der Wert kann bis zu fünf Zeichen umfassen, zu denen auch ein eventuelles Dezimaltrennzeichen zählt. Diese Option können Sie auch verwenden, wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält. Legen Sie dann den größeren der beiden Werte als Trennwert fest. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S. 747. 30.5 Ein-Stichproben-Kolmogorov-Smirnov-Test Mit dem Kolmogorov-Smirnov-Test können Sie überprüfen, ob die Werte einer Variablen einer theoretischen Verteilung folgen. Dabei können Sie den Test für eine Normal-, Poisson-, Gleich- oder Exponentialverteilung durchführen.

30.5 Ein-Stichproben-Kolmogorov-Smirnov-Test 755 30.5.1 Interpretation des Ein-Stichproben-Kolmogorov- Smirnov-Tests In der Datendatei allbus.sav mit den Ergebnissen der Bevölkerungsbefragung ist unter anderem in der Variablen v338 die Dauer des Interviews in Minuten angegeben. Im folgenden soll mit dem Kolmogorov-Smirnov-Test untersucht werden, ob die Annahme, die Dauer des Interviews folge einer Normalverteilung, vor dem Hintergrund der Beobachtungen aus der Stichprobe aufrechterhalten werden kann. ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt auch Notwendigkeit zur Gewichtung der Daten. 349 ¾ Kolmogorov-Smirnov-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS K-S BEI EINER STICHPROBE... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variable v338 in das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen verwendet. Abbildung 30.9, S. 756 zeigt die für dieses Beispiel verwendeten Einstellungen. Die Ergebnisse des Tests werden in Abbildung 30.8 dargestellt. Der Test wird anhand der größten (absoluten) Abweichung der empirischen von der theoretischen Verteilung durchgeführt. Die größte absolute, die größte positive und die größte negative Abweichung der beiden Verteilungen voneinander werden als Extremste Differenzen in der Tabelle ausgewiesen. Zudem werden die Parameter der Normalverteilung angegeben, mit der die empirische Verteilung verglichen wird. Die Parameter einer Normalverteilung sind der Mittelwert und die Standardabweichung. Die ausgewiesenen Werte von 59,26 bzw. 19,41 entsprechen den Werten der Variablen v338 in der betrachteten Stichprobe. Die durchgeführten Interviews dauerten in den neuen Bundesländern somit im Durchschnitt 59,26 Minuten. Das eigentliche Ergebnis des Tests wird in der untersten Zeile mit der Beschriftung Asymptotische Signifikanz angegeben. Dies ist die Irrtumswahrscheinlichkeit, die mit einem Zurückweisen der Nullhypothese verbunden ist. Die getestete Nullhypothese besagt, daß die Dauer des Interviews in der Grundgesamtheit einer Normalverteilung folgt. Die Wahrscheinlichkeit für das Zutreffen der Hypothese wird mit 0,000 angegeben. Die Nullhypothese kann damit zurückgewiesen werden. Trotz dieser geringen Irrtumswahrscheinlichkeit ist es möglich, daß die Werte in der Grundgesamtheit annähernd normalverteilt sind. Dies genügt bereits als Voraussetzung für viele statistische Prozeduren. Um einen Eindruck von der Ähnlich- 349 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen und Fälle nicht gewichten, S. 742.

756 Kapitel 30 Nichtparametrische Tests keit der empirischen Verteilung mit der Normalverteilung zu gewinnen, kann zum Beispiel ein Histogramm mit Normalverteilungskurve erstellt werden. Kolmogorov-Smirnov-Anpassungstest N Parameter der Normalverteilung a,b Extremste Differenzen Kolmogorov-Smirnov-Z Asymptotische Signifikanz (2-seitig) Mittelwert Standardabweichung Absolut Positiv Negativ V338 348 59,26 19,41,126,126 -,074 2,344,000 a. Die zu testende Verteilung ist eine Normalverteilung. b. Aus den Daten berechnet. Abbildung 30.8: Ergebnis des Kolmogorov-Smirnov-Tests für die Variable v338 zum Testen auf eine Normalverteilung 30.5.2 Einstellungen des Kolmogorov-Smirnov-Tests bei SPSS Um einen Kolmogorov-Smirnov-Test bei einer Stichprobe durchzuführen, wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.9 öffnet: STATISTIK NICHTPARAMETRISCHE TESTS K-S BEI EINER STICHPROBE... Abbildung 30.9: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, K-S BEI EINER STICHPROBE

30.6 Tests für zwei unabhängige Stichproben 757 Variablen In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt, denn der Kolmogorov-Smirnov-Test ist nur für Variablen mit Intervallskalenniveau sinnvoll durchzuführen. Verschieben Sie die zu testenden Variablen in das Feld Testvariablen. Wenn Sie hier mehr als eine Variablen angeben, wird für jede Variable ein eigenständiger Test durchgeführt. Testverteilung Per Voreinstellung wird ein Test auf Normalverteilung durchgeführt, es stehen jedoch die folgenden vier Verteilungen zur Verfügung: ¾ Normalverteilung: Testet auf eine Normalverteilung mit dem Mittelwert und der Standardabweichung der Stichprobe. ¾ Gleichverteilung: Testet auf eine Gleichverteilung über den gesamten Wertebereich der Testvariablen. ¾ Poissonverteilung: Testet auf eine Poissonverteilung mit dem Mittelwert der Stichprobe. ¾ Exponentialverteilung: Testet auf eine Exponentialverteilung mit dem Mittelwert der Stichprobe. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S. 747. 30.6 Tests für zwei unabhängige Stichproben Insgesamt stehen vier Tests zum Vergleichen zweier unabhängiger Stichproben zur Verfügung. 350 Mit dem Mann-Whitney-Test, dem Kolmogorov-Smirnov-Test und dem Wald-Wolfowitz-Test überprüfen Sie jeweils die Hypothese, die beiden Stichproben würden derselben Grundgesamtheit entstammen. Der Moses-Test vergleicht dagegen die Spannweite der beiden Stichproben. Er testet die Hypothese, die Spannweite sei in beiden Stichproben gleich groß. Der Kolmogorov- Smirnov-Test setzt intervallskalierte Variablen voraus, für die drei übrigen Tests ist Ordinalskalenniveau ausreichend. 350 Zum Begriff von unabhängigen und abhängigen Stichproben siehe Kapitel 19, T-Test.

758 Kapitel 30 Nichtparametrische Tests 30.6.1 Interpretation der Testergebnisse In den Befragungsdaten der allbus-datei von der Begleit-CD sind unter anderem das Nettoeinkommen (Variable v261) und das Geschlecht der Befragten (v141) angegeben. Im folgenden soll untersucht werden, ob sich die Einkommensangaben von Männern und Frauen so ähnlich sind, daß auf eine einheitliche Grundgesamtheit geschlossen werden kann, oder ob von zwei unterschiedlichen Grundgesamtheiten auszugehen ist. Mann-Whitney-Test Der Mann-Whitney-Test für die beschriebene Fragestellung wird folgendermaßen angefordert: ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt auch die Notwendigkeit zur Gewichtung der Daten. 351 ¾ Test für zwei unabhängige Stichproben aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS ZWEI UNABHÄNGIGE STICHPROBEN... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v261 in das Feld Testvariablen und v141 in das Feld Gruppenvariable ein. Klicken Sie anschließend auf die Schaltfläche Gruppen definieren, 352 und geben Sie in dem damit geöffneten Dialogfeld die Werte 1 und 2 in die beiden Eingabefelder ein. Bei allen anderen Optionen werden die Voreinstellungen verwendet. Dies bedeutet insbesondere, daß in der Gruppe Welche Tests durchführen? die Option Mann-Whitney-U-Test angekreuzt bleibt. Diese Einstellungen, die in dem Dialogfeld in Abbildung 30.12 auf S. 762 dargestellt sind, liefern den Output aus Abbildung 30.10. Bei einem Mann-Whitney-Test werden die Werte der beiden Gruppen zunächst zu einer Gruppe zusammengefaßt und in aufsteigender Folge geordnet. Jedem der Werte wird seiner Position in der Ordnung entsprechend ein Rang zugewiesen. Anschließend wird für die beiden Gruppen getrennt die Summe der Rangwerte berechnet. Anhand der beiden sich dabei ergebenden Summen wird die Hypothese getestet, die beiden Stichproben würden der gleichen Grundgesamtheit entstammen. Trifft die Hypothese zu, sollten die Werte der beiden Gruppen in der zu Be- 351 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, wie Sie diese Einstellungen in der Datendatei herbeiführen können. 352 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde und diese aktuell markiert ist.

30.6 Tests für zwei unabhängige Stichproben 759 ginn gebildeten Reihenfolge in etwa gleichmäßig verteilt sein, die durchschnittlichen Ränge beider Gruppen sollten also ungefähr die gleiche Größe haben. Ränge Statistik für Test a V261 V141 MANN FRAU Gesamt Mittlerer N Rang Rangsumme 95 121,37 11530,00 109 86,06 9380,00 204 Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) a. Gruppenvariable: V141 V261 3385,000 9380,000-4,266,000 Abbildung 30.10: Ergebnis des Mann-Whitney-Tests für zwei unabhängige Stichproben Der durchschnittliche Rang (Mittlerer Rang) für das Einkommen der Frauen liegt mit 86,06 deutlich unter dem mittleren Rang von 121,37, der sich für das Einkommen der Männer ergeben hat. Dies deutet bereits darauf hin, daß die Nullhypothese falsch ist und die beiden Stichproben nicht der gleichen Grundgesamtheit entstammen. Selbst wenn sich sehr ähnliche mittlere Rangwerte ergeben hätten, könnte daraus jedoch noch nicht geschlossen werden, daß die Stichproben aus der gleichen Grundgesamtheit stammen. Es wäre beispielsweise denkbar, daß Männer entweder sehr hohe oder sehr niedrige Einkommen erzielen, während Frauen überwiegend im mittleren Bereich der Einkommensverteilung anzutreffen sind. In diesem Fall würden die durchschnittlichen Rangwerte bei Männern und Frauen ungefähr gleich groß sein, obwohl die tatsächliche Verteilung der Werte sehr unterschiedlich wäre und die beiden Gruppen nicht der gleichen Grundgesamtheit zugeordnet werden könnten. Aus diesem Grund wird neben den durchschnittlichen Rangwerten zusätzlich untersucht, wie häufig ein Wert der ersten Gruppe einem der zweiten Gruppe vorausgeht bzw. wie häufig ein Wert der zweiten Gruppe vor einem der ersten Gruppe angeordnet ist. Die geringere der beiden Häufigkeiten wird in der rechten Tabelle in der Zeile mit der Beschriftung Mann-Whitney-U angegeben. Bei der Berechnung wird für jeden Wert der zweiten Gruppe die Anzahl der Werte aus der ersten Gruppe gezählt, die einen niedrigeren Rang haben. Die so gezählten Werte werden addiert, so daß jeder Wert der ersten Gruppe mehrmals in die Zählung eingehen kann. Beispiel: Bei den vier Werten, die in geordneter Form den beiden Gruppen in der Reihenfolge 1 2 1 2 zuzuordnen sind, gehen drei Werte aus der Gruppe 1 der Gruppe 2 voraus, da der ersten 2 ein Wert der ersten Gruppe und der zweiten 2 zwei Werte der ersten Gruppe vorausgehen. Umgekehrt geht nur ein Wert der zweiten Gruppe den Werten der ersten Gruppe voraus. In der Zeile mit der Beschriftung Wilcoxon-W wird zusätzlich die Summe der Ränge angegeben, die sich für die Gruppe mit der geringeren Fallzahl ergibt, bei diesem Test also für die Gruppe der Frauen. Anhand dieser Werte wird eine Signifikanz für die Nullhypothese berechnet. Für dieses Beispiel wird der Signifikanzwert mit 0,000 angegeben und ist damit kleiner als 0,0005. Bei einer derart niedrigen Irrtumswahrscheinlichkeit kann die

760 Kapitel 30 Nichtparametrische Tests Nullhypothese, die Einkommensangaben von Männern und Frauen würden der gleichen Grundgesamtheit entstammen, zurückgewiesen werden. Moses-Test Um die Spannweite der Einkommensangaben von Männern und Frauen aus den neuen Bundesländern zu vergleichen, kann mit einem Moses-Test die Nullhypothese getestet werden, nach der die Spannweiten beider Stichproben in der Grundgesamtheit gleich sind. Um einen solchen Test durchzuführen, können Sie die oben (S. 758) beschriebenen Einstellungen verwenden. Sie müssen lediglich im Hauptdialogfeld der Prozedur die Option Extremreaktionen nach Moses aus der Gruppe Welche Tests durchführen? ankreuzen. Die Ergebnisse dieses Tests sind in Abbildung 30.11 wiedergegeben. Häufigkeiten V261 V141 MANN (Kontrolle) FRAU (Experimentell) Gesamt N 95 109 204 Statistik für Test a,b Beobachtete Spannweite der Kontrollgruppe Spannweite der getrimmten Kontrollgruppe Ausreißer an beiden Enden entfernt a. Moses-Test b. Gruppenvariable: V141 Signifikanz (1-seitig) Signifikanz (1-seitig) V261 203,784 179,136 4 Abbildung 30.11: Ergebnisse eines Moses-Tests für zwei unabhängige Stichproben In der oberen Tabelle wird lediglich die Anzahl der Fälle für die beiden Gruppen mitgeteilt. Der Moses-Test verwendet eine der beiden Gruppen als Kontrollgruppe. Wie aus der oberen Tabelle hervorgeht, ist dies in diesem Fall die Gruppe der Männer. Die Werte beider Gruppen werden gemeinsam geordnet und der Ordnung entsprechend mit Rangwerten versehen. Für die Kontrollgruppe wird die Spannweite der Rangwerte als Differenz zwischen dem größten und dem kleinsten Rang berechnet. Diese Spannweite wird in der unteren Tabelle in der Zeile Beobachtete Spannweite der Kontrollgruppe mit 203 angegeben. Bei einer Gesamtstichprobe von 204 Fällen bedeutet dies, daß entweder der größte und der zweitkleinste oder umgekehrt der zweitgrößte sowie der kleinste Rang einem Wert der Kontrollgruppe zugeordnet wurde. 353 353 Die Spannweite wird beim Moses-Test von SPSS berechnet als Höchster Rang Niedrigster Rang + 1 und nicht, wie erwartet werden könnte, als Höchster Rang Niedrigster Rang. Die größte erreichbare Spannweite entspricht damit der Anzahl der Beobachtungen.

30.6 Tests für zwei unabhängige Stichproben 761 Die Wahrscheinlichkeit dafür, daß sich eine solche Spannweite für die Kontrollgruppe ergibt, wenn die beiden Stichproben (Männer und Frauen) in der Grundgesamtheit die gleiche Spannweite aufweisen, beträgt 78,4%. Dieser Wert wird in der Zeile Signifikanz (1-seitig) für die Beobachtete Spannweite der Kontrollgruppe angegeben. Bei einer derart hohen Irrtumswahrscheinlichkeit kann die Nullhypothese nicht zurückgewiesen werden. Aus der Stichprobe ergibt sich somit kein Hinweis darauf, daß die Einkommenswerte von Männern und Frauen in der Grundgesamtheit eine unterschiedliche Spannweite aufweisen. Bei der Betrachtung von Spannweiten können die Ergebnisse leicht durch einzelne Ausreißer verzerrt werden. Aus diesem Grund wird ein zweiter Signifikanzwert mitgeteilt, der sich auf eine getrimmte Kontrollgruppe bezieht, also auf eine Kontrollgruppe, aus der einige Ausreißer entfernt wurden. In der untersten Zeile der Tabelle wird angegeben, daß an jedem Ende der gesamten Rangordnung (die sowohl Männer als auch Frauen umfaßt) vier Werte entfernt wurden. Damit verringert sich die Fallzahl der Gesamtstichprobe um 8 auf 196. Die Spannweite der Kontrollgruppe hat sich dabei jedoch wesentlich stärker verringert, und zwar um 24 auf 179. Dieser Wert wird als Spannweite der getrimmten Kontrollgruppe ausgewiesen. Die Wahrscheinlichkeit für das Eintreten einer Spannweite dieser Größe beträgt bei Gültigkeit der Nullhypothese nur noch 13,6%. Unter Ausschluß der extremen Werte kann die Nullhypothese damit bei weitem nicht so deutlich bestätigt werden wie bei Einbeziehung der Ausreißer, allerdings läßt sich die Nullhypothese auch bei einer Irrtumswahrscheinlichkeit von 13,6% nicht zurückweisen. 30.6.2 Einstellungen der Tests für zwei unabhängige Stichproben bei SPSS Um nichtparametrische Tests für zwei unabhängige Stichproben durchzuführen, öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung 30.12: STATISTIK NICHTPARAMETRISCHE TESTS ZWEI UNABHÄNGIGE STICHPROBEN... In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt. Textvariablen können weder als Test- noch als Gruppenvariable verwendet werden, obwohl die Gruppenvariable lediglich Nominalskalenniveau besitzen muß. Um einen oder mehrere der Tests durchzuführen, gehen Sie folgendermaßen vor: ¾ Testvariablen: Geben Sie die Testvariablen in dem gleichnamigen Feld an. Für jede der angegebenen Variablen werden alle angeforderten Tests berechnet. Die Testvariablen müssen mindestens Ordinalskalenniveau besitzen, für die Durchführung eines Kolmogorov-Smirnov-Tests ist sogar Intervallskalenniveau erforderlich. ¾ Gruppierungsvariablen: Verschieben Sie eine Gruppierungsvariable in das Feld Gruppenvariable. Zusätzlich müssen für diese Variable zwei Werte ange-

762 Kapitel 30 Nichtparametrische Tests geben werden, die die beiden zu vergleichenden Gruppen (Stichproben) definieren (s.u.). ¾ Tests: Kreuzen Sie die durchzuführenden Tests an. ¾ Optionen: Sie können ergänzende Maßzahlen für die Testvariablen anfordern und den Ausschluß von fehlenden Werten regeln. Abbildung 30.12: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, ZWEI UNABHÄNGIGE STICHPROBEN Gruppierungsvariable Geben Sie eine Gruppierungsvariable an, anhand derer aus den Fällen der Stichprobe zwei Gruppen gebildet werden sollen. Zur Gruppenbildung müssen zwei Werte der Variablen angegeben werden. Fälle, die keinen der angegebenen Werte in der Gruppierungsvariable enthalten, werden von den Tests ausgeschlossen. Von den übrigen Fällen bilden jeweils die Fälle mit den gleichen Werten in der Gruppierungsvariable eine Gruppe. Um die Gruppen zu definieren, verschieben Sie die gruppierende Variable in das Feld Gruppenvariable, und klicken Sie anschließend auf die Schaltfläche Gruppen definieren. Diese Schaltfläche ist nur aktiv, wenn die Variable in dem Feld Gruppenvariable ausgewählt ist. Hierzu müssen Sie die Variable ggf. einmal mit der Maus anklicken. Die Schaltfläche öffnet das Dialogfeld aus Abbildung 30.13. Abbildung 30.13: Dialogfeld der Schaltfläche Gruppen definieren

30.6 Tests für zwei unabhängige Stichproben 763 Geben Sie zwei ganzzahlige Werte zur Gruppenbildung an. Fälle, die keinen der angegebenen Werte aufweisen, werden in den Tests nicht berücksichtigt. Werte mit Dezimalstellen werden auch nicht gerundet oder abgeschnitten. In den Gruppen 1 und 2 ist der Wert 1,4 also nicht enthalten. Die Gruppe des ersten Wertes wird in dem Moses-Test als Kontrollgruppe verwendet. In dem Mann-Whitney- Test bezieht sich der Wert W auf diese Gruppe, sofern beide Gruppen die gleiche Anzahl von Fällen umfassen. Welche Tests durchführen? Per Voreinstellung wird nur der Mann-Whitney-Test durchgeführt, es stehen jedoch die folgende vier Tests zur Verfügung: ¾ Mann-Whitney-U-Test: Nullhypothese: Beide Stichproben entstammen der gleichen Grundgesamtheit. Die Werte beider Gruppen werden gemeinsam in aufsteigender Folge der Werte geordnet und mit Rangwerten versehen. Aus dieser Reihenfolge wird der Wert U berechnet, der angibt, wie häufig der Wert einer Gruppe einem Wert der anderen Gruppe vorausgeht. Zusätzlich wird Wilcoxons W berechnet. Dies ist die Summe der Ränge für die Gruppe mit geringerer Fallzahl. Für diese Werte wird die zweiseitige Wahrscheinlichkeit als Fehlerwahrscheinlichkeit für die Nullhypothese berechnet. Zusätzlich werden die mittleren Ränge beider Stichproben sowie die Anzahl der Fälle in den Gruppen angegeben. Für ein Beispiel siehe oben Mann-Whitney-Test, S. 758. ¾ Kolmogorov-Smirnov-Z: Nullhypothese: Beide Stichproben entstammen der gleichen Grundgesamtheit. Dieser Test vergleicht die Verteilungen der beiden Stichproben miteinander. Er reagiert empfindlich auf Unterschiede in Median, Schiefe u.a. Dieser Test erfordert Intervallskalenniveau der Testvariablen. Im Output werden die Fallzahlen der Gruppen, die größten negativen, positiven und absoluten Differenzen, der Kolmogorov-Smirnov-Z-Wert sowie die zweiseitige Wahrscheinlichkeit mitgeteilt. ¾ Extremreaktionen nach Moses: Nullhypothese: Die Spannweite der Werte ist in beiden Gruppen gleich groß. Die Werte beider Gruppen werden in eine gemeinsame Reihenfolge gebracht. Anschließend werden ihnen Rangwerte zugewiesen. Eine der Gruppen (die Gruppe des Wertes, der in dem Dialogfeld Gruppen definieren als erstes angegeben ist) wird als Kontrollgruppe verwendet. Für diese Gruppe wird die Spannweite der Ränge als Differenz zwischen dem größten und kleinsten Rangwert berechnet. Anhand dieser Spannweite errechnet sich die einseitige Signifikanz. Zusätzlich wird der Test ein zweites Mal durchgeführt, wobei die Ausreißer der Gesamtstichprobe ausgeschlossen werden (insgesamt 5% der Fälle). Dabei werden sowohl die höchsten als auch die niedrigsten Ränge entfernt. Das Testergebnis teilt die Anzahl der Fälle beider Gruppen, die Spannweiten und die entsprechenden einseitigen Signifikanzen für beide Tests (mit und ohne Ausreißer) mit. Für ein Beispiel siehe oben Abschnitt Moses-Test, S. 760.

764 Kapitel 30 Nichtparametrische Tests ¾ Wald-Wolfowitz-Sequenzen: Nullhypothese: Beide Stichproben entstammen der gleichen Grundgesamtheit. Die Werte beider Gruppen werden in eine gemeinsame Reihenfolge gebracht. Für diese Werte wird eine Sequenzanalyse für die Gruppenzugehörigkeit durchgeführt. Im Output angegeben wird die Anzahl der Fälle in beiden Gruppen, die Zahl der Sequenzen in der Rangfolge, der Z-Wert und die entsprechende Signifikanz. Außerdem wird die Zahl der Rangbindungen ausgewiesen. Sind in der Rangfolge verbundene Fälle enthalten, werden die Höchst- und Mindestzahl der möglichen Sequenzen angegeben. Für beide werden der Z-Wert und die einseitige Signifikanz mitgeteilt. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S. 747. 30.7 Tests für mehrere unabhängige Stichproben Zum Vergleich mehrerer unabhängiger Stichproben stehen zwei Tests zur Verfügung, der Kruskal-Wallis-Test und der Median-Test. Beide Tests vergleichen die Werte einer Variablen in verschiedenen Fallgruppen der Datendatei miteinander. Jede Fallgruppe bildet im Sinne der Tests eine unabhängige Stichprobe. Die Fallgruppen werden dabei mit Hilfe einer gruppierenden (kategorialen) Variablen aus der Datendatei definiert. Der Median-Test untersucht, ob die verschiedenen Stichproben in der Grundgesamtheit den gleichen Median aufweisen. Er entspricht insofern einem T-Test, der einen Vergleich der Mittelwerte verschiedener Stichproben durchführt. Der Kruskal-Wallis-Test erstellt eine gemeinsame Rangfolge aller Werte der verschiedenen Stichproben und testet anschließend die Nullhypothese, die mittleren Rangzahlen in den einzelnen Gruppen seien gleich. Für beide Tests müssen die Testvariablen mindestens Ordinalskalenniveau aufweisen. 30.7.1 Interpretation der Testergebnisse Beispiel Im Rahmen der ALLBUS-Umfrage wurde den Befragten unter anderem der in Abbildung 30.14 wiedergegebene Fragetext mit den ebenfalls aufgeführt Antwortkategorien vorgelegt. Im folgenden soll untersucht werden, ob sich die Antworten von Befragten mit unterschiedlichem allgemeinen Schulabschluß bei dieser Frage unterscheiden. Hierzu werden sowohl ein Median-Test als auch ein Kruskal-Wallis-Test durchgeführt.

30.7 Tests für mehrere unabhängige Stichproben 765 Im Vergleich dazu, wie andere hier in Deutschland leben: Glauben Sie, daß Sie Ihren gerechten Anteil erhalten, mehr als Ihren gerechten Anteil, etwas weniger oder sehr viel weniger? 1 Sehr viel weniger 2 Etwas weniger 3 Gerechten Anteil 4 Mehr als den gerechten Anteil Abbildung 30.14: Fragetext und Antwortkategorien für die Variable v30 Die Tests zur Untersuchung der beschriebenen Fragestellungen fordern Sie mit den folgenden Einstellungen an: ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt auch die Notwendigkeit zur Gewichtung der Daten. 354 ¾ Test für mehrere unabhängige Stichproben aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS K UNABHÄNGIGE STICHPROBEN... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v30 (Gerechter Anteil am Lebensstandard?) in das Feld Testvariablen und bildung (Allgemeiner Schulabschluß) in das Feld Gruppenvariable ein. Klicken Sie anschließend auf die Schaltfläche Gruppen definieren, 355 und geben Sie in dem damit geöffneten Dialogfeld den Wert 1 als Minimum und den Wert 3 als Maximum an. Da im folgenden sowohl der Median-Test als auch der Kruskal-Wallis-Test betrachtet werden sollen, werden in der Gruppe Welche Tests durchführen? im Hauptdialogfeld beide Optionen angekreuzt. Die beschriebenen Einstellungen sind in dem Dialogfeld in Abbildung 30.17, S. 768 dargestellt und liefern den Output aus den Abbildung 30.15 und 30.16. Kruskal-Wallis-Test Die Ergebnisse des Kruskal-Wallis-Tests sind in Abbildung 30.15 dargestellt. Die Variable bildung unterscheidet zwischen drei allgemeinen Schulabschlüssen. In der Spalte Mittlerer Rang werden die durchschnittlichen Rangzahlen für diese drei Gruppen ausgegeben. Diese werden berechnet, indem zunächst alle Werte der Testvariablen in eine gemeinsame Rangordnung gebracht werden. Jedem Variablenwert wird dabei ein Rangwert entsprechend seiner Position in der Rangord- 354 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, wie Sie diese Einstellungen in der Datendatei herbeiführen können. 355 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde und diese aktuell markiert ist.

766 Kapitel 30 Nichtparametrische Tests nung zugewiesen. Anschließend werden die durchschnittlichen Rangwerte getrennt für die drei Kategorien des Schulabschlusses errechnet. Es ist sehr deutlich, daß die mittleren Rangwerte mit der Höhe des Schulabschlusses ansteigen. Während der durchschnittliche Rangwerte in der Kategorie Hauptschule 154,50 beträgt, hat er in der Kategorie Mittlere Reife einen Wert von 172,65 und in erreicht in der Kategorie Abitur sogar den Wert 202,51. Anhand des Wertes Kruskal-Wallis-H, der annähernd Chi-Quadrat verteilt ist, wird ein Signifikanzwert für die Nullhypothese berechnet, derzufolge die mittleren Ränge in der Grundgesamtheit gleich sind. Diese Signifikanz beträgt im vorliegenden Beispiel 0,010 bzw. 1,0%. Weist man die Nullhypothese gleicher mittlerer Rangwerte der drei Gruppen in der Grundgesamtheit zurück, begeht man folglich mit einer Wahrscheinlichkeit von 1,0% einen Irrtum. Bei einer so geringen Irrtumswahrscheinlichkeit kann die Nullhypothese zurückgewiesen werden, die mittleren Rangwerte der Zufriedenheit mit dem Lebensstandard in den drei unterschiedlichen Schulabschluß-Kategorien sind in der Grundgesamtheit offenbar nicht gleich. Ränge V30 BILDUNG Hauptschule, Polytech. Schule 8. o. 9. Kl., kein Abschluß Mittlere Reife, Fachhochschule, Polytech. Schule 10. Klasse Abitur bzw. Erw. Oberschule Gesamt N 141 154,50 156 172,65 39 202,51 336 Mittlerer Rang Statistik für Test a,b Chi-Quadrat df Asymptotische Signifikanz a. Kruskal-Wallis-Test b. Gruppenvariable: BILDUNG V30 9,249 2,010 Abbildung 30.15: Ergebnisse des Kruskal-Wallis-Tests für mehrere unabhängige Stichproben Median-Test Für den Median-Test hat die Prozedur die Ergebnisse aus Abbildung 30.16 ausgegeben. Zunächst wurde der Median der Testvariablen für die Gesamtheit der in den Test eingegangenen Fälle berechnet. Dieser Median wird in der unteren Tabelle mit 2 angegeben. Anschließend werden die Werte der einzelnen Gruppen mit dem Gesamtmedian verglichen. Für jede Gruppen wird die Anzahl der Fälle mitgeteilt, deren Werte größer bzw. kleiner sind als der Median aller Fälle. Entstammen die Werte alle der gleichen Grundgesamtheit, sollten die Mediane in den drei Gruppen ungefähr gleich sein. In dem Fall würden auch in jeder Gruppe in etwa die Hälfte der Werte über und die andere Hälfte unter dem Median liegen, der für die Gesamtheit der Fälle berechnet wurde. Für die drei Gruppen aus dem Beispiel trifft dies nicht uneingeschränkt zu. Zunächst ist zu beobachten, daß in jeder Gruppe deutlich mehr Werte kleiner oder gleich dem Median (<=Median) sind als über dem Median liegen. Dies liegt daran, daß insgesamt mit vier Kategorien nur

30.7 Tests für mehrere unabhängige Stichproben 767 wenige Gruppen unterschieden werden und der Median mit einer häufig vertretenen Gruppe zusammenfällt. Für den Test ist aber vor allem entscheidend, daß die Verteilung der Werte in den drei Gruppen sehr ähnlich ist, sich die Werte also in ähnlicher Weise auf die beiden Seiten des Medians verteilen. Mit einem Chi-Quadrat-Test wird überprüft, inwieweit die Unterschiede zwischen den Gruppen auf tatsächliche Unterschiede in der Grundgesamtheit hindeuten. Der Signifikanzwert für die Nullhypothese wird mit 0,114% bzw. 11,4% angegeben. Bei einer so hohen Irrtumswahrscheinlichkeit kann die Nullhypothese, derzufolge die Mediane der einzelnen Gruppen der gleichen Grundgesamtheit entstammen (das bedeutet hier einfach, daß die Mediane gleich sind) nicht zurückgewiesen werden. Häufigkeiten V30 > Median < = Median Hauptschule, Polytech. Schule 8. o. 9. Kl., kein BILDUNG Mittlere Reife, Fachhochschule, Polytech. Schule Abitur bzw. Erw. Abschluß 10. Klasse Oberschule 44 59 19 97 97 20 Statistik für Test b N Median Chi-Quadrat df Asymptotische Signifikanz V30 336 2,00 4,339 a 2,114 a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 14,2. b. Gruppenvariable: BILDUNG Abbildung 30.16: Ergebnisse eines Median-Tests für mehrere unabhängige Stichproben 30.7.2 Einstellungen eines Tests für mehrere unabhängige Stichproben bei SPSS Um nichtparametrische Tests für mehrere unabhängige Stichproben durchzuführen, öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung 30.17: STATISTIK NICHTPARAMETRISCHE TESTS K UNABHÄNGIGE STICHPROBEN...

768 Kapitel 30 Nichtparametrische Tests Abbildung 30.17: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, K UNABHÄNGIGE STICHPROBEN Das abgebildete Dialogfeld zeigt die für das obige Beispiel verwendeten Einstellungen. In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt, Textvariablen können also auch nicht als Gruppierungsvariablen verwendet werden. Um einen Test für mehrere unabhängige Stichproben durchzuführen, nehmen Sie die folgenden Einstellungen vor: ¾ Testvariablen: Geben Sie in diesem Feld mindestens eine Testvariable an. Die Werte der Testvariablen in verschieden Fallgruppen der Datendatei werden anhand der Tests miteinander verglichen. ¾ Gruppenvariable: Geben Sie hier die gruppierende Variable an. Zusätzlich muß in dem Dialogfeld der Schaltfläche Bereich definieren ein Wertebereich angegeben werden (s.u.). Jeder Wert der Gruppenvariablen innerhalb dieses Bereichs bildet eine Fallgruppe in der Datendatei. ¾ Welche Tests durchführen?: Kreuzen Sie die durchzuführenden Tests an. ¾ Optionen: Hier können Sie zusätzliche Maßzahlen für den Output anfordern und den Ausschluß von Fällen mit fehlenden Werten regeln. Gruppenvariable Geben Sie die Variable, durch deren Werte die Fallgruppen definiert werden sollen, in dem Feld Gruppenvariable an. Um die Gruppen zu definieren, müssen Sie zusätzliche einen Wertebereich festlegen. Jeder ganzzahlige Wert innerhalb dieses Bereichs (einschließlich der Grenzen) bildet eine Fallgruppe und damit eine der zu vergleichenden unabhängigen Stichproben. Um den Wertebereich anzugeben, öffnen Sie mit der Schaltfläche Bereiche definieren das in Abbildung 30.18 dargestellte Dialogfeld.

30.7 Tests für mehrere unabhängige Stichproben 769 Abbildung 30.18: Dialogfeld der Schaltfläche "Bereich definieren für mehrere unabhängige Stichproben Geben Sie in den Feldern Minimum und Maximum die untere und obere Grenze des Wertebereichs an. Jeder ganzzahlige Werte innerhalb dieses Bereichs definiert eine Fallgruppe in der Datendatei. Durch die Angaben in Abbildung 30.17 werden damit die drei Fallgruppen 1, 2 und 3 definiert. Enthält die Gruppenvariable Werte mit Dezimalstellen, werden diese abgeschnitten. Der Wert 3,9 wird damit noch der Gruppe 3 zugeordnet, auch wenn er bereits außerhalb des angegeben Wertebereichs liegt. Welche Tests durchführen? Für mehrere unabhängige Stichproben stehen die beiden folgenden Tests zur Verfügung: ¾ Kruskal-Wallis H: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. Um die Hypothese zu überprüfen, werden die Werte in eine gemeinsame Rangordnung gebracht. Getestet wird anschließend mit einem χ 2 - Test, ob die durchschnittlichen Rangwerte in den einzelnen Stichproben gleich groß sind. Es werden die durchschnittlichen Ränge sowie die Anzahl der Fälle und außerdem der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz ausgegeben. ¾ Median: Nullhypothese: Die Stichproben entstammen Grundgesamtheiten mit dem gleichen Median. Zunächst wird der Median für die Gesamtheit der Variablenwerte berechnet. Anschließend wird jeweils die Anzahl der Fälle in den einzelnen Gruppen betrachtet, deren Werte größer bzw. kleiner als der Gesamtmedian sind. Bei Gültigkeit der Nullhypothese müßte jeweils die Hälfte der Werte über und die andere Hälfte unter dem Median liegen. Anhand der Abweichungen der beobachteten von den erwarteten Fallzahlen wird ein χ 2 - Test durchgeführt. Im Output werden der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz mitgeteilt, außerdem die Anzahl der Fälle, der Gesamtmedian sowie für die einzelnen Gruppen die Zahl der Fälle mit Werten größer und kleiner oder gleich dem Gesamtmedian.

770 Kapitel 30 Nichtparametrische Tests Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S. 747. 30.8 Tests für zwei verbundene Stichproben Für zwei verbundene Stichproben können Sie mit dem Wilcoxon-Test und dem Vorzeichen-Test überprüfen, ob die beiden Stichproben Grundgesamtheiten mit der gleichen Verteilung entstammen. Mit dem McNemar-Test können Sie für zwei dichotome Variablen untersuchen, ob diese systematische Unterschiede aufweisen. Zwei Stichproben werden als verbunden bezeichnet, wenn ihre Werte gemeinsam und damit paarweise auftreten und inhaltlich zusammenhängen. Werden bei einer Befragung die Personen zum Beispiel nach dem Alter der Mutter sowie nach dem Alter des Vaters gefragt, bilden die beiden Altersangaben zwei verbundene Stichproben, da die einzelnen Werte jeweils paarweise miteinander verbunden sind. Die beiden Werte werden dabei in zwei Variablen, aber im gleichen Fall gespeichert. Bei verbundenen Stichproben bilden also die Werte einer Stichprobe jeweils eine eigene Variable. 30.8.1 Interpretation des Wilcoxon-Tests Im Rahmen der ALLBUS-Umfrage wurden den Befragten unter anderem die beiden in den Abbildungen 30.19 und 30.20 wiedergegebenen Fragen vorgelegt. Im folgenden geht es um den Zuzug verschiedener Personengruppen nach Deutschland. Wie ist Ihre Einstellung dazu? Wie ist es mit Arbeitnehmern aus der Europäischen Union? 1 Der Zuzug soll uneingeschränkt möglich sein. 2 Der Zuzug soll begrenzt werden. 3 Der Zuzug soll völlig unterbunden werden. Abbildung 30.19: Fragetext und Antwortkategorien für die Variable v33 Und wie ist es mit Arbeitnehmern aus Nicht-EU-Staaten, z.b. Türken? 1 Der Zuzug soll uneingeschränkt möglich sein. 2 Der Zuzug soll begrenzt werden. 3 Der Zuzug soll völlig unterbunden werden. Abbildung 30.20: Fragetext und Antwortkategorien für die Variable v34 Im folgenden wird mit einem Wilcoxon-Test untersucht, ob die beiden Variablen in der Grundgesamtheit die gleiche Verteilung aufweisen. Ein solcher Test läßt sich mit den folgenden Einstellungen anfordern:

30.8 Tests für zwei verbundene Stichproben 771 ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet. Damit entfällt auch die Notwendigkeit zur Gewichtung der Daten. 356 ¾ Test für zwei verbundene Stichproben aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS ZWEI VERBUNDENE STICHPROBEN... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur das Variablenpaar v33 - v34 in das Feld Ausgewählte Variablenpaare ein. Klicken Sie hierzu in der Quellvariablenliste nacheinander auf die Variablen v33 und v34, und verschieben Sie das Paar anschließend mit der Pfeil-Schaltfläche in das Feld Ausgewählte Variablenpaare. Bei den übrigen Optionen werden die Voreinstellungen verwendet. Dies bedeutet insbesondere, daß in der Gruppe Welche Tests durchführen? die Option Wilcoxon angekreuzt bleibt. Die beschriebenen Einstellungen sind in dem Dialogfeld in Abbildung 30.22, S. 772 dargestellt und liefern den Output aus Abbildung 30.21. Der Wilcoxon-Test vergleicht die Verteilung beider Variablen anhand der Differenzen zwischen den Wertepaaren. Zunächst werden die Differenzen berechnet und nach ihrer absoluten Größe in eine Rangordnung gebracht. Anschließend werden die mittleren Rangzahlen der positiven und der negativen Differenzen berechnet. Die Zahl der positiven und negativen Differenzen sowie ihr durchschnittlicher Rangwert werden in dem Output angegeben. Insgesamt wurden 329 Fälle in den Test einbezogen, davon wiesen 7 Fälle negative und 73 Fälle positive Differenzen auf. In 7 Fällen wurde der Zuzug von EU-Ausländern damit ablehnender beurteilt als der Zuzug von Nicht-EU-Ausländern, in 73 Fälle verhielt es sich genau umgekehrt. 249 Befragte haben den Zuzug der beiden Gruppen von ausländischen Arbeitnehmern gleich bewertet (Bindungen). Nicht nur die Anzahl negativer Differenzen, sondern auch ihr durchschnittlicher absoluter Betrag scheinen etwas kleiner zu sein als die positiven Abweichungen. Der mittlere Rang der sieben negativen Abweichungen ist mit 37,00 angegeben, während der für positive Differenzen 40,84 beträgt. Aufgrund dieser Beobachtungen ergibt sich für die Nullhypothese, derzufolge beide Stichproben einer Grundgesamtheit mit der gleichen Verteilung entstammen, ein Signifikanzwert von 0,000 bzw. 0,0%. Die Nullhypothese kann damit zurückgewiesen werden. Der annähernd standardnormalverteilte Z-Wert, der zur Berechnung der Signifikanz diente, wird ebenfalls ausgewiesen und beträgt -7,238. 356 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, wie Sie diese Einstellungen in der Datendatei herbeiführen können.

772 Kapitel 30 Nichtparametrische Tests V34 - V33 a. V34 < V33 b. V34 > V33 c. V33 = V34 Negative Ränge Positive Ränge Bindungen Gesamt Ränge N Mittlerer Rang Rangsumme 7 a 37,00 259,00 73 b 40,84 2981,00 249 c 329 Z Statistik für Test b Asymptotische Signifikanz (2-seitig) V34 - V33-7,238 a a. Basiert auf negativen Rängen. b. Wilcoxon-Test,000 Abbildung 30.21: Ergebnisse eines Wilcoxon-Tests für zwei verbundene Stichproben 30.8.2 Einstellungen der Tests für zwei verbundene Stichproben bei SPSS Um einen nichtparametrischen Test für zwei verbundene Stichproben durchzuführen, wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.22 öffnet. Das abgebildete Dialogfeld zeigt die für das vorhergehende Beispiel verwendeten Einstellungen. STATISTIK NICHTPARAMETRISCHE TESTS ZWEI VERBUNDENE STICHPROBEN... Abbildung 30.22: Dialogfeld des Befehls STATISTIK, NICHTPARAME- TRISCHE TESTS, ZWEI VERBUNDENE STICHPROBEN ¾ Variablen: Geben Sie in dem Feld Ausgewählte Variablenpaare die Paare der jeweils miteinander zu vergleichenden Variablen an. Klicken Sie dafür zunächst nacheinander auf die beiden Variablen eines Paares, und fügen Sie das Paar anschließend durch Klicken auf die Pfeil-Schaltfläche der Liste Ausgewählte Variablenpaare hinzu. Wenn Sie mehrere Variablenpaare angeben, werden die Tests für jedes Paar getrennt durchgeführt.

30.8 Tests für zwei verbundene Stichproben 773 ¾ Tests: Per Voreinstellung wird lediglich der Wilcoxon-Test durchgeführt. Möchten Sie andere oder zusätzliche Tests durchführen, kreuzen Sie diese in der Gruppe Welche Tests durchführen? an (s.u.). ¾ Optionen: Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S. 747. Welche Tests durchführen? Die folgenden drei Tests stehen für zwei verbundene Stichproben zur Verfügung: ¾ Wilcoxon: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit mit gleicher Verteilung. Der Wilcoxon-Test erstellt eine gemeinsame Rangfolge aller Werte aus den beiden Stichproben. Anschließend vergleicht er die Ränge der einzelnen Wertepaare miteinander. Dazu wird die Differenz zwischen den beiden Rängen eines Paares berechnet und der durchschnittliche Rang für alle positiven sowie für alle negativen Differenzen ermittelt. Anhand des unter der Nullhypothese annähernd standardnormalverteilten Testwertes Z wird die Signifikanz der Nullhypothese ermittelt. Im Output werden für die positiven und negativen Abweichungen sowie für die Fälle ohne Differenzen (Bindungen) die Anzahl der Fälle sowie der mittlere Rangwert angegeben. Außerdem werden der Z-Wert und die Signifikanz mitgeteilt. ¾ Vorzeichen: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit mit gleicher Verteilung. Der Test vergleicht jeweils die Werte der einzelnen Paare miteinander. Er berechnet die Differenzen beider Werte und zählt die Anzahl der positiven und die der negativen Abweichungen. Anschließend wird der bei Gültigkeit der Nullhypothese standardnormalverteilte Z- Wert berechnet und auf diese Weise die Signifikanz der Nullhypothese bestimmt. Die Anzahl der positiven und negativen Abweichungen sowie die Zahl der Fälle mit gleichen Werten in beiden Variablen werden neben dem Z-Wert und der Signifikanz im Output mitgeteilt. ¾ McNemar: Nullhypothese: Unterschiede in den Werten beider Variablen liegen in beiden Richtungen gleichermaßen vor. Der Test untersucht für dichotome Variablen, ob Unterschiede in den Werten beider Variablen in eine Richtung stärker ausgeprägt sind als in die andere. Dieser Test wird insbesondere für Voher/Nachher-Vergleiche verwendet. Der Test betrachtet lediglich die Fälle, in denen sich die Werte beider Variablen unterscheiden. Er erstellt eine 2 2-Tabelle für die dichotomen Werte der beiden Variablen und gibt die Anzahl der Fälle für die vier verschiedenen Wertekombinationen an. Wenn die Unterschiede zwischen den Variablen zufällig sind, müßten die beiden ungleichen Wertekombinationen - in Relation zu der Häufigkeit der einzelnen Werte - mit gleicher Häufigkeit auftreten. Die Nullhypothese wird mit einem χ 2 - Test überprüft. Weisen weniger als 25 Fälle verschiedene Werte auf, wird ein Binomial-Test durchgeführt. Im Output werden die 2 2-Tabelle sowie der χ 2 - Wert und die Signifikanz angegeben.

774 Kapitel 30 Nichtparametrische Tests 30.9 Test für mehrere verbundene Stichproben Analog zu den Tests für zwei verbundene Stichproben können Sie auch mehrere verbundene Stichproben daraufhin untersuchen, ob sie derselben Grundgesamtheit entstammen. Mit dem Friedman-Test können Sie für ordinalskalierte Variablen die mittleren Ränge der Variablen vergleichen. Kendalls W wird häufig verwendet, um die Zuverlässigkeit von Gutachtern oder Tests zu überprüfen. Der Test untersucht die Übereinstimmung zwischen verschiedenen Bewertungen. Die Verteilung mehrerer dichotomer Variablen können Sie mit Cochrans Q auf Gleichheit untersuchen. Die Interpretation der Testergebnisse erfolgt dabei ganz analog zu den Tests für zwei verbundene Stichproben. Um nichtparametrische Tests für mehrere verbundene Stichproben durchzuführen, wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.23 öffnet: STATISTIK NICHTPARAMETRISCHE TESTS K VERBUNDENE STICHPROBEN... Abbildung 30.23: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, K VERBUNDENE STICHPROBEN ¾ Variablen: Verschieben Sie die Variablen, die die einzelnen verbundenen Stichproben repräsentieren, in das Feld Testvariablen. Es müssen mindestens zwei Variablen angegeben werden. Die Angabe dieser Variablen genügt, um die Prozedur auszuführen. ¾ Tests: Kreuzen Sie in der Gruppe Welche Tests durchführen? die gewünschten Tests an (s.u.). ¾ Statistik: Sie können für die Testvariablen zusätzlichen deskriptive Maßzahlen anfordern (s.u.).

30.9 Test für mehrere verbundene Stichproben 775 Welche Tests durchführen? ¾ Friedman: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. Betrachtet werden jeweils die Werte der Testvariablen in demselben Fall. Für diese Werte eines Falles wird eine Rangordnung erstellt. Anschließend werden die mittleren Rangzahlen der einzelnen Testvariablen ermittelt. Anhand eines annähernd χ 2 -verteilten Testwertes wird der Signifikanzwert für die Nullhypothese berechnet. Der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz werden im Output mitgeteilt, ebenso wie die Anzahl der Fälle sowie die mittleren Rangzahlen der einzelnen Variablen. ¾ Kendall-W: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. Der Test interpretiert die einzelnen Variablen als verschiedene zu bewertende Sachverhalte und die einzelnen Fälle als unterschiedliche Prüfer oder Tests. Der Test mißt die Übereinstimmung zwischen den Prüfern. Für jeden Fall werden die Werte der Variablen dabei in eine Rangordnung gebracht. Anschließend werden die mittleren Ränge der Variablen ermittelt. Daraus wird Kendalls W sowie ein χ 2 -Wert berechnet. Kendalls W liegt zwischen 0 und 1 und gibt die Stärke der Übereinstimmung an. Bei einem Wert von 0 besteht gar keine, bei einem Wert von 1 perfekte Übereinstimmung. Zu dem χ 2 -Wert wird die Signifikanz mitgeteilt. Neben dem χ 2 -Wert, der Anzahl der Freiheitsgrade und der Signifikanz und Kendalls W werden die Anzahl der Fälle sowie die mittleren Ränge der einzelnen Testvariablen mitgeteilt. ¾ Cochran-Q: Nullhypothese: Die verschiedenen dichotomen Variablen haben dieselbe Verteilung. Bei dichotomen Variablen läuft diese Hypothese darauf hinaus, daß sie denselben Mittelwert haben. Der Test zählt jeweils die Häufigkeiten der einzelnen Werte in den Variablen und berechnet den annähernd χ 2 - verteilten Testwert Q. Cochrans Q, die Anzahl der Freiheitsgrade sowie die Signifikanz werden im Output angegeben. Zusätzlich werden die Anzahl der Fälle und die Häufigkeiten der einzelnen Werte in den Testvariablen mitgeteilt. Statistik Die Schaltfläche Statistik öffnet das Dialogfeld aus Abbildung 30.24. Abbildung 30.24: Dialogfeld der Schaltfläche Statistik

776 Kapitel 30 Nichtparametrische Tests In diesem Dialogfeld können Sie folgende ergänzende Maßzahlen anfordern können: ¾ Deskriptive Statistik: Berechnet für die Testvariablen auf der Basis der in die Tests einbezogenen Fälle den Mittelwert und die Standardabweichung. Zusätzlich werden das Minimum und das Maximum sowie die Anzahl der Fälle mitgeteilt. ¾ Quartile: Für die in die Prozedur einbezogenen Fälle werden die 25%-, 50%- und 75%-Perzentile der Testvariablen angegeben.