Kapitel 30 Nichtparametrische Tests
|
|
|
- Ferdinand Diefenbach
- vor 9 Jahren
- Abrufe
Transkript
1 Kapitel 30 Nichtparametrische Tests 30.1 Überblick Nichtparametrische Tests dienen dazu, aufgrund der Daten einer Stichprobe Rückschlüsse auf die Eigenschaften der Werte in der Grundgesamtheit zu ziehen. Dies haben sie mit allen anderen Testverfahren auf stichprobentheoretischer Grundlage wie beispielsweise dem T-Test oder den Varianzanalysen (ANOVA) gemeinsam. Auch in dem konkret zu untersuchenden Sachverhalt unterscheiden sich die nichtparametrischen Tests häufig nicht von anderen Testverfahren. So kann zum Beispiel anstatt des T-Tests grundsätzlich auch stets der nichtparametrische Mann- Whitney-Test durchgeführt werden. (Umgekehrt gilt jedoch nicht, daß der Mann- Whitney-Test jederzeit durch den T-Test ersetzt werden kann.) Der wesentliche Unterschied zwischen nichtparametrischen Tests und den übrigen Testverfahren besteht darin, daß die nichtparametrischen Tests wesentlich geringere Anforderungen an die Verteilung der Werte in der Grundgesamtheit stellen. Während zum Beispiel der T-Test verlangt, daß die zu vergleichenden Stichproben jeweils einer annähernd normalverteilten Grundgesamtheit entstammen und gleiche Varianzen aufweisen, müssen diese Voraussetzungen für den Mann-Whitney-Test nicht erfüllt sein. Zudem stellen nichtparametrische Tests häufig weniger starke Anforderungen an das Skalenniveau der zu untersuchenden Variablen. Dies hängt damit zusammen, daß ein Großteil der nichtparametrischen Tests auf der Betrachtung von Rangzahlen basiert und daher oftmals ein Ordinalskalenniveau genügt, wenn bei alternativen Tests intervallskalierte Daten erforderlich sind. Aus dem bisher Gesagten ergibt sich unmittelbar das primäre Anwendungsgebiet nichtparametrischer Tests: Sie kommen insbesondere dann zur Anwendung, wenn die stärkeren Voraussetzungen alternativer Tests von den zugrundeliegenden Daten nicht erfüllt werden. Der Preis für das Ausweichen auf Tests mit schwächeren Anforderungen an die Daten besteht allerdings darin, daß sich mit nichtparametrischen Tests auch nur weniger scharfe und klare Hypothesen testen lassen. Die aus diesen Tests abgeleiteten Aussagen sind häufig weniger fundiert, da bei den Tests nur ein geringerer Teil der verfügbaren Informationen ausgenutzt wird. Wird bei-
2 740 Kapitel 30 Nichtparametrische Tests spielsweise eine intervallskalierte Variable mit einem nichtparametrischen Test untersucht, der auf der Betrachtung von Rangwerten basiert, werden die verfügbaren Informationen über die Größe von Wertdifferenzen nicht verwendet. Daher kann der Test auch keine so starken Ergebnisse liefern, wie es parametrische Tests vermögen. Dies ist der Grund dafür, daß im allgemeinen den parametrischen Verfahren der Vorzug gegeben wird, sofern von den zu untersuchenden Daten die entsprechenden Voraussetzungen erfüllt werden. Umgekehrt sind nichtparametrische Tests vor allem dann sinnvoll, wenn die Variablen ein zu niedriges Skalenniveau für parametrische Tests aufweisen oder die Verteilungsannahmen der parametrischen Verfahren nicht hinreichend erfüllt sind. Insgesamt stehen bei SPSS 16 nichtparametrische Testverfahren zur Verfügung, die in acht Unterbefehlen des Menüs STATISTIK NICHTPARAMETRISCHE TESTS zusammengefaßt sind. Es folgt eine Übersicht über die zur Verfügung stehenden Testverfahren unter Angabe der jeweils zugrundeliegenden Fragestellung, des erforderlichen Skalenniveaus, des Unterbefehls, mit dem der Test angefordert werden kann, und der Seitenzahl, bei der die jeweilige Prozedur ausführlicher beschrieben wird. ¾ Chi-Quadrat: Stimmen die beobachteten Häufigkeiten einer Variablen mit vorgegebenen erwarteten Häufigkeiten überein? Nominalskalenniveau. CHI- QUADRAT (S. 741). ¾ Binomial: Stimmen die beobachteten Häufigkeiten einer dichotomen Variablen mit vorgegebenen erwarteten Häufigkeiten überein? Dichotome Variable. BINOMIAL (S. 748). ¾ Sequenz: Sind die Werte einer dichotomen Variablen in einer Folge von Werten zufällig angeordnet? Dichotome Variable. SEQUENZEN (S. 751). ¾ Kolmogorov-Smirnov bei einer Stichprobe: Folgen die Werte in der Grundgesamtheit einer bestimmten Verteilung? Getestet werden kann auf Normalverteilung, Gleichverteilung, Poissonverteilung und Exponentialverteilung. Intervallskalenniveau. K-S BEI EINER STICHPROBE (S. 754). ¾ Mann-Whitney: Entstammen zwei unabhängige Stichproben derselben Grundgesamtheit? Der Test erfolgt auf der Basis von Rangunterschieden. Ordinalskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757). ¾ Kolmogorov-Smirnov-Z: Entstammen zwei unabhängige Stichproben derselben Grundgesamtheit? Der Test basiert auf einem Vergleich der Verteilungen. Intervallskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757). ¾ Moses: Ist die Spannweite der Werte in den Grundgesamtheiten zweier unabhängiger Stichproben gleich groß? Ordinalskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757).
3 30.2 Chi-Quadrat-Test 741 ¾ Wald-Wolfowitz: Entstammen zwei unabhängige Stichproben derselben Grundgesamtheit? Der Test basiert auf einer Sequenzanalyse für die Gruppenzugehörigkeiten in einer Rangfolge. Ordinalskalenniveau. ZWEI UNAB- HÄNGIGE STICHPROBEN (S. 757). ¾ Kruskal-Wallis: Entstammen mehrere unabhängige Stichproben derselben Grundgesamtheit? Hierbei werden die mittleren Rangwerte verglichen. Ordinalskalenniveau. K UNABHÄNGIGE STICHPROBEN (S. 764). ¾ Median: Weisen mehrere unabhängige Stichproben in der Grundgesamtheit den gleichen Median auf? Ordinalskalenniveau. K UNABHÄNGIGE STICHPRO- BEN (S. 764). ¾ Wilcoxon: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPROBEN (S. 770). ¾ Vorzeichen: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPRO- BEN (S. 770). ¾ McNemar: Erfolgen Änderungen zwischen zwei verbundenen Variablen in beiden Richtungen gleichermaßen? Dichotome Variablen. ZWEI VERBUNDENE STICHPROBEN (S. 770). ¾ Friedman: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit? Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774). ¾ Kendall: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit? Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774). ¾ Cochran: Haben mehrere verbundene dichotome Variablen die gleiche Verteilung. Dichotome Variablen. K VERBUNDENE STICHPROBEN (S. 774) Chi-Quadrat-Test Mit diesem χ 2 -Test können Sie überprüfen, ob die Häufigkeiten der Werte einer Variablen in der Grundgesamtheit vorgegebenen erwarteten Häufigkeiten entsprechen. Dabei können auch Variablen untersucht werden, die lediglich Nominalskalenniveau aufweisen. Per Voreinstellung wird getestet, ob die unterschiedlichen Werte der Variablen in der Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung können Sie jedoch ändern und die erwartete Häufigkeit für jeden Wert manuell vorgeben. Der Test untersucht dann, ob aus den empirischen Häufigkeiten, die in der vorliegenden Stichprobe beobachtet wurden, geschlossen werden kann, daß die angegebenen erwarteten Häufigkeiten in der Grundgesamtheit tatsächlich gelten Zur Berechnung des χ 2 -Wertes und zur Teststatistik vgl. Abschnitt 16.2, Chi-Quadrat- Test, S. 402.
4 742 Kapitel 30 Nichtparametrische Tests Interpretation eines Chi-Quadrat-Tests Die Datendatei allbus.sav von der Begleit-CD enthält Daten einer 1996 in Deutschland durchgeführten Bevölkerungsbefragung. 344 Im folgenden sollen ausschließlich die Personen aus den neuen Bundesländern betrachtet werden. Für jeden Befragten ist unter anderem in der Variablen v35 sein Geburtsmonat angegeben. Mit dem Chi-Quadrat-Test wird nun untersucht, ob die Anzahl der Geburten in den einzelnen Monaten in der Grundgesamtheit gleich ist. Hierzu sind die folgenden Einstellungen erforderlich: ¾ Fälle auswählen: Zunächst ist der Test auf die Befragten aus den neuen Bundesländern zu beschränken. Hierzu wird der Befehl DATEN FÄLLE AUSWÄHLEN... verwendet. In dem damit geöffneten Dialogfeld wird die Option Falls Bedingung zutrifft ausgewählt und anschließend auf die zu dieser Option gehörenden Schaltfläche Falls geklickt. In dem damit geöffneten Dialogfeld wird in das große Eingabefeld die Bedingung v3 = 2 geschrieben. Anschließend wird dieses Dialogfeld mit der Schaltfläche Weiter und das Hauptdialogfeld mit der Schaltfläche OK geschlossen. Achten Sie vor dem Schließen des Hauptdialogfeldes darauf, daß in der Gruppe Nicht ausgewählte Fälle die Option Filtern eingestellt ist. ¾ Fälle nicht gewichten: Anders als in vielen anderen Kapiteln werden im folgenden Beispiel nicht gewichtete Fälle betrachtet. Sollten die Fälle in der Datendatei gewichtet sein, muß die Gewichtung zuvor ausgeschaltet werden. Dies geschieht mit dem Befehl DATEN FÄLLE GEWICHTEN... Wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle nicht gewichten, und schließen Sie das Dialogfeld mit OK. ¾ Chi-Quadrat-Test aufrufen: Um den Chi-Quadrat-Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS CHI-QUADRAT... ¾ Einstellungen: Verschieben Sie die Variable v35 in das Feld Testvariable. Bei allen übrigen Optionen werden die Voreinstellungen beibehalten. Abbildung 30.2, S. 745 zeigt die hier verwendeten Dialogfeldeinstellungen. Durch die voreingestellten Optionen wurde unter anderem festgelegt, daß untersucht werden soll, ob angenommen werden kann, daß die 12 Monate als Geburtsmonate in der Grundgesamtheit mit der gleichen Häufigkeit vorkommen. Abwei- 344 Siehe hierzu im einzelnen Kapitel 1, Überblick.
5 30.2 Chi-Quadrat-Test 743 chend von dieser Voreinstellung hätte auch untersucht werden können, ob beispielsweise die Hypothese vertreten werden kann, daß die Sommermonate in der Grundgesamtheit mit einer 10% höheren Häufigkeit vertreten sind als die Wintermonate. Der mit den hier verwendeten Einstellungen erzeugte Output ist in Abbildung 30.1 wiedergegeben. Häufigkeiten Gesamt Kategorie V35 Beobachtetes N Erwartete Anzahl Residuum Januar 27 28,9-1,9 Februar 22 28,9-6,9 März 30 28,9 1,1 April 32 28,9 3,1 Mai 32 28,9 3,1 Juni 29 28,9,1 Juli 31 28,9 2,1 August 35 28,9 6,1 September 38 28,9 9,1 Oktober 21 28,9-7,9 November 20 28,9-8,9 Dezember 30 28,9 1,1 347 Statistik für Test Chi-Quadrat a df Asymptotische Signifikanz V35 11,720 11,385 a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 28,9. Abbildung 30.1: Ergebnisse des Chi-Quadrat-Tests für die Variable v35 (Geburtsmonat der Befragten) Die betrachtete Stichprobe umfaßt 347 Personen aus den neuen Bundesländern, deren Geburtsmonat bekannt ist. Dieser Wert wird in der Tabelle Häufigkeiten und dort in der Zeile Gesamt angegeben. Wäre nun in der Stichprobe jeder Geburtsmonat mit der gleichen Häufigkeit vertreten, müßten in jedem Monat ein Zwölftel der 347 Personen geboren sein. Dies wären 28,9 Personen in jedem Monat. Auch dieser Wert wird in der Tabelle Häufigkeiten in der Spalte Erwartete Anzahl für jeden Monat mitgeteilt. Daß diese Häufigkeit von 28,9 Personen in jedem Monat als erwartete Häufigkeit bezeichnet wird, hat folgenden Hintergrund: Werden in jedem Monat tatsächlich gleich viele Personen geboren, wäre in einer Zufallsstichprobe von 347 Personen zu erwarten, daß (rein rechnerisch) 28,9 von den insgesamt 347 Personen im Januar geboren wurden. Die gilt ebenso für den Monat Februar, den März etc.
6 744 Kapitel 30 Nichtparametrische Tests Die tatsächlich beobachteten Häufigkeiten der einzelnen Monate, die in der Spalte Beobachtetes N ausgewiesen werden, weichen mehr oder weniger stark von den erwarteten Häufigkeiten ab. So wurden nicht 29 (als gerundeter Wert von 28,9) Personen im Januar geboren, sondern lediglich 27. Die Monate April und Mai sind dagegen mit jeweils 32 Personen etwas stärker vertreten, als es den erwarteten Häufigkeiten entsprochen hätte. Diese Abweichungen der beobachteten von den erwarteten Häufigkeiten lassen jedoch noch nicht den Schluß zu, die Hypothese, in der Grundgesamtheit seien alle Monate mit der gleichen Häufigkeit als Geburtsmonate vertreten, sei falsch. Vielmehr ist es durchaus möglich, daß die Hypothese vollkommen richtig ist und die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten lediglich auf zufällige Einflüsse bei der Stichprobenziehung zurückzuführen sind. Die Tatsache, daß entsprechende Abweichungen auch bei Gültigkeit der Nullhypothese auftreten, ergibt sich schon daraus, daß die erwarteten Häufigkeiten ein Wert mit Dezimalstellen sind, tatsächlich aber immer nur ganzzahlige Häufigkeiten beobachtet werden können. Der Chi-Quadrat-Test untersucht nun, ob die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten so groß sind, daß angenommen werden kann, sie seien nicht durch zufällige Einflüsse entstanden, sondern auf entsprechend unterschiedliche Häufigkeiten der Geburtsmonate in der Grundgesamtheit zurückzuführen. Das Ergebnis des Chi-Quadrat-Tests wird in der unteren Tabelle Statistik für Test mitgeteilt. Der zentrale Wert bei diesen Ergebnissen ist die Signifikanz, die in diesem Fall 0,385 beträgt. Dieser Wert ist die Irrtumswahrscheinlichkeit, die mit einem Zurückweisen der Nullhypothese verbunden ist. Er ist in diesem Fall also folgendermaßen zu interpretieren: Weist man die Nullhypothese zurück, derzufolge in der Grundgesamtheit jeder Monat mit der gleichen Häufigkeit als Geburtsmonat vertreten ist, begeht man mit einer Wahrscheinlichkeit von 38,5% einen Irrtum. Diese Irrtumswahrscheinlichkeit ist derart hoch, daß man die Nullhypothese nicht zurückweisen wird. 345 Die Tatsache, daß die Nullhypothese aufgrund der hohen Irrtumswahrscheinlichkeit nicht zurückgewiesen werden kann, läßt nicht umgekehrt den Schluß zu, die Nullhypothese sei richtig. Vielmehr ist das Ergebnis lediglich so zu interpretieren, daß sich aus den vorhanden Daten keine handfesten Anhaltspunkte dafür ergeben, daß die Nullhypothese falsch ist. Man kann also zunächst einmal weiter an der Nullhypothese festhalten, hat sie damit aber nicht verifiziert. 345 Üblicherweise wird die Nullhypothese bei einer Irrtumswahrscheinlichkeit von 5% oder weniger zurückgewiesen. Je nach zugrundeliegender Fragestellung kann man auch beliebige andere Grenzen als die 5%-Grenze verwenden, eine Irrtumswahrscheinlichkeit von 38% ist jedoch derart hoch, daß man die Nullhypothese unter keinen ersichtlichen Umständen zurückweisen kann.
7 30.2 Chi-Quadrat-Test Einstellungen des Chi-Quadrat-Tests bei SPSS Um einen Chi-Quadrat-Test durchzuführen, öffnen Sie das Dialogfeld aus Abbildung 30.2 mit dem Befehl STATISTIK NICHTPARAMETRISCHE TESTS CHI-QUADRAT... Abbildung 30.2: Dialogfeld des Befehls STATISTIK, NICHTPARAMETRISCHE TESTS, CHI-QUADRAT Variablen Die Variablenliste führt lediglich alle numerischen Variablen der Datendatei auf. Textvariablen können Sie mit dem χ 2 -Test daher nicht untersuchen, obwohl es für eine sinnvolle Interpretation des Tests genügt, wenn die Variablen nominalskaliert sind. Daher müssen Sie Textvariablen ggf. zunächst in eine numerische Variable umcodieren. 346 Verschieben Sie die Variablen, für deren Werte Sie die Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten vergleichen möchten, in das Feld Testvariablen. Wenn Sie mehrere Variablen auswählen, wird für jede der Variablen ein eigener Test durchgeführt. Wenn Sie nicht davon ausgehen, daß die Werte in der Testvariablen alle mit der gleichen Häufigkeit vorkommen und daher die erwarteten Häufigkeiten in der Gruppe Erwartete Werte manuell festlegen (s.u.), müssen diese für alle Testvariablen identisch sein. Ist dies nicht der Fall, müssen Sie die Variablen nacheinander durch wiederholtes Aufrufen der Prozedur untersuchen. 346 Hierzu können Sie zum Beispiel den Befehl TRANSFORMIEREN, UMKODIEREN, IN ANDERE VARIABLEN verwenden.
8 746 Kapitel 30 Nichtparametrische Tests Erwarteter Bereich Per Voreinstellung werden die Häufigkeiten aller in der Testvariablen vorkommenden gültigen Werte miteinander verglichen. Abweichend von dieser Voreinstellung können Sie jedoch auch einen Wertebereich vorgeben, um nur die Werte innerhalb dieses Bereichs in den Test einzubeziehen. Dies bewirkt zugleich, daß die Werte in der Testvariablen zu ganzzahligen Werten zusammengefaßt werden: ¾ Aus den Daten: Diese Option ist voreingestellt. Damit werden die Häufigkeiten für alle gültigen Werte der Testvariablen miteinander verglichen. Dabei werden auch Dezimalstellen berücksichtigt. Zwischen den Werten 7,53 und 7,52 wird also unterschieden. ¾ Angegebenen Bereich verwenden: Sie können einen Bereich der zu berücksichtigenden Werte vorgeben. Dies bewirkt gegenüber der Voreinstellung zwei Veränderungen. Zum einen werden nur die Werte innerhalb des Bereichs - einschließlich der angegebenen Grenzen - berücksichtigt. Werte, die nicht in den Bereich fallen, werden von dem Test ausgeschlossen. Zum zweiten werden die Dezimalstellen der Werte aus der Testvariablen nicht mehr berücksichtigt. Vielmehr werden die Dezimalstellen abgeschnitten, so daß nur der ganzzahlige Teil eines Wertes Berücksichtigung findet. Die Werte 7,01 und 7,99 werden somit beide als 7 interpretiert. Zudem werden auch solche ganzzahligen Werte berücksichtigt, die zwar im vorgegebenen Wertebereich, nicht aber in der Testvariablen enthalten sind. Für diese Werte wird eine beobachtete Häufigkeit von null zugrunde gelegt. Auch die Grenzen des zu berücksichtigenden Wertebereichs müssen durch ganzzahlige Werte in den Feldern Minimum und Maximum angegeben werden. Wenn Sie beispielsweise ein Minimum von -1 und ein Maximum von 2 angeben, werden die Häufigkeiten der Werte -1, 0, 1 und 2 betrachtet. Erwartete Werte Per Voreinstellung wird angenommen, daß alle Werte der Testvariablen in der Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung können Sie mit den folgenden Optionen ändern: ¾ Alle Kategorien gleich: Diese Option ist voreingestellt. Damit wird angenommen, daß alle Werte der Testvariablen in der Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Die absoluten erwarteten Häufigkeiten der einzelnen Werte ergeben sich damit aus der Anzahl der berücksichtigten Fälle, dividiert durch die Anzahl der unterschiedlichen Werte in der Testvariablen. ¾ Werte: Wenn Sie nicht von gleichen erwarteten Häufigkeiten für alle Werte der Testvariablen ausgehen, können Sie die erwartete Häufigkeit für jeden Wert einzeln festlegen. Hierzu müssen Sie für jeden Wert der Testvariablen einen Wert vorgeben, es darf also kein Wert unberücksichtigt bleiben. Sollten Sie in der Gruppe Erwarteter Bereich einen Wertebereich festgelegt haben, müssen Sie für jeden ganzzahligen Wert aus dem Bereich eine erwartete Häu-
9 30.2 Chi-Quadrat-Test 747 figkeit angeben, auch wenn einzelne Werte in der Testvariablen gar nicht vorkommen. Um die erwarteten Häufigkeiten festzulegen, gehen Sie folgendermaßen vor: y Legen Sie als erstes die erwartete Häufigkeit für den kleinsten in der Testvariablen vorkommenden Wert fest. 347 Schreiben Sie den Wert in das Eingabefeld, und klicken Sie auf die Schaltfläche Hinzufügen. Daraufhin wird der Wert in das Listenfeld übertragen. y Legen Sie nun auf die gleiche Weise die erwarteten Häufigkeiten der übrigen Werte fest. Beachten Sie hierbei, daß die Häufigkeiten in aufsteigender Reihenfolge der Werte aus der Testvariablen zugeordnet werden. y Um einen bereits in das Listenfeld eingefügten Wert zu ändern, markieren Sie den betreffenden Eintrag, ändern Sie den Wert in dem Eingabefeld, und wählen Sie anschließend die Schaltfläche Ändern. Um einen Wert aus der Liste zu löschen, markieren Sie ihn, und wählen Sie die Schaltfläche Entfernen. Beachten Sie hierbei jedoch, daß die verbleibenden Werte in der Liste am Ende in ihrer Reihenfolge den Werten aus der Testvariablen entsprechen müssen. Optionen Mit der Schaltfläche Optionen öffnen Sie das Dialogfeld aus Abbildung Dort können Sie ergänzenden Output mit deskriptiven Maßzahlen und den Quartilen der Testvariablen anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Abbildung 30.3: Dialogfeld der Schaltfläche Optionen Statistiken: Mit den beiden folgenden Optionen können Sie ergänzenden Output anfordern: ¾ Deskriptive Statistik: Hiermit werden die Anzahl der Fälle mit gültigen Werten, der Mittelwert, die Standardabweichung sowie der kleinste und der größte 347 Es genügt, wenn die Häufigkeiten die Relationen richtig widerspiegeln. Sie können also wahlweise die erwarteten relativen Häufigkeiten oder ein beliebiges Vielfaches der erwarteten relativen Häufigkeiten angeben.
10 748 Kapitel 30 Nichtparametrische Tests Wert angegeben. Beachten Sie, daß der Mittelwert und die Standardabweichung nur bei Variablen mit Intervallskalenniveau sinnvoll interpretiert werden können. ¾ Quartile: Es werden das 25%-, das 50%- und das 75%-Perzentil sowie die Anzahl der Fälle mit gültigen Werten mitgeteilt. Fehlende Werte: Wenn Sie mehr als eine Testvariable ausgewählt haben, können Sie mit den beiden folgenden Optionen den Ausschluß von Fällen mit fehlenden Werten steuern. Wenn Sie nur eine Testvariable betrachten, haben beide Optionen den gleichen Effekt. ¾ Fallausschluß Test für Test: Diese Option ist voreingestellt. Bei der Untersuchung der einzelnen Testvariablen werden nur jeweils die Fälle ausgeschlossen, die in der betreffenden Variablen einen fehlenden Wert aufweisen. Fälle mit fehlenden Werten in anderen Testvariablen werden dagegen in den Test einbezogen. ¾ Listenweiser Fallausschluß: Alle Fälle, die in mindestens einer der Testvariablen einen fehlenden Wert aufweisen, werden aus der gesamten Prozedur ausgeschlossen Binomial-Test Mit einem Binomial-Test können Sie für eine dichotome Variable - dies ist eine Variable mit nur zwei unterschiedlichen Wertausprägungen - untersuchen, ob die beobachteten Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten vereinbar sind. Hierbei ist es nicht erforderlich, daß die Testvariable tatsächlich nur zwei unterschiedliche Werte enthält. Vielmehr können die Werte der Variablen beim Binomial-Test dichotomisiert, also zu zwei Gruppen zusammengefaßt, werden Interpretation eines Binomial-Tests In der Datei allbus.sav ist unter anderem das Geschlecht der Befragten (Variable v141) angegeben. Hierbei handelt es sich naturgemäß um eine dichotome Variable. Im folgenden soll die Hypothese getestet werden, in der Grundgesamtheit der Allbus-Daten seien Männer und Frauen zu gleichen Anteilen vertreten. Hierzu wird mit Hilfe eines Binomial-Tests untersucht, ob die in der Stichprobe beobachteten Häufigkeiten dieser Hypothese widersprechen. Um diesen Test durchzuführen, sind die folgenden Einstellungen erforderlich: ¾ Daten: Die Daten entstammen der Datendatei allbus.sav. Auch hier werden wie bei dem im vorhergehenden Abschnitt durchgeführten Chi-Quadrat-Test
11 30.3 Binomial-Test 749 nur die Personen aus den neuen Bundesländern betrachtet, und es werden ungewichtete Daten verwendet. 348 ¾ Binomial-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS BINOMIAL... ¾ Einstellungen: Fügen Sie die Variable v141 in das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen verwendet (siehe Abbildung 30.5, S. 750). Damit wird die Hypothese getestet, in der Grundgesamtheit seien Männer und Frauen mit der gleiche Häufigkeit vertreten. Mit diesen Einstellungen erhalten Sie den Output aus Abbildung In der Spalte N werden zunächst die beobachteten Häufigkeiten der beiden Kategorien mitgeteilt. Die Stichprobe umfaßt 160 Männer und 189 Frauen aus den neuen Bundesländern. Damit sind die beiden Gruppen in der Stichprobe offensichtlich nicht zu gleichen Anteilen vertreten. Die relativen Häufigkeiten aus der Stichprobe werden in der Spalte Beobachteter Anteil ausgewiesen. Da die Stichprobe insgesamt 349 Personen aus den neuen Ländern umfaßt, stellen die 189 Frauen einen Anteil von 54% dar. Entsprechend beträgt der Anteil der Männer 46%. Bei Gültigkeit der Nullhypothese wäre dagegen ein Anteil von jeweils 50% zu erwarten gewesen. Von diesem erwarteten Anteil können sich durch die Stichprobenbetrachtung zufällige Abweichungen ergeben. Ob sich die Abweichungen der beobachteten von den erwarteten Häufigkeiten plausibel durch Zufallseinflüsse erklären lassen und folglich mit der Nullhypothese, in der Grundgesamtheit seien beide Gruppen zu gleichen Anteilen vertreten, vereinbar sind, wird mit dem Binomial- Test untersucht. Die Wahrscheinlichkeit dafür, daß sich bei Gültigkeit der Nullhypothese mindestens so große Abweichungen ergeben wie in der vorliegenden Stichprobe, beträgt 0,134 bzw. 13,4%. Dieser Wert wird in der Spalte Asymptotische Signifikanz mitgeteilt. Der Wert läßt sich auch folgendermaßen interpretieren: Weist man die Nullhypothese, in der Grundgesamtheit seien Männer und Frauen zu gleichen Anteilen vertreten, zurück, begeht man mit einer Wahrscheinlichkeit von 13,4% einen Irrtum. V141 Gruppe 1 Gruppe 2 Gesamt Test auf Binomialverteilung Asymptotische Beobachteter Signifikanz Kategorie N Anteil Testanteil (2-seitig) MANN 160,46,50,134 a FRAU 189, ,00 a. Basiert auf der Z-Approximation. Abbildung 30.4: Ergebnis des Binomial-Tests für die Variable v Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen und Fälle nicht gewichten, S. 742.
12 750 Kapitel 30 Nichtparametrische Tests Einstellungen des Binomial-Tests bei SPSS Die Einstellungen zum Durchführen eines Binomial-Tests werden in dem Dialogfeld aus Abbildung 30.5 vorgenommen. Um dieses Dialogfeld zu öffnen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS BINOMIAL... Abbildung 30.5: Dialogfeld des Befehls STATISTIK, NICHTPARAMETRISCHE TESTS, BINOMIAL Variablen In der Variablenliste werden lediglich die numerischen Variablen der Datendatei aufgeführt. Um Textvariablen mit einem Binomial-Test zu untersuchen, müssen Sie diese daher zuvor in eine numerische Variable umcodieren. Fügen Sie die zu untersuchenden Variablen in das Feld Testvariablen ein. Wenn Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test durchgeführt. Per Voreinstellung wird die Hypothese untersucht, die beiden Werte der Testvariablen seien in der Grundgesamtheit mit der gleichen Häufigkeit vertreten. Sie können einen anderen Testanteil zugrunde legen (s.u., Abschnitt Testanteil), dieser gilt dann jedoch für alle Testvariablen gleichermaßen. Dichotomie definieren Sie können auch Testvariablen untersuchen, die mehr als zwei unterschiedliche Werte enthalten, diese müssen dann jedoch zu zwei Gruppen zusammengefaßt werden: ¾ Aus den Daten: Behalten Sie diese voreingestellte Option bei, wenn die Testvariable nur zwei unterschiedliche Werte enthält. Es werden dann die Häufigkeiten dieser beiden Werte untersucht.
13 30.4 Sequenzanalyse 751 ¾ Trennwert: Enthält die Testvariable mehr als zwei unterschiedliche Werte, wählen Sie diese Option, und geben Sie einen Trennwert an, der die Werte in zwei Gruppen unterteilt. Alle Werte, die kleiner oder gleich dem Trennwert sind, bilden die eine Gruppe, Werte über dem Trennwert werden zu der zweiten Gruppen zusammengefaßt. Der Trennwert kann insgesamt fünf Zeichen (einschließlich Dezimaltrennzeichen) umfassen. Die Gruppe mit den kleineren Werte wird als erste Gruppe angesehen. Auf diese beziehen sich die Angaben über die erwarteten und realisierten Häufigkeiten. Testanteil Per Voreinstellung wird für die beiden Werte bzw. für die Wertegruppen jeweils eine relative Häufigkeit von 0,5 erwartet. Um diese Voreinstellung zu ändern, geben Sie die erwartete Häufigkeit des ersten Wertes an. Dies ist der Wert, der in der Datendatei als erstes aufgeführt wird. Bei gruppierten Werten ist es dagegen die Gruppe mit den niedrigeren Werten. Sie können eine erwartete Häufigkeit zwischen 0,001 und 0,999 angeben. Der Wert darf insgesamt nur vier Zeichen umfassen, Sie können jedoch die führende null vor dem Dezimaltrennzeichen weglassen. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S Sequenzanalyse Mit der Sequenzanalyse können Sie für eine dichotome Variable - eine Variable mit nur zwei unterschiedlichen Wertausprägungen - bzw. für eine dichotomisierte Variable testen, ob die Werte in zufälliger Reihenfolge auftreten oder ob sie ein Muster aufweisen Interpretation einer Sequenzanalyse Die Erfahrung legt die Vermutung nahe, daß Sonnen- und Regentagen nicht zufällig aufeinanderfolgen. Hat es einen Tag lang geregnet, ist es nicht unplausibel, auch für den kommenden Tag eher Regen als Sonnenschein zu erwarten, sofern nicht bessere Informationen über das Wetter vorliegen. In einem fiktiven Beispiel sei das Wetter an 40 Tagen beobachtet und mit den Werten 0 (Sonnenschein) und 1 (Regen) codiert worden, wobei sich die folgende Sequenz von Sonnen- und Regentagen ergeben habe:
14 752 Kapitel 30 Nichtparametrische Tests Die Datendatei Wetter.sav von der Begleit-CD enthält lediglich eine einzige Variable, die ebenfalls den Namen wetter hat und die dargestellte Wertefolge enthält. Im folgenden soll mit einem Sequenztest untersucht werden, ob vor dem Hintergrund der (fiktiven) Beobachtungen an der Hypothese zufällig aufeinanderfolgender Sonnen- und Regentage festgehalten werden kann. Zum Durchführen des Tests werden die folgenden Einstellungen vorgenommen: ¾ Befehl: Um eine Sequenzanalyse durchzuführen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS SEQUENZEN... ¾ Einstellungen: Verschieben Sie in dem Dialogfeld Sequenzentest die Variable Wetter in das Feld Testvariablen. In der Gruppe Trennwert wird die Option Anderer gewählt und der Wert 1 in das zugehörige Eingabefeld eingegeben. Die übrigen Optionen der Gruppe Trennwert werden abgewählt. Abbildung 30.7, S. 753 zeigt das Dialogfeld mit diesen Einstellungen. Als Ergebnis wird die Tabelle aus Abbildung 30.6 ausgegeben. In der Zeile Testwert wird noch einmal der Wert mitgeteilt, den wir im Dialogfeld als Testwert vorgegeben haben. Die untersuchte Gesamtsequenz umfaßt 40 Werte (Gesamtzahl der Fälle), die sich in 27 Sequenzen unterteilen. Eine Sequenz in diesem Sinne ist eine Folge gleicher Werte. Die ersten fünf Werte der Gesamtsequenz lauten (s.o.). Diese fünf Werte bilden die vier Sequenzen Entsprechend läßt sich die Gesamtsequenz in 27 derartige Sequenzen unterteilen. Sequenzentest Testwert a Gesamte Fälle Anzahl der Sequenzen Z Asymptotische Signifikanz (2-seitig) a. Benutzerdefiniert WETTER ,783,075 Abbildung 30.6: Ergebnis der Sequenzanalyse Auf der Basis dieser Werte wird die Nullhypothese getestet, die Sonnen- und Regentage und damit die Werte 0 und 1 würden in der Grundgesamtheit rein zufällig aufeinanderfolgen. In der Zeile Asymptotische Signifikanz wird das Ergebnis dieses Tests mitgeteilt. Ist die Nullhypothese wahr, ergibt sich eine Folge von Sonnen- und Regentagen, wie sie in der Stichprobe vorliegt, nur mit einer Wahrscheinlichkeit von 0,075 bzw. 7,5%. Umgekehrt bedeutet dies: Weist man die Nullhypothese zurück, begeht man mit einer Wahrscheinlichkeit von 7,5% einen Fehler. Diese Wahrscheinlichkeit ist zwar sehr gering, aber vermutlich noch nicht gering genug, um die Nullhypothese tatsächlich abzulehnen.
15 30.4 Sequenzanalyse 753 Ergibt sich bei einem Test eine noch geringere Irrtumswahrscheinlichkeit, so daß die Nullhypothese zurückgewiesen wird, besagt dies noch nichts über das wahre Muster der untersuchten Daten, das in diesem Fall in dem tatsächlichen Zusammenhang zwischen Sonnen- und Regentagen bestehen würde. Eine geringe Irrtumswahrscheinlichkeit ergibt sich sowohl dann, wenn aufeinanderfolgende Beobachtungen häufig den gleichen Wert aufweisen, als auch in dem Fall, daß sich die Werte häufig abwechseln und damit benachbarte Beobachtungen unterschiedliche Werte enthalten Einstellungen der Sequenzanalyse bei SPSS Zum Durchführen einer Sequenzanalyse dient das Dialogfeld aus Abbildung Um das Dialogfeld zu öffnen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS SEQUENZEN... Abbildung 30.7: Dialogfeld des Befehls STATISTIK, NICHTPARAMETRISCHE TESTS, SEQUENZEN Variablen In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt. Textvariablen können Sie mit einer Sequenzanalyse daher nicht untersuchen, ohne sie zuvor in eine numerische Variable umzucodieren. Verschieben Sie die Variablen, für die eine Sequenzanalyse durchgeführt werden soll, in das Feld Testvariablen. Wenn Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test durchgeführt, die Ergebnisse werden jedoch gemeinsam in einer Pivot-Tabelle dargestellt.
16 754 Kapitel 30 Nichtparametrische Tests Trennwert Sie können mit der Sequenzanalyse auch Variablen untersuchen, die mehr als zwei unterschiedliche Werte enthalten. In diesem Fall müssen die Werte jedoch dichotomisiert, also in zwei Gruppen zusammengefaßt werden. Anstatt der Folge einzelner Werte wird dann die Folge der Gruppenzugehörigkeiten untersucht. Um die Werte zu dichotomisieren, müssen Sie einen Trennwert angeben. Alle Werte der Variablen, die größer oder gleich dem Trennwert sind, werden dann zu einer Gruppe zusammengefaßt, alle Werte, die kleiner sind als der Trennwert, bilden die zweite Gruppe. Die Angabe eines Trennwertes ist auch dann erforderlich, wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält. Die folgenden vier Optionen stehen zur Verfügung, um den Trennwert zu definieren. Die Optionen schließen sich nicht gegenseitig aus. Wenn Sie mehr als eine Option ankreuzen, wird für jeden Trennwert ein eigener Sequenztest durchgeführt. ¾ Median: Das 50%-Perzentil der Variablen bildet den Trennwert. ¾ Modalwert: Der Modus, also der am häufigsten in der Variable vorkommende Wert, wird als Trennwert verwendet. ¾ Mittelwert: Das arithmetische Mittel der Variablen bildet den Trennwert. ¾ Anderer: Mit dieser Option können Sie den Trennwert frei festlegen, indem Sie ihn in das zugehörige Eingabefeld schreiben. Der Wert kann bis zu fünf Zeichen umfassen, zu denen auch ein eventuelles Dezimaltrennzeichen zählt. Diese Option können Sie auch verwenden, wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält. Legen Sie dann den größeren der beiden Werte als Trennwert fest. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S Ein-Stichproben-Kolmogorov-Smirnov-Test Mit dem Kolmogorov-Smirnov-Test können Sie überprüfen, ob die Werte einer Variablen einer theoretischen Verteilung folgen. Dabei können Sie den Test für eine Normal-, Poisson-, Gleich- oder Exponentialverteilung durchführen.
17 30.5 Ein-Stichproben-Kolmogorov-Smirnov-Test Interpretation des Ein-Stichproben-Kolmogorov- Smirnov-Tests In der Datendatei allbus.sav mit den Ergebnissen der Bevölkerungsbefragung ist unter anderem in der Variablen v338 die Dauer des Interviews in Minuten angegeben. Im folgenden soll mit dem Kolmogorov-Smirnov-Test untersucht werden, ob die Annahme, die Dauer des Interviews folge einer Normalverteilung, vor dem Hintergrund der Beobachtungen aus der Stichprobe aufrechterhalten werden kann. ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt auch Notwendigkeit zur Gewichtung der Daten. 349 ¾ Kolmogorov-Smirnov-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS K-S BEI EINER STICHPROBE... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variable v338 in das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen verwendet. Abbildung 30.9, S. 756 zeigt die für dieses Beispiel verwendeten Einstellungen. Die Ergebnisse des Tests werden in Abbildung 30.8 dargestellt. Der Test wird anhand der größten (absoluten) Abweichung der empirischen von der theoretischen Verteilung durchgeführt. Die größte absolute, die größte positive und die größte negative Abweichung der beiden Verteilungen voneinander werden als Extremste Differenzen in der Tabelle ausgewiesen. Zudem werden die Parameter der Normalverteilung angegeben, mit der die empirische Verteilung verglichen wird. Die Parameter einer Normalverteilung sind der Mittelwert und die Standardabweichung. Die ausgewiesenen Werte von 59,26 bzw. 19,41 entsprechen den Werten der Variablen v338 in der betrachteten Stichprobe. Die durchgeführten Interviews dauerten in den neuen Bundesländern somit im Durchschnitt 59,26 Minuten. Das eigentliche Ergebnis des Tests wird in der untersten Zeile mit der Beschriftung Asymptotische Signifikanz angegeben. Dies ist die Irrtumswahrscheinlichkeit, die mit einem Zurückweisen der Nullhypothese verbunden ist. Die getestete Nullhypothese besagt, daß die Dauer des Interviews in der Grundgesamtheit einer Normalverteilung folgt. Die Wahrscheinlichkeit für das Zutreffen der Hypothese wird mit 0,000 angegeben. Die Nullhypothese kann damit zurückgewiesen werden. Trotz dieser geringen Irrtumswahrscheinlichkeit ist es möglich, daß die Werte in der Grundgesamtheit annähernd normalverteilt sind. Dies genügt bereits als Voraussetzung für viele statistische Prozeduren. Um einen Eindruck von der Ähnlich- 349 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen und Fälle nicht gewichten, S. 742.
18 756 Kapitel 30 Nichtparametrische Tests keit der empirischen Verteilung mit der Normalverteilung zu gewinnen, kann zum Beispiel ein Histogramm mit Normalverteilungskurve erstellt werden. Kolmogorov-Smirnov-Anpassungstest N Parameter der Normalverteilung a,b Extremste Differenzen Kolmogorov-Smirnov-Z Asymptotische Signifikanz (2-seitig) Mittelwert Standardabweichung Absolut Positiv Negativ V ,26 19,41,126,126 -,074 2,344,000 a. Die zu testende Verteilung ist eine Normalverteilung. b. Aus den Daten berechnet. Abbildung 30.8: Ergebnis des Kolmogorov-Smirnov-Tests für die Variable v338 zum Testen auf eine Normalverteilung Einstellungen des Kolmogorov-Smirnov-Tests bei SPSS Um einen Kolmogorov-Smirnov-Test bei einer Stichprobe durchzuführen, wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.9 öffnet: STATISTIK NICHTPARAMETRISCHE TESTS K-S BEI EINER STICHPROBE... Abbildung 30.9: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, K-S BEI EINER STICHPROBE
19 30.6 Tests für zwei unabhängige Stichproben 757 Variablen In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt, denn der Kolmogorov-Smirnov-Test ist nur für Variablen mit Intervallskalenniveau sinnvoll durchzuführen. Verschieben Sie die zu testenden Variablen in das Feld Testvariablen. Wenn Sie hier mehr als eine Variablen angeben, wird für jede Variable ein eigenständiger Test durchgeführt. Testverteilung Per Voreinstellung wird ein Test auf Normalverteilung durchgeführt, es stehen jedoch die folgenden vier Verteilungen zur Verfügung: ¾ Normalverteilung: Testet auf eine Normalverteilung mit dem Mittelwert und der Standardabweichung der Stichprobe. ¾ Gleichverteilung: Testet auf eine Gleichverteilung über den gesamten Wertebereich der Testvariablen. ¾ Poissonverteilung: Testet auf eine Poissonverteilung mit dem Mittelwert der Stichprobe. ¾ Exponentialverteilung: Testet auf eine Exponentialverteilung mit dem Mittelwert der Stichprobe. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S Tests für zwei unabhängige Stichproben Insgesamt stehen vier Tests zum Vergleichen zweier unabhängiger Stichproben zur Verfügung. 350 Mit dem Mann-Whitney-Test, dem Kolmogorov-Smirnov-Test und dem Wald-Wolfowitz-Test überprüfen Sie jeweils die Hypothese, die beiden Stichproben würden derselben Grundgesamtheit entstammen. Der Moses-Test vergleicht dagegen die Spannweite der beiden Stichproben. Er testet die Hypothese, die Spannweite sei in beiden Stichproben gleich groß. Der Kolmogorov- Smirnov-Test setzt intervallskalierte Variablen voraus, für die drei übrigen Tests ist Ordinalskalenniveau ausreichend. 350 Zum Begriff von unabhängigen und abhängigen Stichproben siehe Kapitel 19, T-Test.
20 758 Kapitel 30 Nichtparametrische Tests Interpretation der Testergebnisse In den Befragungsdaten der allbus-datei von der Begleit-CD sind unter anderem das Nettoeinkommen (Variable v261) und das Geschlecht der Befragten (v141) angegeben. Im folgenden soll untersucht werden, ob sich die Einkommensangaben von Männern und Frauen so ähnlich sind, daß auf eine einheitliche Grundgesamtheit geschlossen werden kann, oder ob von zwei unterschiedlichen Grundgesamtheiten auszugehen ist. Mann-Whitney-Test Der Mann-Whitney-Test für die beschriebene Fragestellung wird folgendermaßen angefordert: ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt auch die Notwendigkeit zur Gewichtung der Daten. 351 ¾ Test für zwei unabhängige Stichproben aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS ZWEI UNABHÄNGIGE STICHPROBEN... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v261 in das Feld Testvariablen und v141 in das Feld Gruppenvariable ein. Klicken Sie anschließend auf die Schaltfläche Gruppen definieren, 352 und geben Sie in dem damit geöffneten Dialogfeld die Werte 1 und 2 in die beiden Eingabefelder ein. Bei allen anderen Optionen werden die Voreinstellungen verwendet. Dies bedeutet insbesondere, daß in der Gruppe Welche Tests durchführen? die Option Mann-Whitney-U-Test angekreuzt bleibt. Diese Einstellungen, die in dem Dialogfeld in Abbildung auf S. 762 dargestellt sind, liefern den Output aus Abbildung Bei einem Mann-Whitney-Test werden die Werte der beiden Gruppen zunächst zu einer Gruppe zusammengefaßt und in aufsteigender Folge geordnet. Jedem der Werte wird seiner Position in der Ordnung entsprechend ein Rang zugewiesen. Anschließend wird für die beiden Gruppen getrennt die Summe der Rangwerte berechnet. Anhand der beiden sich dabei ergebenden Summen wird die Hypothese getestet, die beiden Stichproben würden der gleichen Grundgesamtheit entstammen. Trifft die Hypothese zu, sollten die Werte der beiden Gruppen in der zu Be- 351 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, wie Sie diese Einstellungen in der Datendatei herbeiführen können. 352 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde und diese aktuell markiert ist.
21 30.6 Tests für zwei unabhängige Stichproben 759 ginn gebildeten Reihenfolge in etwa gleichmäßig verteilt sein, die durchschnittlichen Ränge beider Gruppen sollten also ungefähr die gleiche Größe haben. Ränge Statistik für Test a V261 V141 MANN FRAU Gesamt Mittlerer N Rang Rangsumme , , , , Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) a. Gruppenvariable: V141 V , ,000-4,266,000 Abbildung 30.10: Ergebnis des Mann-Whitney-Tests für zwei unabhängige Stichproben Der durchschnittliche Rang (Mittlerer Rang) für das Einkommen der Frauen liegt mit 86,06 deutlich unter dem mittleren Rang von 121,37, der sich für das Einkommen der Männer ergeben hat. Dies deutet bereits darauf hin, daß die Nullhypothese falsch ist und die beiden Stichproben nicht der gleichen Grundgesamtheit entstammen. Selbst wenn sich sehr ähnliche mittlere Rangwerte ergeben hätten, könnte daraus jedoch noch nicht geschlossen werden, daß die Stichproben aus der gleichen Grundgesamtheit stammen. Es wäre beispielsweise denkbar, daß Männer entweder sehr hohe oder sehr niedrige Einkommen erzielen, während Frauen überwiegend im mittleren Bereich der Einkommensverteilung anzutreffen sind. In diesem Fall würden die durchschnittlichen Rangwerte bei Männern und Frauen ungefähr gleich groß sein, obwohl die tatsächliche Verteilung der Werte sehr unterschiedlich wäre und die beiden Gruppen nicht der gleichen Grundgesamtheit zugeordnet werden könnten. Aus diesem Grund wird neben den durchschnittlichen Rangwerten zusätzlich untersucht, wie häufig ein Wert der ersten Gruppe einem der zweiten Gruppe vorausgeht bzw. wie häufig ein Wert der zweiten Gruppe vor einem der ersten Gruppe angeordnet ist. Die geringere der beiden Häufigkeiten wird in der rechten Tabelle in der Zeile mit der Beschriftung Mann-Whitney-U angegeben. Bei der Berechnung wird für jeden Wert der zweiten Gruppe die Anzahl der Werte aus der ersten Gruppe gezählt, die einen niedrigeren Rang haben. Die so gezählten Werte werden addiert, so daß jeder Wert der ersten Gruppe mehrmals in die Zählung eingehen kann. Beispiel: Bei den vier Werten, die in geordneter Form den beiden Gruppen in der Reihenfolge zuzuordnen sind, gehen drei Werte aus der Gruppe 1 der Gruppe 2 voraus, da der ersten 2 ein Wert der ersten Gruppe und der zweiten 2 zwei Werte der ersten Gruppe vorausgehen. Umgekehrt geht nur ein Wert der zweiten Gruppe den Werten der ersten Gruppe voraus. In der Zeile mit der Beschriftung Wilcoxon-W wird zusätzlich die Summe der Ränge angegeben, die sich für die Gruppe mit der geringeren Fallzahl ergibt, bei diesem Test also für die Gruppe der Frauen. Anhand dieser Werte wird eine Signifikanz für die Nullhypothese berechnet. Für dieses Beispiel wird der Signifikanzwert mit 0,000 angegeben und ist damit kleiner als 0,0005. Bei einer derart niedrigen Irrtumswahrscheinlichkeit kann die
22 760 Kapitel 30 Nichtparametrische Tests Nullhypothese, die Einkommensangaben von Männern und Frauen würden der gleichen Grundgesamtheit entstammen, zurückgewiesen werden. Moses-Test Um die Spannweite der Einkommensangaben von Männern und Frauen aus den neuen Bundesländern zu vergleichen, kann mit einem Moses-Test die Nullhypothese getestet werden, nach der die Spannweiten beider Stichproben in der Grundgesamtheit gleich sind. Um einen solchen Test durchzuführen, können Sie die oben (S. 758) beschriebenen Einstellungen verwenden. Sie müssen lediglich im Hauptdialogfeld der Prozedur die Option Extremreaktionen nach Moses aus der Gruppe Welche Tests durchführen? ankreuzen. Die Ergebnisse dieses Tests sind in Abbildung wiedergegeben. Häufigkeiten V261 V141 MANN (Kontrolle) FRAU (Experimentell) Gesamt N Statistik für Test a,b Beobachtete Spannweite der Kontrollgruppe Spannweite der getrimmten Kontrollgruppe Ausreißer an beiden Enden entfernt a. Moses-Test b. Gruppenvariable: V141 Signifikanz (1-seitig) Signifikanz (1-seitig) V , ,136 4 Abbildung 30.11: Ergebnisse eines Moses-Tests für zwei unabhängige Stichproben In der oberen Tabelle wird lediglich die Anzahl der Fälle für die beiden Gruppen mitgeteilt. Der Moses-Test verwendet eine der beiden Gruppen als Kontrollgruppe. Wie aus der oberen Tabelle hervorgeht, ist dies in diesem Fall die Gruppe der Männer. Die Werte beider Gruppen werden gemeinsam geordnet und der Ordnung entsprechend mit Rangwerten versehen. Für die Kontrollgruppe wird die Spannweite der Rangwerte als Differenz zwischen dem größten und dem kleinsten Rang berechnet. Diese Spannweite wird in der unteren Tabelle in der Zeile Beobachtete Spannweite der Kontrollgruppe mit 203 angegeben. Bei einer Gesamtstichprobe von 204 Fällen bedeutet dies, daß entweder der größte und der zweitkleinste oder umgekehrt der zweitgrößte sowie der kleinste Rang einem Wert der Kontrollgruppe zugeordnet wurde Die Spannweite wird beim Moses-Test von SPSS berechnet als Höchster Rang Niedrigster Rang + 1 und nicht, wie erwartet werden könnte, als Höchster Rang Niedrigster Rang. Die größte erreichbare Spannweite entspricht damit der Anzahl der Beobachtungen.
23 30.6 Tests für zwei unabhängige Stichproben 761 Die Wahrscheinlichkeit dafür, daß sich eine solche Spannweite für die Kontrollgruppe ergibt, wenn die beiden Stichproben (Männer und Frauen) in der Grundgesamtheit die gleiche Spannweite aufweisen, beträgt 78,4%. Dieser Wert wird in der Zeile Signifikanz (1-seitig) für die Beobachtete Spannweite der Kontrollgruppe angegeben. Bei einer derart hohen Irrtumswahrscheinlichkeit kann die Nullhypothese nicht zurückgewiesen werden. Aus der Stichprobe ergibt sich somit kein Hinweis darauf, daß die Einkommenswerte von Männern und Frauen in der Grundgesamtheit eine unterschiedliche Spannweite aufweisen. Bei der Betrachtung von Spannweiten können die Ergebnisse leicht durch einzelne Ausreißer verzerrt werden. Aus diesem Grund wird ein zweiter Signifikanzwert mitgeteilt, der sich auf eine getrimmte Kontrollgruppe bezieht, also auf eine Kontrollgruppe, aus der einige Ausreißer entfernt wurden. In der untersten Zeile der Tabelle wird angegeben, daß an jedem Ende der gesamten Rangordnung (die sowohl Männer als auch Frauen umfaßt) vier Werte entfernt wurden. Damit verringert sich die Fallzahl der Gesamtstichprobe um 8 auf 196. Die Spannweite der Kontrollgruppe hat sich dabei jedoch wesentlich stärker verringert, und zwar um 24 auf 179. Dieser Wert wird als Spannweite der getrimmten Kontrollgruppe ausgewiesen. Die Wahrscheinlichkeit für das Eintreten einer Spannweite dieser Größe beträgt bei Gültigkeit der Nullhypothese nur noch 13,6%. Unter Ausschluß der extremen Werte kann die Nullhypothese damit bei weitem nicht so deutlich bestätigt werden wie bei Einbeziehung der Ausreißer, allerdings läßt sich die Nullhypothese auch bei einer Irrtumswahrscheinlichkeit von 13,6% nicht zurückweisen Einstellungen der Tests für zwei unabhängige Stichproben bei SPSS Um nichtparametrische Tests für zwei unabhängige Stichproben durchzuführen, öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung 30.12: STATISTIK NICHTPARAMETRISCHE TESTS ZWEI UNABHÄNGIGE STICHPROBEN... In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt. Textvariablen können weder als Test- noch als Gruppenvariable verwendet werden, obwohl die Gruppenvariable lediglich Nominalskalenniveau besitzen muß. Um einen oder mehrere der Tests durchzuführen, gehen Sie folgendermaßen vor: ¾ Testvariablen: Geben Sie die Testvariablen in dem gleichnamigen Feld an. Für jede der angegebenen Variablen werden alle angeforderten Tests berechnet. Die Testvariablen müssen mindestens Ordinalskalenniveau besitzen, für die Durchführung eines Kolmogorov-Smirnov-Tests ist sogar Intervallskalenniveau erforderlich. ¾ Gruppierungsvariablen: Verschieben Sie eine Gruppierungsvariable in das Feld Gruppenvariable. Zusätzlich müssen für diese Variable zwei Werte ange-
24 762 Kapitel 30 Nichtparametrische Tests geben werden, die die beiden zu vergleichenden Gruppen (Stichproben) definieren (s.u.). ¾ Tests: Kreuzen Sie die durchzuführenden Tests an. ¾ Optionen: Sie können ergänzende Maßzahlen für die Testvariablen anfordern und den Ausschluß von fehlenden Werten regeln. Abbildung 30.12: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, ZWEI UNABHÄNGIGE STICHPROBEN Gruppierungsvariable Geben Sie eine Gruppierungsvariable an, anhand derer aus den Fällen der Stichprobe zwei Gruppen gebildet werden sollen. Zur Gruppenbildung müssen zwei Werte der Variablen angegeben werden. Fälle, die keinen der angegebenen Werte in der Gruppierungsvariable enthalten, werden von den Tests ausgeschlossen. Von den übrigen Fällen bilden jeweils die Fälle mit den gleichen Werten in der Gruppierungsvariable eine Gruppe. Um die Gruppen zu definieren, verschieben Sie die gruppierende Variable in das Feld Gruppenvariable, und klicken Sie anschließend auf die Schaltfläche Gruppen definieren. Diese Schaltfläche ist nur aktiv, wenn die Variable in dem Feld Gruppenvariable ausgewählt ist. Hierzu müssen Sie die Variable ggf. einmal mit der Maus anklicken. Die Schaltfläche öffnet das Dialogfeld aus Abbildung Abbildung 30.13: Dialogfeld der Schaltfläche Gruppen definieren
25 30.6 Tests für zwei unabhängige Stichproben 763 Geben Sie zwei ganzzahlige Werte zur Gruppenbildung an. Fälle, die keinen der angegebenen Werte aufweisen, werden in den Tests nicht berücksichtigt. Werte mit Dezimalstellen werden auch nicht gerundet oder abgeschnitten. In den Gruppen 1 und 2 ist der Wert 1,4 also nicht enthalten. Die Gruppe des ersten Wertes wird in dem Moses-Test als Kontrollgruppe verwendet. In dem Mann-Whitney- Test bezieht sich der Wert W auf diese Gruppe, sofern beide Gruppen die gleiche Anzahl von Fällen umfassen. Welche Tests durchführen? Per Voreinstellung wird nur der Mann-Whitney-Test durchgeführt, es stehen jedoch die folgende vier Tests zur Verfügung: ¾ Mann-Whitney-U-Test: Nullhypothese: Beide Stichproben entstammen der gleichen Grundgesamtheit. Die Werte beider Gruppen werden gemeinsam in aufsteigender Folge der Werte geordnet und mit Rangwerten versehen. Aus dieser Reihenfolge wird der Wert U berechnet, der angibt, wie häufig der Wert einer Gruppe einem Wert der anderen Gruppe vorausgeht. Zusätzlich wird Wilcoxons W berechnet. Dies ist die Summe der Ränge für die Gruppe mit geringerer Fallzahl. Für diese Werte wird die zweiseitige Wahrscheinlichkeit als Fehlerwahrscheinlichkeit für die Nullhypothese berechnet. Zusätzlich werden die mittleren Ränge beider Stichproben sowie die Anzahl der Fälle in den Gruppen angegeben. Für ein Beispiel siehe oben Mann-Whitney-Test, S ¾ Kolmogorov-Smirnov-Z: Nullhypothese: Beide Stichproben entstammen der gleichen Grundgesamtheit. Dieser Test vergleicht die Verteilungen der beiden Stichproben miteinander. Er reagiert empfindlich auf Unterschiede in Median, Schiefe u.a. Dieser Test erfordert Intervallskalenniveau der Testvariablen. Im Output werden die Fallzahlen der Gruppen, die größten negativen, positiven und absoluten Differenzen, der Kolmogorov-Smirnov-Z-Wert sowie die zweiseitige Wahrscheinlichkeit mitgeteilt. ¾ Extremreaktionen nach Moses: Nullhypothese: Die Spannweite der Werte ist in beiden Gruppen gleich groß. Die Werte beider Gruppen werden in eine gemeinsame Reihenfolge gebracht. Anschließend werden ihnen Rangwerte zugewiesen. Eine der Gruppen (die Gruppe des Wertes, der in dem Dialogfeld Gruppen definieren als erstes angegeben ist) wird als Kontrollgruppe verwendet. Für diese Gruppe wird die Spannweite der Ränge als Differenz zwischen dem größten und kleinsten Rangwert berechnet. Anhand dieser Spannweite errechnet sich die einseitige Signifikanz. Zusätzlich wird der Test ein zweites Mal durchgeführt, wobei die Ausreißer der Gesamtstichprobe ausgeschlossen werden (insgesamt 5% der Fälle). Dabei werden sowohl die höchsten als auch die niedrigsten Ränge entfernt. Das Testergebnis teilt die Anzahl der Fälle beider Gruppen, die Spannweiten und die entsprechenden einseitigen Signifikanzen für beide Tests (mit und ohne Ausreißer) mit. Für ein Beispiel siehe oben Abschnitt Moses-Test, S. 760.
26 764 Kapitel 30 Nichtparametrische Tests ¾ Wald-Wolfowitz-Sequenzen: Nullhypothese: Beide Stichproben entstammen der gleichen Grundgesamtheit. Die Werte beider Gruppen werden in eine gemeinsame Reihenfolge gebracht. Für diese Werte wird eine Sequenzanalyse für die Gruppenzugehörigkeit durchgeführt. Im Output angegeben wird die Anzahl der Fälle in beiden Gruppen, die Zahl der Sequenzen in der Rangfolge, der Z-Wert und die entsprechende Signifikanz. Außerdem wird die Zahl der Rangbindungen ausgewiesen. Sind in der Rangfolge verbundene Fälle enthalten, werden die Höchst- und Mindestzahl der möglichen Sequenzen angegeben. Für beide werden der Z-Wert und die einseitige Signifikanz mitgeteilt. Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S Tests für mehrere unabhängige Stichproben Zum Vergleich mehrerer unabhängiger Stichproben stehen zwei Tests zur Verfügung, der Kruskal-Wallis-Test und der Median-Test. Beide Tests vergleichen die Werte einer Variablen in verschiedenen Fallgruppen der Datendatei miteinander. Jede Fallgruppe bildet im Sinne der Tests eine unabhängige Stichprobe. Die Fallgruppen werden dabei mit Hilfe einer gruppierenden (kategorialen) Variablen aus der Datendatei definiert. Der Median-Test untersucht, ob die verschiedenen Stichproben in der Grundgesamtheit den gleichen Median aufweisen. Er entspricht insofern einem T-Test, der einen Vergleich der Mittelwerte verschiedener Stichproben durchführt. Der Kruskal-Wallis-Test erstellt eine gemeinsame Rangfolge aller Werte der verschiedenen Stichproben und testet anschließend die Nullhypothese, die mittleren Rangzahlen in den einzelnen Gruppen seien gleich. Für beide Tests müssen die Testvariablen mindestens Ordinalskalenniveau aufweisen Interpretation der Testergebnisse Beispiel Im Rahmen der ALLBUS-Umfrage wurde den Befragten unter anderem der in Abbildung wiedergegebene Fragetext mit den ebenfalls aufgeführt Antwortkategorien vorgelegt. Im folgenden soll untersucht werden, ob sich die Antworten von Befragten mit unterschiedlichem allgemeinen Schulabschluß bei dieser Frage unterscheiden. Hierzu werden sowohl ein Median-Test als auch ein Kruskal-Wallis-Test durchgeführt.
27 30.7 Tests für mehrere unabhängige Stichproben 765 Im Vergleich dazu, wie andere hier in Deutschland leben: Glauben Sie, daß Sie Ihren gerechten Anteil erhalten, mehr als Ihren gerechten Anteil, etwas weniger oder sehr viel weniger? 1 Sehr viel weniger 2 Etwas weniger 3 Gerechten Anteil 4 Mehr als den gerechten Anteil Abbildung 30.14: Fragetext und Antwortkategorien für die Variable v30 Die Tests zur Untersuchung der beschriebenen Fragestellungen fordern Sie mit den folgenden Einstellungen an: ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt auch die Notwendigkeit zur Gewichtung der Daten. 354 ¾ Test für mehrere unabhängige Stichproben aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS K UNABHÄNGIGE STICHPROBEN... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v30 (Gerechter Anteil am Lebensstandard?) in das Feld Testvariablen und bildung (Allgemeiner Schulabschluß) in das Feld Gruppenvariable ein. Klicken Sie anschließend auf die Schaltfläche Gruppen definieren, 355 und geben Sie in dem damit geöffneten Dialogfeld den Wert 1 als Minimum und den Wert 3 als Maximum an. Da im folgenden sowohl der Median-Test als auch der Kruskal-Wallis-Test betrachtet werden sollen, werden in der Gruppe Welche Tests durchführen? im Hauptdialogfeld beide Optionen angekreuzt. Die beschriebenen Einstellungen sind in dem Dialogfeld in Abbildung 30.17, S. 768 dargestellt und liefern den Output aus den Abbildung und Kruskal-Wallis-Test Die Ergebnisse des Kruskal-Wallis-Tests sind in Abbildung dargestellt. Die Variable bildung unterscheidet zwischen drei allgemeinen Schulabschlüssen. In der Spalte Mittlerer Rang werden die durchschnittlichen Rangzahlen für diese drei Gruppen ausgegeben. Diese werden berechnet, indem zunächst alle Werte der Testvariablen in eine gemeinsame Rangordnung gebracht werden. Jedem Variablenwert wird dabei ein Rangwert entsprechend seiner Position in der Rangord- 354 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, wie Sie diese Einstellungen in der Datendatei herbeiführen können. 355 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde und diese aktuell markiert ist.
28 766 Kapitel 30 Nichtparametrische Tests nung zugewiesen. Anschließend werden die durchschnittlichen Rangwerte getrennt für die drei Kategorien des Schulabschlusses errechnet. Es ist sehr deutlich, daß die mittleren Rangwerte mit der Höhe des Schulabschlusses ansteigen. Während der durchschnittliche Rangwerte in der Kategorie Hauptschule 154,50 beträgt, hat er in der Kategorie Mittlere Reife einen Wert von 172,65 und in erreicht in der Kategorie Abitur sogar den Wert 202,51. Anhand des Wertes Kruskal-Wallis-H, der annähernd Chi-Quadrat verteilt ist, wird ein Signifikanzwert für die Nullhypothese berechnet, derzufolge die mittleren Ränge in der Grundgesamtheit gleich sind. Diese Signifikanz beträgt im vorliegenden Beispiel 0,010 bzw. 1,0%. Weist man die Nullhypothese gleicher mittlerer Rangwerte der drei Gruppen in der Grundgesamtheit zurück, begeht man folglich mit einer Wahrscheinlichkeit von 1,0% einen Irrtum. Bei einer so geringen Irrtumswahrscheinlichkeit kann die Nullhypothese zurückgewiesen werden, die mittleren Rangwerte der Zufriedenheit mit dem Lebensstandard in den drei unterschiedlichen Schulabschluß-Kategorien sind in der Grundgesamtheit offenbar nicht gleich. Ränge V30 BILDUNG Hauptschule, Polytech. Schule 8. o. 9. Kl., kein Abschluß Mittlere Reife, Fachhochschule, Polytech. Schule 10. Klasse Abitur bzw. Erw. Oberschule Gesamt N , , , Mittlerer Rang Statistik für Test a,b Chi-Quadrat df Asymptotische Signifikanz a. Kruskal-Wallis-Test b. Gruppenvariable: BILDUNG V30 9,249 2,010 Abbildung 30.15: Ergebnisse des Kruskal-Wallis-Tests für mehrere unabhängige Stichproben Median-Test Für den Median-Test hat die Prozedur die Ergebnisse aus Abbildung ausgegeben. Zunächst wurde der Median der Testvariablen für die Gesamtheit der in den Test eingegangenen Fälle berechnet. Dieser Median wird in der unteren Tabelle mit 2 angegeben. Anschließend werden die Werte der einzelnen Gruppen mit dem Gesamtmedian verglichen. Für jede Gruppen wird die Anzahl der Fälle mitgeteilt, deren Werte größer bzw. kleiner sind als der Median aller Fälle. Entstammen die Werte alle der gleichen Grundgesamtheit, sollten die Mediane in den drei Gruppen ungefähr gleich sein. In dem Fall würden auch in jeder Gruppe in etwa die Hälfte der Werte über und die andere Hälfte unter dem Median liegen, der für die Gesamtheit der Fälle berechnet wurde. Für die drei Gruppen aus dem Beispiel trifft dies nicht uneingeschränkt zu. Zunächst ist zu beobachten, daß in jeder Gruppe deutlich mehr Werte kleiner oder gleich dem Median (<=Median) sind als über dem Median liegen. Dies liegt daran, daß insgesamt mit vier Kategorien nur
29 30.7 Tests für mehrere unabhängige Stichproben 767 wenige Gruppen unterschieden werden und der Median mit einer häufig vertretenen Gruppe zusammenfällt. Für den Test ist aber vor allem entscheidend, daß die Verteilung der Werte in den drei Gruppen sehr ähnlich ist, sich die Werte also in ähnlicher Weise auf die beiden Seiten des Medians verteilen. Mit einem Chi-Quadrat-Test wird überprüft, inwieweit die Unterschiede zwischen den Gruppen auf tatsächliche Unterschiede in der Grundgesamtheit hindeuten. Der Signifikanzwert für die Nullhypothese wird mit 0,114% bzw. 11,4% angegeben. Bei einer so hohen Irrtumswahrscheinlichkeit kann die Nullhypothese, derzufolge die Mediane der einzelnen Gruppen der gleichen Grundgesamtheit entstammen (das bedeutet hier einfach, daß die Mediane gleich sind) nicht zurückgewiesen werden. Häufigkeiten V30 > Median < = Median Hauptschule, Polytech. Schule 8. o. 9. Kl., kein BILDUNG Mittlere Reife, Fachhochschule, Polytech. Schule Abitur bzw. Erw. Abschluß 10. Klasse Oberschule Statistik für Test b N Median Chi-Quadrat df Asymptotische Signifikanz V ,00 4,339 a 2,114 a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 14,2. b. Gruppenvariable: BILDUNG Abbildung 30.16: Ergebnisse eines Median-Tests für mehrere unabhängige Stichproben Einstellungen eines Tests für mehrere unabhängige Stichproben bei SPSS Um nichtparametrische Tests für mehrere unabhängige Stichproben durchzuführen, öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung 30.17: STATISTIK NICHTPARAMETRISCHE TESTS K UNABHÄNGIGE STICHPROBEN...
30 768 Kapitel 30 Nichtparametrische Tests Abbildung 30.17: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, K UNABHÄNGIGE STICHPROBEN Das abgebildete Dialogfeld zeigt die für das obige Beispiel verwendeten Einstellungen. In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt, Textvariablen können also auch nicht als Gruppierungsvariablen verwendet werden. Um einen Test für mehrere unabhängige Stichproben durchzuführen, nehmen Sie die folgenden Einstellungen vor: ¾ Testvariablen: Geben Sie in diesem Feld mindestens eine Testvariable an. Die Werte der Testvariablen in verschieden Fallgruppen der Datendatei werden anhand der Tests miteinander verglichen. ¾ Gruppenvariable: Geben Sie hier die gruppierende Variable an. Zusätzlich muß in dem Dialogfeld der Schaltfläche Bereich definieren ein Wertebereich angegeben werden (s.u.). Jeder Wert der Gruppenvariablen innerhalb dieses Bereichs bildet eine Fallgruppe in der Datendatei. ¾ Welche Tests durchführen?: Kreuzen Sie die durchzuführenden Tests an. ¾ Optionen: Hier können Sie zusätzliche Maßzahlen für den Output anfordern und den Ausschluß von Fällen mit fehlenden Werten regeln. Gruppenvariable Geben Sie die Variable, durch deren Werte die Fallgruppen definiert werden sollen, in dem Feld Gruppenvariable an. Um die Gruppen zu definieren, müssen Sie zusätzliche einen Wertebereich festlegen. Jeder ganzzahlige Wert innerhalb dieses Bereichs (einschließlich der Grenzen) bildet eine Fallgruppe und damit eine der zu vergleichenden unabhängigen Stichproben. Um den Wertebereich anzugeben, öffnen Sie mit der Schaltfläche Bereiche definieren das in Abbildung dargestellte Dialogfeld.
31 30.7 Tests für mehrere unabhängige Stichproben 769 Abbildung 30.18: Dialogfeld der Schaltfläche "Bereich definieren für mehrere unabhängige Stichproben Geben Sie in den Feldern Minimum und Maximum die untere und obere Grenze des Wertebereichs an. Jeder ganzzahlige Werte innerhalb dieses Bereichs definiert eine Fallgruppe in der Datendatei. Durch die Angaben in Abbildung werden damit die drei Fallgruppen 1, 2 und 3 definiert. Enthält die Gruppenvariable Werte mit Dezimalstellen, werden diese abgeschnitten. Der Wert 3,9 wird damit noch der Gruppe 3 zugeordnet, auch wenn er bereits außerhalb des angegeben Wertebereichs liegt. Welche Tests durchführen? Für mehrere unabhängige Stichproben stehen die beiden folgenden Tests zur Verfügung: ¾ Kruskal-Wallis H: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. Um die Hypothese zu überprüfen, werden die Werte in eine gemeinsame Rangordnung gebracht. Getestet wird anschließend mit einem χ 2 - Test, ob die durchschnittlichen Rangwerte in den einzelnen Stichproben gleich groß sind. Es werden die durchschnittlichen Ränge sowie die Anzahl der Fälle und außerdem der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz ausgegeben. ¾ Median: Nullhypothese: Die Stichproben entstammen Grundgesamtheiten mit dem gleichen Median. Zunächst wird der Median für die Gesamtheit der Variablenwerte berechnet. Anschließend wird jeweils die Anzahl der Fälle in den einzelnen Gruppen betrachtet, deren Werte größer bzw. kleiner als der Gesamtmedian sind. Bei Gültigkeit der Nullhypothese müßte jeweils die Hälfte der Werte über und die andere Hälfte unter dem Median liegen. Anhand der Abweichungen der beobachteten von den erwarteten Fallzahlen wird ein χ 2 - Test durchgeführt. Im Output werden der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz mitgeteilt, außerdem die Anzahl der Fälle, der Gesamtmedian sowie für die einzelnen Gruppen die Zahl der Fälle mit Werten größer und kleiner oder gleich dem Gesamtmedian.
32 770 Kapitel 30 Nichtparametrische Tests Optionen Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S Tests für zwei verbundene Stichproben Für zwei verbundene Stichproben können Sie mit dem Wilcoxon-Test und dem Vorzeichen-Test überprüfen, ob die beiden Stichproben Grundgesamtheiten mit der gleichen Verteilung entstammen. Mit dem McNemar-Test können Sie für zwei dichotome Variablen untersuchen, ob diese systematische Unterschiede aufweisen. Zwei Stichproben werden als verbunden bezeichnet, wenn ihre Werte gemeinsam und damit paarweise auftreten und inhaltlich zusammenhängen. Werden bei einer Befragung die Personen zum Beispiel nach dem Alter der Mutter sowie nach dem Alter des Vaters gefragt, bilden die beiden Altersangaben zwei verbundene Stichproben, da die einzelnen Werte jeweils paarweise miteinander verbunden sind. Die beiden Werte werden dabei in zwei Variablen, aber im gleichen Fall gespeichert. Bei verbundenen Stichproben bilden also die Werte einer Stichprobe jeweils eine eigene Variable Interpretation des Wilcoxon-Tests Im Rahmen der ALLBUS-Umfrage wurden den Befragten unter anderem die beiden in den Abbildungen und wiedergegebenen Fragen vorgelegt. Im folgenden geht es um den Zuzug verschiedener Personengruppen nach Deutschland. Wie ist Ihre Einstellung dazu? Wie ist es mit Arbeitnehmern aus der Europäischen Union? 1 Der Zuzug soll uneingeschränkt möglich sein. 2 Der Zuzug soll begrenzt werden. 3 Der Zuzug soll völlig unterbunden werden. Abbildung 30.19: Fragetext und Antwortkategorien für die Variable v33 Und wie ist es mit Arbeitnehmern aus Nicht-EU-Staaten, z.b. Türken? 1 Der Zuzug soll uneingeschränkt möglich sein. 2 Der Zuzug soll begrenzt werden. 3 Der Zuzug soll völlig unterbunden werden. Abbildung 30.20: Fragetext und Antwortkategorien für die Variable v34 Im folgenden wird mit einem Wilcoxon-Test untersucht, ob die beiden Variablen in der Grundgesamtheit die gleiche Verteilung aufweisen. Ein solcher Test läßt sich mit den folgenden Einstellungen anfordern:
33 30.8 Tests für zwei verbundene Stichproben 771 ¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur die Personen aus den neuen Bundesländern betrachtet. Damit entfällt auch die Notwendigkeit zur Gewichtung der Daten. 356 ¾ Test für zwei verbundene Stichproben aufrufen: Um den Test aufzurufen, wählen Sie den Befehl STATISTIK NICHTPARAMETRISCHE TESTS ZWEI VERBUNDENE STICHPROBEN... ¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur das Variablenpaar v33 - v34 in das Feld Ausgewählte Variablenpaare ein. Klicken Sie hierzu in der Quellvariablenliste nacheinander auf die Variablen v33 und v34, und verschieben Sie das Paar anschließend mit der Pfeil-Schaltfläche in das Feld Ausgewählte Variablenpaare. Bei den übrigen Optionen werden die Voreinstellungen verwendet. Dies bedeutet insbesondere, daß in der Gruppe Welche Tests durchführen? die Option Wilcoxon angekreuzt bleibt. Die beschriebenen Einstellungen sind in dem Dialogfeld in Abbildung 30.22, S. 772 dargestellt und liefern den Output aus Abbildung Der Wilcoxon-Test vergleicht die Verteilung beider Variablen anhand der Differenzen zwischen den Wertepaaren. Zunächst werden die Differenzen berechnet und nach ihrer absoluten Größe in eine Rangordnung gebracht. Anschließend werden die mittleren Rangzahlen der positiven und der negativen Differenzen berechnet. Die Zahl der positiven und negativen Differenzen sowie ihr durchschnittlicher Rangwert werden in dem Output angegeben. Insgesamt wurden 329 Fälle in den Test einbezogen, davon wiesen 7 Fälle negative und 73 Fälle positive Differenzen auf. In 7 Fällen wurde der Zuzug von EU-Ausländern damit ablehnender beurteilt als der Zuzug von Nicht-EU-Ausländern, in 73 Fälle verhielt es sich genau umgekehrt. 249 Befragte haben den Zuzug der beiden Gruppen von ausländischen Arbeitnehmern gleich bewertet (Bindungen). Nicht nur die Anzahl negativer Differenzen, sondern auch ihr durchschnittlicher absoluter Betrag scheinen etwas kleiner zu sein als die positiven Abweichungen. Der mittlere Rang der sieben negativen Abweichungen ist mit 37,00 angegeben, während der für positive Differenzen 40,84 beträgt. Aufgrund dieser Beobachtungen ergibt sich für die Nullhypothese, derzufolge beide Stichproben einer Grundgesamtheit mit der gleichen Verteilung entstammen, ein Signifikanzwert von 0,000 bzw. 0,0%. Die Nullhypothese kann damit zurückgewiesen werden. Der annähernd standardnormalverteilte Z-Wert, der zur Berechnung der Signifikanz diente, wird ebenfalls ausgewiesen und beträgt -7, In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, wie Sie diese Einstellungen in der Datendatei herbeiführen können.
34 772 Kapitel 30 Nichtparametrische Tests V34 - V33 a. V34 < V33 b. V34 > V33 c. V33 = V34 Negative Ränge Positive Ränge Bindungen Gesamt Ränge N Mittlerer Rang Rangsumme 7 a 37,00 259,00 73 b 40, , c 329 Z Statistik für Test b Asymptotische Signifikanz (2-seitig) V34 - V33-7,238 a a. Basiert auf negativen Rängen. b. Wilcoxon-Test,000 Abbildung 30.21: Ergebnisse eines Wilcoxon-Tests für zwei verbundene Stichproben Einstellungen der Tests für zwei verbundene Stichproben bei SPSS Um einen nichtparametrischen Test für zwei verbundene Stichproben durchzuführen, wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung öffnet. Das abgebildete Dialogfeld zeigt die für das vorhergehende Beispiel verwendeten Einstellungen. STATISTIK NICHTPARAMETRISCHE TESTS ZWEI VERBUNDENE STICHPROBEN... Abbildung 30.22: Dialogfeld des Befehls STATISTIK, NICHTPARAME- TRISCHE TESTS, ZWEI VERBUNDENE STICHPROBEN ¾ Variablen: Geben Sie in dem Feld Ausgewählte Variablenpaare die Paare der jeweils miteinander zu vergleichenden Variablen an. Klicken Sie dafür zunächst nacheinander auf die beiden Variablen eines Paares, und fügen Sie das Paar anschließend durch Klicken auf die Pfeil-Schaltfläche der Liste Ausgewählte Variablenpaare hinzu. Wenn Sie mehrere Variablenpaare angeben, werden die Tests für jedes Paar getrennt durchgeführt.
35 30.8 Tests für zwei verbundene Stichproben 773 ¾ Tests: Per Voreinstellung wird lediglich der Wilcoxon-Test durchgeführt. Möchten Sie andere oder zusätzliche Tests durchführen, kreuzen Sie diese in der Gruppe Welche Tests durchführen? an (s.u.). ¾ Optionen: Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S Dort können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt Optionen, S Welche Tests durchführen? Die folgenden drei Tests stehen für zwei verbundene Stichproben zur Verfügung: ¾ Wilcoxon: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit mit gleicher Verteilung. Der Wilcoxon-Test erstellt eine gemeinsame Rangfolge aller Werte aus den beiden Stichproben. Anschließend vergleicht er die Ränge der einzelnen Wertepaare miteinander. Dazu wird die Differenz zwischen den beiden Rängen eines Paares berechnet und der durchschnittliche Rang für alle positiven sowie für alle negativen Differenzen ermittelt. Anhand des unter der Nullhypothese annähernd standardnormalverteilten Testwertes Z wird die Signifikanz der Nullhypothese ermittelt. Im Output werden für die positiven und negativen Abweichungen sowie für die Fälle ohne Differenzen (Bindungen) die Anzahl der Fälle sowie der mittlere Rangwert angegeben. Außerdem werden der Z-Wert und die Signifikanz mitgeteilt. ¾ Vorzeichen: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit mit gleicher Verteilung. Der Test vergleicht jeweils die Werte der einzelnen Paare miteinander. Er berechnet die Differenzen beider Werte und zählt die Anzahl der positiven und die der negativen Abweichungen. Anschließend wird der bei Gültigkeit der Nullhypothese standardnormalverteilte Z- Wert berechnet und auf diese Weise die Signifikanz der Nullhypothese bestimmt. Die Anzahl der positiven und negativen Abweichungen sowie die Zahl der Fälle mit gleichen Werten in beiden Variablen werden neben dem Z-Wert und der Signifikanz im Output mitgeteilt. ¾ McNemar: Nullhypothese: Unterschiede in den Werten beider Variablen liegen in beiden Richtungen gleichermaßen vor. Der Test untersucht für dichotome Variablen, ob Unterschiede in den Werten beider Variablen in eine Richtung stärker ausgeprägt sind als in die andere. Dieser Test wird insbesondere für Voher/Nachher-Vergleiche verwendet. Der Test betrachtet lediglich die Fälle, in denen sich die Werte beider Variablen unterscheiden. Er erstellt eine 2 2-Tabelle für die dichotomen Werte der beiden Variablen und gibt die Anzahl der Fälle für die vier verschiedenen Wertekombinationen an. Wenn die Unterschiede zwischen den Variablen zufällig sind, müßten die beiden ungleichen Wertekombinationen - in Relation zu der Häufigkeit der einzelnen Werte - mit gleicher Häufigkeit auftreten. Die Nullhypothese wird mit einem χ 2 - Test überprüft. Weisen weniger als 25 Fälle verschiedene Werte auf, wird ein Binomial-Test durchgeführt. Im Output werden die 2 2-Tabelle sowie der χ 2 - Wert und die Signifikanz angegeben.
36 774 Kapitel 30 Nichtparametrische Tests 30.9 Test für mehrere verbundene Stichproben Analog zu den Tests für zwei verbundene Stichproben können Sie auch mehrere verbundene Stichproben daraufhin untersuchen, ob sie derselben Grundgesamtheit entstammen. Mit dem Friedman-Test können Sie für ordinalskalierte Variablen die mittleren Ränge der Variablen vergleichen. Kendalls W wird häufig verwendet, um die Zuverlässigkeit von Gutachtern oder Tests zu überprüfen. Der Test untersucht die Übereinstimmung zwischen verschiedenen Bewertungen. Die Verteilung mehrerer dichotomer Variablen können Sie mit Cochrans Q auf Gleichheit untersuchen. Die Interpretation der Testergebnisse erfolgt dabei ganz analog zu den Tests für zwei verbundene Stichproben. Um nichtparametrische Tests für mehrere verbundene Stichproben durchzuführen, wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung öffnet: STATISTIK NICHTPARAMETRISCHE TESTS K VERBUNDENE STICHPROBEN... Abbildung 30.23: Dialogfeld des Befehls STATISTIK, NICHTPARA- METRISCHE TESTS, K VERBUNDENE STICHPROBEN ¾ Variablen: Verschieben Sie die Variablen, die die einzelnen verbundenen Stichproben repräsentieren, in das Feld Testvariablen. Es müssen mindestens zwei Variablen angegeben werden. Die Angabe dieser Variablen genügt, um die Prozedur auszuführen. ¾ Tests: Kreuzen Sie in der Gruppe Welche Tests durchführen? die gewünschten Tests an (s.u.). ¾ Statistik: Sie können für die Testvariablen zusätzlichen deskriptive Maßzahlen anfordern (s.u.).
37 30.9 Test für mehrere verbundene Stichproben 775 Welche Tests durchführen? ¾ Friedman: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. Betrachtet werden jeweils die Werte der Testvariablen in demselben Fall. Für diese Werte eines Falles wird eine Rangordnung erstellt. Anschließend werden die mittleren Rangzahlen der einzelnen Testvariablen ermittelt. Anhand eines annähernd χ 2 -verteilten Testwertes wird der Signifikanzwert für die Nullhypothese berechnet. Der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz werden im Output mitgeteilt, ebenso wie die Anzahl der Fälle sowie die mittleren Rangzahlen der einzelnen Variablen. ¾ Kendall-W: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. Der Test interpretiert die einzelnen Variablen als verschiedene zu bewertende Sachverhalte und die einzelnen Fälle als unterschiedliche Prüfer oder Tests. Der Test mißt die Übereinstimmung zwischen den Prüfern. Für jeden Fall werden die Werte der Variablen dabei in eine Rangordnung gebracht. Anschließend werden die mittleren Ränge der Variablen ermittelt. Daraus wird Kendalls W sowie ein χ 2 -Wert berechnet. Kendalls W liegt zwischen 0 und 1 und gibt die Stärke der Übereinstimmung an. Bei einem Wert von 0 besteht gar keine, bei einem Wert von 1 perfekte Übereinstimmung. Zu dem χ 2 -Wert wird die Signifikanz mitgeteilt. Neben dem χ 2 -Wert, der Anzahl der Freiheitsgrade und der Signifikanz und Kendalls W werden die Anzahl der Fälle sowie die mittleren Ränge der einzelnen Testvariablen mitgeteilt. ¾ Cochran-Q: Nullhypothese: Die verschiedenen dichotomen Variablen haben dieselbe Verteilung. Bei dichotomen Variablen läuft diese Hypothese darauf hinaus, daß sie denselben Mittelwert haben. Der Test zählt jeweils die Häufigkeiten der einzelnen Werte in den Variablen und berechnet den annähernd χ 2 - verteilten Testwert Q. Cochrans Q, die Anzahl der Freiheitsgrade sowie die Signifikanz werden im Output angegeben. Zusätzlich werden die Anzahl der Fälle und die Häufigkeiten der einzelnen Werte in den Testvariablen mitgeteilt. Statistik Die Schaltfläche Statistik öffnet das Dialogfeld aus Abbildung Abbildung 30.24: Dialogfeld der Schaltfläche Statistik
38 776 Kapitel 30 Nichtparametrische Tests In diesem Dialogfeld können Sie folgende ergänzende Maßzahlen anfordern können: ¾ Deskriptive Statistik: Berechnet für die Testvariablen auf der Basis der in die Tests einbezogenen Fälle den Mittelwert und die Standardabweichung. Zusätzlich werden das Minimum und das Maximum sowie die Anzahl der Fälle mitgeteilt. ¾ Quartile: Für die in die Prozedur einbezogenen Fälle werden die 25%-, 50%- und 75%-Perzentile der Testvariablen angegeben.
5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest
Empirische Wirtschaftsforschung Prof. Dr. Ralf Runde 5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest Ein wesentliches Merkmal nichtparametrischer Testverfahren ist, dass diese im Allgemeinen weniger
Kapitel 35 Histogramme
Kapitel 35 Histogramme In einem Histogramm können Sie die Häufigkeitsverteilung der Werte einer intervallskalierten Variablen darstellen. Die Werte werden zu Gruppen zusammengefaßt und die Häufigkeiten
Kapitel 38 Verteilungsdiagramme
Kapitel 38 Verteilungsdiagramme Mit Verteilungsdiagrammen können Sie grafisch untersuchen, inwieweit die Stichprobenverteilung einer Variablen mit einer theoretischen Verteilung übereinstimmt. So können
Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael
Kapitel 22 Partielle Korrelationen
Kapitel 22 Partielle Korrelationen Bereits im vorhergehenden Kapitel wurden mit der Prozedur KORRELATION, BIVARIAT Korrelationskoeffizienten berechnet. Korrelationskoeffizienten dienen allgemein dazu,
Einfache statistische Auswertungen mit dem Programm SPSS
Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...
Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
Kapitel 39 Sequenzdiagramme
Kapitel 39 Sequenzdiagramme Sequenzdiagramme bilden eine spezielle Form von Liniendiagrammen. Die Besonderheit von Sequenzdiagrammen besteht darin, daß sie stets die einzelnen Werte einer Variablen aus
Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 6 Seite 1 Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische
Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation
Kapitel 40 Zeitreihen: Autokorrelation und Kreuzkorrelation Bei Zeitreihendaten ist häufig das Phänomen zu beobachten, daß die Werte der Zeitreihe zeitverzögert mit sich selbst korreliert sind. Dies bedeutet,
LÖSUNG 2C a. Bei HHEINK handelt es sich um eine metrische Variable.
LÖSUNG 2C a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Bei HHEINK handelt es sich um eine metrische Variable. Bei den Analysen sollen Extremwerte ausgeschlossen werden. Man sollte
fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
Kapitel 8: Verfahren für Rangdaten
Kapitel 8: Verfahren für Rangdaten Der Mann-Whitney U-Test 1 Der Wilcoxon-Test 3 Der Kruskal-Wallis H-Test 4 Vergleich von Mann-Whitney U-Test und Kruskal-Wallis H-Test 6 Der Mann-Whitney U-Test In Kapitel
Kapitel 41 Interaktive Diagramme
Kapitel 41 Interaktive Diagramme Bei den Interaktiven Grafiken handelt es sich um eine Gruppen von Diagrammen, die bei SPSS erst seit der Version 8.0 zur Verfügung stehen. Vom grundlegenden Diagrammtyp
Hypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 2C a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Bei HHEINK handelt es sich um eine metrische Variable. Bei den Analysen sollen Extremwerte ausgeschlossen werden. Man sollte
Angewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
Parametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
Univariate Kennwerte mit SPSS
Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der
Statistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Kapitel 11 Verschmelzen und Aggregieren von Datendateien
Kapitel 11 Verschmelzen und Aggregieren von Datendateien Daten, die in unterschiedlichen Datendateien gespeichert sind, lassen sich nicht unmittelbar gemeinsam analysieren, sondern sie müssen zuvor in
FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)
FH- Management & IT Folie 1 Rückblick Häufigkeiten berechnen Mittelwerte berechnen Grafiken ausgeben Grafiken anpassen und als Vorlage abspeichern Variablenoperationen Fälle vergleichen Fälle auswählen
Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
So berechnen Sie einen Schätzer für einen Punkt
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung
Hypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
UE Angewandte Statistik Termin 4 Gruppenvergleichstests
UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...
Statistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
Aufgaben zu Kapitel 8
Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen Rängen. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.
Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser
Kolmogorov-Smirnov-Test Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz 1 Kolmogorov- Smirnov Test Andrei Nikolajewitsch Kolmogorov * 25.4.1903-20.10.1987 2 Kolmogorov-
Statistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
Statistik K urs SS 2004
Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die
Basis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Statistische Tests
Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Statistische Tests Testentscheidung: Deskriptive Statistik Basis-Kurs Statistik und SPSS für Mediziner 2 Mit Datensatz Daten_SPSS_Kurs_I.sav
Statistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
12 Rangtests zum Vergleich zentraler Tendenzen
12 Rangtests zum Vergleich zentraler Tendenzen 12.1 Allgemeine Bemerkungen 12.2 Gepaarte Stichproben: Der Wilcoxon Vorzeichen- Rangtest 12.3 Unabhängige Stichproben: Der Wilcoxon Rangsummentest und der
Statistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
Sommersemester Marktforschung
Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing [email protected] Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:
Aufgaben zu Kapitel 8
Aufgaben zu Kapitel 8 Aufgabe 1 a) Berechnen Sie einen U-Test für das in Kapitel 8.1 besprochene Beispiel mit verbundenen n. Die entsprechende Testvariable punkte2 finden Sie im Datensatz Rangdaten.sav.
3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
Tabelle 4 : Berechnete Konzeptionen pro Monat aus den Ausgangsdaten Lebendgeburten pro Monat am Beispiel der gesamten Kontrollen.
5 Ergebnisse 5.1 Analyse der Kontrollgruppe 5.1.1 Bestimmung des Konzeptionstermins Entsprechend dem unter 4.2.2 geschilderten Verfahren wurden aus den Ausgangsdaten, d.h. der Aufschlüsselung der Lebendgeburten
Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
Nicht-parametrische Statistik Eine kleine Einführung
Nicht-parametrische Statistik Eine kleine Einführung Überblick Anwendung nicht-parametrischer Statistik Behandelte Tests Mann-Whitney U Test Kolmogorov-Smirnov Test Wilcoxon Test Binomialtest Chi-squared
PROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)
PROC NPAR1WAY zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) Allgemeine Form: PROC NPAR1WAY DATA=name Optionen ; VAR variablenliste ; CLASS
Ergebnisse VitA und VitVM
Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
3.Wiederholung: Toleranzbereiche Für EX Geg:
3.Wiederholung: Toleranzbereiche Für EX Geg: Vl. 24.2.2017 Schätzfunktion für Güte: Ist X Problem: Feb 17 13:21 > Wir berechnen Bereiche (Toleranzbereiche) für sind untere und obere Grenzen, berechnet
6.4 Der Kruskal-Wallis Test
6.4 Der Kruskal-Wallis Test Der Test von Kruskal und Wallis, auch H-Test genannt, ist ein Test, mit dem man die Verteilungen von Teilstichproben auf Unterschiede untersuchen kann. Bei diesem Test geht
PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)
PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der
Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
Online Statistik-Coaching
Online Statistik-Coaching Modul 3 Statistisches Testen - Auswahl der passenden Methode - Durchführung mit SPSS - Interpretation und Darstellung Dipl.-Math. Daniela Keller www.statistik-und-beratung.de
Statistische Messdatenauswertung
Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2
Häufigkeiten Deskriptive Statistiken Häufigkeiten Beruflicher Bildungsabschluss (Mbfbil4) Zielvariablenliste OK Er erscheint: Statistiken beruflicher Bildungsabschluss incl. N Gültig 3445 Fehlend 0 beruflicher
VU mathematische methoden in der ökologie: räumliche verteilungsmuster 1/5 h.lettner /
VU mathematische methoden in der ökologie: räumliche verteilungsmuster / h.lettner / Analyse räumlicher Muster und Verteilungen Die Analyse räumlicher Verteilungen ist ein zentrales Gebiet der ökologischen
Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
Aufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag
Chi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 5 Seite 1 Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test Im Folgenden
3) Testvariable: T = X µ 0
Beispiel 4.9: In einem Molkereibetrieb werden Joghurtbecher abgefüllt. Der Sollwert für die Füllmenge dieser Joghurtbecher beträgt 50 g. Aus der laufenden Produktion wurde eine Stichprobe von 5 Joghurtbechern
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10
Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-
SPSSinteraktiv Signifikanztests (Teil ) - - Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil - t-test bei einer Stichprobe - SPSS-Output Der t-test bei einer Stichprobe wird
Die ungeliebten Verwandten: nicht-parametrische Alternativen
1.1.1. Die ungeliebten Verwandten: nicht-parametrische Alternativen 1.1.1.1. Was zur Hölle? Ted richtet seine Waffe auf Dr. Bob Kelso: Nein, Bob! Das werde ich nicht tun! Nicht nach all dem, was ich durchmachen
Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2
Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2 Dr. Jan-Peter Brückner [email protected] R.216 Tel. 880 4717 Statistischer Schluss Voraussetzungen z.b. bzgl. Skalenniveau und
SBP Mathe Aufbaukurs 1 # 0 by Clifford Wolf. SBP Mathe Aufbaukurs 1
SBP Mathe Aufbaukurs 1 # 0 by Clifford Wolf SBP Mathe Aufbaukurs 1 # 0 Antwort Diese Lernkarten sind sorgfältig erstellt worden, erheben aber weder Anspruch auf Richtigkeit noch auf Vollständigkeit. Das
Analyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
Kapitel 5: Einfaktorielle Varianzanalyse
Kapitel 5: Einfaktorielle Varianzanalyse Durchführung einer einfaktoriellen Varianzanalyse ohne Messwiederholung Dieser Abschnitt zeigt die Durchführung der in Kapitel 5 vorgestellten einfaktoriellen Varianzanalyse
Bereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
Statistische Datenanalyse mit SPSS für Windows
Jürgen Janssen Wilfried Laatz Statistische Datenanalyse mit SPSS für Windows Eine anwendungsorientierte Einführung in das Basissystem und das Modul Exakte Tests Zweite, neubearbeitete Auflage Mit 357 AbbOdungen
Hypothesentests mit SPSS
Beispiel für eine zweifaktorielle Varianzanalyse mit Messwiederholung auf einem Faktor (univariate Lösung) Daten: POKIII_AG4_V06.SAV Hypothese: Die physische Attraktivität der Bildperson und das Geschlecht
Inhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
Kurzanleitung für SPSS Statistics 22
Kurzanleitung für SPSS Statistics 22 im Rahmen des Moduls Betriebssoziologie (Prof. Dr. Christian Ernst) Schritt 1: Variablen definieren (in der Variablenansicht) Daten können direkt in ein "leeres" Datenfenster
Statistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 [email protected] Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
Nicht-parametrische Verfahren 2 unabhängige Stichproben: Mediantest 1/7
unabhängige Stichproben: Mediantest /7 Mediantestprüft unabhängige Stichproben auf Unterschiede in ihrer zentralen Tendenz (ist neben U-Test einenicht-parametrische Entsprechung zum t-test für unabhängige
1 Univariate Statistiken
1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen
Skript 6 Häufigkeiten und Deskriptive Statistiken einer Variablen
Skript 6 Häufigkeiten und Deskriptive Statistiken einer Variablen Ziel: Charakterisierung der Verteilung einer Variablen. Je nach Variablentyp geschieht dies durch Häufigkeitsauszählung und Modus (Nominale
Statistik II Übung 3: Hypothesentests Aktualisiert am
Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier
Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von
Statistik Prüfung 24. Jänner 2008
Statistik Prüfung 24. Jänner 2008 February 10, 2008 Es ist immer nur EINE Antwort richtig, bei falsch beantworteten Fragen gibt es KEINEN Punktabzug. Werden mehrere Antworten bei einer Frage angekreuzt,
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
Bitte am PC mit Windows anmelden!
Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung
Bivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests
Modul 141 Statistik 1. Studienjahr 11. Sitzung Signifikanztests Inhalt der 11. Sitzung 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau
1.5 Berechnung von Rangzahlen
1.5 Berechnung von Rangzahlen Bei vielen nichtparametrischen Verfahren spielen die so genannten Rangzahlen eine wesentliche Rolle, denn über diese werden hier die Prüfgrößen berechnet. Dies steht im Gegensatz
Statistik II: Grundlagen und Definitionen der Statistik
Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 [email protected] Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen
Einführung in Quantitative Methoden
Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Juni 2014 Waldherr / Christodoulides Einführung in Quantitative Methoden 1/46 Anpassungstests allgemein Gegeben: Häufigkeitsverteilung
Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops
Auswertung: Irina Zamfirescu Auftraggeber: Mag. Klaus Brehm Statistische Auswertung (Signifikanzen) Projekt: Evaluation der Langzeitauswirkung des Imago Paartherapie Workshops Fragestellung: Wirkt sich
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen
