Kolmogorov-Smirnov-Test Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz 1
Kolmogorov- Smirnov Test Andrei Nikolajewitsch Kolmogorov * 25.4.1903-20.10.1987 2
Kolmogorov- Smirnov Test Wladimir Iwanowitsch Smirnov * 10.6.1887-11.2.1974 3
Einleitung Statistischer Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen zwei Zufallsvariablen die gleiche Verteilung besitzen eine Zufallsvariable einer Wahrscheinlichkeitsverteilung folgt (Kolmogorov- Smirnov- Anpassungstest) 4
Einleitung NVT als Voraussetzung für viele statistische Verfahren Überprüfung mittels KSA 5
Einleitung Kolmogorov- Smirnov: n <50 n >50: Chi- Quadrat Nichtparametrischer Test stabil unanfällig 6
Kolmogorov- Smirnov- Test Stetig verteilte metrische Merkmale Diskrete Merkmale Rangskalierte Merkmale Weniger Trennschärfe 7
Kolmogorov- Smirnov- Test Nullhypothese H0: Fx(x) = F0(x) Alternativhypothese H1: Fx(x) F0(x) 8
Kolmogorov- Smirnov- Test p < 0.05: keine Normalverteilung Zahlenreihen stammen nicht aus derselben Verteilung 9
Kolmogorov-Smirnov Smirnov-Test Berechnung per Hand 10
Bsp. für händische Berechnung 8 Zeitangaben (= n), die auf Normalverteilung geprüft werden sollen 200, 198, 390, 215, 171, 160, 150, 224 11
Vorgehensweise 1. Tabelle aufstellen x z Ф(z) f d x = die zu testenden Werte z = z-werte Ф(z) = Flächenstücke unter Normalverteilungskurve f = gleiche Abstände der Flächenstücke d = absolute Differenzen 12
Vorgehensweise x 150 160 171 198 200 215 224 390 2. Werte in eine aufsteigende Reihenfolge bringen 200, 198, 390, 215, 171, 160, 150, 224 13
Vorgehensweise x z Ф(z) 150-0.84 0.200 160-0.70 0.242 171-0.56 0.288 198-0.20 0.421 200-0.18 0.429 215 0.02 0.508 224 0.14 0.556 390 2.32 0.990 3. dazugehörige z-werte ausrechnen 4. gemäß der z-tabelle Flächenstücke unter der Normalverteilungskurve Ф(z) ermittelten 14
Vorgehensweise f 0.125 0.250 0.375 0.500 0.625 0.750 0.875 1.000 Flächenstücke unter der Normalverteilungskurve sollten bei idealer Normalverteilung gleiche Abstände haben: erzeugt durch Division mit Fallzahl n ( = 8 ) 5. f berechnen f = i/n i = 1,, n 15
Vorgehensweise Ф(z) f d 0.200 0.125 0.075 0.242 0.250 0.008 0.288 0.375 0.087 0.421 0.500 0.079 0.429 0.625 0.196 0.508 0.750 0.242 0.556 0.875 0.319 0.990 1.000 0.010 6. Berechnung der absoluten Differenzen: d = ІФ(z) - fі 16
Vorgehensweise x z Ф(z) f d 150-0.84 0.200 0.125 0.075 160-0.70 0.242 0.250 0.008 171-0.56 0.288 0.375 0.087 198-0.20 0.421 0.500 0.079 200-0.18 0.429 0.625 0.196 215 0.02 0.508 0.750 0.242 224 0.14 0.556 0.875 0.319 390 2.32 0.990 1.000 0.010 17
Vorgehensweise Ф(z) f d 0.200 0.125 0.075 0.242 0.250 0.008 0.288 0.375 0.087 0.421 0.500 0.079 0.429 0.625 0.196 0.508 0.750 0.242 0.556 0.875 0.319 0.990 1.000 0.010 Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov- Smirnov-Test a = 0.319 18
Vorgehensweise Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov-Smirnov-Test a = 0.319 kritischen Wert ermitteln: in Tabelle nachschauen (bei n = 8) 19
Kritische Werte n 3 0.708 4 0.624 5 0.563 6 0.519 7 0.483 8 0.454 9 0.430 10 0.409 11 0.391 12 0.375 kritischer Wert 20
Vorgehensweise Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov-Smirnov-Test a = 0.319 in Tabelle nachschauen (bei n = 8) kritischer Wert = 0.454 a < a crit normalverteilt 21
Kolmogorov-Smirnov Smirnov-Test mit SPSS 22
Kolmogorov-Smirnov Smirnov-Test mit SPSS Menüpunkt ANALYSIEREN Aus den Alternativen NICHTPARAMETRISCHE TESTS wählen Auswahlpunkte, die sich rechts öffnen, K-S BEI EINER STICHPROBE wählen 23
Kolmogorov-Smirnov Smirnov-Test mit SPSS Testvariable auswählen, welche auf Normalverteilung überprüft werden. Achtung: links unten unter Testverteilung darauf achten, dass der Punkt Normal angewählt ist. OK anklicken Bildschirmausgabe wie folgende: 24
Kolmogorov-Smirnov Smirnov-Test mit SPSS 25
Kolmogorov-Smirnov Smirnov-Test mit SPSS Hier sind für uns die folgenden Werte wichtig: N (in diesem Falle 8), Extremste Differenzen (0,320) und Asymptotische Signifikanz. Nun vergleichen wir diese beiden ersten Werte mit einer Tabelle für den Kolmogorov-Smirnov-Test. 26
Kolmogorov-Smirnov Smirnov-Test mit SPSS Die nachfolgende Tabelle gibt bei einer 5 % Irrtumswahrscheinlichkeit Grenzwerte für Stichproben an, bei denen n zwischen 1-35 liegt. 27
Kolmogorov-Smirnov Smirnov-Test mit SPSS 28
Kolmogorov-Smirnov Smirnov-Test mit SPSS Wir suchen nun den Wert für N = 8 und sehen dort die Zahl 0,454. Falls die Extremste Differenz in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine Normalverteilung vor. 29
Kolmogorov-Smirnov Smirnov-Test mit SPSS In unserem Fall haben wir jedoch eine Extremste Differenz von nur 0,32. Das Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer Standardverteilung nicht verworfen werden muss. 30
Kolmogorov-Smirnov Smirnov-Test mit SPSS Auch unser Wert für die Asymptotische Signifikanz ist weit größer als der Grenzwert 0,05. Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % Signifikanzniveau). 31
Kolmogorov-Smirnov Smirnov-Test mit SPSS Da unser Wert jedoch deutlich darüber liegt, kann die Hypothese einer Normalverteilung auf diesem Signifikanzniveau nicht verworfen werden. 32
Kolmogorov-Smirnov Smirnov-Test mit SPSS Achtung: Der Kolmogorov-Smirnov-Test benötigt, v.a. bei kleinen Stichproben, extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen. 33
Kolmogorov-Smirnov Smirnov-Test mit SPSS SPSS Syntax NPAR TEST /K-S (normal) = variable. 34
Vielen Dank für Ihre Aufmerksamkeit! 35