Statistische Tests zu ausgewählten Problemen

Ähnliche Dokumente
Statistik II für Betriebswirte Vorlesung 2

12 Rangtests zum Vergleich zentraler Tendenzen

Klassifikation von Signifikanztests

Statistik II. IV. Hypothesentests. Martin Huber

6.4 Der Kruskal-Wallis Test

Statistik II. Weitere Statistische Tests. Statistik II

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Statistisches Testen

Einfaktorielle Varianzanalyse

Hypothesentests für Erwartungswert und Median. Statistik (Biol./Pharm./HST) FS 2015

Statistik II für Betriebswirte Vorlesung 3

Mathematik für Biologen

3) Testvariable: T = X µ 0

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in Quantitative Methoden

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

3 Grundlagen statistischer Tests (Kap. 8 IS)

Ablaufschema beim Testen

Statistik für Ingenieure Vorlesung 12

Klausur Statistik 2 RE Statistik für Soziologen Do,

Auswertung und Lösung

Das Zweistichprobenproblem

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Stochastik Praktikum Testtheorie

Klassifikation von Signifikanztests

Biometrieübung 7 t-test (gepaarte Daten) & Wilcoxon-Test

Mathematik für Biologen

Tests für Erwartungswert & Median

Blockpraktikum zur Statistik mit R

Nicht-parametrische Statistik Eine kleine Einführung

Kapitel XIV - Anpassungstests

11. Nichtparametrische Tests

Klausur zur Vorlesung

Einführung in Quantitative Methoden

Statistik-Klausur A WS 2010/11

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Statistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Zusammenfassung PVK Statistik

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Ein- und Zweistichprobentests

10. Die Normalverteilungsannahme

Fallzahlplanung bei unabhängigen Stichproben

Klassifikation von Signifikanztests

Kategoriale und metrische Daten

Klassifikation von Signifikanztests

Parametrische vs. Non-Parametrische Testverfahren

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Wahrscheinlichkeitsrechnung und Statistik

S1. a. Drücken Sie allgemein p durch die anderen in der Formel verwendeten Größen aus! Wie groß ist p, wenn a = 0.08, u = 1.96 und n = 120?

Grundlagen der Statistik

Mathematik für Biologen

Statistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/453

Statistik II für Betriebswirte Vorlesung 3

t-differenzentest bei verbundener Stichprobe

Statistik. Jan Müller

Statistik für NichtStatistiker

Statistik II. Statistische Tests. Statistik II

Vorlesung: Statistik II für Wirtschaftswissenschaft

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Gepaarter und ungepaarter t-test. Statistik (Biol./Pharm.) Herbst 2012

Mathematik für Biologen

Teil VIII Hypothesentests für zwei Stichproben

Forschungsstatistik II

Verteilungsfreie Verfahren

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

5.9. Nichtparametrische Tests Übersicht

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Nachklausur zur Vorlesung

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1

das Kleingedruckte...

Mathematik 2 Dr. Thomas Zehrt

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

T-Test für den Zweistichprobenfall

Mathematik für Biologen

Mathematik für Biologen

5. Seminar Statistik

Tests einzelner linearer Hypothesen I

Statistische Tests Übersicht

Vergleich von Parametern zweier Stichproben

Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

1.5 Berechnung von Rangzahlen

Statistik II für Betriebswirte Vorlesung 1

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Empirische Wirtschaftsforschung

Statistik I für Betriebswirte Vorlesung 14

Angewandte Statistik 3. Semester

Transkript:

Einführung in die statistische Testtheorie Statistische Tests zu ausgewählten Problemen Teil 4: Nichtparametrische Tests Statistische Testtheorie IV Einführung Beschränkung auf nichtparametrische Testverfahren Beschränkung auf Tests für Lageunterschiede, Anpassungstests Beschränkung auf Tests im Ein- oder Zwei-Stichprobenfall 2 Statistische Testtheorie IV Kolmogorov- Smirnov- Anpassungstest Mann-Whitney- U-Test Vorzeichenrangtest nach Wilcoxon 3

Nichtparametrische Tests Nichtparametrische Tests Allgemeine Bemerkungen setzen keine speziellen Verteilungsannahmen (z.b. Normalverteilung) voraus lassen sich auch für ordinale und/oder nominale Daten anwenden Voraussetzungen sollten jedoch jeweils überprüft werden (z.b. Symmetrie) aber: schwächere Voraussetzungen = weniger trennscharfe Ergebnisse 4 Kolmogorov-Smirnov-Anpassungstest Voraussetzungen es liegt eine eindimensionale metrische Stichprobe vor x,, x n x,,x n stammen aus einer (unbekannten) stetigen Verteilung ist auch bei kleinen Stichproben anwendbar es existiert auch ein Zweistichprobentest, der überprüft, ob zwei unabhängige Stichproben derselben Verteilung entstammen 5 Kolmogorov-Smirnov-Anpassungstest Voraussetzungen Getestet werden ypothesen bzgl. der unbekannten theoretischen Verteilung F 0 (x) ypothese: 0 : F( x) F0 ( x) : F( x) F0 ( x) für alle x für wenigstens ein x F 0 (x) kann z.b. eine Normalverteilung sein 6 2

Kolmogorov-Smirnov-Anpassungstest Als Schätzer für die Gleichheit der Verteilungsfunktionen verwenden wir den größten vertikalen Abstand zwischen hypothetischer und empirischer Verteilungsfunktion Wir vergleichen beobachtete und unter 0 erwartete Verteilungsfunktion und erhalten als Teststatistik T nd n mit D F ( x) F ( x) n sup 0 x n (F n (x) ist die empirische Verteilungsfunktion) 7 Kolmogorov-Smirnov-Anpassungstest Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.84 8 Kolmogorov-Smirnov-Anpassungstest Bei der Durchführung des Tests vergleichen wir nun die Realisation dieser Teststatistik t nd n mit Quantilen einer d n;-α -Verteilung. ( ist in gängigen Statistik-Lehrbüchern vertafelt). Die (Null-)ypothese wird zum Niveau abgelehnt, falls t d n ; 9 3

Kolmogorov-Smirnov-Anpassungstest Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.86ff Bei einem ersteller von Schrauben für chirurgische Eingriffe wird im Rahmen einer Qualitätskontrolle der Durchmesser der Schrauben überprüft. Es werden n=20 Stück zufällig ausgewählt und der jeweilige Durchmesser in mm gemessen: Zum Niveau =5% soll überprüft werden, ob der Durchmesser der gemessenen Schrauben einer Normalverteilung mit den Parametern μ=0,75 und σ 2 =0,00 entstammt? 0 Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) 2 4

Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) 3 Kolmogorov-Smirnov-Anpassungstest (Fortsetzung) Die Annahme, dass der Durchmesser der gemessenen Schrauben einer Normalverteilung mit den Parametern μ=0,75 und σ 2 =0,00 entstammt, kann zum Niveau =5% nicht verworfen werden.. 4 Voraussetzungen es liegt eine eindimensionale ordinale Stichprobe vor x,, x n bei Vorliegen (einer) metrischskalierten Beobachtungsreihe kann zu Rangdaten übergegangen werden nichtparametrische Alternative zum Einstichproben-t-Test (auch für verbundene Stichproben) 5 5

Voraussetzungen Getestet werden (ein- und zweiseitige) ypothesen 0 : F0 ist symmetrisch um einen Wert 0 Die (exakte) Teststatistik T berechnet sich aus der Summe der (positiven) Rangzahlen, im Falle von Bindungen werden gemittelte Rangzahlen vergeben (Midranks) Im Falle größerer Stichproben (n>50) kann eine approximativ normalverteilte Teststatistik verwendet werden 6. Bilde die transformierten Werte x i * = x i μ 0 (Ist x i *= 0 so wird dieser Wert nicht berücksichtigt). Vergebe Rangzahlen für die Werte x i * ohne Berücksichtigung des Vorzeichens (ggf. bei Bindungen gemittelte Rangzahlen) 2. Weise den Rangzahlen das Vorzeichen der zugehörigen Originalbeobachtung zu (signed ranks) 3. Berechne T = T + = die Summe aller positiven Rangzahlen 7 Im Falle großer Stichproben errechne T als T T n( n ) / 4 T n( n )(2n ) / 24 E( T Var( T ) ) keine Bindungen bzw. als T 24 T n( n ) / 4 n( n )(2n ) 2 g t ( )( j j t j t j ) mit Bindungen g= Anzahl der gebundene Gruppen; t j = Anzahl Elemente in dieser Gruppe 8 6

Bei der Durchführung des Tests vergleichen wir nun die Realisation dieser Teststatistik n 50 T mit den kritischen Werten w n;α des Tests n > 50 T mit Quantilen der Standardnormalverteilung. ( sind in gängigen Statistik-Lehrbüchern vertafelt). 9 0 : F0 ist symmetrisch um einen Wert 0 0 verwerfen, falls T + > w n;-α bzw. falls T > u -α/2 02 : F 0 ist symmetrisch um einen Wert 0 02 verwerfen, falls T + < w n;α bzw. falls T < u α/2 03 : F0 ist symmetrisch um einen Wert 0 03 verwerfen, falls T + > w n;-α/2 oder T + < w n;α/2 bzw. falls T > u -α/2 20 Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.246ff Es wird bei n= Probanden ein psychologischer Test durchgeführt und die erzielten Punktzahlen der Ergebnisbewertung in einer Tabelle notiert. Zum Niveau =5% soll überprüft werden, ob die gemessenen Werte symmetrisch ti um μ 0 =6 Punkte liegen ( 03 ) Es müssen also zunächst die transformierten Werte x i * = x i μ 0 = x i 6 berechnet und dann die entsprechenden Rangzahlen vergeben werden 2 7

Damit ist T + = Summe aller positiven Ränge = 53 22 03 : F0 ist symmetrisch um einen Wert 0 03 verwerfen, falls T + > w n;-α/2 oder T + < w n;α/2 bzw. falls T > u -α/2 d.h. die Nullhypothese (Symmetrie um μ 0 = 6 Punkte) kann bei α = 5% = 0,05 nicht verworfen werden. 23 approximative Lösung 24 8

approximative Lösung 25 Quelle: Rasch et al.(2006 )Quantitative Methoden 2, Springer, S.63 Ein Therapeut überprüft die Wirksamkeit einer Entspannungstechnik. Vor und nach der Übung geben die Patient(inn)en auf einer Skala von bis 9 an, wie (zunehmend) entspannt sie sich fühlen. Zum Niveau =% soll überprüft werden, ob die gemessenen Werte symmetrisch um μ 0 0 liegen ( 0 ) ier liegt der Fall verbundener Stichproben (Vorher-Nachher- Messungen) vor. Es müssen also zunächst die Differenzen der beiden Messreihen berechnet und dann die die transformierten Werte x i * = x i μ 0 = x i 0 bestimmt sowie die entsprechenden Rangzahlen vergeben werden. 26 Damit ist T + = Summe aller positiven Ränge = 34,5 27 9

0 : F0 ist symmetrisch um einen Wert 0 0 verwerfen, falls T + > w n;-α bzw. falls T > u -α/2 w 8;0,99 = 33 < 34,5 = T + d.h. die Nullhypothese (Symmetrie um μ 0 0 Punkte) kann bei α = % = 0,0 verworfen werden. 28 Allgemeine Bemerkungen Es liegt zwei Stichprobe vom Umfang n bzw. n 2 vor, bei der zwei (mindestens) ordinale Merkmale X und Y beobachtet werden. bei Vorliegen (einer) metrischskalierten Beobachtungsreihe kann zu Rangdaten übergegangen werden Man interessiert sich dafür, ob die beiden Merkmale einen Lageunterschied aufweisen nichtparametrische Alternative zum Zweistichproben-t-Test (für unabhängige Stichproben) 29 Voraussetzungen Getestet werden (ein- und zweiseitige) ypothesen : F F2 (bzw. F F2 oderf F2 ) 0 Den Stichprobenwerten aus beiden Stichproben werden insgesamt Ränge zugeordnet, im Falle von Bindungen werden gemittelte Rangzahlen vergeben (Midranks) Die Teststatistik T berechnet sich aus der Summe der Rangzahlen, die in der ersten Stichprobe vergeben werden Wilcoxon-Rangsummen-Test 30 0

. Vergebe (gemeinsame) Rangzahlen für die Werte x i und y i (ggf. bei Bindungen gemittelte Rangzahlen) 2. Summiere die Rangzahlen der ersten Stichprobe auf n T r r i i 3. Falls n,n 2 > 20: berechne T approx T approax T / 2 n ( n n /2n n ( n n 2 2 2 ) ) 3 Alternative Berechne U = Anzahl aller Paare (x i,x 2i ) mit x i < x 2i U heißt Mann-Whitney-Statistik. Es ist T n n2 n ( n ) U 2 32 Bei der Durchführung des Tests vergleichen wir nun die Realisation dieser Teststatistik n 20 T mit den kritischen Werten w nn2;α des Tests n > 20 T approx mit Quantilen der Standardnormalverteilung. ( sind in gängigen Statistik-Lehrbüchern vertafelt). 33

: F ( x) F2 (x) 0 0 verwerfen, falls T < w n,n2;α/2 oder T > w n,n2;-α/2 bzw. falls T approx > u -α/2 : F ( x ) F 2(x) () 02 02 verwerfen, falls T > w n,n2;-α bzw. falls T approx > u -α : F ( x) F2 (x) 03 03 verwerfen, falls T < w n,n2;α oder T approx < u α 34 Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.53ff Um die Wirkung von Vitamin B auf die Wachstumsförderung von Pilzen festzustellen, wurden von 24 Pilzen 3 (Stichprobe ) zufällig ausgewählt Pilze mit Vitamin B behandelt. Die restlichen Pilze (Stichprobe 2) blieben ohne Behandlung (Kontrolle). Zum Niveau =5% soll überprüft werden, ob die Behandlung mit Vitamin B zu (signifikant) höherem Gewicht führt. : F ( x) F2 (x) 02 35 Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.53ff Es müssen nun zunächst alle Werte sortiert und dann die entsprechenden Rangzahlen vergeben werden 36 2

Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.246ff T= Summe Ränge Behandlung = 220 37 02 verwerfen, falls T > w n,n2;-α w n,n2;-α = 9 Tabelle Quelle: artung/elpelt/klösener (985): Statistik. Oldenbourg, S.246ff T=220 > 9= w n,n2;-α 02 α = 0,05 zu verwerfen. Die Behandlung mit B führt zu signifikanten Ergebnissen, d.h. zu höherem Gewicht. 38 Statistische Testtheorie IV Im Mehrstichprobenfall (> 2): Kruskal-Wallis-Test für Lageunterschiede bei unabhängigen Stichproben Friedman-Test für Lageunterschiede bei abhängigen Stichproben 39 3

Statistische Testtheorie IV Literatur: artung J, Elpelt B & Klösener K (2002) :Statistik. 3. Aufl. Oldenbourg, München Ostermann R & Wolf-Ostermann K (2005): Statistik. 3. Aufl. Oldenbourg, München Rasch B, Friese M, ofmann W & Naumann E (2006): Quantitative Methoden 2. 2. Aufl. Springer, eidelberg. 40 4