Nonparametrische Verfahren

Ähnliche Dokumente
Mehrfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse

Mittelwert und Standardabweichung

Stichprobenumfangsplanung

Signifikanztests zur Prüfung von Unterschieden in der zentralen Tendenz -Teil 1-

Weitere Varianzanalysen

Einführung in Web- und Data-Science

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Korrelation und Regression

ÜBUNGSAUFGABEN ZU INFERENZSTATISTIK II

Parametrische vs. Non-Parametrische Testverfahren

Einführung in die Statistik Einführung

Zusammenfassung. Einführung in die Statistik. Professur E-Learning und Neue Medien. Institut für Medienforschung Philosophische Fakultät

Tabellen und Abbildungen

Kapitel 8: Verfahren für Rangdaten

Mann-Whitney-U-Test für zwei unabhängige Stichproben

Chi-Quadrat Verfahren

Test auf einen Anteilswert (Binomialtest) Vergleich zweier Mittelwerte (t-test)

Deskriptive Statistik Kapitel IX - Kontingenzkoeffizient

Statistik II: Signifikanztests /1

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko

Statistik. Jan Müller

Übersicht über verschiedene Signifikanztests und ihre Voraussetzungen

Biometrische Planung von Versuchsvorhaben

Herzlich willkommen zur Vorlesung Statistik

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Biometrieübung 7 t-test (gepaarte Daten) & Wilcoxon-Test

Tabellen und Abbildungen

Hypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Mittelwertvergleiche, Teil I: Zwei Gruppen

Kapitel 5: Einfaktorielle Varianzanalyse

a) Wie hoch ist die Wahrscheinlichkeit, dass Vokale vorkommen, die länger als 140 ms sind?

Kapitel 7: Varianzanalyse mit Messwiederholung

Modul G.1 WS 07/08: Statistik

Methodik für Linguisten

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Biostatistik Erne Einfuhrung fur Biowissenschaftler

Statistische Tests zu ausgewählten Problemen

Kapitel 5: Einfaktorielle Varianzanalyse

Einführung in die Korrelationsrechnung

Aufgaben zu Kapitel 4

Multivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167

Kapitel 5: Einfaktorielle Varianzanalyse

VS PLUS

Herzlich willkommen zum Thema SPSS

Mathematik für Biologen

Sven Garbade. Statistik 1

Aufgaben zu Kapitel 9

Kapitel 9: Verfahren für Nominaldaten

Statistik III. Einfaktorielle Varianzanalyse (ANOVA), Regressionsanalyse und Verfahren bei Messwiederholung mit SPSS.

Nicht-parametrische Statistik Eine kleine Einführung

t-test Einführung in die Statistik Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät

5. Lektion: Einfache Signifikanztests

Einfache statistische Auswertungen mit dem Programm SPSS

SPSS IV Gruppenvergleiche (>2 Gruppen) A priori & post hoc-tests. H0: Die mittlere Anzahl der Seegräser (µ) hängt nicht von der Seeigel menge ab.

Angewandte Statistik 3. Semester

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Test-Finder. Inhalt. Orientierung im Test-Chaos Dipl.-Psych. Dr. Guido Strunk

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Lösungen zu den Übungsaufgaben in Kapitel 10

Nichtparametrische statistische Verfahren

6. Übung Statistische Tests Teil 1 (t-tests)

Tutorial:Unabhängigkeitstest

Aufgaben zu Kapitel 9

STATISTIK II. Hans-Otfried Müller Institut für Mathematische Stochastik.

Business Value Launch 2006

Statistisches Testen

Einführung in die Statistik Testgütekriterien

Tutorial: Vergleich von Anteilen

Statistik: Planung, Auswertung, Lesen von Meta-Studien

Hypothesentests mit SPSS. Beispiel für einen t-test

Quantitative Methoden Band 2 Einführung in die Statistik für Psychologen und Sozialwissenschaftler

Forschungsmethodik II Mag.rer.nat. M. Kickmeier-Rust Karl-Franzens-Universität Graz. Lisza Gaiswinkler, Daniela Gusel, Tanja Schlosser

Vergleich von Parametern zweier Stichproben

Statistik II. Weitere Statistische Tests. Statistik II

Statistische Methoden in den Umweltwissenschaften

Einführung in die Induktive Statistik: Varianzanalyse

1.3 Das Testen von Hypothesen am Beispiel des Einstichproben t-tests

Mathematische und statistische Methoden I

Klassifikation von Signifikanztests

Kapitel 6: Zweifaktorielle Varianzanalyse

12 Rangtests zum Vergleich zentraler Tendenzen

Statistische Methoden in den Umweltwissenschaften

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Analytische Statistik II

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Alternative Darstellung des 2-Stichprobentests für Anteile

Skript zur Vorlesung Statistik 2

Mathematik 2 für Naturwissenschaften

Bivariate Zusammenhänge

Transkript:

Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Nonparametrische Verfahren

Überblick Einführung Mann-Whitney U-Test Wilcoxon-Test Kruskal-Wallis H-Test Eindimensionaler Chi-Quadrat-Test Zweidimensionaler Chi-Quadrat-Test Vierfelder Chi-Quadrat-Test

Einführung (z. B. Rasch, Friese, Hofmann & Naumann, 014) Parametrische Verfahren (z. B. t-test und Varianzanalyse) vs. nonparametrische Verfahren Vorteile parametrischer Verfahren Einbezug von mehr Informationen bei der Auswertung Höhere Teststärke (in den meisten Fällen) Nachteile parametrischer Verfahren Intervallskalenniveau und Normalverteilung (u. a.) als Voraussetzung Empfehlungen Einsatz parametrischer Verfahren als Regelfall (bei intervallskalierten Daten und hinreichend großen Stichproben) Einsatz nonparametrischer Verfahren bei groben Verletzungen der Annahmevoraussetzungen 3

Mann-Whitney U-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Mann-Whitney U-Test (bzw. U-Test für unabhängige Stichproben): Nonparametrisches Verfahren zur Auswertung einer Studie mit zwei unabhängigen Gruppen (vgl. t-test) Analyse der Rangplätze beim U-Test, der speziell für ordinalskalierte Messwerte geeignet ist Empfehlung: U-Test anstelle des t-tests bei zweifelhaftem Intervallskalenniveau oder nicht vorliegender Normalverteilung oder verletzter Varianzhomogenität 4

Beispiel zur Berechnung eines U-Tests Fiktive Rohdaten zu einer Studie zum seductive detail Effekt Mit seductive details VPN Transfer Rang 1 4.0 8 4.5 7 3 7.0 4 4 3.0 9 5.0 10 Ohne seductive details VPN Transfer Rang 6 7.5 3 7 6.5 5 8 8.5 1 9 5.0 6 10 8.0 Hinweis: SPSS vergibt im Gegensatz hierzu für den niedrigsten Zahlenwert den niedrigsten Rangplatz (d. h. den ersten Platz ) 5

Mann-Whitney U-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Formel zur Überprüfung der Rangplatzunterschiede mittels U-Test: U n 1 n n 1 ( n 1 1) T Für das Beispiel gilt: Anzahl an Versuchspersonen in Gruppe 1 und : Jeweils 5 Rangsumme für Gruppe 1: 8 + 7 + 4 + 9 + 10 = 38 Berechnung: 5(5 1) U 55 38 5 15 38 1 n 1 = Anzahl an Versuchspersonen in Gruppe 1 n = Anzahl an Versuchspersonen in Gruppe T 1 = Rangsumme für Gruppe 1 6

Mann-Whitney U-Test Welcher U-Wert resultiert für den nachfolgenden Datensatz? A: U = 18; B: U = 19; C: U = 38; D: U = 39 VPN EG Rang 1 1 8 3 3 4 6 5 1 6 9 VPN Berechnung: T 1 =39; T =39; U=36+1-39=18; U =36+1-39=18 KG Rang 7 7 8 9 4 10 5 11 10 1 11 Rey.participoll.com A B C D 0 7

Mann-Whitney U-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Statistischer Kennwert U als Summe der Rangplatzüberschreitungen Statistischer Kennwert U als Summe der Rangplatzunterschreitungen U n 1 n Zusammenhang zwischen U und U : U n1 n bzw. Berechnung für das Beispiel: U 55 3 n U ( n 1) T U n1 n n 1 = Anzahl an Personen in Gruppe 1 n = Anzahl an Personen in Gruppe T = Rangsumme für Gruppe U 8

Mann-Whitney U-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Statistische Nullhypothese des U-Tests: U = U Erwarteter U-Wert unter der Nullhypothese: U n 1 n Berechnung für das Beispiel: 55 U 1.5 Je stärker sich der empirische U-Wert (bzw. U ) vom erwarteten U-Wert unterscheidet, desto eher ist das Ergebnis signifikant Beispiel: Ist der Unterschied zwischen und 1.5 signifikant? 9

Mann-Whitney U-Test Zwei Möglichkeiten bei der inferenzstatistischen Entscheidung Nicht signifikant (U emp > U krit ): H 0 wird vorläufig beibehalten Signifikant (U emp U krit ): H 0 wird zugunsten der H 1 verworfen Wichtig: Je kleiner U emp ist, desto eher ist der Test signifikant! Beispiel: Da U emp = U krit = 4 (laut Tabelle für α =.05 (einseitig)) wird H 0 zugunsten der H 1 verworfen, d. h. das Ergebnis ist signifikant Inferenzstatistische Ergebnisdarstellung Signifikantes Ergebnis: Angabe des U-Wertes (alternativ des z-wertes) und des p-wertes sowie der Effektstärke (über z-wert berechenbar) Nicht signifikantes Ergebnis: Zusätzlich Angabe der Teststärke Beispiel: U =, p <.05, r =.69 10

Wilcoxon-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Wilcoxon-Test (bzw. W-Test): Nonparametrisches Verfahren zur Auswertung einer Studie mit zwei abhängigen Stichproben (vgl. t-test für abhängige Stichproben) Beispielsweise für Studien mit Messwiederholung geeignet Analyse der Rangplätze (vgl. U-Test) in vier Schritten: 1. Differenzbildung der Messwertpaare. Ermittlung der Betragswerte zu jeder Paardifferenz 3. Rangreihenbildung zu den Absolutbeträgen der Differenzen 4. Negatives Vorzeichen für alle absoluten Rangplätze, die zu einer negativen Paardifferenz gehören Ergebnis als gerichtete Ränge (engl. signed ranks) bezeichnet Paardifferenzen mit dem Wert 0 nicht berücksichtigen 11

Wilcoxon-Test Fiktive Rohdaten zu einer Studie (vgl. vorherige Sitzung) IQ Basketball Gerichtete Ränge VPN Leistung VPN Leistung VPN Betrag Rang Sheldon 9.5 Sheldon 1.5 Sheldon 8.0 5 Leonard 6.5 Leonard.0 Leonard 4.5 4 Howard 4.5 Howard.5 Howard.0 Rajesh 8.5 Rajesh 7.0 Rajesh 1.5 1 Penny.0 Penny 6.0 Penny 4.0-3 Summe positiver gerichteter Ränge (R positiv ): 5 + 4 + +1 = 1 Summe negativer gerichteter Ränge (R negativ ): -3 1

Wilcoxon-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Betragsmäßig kleinerer Wert entspricht dem Testwert W: W min( Beispiel: W = 3 R positiv, R negativ Kritischer W-Wert für α =.05 (einseitig) laut Tabelle: W krit = 0 Zwei Möglichkeiten bei der inferenzstatistischen Entscheidung Nicht signifikant (W emp > W krit ): H 0 wird vorläufig beibehalten Signifikant (W emp W krit ): H 0 wird zugunsten der H 1 verworfen Wichtig: Je kleiner W emp ist, desto eher ist der Test signifikant! Beispiel: Da W emp = 3 > W krit = 0 wird H 0 vorläufig beibehalten, d. h. das Ergebnis ist nicht signifikant ) 13

Kruskal-Wallis H-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Kruskal-Wallis H-Test (bzw. Rangvarianzanalyse): Nonparametrisches Verfahren zur Auswertung einer Studie mit mehr als zwei unabhängigen Gruppen (vgl. Varianzanalyse) Analyse der Rangplätze analog zum U-Test über die Rangsummen T i Formel zur Berechnung des Testwertes H: H 1 N ( N 1) i1 T n 3( N 1) Bei hinreichend großen Stichproben kann dieser H-Wert mit einem kritischen Chi-Quadrat-Wert (χ ) mit df = p 1 verglichen werden Wenn H χ krit, dann ist das Ergebnis signifikant p i i N = Stichprobenumfang T i = Rangsumme für Gruppe i n i = Anzahl an Personen in Gruppe i 14

Kruskal-Wallis H-Test Welcher H-Wert resultiert für den nachfolgenden Datensatz? A: H = 1.0; B: H = 1.5; C: H = 13.0 Gruppe 1 Gruppe Gruppe 3 VPN Transfer 1 1.0 1.5 3.0 4.5 5 3.0 VPN Transfer 6 3.5 7 4.0 8 4.5 9 5.0 10 5.5 Berechnung: T 1 : 5; T : 1600; T 3 : 45 VPN Transfer 11 6.0 1 6.5 13 7.0 14 7.5 15 8.0 1 H 110 3(15 1) 0.05110 48 60.5 48 1.5 15 (15 1) Rey.participoll.com A B C 0 15

Eindimensionaler Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) χ -Verfahren (Chi-Quadrat-Verfahren) dienen der Analyse nominalskalierter (kategorialer bzw. diskreter) Daten, sprich der Analyse von Häufigkeiten Eindimensionaler χ -Test: Klassifikation von Versuchspersonen anhand eines Merkmals mit zwei oder mehr Stufen Beispiel: Überprüfung, ob signifikant mehr Frauen als Männer an einem Lernexperiment teilgenommen haben Vergleich zwischen beobachteten und erwarteten Häufigkeiten Erwartete Häufigkeiten entsprechen der Nullhypothese Gleichverteilungsannahme: Eine (von vielen möglichen) Nullhypothesen, bei der die erwarteten Häufigkeiten für alle Zellen gleich sind 16

Eindimensionaler Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Beispiel: Geschlechtsverteilung aus dem Artikel von Wang und Yeh (013) zum Einfluss des Sexappeals pädagogischer Agenten: 11 Männer und 163 Frauen (N = 84; 57% ) Berechnung des χ -Wertes: k i1 (f bi f f ei ei ) k f bi f ei N = Anzahl der Kategorien des Merkmals = Beobachtete Häufigkeit in Kategorie i = Erwartete Häufigkeit in Kategorie i = Stichprobenumfang Unter der Gleichverteilungsannahme gilt: Beispiel: f ei = 84 : = 14 1114 16314 14 14 441 14 441 14 fe 1 fe 1 6.1... f ek N k 17

Eindimensionaler Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Bestimmung der Freiheitsgrade durch df = k 1 (z. B. df = 1 = 1) Kritischer χ -Wert für df = 1 und α =.05 (zweiseitig): χ krit 3.84 Inferenzstatistische Entscheidung und Ergebnisdarstellung Da χ emp = 6.1 χ krit = 3.84 wird H 0 wird zugunsten der H 1 verworfen, d. h. das Ergebnis ist signifikant χ (1) = 6.1, p =.01, w = 0.0 Berechnung der Effektgröße w über w = χ : N Konventionen zu w : Effektgröße Kleiner Effekt Mittlerer Effekt Großer Effekt w 0.01 0.09 0.5 18

Zweidimensionaler Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Zweidimensionaler χ -Test: Klassifikation von Versuchspersonen anhand zweier Merkmale mit jeweils zwei oder mehr Stufen Kontingenzanalyse: Spezieller zweidimensionaler χ -Test, bei dem die Unabhängigkeit der untersuchten Merkmale überprüft wird Beispiel: Überprüfung, ob signifikant mehr Frauen als Männer eine Lernaufgabe richtig gelöst haben Fiktive Rohdaten und Randhäufigkeiten zu einer Studie k x l Kreuztabelle Lernaufgabe Männer Geschlecht Frauen Richtig 5 55 Falsch 10 30 Spaltensumme 15 85 Zeilensumme 60 40 100 19

Zweidimensionaler Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Berechnung des χ -Wertes: k l i1 j1 (f bij f f eij eij ) k l f bij f eij N = Anzahl der Kategorien des Merkmals A = Anzahl der Kategorien des Merkmals B = Beobachtete Häufigkeit der Kombination i,j = Erwartete Häufigkeit der Kombination i,j = Stichprobenumfang Bei der Kontingenzanalyse gilt: f eij n n i j N Zeilensumme Spaltensumme N Beispiel: f e11 = (15 60) : 100 = 9 ; f e1 = 51; f e1 = 6; f e = 34 5 9 55 51 10 6 30 34 9 51 6 34 5.3 0

Zweidimensionaler Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Bestimmung der Freiheitsgrade durch df = (k 1) (l 1) Beispiel: df = ( 1) ( 1) = 1 Kritischer χ -Wert für df = 1 und α =.05 (zweiseitig): χ krit 3.84 Inferenzstatistische Entscheidung Da χ emp = 5.3 χ krit = 3.84 wird H 0 wird zugunsten der H 1 verworfen, d. h. das Ergebnis ist signifikant Ergebnisdarstellung: χ (1) = 5.3, p =.0, w = 0.05 1

Vierfelder Chi-Quadrat-Test (z. B. Rasch, Friese, Hofmann & Naumann, 014) Vierfelder χ -Test: Spezialfall des zweidimensionalen χ -Tests auf Unabhängigkeit mit zwei dichotomen Merkmalen, d. h. zwei Merkmalen mit jeweils zwei Stufen x Kontingenztabelle als Versuchsplan: x Kreuztabelle Merkmal A Merkmal B B 1 B A 1 a b A c d Berechnung des χ -Wertes: ( a N ( a d bc) b) ( c d) ( a c) ( b d)

Vierfelder Chi-Quadrat-Test Berechnen Sie den χ -Wert für den nachfolgenden Datensatz mit der Formel zum Vierfelder χ -Test! A: χ = 5.3 B: χ = 3.84 C: χ = 0.64 Berechnung: x Kreuztabelle Lernaufgabe Männer Geschlecht Frauen Richtig 5 55 Falsch 10 30 100(530 5510) (5 55) (10 30) (5 10) (55 30) 100160000 5.3 60401585 Rey.participoll.com A B C 0 3

Beispiele für nonparametrische Verfahren in Fachzeitschriften Quelle: Nievelstein, van Gog, van Dijck und Boshuizen (013) Quelle: Jamet (014) Quelle: Stiller, Freitag, Zinnbauer und Freitag (009) 4

Zusammenfassung Einsatz nonparametrischer Verfahren bei groben Verletzungen der Annahmevoraussetzungen parametrischer Verfahren Mann-Whitney U-Test für Studien mit zwei unabhängigen Gruppen Wilcoxon-Test für Studien mit zwei abhängigen Stichproben Kruskal-Wallis H-Test für Studien mit mehr als zwei unabhängigen Gruppen Chi-Quadrat-Verfahren zur Analyse nominalskalierter Daten, sprich der Analyse von Häufigkeiten 5

Prüfungsliteratur Rasch, B., Friese, M., Hofmann, W., & Naumann, E. (014). Quantitative Methoden : Einführung in die Statistik für Psychologen und Sozialwissenschaftler (4. Aufl.). Heidelberg: Springer. Verfahren für Rangdaten (S. 93-110) Verfahren für Nominaldaten (S. 111-13) 6

Weiterführende Literatur I Bortz, J., & Schuster, C. (010). Statistik für Human- und Sozialwissenschaftler (7. Aufl.). Berlin: Springer. Nicht-parametrische Tests (S. 19-136) Analyse von Häufigkeiten (S. 137-15) Eid, M., Gollwitzer, M., & Schmitt, M. (015). Statistik und Forschungsmethoden (4. Aufl.). Weinheim: Beltz. Vergleich zweier Stichprobenmediane (Wilcoxon-Rangsummen- Test bzw. U-Test) (S. 343-349) Vergleich von Häufigkeitsverteilungen zwischen zwei unabhängigen Stichproben (S. 354-360) Der Zweistichproben-χ -Test (S. 360-365) Test auf Gruppenunterschiede für Rangdaten (Kruskal-Wallis- Test) (S. 454-456) 7

Weiterführende Literatur II Leonhart, R. (013). Lehrbuch Statistik. Einstieg und Vertiefung (3. Auflage). Bern: Huber. Nicht-parametrische Testverfahren (S. 9-58) Sedlmeier, P., & Renkewitz, F. (013). Forschungsmethoden und Statistik: Ein Lehrbuch für Psychologen und Sozialwissenschaftler (. Aufl.). München: Pearson. Verfahren zur Analyse nominalskalierter Daten: Chi-Quadrat (χ -)Tests (S. 539-566) Verfahren zur Analyse ordinalskalierter Daten (S. 567-58) 8