Einführung in Web- und Data-Science

Ähnliche Dokumente
Thema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population

Mathematische und statistische Methoden II

Statistik II. IV. Hypothesentests. Martin Huber

Parametrische vs. Non-Parametrische Testverfahren

Statistisches Testen

Mathematische und statistische Methoden II

Jost Reinecke. 7. Juni 2005

Statistik II: Signifikanztests /1

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

Einführung in Quantitative Methoden

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

T-Test für unabhängige Stichproben

SozialwissenschaftlerInnen II

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Mathematische und statistische Methoden II

Der χ 2 -Test (Chiquadrat-Test)

Einführung in Quantitative Methoden

Anhang: Statistische Tafeln und Funktionen

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

Hypothesentests mit SPSS. Beispiel für einen t-test

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Lösungen zu den Übungsaufgaben in Kapitel 10

Bereiche der Statistik

Statistik II Übung 3: Hypothesentests

5. Seminar Statistik

3 Grundlagen statistischer Tests (Kap. 8 IS)

Vergleich von Parametern zweier Stichproben

9 Prinzipien der statistischen Hypothesenprüfung

Ergebnisse VitA und VitVM

9 Prinzipien der statistischen Hypothesenprüfung

Analyse von Querschnittsdaten. Signifikanztests I Basics

Klassifikation von Signifikanztests

Prüfen von Unterschiedshypothesen für ordinale Variablen: Mann-Whitney Test und Ko

Modul G.1 WS 07/08: Statistik

a) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Inferenzstatistik und Hypothesentests. Hierbei geht es um die Absicherung eines Untersuchungsergebnisses gegen ein Zufallsereignis.

Bereiche der Statistik

Prüfung aus Statistik 2 für SoziologInnen

Der χ2-test Der χ2-test

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Kategoriale und metrische Daten

Vorlesung: Statistik II für Wirtschaftswissenschaft

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Konkretes Durchführen einer Inferenzstatistik

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

Schließende Statistik

Statistik-Quiz Wintersemester

J. Bortz/N. Döring: Forschungsmethoden und Evaluation (jeweils neueste Auflage) Springer, Berlin S. 463ff

WS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest

Alternative Darstellung des 2-Stcihprobentests für Anteile

Statistische Methoden in der MMST: Schließende Statistik

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2016

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Statistik II Übung 3: Hypothesentests Aktualisiert am

Inhaltsverzeichnis Einführung und deskriptive Statistik Grundlagen der Inferenzstatistik 1: Zufallsvariablen

3) Testvariable: T = X µ 0

Statistik II für Betriebswirte Vorlesung 1

Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung IV: Konfidenzintervalle // Normalverteilungstests

Statistische Methoden in den Umweltwissenschaften

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

12 Rangtests zum Vergleich zentraler Tendenzen

Mathematische und statistische Methoden II

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Statistik I für Betriebswirte Vorlesung 14

Sven Garbade. Statistik 1

Hypothesentests II. Statistik I. Sommersemester Klausur Wiederholung t-tests. Zusammenfassung. Statistik I Hypothesentests I (1/37)

Statistik K urs SS 2004

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

Unterschiedshypothesen für maximal 2 Gruppen, wenn die Voraussetzungen für parametrische Verfahren nicht erfüllt sind

Chi-Quadrat Verfahren

Winter 2017 David Kurbel. Evaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung II: t-tests

Inferenzstatistik verstehen

5. Lektion: Einfache Signifikanztests

Einfaktorielle Varianzanalyse

Aufgaben zu Kapitel 3

Klausur Wiederholung t-tests. Zusammenfassung. Hypothesentests II. Statistik I. Sommersemester Statistik I Hypothesentests I (1/37)

Statistik und Wahrscheinlichkeitsrechnung

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Statistik und Wahrscheinlichkeitsrechnung

Hypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15

Analyse 2: Hypothesentests

Statistische Methoden in den Umweltwissenschaften

6.4 Der Kruskal-Wallis Test

Anpassungstests VORGEHENSWEISE

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Statistik I für Betriebswirte Vorlesung 14

Grundlagen der Statistik

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

Transkript:

Einführung in Web- und Data-Science Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Tanya Braun (Übungen)

P-Wert (einseitiger Ablehnungsbereich) Hypothesentest H 0 vs. H 1 Wie extrem ist der auf Basis der erhobenen Daten berechnete Wert der Teststatistik? Wahrscheinlichkeit, bei Gültigkeit von H 0 den bestimmten oder einen extremeren Wert der Teststatistik zu erhalten In manchen Veröffentlichungen wird leider α als p-wert bezeichnet! [Wikipedia}

Danksagung Nachfolgende Materialen sind mit Änderungen übernommen aus: Vorlesung Statistik (WS08/09) aus dem Studiengang Psychologie and der Universität Freiburg 3

Unterschiedshypothesen Sind Frauen ängstlicher als Männer? Unterscheiden sich die Mittelwerte von zwei Gruppen? Unabhängige Stichproben Ist der Mittelwert der Ängstlichkeit nach einer Therapie größer als vor der Therapie? Unterscheidet sich der Mittelwert einer Stichprobe zu zwei Messzeitpunkten? Abhängige Stichproben Liegt der mittlere IQ einer Gruppe über 100? Unterscheidet sich der Mittelwert einer Gruppe von einem vorgegeben Wert? Test bzgl. Gruppe 4

Unterschiedshypothesen: Unabhängige Stichproben Unterscheiden sich die Mittelwerte von zwei Gruppen? Differenz der Mittelwerte zweier Stichproben: D x = x 1 - x Schätze die bedingte Wahrscheinlichkeit : p D H ) Wenn p < α, wird H 0 verworfen und H 1 angenommen Stichprobenkennwerteverteilung: Verteilung der Mittelwertsdifferenzen unter H 0 0.4 Wie verteilen sich empirische 0.3 Mittelwertsdifferenzen, wenn 0. man sehr oft Stichproben zieht? 0.1 ( x 0 0.0 Verteilung von Mittelwertsdifferenzen bei großen Stichproben normalverteilt -10-5 0 5 10 x 1 x

Standardfehler der Kennwerteverteilung Hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab: s ˆ s x -x = + N ˆ ˆ1 s 1 N 1 Benötigt, um gefundene Mittelwertsdifferenz interpretieren zu können

t-verteilung Empirische Mittelwertsdifferenz durch Standardfehler dividiert ergibt sog. t-verteilung x ( ) 1 - x t df = df ˆ s x -x 1 Die genaue Form der t-verteilung hängt von deren Freiheitsgraden (df = degree of freedom) ab df = N N 1 + - Bei df >10 nahezu identisch mit z-verteilung Je kleiner df, desto schmalgipfliger die t-verteilung Die Herleitung der Dichtefunktion und der kumulativen Funktion erfolgt später

Der t-test für unabhängige Stichproben einseitiger Test (gerichtete H 0 ) 0.4 0.3 0. 0.1 H 0 H 1 p = 1- zweiseitiger Test (ungerichtete H 0 ) Hier wird 1-α als p-wert bezeichnet! 0.4 0.3 0. 0.1 0-3 - -1 0 1 3 H 1 H 0 p = 1-0 -3 - -1 0 1 3 t krit H 1 t krit

Entscheidung über die Nullhypothese Mittels einer t-tabelle wird der empirische t-wert interpretiert Dazu wird ein kritischer t-wert aus der t-tabelle entnommen Der kritische t-wert hängt dabei ab: von den Freiheitsgraden, von dem gewählten α-niveau von der Art des Tests (einseitig vs. zweiseitig) Der kritische t-wert definiert die Grenze des Bereichs für den empirischen t-wert, ab dem H 0 verworfen wird

Die t-verteilung df p=.800 p=.900 p=.950 p=.975 p=.990 p=.995 1 1,376 3,078 6,314 1,706 31,81 63,657 1,061,90,90 4,303 6,965 9,95 3 0,978,353,353 3,18 4,541 5,841 4 0,941,13,13,776 3,747 4,604 5 0,90,015,015,571 3,365 4,03 6 0,906 1,943 1,943,447 3,143 3,707 7 0,896 1,895 1,895,365,998 3,499 8 0,889 1,860 1,860,306,896 3,355 9 0,883 1,833 1,833,6,81 3,50 10 0,879 1,81 1,81,8,764 3,169 0 0,860 1,75 1,75,086,58,845 30 0,854 1,697 1,697,04,457,750 40 0,851 1,684 1,684,01,43,704 50 0,849 1,676 1,676,009,403,678 60 0,848 1,671 1,671,000,390,660 70 0,847 1,667 1,667 1,994,381,648 80 0,846 1,664 1,664 1,990,374,639 90 0,846 1,66 1,66 1,987,368,63 100 0,845 1,660 1,660 1,984,364,66 00 0,843 1,653 1,653 1,97,345,601 1000 0,84 1,646 1,646 1,96,330,581 0.4 0.3 0. 0.1 p= 1-0 -3 - -1 0 1 3 Kritische t-werte: α =.05, einseitig, df=100: t krit (100) = 1.66 α =.05, zweiseitig, df=100: t krit (100) = 1.98 α =.01, einseitig, df=100: t krit (100) =.36 t krit

Der t-test für unabhängige Stichproben Entscheidungsregeln Einseitiger Test: Wenn t emp > t krit wird H 0 verworfen Zweiseitiger Test Wenn t emp > t krit wird H 0 verworfen In der t-tabelle werden immer Werte für den einseitigen Test angegeben. Für einen -seitigen Test muss t krit so gewählt werden, dass ein Bereich von α/ von der Verteilung abgeschnitten wird

Voraussetzungen (1) Intervallskalenniveau der Variable () Normalverteilung des Merkmals in der Grundgesamtheit (3) Varianzhomogenität (Gleiche Varianzen des Merkmals in beiden Populationen) (4) Unabhängigkeit der Stichproben

Normalverteilung des Merkmals in Grundgesamtheit Normalverteilungsannahme für X statistisch überprüfbar Kolmogorov-Smirnov-Test: X~N(μ,σ) ist H 0 Sortiere Stichprobendaten x T = [x 1, x ] nach x 1 aufsteigend Bestimme maximale Differenz D der kumulativen Verteilungen Vergleiche ob D > KS-Wert bzgl. gewähltem Signifikanzniveau α (KS-Wert aus KS-Tabelle bestimmbar) Herleitung der KS-Tabelle in höherem Semester x 1

Varianzhomogenität Auch Varianzhomogenität kann statistisch überprüft werden (Levene-Test) Testverteilung für Levene-Test wird später hergeleitet Bei einem signifikanten Ergebnis (p <.05), werden die Freiheitsgrade des Tests korrigiert df mit corr = c 1 c (1 - c ) + N -1 N -1 = 1 ˆ s x ˆ s 1 x 1 + ˆ s x

Zusammenfassung: t-test für unabhängige Stichproben (1) Formulierung der (inhaltlichen und statistische) Hypothesen gerichtet oder ungerichtet? () Erfassung des Merkmals in zwei unabhängigen Stichproben (3) Berechnung der Mittelwerte in beiden Stichproben (4) Schätzung der Populationsvarianz (5) Berechnung des Standardfehlers der Mittelwertsdifferenz (6) Berechnung des empirischen t-werts (7) Bestimmung des kritischen t-werts aus df, α, und Art des Tests (8) Entscheidung für H 0 oder H 1

Unterschiedshypothesen Teil 16

Unterschiedshypothesen: Abhängige Stichproben Ziehung eines Merkmalsträgers in die erste Stichprobe beeinflusst die Zugehörigkeit eines Merkmalsträgers zur zweiten Stichprobe Werte zweier Stichproben paarweise zugeordnet. Beide Teilstichproben immer gleich groß! Messwiederholung Gleiches Merkmal zweimal (oder mehrmals) bei den gleichen Personen erhoben Parallelisierung Jeweils ähnliche Personen einander zugeordnet Matching Jeder Person der Stichprobe 1 ist einer Person der Stichprobe zugeordnet

Abhängige Stichproben: Beispielrechnung Verändert sich die Einstellung zum Studienfach Informatik innerhalb der ersten 6 Wochen des Studiums? Abh. Variable: Einstellung zum Studium Informatik (Wertebereich 5 bis 5) Unabh. Variable: Messzeitpunkt (1. Woche vs. 6. Woche) Versuchsperson 1. Woche 6. Woche 1 16 0 18 19 3 3 3 4 14 16 mean 19.67 18.98

Beispielrechnung Für jede Person kann die Differenz der Messwerte berechnet werden (Einstellungsänderung) Vp 1. Woche 6. Woche D=x -x 1 1 16 0 4 18 19 1 3 3 3 0 4 16 14 - mean 19.67 18.98.68

Hypothesen Die statistischen Hypothesen des t-tests für abhängige Stichproben beziehen sich auf den Mittelwert der Differenzen aller Personen Vorteil: Es ist nun unerheblich, ob innerhalb der Messzeitpunkte große Varianz gegeben ist. Ungerichtete Hypothese: H 0 : μ d = 0 H 1 : μ d 0 Gerichtete Hypothese (1): H 0 : μ d 0 H 1 : μ d > 0 Gerichtete Hypothese (): H 0 : μ d 0 H 1 : μ d < 0

Standardfehler und t-wert Um die empirisch gefundene Differenz beurteilen zu können, wird der Standardfehler benötigt ˆ s = x d ˆ s x d N mit i= 1 ˆ s xd = N å ( x di - x N -1 d ) Basierend auf korrigierter Stichprobenvarianz Mit dem Standardfehler kann nun ein empirischer t-wert berechnet werden: t df t x ˆ s ( ) d df = mit df = N -1 x d

Standardfehler und t-wert Im Beispieldatensatz: Es ergibt sich : t ˆ s x d x d N = 0.68 =.78 = 60.78 ˆ = = 60 s xd t 59 0.68 0.36 0.36 ( 59 ) = = 1. 89

Kritischer t-wert & Interpretation T emp,59 = 1.89 T krit,59 =? Offene Fragestellung ð zweiseitiger Test α =.05 Interpretation: t emp < t krit Also: Kein bedeutsamer Unterschied! df p=.800 p=.900 p=.950 p=.975 p=.990 p=.995 1 1,376 3,078 6,314 1,706 31,81 63,657 1,061,90,90 4,303 6,965 9,95 3 0,978,353,353 3,18 4,541 5,841 4 0,941,13,13,776 3,747 4,604 5 0,90,015,015,571 3,365 4,03 6 0,906 1,943 1,943,447 3,143 3,707 7 0,896 1,895 1,895,365,998 3,499 8 0,889 1,860 1,860,306,896 3,355 9 0,883 1,833 1,833,6,81 3,50 10 0,879 1,81 1,81,8,764 3,169 0 0,860 1,75 1,75,086,58,845 30 0,854 1,697 1,697,04,457,750 40 0,851 1,684 1,684,01,43,704 50 0,849 1,676 1,676,009,403,678 60 0,848 1,671 1,671,000,390,660 70 0,847 1,667 1,667 1,994,381,648 80 0,846 1,664 1,664 1,990,374,639 90 0,846 1,66 1,66 1,987,368,63 100 0,845 1,660 1,660 1,984,364,66 00 0,843 1,653 1,653 1,97,345,601 1000 0,84 1,646 1,646 1,96,330,581

Eingruppen t-test Ziel: Vergleich des Mittelwerts einer Stichprobe mit einem vorgegebenen (konstanten) Wert. Beispiele: - Es wir überprüft, ob eine bestimmte Personengruppe sich in ihrer Intelligenz vom Populationsmittelwert (100) unterscheidet. - Es wird überprüft, ob sich die tatsächliche Studiendauer von der Regelstudienzeit unterscheidet. - Es wird überprüft, ob sich die Differenz von Reaktionszeiten unter zwei Bedingungen von Null unterscheidet.

Eingruppen t-test Voraussetzungen Normalverteilung des Merkmals Intervalskalenniveau des Merkmals Es handelt sich um eine Zufallsstichprobe

Eingruppen t-test Statistische Hypothesen Ungerichtete Hypothese: H 0 : μ = c H 1 : μ c Gerichtet Hypothese (1): H 0 : μ c H 1 : μ > c Gerichtet Hypothese (): H 0 : μ c H 1 : μ < c

Standardfehler und t-wert Berechnung des Standardfehlers sˆ = x sˆ x N Berechnung des t-werts t ( df = N -1) = x - c sˆ x

Beispiel Liegt der IQ der Kinder, die als hochbegabten klassifiziert werden, wirklich über dem Populationsmittelwert (100)? Hypothesen: H 0 : μ 100 H 1 : μ > 100 Stichprobenkennwerte bei N=10: Mittelwert: 108.50 Standardabweichung: 14.35 14.35 s ˆ = = 4.54 ( ) 108.5-100 t 9 = = 1. 87 x 10 4.54

Beispiel t emp (9) = 1.87 t krit (9) =? Gerichtete Fragestellung ð einseitiger Test α =.05 Interpretation: t emp > t krit H 0 wird verworfen df p=.800 p=.900 p=.950 p=.975 p=.990 p=.995 1 1,376 3,078 6,314 1,706 31,81 63,657 1,061,90,90 4,303 6,965 9,95 3 0,978,353,353 3,18 4,541 5,841 4 0,941,13,13,776 3,747 4,604 5 0,90,015,015,571 3,365 4,03 6 0,906 1,943 1,943,447 3,143 3,707 7 0,896 1,895 1,895,365,998 3,499 8 0,889 1,860 1,860,306,896 3,355 9 0,883 1,833 1,833,6,81 3,50 10 0,879 1,81 1,81,8,764 3,169 0 0,860 1,75 1,75,086,58,845 30 0,854 1,697 1,697,04,457,750 40 0,851 1,684 1,684,01,43,704 50 0,849 1,676 1,676,009,403,678 60 0,848 1,671 1,671,000,390,660 70 0,847 1,667 1,667 1,994,381,648 80 0,846 1,664 1,664 1,990,374,639 90 0,846 1,66 1,66 1,987,368,63 100 0,845 1,660 1,660 1,984,364,66 00 0,843 1,653 1,653 1,97,345,601 1000 0,84 1,646 1,646 1,96,330,581

Vergleich der 3 Arten des t-tests unabhängige Stichproben abhängige Stichproben Eingruppen t-test Fragestellung Unterscheiden sich die Mittelwerte von zwei Gruppen? Unterscheiden sich die Mittelwerte zu zwei Messzeitpunkten? Unterscheidet sich der Mittelwert von einem Vergleichswert? Voraussetzungen Intervallskalenniveau Normalverteilung Varianzhomogenität Unabhängige Stichproben Intervallskalenniveau Normalverteilung Abhängige Stichproben Intervallskalenniveau Normalverteilung Eine Zufallsstichprobe

Vergleich der 3 Arten des t-tests Ungerichtete Hypothese Unabhängige Stichproben Abhängige Stichproben H 0 : μ 1 = μ H 0 : μ d = 0 H 1 : μ 1 μ H 1 : μ d 0 Eingruppen t-test H 0 : μ = c H 1 : μ c Gerichtete Hypothese H 0 : μ 1 μ H 0 : μ d 0 H 1 : μ 1 > μ H 1 : μ d > 0 H 0 : μ c H 1 : μ > c

Vergleich der 3 Arten des t-tests Unabhängige Stichproben Abhängige Stichproben Eingruppen t-test Kennwert des Tests x1 - x xd x - c Standardfehler des Kennwerts s ˆ s x -x = + N ˆ ˆ1 s 1 N 1 ˆ s = x d ˆ s x d N ˆ s = x ˆ s x N t-wert t x1 - x = ˆ s x 1 -x t = x d ˆ s x d t = x - c sˆ x Freiheitsgrade df = N + N df =N -1 df =N -1 1 -

Vergleich der 3 Arten des t-tests Kritischer t- Wert hängt ab von H 0 wird verworfen, wenn H 0 wird verworfen, wenn Unabhängige Stichproben df α Art des Tests (1- vs. seitig) Abhängige Stichproben df α Art des Tests (1- vs. seitig) Eingruppen t-test t emp > t krit t emp > t krit t emp > t krit p <.05 (-seitiger Test) p/ <.05 (1-seitiger Test) p <.05 (-seitiger Test) p/ <.05 (1-seitiger Test) df α Art des Tests (1- vs. seitig) p <.05 (-seitiger Test) p/ <.05 (1-seitiger Test)

Nonparametrische Testverfahren Definition: Nonparametrische (verteilungsfreie) Verfahren Keine bestimmte Verteilungsformen des erfassten Merkmals vorausgesetzt (z.b. Normalverteilung) Nonparametrische Verfahren werden eingesetzt ð Für die Analyse von ordinal- oder nominalskalierten Variablen ð Wenn die Normalverteilungsannahme verletzt ist Parametrische Verfahren dürfen nur verwendet werden, wenn die beteiligten Variablen die geforderte Verteilungsform ausweisen (z.b. Normalverteilung für den t-test) Dann aber meist mehr "Aussagekraft" (Power)

Der χ² -Test Der χ²-test ( Chi-Quadrat-Test ) dient dem Vergleich von beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt werden, wenn 1 oder nominalskalierte unabhängige Variablen vorliegen. Beispiele: Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung? Leisten hoch-ängstlich und gering-ängstliche Personen gleich häufig Hilfe in einer Notsituation?

Der χ² -Test Voraussetzung für den χ² -Test (Faustregeln) (1) Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit kleiner als 5. () Keine Zelle weist eine erwartete Häufigkeit kleiner als 1 auf. Wenn diese Voraussetzungen nicht erfüllt sind, gibt es andere Tests (später behandelt)

Der χ² -Test χ² -Test Beispiel 1 Es soll geprüft werden, ob die Verteilung von Männern und Frauen in einer Gruppe signifikant von einer Gleichverteilung abweicht. N = 76 (Frauen: 56; Männer: 0) Statistische Hypothesen H 0 : π(frau) = π(mann) H 1 : π(frau) π(mann)

Der χ² -Test Schritt 1: Zunächst werden die nach der H 0 zu erwarteten Häufigkeiten berechnet: Beobachtet: N F = 56; N M =0 Erwartet:??? Gesamtzahl: 76 Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu erwarten.

Der χ² -Test Schritt : Nun wird der (empirische) χ²-wert berechnet: c df = k -1 = k å ( f - f ) b, i f i= 1 e, i mit: k: Anzahl der Stufen der beiden Variablen f b,i : Beobachtete Häufigkeit in der Zelle (i) f e,i : Erwartete Häufigkeit in der Zelle (i) e, i Merkmal Auspr. 1... Auspr. k Beobachtet f b,1 f b,k Erwartet f e.1 f e,k

Der χ² -Test Geschlecht Frau Mann Beobachtet 56 0 76 Erwartet 38 38 76 c df = k -1 = ( ) k f - å b, i fe, i f i= 1 e, i c df = ( 56-38) ( 0-38) 18 (-18) 1 = + = + = 8.53 + 8.53 = 17.05 38 38 38 38

Der χ² -Test Schritt 3: Vergleich des empirischen χ²-werts mit dem kritischen χ²-wert. Der kritische χ²-wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-niveau aus einer Tabelle zur χ²-verteilung abgelesen Für α=.05 ergibt sich bei df=1: c c emp krit = 17.05 = 5.0 Die H 0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden.

Der χ² -Test χ² -Test Beispiel Geschlecht Angst Frau Mann gering 5 14 39 hoch 33 6 39 58 0 78 Frage: Ist die (relative) Häufigkeit hoher bzw. geringer Ängstlichkeit bei Männern und Frauen gleich? Statistische Hypothesen H 0 : π(angst Frau) = π(angst Mann) H 1 : π(angst Frau) π(angst Mann)

Der χ² -Test Schritt 1: Zunächst werden aus den Randsummen die nach der H 0 zu erwarteten Häufigkeiten geschätzt: Beobachtet: f Geschlecht b( i.) fb(. j) fe( i, j) = Angst Frau Mann N N gering 5 14 39 fb( i.) fb(. j) hoch 33 6 39 = 58 0 78 N N Erwartet: Geschlecht Angst Frau Mann gering 9 10 39 hoch 9 10 39 58 0 78

Der χ² -Test Schritt : Nun wird der (empirische) χ²-wert berechnet: c df = ( k -i) ( l-1) = ( ) k l f - åå b( i, j) fe( i, j) i= 1 j= 1 e( i, j) f mit: k, l: f b(i,j) : f e(i,j) : Anzahl der Stufen der beiden Variablen Beobachtete Häufigkeit in der Zelle (i,j) Erwartete Häufigkeit in der Zelle (i,j)

Der χ² -Test Beobachtet: Geschlecht Angst Frau Mann gering 5 14 39 hoch 33 6 39 58 0 78 Erwartet: Geschlecht Angst Frau Mann gering 9 10 39 hoch 9 10 39 58 0 78 c df = ( k -1) ( l-1) = ( ) k l f - åå b( i, j) fe( i, j) i= 1 j= 1 e( i, j) f c df = 1 = = ( 5-9) ( 33-9) ( 14-10) ( 6-10) + + 9 9 0.55 + 0.55 + 1.60 + 1.60 = 10 4.30 + 10

Der χ² -Test Schritt 3: Vergleich des empirischen χ²-werts mit dem kritischen χ²-wert. Der kritische χ²-wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-niveau aus einer Tabelle zur χ²-verteilung abgelesen (Leonhart, S.448f). Für α=.05 ergibt sich bei df=1: c c emp krit = = 4.30 3.84 Die H 0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden.

Überblick weitere Verfahren: Stichproben Nominaskalen Nominalskalen Unabhängig χ² Test Fisher-Yates-Test Abhängig McNemar-Test Cochran-Test Ordinalskalen Mediantest U-Test (Mann-Whitney) H-Test (Kruskal & Wallis) Vorzeichen-Test Vorzeichen-Rang-Test (Wilkoxon) Friedman-Test

Zusammenfassung Nonparametrische Testverfahren können, wenn a) die vorliegenden Daten kein Intervallskalenniveau aufweisen oder b) die Normalverteilungsannahme der parametrischen Tests verletzt ist. Der χ²-test überprüft, ob beobachtete und erwartete Häufigkeiten signifikant voneinander abweichen.