Der χ2-test Der χ2-test

Ähnliche Dokumente
Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ 2 -Test (Chiquadrat-Test)

Statistisches Testen

Alternative Darstellung des 2-Stcihprobentests für Anteile

Tutorial:Unabhängigkeitstest

Chi-Quadrat Verfahren

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Statistik Einführung // Kategoriale Daten 10 p.2/26

Tutorial: Anpassungstest

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Grundlagen der Statistik

Aufgaben zu Kapitel 9

Statistik II: Signifikanztests /1

Analytische Statistik II

Alternative Darstellung des 2-Stichprobentests für Anteile

Hypothesentests mit SPSS

Aufgaben zu Kapitel 9

5. Seminar Statistik

Modul G.1 WS 07/08: Statistik

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Alternative Darstellung des 2-Stichprobentests für Anteile

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

Statistische Methoden in den Umweltwissenschaften

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen

Tutorial: χ 2 -Test auf vorgegebene Verteilung

Alternative Darstellung des 2-Stichprobentests für Anteile

Aufgaben zu Kapitel 9

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Vorlesung: Statistik II für Wirtschaftswissenschaft

Klassifikation von Signifikanztests

SozialwissenschaftlerInnen II

Zwei kategoriale Merkmale. Homogenität Unabhängigkeit

9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Chi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge

Statistische Tests (Signifikanztests)

Biometrieübung 11 Kontingenztafeln

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen

Kreuztabellenanalyse. bedingte Häufigkeiten

Ergebnisse VitA und VitVM

Bivariate Verteilungen

Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen

Einführung in Web- und Data-Science

Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Chi Quadrat-Unabhängigkeitstest

Klassifikation von Signifikanztests

Statistik II. Statistische Tests. Statistik II

Analyse von Kontingenztafeln

Statistische Tests funktionieren generell nach obigem Schema; der einzige Unterschied besteht in der unterschiedlichen Berechnung der Testgröße.

Angewandte Statistik 3. Semester

Einführung in Quantitative Methoden

Anpassungstests VORGEHENSWEISE

11. Zusammenhangsmaße für nominale Variablen

"Korrelation" bei Nominaldaten: Kontingenz

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Kapitel 9: Verfahren für Nominaldaten

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Statistik II. Weitere Statistische Tests. Statistik II

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).

Mehrere kategoriale Merkmale

Im ersten Schritt müssen die Daten in die Datenansicht eingelesen werden.

Einfache Varianzanalyse für unabhängige Stichproben

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Einführung in die Induktive Statistik: Testen von Hypothesen

4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

Klassifikation von Signifikanztests

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Wiederholung. Statistik I. Sommersemester 2009

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Englisch Französisch 13 7

Statistische Tests Version 1.2

Statistik II (Sozialwissenschaften)

r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings

Test auf den Erwartungswert

Einführung in Quantitative Methoden

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Parametrische vs. Non-Parametrische Testverfahren

T-Test für unabhängige Stichproben

Tabelle 4 : Berechnete Konzeptionen pro Monat aus den Ausgangsdaten Lebendgeburten pro Monat am Beispiel der gesamten Kontrollen.

= 0.445, also annähernd die Hälfte aller Männer zugelassen 557

Mathematik 2 für Naturwissenschaften

Klassifikation von Signifikanztests

Ablaufschema beim Testen

Mathematik für Biologen

Statistik Prüfung 24. Jänner 2008

Transkript:

Der χ 2 -Test

Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln hier die folgenden Varianten den χ 2 -Anpassungs- oder Verteilungstest (Goodness-of-fit-Test) den χ 2 -Unabhängigkeitstest

Beispiel 1 (χ 2 -Anpassungstest) Die Fragestellung Schokoladenlinsen einer bestimmten Marke haben Zuckerüberzüge in den Farben rot, grün, blau gelb und braun. Unterscheiden sich in den Packungen die Häufigkeiten der Farben signifikant von der Gleichverteilung?

Beispiel 1 (χ 2 -Anpassungstest) Schritt 1: Formulierung der Hypothesen H 0 : Die relativen Häufigkeiten aller Farben sind gleich gross; d. h. p 1 = p 2 = p 3 = p 4 = p 5 = 0.2 H 1 : Die Häufigkeit mindestens einer Farbe weicht von 0.2 ab. Bei mehr als zwei Kategorien, gibt es unterschiedliche Formen der Abweichung. Daher ist eine Unterscheidung in ein- und zweiseitige Tests nicht sinnvoll.

Beispiel 1 (χ 2 -Anpassungstest) Schritt 2: Die Stichprobe In einem zufällig ausgewählten Geschäft wird eine Packung gekauft und die Farben der Bonbons ausgezählt. Dies ergibt die beobachteten Häufigkeiten (b): Farbe rot grün blau gelb braun Anzahl (b i ) 29 23 21 32 20 Da es sich um insgesamt 125 Bonbons handelt, würden wir bei Gleichverteilung jeweils 25 Bonbons von jeder Farbe erwarten. Daraus ergibt sich die Tabelle mit den erwarteten Häufigkeiten (e): Farbe rot grün blau gelb braun Anzahl (e i ) 25 25 25 25 25

Beispiel 1 (χ 2 -Anpassungstest) Schritt 3: Die Wahl des Signifikanzniveaus Üblicherweise wird α = 5% vor der Durchführung eines Tests festgesetzt.

Beispiel 1 (χ 2 -Anpassungstest) Schritt 4: Die Wahl des Tests Das dem χ 2 -Test zugrunde liegende Konzept ist leicht zu verstehen. Für jede Farbe berechnet man das Quadrat der Differenz zwischen der beobachteten und der erwarteten Häufigkeiten und relativiert diesen Wert, indem man ihn durch die erwartete Häufigkeit teilt: (b i e i ) 2 e i (i = 1, 2, 3, 4, 5) Anschliessend bildet man die Summe dieser Werte und bezeichnet sie mit χ 2.

Beispiel 1 (χ 2 -Anpassungstest) rot grün blau gelb braun Summe b i 29 23 21 32 20 125 e i 25 25 25 25 25 125 (b i e i ) 2 /e i 0.64 0.16 0.64 1.96 1 4.4 Je mehr die beobachteten von den erwarteten Häufigkeiten abweichen, desto grösser wird χ 2. Wegen der quadrierten Abweichungen gilt χ 2 0. Da die Randsummen der erwarteten und der beobachteten Häufigkeiten übereinstimmen müssen, sind im Grunde nur 4 der 5 erwarteten Häufigkeiten frei wählbar. Deshalb liegen hier df = 4 Freiheitsgrade vor.

Beispiel 1 (χ 2 -Anpassungstest) Schritt 5: Überprüfung der Voraussetzungen Da der χ 2 -Test im Grunde wieder eine Näherungslösung für das eigentliche Testproblem darstellt, müssen die folgenden Bedingungen erfüllt sein, damit diese Näherung ausreichend nahe bei der echten Lösung liegt. Die beobachteten Häufigkeiten stammen aus einer Zufallsstichprobe. Die erwarteten Häufigkeiten pro Zelle sollten grösser als 5 sein. Somit sind im Beispiel die Voraussetzungen erfüllt.

Beispiel 1 (χ 2 -Anpassungstest) Schritt 6: Durchführung des Tests mit dem TI-84+ Speichere die beobachteten Häufigkeiten z. B. in der Liste L 1 : {29,23,21,32,20} L 1 Speichere die erwarteten Häufigkeiten z. B. in der Liste L 2 : {25,25,25,35,25} L 2 Öffne mit stat das Statistik-Menü, gehe ins TESTS-Untermenü und wähle D:χ 2 GOF-Test... (GOF steht für Goodness-of-fit.)

Beispiel 1 (χ 2 -Anpassungstest) Gib die Liste mit den beobachteten Häufigkeiten ein. (L 1 ) Diese Liste darf weder negative noch gebrochene Zahlen enthalten. Gib die Liste mit den erwarteten Häufigkeiten ein. (L 2 ) Diese Liste darf gebrochene aber keine negativen Zahlen enthalten. Gib die Anzahl der Freiheitsgrade ein. (df = 4) Wähle Calculate für die numerische Darstellung des Testresultats oder Draw für seine grafische Darstellung.

Beispiel 1 (χ 2 -Anpassungstest)

Beispiel 1 (χ 2 -Anpassungstest) Wähle Draw und drücke enter, für eine grafische Darstellung (mit weniger Zahlen).

Beispiel 1 (χ 2 -Anpassungstest) Schritt 7: Interpretation des Resultats Da der p-wert von 0.355 über dem Signifikanzniveau α = 0.05 liegt, entscheiden wir uns dafür, die Nullhypothese beizubehalten.

Beispiel 1 (χ 2 -Anpassungstest) Schritt 8: Darstellung des Resultats Ein χ 2 -Anpassungstest zeigt, dass die beobachteten Häufigkeiten nicht signifikant von der Gleichverteilung abweichen (χ 2 (4, N = 125) = 4.4, p = 0.355). Daher kann die Nullhypothese nicht verworfen werden.

Beispiel 1 (χ 2 -Anpassungstest) Bemerkung Der χ 2 -Anpassungstest ist nicht darauf beschränkt, wie im obigen Beispiel die Hypothese einer Gleichverteilung zu überprüfen. Die Stichprobendaten können damit auf beliebige Verteilungsformen getestet werden, so lange diese durch endlich viele Kategorien dargestellt werden kann.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Die Fragestellung Es soll untersucht werden, ob es einen Zusammenhang zwischen der Häufigkeit des Konsums von Fast Food und der Grösse des Haushalts gibt, in der eine Person lebt. Um dies herauszufinden, versucht man nachzuweisen, dass es eben keinen Zusammenhang gibt, dass diese beiden Faktoren unabhängig voneinander sind.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 1: Formulierung der Hypothesen H 0 : Die Merkmale Häufigkeit des Konsums von Fast Food und Grösse des Haushalts sind unabhängig voneinander. H 1 : Die Merkmale Häufigkeit des Konsums von Fast Food und Grösse des Haushalts sind abhängig voneinander.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 2: Die Stichprobe Umfrageergebnisse werden in einer Kontingenztafel (Kreuztabelle) zusammengestellt: Single Paar Familie Summe 1 Mal pro Monat 18 7 5 30 < 1 Mal pro Monat 32 53 65 150 50 60 70 180

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 3: Die Wahl des Signifikanzniveaus Üblicherweise wird α = 5% vor der Durchführung eines Tests festgesetzt.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 4: Die Wahl des Tests Das Prinzip ist dasselbe wie beim χ 2 -Anpassungstest. Um die erwarteten Häufigkeiten zu berechnen, geht man davon aus, dass die Randhäufigkeiten fest gegeben sind. Damit bestimmt man dann die Häufigkeiten im Innern der Tabelle: Single Paar Familie Summe 1 Mal pro Monat 8.33 10 11.67 30 < 1 Mal pro Monat 51.67 50 58.33 150 50 60 70 180 Das Element mit dem Wert 10 in der 1. Zeile und 2. Spalte wird berechnet, indem man das Produkt aus der Summe der 1. Zeile (30) und der Summe der 2. Spalte (60) durch das Gesamttotal (180) dividiert. So verfährt man auch mit den übrigen Elementen.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Dann Berechnet man χ 2 indem man die Summe der Terme (b ij e ij ) 2 e ij über alle beobachteten und erwarteten Häufigkeiten in den Zellen mit der Zeilennummer i und der Spaltennummer j bildet. Im Beispiel: χ 2 = (18 8.33)2 8.33 + + (65 58.33)2 58.33 = 19.11

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 5: Überprüfung der Voraussetzungen Die Voraussetzungen sind erfüllt, da die erwarteten Häufigkeiten in jeder Zelle grösser als 5 sind. Die Anzahl der Freiheitsgrade berechnet sich in diesem Fall nach der Formel: ist n z die Anzahl der Merkmale in den Zeilen und n s die Anzahl der Merkmale in den Spalten, so gilt: df = (n z 1)(n s 1) = (2 1)(3 1) = 1 2 = 2

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 6: Durchführung des Tests mit dem TI-84+ Speichere die beobachteten Häufigkeiten in einer Matrix ab. (Eine Matrix ist eine rechteckige Zahlentabelle.) Um Daten in einer Matrix zu speichern, muss man zuerst mit 2nd [matrix] das Matrix-Menü öffnen. Dort wählt man das Untermenü EDIT.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Wähle mit den Pfeiltasten eine Matrixvariable aus (hier [A]) und gib dann die Anzahl der Zeilen (2) und dann die Anzahl der Spalten (3) ein. Anschliessend lassen sich die Werte in der Tabelle eingeben. Die Matrix mit den erwarteten Häufigkeiten wird später vom TI-84+ automatisch bestimmt und muss nicht berechnet und eingegeben werden.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Öffne mit stat das Statistik-Menü, gehe ins Untermenü TESTS und wähle dort den Eintrag χ 2 -Test... aus.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Im folgenden Menü muss unter Observed via NAMES im Matrix-Menü die Matrix [A] ausgewählt werden. Unter Expected kann eine beliebige andere Matrix angegeben werden. Diese wird überschrieben.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Wähle Calculate für die numerische Darstellung des Testresultats oder Draw für seine grafische Darstellung.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 7: Interpretation des Resultats Da der p-wert von 0.00007 unter dem Signifikanzniveau α = 0.05 liegt, entscheiden wir uns dafür, die Nullhypothese zu verwerfen.

Beispiel 2 (χ 2 -Unabhängigkeitstest) Schritt 8: Darstellung des Resultats Ein χ 2 -Anpassungstest zeigt, dass sich die beobachteten Häufigkeiten signifikant von den erwarteten Häufigkeiten unterscheiden (χ 2 (4, N = 180) = 19.1, p < 0.001). Daher wird die Nullhypothese verworfen.

Aufgaben Führe jeweils einen χ 2 -Test auf dem Signifikanzniveau α = 0.05 durch. Notiere die statistischen Hypothesen. Überprüfe die Voraussetzungen. Führe den Test mit dem Taschenrechner durch. Formuliere das Testergebnis.

Aufgaben Übung 1 Sind die Merkmale Arbeitszeitmodell und Geschlecht unabhängig voneinander?

Aufgaben Übung 1 Sind die Merkmale Arbeitszeitmodell und Geschlecht unabhängig voneinander? männlich weiblich Summe vollzeit beschäftigt 60 26 86 teilzeit beschäftigt 2 16 18 wenig beschäftigt 4 8 12 nicht erwerbstätig 34 50 84 Summe 100 100 200

Aufgaben Hypothesen:

Aufgaben Hypothesen: H 1 : Die beiden Merkmale sind unabhängig voneinander H 0 : Die beiden Merkmale sind abhängig voneinander

Aufgaben Hypothesen: H 1 : Die beiden Merkmale sind unabhängig voneinander H 0 : Die beiden Merkmale sind abhängig voneinander erwartete Häufigkeiten:

Aufgaben Hypothesen: H 1 : Die beiden Merkmale sind unabhängig voneinander H 0 : Die beiden Merkmale sind abhängig voneinander erwartete Häufigkeiten: männlich weiblich Summe vollzeit beschäftigt 43 43 86 teilzeit beschäftigt 9 9 18 wenig beschäftigt 6 6 12 nicht erwerbstätig 42 42 84 Summe 100 100 200

Aufgaben Hypothesen: H 1 : Die beiden Merkmale sind unabhängig voneinander H 0 : Die beiden Merkmale sind abhängig voneinander erwartete Häufigkeiten: männlich weiblich Summe vollzeit beschäftigt 43 43 86 teilzeit beschäftigt 9 9 18 wenig beschäftigt 6 6 12 nicht erwerbstätig 42 42 84 Summe 100 100 200 Voraussetzungen:

Aufgaben Hypothesen: H 1 : Die beiden Merkmale sind unabhängig voneinander H 0 : Die beiden Merkmale sind abhängig voneinander erwartete Häufigkeiten: männlich weiblich Summe vollzeit beschäftigt 43 43 86 teilzeit beschäftigt 9 9 18 wenig beschäftigt 6 6 12 nicht erwerbstätig 42 42 84 Summe 100 100 200 Voraussetzungen: erfüllt (jedes innere Feld ist > 10)

Aufgaben Durchführung mit dem TR:

Aufgaben Durchführung mit dem TR:

Aufgaben Durchführung mit dem TR: Resultat:

Aufgaben Durchführung mit dem TR: Resultat: Ein χ 2 -Anpassungstest zeigt, dass die beobachteten Häufigkeiten signifikant von den erwarteten abweichen (χ 2 (3, N = 200) = 28.7, p < 0.01). Daher ist die Nullhypothese zu Gunsten der Alternativhypothese zu verwerfen.