Sven Garbade. Statistik 1

χ 2 -Test für nominale Daten Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 1 / 50

Agenda Übersicht zu statistischen Tests Der χ 2 -Test Werbemaßnahmen und Verkaufszahlen Wann fallen die Tore, Teil 1? Wann fallen die Tore, Teil 2? Beispiel HR Schätzung der erwarteten Häufigkeit über die Randsummen McNemar Test: Messwiederholung S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 2 / 50

Übersicht zu statistischen Tests Übersicht zu statistischen Tests Übersicht zu statistischen Tests Einteilung von ausgewählten Testverfahren Tests für Nominal-Skalenniveau S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 3 / 50

Übersicht zu statistischen Tests Einteilung von ausgewählten Testverfahren Einteilung von Testverfahren Datenniveau Stichproben Nominal Ordinal Intervall unabhängig χ 2 -Test Mann- Whitney-U- Test, Kruskalt-Test, F-Test Wallis abhängig McNemar-Test Wilcoxon-Test t-test für abhängige Stichproben S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 4 / 50

Übersicht zu statistischen Tests Tests für Nominal-Skalenniveau Tests für Nominal-Skalenniveau Das Interesse liegt auf Häufigkeitsunterschiede hinsichtlich bestimmter Merkmale. Die meisten Prüfstatistiken (Prüfgrößen) sind annähernd χ 2 -verteilt, daher auch χ 2 -Methoden genannt. Typische Fragestellungen: Wird eins von vier Waschmittel besonders bevorzugt? Sind Frauen in Städten besonders häufig berufstätig? Hat sich die Anzahl der Nichtraucher nach einer Kampagne erhöht? S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 5 / 50

Der χ 2 -Test Der χ 2 -Test Der χ 2 -Test Unfallhäufigkeiten Definition Dichte der χ 2 -Quadratverteilung Kritische Werte der χ 2 -Verteilung Hypothesen S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 6 / 50

Der χ 2 -Test Unfallhäufigkeiten Unfallhäufigkeiten nach Geschlecht und Schulabschluss Frauen Männer Hauptschule 20 10 30 mittlere Reife 60 50 110 Abitur 20 20 40 100 80 180 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 7 / 50

Der χ 2 -Test Definition Beobachtete vs. erwartete Häufigkeiten Erwartete und beobachtete Häufigkeiten: Ereignis E 1 E 2... E k Beobachtete Häufigkeit f b1 f b2... f bk Erwartete Häufigkeit f e1 f e2... f ek Soll untersucht werden, ob erwartete Häufigkeiten von beobachteten abweichen, können χ 2 -Verfahren angewendet werden. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 8 / 50

Der χ 2 -Test Definition Definition Der χ 2 -Test χ 2 = k (f b f e ) 2 i=1 f e (1) ist unter H 0 annähernd χ 2 verteilt, k entspricht der Anzahl an Kategorien. Die Anzahl der Freiheitsgrade variiert mit der Fragestellung. Die beobachteten Häufigkeiten f b können aus den Daten berechnet werden. Die erwarteten Häufigkeiten f e muss man aufgrund von Voranahmen oder den Randwahrscheinlichkeiten schätzen. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 9 / 50

Der χ 2 -Test Dichte der χ 2 -Quadratverteilung Dichte der χ 2 -Quadratverteilung 0.5 0.4 df = 1 df = 3 df = 6 df = 10 Dichte 0.3 0.2 0.1 0 0 2 4 6 8 10 12 14 16 χ 2 -Werte S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 10 / 50

Der χ 2 -Test Kritische Werte der χ 2 -Verteilung Kritische Werte der χ 2 -Verteilung Die kritischen Werte sind zweiseitig tabelliert. Fläche df 0.90 0.95 0.99 1 2.706 3.841 6.635 2 4.605 5.991 9.210 3 6.251 7.815 11.345 4 7.779 9.488 13.277 5 9.236 11.070 15.086 6 10.645 12.592 16.812 7 12.017 14.067 18.475 8 13.362 15.507 20.090 9 14.684 16.919 21.666 10 15.987 18.307 23.209 11 17.275 19.675 24.725... S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 11 / 50

Der χ 2 -Test Hypothesen Hypothesen Nullhypothese: H 0 : Das Merkmal X besitzt die Wahrscheinlichkeitsverteilung F 0 (x). Abweichungen der beobachteten von den erwarteten Häufigkeiten sprechen gegen die H 0. Die H 1 wird nicht mathematisch vormuliert. Typischerweise werden die Fragestellungen ungerichtet geprüft, gelegentlich interessiert aber eine gerichtete Fragestellung, z.b. bei 2 2 Tabellen, vgl. Bortz und Schuster (2010, S. 139). S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 12 / 50

Werbemaßnahmen und Verkaufszahlen Werbemaßnahmen und Verkaufszahlen Werbemaßnahmen und Verkaufszahlen Datenbeispiel Fragestellung Berechnung der Prüfgröße Vergleich χ 2 emp mit χ 2 krit S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 13 / 50

Werbemaßnahmen und Verkaufszahlen Datenbeispiel Datenbeispiel Eine Keksfirma entwickelt ein neues Sortiment an Butterkeksen. Das besondere ist, dass die Kekse entweder kreisförmig, dreieckig oder in quadratischer Form dargeboten werden. Zu Testzwecken wird dieses Sortiment in einem kleinen Gebiet eingeführt und es werden die Verkaufszahlen nach einem Monat ermittelt: Dreieckige Kekse: 150 verkaufte Packungen. Kreisförmige Kekse: 200 verkaufte Packungen. Quadratische Kekse: 100 verkaufte Packungen. Da bisher keine Informationen zu den Kaufgewohnheiten vorlagen, ging man von gleichen Verkaufszahlen für alle drei Kekssorten aus. Bei insgesamt 450 verkauften Packungen hätte man also 150 Packungen für jede Sorte erwartet. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 14 / 50

Werbemaßnahmen und Verkaufszahlen Fragestellung Fragestellung Entsprechen die tatsächlichen Verkaufszahlen den erwarteten bzw. weichen die tatsächlichen Verkaufszahlen signifikant von den erwarteten ab? H 0 : Die beobachteten Verkaufszahlen entsprechen den erwarteten Verkaufszahlen. H 1 : Die beobachteten Verkaufszahlen weichen von den erwarteten Verkaufszahlen ab. Mathematische Hypothesen werden hierbei in der Regel nicht gebildet. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 15 / 50

Werbemaßnahmen und Verkaufszahlen Berechnung der Prüfgröße Berechnung der Prüfgröße Drei verschiedene Kekssorten (rund, dreieckig, quadratisch), damit k = 3 Kategorien. Verkaufzahlen: Dreieckige Kekse: 150; kreisförmige Kekse: 200 und quadratische Kekse: 100 verkaufte Packungen. Erwartete Verkaufszahlen f e : 150. Prüfgröße χ 2 emp: χ 2 emp = = k (f b f e ) 2 i=1 f e (150 150)2 150 + = 02 150 + 502 150 + 502 150 = 0 + 16.67 + 16.67 = 33.33 (200 150)2 150 + (100 150)2 150 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 16 / 50

Werbemaßnahmen und Verkaufszahlen Vergleich χ 2 emp mit χ2 krit Vergleich χ 2 emp mit χ 2 krit In diesem Beispiel gibt es k 1 Freiheitsgrade: 3 1 = 2. χ 2 krit(df=2,α=5%,zweiseitig) = 5.991. χ 2 emp > χ 2 krit, signifikant, Entscheidung zugunsten der H 1. Antwort: Mit einer Irrtumswahrscheinlichkeit von 5% kann behauptet werden, dass die beobachteten Verkaufszahlen von der erwarteten Verteilung abweichen: Kreisförmige Kekse werden häufiger, quadratische Kekse seltener verkauft als erwartet. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 17 / 50

Wann fallen die Tore, Teil 1? Wann fallen die Tore, Teil 1? Wann fallen die Tore, Teil 1? Wann fallen die Tore, Teil 1? Hypothesen Berechnung der Prüfgröße χ 2 emp Vergleich χ 2 emp mit χ 2 krit S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 18 / 50

Wann fallen die Tore, Teil 1? Wann fallen die Tore, Teil 1? Wann fallen die Tore, Teil 1? In der Vorrunde der Fußball-Bundesliga fielen in der Saison 2006/2007 insgesamt 413 Tore. Bezogen auf Spielabschnitte von jeweils 15 Minuten ergab sich folgende Verteilung: Minute 1 bis 15: 53 Tore Minute 16 bis 30: 64 Tore Minute 31 bis 45: 72 Tore Minute 46 bis 60: 77 Tore Minute 61 bis 75: 64 Tore Minute 76 bis 90: 83 Tore Fallen in den einzelnen Spielabschnitten statistisch bedeutsam unterschiedlich viele Tore? S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 19 / 50

Wann fallen die Tore, Teil 1? Hypothesen Hypothesen Hypothesen: H 0 : Die empirische Verteilung der Tore pro Spielabschnitt entspricht der erwarteten Verteilung an Toren pro Spielabschnitt. H 1 : Die empirische Verteilung der Tore pro Spielabschnitt entspricht nicht der erwarteten Verteilung an Toren pro Spielabschnitt. Im Mittel wären 68.83 Tore pro Spielabschnitt gefallen (413/6 = 68.83). Dies entspreicht der erwarteten Häufigkeit f e. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 20 / 50

Wann fallen die Tore, Teil 1? Berechnung der Prüfgröße χ 2 emp Berechnung der Prüfgröße χ 2 emp f e = 68.83, k = 6 χ 2 emp = k (f b f e ) 2 i=1 f e (53 68.83)2 (64 68.83)2 (72 68.83)2 = + + 68.83 68.83 68.83 (77 68.83)2 (64 68.83)2 (83 68.83)2 + + + 68.83 68.83 68.83 = 15.832 68.83 + 4.832 68.83 + 3.172 68.83 + 8.172 68.83 + 4.832 68.83 + 14.172 68.83 250.59 + 23.33 + 10.05 + 66.75 + 23.33 + 200.79 = = 574.84 68.83 68.83 = 8.35 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 21 / 50

Wann fallen die Tore, Teil 1? Vergleich χ 2 emp mit χ2 krit Vergleich χ 2 emp mit χ 2 krit 6 Gruppen, keine Berücksichtigung der Randsummen, daher k 1 = 6 1 = 5 Freiheitsgrade. Kritischer Wert: χ 2 krit(df=5,α=5%,zweiseitig) = 11.071. χ 2 emp = 8.35 ist kleiner als χ 2 krit = 11.071, daher Beibehaltung der H 0. Auch wenn es so aussieht, die Verteilung der Tore auf die Spielabschnitte weicht nicht signifikant von der erwarteten Gleichverteilung ab. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 22 / 50

Wann fallen die Tore, Teil 2? Wann fallen die Tore, Teil 2? Wann fallen die Tore, Teil 2? Wann fallen die Tore, Teil 2? Hypothesen Berechnung der Prüfgröße χ 2 emp Vergleich χ 2 emp mit χ 2 krit S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 23 / 50

Wann fallen die Tore, Teil 2? Wann fallen die Tore, Teil 2? Wann fallen die Tore, Teil 2? In der Rückrunde der Fußball-Bundesliga fielen in der Saison 2006/2007 insgesamt 424 Tore. Bezogen auf Spielabschnitte von jeweils 15 Minuten ergab sich folgende Verteilung: Minute 1 bis 15: 57 Tore Minute 16 bis 30: 72 Tore Minute 31 bis 45: 56 Tore Minute 46 bis 60: 68 Tore Minute 61 bis 75: 81 Tore Minute 76 bis 90: 90 Tore Fallen in den einzelnen Spielabschnitten statistisch bedeutsam unterschiedlich viele Tore? S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 24 / 50

Wann fallen die Tore, Teil 2? Hypothesen Hypothesen Hypothesen: H 0 : Die empirische Verteilung der Tore pro Spielabschnitt entspricht der erwarteten Verteilung an Toren pro Spielabschnitt. H 1 : Die empirische Verteilung der Tore pro Spielabschnitt entspricht nicht der erwarteten Verteilung an Toren pro Spielabschnitt. Im Mittel wären 70.67 Tore pro Spielabschnitt gefallen (424/6 = 70.67). Dies entspreicht der erwarteten Häufigkeit f e. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 25 / 50

Wann fallen die Tore, Teil 2? Berechnung der Prüfgröße χ 2 emp Berechnung der Prüfgröße χ 2 emp f e = 70.67, k = 6 χ 2 emp = k (f b f e ) 2 i=1 f e (57 70.67)2 (72 70.67)2 (56 70.67)2 = + + 70.67 70.67 70.67 (68 70.67)2 (81 70.67)2 (90 70.67)2 + + + 70.67 70.67 70.67 = 13.672 70.67 + 1.332 70.67 + 14.672 70.67 + 2.672 70.67 + 10.332 70.67 + 19.332 70.67 186.87 + 1.77 + 215.21 + 7.13 + 106.71 + 373.65 = = 891.34 70.67 70.67 = 12.61 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 26 / 50

Wann fallen die Tore, Teil 2? Vergleich χ 2 emp mit χ2 krit Vergleich χ 2 emp mit χ 2 krit 6 Gruppen, keine Berücksichtigung der Randsummen, daher k 1 = 6 1 = 5 Freiheitsgrade. Kritischer Wert: χ 2 krit(df=5,α=5%,zweiseitig) = 11.071. χ 2 emp = 12.61 ist größer als χ 2 krit = 11.071, daher Entscheidung zugunsten der H 1. Mit einer Irrtumswahrscheinlichkeit von 5% kann behauptet werden, dass in der Rückrunde der Fußball-Bundesliga-Saison 2006/2007 die Verteilung der Tore auf sechs 15minütige Spielabschnitte von der zu erwartenden Verteilung abweicht! In den Spielabschnitten 16-30, 61-75 und 76-90 Minute fallen mehr Tore, in den anderen weniger Tore als erwartet. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 27 / 50

Beispiel HR Beispiel HR Beispiel HR Beispiel HR Fragestellung Berechnung der erwarteten Häufigkeiten Rechengang S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 28 / 50

Beispiel HR Beispiel HR Beispiel HR Als Leiter der Personalabteilung beschäftigen Sie sich unter anderem auch mit der Arbeitssicherheit. In der Zeitschrift für Arbeitssicherheit (ZfA) lesen Sie nun, dass durchschnittlich von 100 Unfällen in einer Firma 50% auf die Produktionsabteilung, 30% auf die Vertriebsabteilung, 20% auf die Marketingabteilung entfallen. In der Firma, in der Sie beschäftigt sind, gab es im letzten Jahr insgesamt 200 Unfälle: 80 in der Produktionsabteilung. 70 im Vertrieb. 50 in der Marketingabteilung. Unterscheiden sich die Unfallzahlen in Ihrer Firma von dem, was in der Zeitschrift berichtet wird? S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 29 / 50

Beispiel HR Fragestellung Fragestellung Unterscheiden sich die Unfallzahlen in Ihrer Firma von dem, was in der Zeitschrift berichtet wird? Daraus ergeben sich folgende Hypothesen: H 0 : Die Verteilung der Unfallzahlen in den verschiedenen Abteilungen unterscheiden sich nicht von den Unfallzahlen, über die in der ZfA berichtet wird. H 1 : Die Verteilung der Unfallzahlen in den verschiedenen Abteilungen unterscheiden sich von den Unfallzahlen, über die in der ZfA berichtet wird. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 30 / 50

Beispiel HR Berechnung der erwarteten Häufigkeiten Berechnung der erwarteten Häufigkeiten Auch hier sollen wieder beobachtete Häufigkeiten (die Unfallzahlen in Ihrer Firma) mit erwarteten Häufigkeiten (das, was in der ZfA berichtet wird) verglichen werden. Als ersten Schritt muss man bestimmen, wieviele Unfälle in den einzelnen Abteilungen Ihrer Firma eigentlich nach den Angaben der ZfA zu erwarten gewesen wären: Produktionsabteilung: 80 beobachtet; 50% von 200 erwartet = 100. Vertriebsabteilung: 70 beobachtet; 30% von 200 erwartet = 60. Marketingabteilung: 50 beobachtet; 20% von 200 erwartet = 40. Alle Bestimmungsstücke für den χ 2 -Test sind nun bekannt. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 31 / 50

Beispiel HR Rechengang Rechengang Prüfgröße: χ 2 emp = k (f b f e ) 2 i=1 f e (80 100)2 = 100 = 400 100 + 100 = 8.17 + (70 60)2 60 + (50 40)2 40 60 + 100 = 4 + 1.67 + 2.5 40 Freiheitsgrade: Bei drei Kategorien df = k 1 = 3 1 = 2. χ 2 krit(df=2;α=5%;zweiseitig) = 5.991. χ 2 emp > χ 2 krit H 1! S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 32 / 50

Beispiel HR Rechengang Rechengang (Forts. 2) Antwort: Mit einer Irrtumswahrscheinlichkeit von 5% kann behauptet werden, dass sich die Verteilung der Unfallzahlen in den verschiedenen Abteilungen von den Unfallzahlen unterscheidet, über die in der ZfA berichtet wird. In der Produktionsabteilung passieren weniger, im Marketing und im Vertrieb mehr Unfälle als erwartet. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 33 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Schätzung der erwarteten Häufigkeit über die Randsummen Schätzung der erwarteten Häufigkeit über die Randsummen Schätzung der erwarteten Häufigkeit über die Randsummen Beispiel Hypothesen Berechnung der erwarteten Häufigkeiten Freiheitsgrade Berechnung der Prüfgröße Vergleich mit dem kritischen Wert S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 34 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Schätzung der erwarteten Häufigkeit über die Randsummen Schätzung der erwarteten Häufigkeit über die Randsummen Wenn keine Annahmen über die erwarteten Häufigkeiten gemacht werden, müssen diese über die Randsummen geschätzt werden. Rückblick: Stochastische Unabhängigkeit: Entspricht die erwartete Verteilung der beobachteten Verteilung, spricht man von stochastischer Unabhängigkeit. Entspricht die erwartete Verteilung nicht der beobachteten, spricht man von stochastischer Abhängigkeit. Mathematisch ist die erwartete Häufigkeit das Produkt der jeweiligen Einzelwahrscheinlichkeiten der Ereignisse. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 35 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Beispiel Beispiel Sie wollen wissen, ob es bezogen auf die Unfallhäufigkeiten einen Unterschied zwischen Männern und Frauen bzw. nach Bildungsstand (Hauptschulabschluss, mittlere Reife, Abitur) gibt. Nach einem Aktenstudium können Sie bei 180 Unfällen das Geschlecht sowie den Bildungsabschluss der verunfallten Person bestimmen. Daten: Frauen Männer Hauptschule 20 10 30 mittlere Reife 60 50 110 Abitur 20 20 40 100 80 180 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 36 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Hypothesen Hypothesen H 0 : Die Verteilung der Unfallhäufigkeiten nach Bildung und Geschlecht entspricht dem, was zu erwarten wäre. H 1 : Die Verteilung der Unfallhäufigkeiten nach Bildung und Geschlecht entspricht nicht dem, was zu erwarten wäre. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 37 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Berechnung der erwarteten Häufigkeiten Berechnung der erwarteten Häufigkeiten Die erwarten Häufigkeiten ergeben sich gemäß dem Multiplikationstheorem für unabhängige Wahrscheinlichkeiten (und-verknüpfung) aus dem Produkt der jeweiligen Einzelwahrscheinlichkeiten. Beispiel männlich und Abitur: p(männlich Abitur) = 80 180 40 180 0.0988. Etwa 9.88% sind damit männlich und haben Abitur. Damit erwarten wir bei 180 Personen 180 0.0988 17.784 Männer mit Abitur. 80 Genauer: 180 40 40 80 180 180 = 180 = 17.777. Kurz: Multiplikation der Randsummen geteilt durch Gesamtanzahl vgl. Bortz und Schuster (2010, S. 139) und Vorlesung 2. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 38 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Berechnung der erwarteten Häufigkeiten Erwartete Häufigkeiten Die erwarteten Häufigkeiten ergeben sich mit der Regel Multiplikation der Randsummen geteilt durch Gesamtanzahl als: Frauen Männer Hauptschule 16.67 13.33 30 mittlere Reife 61.11 48.89 110 Abitur 22.22 17.78 40 100 80 180 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 39 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Freiheitsgrade Freiheitsgrade Frauen Männer Hauptschule 16.67 13.33 30 mittlere Reife 61.11 48.89 110 Abitur 22.22 17.78 40 100 80 180 In obiger Tabelle könnten bei unveränderten Randsummen zwei Zahlen frei gewählt werden, die anderen vier wären dann bereits festgelegt df = 2. In unserem Beispiel haben wir 2 Merkmale: ein 3fach (k) und ein 2fach (m) gestuftes Merkmal. Da die Spalten- als auch Zeilensummen jeweils die Gesamtanzahl ergeben muss, können jeweils k 1 und m 1 Werte frei gewählt werden. Allgemein: Die Anzahl der Freiheitsgrade in einer k m Matrix sind (k 1) (m 1) = (3 1) (2 1) = 2. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 40 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Berechnung der Prüfgröße Berechnung der Prüfgröße k = 6 Prüfgröße χ 2 emp: χ 2 emp = k (f b f e ) 2 i=1 f e (20 16.67)2 (10 13.33)2 (60 61.11)2 = + + 16.67 13.33 61.11 (50 48.89)2 (20 22.22)2 (20 17.78)2 + + + 48.89 22.22 17.78 = 3.332 16.67 + 3.332 13.33 + 1.112 61.11 + 1.112 48.89 + 2.222 22.22 + 2.222 17.78 = 0.67 + 0.83 + 0.02 + 0.03 + 0.22 + 0.28 = 2.05 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 41 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Vergleich mit dem kritischen Wert Vergleich mit dem kritischen Wert χ 2 emp = 2.05. 2 Freiheitsgrade: χ 2 krit(df=2,α=5%,zweiseitig) = 5.991. Prüfgröße ist kleiner als der kritische Wert, damit wird die H 0 beibehalten, die Verteilung der Unfallhäufigkeiten nach Bildung und Geschlecht entspricht dem, was zu erwarten wäre. Schlusssatz: Bezogen auf die marginalen Unfallhäufigkeiten kann behauptet werden, dass es keinen Unterschied bezüglich Geschlecht und Bildung gibt. Die beobachteten Häufigkeiten unterscheiden sich bezüglich der marginalen Wahrscheinlichkeiten nicht. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 42 / 50

Schätzung der erwarteten Häufigkeit über die Randsummen Vergleich mit dem kritischen Wert Ausgabe mit Typische Ausgabe: > chisq. test(m) Pearson 's Chi - squared test data: m X- squared = 2.0455, df = 2, p- value = 0.3596 Satz: Die beobachteten Unfallhäufigeiten zwischen Frauen und Männern mit unterschiedlichem Schulabschluss unterscheiden sich bezüglich der marginalen Wahrscheinlichkeiten nicht (χ 2 (2) = 2.05; p = 0.36). S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 43 / 50

McNemar Test: Messwiederholung McNemar Test: Messwiederholung McNemar Test: Messwiederholung Beispiel: Nichtraucherkampagne Prüfgröße Berechnung S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 44 / 50

McNemar Test: Messwiederholung McNemar Test: Messwiederholung Wenn eine Stichprobe hinsichtlich eines nominalen Merkmals zweimal untersucht wird, so kann der McNemar Test angewendet werden. Der McNemar Test berücksichtigt nur diejenigen Fälle, in denen eine Veränderung eingetreten ist. Daher auch der Name test for significance of change. Eine Erweiterung für k-messungen ist der Cochran-Test. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 45 / 50

McNemar Test: Messwiederholung Beispiel: Nichtraucherkampagne Beispiel: Nichtraucherkampagne In einer Firma wird ein Nichtrauchertraining durchgeführt. Dazu wurden 237 Personen vor und nach einer Anti-Rauchkampagne befragt (+: raucht, : raucht nicht). nachher + vorher + a = 80 b = 25 c = 12 d = 120 S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 46 / 50

McNemar Test: Messwiederholung Prüfgröße Prüfgröße McNemar-Test Wird eine Stichprobe hinsichtlich eines dichotomen Merkmals zweimal untersucht, kann auf eine Veränderung von Messzeitpunkt 1 zu 2 mit dem McNemar Tests geprüft werden: mit df = 1. Vgl. Bortz und Schuster (2010, S. 146). χ 2 emp = (b c)2 b + c (2) S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 47 / 50

McNemar Test: Messwiederholung Berechnung Berechnung Prüfgröße: χ 2 (b c)2 emp = b + c (25 12)2 = 37 = 4.57 Der kritische χ 2 -Wert lautet χ 2 krit,df=1,α=5% = 3.84. χ 2 krit < χ2 emp H 1! Schlussatz: Da nach der Kampagne mehr Personen mit dem Rauchen aufgehört als mit dem Rauchen angefangen haben, kann man mit einer Irrtumsahrscheinlichkeit von 5% festhalten, dass die Anti-Raucherkampagne ein Erfolg war. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 48 / 50

McNemar Test: Messwiederholung Berechnung Ausgabe mit Typische Ausgabe: McNemar 's Chi - squared test data: m McNemar 's chi - squared = 4.5676, df = 1, p- value = 0.03258 Schlussatz: Da nach der Kampagne signifikant mehr Personen mit dem Rauchen aufgehört als mit dem Rauchen angefangen haben, war die Anti-Raucherkampagne ein Erfolg (χ 2 (1) = 4, 57; p = 0.033). S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 49 / 50

McNemar Test: Messwiederholung Berechnung Literaturverzeichnis Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Berlin: Springer. S. Garbade (SRH Heidelberg) χ 2 -Test für nominale Daten Statistik 1 50 / 50