Alternatve Darstellung des -Stchprobentests für Antele DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Beobachtete Response No Response Total absolut DCF 43 68 111 CF 6 86 11 69 154 3 Be Gültgket der Nullhypothese Beobachtete Response No Response Total Zelenprozent DCF 38,7% 61,3% 111 CF 3,% 76,8% 11 30,9% 69,1% 3 Erwartete Response No Response Total Zelenprozent DCF 30,9% 69,1% 111 CF 30,9% 69,1% 11 30,9% 69,1% 3 Erwartete Response No Response Total absolut DCF 34,35 77 111 CF 35 77 11 69 154 3 Analyse der Dfferenz Statstk für SozologInnen 1 -Unabhänggketstest Der -Unabhänggketstest erlaubt es, zu testen, ob zwe nomnalskalerte Merkmale vonenander unabhängg snd oder ncht. Dabe werden de Abwechungen der beobachteten Häufgketen n ener Kreuztabelle von den unter der Unabhänggketshypothese erwarteten Häufgketen evaluert. Unter der Unabhänggketshypothese ergeben sch de erwarteten relatven Häufgketen n ener Zelle,j durch Multplkaton der zugehörgen relatven Randhäufgketen bzw. snd de bedngten Vertelungen konstant und glech der Randvertelung. Statstk für SozologInnen 1
Notaton Wr betrachten ene lm Kreuztabelle Zelenndex (1,..., l) Spaltenndex j (1,..., m) n 1 n n n l n 1 n j n m n Statstk für SozologInnen 3 Bedngung für Unabhänggket P( A B) P( A) P( B) Wahrschenlchket ener Zelle st das Produkt der Zele- und der Spaltenwahrschenlchket Es glt daher: n n n n n n n n n Absolute Häufgket ener Zelle st das Produkt der Zelen- und der Spaltenhäufgket dvdert durch de Gesamtanzahl n j j Statstk für SozologInnen 4
Gesamter Datensatz CLASS * SURVIVED * SEX Kreuztabelle Anzahl SEX Male Female CLASS Gesamt CLASS Gesamt 1st Class nd Class 3rd Class Crew 1st Class nd Class 3rd Class Crew SURVIVED No Yes Gesamt 118 6 180 154 5 179 4 88 510 670 19 86 1364 367 1731 4 141 145 13 93 106 106 90 196 3 0 3 16 344 470 Statstk für SozologInnen 5 Vsualserung mttels Mosac-Plot Zusammenhang: Überleben x Passagerklasse Statstk für SozologInnen 6 3
Bespel Dem folgenden Bespel legt der Datenbestand von n = 01 Personen des Schffsunglücks Ttanc zugrunde. Es soll untersucht werden, ob en Zusammenhang der beden Merkmale Unterkunftsklasse am Schff und Überleben des Passagers besteht. Merkmal Unterkunftsklasse: Anzahl rel. Häufgket Merkmal überlebt: 1st Class 35 14,8% Anzahl rel. Häufgket nd Class 85 1,9% NEIN 1.490 0,68 3rd Class 706 3,1% JA 711 0,3 Crew 885 40,%.01.01 Zusammenhang? Statstk für SozologInnen 7 Ausgangsdaten & Fragestellung Beobachtete Häufgketen 1st Class 1 03 35 nd Class 167 118 85 3rd Class 58 178 706 Crew 673 1 885 Spaltensumme 1.490 711.01 1st Class 37,5% 6,5% 100,0% nd Class 58,6% 41,4% 100,0% 3rd Class 74,8% 5,% 100,0% Crew 76,0% 4,0% 100,0% Spaltensumme 67,7% 3,3% 100,0% Zelenprozent beobachtet Ist der Antel der Überlebenden n den 4 Personengruppen glech? Verallgemenerung der Fragestellung des - Stchprobentests für den Verglech von mehr als n Statstk für SozologInnen 8 4
Erwartete Häufgket Berechnung der erwarteten Häufgketen be Unabhänggket der Merkmale Zelensumme Spaltensumme Erwartete Häufgket Gesamtsumme Erwartete Häufgket NEIN, 1st Class 1.49035 0,0.01 Statstk für SozologInnen 9 Erwartete Häufgket Berechnung der erwarteten Häufgketen be Unabhänggket der Merkmale Zelensumme Spaltensumme Erwartete Häufgket Gesamtsumme 1st Class??? 35 nd Class 85 3rd Class 706 Crew 885 Spaltensumme 1.490 711.01 1st Class 0,0 35 nd Class 85 3rd Class 706 Crew 885 Spaltensumme 1.490 711.01 1st Class 0,0 35 nd Class 85 3rd Class???? 706 Crew 885 Spaltensumme 1.490 711.01 1st Class 0,0 35 nd Class 85 3rd Class 8,1 706 Crew 885 Spaltensumme 1.490 711.01 Erwartete Häufgket JA, 3rd Class 711 706 8,1.01 Statstk für SozologInnen 10 5
Erwartete Häufgket Erwartete Häufgketen Unterkunftsklasse versus Person hat überlebt be Gültgket der Unabhänggketshypothese Statstk für SozologInnen 11 Verglech Beobachtete Häufgketen - Erwartete Häufgketen Beobachtete Häufgketen Erwartete Häufgketen unter Ho Zelenprozent beobachtet Zelenprozent erwartet 1st Class 0,0 105,0 35 nd Class 19,9 9,1 85 3rd Class 477,9 8,1 706 Crew 599,1 85,9 885 Spaltensumme 1.490 711.01 1st Class 1 03 35 nd Class 167 118 85 3rd Class 58 178 706 Crew 673 1 885 Spaltensumme 1.490 711.01 1st Class 37,5% 6,5% 100,0% nd Class 58,6% 41,4% 100,0% 3rd Class 74,8% 5,% 100,0% Crew 76,0% 4,0% 100,0% Spaltensumme 67,7% 3,3% 100,0% 1st Class 0 105 35 nd Class 193 9 85 3rd Class 478 8 706 Crew 599 86 885 Spaltensumme 1.490 711.01 1st Class 67,7% 3,3% 100,0% nd Class 67,7% 3,3% 100,0% 3rd Class 67,7% 3,3% 100,0% Crew 67,7% 3,3% 100,0% Spaltensumme 67,7% 3,3% 100,0% Statstk für SozologInnen 1 6
Beobachtete mnus erwartete Häufgket überlebt NEIN JA Zelensumme 1st Class -98,0 98,0 0 nd Class -5,9 5,9 0 3rd Class 50,1-50,1 0 Crew 73,9-73,9 0 Spaltensumme 0 0 0 Statstk für SozologInnen 13 -Statstk Berechnung des -Wertes l m 1 j1 Beobachteter Wert Erwarteter Wert Erwarteter Wert l... Anzahl der Zelen m... Anzahl der Spalten Anzahl der Frehetsgrade: (l-1)(m-1) Statstk für SozologInnen 14 7
Form der Ch²-Vertelungsdchte Statstk für SozologInnen 15 -Statstk o11 e11 e11 1st Class 43,7 91,5 135, nd Class 3,5 7,3 10,8 3rd Class 5, 11,0 16, Crew 9,1 19,1 8, Spaltensumme 61,5 18,9 190,4 l m 1 j1 o e e Statstk für SozologInnen 16 8
Dchtefunkton der -Vertelung Dchtefunkton der -Vertelung mt 3 Frehetsgraden 0.0 0.05 0.10 0.15 0.0 0.5 krtscher Berech 0 5 10 15 0 3;0,95 7,81 Statstk für SozologInnen 17 -Statstk 190,4 7, 81 nach Überleben > krtsch Hoch sgnfkantes Ergebns; Unterschede zwschen den Überlebenschancen n den verschedenen n können wohl ncht zufällg sen Es bestehen sgnfkante Unterschede zwschen den beobachteten und den erwarteten Werten Überlebende Personen snd eher n den höherwertgen Unterkunftsklassen zu fnden Statstk für SozologInnen 18 9
Analyse von 3 Merkmalen Log-lneare Modelle: Werkzeug zur Analyse höher-dmensonaler Häufgketstabellen Statstk für SozologInnen 19 Äquvalenz zu -Stchprobenantelstest Beobachtete Response No Response Total Krtscher Wert be =0,01 6,634897 absolut DCF 43 68 111 Krtscher Wert be =0,05 3,841459 CF 6 86 11 69 154 3 Abwechung Beobachtete Response No Response Total Response No Response Total Zelenprozent DCF 38,7% 61,3% 111 DCF 8,655-8,655 0,000 CF 3,% 76,8% 11 CF -8,655 8,655 0,000 30,9% 69,1% 3 0,000 0,000 0,000 Erwartete Response No Response Total CHI-WERT Zelenprozent DCF 30,9% 69,1% 111 Response No Response Total CF 30,9% 69,1% 11 DCF,181 0,977 30,9% 69,1% 3 CF,161 0,968 6,88 Erwartete Response No Response Total absolut DCF 34,35 77 111 p-value 0,01 6,88 CF 35 77 11 69 154 3 Statstk für SozologInnen 0 10
Ausrechende Fallzahl und de Yates-Korrektur De Approxmaton der Stchprobenvertelung mt der statstk darf nur angewendet werden, wenn alle erwarteten Häufgketen 5 snd. Andernfalls müssen Zelen bzw. Spalten der Kreuztabelle zusammengefasst werden. Für den Fall der 4-Felder Tafel (Anzahl der Frehetsgrade = 1), wrd n der Praxs häufg de sogenannte Yates-Korrektur herangezogen: korr. l 1 m j1 o e e 0,5 Statstk für SozologInnen 1 Bespel zur Yates-Korrektur Anhand enes Labortests (Dgtals-Konzentraton m Blut) kann das Vorlegen ener bestmmten Krankhet nachgewesen werden. 1975 wurde dazu folgende Statstk veröffentlcht: T+ postver Test D+ D- Total T- negatver Test T+ 5 14 39 D+ krank T- 18 78 96 D- gesund Total 43 9 135 6,8 korr. 4,3 1;0,95 3,84 sgnfkantes Ergebns Statstk für SozologInnen 11
Berechnungsschema n Excel D+ D- Ohne Yates-Korrektur T+ 5 14 39 1,7353 5,9536 T- 18 78 96 5,17371,41815 p-value 43 9 135 6,8 0,00000030 D+ D- Mt Yates-Korrektur T+ 1,4 6,58 39 11,749 5,4885 T- 30,58 65,4 96 4,77055,971 p-value 43 9 135 4,3 0,00000085 krt. Wert: 11,3449 Funkton: CHITEST(Beobachtete Werte; Unter H0 erwartete Werte) Statstk für SozologInnen 3 Example wth SPSS Statstk für SozologInnen 4 1
Expected Frequences Statstk für SozologInnen 5 Dfference Observed - Expected Statstk für SozologInnen 6 13
Reduced Analyss x Table Statstk für SozologInnen 7 Smpson Paradoxon (1) Clncal Center I Treatment A B Sum response 10 100 110 no response 100 730 830 Sum 110 830 940 Clncal Center II Treatment A B Sum response 100 50 150 no response 50 0 70 Sum 150 70 0 Statstk für SozologInnen 8 Response A:10 von 110 9% B:100 von 830 1% p-value = 0,365 Response A:100 von 150 67% B:50 von 70 71% p-value = 0,480 14
Smpson Paradoxon () Data of Clncal Center I and II collapsed Treatment A B Sum response 110 150 60 no response 150 750 900 Sum 60 900 1160 p-value = 0,0001 Response A: 4% B:17% Statstk für SozologInnen 9 Anderer Problemstellung: Anpassungstest Vertelung der Augenzahl x be n = 35 Würfen mt enem antken Würfel x 1 3 4 5 6 n 37 17 49 59 8 45 Theoretsche Wahrschenlchket: P(X=x) = p = 1/6 = 0.167 Statstk für SozologInnen 30 15
Berechnung der -Statstk k 1 Beobachtet e Häufgket Erwartete Erwartete Häufgket Häufgket k 1 k n n p h p n p n 1 p n... Stchprobenumfang n... beobachtete Häufgket p... theoretsche Wahrschenlchket h = n /n... relatve Häufgket Statstk für SozologInnen 31 Arbetstabelle zur Bestmmung der Prüfgröße x n n n n n n p p p n p 1 37 39.17 -.17 0.10 17 39.17 -.17 1.548 3 49 39.17 9.83.467 4 59 39.17 19.83 10.039 5 8 39.17-11.17 3.185 6 45 39.17 5.83 0.868 n = 35 9.7 Würfel 9,7 Statstk für SozologInnen 3 16
Dchtefunkton der -Vertelung Dchtefunkton der -Vertelung mt 5 Frehetsgraden 0.0 0.05 0.10 0.15 krtscher Berech 0 5 10 15 0 5 krtsch Statstk für SozologInnen 33 -Statstk Berechnung des -Wertes 9,7 11, 07 Würfel > krtsch 5;0.95 sgnfkantes Ergebns (Sgnfkanznveau = 0.05); De beobachteten Häufgketen wechen sgnfkant von den unter der Annahme ener Glechvertelung erwarteten Häufgketen ab. er oder 5er werden mt dem antken Würfel seltener gewürfelt ( Seten de gegenüber legen!) Der antke Würfel st ken farer Würfel Statstk für SozologInnen 34 17
Bespel Mendel überprüfte sene Theoren über de Vererbungsgesetze durch Kreuzung verschedener Erbsensorten. Gemäß sener Theore sollte das Vorkommen von 4 Sorten m Verhältns 9:3:3:1 stehen. Ene Stchprobe von 556 Erbsen ergab: 315:108:101:3 Snd de beobachteten Abwechungen sgnfkant? Observed Soll-Odds Soll-Rel Expected (Obs-Exp)^ (O-E)^/E 315 9 0,565 31,75 5,065 0,016 108 3 0,1875 104,5 14,065 0,1349 101 3 0,1875 104,5 10,565 0,1013 3 1 0,065 34,75 7,565 0,176 556 16 1 556 0,4700 CHI(3;0,99) 11,345 Statstk für SozologInnen 35 Hnwese Der Ch-Quadrat Wert lefert ene summarsche Beurtelung der Abwechung ener emprschen Vertelung von ener theoretsch erwarteten Vertelung. Damt de Vertelung der Teststatstk approxmatv Ch-Quadrat vertelt st, müssen de erwarteten Häufgketen n jeder größer 5 sen. Ist des ncht der Fall müssen enzelne n aggregert werden. De Anzahl der Frehetsgrade st de Anzahl der n mnus ens. Falls zur Bestmmung der erwarteten Häufgketen auch Parameter geschätzt werden müssen, so snd de Frehetsgrade zusätzlch um de Anzahl der Parameter zu reduzeren. Statstk für SozologInnen 36 18