Alternative Darstellung des 2-Stichprobentests für Anteile. Beobachtete Response No Response Total absolut DCF CF

Ähnliche Dokumente
nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Datenaufbereitung und Darstellung

6. Modelle mit binären abhängigen Variablen

Nomenklatur - Übersicht

Statistik und Wahrscheinlichkeit

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Einführung in die Wahrscheinlichkeitsrechnung. Wahrscheinlichkeitsrechnung. Übersicht. Wahrscheinlichkeitsrechnung. bedinge Wahrscheinlichkeit

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

8 Logistische Regressionsanalyse

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

Auswertung von Umfragen und Experimenten. Umgang mit Statistiken in Maturaarbeiten Realisierung der Auswertung mit Excel 07

VERGLEICH VON TESTVERFAHREN FÜR DIE DEFORMATIONSANALYSE

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

Auswertung univariater Datenmengen - deskriptiv

Ionenselektive Elektroden (Potentiometrie)

Gruppe. Lineare Block-Codes

12 UMPU Tests ( UMP unbiased )

5. ZWEI ODER MEHRERE METRISCHE MERKMALE

Auswertung univariater Datenmengen - deskriptiv

Entscheidungsprobleme der Marktforschung (1)

Lineare Regression (1) - Einführung I -

Standardnormalverteilung / z-transformation

Innovative Handelssysteme für Finanzmärkte und das Computational Grid

FORMELSAMMLUNG STATISTIK (I)

Kreditrisikomodellierung und Risikogewichte im Neuen Baseler Accord

P(mindestens zwei gleiche Augenzahlen) = = 0.4 = = 120. den 5 vorbereiteten Gebieten drei auszuwählen: = 10. Deshalb ist 120 =

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Free Riding in Joint Audits A Game-Theoretic Analysis

3. Lineare Algebra (Teil 2)

Netzwerkstrukturen. Entfernung in Kilometer:

Beschreibende Statistik Mittelwert

4. Musterlösung. Problem 1: Kreuzende Schnitte **

NSt. Der Wert für: x= +1 liegt, erkennbar an dem zugehörigen Funktionswert, der gesuchten Nullstelle näher.

"Zukunft der Arbeit" Arbeiten bis 70 - Utopie - oder bald Realität? Die Arbeitnehmer der Zukunft

Statistische Regressionsmodelle

Kapitel 3: Interpretation und Vergleich von Regressionsmodellen

Spiele und Codes. Rafael Mechtel

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

Boost-Schaltwandler für Blitzgeräte

binäre Suchbäume Informatik I 6. Kapitel binäre Suchbäume binäre Suchbäume Rainer Schrader 4. Juni 2008 O(n) im worst-case Wir haben bisher behandelt:

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Übung/Tutorate Statistik II: Schließende Statistik SS 2007

Fallstudie 4 Qualitätsregelkarten (SPC) und Versuchsplanung

Übung zur Vorlesung. Informationstheorie und Codierung

Versicherungstechnischer Umgang mit Risiko

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

12 LK Ph / Gr Elektrische Leistung im Wechselstromkreis 1/ ω Additionstheorem: 2 sin 2 2

9 Phasengleichgewicht in heterogenen Mehrkomponentensystemen

Qualitative Evaluation einer interkulturellen Trainingseinheit

SIMULATION VON HYBRIDFAHRZEUGANTRIEBEN MIT

Man unterscheidet zwischen gewichteten und ungewichteten Faktorwerten.

Konkave und Konvexe Funktionen

H I HEIZUNG I 1 GRUNDLAGEN 1.1 ANFORDERUNGEN. 1 GRUNDLAGEN 1.1 Anforderungen H 5

9 Diskriminanzanalyse

Kursthemen 2. Sitzung. Tabellarische und graphische Darstellung diskreter Daten. Tabellarische und graphische Darstellung diskreter Daten

Verallgemeinerte Lineare Modelle

Seminar Analysis und Geometrie Professor Dr. Martin Schmidt - Markus Knopf - Jörg Zentgraf. - Fixpunktsatz von Schauder -

Methoden der innerbetrieblichen Leistungsverrechnung

Nernstscher Verteilungssatz

BAM-Leitfaden zur Ermittlung von Messunsicherheiten bei quantitativen Prüfergebnissen 1. Fassung 11. vom März 2004

Ich habe ein Beispiel ähnlich dem der Ansys-Issue [ansys_advantage_vol2_issue3.pdf] durchgeführt. Es stammt aus dem Dokument Rfatigue.pdf.

Ordered Response Models (ORM)

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Finanzwirtschaft. Kapitel 3: Simultane Investitions- und Finanzplanung. Lehrstuhl für Finanzwirtschaft - Universität Bremen 1

AUFGABEN ZUR INFORMATIONSTHEORIE

1 BWL 4 Tutorium V vom

5. Transmissionsmechanismen der Geldpolitik

Gliederung des Kurses:

Kapitel 2: Klassifikation. Maschinelles Lernen und Neural Computation

1 Definition und Grundbegriffe

Projektmanagement / Netzplantechnik Sommersemester 2005 Seite 1

Zinseszinsformel (Abschnitt 1.2) Begriffe und Symbole der Zinsrechnung. Die vier Fragestellungen der Zinseszinsrechnung 4. Investition & Finanzierung

1.1 Das Prinzip von No Arbitrage

Für jeden reinen, ideal kristallisierten Stoff ist die Entropie am absoluten Nullpunkt gleich

Anwendungsmöglichkeiten von Lernverfahren

Institut für Technische Chemie Technische Universität Clausthal

11 Chemisches Gleichgewicht

Standortplanung. Positionierung von einem Notfallhubschrauber in Südtirol. Feuerwehrhaus Zentrallagerpositionierung

1 - Prüfungsvorbereitungsseminar

Statistische Methoden für Bauingenieure WS 13/14

Einführung in Origin 8 Pro

Grundlagen der makroökonomischen Analyse kleiner offener Volkswirtschaften

Diskrete Mathematik 1 WS 2008/09

Spannweite, Median Quartilsabstand, Varianz und Standardabweichung.

Die Schnittstellenmatrix Autor: Jürgen P. Bläsing

Netzsicherheit I, WS 2008/2009 Übung 3. Prof. Dr. Jörg Schwenk

Rainer Diaz-Bone/Harald Künemund. Einführung in die binäre logistische Regression

Klasse : Name1 : Name 2 : Datum : Nachweis des Hookeschen Gesetzes und Bestimmung der Federkonstanten

Schätzfehler in der linearen Regression (1) Einführung

Einführung in die Finanzmathematik

Quantitatives Prognosemodell für die Anwendung des Black-Litterman-Verfahrens

mit der Anfangsbedingung y(a) = y0

Quant oder das Verwelken der Wertpapiere. Die Geburt der Finanzkrise aus dem Geist der angewandten Mathematik

Geld- und Finanzmärkte

Validierung der Software LaborValidate Testbericht

Klausuren zum Üben. Gesamtdauer der Anrufe in [Min]: bis 20 bis 40 bis 60 bis 90 bis 120 Anzahl der Schüler/innen:

Regression und Korrelation

Transkript:

Alternatve Darstellung des -Stchprobentests für Antele DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Beobachtete Response No Response Total absolut DCF 43 68 111 CF 6 86 11 69 154 3 Be Gültgket der Nullhypothese Beobachtete Response No Response Total Zelenprozent DCF 38,7% 61,3% 111 CF 3,% 76,8% 11 30,9% 69,1% 3 Erwartete Response No Response Total Zelenprozent DCF 30,9% 69,1% 111 CF 30,9% 69,1% 11 30,9% 69,1% 3 Erwartete Response No Response Total absolut DCF 34,35 77 111 CF 35 77 11 69 154 3 Analyse der Dfferenz Statstk für SozologInnen 1 -Unabhänggketstest Der -Unabhänggketstest erlaubt es, zu testen, ob zwe nomnalskalerte Merkmale vonenander unabhängg snd oder ncht. Dabe werden de Abwechungen der beobachteten Häufgketen n ener Kreuztabelle von den unter der Unabhänggketshypothese erwarteten Häufgketen evaluert. Unter der Unabhänggketshypothese ergeben sch de erwarteten relatven Häufgketen n ener Zelle,j durch Multplkaton der zugehörgen relatven Randhäufgketen bzw. snd de bedngten Vertelungen konstant und glech der Randvertelung. Statstk für SozologInnen 1

Notaton Wr betrachten ene lm Kreuztabelle Zelenndex (1,..., l) Spaltenndex j (1,..., m) n 1 n n n l n 1 n j n m n Statstk für SozologInnen 3 Bedngung für Unabhänggket P( A B) P( A) P( B) Wahrschenlchket ener Zelle st das Produkt der Zele- und der Spaltenwahrschenlchket Es glt daher: n n n n n n n n n Absolute Häufgket ener Zelle st das Produkt der Zelen- und der Spaltenhäufgket dvdert durch de Gesamtanzahl n j j Statstk für SozologInnen 4

Gesamter Datensatz CLASS * SURVIVED * SEX Kreuztabelle Anzahl SEX Male Female CLASS Gesamt CLASS Gesamt 1st Class nd Class 3rd Class Crew 1st Class nd Class 3rd Class Crew SURVIVED No Yes Gesamt 118 6 180 154 5 179 4 88 510 670 19 86 1364 367 1731 4 141 145 13 93 106 106 90 196 3 0 3 16 344 470 Statstk für SozologInnen 5 Vsualserung mttels Mosac-Plot Zusammenhang: Überleben x Passagerklasse Statstk für SozologInnen 6 3

Bespel Dem folgenden Bespel legt der Datenbestand von n = 01 Personen des Schffsunglücks Ttanc zugrunde. Es soll untersucht werden, ob en Zusammenhang der beden Merkmale Unterkunftsklasse am Schff und Überleben des Passagers besteht. Merkmal Unterkunftsklasse: Anzahl rel. Häufgket Merkmal überlebt: 1st Class 35 14,8% Anzahl rel. Häufgket nd Class 85 1,9% NEIN 1.490 0,68 3rd Class 706 3,1% JA 711 0,3 Crew 885 40,%.01.01 Zusammenhang? Statstk für SozologInnen 7 Ausgangsdaten & Fragestellung Beobachtete Häufgketen 1st Class 1 03 35 nd Class 167 118 85 3rd Class 58 178 706 Crew 673 1 885 Spaltensumme 1.490 711.01 1st Class 37,5% 6,5% 100,0% nd Class 58,6% 41,4% 100,0% 3rd Class 74,8% 5,% 100,0% Crew 76,0% 4,0% 100,0% Spaltensumme 67,7% 3,3% 100,0% Zelenprozent beobachtet Ist der Antel der Überlebenden n den 4 Personengruppen glech? Verallgemenerung der Fragestellung des - Stchprobentests für den Verglech von mehr als n Statstk für SozologInnen 8 4

Erwartete Häufgket Berechnung der erwarteten Häufgketen be Unabhänggket der Merkmale Zelensumme Spaltensumme Erwartete Häufgket Gesamtsumme Erwartete Häufgket NEIN, 1st Class 1.49035 0,0.01 Statstk für SozologInnen 9 Erwartete Häufgket Berechnung der erwarteten Häufgketen be Unabhänggket der Merkmale Zelensumme Spaltensumme Erwartete Häufgket Gesamtsumme 1st Class??? 35 nd Class 85 3rd Class 706 Crew 885 Spaltensumme 1.490 711.01 1st Class 0,0 35 nd Class 85 3rd Class 706 Crew 885 Spaltensumme 1.490 711.01 1st Class 0,0 35 nd Class 85 3rd Class???? 706 Crew 885 Spaltensumme 1.490 711.01 1st Class 0,0 35 nd Class 85 3rd Class 8,1 706 Crew 885 Spaltensumme 1.490 711.01 Erwartete Häufgket JA, 3rd Class 711 706 8,1.01 Statstk für SozologInnen 10 5

Erwartete Häufgket Erwartete Häufgketen Unterkunftsklasse versus Person hat überlebt be Gültgket der Unabhänggketshypothese Statstk für SozologInnen 11 Verglech Beobachtete Häufgketen - Erwartete Häufgketen Beobachtete Häufgketen Erwartete Häufgketen unter Ho Zelenprozent beobachtet Zelenprozent erwartet 1st Class 0,0 105,0 35 nd Class 19,9 9,1 85 3rd Class 477,9 8,1 706 Crew 599,1 85,9 885 Spaltensumme 1.490 711.01 1st Class 1 03 35 nd Class 167 118 85 3rd Class 58 178 706 Crew 673 1 885 Spaltensumme 1.490 711.01 1st Class 37,5% 6,5% 100,0% nd Class 58,6% 41,4% 100,0% 3rd Class 74,8% 5,% 100,0% Crew 76,0% 4,0% 100,0% Spaltensumme 67,7% 3,3% 100,0% 1st Class 0 105 35 nd Class 193 9 85 3rd Class 478 8 706 Crew 599 86 885 Spaltensumme 1.490 711.01 1st Class 67,7% 3,3% 100,0% nd Class 67,7% 3,3% 100,0% 3rd Class 67,7% 3,3% 100,0% Crew 67,7% 3,3% 100,0% Spaltensumme 67,7% 3,3% 100,0% Statstk für SozologInnen 1 6

Beobachtete mnus erwartete Häufgket überlebt NEIN JA Zelensumme 1st Class -98,0 98,0 0 nd Class -5,9 5,9 0 3rd Class 50,1-50,1 0 Crew 73,9-73,9 0 Spaltensumme 0 0 0 Statstk für SozologInnen 13 -Statstk Berechnung des -Wertes l m 1 j1 Beobachteter Wert Erwarteter Wert Erwarteter Wert l... Anzahl der Zelen m... Anzahl der Spalten Anzahl der Frehetsgrade: (l-1)(m-1) Statstk für SozologInnen 14 7

Form der Ch²-Vertelungsdchte Statstk für SozologInnen 15 -Statstk o11 e11 e11 1st Class 43,7 91,5 135, nd Class 3,5 7,3 10,8 3rd Class 5, 11,0 16, Crew 9,1 19,1 8, Spaltensumme 61,5 18,9 190,4 l m 1 j1 o e e Statstk für SozologInnen 16 8

Dchtefunkton der -Vertelung Dchtefunkton der -Vertelung mt 3 Frehetsgraden 0.0 0.05 0.10 0.15 0.0 0.5 krtscher Berech 0 5 10 15 0 3;0,95 7,81 Statstk für SozologInnen 17 -Statstk 190,4 7, 81 nach Überleben > krtsch Hoch sgnfkantes Ergebns; Unterschede zwschen den Überlebenschancen n den verschedenen n können wohl ncht zufällg sen Es bestehen sgnfkante Unterschede zwschen den beobachteten und den erwarteten Werten Überlebende Personen snd eher n den höherwertgen Unterkunftsklassen zu fnden Statstk für SozologInnen 18 9

Analyse von 3 Merkmalen Log-lneare Modelle: Werkzeug zur Analyse höher-dmensonaler Häufgketstabellen Statstk für SozologInnen 19 Äquvalenz zu -Stchprobenantelstest Beobachtete Response No Response Total Krtscher Wert be =0,01 6,634897 absolut DCF 43 68 111 Krtscher Wert be =0,05 3,841459 CF 6 86 11 69 154 3 Abwechung Beobachtete Response No Response Total Response No Response Total Zelenprozent DCF 38,7% 61,3% 111 DCF 8,655-8,655 0,000 CF 3,% 76,8% 11 CF -8,655 8,655 0,000 30,9% 69,1% 3 0,000 0,000 0,000 Erwartete Response No Response Total CHI-WERT Zelenprozent DCF 30,9% 69,1% 111 Response No Response Total CF 30,9% 69,1% 11 DCF,181 0,977 30,9% 69,1% 3 CF,161 0,968 6,88 Erwartete Response No Response Total absolut DCF 34,35 77 111 p-value 0,01 6,88 CF 35 77 11 69 154 3 Statstk für SozologInnen 0 10

Ausrechende Fallzahl und de Yates-Korrektur De Approxmaton der Stchprobenvertelung mt der statstk darf nur angewendet werden, wenn alle erwarteten Häufgketen 5 snd. Andernfalls müssen Zelen bzw. Spalten der Kreuztabelle zusammengefasst werden. Für den Fall der 4-Felder Tafel (Anzahl der Frehetsgrade = 1), wrd n der Praxs häufg de sogenannte Yates-Korrektur herangezogen: korr. l 1 m j1 o e e 0,5 Statstk für SozologInnen 1 Bespel zur Yates-Korrektur Anhand enes Labortests (Dgtals-Konzentraton m Blut) kann das Vorlegen ener bestmmten Krankhet nachgewesen werden. 1975 wurde dazu folgende Statstk veröffentlcht: T+ postver Test D+ D- Total T- negatver Test T+ 5 14 39 D+ krank T- 18 78 96 D- gesund Total 43 9 135 6,8 korr. 4,3 1;0,95 3,84 sgnfkantes Ergebns Statstk für SozologInnen 11

Berechnungsschema n Excel D+ D- Ohne Yates-Korrektur T+ 5 14 39 1,7353 5,9536 T- 18 78 96 5,17371,41815 p-value 43 9 135 6,8 0,00000030 D+ D- Mt Yates-Korrektur T+ 1,4 6,58 39 11,749 5,4885 T- 30,58 65,4 96 4,77055,971 p-value 43 9 135 4,3 0,00000085 krt. Wert: 11,3449 Funkton: CHITEST(Beobachtete Werte; Unter H0 erwartete Werte) Statstk für SozologInnen 3 Example wth SPSS Statstk für SozologInnen 4 1

Expected Frequences Statstk für SozologInnen 5 Dfference Observed - Expected Statstk für SozologInnen 6 13

Reduced Analyss x Table Statstk für SozologInnen 7 Smpson Paradoxon (1) Clncal Center I Treatment A B Sum response 10 100 110 no response 100 730 830 Sum 110 830 940 Clncal Center II Treatment A B Sum response 100 50 150 no response 50 0 70 Sum 150 70 0 Statstk für SozologInnen 8 Response A:10 von 110 9% B:100 von 830 1% p-value = 0,365 Response A:100 von 150 67% B:50 von 70 71% p-value = 0,480 14

Smpson Paradoxon () Data of Clncal Center I and II collapsed Treatment A B Sum response 110 150 60 no response 150 750 900 Sum 60 900 1160 p-value = 0,0001 Response A: 4% B:17% Statstk für SozologInnen 9 Anderer Problemstellung: Anpassungstest Vertelung der Augenzahl x be n = 35 Würfen mt enem antken Würfel x 1 3 4 5 6 n 37 17 49 59 8 45 Theoretsche Wahrschenlchket: P(X=x) = p = 1/6 = 0.167 Statstk für SozologInnen 30 15

Berechnung der -Statstk k 1 Beobachtet e Häufgket Erwartete Erwartete Häufgket Häufgket k 1 k n n p h p n p n 1 p n... Stchprobenumfang n... beobachtete Häufgket p... theoretsche Wahrschenlchket h = n /n... relatve Häufgket Statstk für SozologInnen 31 Arbetstabelle zur Bestmmung der Prüfgröße x n n n n n n p p p n p 1 37 39.17 -.17 0.10 17 39.17 -.17 1.548 3 49 39.17 9.83.467 4 59 39.17 19.83 10.039 5 8 39.17-11.17 3.185 6 45 39.17 5.83 0.868 n = 35 9.7 Würfel 9,7 Statstk für SozologInnen 3 16

Dchtefunkton der -Vertelung Dchtefunkton der -Vertelung mt 5 Frehetsgraden 0.0 0.05 0.10 0.15 krtscher Berech 0 5 10 15 0 5 krtsch Statstk für SozologInnen 33 -Statstk Berechnung des -Wertes 9,7 11, 07 Würfel > krtsch 5;0.95 sgnfkantes Ergebns (Sgnfkanznveau = 0.05); De beobachteten Häufgketen wechen sgnfkant von den unter der Annahme ener Glechvertelung erwarteten Häufgketen ab. er oder 5er werden mt dem antken Würfel seltener gewürfelt ( Seten de gegenüber legen!) Der antke Würfel st ken farer Würfel Statstk für SozologInnen 34 17

Bespel Mendel überprüfte sene Theoren über de Vererbungsgesetze durch Kreuzung verschedener Erbsensorten. Gemäß sener Theore sollte das Vorkommen von 4 Sorten m Verhältns 9:3:3:1 stehen. Ene Stchprobe von 556 Erbsen ergab: 315:108:101:3 Snd de beobachteten Abwechungen sgnfkant? Observed Soll-Odds Soll-Rel Expected (Obs-Exp)^ (O-E)^/E 315 9 0,565 31,75 5,065 0,016 108 3 0,1875 104,5 14,065 0,1349 101 3 0,1875 104,5 10,565 0,1013 3 1 0,065 34,75 7,565 0,176 556 16 1 556 0,4700 CHI(3;0,99) 11,345 Statstk für SozologInnen 35 Hnwese Der Ch-Quadrat Wert lefert ene summarsche Beurtelung der Abwechung ener emprschen Vertelung von ener theoretsch erwarteten Vertelung. Damt de Vertelung der Teststatstk approxmatv Ch-Quadrat vertelt st, müssen de erwarteten Häufgketen n jeder größer 5 sen. Ist des ncht der Fall müssen enzelne n aggregert werden. De Anzahl der Frehetsgrade st de Anzahl der n mnus ens. Falls zur Bestmmung der erwarteten Häufgketen auch Parameter geschätzt werden müssen, so snd de Frehetsgrade zusätzlch um de Anzahl der Parameter zu reduzeren. Statstk für SozologInnen 36 18