Zusammenhangsanalyse in Kontingenztabellen
|
|
- Heini Fischer
- vor 7 Jahren
- Abrufe
Transkript
1 Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst Kontingenztafel Y h 11 h 12 h 1 X 2 h21 h 22 h 2 h 1 h 2 n Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 176 / 206
2 Chancen ( Odds ) Wir betrachten die Merkmale X und Y zunächst asymmetrisch: Die Ausprägungen von X definieren (hier 2) Subpopulationen, Y ist das interessierende binäre Merkmal in diesen Subpopulationen Unter einer Chance ( odds ) versteht man nun das Verhältnis zwischen dem Auftreten von Y = 1 und Y = 2 in einer Subpopulation X = a i. Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 177 / 206
3 Odds Ratio Die (empirische) bedingte Chance für festes X = a i ist bestimmt durch γ(1, 2 X = a i ) = h i1 h i2. Ein sehr einfaches Zusammenhangsmaß stellen die empirischen relativen Chancen (Odds Ratio) dar, die gegeben sind durch γ(1, 2 X = 1, X = 2) = γ(1, 2 X = 1) γ(1, 2 X = 2) = h 11/h 12 h 21 /h 22 = h 11h 22 h 21 h 12, d.h. γ(1, 2 X = 1, X = 2) ist das Verhältnis zwischen den Chancen der 1. Population (X = 1, 1. Zeile) zu den Chancen der 2. Population (X = 2, 2. Zeile). Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 178 / 206
4 Beispiel: Dauer der Arbeitslosigkeit Beschränkt man sich jeweils nur auf zwei Kategorien der Merkmale Ausbildungsniveau und Dauer der Arbeitslosigkeit, erhält man beispielsweise die Tabelle Kurzzeit- Mittel- und langfristige arbeitslosigkeit Arbeitslosigkeit Fachspezifische Ausbildung Hochschulabschluß 28 7 Daraus ergibt sich für Personen mit fachspezifischer Ausbildung die Chance, kurzzeitig arbeitslos zu sein, im Verhältnis dazu, mittel oder längerfristig arbeitslos zu sein, durch γ(1, 2 fachspezifisch) = = 2.5. Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 179 / 206
5 Für Arbeitslose mit Hochschulabschluß erhält man γ(1, 2 Hochschulabschluß) = 28 7 = 4. Für fachspezifische Ausbildung stehen die Chancen somit 5 : 2, für Arbeitslose mit Hochschulabschluß 4 : 1. Man erhält für fachspezifische Ausbildung und Hochschulabschluß die relativen Chancen (Odds Ratio) γ(1, 2 fachsp. Ausbildung, Hochschule) = = = Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 180 / 206
6 Interpretation Odds Ratio Wegen der spezifischen Form γ(1, 2 X = 1, X = 2) = (h 11 h 22 )/(h 21 h 12 ) werden die relativen Chancen auch als Kreuzproduktverhältnis bezeichnet. Es gilt γ = 1 Chancen in beiden Populationen gleich γ > 1 Chancen in Population X = 1 besser als in Population X = 2 γ < 1 Chancen in Population X = 1 schlechter als in Population X = 2. Die relativen Chancen geben somit an, welche der Populationen die besseren Chancen besitzen und um wieviel besser diese Chancen sind. Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 181 / 206
7 Symmetrie Für die Kontingenztafel h 11 h 12 h 21 h 22 ist das Kreuzproduktverhältnis (relative Chance oder Odds Ratio) bestimmt durch γ = h 11/h 12 h 21 /h 22 = h 11h 22 h 21 h 12. Die asymmetrische Betrachtung der Merkmale X und Y wird aufgehoben Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 182 / 206
8 Fall - Kontroll - Studien Beispiel: Morbus Alzheimer und Genetik ApoE3 ApoE4 Summe Kontrolle Fall OR = 593/ /803 = 0.34 Chance für ApoE3 bei Fällen um den Faktor 3 niedriger als bei Kontrollen? ApoE4 Risiko-Faktor für Morbus Alzheimer Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 183 / 206
9 Fall - Kontroll - Studien Zentrale Argumentation: Odds Ratio ist symmetrisches Maß d.h. Chancenverhältnis für Auftreten von ApoE4 bei Kontrolle zu Auftreten von ApoE4 bei Fällen Person ist krank bei ApoE3 zu Person ist krank bei ApoE4 Interpretation als Risikofaktor zulässig Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 184 / 206
10 Verallgemeinerung auf k m Kontingenztafeln, Anmerkungen Verallgemeinerung des Verfahres auf mehr als zwei Ausprägungen mindestens eines Merkmals: Man beschränkt sich auf jeweils zwei Zeilen X = a i und X = a j und zwei Spalten Y = b r und Y = b s und die zugehörigen vier Zellen einer (k m)-kontingenztafel. Verwendung einer Referenzkategorie Statt Odds Ratio wird oft der logarithmierte Odds Ratio verwendet Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 185 / 206
11 Anwendung: Apolipoprotein E und Morbus Alzheimer Etablierter Zusammenhang zwischen Apolipoprotein Eε4 und Morbus Alzheimer Daten aus Metaanalyse ApoE genotype ε2ε2 ε2ε3 ε2ε4 ε3ε3 ε3ε4 ε4ε4 Clinical controls Clinical Alzheimer PM controls PM Alzheimer Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 186 / 206
12 Anwendung: Apolipoprotein E und Morbus Alzheimer OR im Vergleich zu ε3ε3 (Referenz) ε2ε2 ε2ε3 ε2ε4 ε3ε3 ε3ε4 ε4ε4 OR (klinisch) OR (post mortem) Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 187 / 206
13 Kontingenz- und χ 2 -Koeffizient Ausgangspunkt: Wie sollten gemeinsame Häufigkeiten h ij bzw. f ij verteilt sein, damit - bei vorgegebenen Randverteilungen - die Merkmale X und Y als empirisch unabhängig angesehen werden können? b 1... b m a 1 h 1.?. a k h k h 1... h m n Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 188 / 206
14 Empirische Unabhängigkeit Idee: X und Y empirisch unabhängig Bedingte relative Häufigkeiten f Y (b 1 a i ),..., f Y (b m a i ), i = 1,..., k sind in jeder Schicht X = a i identisch, d.h. unabhängig von a i. Formal: f Y (b 1 a 1 ) = f (b 1 ),..., f Y (b m a 1 ) = f Y (b m ) f Y (b 1 a 2 ) = f (b 1 ),..., f Y (b m a 2 ) = f Y (b m ). =. f Y (b 1 a k ) = f (b 1 ),..., f Y (b m a k ) = f Y (b m ) Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 189 / 206
15 Kunstbeispiel: b 1 b 2 b 3 a a f Y (b 1 a 1 ) = f Y (b 1 a 2 ) = f Y (b 1 ) = 1 6 f Y (b 2 a 1 ) = f Y (b 2 a 2 ) = f Y (b 2 ) = 1 3 f Y (b 3 a 1 ) = f Y (b 3 a 2 ) = f Y (b 3 ) = 1 2 Bemerkung: Lokale Odds Ratios sind alle 1 Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 190 / 206
16 Wie sehen die erwarteten (absoluten und relativen) Häufigkeiten h ij und f ij also aus? f Y (b 1 a i ) = f (b 1 ),..., f Y (b m a i ) = f Y (b m ), i = 1,..., k h ij h i = h j n h ij = h i h j n f ij = f i f j Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 191 / 206
17 Unabhängigkeitstabelle Idee: Vergleiche für jede Zelle (i, j) h ij mit tatsächlich beobachteten h ij χ 2 -Koeffizient Der χ 2 -Koeffizient ist bestimmt durch χ 2 = k m (h ij h ) 2 ij = h ij i=1 j=1 k i=1 j=1 ( m h ij h i h j n h i h j n ) 2 = n i j (f ij f i f j f i f j Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 192 / 206
18 Eigenschaften des χ 2 -Koeffizienten: χ 2 [0, ) χ 2 = 0 X und Y empirisch unabhängig χ 2 groß starker Zusammenhang χ 2 klein schwacher Zusammenhang Nachteil: χ 2 hängt vom Stichprobenumfang n und von der Dimension der Tafel ab. Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 193 / 206
19 Kontingenzkoeffizient und korrigierter Kontingenzkoeffizient Weitere Normierung Kontingenzkoeffizient Der Kontingenzkoeffizient ist bestimmt durch χ K = 2 n + χ 2 und besitzt den Wertebereich K M = min{k, m}. [ ] M 1 0, M, wobei Der korrigierte Kontingenzkoeffizient ergibt sich durch M 1 K = K/ M mit dem Wertebereich K [0, 1]. Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 194 / 206
20 Eigenschaften des Kontingenzkoeffizienten Es wird nur die Stärke des Zusammenhangs gemessen, nicht die Richtung wie beim Odds Ratio. Vorsicht ist geboten bei einem Vergleich von Kontingenztafeln mit stark unterschiedlichen Stichprobenumfängen, da χ 2 mit wachsendem Stichprobenumfang wächst, beispielsweise führte eine Verzehnfachung von h ij und h ij zu zehnfachem χ 2. Sämtliche Maße benutzen nur das Nominalskalenniveau von X und Y. Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 195 / 206
21 Beispiel: Sonntagsfrage Für die Kontingenztafel aus Geschlecht und Parteipräferenz für das Beispiel der Sonntagsfrage erhält man die in der folgenden Tabelle wiedergegebenen zu erwartenden Häufigkeiten h ij. CDU/CSU SPD FDP Grüne Rest Männer (144) (153) (17) (26) (95) 435 Frauen (200) (145) (30) (50) (71) Zu erwartende Häufigkeiten h ij und tatsächliche Häufigkeiten h ij (in Klammern) Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 196 / 206
22 Interpretation: Wenn Geschlecht und Parteipräferenz keinen Zusammenhang aufweisen, wären die CDU/CSU präferierende Männer zu erwarten. Tatsächlich wurden aber nur 144 beobachtet. χ 2 -Wert von , K = 0.145, K = Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 197 / 206
23 Spezialfall: (2 2)-Tafel Für den Spezialfall einer (2 2)-Tafel erhält man χ 2 aus χ 2 = a b a + b c d c + d a + c b + d n(ad bc) 2 (a + b)(a + c)(b + d)(c + d). Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 198 / 206
24 Beispiel: Arbeitslosigkeit Aus der Kontingenztafel Mittelfristige Langfristige Arbeitslosigkeit Arbeitslosigkeit Keine Ausbildung Lehre erhält man also unmittelbar χ 2 = und K = 0.165, K = ( ) = Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 199 / 206
25 Mehrdimensionale Kontingenztabellen Beispiel: Überleben beim Titanic-Untergang Mehrere diskrete Merkmale: Geschlecht, Klasse, Kind/ Erwachsene, Überleben (Ja/Nein) Darstellung durch geeignete bedingte und marginale Verteilungen Berechnung von Odds-Ratio zweier Merkmale bedingt auf ein drittes Merkmal Graphische Darstellung durch Mosaik-Plot Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 200 / 206
26 Mosaik-Plot Flächentreue Darstellung von Häufigkeiten Aufteilung schrittweise Zuerst Einflussgröße, zum Schluss nach Zielgröße aufteilen Gut geeignet für mehrkategoriale ordinale Daten Auch für höhere Dimensionen geeignet Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 201 / 206
27 Beispiel: Überlebende bei Titanic Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 202 / 206
28 Beispiel: Überlebende bei Titanic Deskriptive Statistik WiSe 2009/2010 Helmut Küchenhoff (Institut für Statistik, LMU) 203 / 206
Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München
Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 1 Multivariate Statistik 192 Einführung In den meisten Anwendungen
MehrKapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen
Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen 5.1 Darstellung der Verteilung zweidimensionaler Merkmale 5.2 Maßzahlen für den Zusammenhang zweier nominaler Merkmale 5.3 Maßzahlen
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten
MehrDeskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j
1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b
MehrEinführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
MehrStatistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.
Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },
Mehr5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten
5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale
Mehr9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem
MehrSkalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrMedizinisches Beispiel
Problemstellung Stimmen zwei oder mehrere Beobachter in ihrer Einschätzung überein? (im engl.: rater agreement oder interrater agreement) Beispiel: Zwei Professoren beurteilen die Referate oder Seminararbeiten
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge
Mehr19 Punkte. Aufgabe 1. Einkommen niedrig mittel hoch Männer Frauen Geschlecht. a) Bestimmen Sie die fehlenden Werte!
Aufgabe 1 19 Punkte Sie haben die Einkommensdaten von 369 Personen gegeben. Diese wurden in die Gehaltsgruppen niedrige, mittlere und hohe Einkommensklassen kategorisiert - jeweils nach Frauen und Männer
MehrMusterlösung zur Aufgabensammlung Statistik I Teil 3
Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
Mehr0 Einführung: Was ist Statistik
0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
Mehr5 Assoziationsmessung in Kontingenztafeln
5 Assoziationsmessung in Kontingenztafeln 51 Multivariate Merkmale 51 Multivariate Merkmale Gerade in der Soziologie ist die Analyse eindimensionaler Merkmale nur der allererste Schritt zur Beschreibung
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
Mehr5 Beschreibung und Analyse empirischer Zusammenhänge
5 Beschreibung und Analyse empirischer Zusammenhänge 132 5 Beschreibung und Analyse empirischer Zusammenhänge 5.1 Zusammenhänge zwischen kategorialen Merkmalen 137 5.1.1 Kontingenztabellen 137 Verteilungen
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße) 6
359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrV a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X
Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y 1 60 60 y 0 0 y 3
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
MehrVl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle
Vl. 5.12.11 3. Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen schnell mittel langsam 3 Arten von Häufigkeitstabellen: Absolute Häufigkeitstabelle relative Häufigkeitstabelle
MehrAnalyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
MehrInhaltsverzeichnis (Ausschnitt)
4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrStatistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.
Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc
MehrStatistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt
Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrBivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
Mehr5 Assoziationsmessung in Kontingenztafeln
5 Assoziationsmessung in Kontingenztafeln 225 5.1 Multivariate Merkmale Die Analyse eindimensionaler Merkmale ist nur der allererste Schritt zur Beschreibung der Daten. Meist ist die Analyse von Zusammenhängen
MehrKreisdiagramm, Tortendiagramm
Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte
Mehr11. Zusammenhangsmaße für nominale Variablen
Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrStatistik I für Betriebswirte Vorlesung 10
Statistik I für Betriebswirte Vorlesung 10 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. Juni 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 10 Version: 13.
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrAnalyse von Kontingenztafeln bei ordinalskalierten Merkmalen
Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen Weisen die in einer Kontingenztafel dargestellten Merkmale zusätzlich Ordinalskalenniveau auf, so kommen auch Kenngrößen zum Einsatz, die in
MehrGrundlagen der Statistik
Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe
Mehr= 0.445, also annähernd die Hälfte aller Männer zugelassen 557
1 Einleitung Es soll anhand des UCBAdmissions Datensatzes die Frage beantwortet werden, ob bei der Zulassung von Studenten Frauen benachteiligt werden. Die Stichprobe lautet zunächst # Daten (UCB
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei gleichzeitiger Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich auch im Bereich der deskriptiven
MehrTHEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ
W THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI W Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training Dr. Torsten Scholz
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße)
5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehr5.Tutorium Generalisierte Regression
5.Tutorium Generalisierte Regression - Multinomiales/Kummulatives Logit-Modell - Cynthia Huber: 09.12.2014 und 16.12.2014 Michael Hanselmann: 18.12.2014 Institut für Statistik, LMU München 1 / 16 Gliederung
MehrStatistik I für Betriebswirte Vorlesung 10
Statistik I für Betriebswirte Vorlesung 10 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 13. Juni 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
Mehr3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrKapitel VIII - Mehrdimensionale Merkmale
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Mehrdimensionale Merkmale Deskriptive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh
MehrChi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge
Chi² Test und Kontingenzoeffizient Für nominalsalierte Daten: - diese haben unterschiedliche Ausprägung, - aber eine natürliche Reihenfolge 1. Chi² Test Test nominalsalierter Daten Vergleich von beobachteten
MehrEmpirische Verteilungsfunktion
Empirische Verteilungsfunktion H(x) := Anzahl der Werte x ist. Deskriptive
MehrW-Rechnung und Statistik für Ingenieure Übung 5
W-Rechnung und Statistik für Ingenieure Übung 5 Grafische/ tabellarische Darstellung für bivariate Daten diskrete Merkmale (qualitativ+ quantitativ diskret) stetige Merkmale (quantitativ stetig) Zusammenhangsmaße
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
MehrStatistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................
MehrMathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
MehrDr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1
2.1 Beispiele 2.2 Odds Ratio 2.3 Modell der logistischen Regression 2.3.1 Modellgleichung 2.3.2 Voraussetzungen 2.4 Schätzungen, Tests und Modellgüte 2.4.1 Schätzung der logistischen Regressionskoeffizienten
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate
MehrStatistik Klausur Wintersemester 2013/2014 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 1 1. Klausur Wintersemester 2013/2014 Hamburg, 12.02.2014 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrGrundlagen der Statistik
www.nwb.de NWB Studium Betriebswirtschaft Grundlagen der Statistik Band 1: Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 12., vollständig überarbeitete Auflage nwb STUDIUM Inhaltsverzeichnis
MehrGrundlagen der Statistik I
NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis
Mehr3 Bivariate Deskription und Exploration von Daten
3 Bivariate Deskription und Exploration von Daten In diesem Kapitel werden Methoden zur Darstellung der gemeinsamen Verteilung von zwei (oder mehreren) verschiedenen Merkmalen behandelt. Von besonderer
MehrInhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale
1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................
MehrDeskriptive Statistik
Helge Toutenburg Christian Heumann Deskriptive Statistik Eine Einführung in Methoden und Anwendungen mit R und SPSS Siebte, aktualisierte und erweiterte Auflage Mit Beiträgen von Michael Schomaker 4ü Springer
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrVoraussetzung für statistische Auswertung: jeder Fall besitzt in bezug auf jedes Merkmal genau eine Ausprägung
Rohdaten Urliste oder Rohdaten sind die auszuwertenden Daten in der Form, wie sie nach der Datenerhebung vorliegen. Dimensionen der Urliste sind die Fälle, Merkmale und ihre Ausprägungen. Voraussetzung
MehrÜbungsblatt 3: Bivariate Deskription I (Sitzung 4)
1 Übungsblatt 3: Bivariate Deskription I (Sitzung 4) Aufgabe 1 Eine Kreuztabelle beinhaltet unterschiedliche Verteilungen. a) Geben Sie an, wie diese Verteilungen heißen und was sie beinhalten. b) Welche
MehrStatistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................
MehrTabellarische und graphie Darstellung von univariaten Daten
Part I Wrums 1 Motivation und Einleitung Motivation Satz von Bayes Übersetzten mit Paralleltext Merkmale und Datentypen Skalentypen Norminal Ordinal Intervall Verältnis Merkmalstyp Diskret Stetig Tabellarische
MehrBivariate Verteilungen [bivariate data]
Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrSoftware oder Tabellen (nicht Thema dieser Veranstaltung).
p-wert p-wert Der p-wert ist die Wahrscheinlichkeit, dass die Testgröße den beobachteten Wert oder einen noch extremeren Wert (,,weiter weg von H 0 ) annimmt unter der Bedingung, dass H 0 wahr ist. Bemerkungen
MehrKontingenztabellen. Worum geht es in diesem Modul?
Kontingenztabellen Worum geht es in diesem Modul? Die Ausgangssituation Die 2x2 Felder Tafel Randverteilungen in 2x2-Tafeln Bedingte Häufigkeiten in 2x2-Tafeln Die IxJ-Felder Tafel Kontingenztabelle und
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrStatistik Einführung // Kategoriale Daten 10 p.2/26
Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrBiometrieübung 11 Kontingenztafeln
Biometrieübung 11 (Kontingenztafeln) - Aufgabe Biometrieübung 11 Kontingenztafeln Aufgabe 1 2x2-Kontingenztafeln 100 weibliche Patienten sind mit einer konventionellen Therapie behandelt worden 85 Patientinnen
MehrBasis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Überlebenszeitanalyse
Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Überlebenszeitanalyse Mit Datensatz Daten_Übung_Überlebenszeitanalyse.sav 1) Zeichnen Sie die Kaplan-Meier-Kurven des progressionsfreien
MehrGrundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).
Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,
MehrÜbungsaufgaben, Statistik 1
Übungsaufgaben, Statistik 1 Kapitel 3: Wahrscheinlichkeiten [ 4 ] 3. Übungswoche Der Spiegel berichtet in Heft 29/2007 von folgender Umfrage vom 3. und 4. Juli 2007:,, Immer wieder werden der Dalai Lama
MehrBiometrie. Regressionsmodelle
1 Regressionsmodelle Einflussgrößen Zielgröße (Alter, Geschlecht Blutdruck) Zielgröße entscheidet über das Regressionsmodell stetige Zielgröße lineare Regression binäre Zielgröße logistische Regression
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrAnalyse bivariater Kontingenztafeln
Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen
Mehr