Bivariate Kreuztabellen
|
|
- Claus Bergmann
- vor 7 Jahren
- Abrufe
Transkript
1 Bivariate Kreuztabellen Kühnel, Krebs 2001 S Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
2 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ y 1 n 11 n 1j n 1J n 1 y i... n ij... n i y I n IJ n I Σ n 1 n j n J n Randverteilung Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
3 Vierfeldertabelle Beide Variablen dichotom, d.h. es gibt nur die Ausprägungen x 1, x 2 und y 1, y 2 Nur vier innere Zellen Vereinfachung zur Bezeichnung der absoluten Häufigkeiten: a= n 11 n 1 = a+b n = a+b+c+d b= n 12 n 2 = c+d c= n 21 n 1 = a+c d= n 22 n 2 = b+d Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
4 Absolute Häufigkeiten in der Vierfeldertabelle Randverteilung x 1 x 2 Σ y 1 a b a+b y 2 c d c+d Σ a+c b+c a+b+c+d Randverteilung Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
5 Absolute Häufigkeiten Beispiel Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
6 Relative Häufigkeiten bezogen auf die Gesamtfallzahl Randverteilung x 1 x 2 Σ y 1 n 11 / n 12 / n n n 1 / n y 2 n 21 / n 22 / n n n 2 / n Σ n 1 / n 2 / n n Randverteilung 1.0 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
7 Relative Häufigkeiten bezogen auf die Gesamtfallzahl Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
8 Relative Häufigkeiten bezogen auf die Gesamtfallzahl Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
9 Spaltenbezogene relative Häufigkeiten bedingte Verteilung Randvereilung unbedingte Verteilung x 1 x 2 Σ y 1 n 11 / n 12 / n 1 n 2 n 1 / n y 2 n 21 / n 22 / n 1 n 2 n 2 / n Σ Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
10 Spaltenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
11 Spaltenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
12 Zeilenbezogene relative Häufigkeiten bedingte Verteilung x 1 x 2 Σ y 1 n 11 / n 12 / n 1 n y 2 Σ n 21 / n 22 / n 2 n 2 n 1 / n 2 / n n Randverteilung unbedingte Verteilung Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
13 Zeilenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
14 Zeilenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
15 Zusammenhang zwischen den beiden Variablen in der Kreuztabelle Kein Zusammenhang (Variablen sind unabhängig): Prozentwerte der bedingten Verteilung entsprechen Prozentwerte der Randverteilung Zusammenhang (Variablen sind nicht unabhängig): Prozentwerte der bedingten Verteilung sind ungleich den Prozentwerten der Randverteilung Symmetrischer Zusammenhang: es gibt keine erklärende und keine abhängige Variable Asymmetrischer Zusammenhang: es gibt eine erklärende und eine abhängige Variable Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
16 Prozentsatzdifferenzen Maß für die Stärke des asymmetrischen Zusammenhangs Berechnung in der Vierfeldertabelle: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
17 Spaltenbezogene relative Häufigkeiten erklärende Variable abhängige Variable d yx %=59.3% %= Kein Zusammenhang zwischen Geschlecht und Einstellung zu Schwangerschaftsabbruch Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
18 Prozentsatzdifferenzen Vorzeichen spielt bei nominalskalierten Variablen keine Rolle d YX % = 0 bei identischen Spaltenprozentwerten :kein Zusammenhang d YX % = -100 bzw. d YX % = +100 bei perfektem Zusammenhang FAUSTREGELN d YX % > 25 PP starker Zusammenhang d YX % < 10 PP schwacher Zusammenhang d YX % < 5 PP nicht interpretierbar Vorsicht: Bei sehr schiefen Verteilungen können auch Prozentsatzdifferenzen kleiner fünf bedeutsam sein! Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
19 Prozentsatzdifferenzen Werden abhängige u. unabhängige Variable vertauscht: Prozentsatzdifferenz ändert isch. SPALTENPROZENT AWL: abhängige Variable EWL: erklärende Variable dxy%= =12.7 Prozentpunkte (PP) Schwacher Zusammenhang zwischen Einschätzung AWL auf Grund von EWL Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
20 Prozentsatzdifferenzen Werden abhängige u. erklärende Variable getauscht: Prozentsatzdifferenz ändert sich. ZEILENPROZENT EWL: abhängige Variable AWL: erklärende Variable dxy%= =27.7 Starker Zusammenhang zwischen Einschätzung EWL auf Grund von AWL Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
21 Unabhängigkeit zweier Variablen Statistische Unabhängigkeit liegt vor wenn, Prozentsatzdifferenz gleich 0 ist alternativ: X und Y (beide dichotom) in der Population sind unabhängig, wenn die relativen Häufigkeiten der bivariaten Verteilung gleich dem Produkt der relativen Häufigkeiten der univariaten Verteilung sind: bedingte Verteilung=unbedingte Verteilung Unabhängigkeit kann dann mittels Hypothesenprüfung nachgewiesen werden Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
22 Unabhängigkeit zweier Variablen Die bei statistischer Unabhängigkeit erwarteten absoluten Häufigkeiten e ij ergeben sich aus dem Produkt der relativen Häufigkeiten der entsprechenden Randverteilungen: Die erwarteten absoluten Häufigkeiten stellen somit Schätzungen von Durchschnittswerten dar Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
23 Unabhängigkeit zweier Variablen Erwartete Häufigkeiten bei Unabhängigkeit Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
24 Pearsons Chiquadrat Teststatistik zum Erfassen der Abweichung zwischen erwarteten und beobachteten Häufigkeiten Ermittlung: Quadrate der Differenzen zwischen erwarteten und beobachteten Häufigkeiten werden durch die jeweiligen ertwarteten Häufigkeiten dividiert und über alle vier Tabellenzellen aufsummiert: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
25 Pearsons Chiquadrat alternativ (in Vierfeldertabellen): 2 χ = 3489 ( 338* *1365) 464*3025*1703* = Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
26 Pearsons Chiquadrat Hypothesentest bei Unabhängikeit ist die Teststatistik χ² asymptotisch chiquadratverteilt mit df=1 Freiheitsgrad H0: Zeilen- und Spaltenvariablen sind unabhängig H1: Zeilen- und Spaltenvariablen sind abhängig Nachweis mittels einseitigem Hypothesentest Nullhypothese wird abgelehnt, wenn χ² größer ist als das 1-α-Quantil der Chiquadratverteilung mit df Freiheitsgraden Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
27 Pearsons Chiquadrat Hypothesentest Beispiel: χ² -Tabelle Quantilwert des 95% Quantils einer χ²- Verteilung mit df=1 Freiheitsgrad ist In einer χ² Verteilung haben 95% der Realisationen einen Wert kleiner gleich Da die Teststatistik χ² = größer ist als der kritische Wert 3.84 kann Nullhypothese abgelehnt werden Es besteht ein Zusammenhang zwischen EWL und AWL Häufigkeiten müssen in allen Tabellenzellen mindestens 5 sein!! Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
28 Eigenschaften Pearsons Chiquadrat Maximal höchster Wert für Teststatistik χ² ist der Stichprobenumfang n. Da χ² mit der Fallzahl variiert ist es unbrauchbar für ein Zusammenhangsmaß Gibt an ob ein Zusammenhang besteht, aber nicht, wie stark der Zusammenhang ist!! Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
29 Symmetrische Zusammenhangsmaße symmetrischer Zusammenhang, wenn nicht zwischen erklärender und abhängiger Variable unterschieden wird Phi Φ Yules Q basieren beide auf χ² Teststatistik Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
30 Symmetrisches Zusammenhangsmaß Phi berücksichtigt die Fallzahlabhängigkeit von χ²: Φ = Φ 2 alternative Berechnung in der Vierfeldertabelle: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
31 Symmetrisches Zusammenhangsmaß Phi mißt den Zusammenhang zwischen zwei Variablen der Vierfeldertabelle kein Zusammenhang Φ = 0 perfekter Zusammenhang Φ = 1 oder Φ = -1 Ab Ordinalskalenniveau und bei entsprechender Anordnung der Variablen (höchste bzw geringste Werte in der ersten Zeile ) kann das Vorzeichen folgendermaßen interpretiert werden: - positives Vorzeichen: positive Beziehung, bei höherem Spaltenwert ist mit höherem Zeilenwert zu rechnen und umgekehrt - negatives Vorzeichen: negative Beziehung, bei höherem Spaltenwert ist mit geringerem Zeilenwert zu rechnen und umgekehrt Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
32 Beispiel AWL & EWL 2 χ = 3489 ( 338* *1365) 464*3025*1703* = H0: AWL & EWL unabhängig ->ablehnen Φ = 338* * *3025*1703*1786 = Bessere Einschätzung der EWL führt zu besserer Einschätzung der AWL und umgekhrt Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
33 Yules Q "robustes" Zusammenhangsmaß, ist unempfindlich gegenüber Änderungen in den Randverteilungen der Kreuztabelle Berechnung: Q ist im allgemeinen größer als Φ, die Vorzeichen stimmt jedoch überein kein Zusammenhang Q = 0 perfekter Zusammenhang Q = 1 oder Q = -1 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
34 Unabhängigkeit in Mehrfeldertabellen bei Nominal skalierten Variablen Kühnel & Krebs 2001 S Symmetrischer Zusammenhang 1. Standardisierte Residuen 2. χ2 Test 3. Cramérs V Asymmetrischer Zusammenhang 1. PRE Maße 2. Relative Devianzreduktion 3. Likelihood Ratio Test Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
35 Symmetrischer Zusammenhang Unabhängigkeit in Mehrfeldertabellen Untersuchung mit Pearsons Chiquadrattest Unabhängigkeit liegt vor, wenn die gemeinsame Verteilung der relativen Häufigkeiten von X und Y in den Tabellenzellen mit dem Produkt der relativen Häufigkeiten der Randverteilungen von X und Y übereinstimmt entsprechendes Hypothesenpaar: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
36 Unabhängigkeit in Mehrfeldertabellen Ermittlung der erwarteten absoluten Häufigkeiten für alle inneren Zellen analog zur Vierfeldertabelle: ebenso die Berechnung der Teststatistik χ²: Damit ergibt sich für die Beispieltabelle: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
37 Unabhängigkeit in Mehrfeldertabellen Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
38 Standardisierte Residuen zur Beurteilung die Abweichung zwischen erwarteten und beobachteten Häufigkeiten Berechnung: Vorzeicheninterpretation: + beobachter Wert liegt über erwartetem - beobachter Wert liegt unter erwartetem standardisierte Residuen sind asymptotisch normalverteilt, Werte über +2 oder unter -2 weisen auf überzufällige Abweichungen hin (Irrtumswahrschienlichkeit α = 5 %) Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
39 χ² in Mehrfeldertabellen bei zutreffender Nullhypothese ist χ² asymptotisch chiquadratverteilt Berechnung der Freiheitsgrade: Im Beispiel: df = (5-1) (3-1) = 8 Ablesen des (1-α)-Quantils für df=8 χ² 8,0.95 =15,51 berechneter Wert im Beispiel χ²= 252,4 252,4 > 15,51 Nullhypothese ist abzulehnen Fazit: In der Population besteht wahrscheinlich ein Zusammenhang zwischen Konfession und Wahlabsicht Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
40 Cramérs V chiquadratbasiertes, symmetrisches Zusammenhangsmaß für nominalskalierte Variablen Verallgemeinerung von Φ² Berechnung: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
41 Cramérs V Vorzeichen kann ignoriert werden Werte von V oder χ² ändern sich bei Vertauschen von Zeilen oder Spalten nicht Für die Beispieltabelle Konfession/Wahlabsicht ergibt sich damit: χ² max = Interpretation: Wert für V zwischen 0,10 und 0,20 wird im Allgemeinen als gering bezeichnet Im Beispiel besteht ein mäßiger Zusammenhang zwischen Wahlabsicht und Konfession Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
42 Asymmetrischer Zusammenhang PRE-Maße PRE = proportional reduction errors proportionale Fehlerreduktion geben das Ausmaß der Verbesserung der Vorhersage von Y an, das bei Berücksichtigung von X erreicht werden kann berechnet wird der Anteil, um den sich der Fehler dabei verringert: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
43 Relative Devianzreduktion Unsicherheitskoeffizient, Likelihood-Ratio-Index, Coefficient of uncertainty Devianz: Streuungsmaß für nominalskalierte Variablen Maß für Vorhersagefehler Berechnung für Variable Y: Devianz ist Null bei perfekten Vorhersagen Berechnung für Variable X erfolgt über die Verteilung von X und Y: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
44 Relative Devianzreduktion Devianz läßt sich als Fehlermaß nutzen Konstruktion das PRE-Maßes P² YX gibt die relative Devianzreduktion von Y bei Kenntnis von X an: auch Likelihood-Ratio-Index oder Unsicherheitskoeffizient ist null bei Unabhängigkeit Interpretation: P² YX < 5% gilt als gering P² YX > 20% gilt als stark Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
45 Relative Devianzreduktion im Beispiel: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
46 Relative Devianzreduktion Veringerung der Devianz der Wahlabsicht um 3,8% bei Kenntnis der Konfession geringer Zusammenhang beim Vertauschen der Variablen ergibt sich ein anderer Wert: P² YX = 0,05 P² YX ist ein asymmetrisches Zusammenhangsmaß für nominalskalierte Variablen Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
47 Likelihood-Ratio-Test L² alternative, aber äquivalente Testmethode zu Pearsons Chiquadrattest prüft, ob die relative Devianzreduktion signifikant von null verschieden ist: Hypothesentest H0: D Y =D YX (D Y -D YX =0) H1: D Y <>D YX (D Y -D YX <>0) Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
48 Likelihood-Ratio-Test L² für das Beispiel Wahlabsicht & konfessionelle Zugehörigkeit ergibt sich L² = 237,67 H0: D Y =D YX H1: D Y <>D YX Ablesen des 95% Quantils bei df=8 ergibt 15,51 (Chiquadratverteilung mit α = 5 %) 237,67 > 15,51, also ist die Nullhypothese abzulehnen Wahlabsicht hängt signifikant von der konfessionellen Zugehörigkeit ab Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
Mehr11. Zusammenhangsmaße für nominale Variablen
Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung
MehrStatistik I im Sommersemester 2007
Themen am 18.6.2007: Statistik I im Sommersemester 2007 Zusammenhangsanalyse in der Vierfeldertabelle Von der Anteilsdifferenz zur Vierfeldertabelle Probeklausur 2 Lernziele: 1. Aufbau einer Kreuztabelle:
MehrKreuztabellenanalyse und Assoziationsmaße. Assoziationsmaße. Allgemeines Beispiel Graphiken Notation. Risiken. Drittvariablenkontrolle.
FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 1 Kreuztabellenanalyse und FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 2 Kreuztabellen eignen sich zur Darstellung und Analyse
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Mehrfeldertabellen und Zusammenhangsmaße 1. Mehrfeldertabellen und Zusammenhangsmaße:
MehrBivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
MehrEinführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
MehrZusammenhangsmaße II
Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:
MehrZusammenhangsmaße II
Sommersemester 2009 Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins: Kapitel
MehrSTATISTIK FÜR DIE SOZIALWISSENSCHAFTEN
Steffen-M. Kühnel Dagmar Krebs 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen Überblick
MehrV a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X
Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y 1 60 60 y 0 0 y 3
MehrAnalyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrStatistik II im Wintersemester 2006/2007
Statistik II im Wintersemester 2006/2007 Themen am 7.11. Drittvariablenkontrolle in der Tabellenanalyse Korrelation und Kausalität Statistische Tests in dreidimensionalen Kreuztabellen Lernziele: 1. Aufbau
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2008, Statistik mit SPSS
Sommersemester 2008, Statistik mit SPSS 27. August 2009 27. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Mehrfeldertabelle und Zusammenhangsmaße für nominale Daten 2. Mehrfeldertabelle
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße) 6
359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrAnalyse bivariater Kontingenztafeln
Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße)
5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrHypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.
Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrEinführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005
Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit
MehrWichtige statistische Koeffizienten und Formeln
Wichtige statistische Koeffizienten und Formeln Felix Baumann Skalenniveau Art des Koeffizienten Koeffizient Formel (ab) ominalskala: (Unterscheidung nach Gleichheit/Ungleichheit; jeder Ausprägung eine
MehrQuantitative Auswertung II. Korpuslinguistik Heike Zinsmeister
Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
MehrEinführung in Web- und Data-Science
Einführung in Web- und Data-Science Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Tanya Braun (Übungen) P-Wert (einseitiger Ablehnungsbereich) Hypothesentest H 0 vs. H 1
MehrInstitut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen
Institut für Soziologie Dipl. Soz. Methoden II Zusammenhangsmaße für kategoriale und metrische Variablen Organisatorisches Prüfungsanmeldung Methoden II Die Anmeldung zur Prüfung läuft über die Tafelübung.
MehrKreuztabellenanalyse. bedingte Häufigkeiten
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse bedingte Häufigkeiten 07. Dezember 2007 Michael Tiemann, Bundesinstitut für Berufsbildung,
MehrStatistik Einführung // Kategoriale Daten 10 p.2/26
Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten
MehrAnalytische Statistik II
Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,
MehrTutorial:Unabhängigkeitstest
Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrZweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz
Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
Mehr3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrLösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau
Lösungen zum Aufgabenblatt 2 1 Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Nach dem Laden des Datensatzes (G:\DATEN\METH2\DATEN\EUROBAR\ Euba30.sav) ist zunächst der
Mehr9 Prinzipien der statistischen Hypothesenprüfung
9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen
MehrChi Quadrat-Unabhängigkeitstest
Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrBivariate Verteilungen [bivariate data]
Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen
Mehr5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten
5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
Mehr2. Zusammenhangsmaße
2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch
Mehr6. Multivariate Verfahren Übersicht
6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
Mehr73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrVarianzvergleiche bei normalverteilten Zufallsvariablen
9 Mittelwert- und Varianzvergleiche Varianzvergleiche bei zwei unabhängigen Stichproben 9.3 Varianzvergleiche bei normalverteilten Zufallsvariablen Nächste Anwendung: Vergleich der Varianzen σa 2 und σ2
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
Mehr9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen
MehrHypothesentests II. Statistik I. Sommersemester Klausur Wiederholung t-tests. Zusammenfassung. Statistik I Hypothesentests I (1/37)
Hypothesentests II Statistik I Sommersemester 2009 Statistik I Hypothesentests I (1/37) Klausur Logik/z-Test Statistische Signifikanz 00 01 02 03 04 4 2 0 2 4 Statistik I Hypothesentests I (2/37) Informationen
Mehr