Bivariate Kreuztabellen
|
|
|
- Claus Bergmann
- vor 9 Jahren
- Abrufe
Transkript
1 Bivariate Kreuztabellen Kühnel, Krebs 2001 S Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
2 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ y 1 n 11 n 1j n 1J n 1 y i... n ij... n i y I n IJ n I Σ n 1 n j n J n Randverteilung Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
3 Vierfeldertabelle Beide Variablen dichotom, d.h. es gibt nur die Ausprägungen x 1, x 2 und y 1, y 2 Nur vier innere Zellen Vereinfachung zur Bezeichnung der absoluten Häufigkeiten: a= n 11 n 1 = a+b n = a+b+c+d b= n 12 n 2 = c+d c= n 21 n 1 = a+c d= n 22 n 2 = b+d Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
4 Absolute Häufigkeiten in der Vierfeldertabelle Randverteilung x 1 x 2 Σ y 1 a b a+b y 2 c d c+d Σ a+c b+c a+b+c+d Randverteilung Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
5 Absolute Häufigkeiten Beispiel Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
6 Relative Häufigkeiten bezogen auf die Gesamtfallzahl Randverteilung x 1 x 2 Σ y 1 n 11 / n 12 / n n n 1 / n y 2 n 21 / n 22 / n n n 2 / n Σ n 1 / n 2 / n n Randverteilung 1.0 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
7 Relative Häufigkeiten bezogen auf die Gesamtfallzahl Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
8 Relative Häufigkeiten bezogen auf die Gesamtfallzahl Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
9 Spaltenbezogene relative Häufigkeiten bedingte Verteilung Randvereilung unbedingte Verteilung x 1 x 2 Σ y 1 n 11 / n 12 / n 1 n 2 n 1 / n y 2 n 21 / n 22 / n 1 n 2 n 2 / n Σ Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
10 Spaltenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
11 Spaltenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
12 Zeilenbezogene relative Häufigkeiten bedingte Verteilung x 1 x 2 Σ y 1 n 11 / n 12 / n 1 n y 2 Σ n 21 / n 22 / n 2 n 2 n 1 / n 2 / n n Randverteilung unbedingte Verteilung Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
13 Zeilenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
14 Zeilenbezogene relative Häufigkeiten Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
15 Zusammenhang zwischen den beiden Variablen in der Kreuztabelle Kein Zusammenhang (Variablen sind unabhängig): Prozentwerte der bedingten Verteilung entsprechen Prozentwerte der Randverteilung Zusammenhang (Variablen sind nicht unabhängig): Prozentwerte der bedingten Verteilung sind ungleich den Prozentwerten der Randverteilung Symmetrischer Zusammenhang: es gibt keine erklärende und keine abhängige Variable Asymmetrischer Zusammenhang: es gibt eine erklärende und eine abhängige Variable Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
16 Prozentsatzdifferenzen Maß für die Stärke des asymmetrischen Zusammenhangs Berechnung in der Vierfeldertabelle: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
17 Spaltenbezogene relative Häufigkeiten erklärende Variable abhängige Variable d yx %=59.3% %= Kein Zusammenhang zwischen Geschlecht und Einstellung zu Schwangerschaftsabbruch Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
18 Prozentsatzdifferenzen Vorzeichen spielt bei nominalskalierten Variablen keine Rolle d YX % = 0 bei identischen Spaltenprozentwerten :kein Zusammenhang d YX % = -100 bzw. d YX % = +100 bei perfektem Zusammenhang FAUSTREGELN d YX % > 25 PP starker Zusammenhang d YX % < 10 PP schwacher Zusammenhang d YX % < 5 PP nicht interpretierbar Vorsicht: Bei sehr schiefen Verteilungen können auch Prozentsatzdifferenzen kleiner fünf bedeutsam sein! Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
19 Prozentsatzdifferenzen Werden abhängige u. unabhängige Variable vertauscht: Prozentsatzdifferenz ändert isch. SPALTENPROZENT AWL: abhängige Variable EWL: erklärende Variable dxy%= =12.7 Prozentpunkte (PP) Schwacher Zusammenhang zwischen Einschätzung AWL auf Grund von EWL Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
20 Prozentsatzdifferenzen Werden abhängige u. erklärende Variable getauscht: Prozentsatzdifferenz ändert sich. ZEILENPROZENT EWL: abhängige Variable AWL: erklärende Variable dxy%= =27.7 Starker Zusammenhang zwischen Einschätzung EWL auf Grund von AWL Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
21 Unabhängigkeit zweier Variablen Statistische Unabhängigkeit liegt vor wenn, Prozentsatzdifferenz gleich 0 ist alternativ: X und Y (beide dichotom) in der Population sind unabhängig, wenn die relativen Häufigkeiten der bivariaten Verteilung gleich dem Produkt der relativen Häufigkeiten der univariaten Verteilung sind: bedingte Verteilung=unbedingte Verteilung Unabhängigkeit kann dann mittels Hypothesenprüfung nachgewiesen werden Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
22 Unabhängigkeit zweier Variablen Die bei statistischer Unabhängigkeit erwarteten absoluten Häufigkeiten e ij ergeben sich aus dem Produkt der relativen Häufigkeiten der entsprechenden Randverteilungen: Die erwarteten absoluten Häufigkeiten stellen somit Schätzungen von Durchschnittswerten dar Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
23 Unabhängigkeit zweier Variablen Erwartete Häufigkeiten bei Unabhängigkeit Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
24 Pearsons Chiquadrat Teststatistik zum Erfassen der Abweichung zwischen erwarteten und beobachteten Häufigkeiten Ermittlung: Quadrate der Differenzen zwischen erwarteten und beobachteten Häufigkeiten werden durch die jeweiligen ertwarteten Häufigkeiten dividiert und über alle vier Tabellenzellen aufsummiert: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
25 Pearsons Chiquadrat alternativ (in Vierfeldertabellen): 2 χ = 3489 ( 338* *1365) 464*3025*1703* = Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
26 Pearsons Chiquadrat Hypothesentest bei Unabhängikeit ist die Teststatistik χ² asymptotisch chiquadratverteilt mit df=1 Freiheitsgrad H0: Zeilen- und Spaltenvariablen sind unabhängig H1: Zeilen- und Spaltenvariablen sind abhängig Nachweis mittels einseitigem Hypothesentest Nullhypothese wird abgelehnt, wenn χ² größer ist als das 1-α-Quantil der Chiquadratverteilung mit df Freiheitsgraden Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
27 Pearsons Chiquadrat Hypothesentest Beispiel: χ² -Tabelle Quantilwert des 95% Quantils einer χ²- Verteilung mit df=1 Freiheitsgrad ist In einer χ² Verteilung haben 95% der Realisationen einen Wert kleiner gleich Da die Teststatistik χ² = größer ist als der kritische Wert 3.84 kann Nullhypothese abgelehnt werden Es besteht ein Zusammenhang zwischen EWL und AWL Häufigkeiten müssen in allen Tabellenzellen mindestens 5 sein!! Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
28 Eigenschaften Pearsons Chiquadrat Maximal höchster Wert für Teststatistik χ² ist der Stichprobenumfang n. Da χ² mit der Fallzahl variiert ist es unbrauchbar für ein Zusammenhangsmaß Gibt an ob ein Zusammenhang besteht, aber nicht, wie stark der Zusammenhang ist!! Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
29 Symmetrische Zusammenhangsmaße symmetrischer Zusammenhang, wenn nicht zwischen erklärender und abhängiger Variable unterschieden wird Phi Φ Yules Q basieren beide auf χ² Teststatistik Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
30 Symmetrisches Zusammenhangsmaß Phi berücksichtigt die Fallzahlabhängigkeit von χ²: Φ = Φ 2 alternative Berechnung in der Vierfeldertabelle: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
31 Symmetrisches Zusammenhangsmaß Phi mißt den Zusammenhang zwischen zwei Variablen der Vierfeldertabelle kein Zusammenhang Φ = 0 perfekter Zusammenhang Φ = 1 oder Φ = -1 Ab Ordinalskalenniveau und bei entsprechender Anordnung der Variablen (höchste bzw geringste Werte in der ersten Zeile ) kann das Vorzeichen folgendermaßen interpretiert werden: - positives Vorzeichen: positive Beziehung, bei höherem Spaltenwert ist mit höherem Zeilenwert zu rechnen und umgekehrt - negatives Vorzeichen: negative Beziehung, bei höherem Spaltenwert ist mit geringerem Zeilenwert zu rechnen und umgekehrt Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
32 Beispiel AWL & EWL 2 χ = 3489 ( 338* *1365) 464*3025*1703* = H0: AWL & EWL unabhängig ->ablehnen Φ = 338* * *3025*1703*1786 = Bessere Einschätzung der EWL führt zu besserer Einschätzung der AWL und umgekhrt Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
33 Yules Q "robustes" Zusammenhangsmaß, ist unempfindlich gegenüber Änderungen in den Randverteilungen der Kreuztabelle Berechnung: Q ist im allgemeinen größer als Φ, die Vorzeichen stimmt jedoch überein kein Zusammenhang Q = 0 perfekter Zusammenhang Q = 1 oder Q = -1 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /33
34 Unabhängigkeit in Mehrfeldertabellen bei Nominal skalierten Variablen Kühnel & Krebs 2001 S Symmetrischer Zusammenhang 1. Standardisierte Residuen 2. χ2 Test 3. Cramérs V Asymmetrischer Zusammenhang 1. PRE Maße 2. Relative Devianzreduktion 3. Likelihood Ratio Test Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
35 Symmetrischer Zusammenhang Unabhängigkeit in Mehrfeldertabellen Untersuchung mit Pearsons Chiquadrattest Unabhängigkeit liegt vor, wenn die gemeinsame Verteilung der relativen Häufigkeiten von X und Y in den Tabellenzellen mit dem Produkt der relativen Häufigkeiten der Randverteilungen von X und Y übereinstimmt entsprechendes Hypothesenpaar: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
36 Unabhängigkeit in Mehrfeldertabellen Ermittlung der erwarteten absoluten Häufigkeiten für alle inneren Zellen analog zur Vierfeldertabelle: ebenso die Berechnung der Teststatistik χ²: Damit ergibt sich für die Beispieltabelle: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
37 Unabhängigkeit in Mehrfeldertabellen Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
38 Standardisierte Residuen zur Beurteilung die Abweichung zwischen erwarteten und beobachteten Häufigkeiten Berechnung: Vorzeicheninterpretation: + beobachter Wert liegt über erwartetem - beobachter Wert liegt unter erwartetem standardisierte Residuen sind asymptotisch normalverteilt, Werte über +2 oder unter -2 weisen auf überzufällige Abweichungen hin (Irrtumswahrschienlichkeit α = 5 %) Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
39 χ² in Mehrfeldertabellen bei zutreffender Nullhypothese ist χ² asymptotisch chiquadratverteilt Berechnung der Freiheitsgrade: Im Beispiel: df = (5-1) (3-1) = 8 Ablesen des (1-α)-Quantils für df=8 χ² 8,0.95 =15,51 berechneter Wert im Beispiel χ²= 252,4 252,4 > 15,51 Nullhypothese ist abzulehnen Fazit: In der Population besteht wahrscheinlich ein Zusammenhang zwischen Konfession und Wahlabsicht Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
40 Cramérs V chiquadratbasiertes, symmetrisches Zusammenhangsmaß für nominalskalierte Variablen Verallgemeinerung von Φ² Berechnung: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
41 Cramérs V Vorzeichen kann ignoriert werden Werte von V oder χ² ändern sich bei Vertauschen von Zeilen oder Spalten nicht Für die Beispieltabelle Konfession/Wahlabsicht ergibt sich damit: χ² max = Interpretation: Wert für V zwischen 0,10 und 0,20 wird im Allgemeinen als gering bezeichnet Im Beispiel besteht ein mäßiger Zusammenhang zwischen Wahlabsicht und Konfession Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
42 Asymmetrischer Zusammenhang PRE-Maße PRE = proportional reduction errors proportionale Fehlerreduktion geben das Ausmaß der Verbesserung der Vorhersage von Y an, das bei Berücksichtigung von X erreicht werden kann berechnet wird der Anteil, um den sich der Fehler dabei verringert: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
43 Relative Devianzreduktion Unsicherheitskoeffizient, Likelihood-Ratio-Index, Coefficient of uncertainty Devianz: Streuungsmaß für nominalskalierte Variablen Maß für Vorhersagefehler Berechnung für Variable Y: Devianz ist Null bei perfekten Vorhersagen Berechnung für Variable X erfolgt über die Verteilung von X und Y: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
44 Relative Devianzreduktion Devianz läßt sich als Fehlermaß nutzen Konstruktion das PRE-Maßes P² YX gibt die relative Devianzreduktion von Y bei Kenntnis von X an: auch Likelihood-Ratio-Index oder Unsicherheitskoeffizient ist null bei Unabhängigkeit Interpretation: P² YX < 5% gilt als gering P² YX > 20% gilt als stark Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
45 Relative Devianzreduktion im Beispiel: Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
46 Relative Devianzreduktion Veringerung der Devianz der Wahlabsicht um 3,8% bei Kenntnis der Konfession geringer Zusammenhang beim Vertauschen der Variablen ergibt sich ein anderer Wert: P² YX = 0,05 P² YX ist ein asymmetrisches Zusammenhangsmaß für nominalskalierte Variablen Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
47 Likelihood-Ratio-Test L² alternative, aber äquivalente Testmethode zu Pearsons Chiquadrattest prüft, ob die relative Devianzreduktion signifikant von null verschieden ist: Hypothesentest H0: D Y =D YX (D Y -D YX =0) H1: D Y <>D YX (D Y -D YX <>0) Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
48 Likelihood-Ratio-Test L² für das Beispiel Wahlabsicht & konfessionelle Zugehörigkeit ergibt sich L² = 237,67 H0: D Y =D YX H1: D Y <>D YX Ablesen des 95% Quantils bei df=8 ergibt 15,51 (Chiquadratverteilung mit α = 5 %) 237,67 > 15,51, also ist die Nullhypothese abzulehnen Wahlabsicht hängt signifikant von der konfessionellen Zugehörigkeit ab Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS /15
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
Bivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
11. Zusammenhangsmaße für nominale Variablen
Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung
Kreuztabellenanalyse und Assoziationsmaße. Assoziationsmaße. Allgemeines Beispiel Graphiken Notation. Risiken. Drittvariablenkontrolle.
FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 1 Kreuztabellenanalyse und FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 2 Kreuztabellen eignen sich zur Darstellung und Analyse
Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax
Was sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
Grundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Mehrfeldertabellen und Zusammenhangsmaße 1. Mehrfeldertabellen und Zusammenhangsmaße:
Bivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
Statistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
Einführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
Statistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
Bivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
Zusammenhangsmaße II
Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:
Zusammenhangsmaße II
Sommersemester 2009 Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins: Kapitel
STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN
Steffen-M. Kühnel Dagmar Krebs 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN
Analyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
Assoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
Statistik II im Wintersemester 2006/2007
Statistik II im Wintersemester 2006/2007 Themen am 7.11. Drittvariablenkontrolle in der Tabellenanalyse Korrelation und Kausalität Statistische Tests in dreidimensionalen Kreuztabellen Lernziele: 1. Aufbau
Hypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
Assoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten
Alternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
5.5 PRE-Maße (Fehlerreduktionsmaße) 6
359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
Analyse bivariater Kontingenztafeln
Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen
5.5 PRE-Maße (Fehlerreduktionsmaße)
5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
Zwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
Assoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.
Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die
Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005
Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit
Wichtige statistische Koeffizienten und Formeln
Wichtige statistische Koeffizienten und Formeln Felix Baumann Skalenniveau Art des Koeffizienten Koeffizient Formel (ab) ominalskala: (Unterscheidung nach Gleichheit/Ungleichheit; jeder Ausprägung eine
Quantitative Auswertung II. Korpuslinguistik Heike Zinsmeister
Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige
Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
Vorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen
Institut für Soziologie Dipl. Soz. Methoden II Zusammenhangsmaße für kategoriale und metrische Variablen Organisatorisches Prüfungsanmeldung Methoden II Die Anmeldung zur Prüfung läuft über die Tafelübung.
Kreuztabellenanalyse. bedingte Häufigkeiten
Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Kreuztabellenanalyse bedingte Häufigkeiten 07. Dezember 2007 Michael Tiemann, Bundesinstitut für Berufsbildung,
Analytische Statistik II
Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,
Tutorial:Unabhängigkeitstest
Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung
Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
Statistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
Parametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz
Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis
Zusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
Einführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
Prüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
Der χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
Statistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
Einführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
Test auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
Chi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer
1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
Statistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem
Statistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden
Forschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike [email protected] http://psymet03.sowi.uni-mainz.de/
Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau
Lösungen zum Aufgabenblatt 2 1 Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Nach dem Laden des Datensatzes (G:\DATEN\METH2\DATEN\EUROBAR\ Euba30.sav) ist zunächst der
9 Prinzipien der statistischen Hypothesenprüfung
9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn
Mathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen
Chi Quadrat-Unabhängigkeitstest
Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland
7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
2. Zusammenhangsmaße
2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch
6. Multivariate Verfahren Übersicht
6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression
Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
Varianzvergleiche bei normalverteilten Zufallsvariablen
9 Mittelwert- und Varianzvergleiche Varianzvergleiche bei zwei unabhängigen Stichproben 9.3 Varianzvergleiche bei normalverteilten Zufallsvariablen Nächste Anwendung: Vergleich der Varianzen σa 2 und σ2
Willkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
Vorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
Hypothesentests II. Statistik I. Sommersemester Klausur Wiederholung t-tests. Zusammenfassung. Statistik I Hypothesentests I (1/37)
Hypothesentests II Statistik I Sommersemester 2009 Statistik I Hypothesentests I (1/37) Klausur Logik/z-Test Statistische Signifikanz 00 01 02 03 04 4 2 0 2 4 Statistik I Hypothesentests I (2/37) Informationen
