2. Zusammenhangsmaße
|
|
- Gottlob Wetzel
- vor 6 Jahren
- Abrufe
Transkript
1 2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch besonders die jeweilige Stärke und die Richtung eines Zusammenhangs. Hierfür wurden statistische Kennzahlen, sog. Kontigenz- bzw. Korrelationskoeffizienten entwickelt. Diese Koeffizienten weisen zudem meist einen standardisierten Wertebereich auf, der Wertbereich ist also unabhängig von der Tabellengröße und dem Stichprobenumfang. Die Verwendbarkeit bzw. Interpretierbarkeit dieser Koeffizienten ist abhängig vom Skalenniveau der Variablen X und Y, da die Koeffizienten unterschiedliche Informationen der Variablen ausschöpfen. Kennwerte für nominalskalierte Variablen basieren in erster Linie auf der χ²-statistik, bei ordinalen Daten können auch Differenzen zwischen Rangplätzen betrachtet bzw. Paarvergleiche durchgeführt werden. Bei intervallskalierten Daten stehen mit Mittelwert und Standardabweichung weitere statistische Kennwerte zur Verfügung. Werden zwei Variablen X,Y mit unterschiedlichen (gemischten) Skalenniveaus betrachtet, ergeben sich Sonderfälle der Koeffizienten. Ein weiterer Spezialfall sind dichotome Variablen (Variablen mit ausschließlich zwei Werten: 0 und 1). Ganz allgemein kann man statistische Zusammenhänge als Abweichungen betrachten, die einem gewissen Muster folgen. Dies könnte beispielsweise in einer Formulierung zusammengefasst werden wie: je höher der Wert für X, desto höher auch der Wert für Y. Ein eindeutiger Zusammenhang verbirgt sich hinter der Aussage Immer wenn X..., dann ist Y.... Derartige Aussagen sind in den Sozialwissenschaften jedoch nahezu nie zu treffen. In aller Regel liegen keine eindeutigen Zusammenhänge vor es sind nur Wahrscheinlichkeitsschätzungen möglich bzw. nötig. Unterschieden nach den Skalenniveaus spricht man bei dichotomen und nominalen Variablen von Kontingenz, bei ordinaler Skalierung von Rangkorrelationen und bei intervallskalierten Daten von Produkt-Moment-Korrelationen bzw. schlicht von Korrelationen.
2 2.1 Zusammenhang zweier dichotomer Variablen Bei zwei dichotomen Variablen (einer Vierfelder-Tafel) steht als Maß für den Zusammenhang der sog. Phikoeffizient zur Verfügung. Er berechnet sich nach folgender Formel: Φ ± 2 χ n Der numerische Wert von Φ kann theoretisch zwischen den Werten 1 und 1 liegen, wobei 0 keinen Zusammenhang (statistische Unabhängigkeit, kein Einfluss) bedeutet und 1 bzw. 1 einem vollständigen (negativen bzw. positiven) Zusammenhang entspricht (perfekte Determination). 2.2 Zusammenhang zwischen zwei nominalen Variablen Bei zwei nominalen Variablen wird ein standardisiertes χ²-maß verwendet, sogenannte Kontingenzkoeffizienten. Der gebräuchlichste Kontingenzkoeffizient ist Cramer s V: Cramer' sv 2 χ n( s 1) Hierbei gibt s die kleinere Anzahl der Kategorien, entweder die Anzahl der Spalten- oder der Zeilenkategorien an. Der numerische Wert von Cramer s V kann theoretisch zwischen den Werten 0 und 1 liegen, wobei 0 keinen Zusammenhang (statistische Unabhängigkeit, kein Einfluss) bedeutet und 1 einem vollständigen Zusammenhang entspricht (perfekte Determination). (Beispiel ALLBUS-Daten)
3 2.3 Zusammenhang zwischen zwei ordinalen Variablen Rangkorrelationen kann man entweder auf der Basis von Differenzen zwischen den Rängen bzw. Rangplätzen für die Werte der Variablen X und Y berechnen. Ein Beispiel wäre der Rangkorrelationskoeffizient R nach Spearman: Rangkorrelationskoeffizient R / Spearman-Rangkorrelation / r s / rho R n 6 n ( n i d 2 i 1) wobei d i ² Quadrat der Rangplatzdifferenzen Eine andere Möglichkeit besteht in Paarvergleichen (durchgeführt über alle Fälle), bei denen beobachtet wird, ob die jeweiligen Rangfolgen übereinstimmen (konkordant sind) oder nicht (diskordant sind). Ein Beispiel hierfür wäre die Rangkorrelation τ nach Kendall. Rangkorrelationskoeffizient nach Kendall (Kendalls τ) τ S n( n 1) 2 2S n( n 1) basiert auf Paarvergleichen wobei S Differenz der konkordanten und diskordanten Paarvergleiche Auch hier liegen die numerischen Werte der Koeffizienten theoretisch zwischen den Extremen -1 und 1, wobei 0 keinem Zusammenhang (statistische Unabhängigkeit, kein Einfluss) bedeutet und 1 bzw. 1 einem vollständigen (negativen bzw. positiven) Zusammenhang entspricht (perfekte Determination).
4 Prinzip der Paarvergleiche, Berechnung von Gamma (γ) Y X x--,y- x-,y0 x-, y++ + x+, y+ x < x und y < y0 konkordantes Paar (grau) x + > x und y+ < y++ diskordantes Paar (schwarz) γ N N c c N + N d d wobei N c die Anzahl der konkordanten und N d die der diskordanten Paare angibt. wenn N c > N d dann ist γ > 0 positiver Zusammenhang wenn N c < N d dann ist γ < 0 negativer Zusammenhang wenn N c N d dann ist γ 0 kein Zusammenhang
5 2.4 Zusammenhang zwischen zwei intervallskalierten Variablen Das Zusammenhangsmaß für zwei intervallskalierte Variablen errechnet sich, indem man für jeden Fall (jede Person) das Produkt berechnet aus der Differenz vom gemessenen Wert der Variable X und deren Mittelwert und der Differenz vom gemessenen Wert der anderen Variable Y und deren Mittelwert. Diese Produkte werden aufaddiert. Die Summe der Abweichungsprodukte wird auch als Kovarianz bezeichnet. Die Kovarianz wird anschließend in Bezug auf die Fallzahl und die Standardabweichung der Variablen X und Y relativiert: r ( xi x)( yi y) n s x s y Produkt-Moment-Korrelationen werden auch Pearson-Korrelationen genannt. Auch hier liegen die numerischen Werte der Koeffizienten theoretisch zwischen den Extremen 1 und 1, wobei 0 keinen Zusammenhang (statistische Unabhängigkeit, kein Einfluss) bedeutet und 1 bzw. 1 einem vollständigen (negativen bzw. positiven) Zusammenhang entspricht (perfekte Determination). (geometrische Veranschaulichung)
6 2.5 Zusammenhang zwischen gemischt skalierten Variablen Für manche denkbaren Kombinationsmöglichkeiten von Skalenniveaus wurden inzwischen (teilweise auch mehrere) Zusammenhangsmaße entwickelt. Nicht alle davon sind in den Sozialwissenschaften gebräuchlich und sind mit Hilfe von Standardprogrammen wie SPSS errechenbar. Für gemischt skalierte Variablen X,Y findet sich daher oft die Empfehlung, auf das nächstniedrigere Skalenniveau auszuweichen, das für beide Variablen akzeptiert werden kann. In der Regel werden Zusammenhänge bei der Annahme eines zu niedrigen Skalenniveaus eher unterschätzt. Dieses Verfahren wird auch als konservative Vorgehensweise bezeichnet, da eher in Kauf genommen wird, einen Zusammenhang nicht zu finden, als fälschlich unzutreffende Skalenannahmen zu treffen. In der folgenden Übersicht finden sich unterhalb der Diagonalen die Koeffizienten nach der konservativen Empfehlung, oberhalb die bereits entwickelten Maße. Skalenniveau dichotom nominal ordinal intervall dichotom Phi-Koeffizient Kontingenzkoeffi- Biserialer Punktbiseriale Korrel. zient, Cramer s V Rangkorrela- tetrachorischr o. bise- tionskoeffizient riale Korrelation nominal Kontingenzko- Kontingenzkoeffi- --- effizient, Cra- zient, Cramer s V Eta mer s V ordinal Kontingenzko- Kontingenzkoeffi- Spearman-Rang- --- effizient, Cra- zient, Cramer s V korrelation, Kendall s mer s V Tau, Gamma intervall Kontingenzko- Kontingenzkoeffi- Spearman-Rang- Pearson s r, Produkt- effizient, Cra- zient, Cramer s V korrelation, Kendall s Moment-Korrelation mer s V Tau, Gamma
7 Interpretationshilfe von Zusamenhangsmaßen Bestimmung des höchsten gemeinsamen Skalenniveaus beider Variablen... Skalenniveau Koeffizient standard. Wertebereich dichotom Phi -1 bis 1 nominal Cramer`s V 0 bis 1 ordinal z.b. Spearman Rangkorrelation / Kendalls tau -1 bis 1 intervall Korrelation nach Pearson -1 bis 1 Analysefragen: 1) Ist der Zusammenhang signifikant? 2) Welche Richtung hat der Zusammenhang (Vorzeichen)? 3) Wie groß ist der Zusammenhang? Hilfestellung zur Verbalisierung von Zusammenhangsgrößen: nach Bühl / Zöfel: Betrag des Koeffizienten Interpretation 0 keine Korrelation 0 < r < 0,2 sehr gering 0,2 < r < 0,5 gering 0,5 < r < 0,7 mittel 0,7 < r < 0,9 hoch 0,9 < r < 1 sehr hoch 1 perfekt nach Brosius: Betrag des Koeffizienten Interpretation 0 keine Korrelation 0 < r < 0,2 sehr schwach 0,2 < r < 0,4 schwach 0,4 < r < 0,6 mittel 0,6 < r < 0,8 stark 0,8 < r < 1 sehr stark 1 perfekt nach Kühnel / Krebs: Betrag des Koeffizienten Interpretation 0 keine Korrelation 0 < r < 0,05 unbedeutend 0,05 < r < 0,20 gering 0,20 < r < 0,50 mittel 0,50 < r < 0,70 hoch 0,70 < r < 1 sehr hoch 1 perfekt
8 Korrelationsanalyse Korrelationen sind nicht anderes als die bereits besprochenen bivariaten Zusammenhangsmaße. Berechnet man Korrelationen für mehr als zwei Variablen, erhält man eine sog. Korrelationsmatrix, z.b. V1 V2 V3 V4 V5 V6 _ V1 1.0 V V V V V In dieser Matrix sind alle bivariaten Kombinationen der untersuchten Variablen abzulesen. In der Diagonale findet sich jeweils die Korrelation einer Variable mit sich selbst sie ist gleich 1.0. Da Korrelationen keine Aussage über Ursache und Wirkung zulassen, sondern nur das gemeinsame Auftreten von Merkmalskombinationen, sind Korrelationsmatrizen immer symmetrisch. Der Zusammenhang zwischen V1 und V2 ist gleich dem von V2 mit V1. Deshalb werden in der Regel die Werte über der Diagonale nicht dargestellt. Für die Durchführung der Korrelationsanalyse sind folgende Schritte notwendig: 1) Auswahl der Variablen 2) Auswahl des angemessenen (gemeinsamen) Skalenniveaus 3) Entscheidung über die Behandlung fehlender Werte Behandlung fehlender Werte Aus verschiedenen Gründen können bei einzelnen Personen bei einzelnen Variablen keine gültigen Werte vorliegen. Diese fehlenden Werte werden auch missings genannt. Werden innerhalb einer Analyse mehrere Variablen verwendet, gibt es im wesentlichen zwei Varianten, wie mit diesem Problem umgegangen werden kann: Listenweiser Ausschluss Es werden nur Daten von Personen ausgewertet, die für alle Variablen gültige Werte haben. Personen, die auch nur bei einer Variable einen Missing-Wert haben, werden für alle Auswertungen ausgeschlossen. Bsp. Person A hat bei V1 und V2 gültige Werte, bei V3 missing Person A wird immer ausgeschlossen Paarweiser Ausschluß Es werden nur die Daten ausgeschlossen, die beim jeweiligen Analyseschritt (Variablenpaar) fehlende Werte aufweisen. Bsp. Person A hat bei V1 und V2 gültige Werte, bei V3 missing Person A wird bei der Analyse V1 mit V2 berücksichtigt, bei V1 mit V3 sowie V2 mit V3 ausgeschlossen.
9 Bei der Interpretation von Korrelationen können folgende Schritte hilfreich sein: 1) Welche Korrelationen sind signifikant? 2) Wie ist die Vorzeichenstruktur der Werte (positive bzw. negative Vorzeichen)? 3) Wie hoch sind die Korrelationen? Wenn in einer Matrix zwei Gruppen von Variablen (V1-V3 und V4-V6) untersucht werden, kann es sinnvoll sein, bestimmte Bereiche der Matrix besonders zu betrachten: 1) die Intrakorrelationen (Korrelationen der Variablen einer Gruppe) 2) die Interkorrelationen (Korrelationen von Variablen aus unterschiedlichen Gruppen)
10 Beispiel aus der Inhaltsanalyse der Bundestagshandbüchern absolute 1 WP 2 WP 3 WP 4 WP 5 WP 6 WP 7 WP 8 WP 9 WP Werte gesamt SPD CDU/CSU BÜNDNIS 90/GRÜNEN FDP fraktionslos gesamt erwartete 1 WP 2 WP 3 WP 4 WP 5 WP 6 WP 7 WP 8 WP 9 WP Werte gesamt SPD 75,0 54,7 46,4 34,8 18,2 5,0 7,0 6,6 1,2 249 CDU/CSU 74,4 54,2 46,0 34,5 18,1 4,9 7,0 6,6 1,2 247 BÜNDNIS 90/GRÜNEN 16,6 12,1 10,2 7,7 4,0 1,1 1,6 1,5 0,3 55 FDP 14,2 10,3 8,8 6,6 3,4 0,9 1,3 1,3 0,2 47 fraktionslos 0,9 0,7 0,6 0,4 0,2 0,1 0,1 0,1 0,0 3 gesamt CHI² 1 WP 2 WP 3 WP 4 WP 5 WP 6 WP 7 WP 8 WP 9 WP gesamt SPD 5,33 6,13 0,94 0,42 0,00 0,19 0,13 0,06 0,05 13,24 CDU/CSU 1,81 4,87 1,40 1,62 0,24 0,87 0,15 1,78 0,48 13,22 BÜNDNIS 90/GRÜNEN 2,50 0,36 2,20 5,82 0,97 1,10 1,56 1,46 0,27 16,24 FDP 0,24 0,17 0,87 1,79 0,09 0,00 0,08 1,25 0,23 4,73 fraktionslos 0,01 2,73 0,56 0,42 0,22 0,06 0,08 0,08 0,01 4,18 gesamt 51,61 CramersV 51,61 601(5 1) 51, , Es gibt Abweichungen zwischen den Fraktionen hinsichtlich der Zugehörigkeit zum Bundestag nach Wahlperioden. In der SPD-Fraktion sind überdurchschnittlich viele Mitglieder bereits in der 2. und 3. Legislaturperiode, während erstmalige MdB und Abgeordnete mit eine Parlamentsangehörigkeit von 4 Wahlperioden seltener vertreten sind. Bei der Unions-Fraktion ergibt sich bei der Zusammensetzung nach Zugehörigkeitsdauer für die ersten vier Wahlperioden das genau inverse Bild.
1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrZusammenhangsmaße II
Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:
MehrSkalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrDeskriptive Statistik Winfried Zinn
Deskriptive Statistik Winfried Zinn Inhalte Statistik 1 1. Themenblock: Grundlagen der beschreibenden Statistik: Skalenniveaus Häufigkeitsverteilungen Mittelwerte (Lagemaße) Standardabweichung und Varianzen
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrEinführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005
Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
MehrEinführung in die Korrelationsrechnung
Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2013
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013 1. Welche Aussage zur Statistik (in den Sozialwissenschaften) sind richtig? (2 Punkte) ( ) Statistik ist die Lehre von Methoden
MehrEinführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
MehrTEIL 11: BIVARIATE ANALYSE FÜR ORDNINALSKA- LIERTE VARIABLEN
TEIL 11: BIVARIATE ANALYSE FÜR ORDNINALSKA- LIERTE VARIABLEN GLIEDERUNG Verfahren, welche auf dem paarweisen Vergleich beruhen Tau-a-Koeffizient Tau-b-Koeffizient Gamma-Koeffizient Alternativen zum paarweisen
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrBivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
MehrDeskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j
1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrBivariate Verteilungen
Bei der univariatendatenanalyse wird jeweils eine Variable analysiert. Im Zuge der univariatendatenanalyse werden zwar i.d.r. mehrere Variablen untersucht, aber jede Variablenverteilung isoliert von den
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrKarl Entacher. FH-Salzburg
Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben
MehrWeitere Korrelationskoeffizienten (1)
Weitere Korrelationskoeffizienten () Welche Korrelationskoeffizienten man für die Analyse von Zusammenhängen benutzen kann, hängt entscheidend von dem Skalenniveau der beteiligen Variablen und der Fragestellung
MehrDatenanalyse mit Excel. Wintersemester 2013/14
Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrKontingenzkoeffizient (nach Pearson)
Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
MehrBivariate Verteilungen [bivariate data]
Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen
MehrKendall s Tau. Betrachte Paare von Beobachtungen (x i, y i ) und (x j, y j ) Ein Paar heißt:
Kendall s Tau Betrachte Paare von Beobachtungen (x i, y i ) und (x j, y j ) Ein Paar heißt: konkordant, diskordant, falls x i < x j und y i < y j oder x i > x j und y i > y j falls x i < x j und y i >
Mehr6. Multivariate Verfahren Übersicht
6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression
MehrKorrelation Regression. Wenn Daten nicht ohne einander können Korrelation
DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der
MehrWiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge beurteilen Illustration an einem
MehrKapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen
Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen 5.1 Darstellung der Verteilung zweidimensionaler Merkmale 5.2 Maßzahlen für den Zusammenhang zweier nominaler Merkmale 5.3 Maßzahlen
MehrWichtige statistische Koeffizienten und Formeln
Wichtige statistische Koeffizienten und Formeln Felix Baumann Skalenniveau Art des Koeffizienten Koeffizient Formel (ab) ominalskala: (Unterscheidung nach Gleichheit/Ungleichheit; jeder Ausprägung eine
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
MehrBivariate Regressionsanalyse
Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x
MehrModul G.1 WS 07/08: Statistik
Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen
MehrV a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X
Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y 1 60 60 y 0 0 y 3
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrEigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße
Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße 1. Kreuze die richtige Aussage an! positiv sind, ist r stets identisch mit s xy. negativ sind, ist r stets identisch mit s xy. positiv sind, ist das
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 10 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 22. Dezember 2008 1 / 21 Online-Materialien Die Materialien
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen Überblick
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrInhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale
1. Grundlagen... 1 1.1 Grundgesamtheit und Untersuchungseinheit................ 1 1.2 Merkmal oder statistische Variable........................ 2 1.3 Datenerhebung.........................................
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
MehrHerzlich Willkommen zur Vorlesung Statistik
Herzlich Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Kovarianz und Korrelation Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei gleichzeitiger Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich auch im Bereich der deskriptiven
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psmet03.sowi.uni-mainz.de/
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrKapitel 22 Partielle Korrelationen
Kapitel 22 Partielle Korrelationen Bereits im vorhergehenden Kapitel wurden mit der Prozedur KORRELATION, BIVARIAT Korrelationskoeffizienten berechnet. Korrelationskoeffizienten dienen allgemein dazu,
MehrInhaltsverzeichnis. II. Statistische Modelle und sozialwissenschaftliche Meßniveaus 16
Vorwort 1 1. Kapitel: Der Stellenwert der Statistik für die sozialwissenschaflliche Forschung 1 1. Zur Logik (sozial-)wissenschaftlicher Forschung 1 1. Alltagswissen und wissenschaftliches Wissen 1 2.
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrStatistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.
Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },
MehrEinführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012
Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012 Es können von den Antwortmöglichkeiten alle, mehrere, eine oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
Mehr5.3 (Empirische) Unabhängigkeit und χ 2
5.3 (Empirische) Unabhängigkeit und χ 2 5.3 (Empirische) Unabhängigkeit und χ 2 5.3.1 (Empirische) Unabhängigkeit Durch den Vergleich der bedingten Häufigkeiten mit den Randhäufigkeiten kann man Zusammenhänge
Mehr1. Datei Informationen
1. Datei Informationen Datei vorbereiten (Daten, Variablen, Bezeichnungen und Skalentypen) > Datei Dateiinformation anzeigen Arbeitsdatei 2. Häufigkeiten Analysieren Deskriptive Statistik Häufigkeiten
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrEinfache statistische Auswertungen mit dem Programm SPSS
Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrComputergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
MehrStreuungsmaße von Stichproben
Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrEigene MC-Fragen SPSS
Eigene MC-Fragen SPSS 1. Welche Spalte ist in der Variablenansicht unbedingt festzulegen? [a] Variablenlabel [b] Skala [c] Name [d] Typ [e] Wertelabel 2. Wie heißt das Standardfenster von SPSS? [a] Dialogfenster
MehrChi Quadrat-Unabhängigkeitstest
Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Mehrfeldertabellen und Zusammenhangsmaße 1. Mehrfeldertabellen und Zusammenhangsmaße:
Mehrhtw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein
MehrProf. Dr. Achim Bühl SPSS 16. Einführung in die moderne Datenanalyse. 11., überarbeitete und erweiterte Auflage
Prof. Dr. Achim Bühl SPSS 16 Einführung in die moderne Datenanalyse 11., überarbeitete und erweiterte Auflage ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrDeskriptive Statistik
Markus Wirtz, Christof Nachtigall Deskriptive Statistik 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Statistische
MehrName Vorname Matrikelnummer Unterschrift
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe
MehrÜberblick über die Verfahren für Ordinaldaten
Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische
Mehr5 Beschreibung und Analyse empirischer Zusammenhänge
5 Beschreibung und Analyse empirischer Zusammenhänge 132 5 Beschreibung und Analyse empirischer Zusammenhänge 5.1 Zusammenhänge zwischen kategorialen Merkmalen 137 5.1.1 Kontingenztabellen 137 Verteilungen
Mehrentschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.
Bsp 1) Die Wahrscheinlichkeit dafür, dass eine Glühbirne länger als 200 Stunden brennt, beträgt 0,2. Wie wahrscheinlich ist es, dass von 10 Glühbirnen mindestens eine länger als 200 Stunden brennt? (Berechnen
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax
Mehr5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten
5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von
MehrEine computergestützte Einführung mit
Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik
MehrEinführung in die Test- und Fragebogenkonstruktion
Markus Bühner 1 Einführung in die Test- und Fragebogenkonstruktion 2., aktualisierte und erweiterte Auflage PEARSON Studium ein Imprint von Pearson Education München Boston San Francisco Harlow, England
MehrGrundlagen der Statistik
Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe
MehrStatistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt
Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrKlausurvorbereitung - Statistik
Aufgabe 1 Klausurvorbereitung - Statistik Studenten der Politikwissenschaft der Johannes Gutenberg-Universität wurden befragt, seit wie vielen Semestern sie eingeschrieben sind. Berechnen Sie für die folgenden
MehrEinführung in die Statistik in Bezug auf die Vorlesung von Bernd Kollek
Juni Einführung in die Statistik in Bezug auf die Vorlesung von Bernd Kollek Verfasser: Johannes Neubauer Für die Richtigkeit der folgenden Ausführungen übernimmt der Verfasser keine Gewähr. Inhalt: Datenmatrix:...
Mehr