Skalenniveaus =,!=, >, <, +, -

Ähnliche Dokumente
1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.

Statistische Methoden in den Umweltwissenschaften

Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j

Vl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle

Lösungen zur Klausur zur Statistik Übung am

Karl Entacher. FH-Salzburg

5 Beschreibung und Analyse empirischer Zusammenhänge

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Statistik. Jan Müller

Einführung in die sozialwissenschaftliche Statistik

6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale

Grundlagen der empirischen Sozialforschung

W-Rechnung und Statistik für Ingenieure Übung 5

Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Deskriptive Statistik

Bivariate Zusammenhänge

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Zusammenhangsanalyse in Kontingenztabellen

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

Modul G.1 WS 07/08: Statistik

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Variablen und Skalenniveaus

Statistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

2. Zusammenhangsmaße

Lösungen zur deskriptiven Statistik

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Grundkurs Statistik für Politologen und Soziologen

Einführung in die Korrelationsrechnung

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

absolute Häufigkeit h: Anzahl einer bestimmten Note relative Häufigkeit r: Anzahl einer bestimmten Note, gemessen an der Gesamtzahl der Noten

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg

Eigene MC-Fragen SPSS

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Bitte am PC mit Windows anmelden!

Parametrische vs. Non-Parametrische Testverfahren

Günther Bourier. Beschreibende Statistik. Praxisorientierte Einführung - Mit. Aufgaben und Lösungen. 12., überarbeitete und aktualisierte Auflage

Wichtige statistische Koeffizienten und Formeln

Was sind Zusammenhangsmaße?

Assoziation & Korrelation

Kapitel 5 Wichtige Maßzahlen für den Zusammenhang zwischen Merkmalen

6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale

Musterlösung zur Aufgabensammlung Statistik I Teil 3

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Prüfung aus Statistik 1 für SoziologInnen

5 Assoziationsmessung in Kontingenztafeln

Einige Grundbegriffe der Statistik

3.4 Bivariate Datenanalyse in R

WISTA WIRTSCHAFTSSTATISTIK

I.3. Computergestützte Methoden 1. Deskriptive Statistik. Master of Science Prof. Dr. G. H. Franke WS 2009/ 2010

Assoziation & Korrelation

19 Punkte. Aufgabe 1. Einkommen niedrig mittel hoch Männer Frauen Geschlecht. a) Bestimmen Sie die fehlenden Werte!

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Bivariate Regressionsanalyse

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Statistische Grundlagen I

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

Zusammenhänge zwischen metrischen Merkmalen

Charakterisierung der Daten: Sind es genug? Sind alle notwendig? Was ist naturgegeben, was von Menschen beeinflusst (beeinflussbar)?

Klausurvorbereitung - Statistik

Deskriptive Statistik Winfried Zinn

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Aufgabe 1. Studiensemester Anzahl Studierende 1. Semester Semester Semester Semester Semester 5 6.

Beschreibende Statistik

1.5 Berechnung von Rangzahlen

Forschungsmethoden VORLESUNG WS 2017/2018

3. Lektion: Deskriptive Statistik

Einführung in die Statistik

Assoziation & Korrelation

Grundlagen empirischer Forschung. Korpuslinguistik Heike Zinsmeister WS 2009/10

Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Statistik. Ronald Balestra CH St. Peter

Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

Einführung in die Statistik

Daten, Datentypen, Skalen

Statistik und Wahrscheinlichkeitsrechnung

3 Bivariate Deskription und Exploration von Daten

5. Lektion: Einfache Signifikanztests

Transkript:

ZUSAMMENHANGSMAßE

Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, <, +, - =,!=, >, <, +, -, *, / Kardinalskala Bemerkungen: Das Skalenniveau ist eine wichtige Eigenschaft von Merkmalen (Variablen). Das Skalenniveau bestimmt die mathematische und logische Operationen, die zulässig sind. Operationen, die bei Variablen eines bestimmten Skalenniveaus zulässig sind, können auch auf Variablen aller höheren Skalenniveaus durchgeführt werden.

Korrelation Eine Korrelation beschreibt eine Beziehung zwischen zwei (mehreren) Merkmalen. Eine Korrelation als Maß des Zusammenhangs soll drei Fragen klären: Existiert ein Zusammenhang überhaupt? Wie stark ist der Zusammenhang? Falls möglich, welche Richtung hat der Zusammenhang?

Zusammenhangsmaße In der Statistik wird der Zusammenhang zwischen zwei statistischen Variablen mit verschiedenen Zusammenhangsmaßen (Koeffizienten) gemessen. in Abhängigkeit vom Skalenniveau der Merkmale (Variablen) gibt es einen oder mehrere mögliche Zusammenhangsmaße. Variable X: Nominalskala Ordinalskala Intervallskala Verhältnisskala Variable Y: Nominalskala Ordinalskala Intervallskala Verhältnisskala Kardinalskala Kontingenzkoeffizient Korrelationskoeffizient nach Spearman Kovarianz Korrelationskoeffizient nach Pearson

Variable X: Nominalskala Ordinalskala Intervallskala Verhältnisskala Variable Y: Nominalskala Ordinalskala Intervallskala Verhältnisskala Welcher Koeffizient benutze ich, wenn die Variablen von verschiedenen Skalenniveaus sind? Regel: Man benutzt immer den Koeffizient, der für das niedrigere Skalenniveau erlaubt ist.

Zusammenhangsmaße In der Statistik wird der Zusammenhang zwischen zwei statistischen Variablen mit verschiedenen Zusammenhangsmaßen (Koeffizienten) gemessen. in Abhängigkeit vom Skalenniveau der Merkmale (Variablen) gibt es einen oder mehrere mögliche Zusammenhangsmaße. Variable X: Nominalskala Ordinalskala Intervallskala Verhältnisskala Variable Y: Nominalskala Ordinalskala Intervallskala Verhältnisskala Kardinalskala Kontingenzkoeffizient Korrelationskoeffizient nach Spearman Kovarianz Korrelationskoeffizient nach Pearson

Kovarianz Variable X Variable Y (Zielvariable) i 1 2 3 4 5 6 7 8 Alter 20 30 40 50 55 65 70 80 Gehalt 200 1800 2500 3000 3000 3000 2000 2000 Kovarianz S xy 1 n n i1 ( x i x)( y i y) Stichprobe vom Umfang n Arithmetischer Mittelwert der Variablen X _ 1 x n n i1 x i

Kovarianz i 1 2 3 4 5 6 7 8 Alter 20 30 40 50 55 65 70 80 Gehalt 200 1800 2500 3000 3000 3000 2000 2000 _ 1 8 Berechnung: x x i 51. 25 y y i 2187. 5 8 S xy 1 7 n i1 ( x i 8 51.25)( y i1 i 2187.5) _ 1 8 i1 10160.71 Wie kann ich den Wert interpretieren? Normierung? Kovarianz

Arithmetischer Mittelwert von X Arithmetischer Mittelwert von Y Kovarianz

Korrelationskoeffizient nach Pearson i 1 2 3 4 5 6 7 8 Alter 20 30 40 50 55 65 70 80 Gehalt 200 1800 2500 3000 3000 3000 2000 2000 Korrelationskoeffizient Kovarianz s xy Standardabweichung von X s x var( x) 1 var( x) n 1 n i1 ( x i _ x) 2 s x. s y

Korrelationskoeffizient nach Pearson 0.5249728 Wie kann ich den Wert interpretieren? 1. Wertebereich: 1 1 2. Eine lineare Zusammenhang ist Voraussetzung.? Wert Zusammenhang (Korrelation) 0 kein 0-0.3 schwach 0.3-0.6 mittel 0.6-1.0 stark 1.0 exakt auf einer Geraden

s xy 0, 0

Zusammenhangsmaße In der Statistik wird der Zusammenhang zwischen zwei statistischen Variablen mit verschiedenen Zusammenhangsmaßen (Koeffizienten) gemessen. in Abhängigkeit vom Skalenniveau der Merkmale (Variablen) gibt es einen oder mehrere mögliche Zusammenhangsmaße. Variable X: Nominalskala Ordinalskala Intervallskala Verhältnisskala Variable Y: Nominalskala Ordinalskala Intervallskala Verhältnisskala Kardinalskala Kontingenzkoeffizient Korrelationskoeffizient nach Spearman Kovarianz Korrelationskoeffizient nach Pearson

Korrelationskoeffizient nach Spearman s Note RN Note P3 1 3 1 Bindungen sind Beobachtungen, die denselben Rang haben. Student Student Note RN RANG Note P3 RANG d d^2 1 3 1 1 2,5-1.5 2,25 d i x i y i 2 4 1 3 5 2 3 2 3 4 3 2 4 3 1 2,5 0,5 0,25 3 5 6,5 2 6,5 0 0 4 4 2 5 4 2 6 5 1 7 5 2 8 5 1 5 6 7 8 6,5 4 1 2 3 4 2.5 4 5 6 7 8 6.5 4 4 4 3 2 6,5-3.5 12.25 5 4 3 2 6,5-3.5 12.25 6 5 6,5 1 2,5 4 16 7 5 6,5 2 6,5 0 0 8 5 6,5 1 2,5 4 16

Korrelationskoeffizient nach Spearman s s s ( n 6. 1 i1 6*59 1 7*8*9 n d 2 i 1). n.( n 0,2976 Wie kann ich den Wert interpretieren? 1) 1. Wertebereich 1 1 2. Eine lineare Zusammenhang ist nicht vorausgesetzt. 3. Aber der Zusammenhang muss monoton sein. 4. Die o.e. Formel ist allerdings nur korrekt im Fall ohne Bindungen. 5. Sollten Bindungen existieren, ist besser den Korrelationskoeff. mit den Rängen rechnen. s

Zusammenhangsmaße In der Statistik wird der Zusammenhang zwischen zwei statistischen Variablen mit verschiedenen Zusammenhangsmaßen (Koeffizienten) gemessen. in Abhängigkeit vom Skalenniveau der Merkmale (Variablen) gibt es einen oder mehrere mögliche Zusammenhangsmaße. Variable X: Nominalskala Ordinalskala Intervallskala Verhältnisskala Variable Y: Nominalskala Ordinalskala Intervallskala Verhältnisskala Kontingenzkoeffizient Korrelationskoeffizient nach Spearman Kovarianz Korrelationskoeffizient nach Pearson

nominalskaliert Kontingenzkoeffizient Variable X i 1 2 3 4 5 6 7 8 Geschlecht Frau Frau Frau Frau Mann Mann Frau Mann Variable Y Ausbildung Haupt schule Hoch schule Haupt schule Gymnasium Gymnasium Hoch schule Hoch schule Hoch schule ordinalskaliert Kontingenztabelle (Kreuztabelle)

Absolute Häufigkeit h11 Gymnasium Hauptschule Hochschule Frau Mann Zeilensumme/ Randhäufigkeit 1 / 1.25 1 / 0.75 2 2 / 1.25 0 / 0.75 2 2 / 2.50 2 / 1.50 4 Spaltensumme/ Randhäufigkeit 5 3 8 Erwartete Häufigkeit he32=(3*4)/8 zeilensumme * spaltensumme h i e ij stichprobenumfang j

Chi2-Koeffizient 2 k m i1 j1 ( h ij h e h ij e ij ) 2 i=1,..,k j=1,..,m Wie kann ich den Wert interpretieren? Die Aussagekraft des χ2-koeffizienten ist gering. 0 <= Chi2-Koeffizient <= n*min{k 1,m 1} Der Chi2-Koeffizient verdoppelt sich durch die Verdoppelung des Stichprobenumfangs (Abhängigkeit von n) Diese Abhängigkeit begründet den Normierungsschritt zum Kontingenzkoeffizienten K

Kontingenzkoeffizient K 2 2 n K liegt im Wertebereich zwischen [0, 1 ), also abhängig von der Anzahl Spalten und Zeilen: min1 K [0, ] min, min=min( k, m ) Wie kann ich den Wert interpretieren? Um zusätzlich zum Einfluss des Stichprobenumfangs auf die Obergrenze des Koeffizienten auszuschalten wird der korrigierte Kontingenzkoeffizient

Korrigierter Kontingenzkoeffizient min K *.K min1 Wie kann ich den Wert interpretieren? min=min( k, m ) Es gilt 0 K* 1 Über K* kann eine Aussage über die Stärke des Zusammenhangs zwischen den Merkmalen X und Y aber nicht über die Richtung der Wirkung gemacht werden.