Assoziation & Korrelation
|
|
- Stephanie Hochberg
- vor 7 Jahren
- Abrufe
Transkript
1 Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den Merkmalen gibt. Für die Messung der quantitativen Stärke des Zusammenhangs dienen im Falle qualitativer Merkmale die sog. Assoziationsmaße im Falle quantitativer Merkmale spricht man von Korrelationsmaßen Bisher besprochene Assoziationsmaße: Cross-product ratio Assoziationskoeffizient nachyule 2 Marcus Hudec 1
2 Maße der prädiktiven Assoziation Diese Maße basieren auf der proportionalen Fehlerreduktion, die sich bei der Vorhersage eines Merkmals bei Kenntnis des Wertes des anderen Merkmals ergeben (Goodman-Kruskal ) E0... Fehler bei Vorhersage von Merkmal X ohne Kenntnis von Y E1... Fehler bei Vorhersage von Merkmal X bei Kenntnis von Y (X) = (E0-E1)/E0 = 1-E1/E0 ~ relative Fehlerreduktion 3 Beispiel katholisch evangelisch keine gesamt CDU SPD FDP Grüne PDS Quelle: Allbus 1996 katholisch evangelisch keine gesamt CDU 48,4% 35,6% 22,3% 35,7% SPD 29,3% 34,9% 34,2% 32,9% FDP 7,2% 12,7% 6,5% 9,2% Grüne 13,6% 15,0% 21,2% 16,4% PDS 1,5% 1,9% 15,8% 5,8% 100,0% 100,0% 100,0% 100,0% Merkmale sind abhängig! 4 Marcus Hudec 2
3 Prognosefehler ohne Kenntnis des zweiten Merkmals katholisch evangelisch keine gesamt CDU E0= =1394 SPD FDP Grüne PDS E0 ist der Vorhersagefehler für die Wahlabsicht ohne Kenntnis des Merkmals bei Anwendung jener Regel, die die geringste Fehlerrate aufweist (tippe auf die Modalklasse!) Ohne Kenntnis der ist es am sinnvollsten auf CDU zu tippen (höchste Trefferquote ~ geringste Fehlerhäufigkeit) 5 Prognosefehler bei Kenntnis des zweiten Merkmals katholisch evangelisch keine gesamt CDU E1=( ) + ( ) + ( ) = 1319 SPD FDP Grüne PDS E1 ist der Vorhersagefehler der Wahlabsicht bei Kenntnis des Merkmals Bei Kenntnis der ist es am sinnvollsten bei den Ausprägungen katholisch h und evangelisch auf CDU zu tippen (höchste Trefferquote) bei der Ausprägung keine auf SPD zu tippen 6 Marcus Hudec 3
4 Berechnung Sei X das Merkmal Wahlabsicht und Y das Merkmal, so gilt für (X) = /1394=0.054 Demgemäß verbessert sich die Vorhersage der Wahlabsicht bei Kenntnis der szugehörigkeit um 5,4%. Man beachte, dass dieses Maß gerichtet ist, d.h. dass es nicht symmetrisch in Bezug auf die Rollen der Variablen ist (Y) = /1308 = 0,084 [siehe nächste Folie] Die Vorhersage der szugehörigkeit wird bei Kenntnis der Wahlabsicht um 8,4% gesteigert. 7 Vorhersage der szugehörigkeit bei Kenntnis der Wahlabsicht 8 Marcus Hudec 4
5 Symmetriesierung Ist man an der Stärke des Zusammenhangs interessiert kann man die beiden gerichteten Maße (X) und (Y) wie folgt symmetrisieren: E E E E (X) x x y y (Y) x y E0 E0 x x y y x y E0 E0 E E E E Im Beispiel ergibt sich: 9 ( ) ( ) 6,8% Die Chi-Quadrat Statistik Basiert auf dem Vergleich von beobachteten und unter Unabhängigkeit erwarteten Häufigkeiten Für eine Tabelle mit I Zeilen und J Spalten und N Beobachtungen wird wie folgt definiert: J I observed 2 2 ij expectedij j1 i1 expected Dabei steht observed für die beobachtete absolute Häufigkeit und expected für jene absolute Häufigkeit, die sich bei Unabhängigkeit ergeben würde. ij 10 Marcus Hudec 5
6 Bezeichnungen Die Chi-Quadratstatistik wird auch als die quadratische Kontingenz bezeichnet Demgemäß bezeichnet man 2 2 /N auch als die mittlere quadratische Kontingenz Manchmal wird auch der Phi-Koeffizient verwendet, der bei einer 2x2 Tafel zwischen 0 und 1 normiert ist. 2 /N 11 Cramer`s V Entspricht einer Normierung der Chi-Quadrat Statistik für eine beliebige Tabellengröße Für eine Tabelle mit I Zeilen und J Spalten und N Beobachtungen wird wie folgt definiert: V 2 N min(i 1, J 1) 12 Marcus Hudec 6
7 Beispiel: Beobachtete Häufigkeiten Erwartete Häufigkeiten katholisch evangelisch keine gesamt katholisch evangelisch keine gesamt CDU CDU 241,3 307,0 225,6 774 SPD SPD 222,6 283,22 208,1 714 FDP FDP 62,0 78,9 58,0 199 Grüne Grüne 110,7 140,8 103,5 355 PDS PDS 39,3 50,0 36, Quelle: Allbus 1996 katholisch evangelisch keine gesamt katholisch evangelisch keine gesamt CDU 48,4% 35,6% 22,3% 35,7% CDU 35,7% 35,7% 35,7% 35,7% SPD 29,3% 34,9% 34,2% 32,9% SPD 32,9% 32,9% 32,9% 32,9% FDP 7,2% 12,7% 6,5% 9,2% FDP 9,2% 9,2% 9,2% 9,2% Grüne 13,6% 15,0% 21,2% 16,4% Grüne 16,4% 16,4% 16,4% 16,4% PDS 15% 1,5% 19% 1,9% 15,8% 58% 5,8% PDS 58% 5,8% 58% 5,8% 58% 5,8% 58% 5,8% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% Bei Unabhängigkeit 13 Berechnung der erwarteten Häufigkeiten katholisch evangelisch keine gesamt CDU SPD FDP Grüne PDS *860/2168 = 78, *632/2168 = 103,49 14 Marcus Hudec 7
8 Berechnung katholisch evangelisch keine CDU 30,4 0,0 31,7 SPD 2,7 1,0 0,3 FDP 2,7 11,4 5,0 Grüne 3,2 1,0 9,0 PDS 21,8 23,1 109,0 n=2168 I=5 J=3 observed 2 ij expectedij expected 252,4 Chi²-Wert 0,241 Cramer`s V ij Interpretation: 0,1 < V < 0,2... geringer Zusammenhang 0,2 < V < 0,4... mäßiger Zusammenhang V > 0,4...starker Zusammenhang 15 Vierfeldertafel (1) Im Falle der einfachsten Tabelle, bei der 2 binäre Merkmale gekreuzt werden (~Vierfeldertafel) gibt es einfache Berechnungsmöglichkeiten: = n(ad bc) (a b)(a c))b d)(c d) ad bc (a b)(a c))b d)(c d) = 1 16 Marcus Hudec 8
9 Vierfeldertafel (2) cpr 1 ad/bc1 adbc Q cpr 1 ad / bc 1 ad bc Q = +1 Q = 1 17 Kovarianz Kovarianz: Zusammenhangsmaß bei intervallskalierten Merkmalen, das sich unmittelbar aus der Varianz ableitet n n s XX 1 n i1 1 n x xx x x x nxx i i1 n n 1 1 XY i i i i n i 1 n i1 i s x x y y x y nxy Nachteil: keine Normierung i i 18 Marcus Hudec 9
10 Konzept der Kovarianz 19 Korrelationskoeffizient Der Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen X und Y. Er ist durch folgende Formel charakterisiert: r xy i nxy i i xiyi 2 2 i i i i i i x x y y x x y y cov( XY) corrxy Std. Abw.( X ) Std. Abw.( Y) 2 2 i 2 2 n x x n y y 20 Marcus Hudec 10
11 Korrelationskoeffizient Der Korrelationskoeffizient liegt stets zwischen -1 und +1. Korrelationskoeffizient nahe -1: Die Mehrzahl hlder Datenpunkte konzentrieren sich um eine Gerade mit negativer Steigung. Korrelationskoeffizient ungefähr 0: Die Datenpunkte sind entweder auf alle vier Quadranten ungefähr gleichmäßig verteilt oder sie liegen um eine Gerade die parallel zu einer Achse verläuft. Korrelationskoeffizient nahe +1: Die Mehrzahl der Datenpunkte konzentrieren sich um eine Gerade mit positiver Steigung. 21 Hohe positive Korrelation Korrelation Marcus Hudec 11
12 Hohe negative Korrelation Korrelation Mittlere positive Korrelation Korrelation Marcus Hudec 12
13 Korrelation nahe 0 Korrelation Was ist eine starke Korrelation? Vorschlag von Cohen: r ~ 0,1 schwacher Zusammenhang r ~ 0,3 mittlerer Zusammenhang r ~ 0,5 starker Zusammenhang Ist r deutlich größer als 0,5 spricht man von einem sehr starken Zusammenhang 26 Marcus Hudec 13
14 Verschiedene Szenarien 27 Beispiel: X Gewicht des Vaters, Y Gewicht des Sohnes Excel-Funktionen: Varianzen Kovar, Korrel 28 Marcus Hudec 14
15 Berechnung via Standardisierte Daten 29 Die Korrelation ist gleich der Kovarianz der standardisierten Daten Unabhängigkeit und Kausalität Sind zwei Variablen unabhängig, so folgt daraus, daß der Korrelationskoeffizient den Wert 0 annimmt. Umgekehrt kann aus einer Korrelation vonnahenull Null nicht auf Unabhängigkeit geschlossen werden, da die Korrelation nur den linearen Zusammenhang misst. 1.0 Die Punkte im linken Beispiel haben Korrelation null! Keinesfalls darf Korrelation mit Kausalität gleichgesetzt werden. Problem: Scheinkorrelation 30 Marcus Hudec 15
16 Kausalität Kausalität bezeichnet die Beziehung zwischen Ursache und Wirkung, wobei die Ursache ein Sachverhalt ist, der einen bestimmten anderen Sachverhalt (Wirkung) als Folge herbeiführt. Kausalität weist eine feste Richtung auf, die immer von der Ursache ausgeht, auf der die Wirkung folgt. Korrelation ist ungerichtet Korrelation kann auch über Drittvariablen entstehen 31 Simpsons Paradoxon (heterogene Gruppen) 32 Marcus Hudec 16
17 Korrelation bei ordinalen Daten Rang-Korrelation nach Spearman Idee: Verwende den Rang der Beobachtung (aufgrund der Ordnung nach X bzw. Y) anstelle des Wertes der Beobachtung 33 Beispiel 34 Marcus Hudec 17
18 Trauen Sie der Korrelation? 35 Elimination des extremen Datenpunkts Keine Korrelation in den Daten!! 36 Marcus Hudec 18
19 Anwendung der Rangkorrelation Durch die Reduktion der Skalierung erfolgt implizit eine schwächere Gewichtung extremer Beobachtungen Nachteil: Informationsverlust t Vergleichbar mit der Diskussion Median versus arithm. Mittel 37 Marcus Hudec 19
Assoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es systematische Zusammenhänge oder Abhängigkeiten
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei gleichzeitiger Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich auch im Bereich der deskriptiven
MehrAssoziation & Korrelation
Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen für jeden Merkmalsträger stellt sich die Frage, ob es systematische Zusammenhänge
Mehr11. Zusammenhangsmaße für nominale Variablen
Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrSkalenniveaus =,!=, >, <, +, -
ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,
Mehr2. Zusammenhangsmaße
2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
MehrEinführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
MehrZusammenhangsmaße II
Sommersemester 2009 Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins: Kapitel
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrMusterlösung zur Aufgabensammlung Statistik I Teil 3
Musterlösung zur Aufgabensammlung Statistik I Teil 3 2008, Malte Wissmann 1 Zusammenhang zwischen zwei Merkmalen Nominale, Ordinale Merkmale und Mischungen Aufgabe 12 a) x\ y 1.Klasse 2.Klasse 3.Klasse
MehrEigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße
Eigene MC-Fragen (Teil II) "Kap. 9 Zusammenhangsmaße 1. Kreuze die richtige Aussage an! positiv sind, ist r stets identisch mit s xy. negativ sind, ist r stets identisch mit s xy. positiv sind, ist das
MehrZusammenhangsmaße II
Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrVl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle
Vl. 5.12.11 3. Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen schnell mittel langsam 3 Arten von Häufigkeitstabellen: Absolute Häufigkeitstabelle relative Häufigkeitstabelle
Mehr5 Beschreibung und Analyse empirischer Zusammenhänge
5 Beschreibung und Analyse empirischer Zusammenhänge 132 5 Beschreibung und Analyse empirischer Zusammenhänge 5.1 Zusammenhänge zwischen kategorialen Merkmalen 137 5.1.1 Kontingenztabellen 137 Verteilungen
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrModul G.1 WS 07/08: Statistik
Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen
MehrAusführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm
y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrGRUPPE B Prüfung aus Statistik 1 für SoziologInnen
GRUPPE B Prüfung aus Statistik 1 für SoziologInnen 16. Oktober 2015 Gesamtpunktezahl =80 Prüfungsdauer: 2 Stunden Name in Blockbuchstaben: Matrikelnummer: 1) Wissenstest (maximal 20 Punkte) Kreuzen ( )
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
MehrPrüfung aus Statistik 1 für SoziologInnen- Gruppe A
Prüfung aus Statistik 1 für SoziologInnen- Gruppe A 26. Juni 2012 Gesamtpunktezahl =80 Prüfungsdauer: 2 Stunden 1) Wissenstest (maximal 20 Punkte) Lösungen Kreuzen ( ) Sie die jeweils richtige Antwort
Mehr3.1 Zusammenhang zwischen einem qualitativen und einem quantitativen Merkmal
Kapitel 3 Bivariate Analyse In Kapitel 2 haben wir gesehen, wie man ein Merkmal auswertet. Mit Hilfe statistischer Verfahren kann man aber auch untersuchen, ob zwischen mehreren Merkmalen Abhängigkeiten
Mehr6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale
6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig
Mehr6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale
6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise
MehrStatistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II
Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
Mehr6 Korrelationsanalyse: Zusammenhangsanalyse stetiger. Merkmale
6 Korrelationsanalyse: Zusammenhangsanalyse stetiger Merkmale 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße) 6
359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrW-Rechnung und Statistik für Ingenieure Übung 5
W-Rechnung und Statistik für Ingenieure Übung 5 Grafische/ tabellarische Darstellung für bivariate Daten diskrete Merkmale (qualitativ+ quantitativ diskret) stetige Merkmale (quantitativ stetig) Zusammenhangsmaße
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrEinführung in die Korrelationsrechnung
Einführung in die Korrelationsrechnung Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) Korrelationsrechnung
MehrBivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
MehrSkriptteufel Klausurworkshop
Skriptteufel Klausurworkshop Statistik Teil 1 - Handout 01.07.2016 1 Inhalt Sieben Aufgabentypen mit Lösungsweg Häufigkeiten Regression (2 Typen) Dichte und Verteilungsfunktionen Beweise Lösungswege für
MehrInhaltsverzeichnis (Ausschnitt)
4 Zweidimensionale Daten Inhaltsverzeichnis (Ausschnitt) 4 Zweidimensionale Daten Häufigkeitsverteilungen unklassierter Daten Häufigkeitsverteilungen klassierter Daten Bedingte Häufigkeitsverteilungen
MehrKorrelation Regression. Wenn Daten nicht ohne einander können Korrelation
DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrKarl Entacher. FH-Salzburg
Ahorn Versteinert Bernhard.Zimmer@fh-salzburg.ac.at Statistik @ HTK Karl Entacher FH-Salzburg karl.entacher@fh-salzburg.ac.at Beispiel 3 Gegeben sind 241 NIR Spektren (Vektoren der Länge 223) zu Holzproben
MehrAnalyse bivariater Kontingenztafeln
Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen
MehrAnwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben
Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich
MehrPrüfung aus Statistik 1 für SoziologInnen
Prüfung aus Statistik 1 für SoziologInnen 27. Juni 2009 Nachname: Vorname: Matrikelnummer: Studienkennzahl: Beispiel 1: (6 Punkte) a) Wie viel Prozent der Beobachtungen liegen beim Box-Plot außerhalb der
MehrBivariate Verteilungen [bivariate data]
Bivariate Verteilungen [bivariate data] Zwei Variablen X, Y werden gemeinsam betrachtet, d.h. an jedem Objekt i werden zwei Merkmale beobachtet. Beobachtungswerte sind Paare/Kombinationen von Merkmalsausprägungen
Mehr1 Einleitung und Grundlagen 1
Inhaltsverzeichnis Vorwort vii 1 Einleitung und Grundlagen 1 1.1 Einführende Beispiele 1 1.2 Statistischer Prozess 2 1.3 Grundlagen 2 1.4 Unterscheidung von Merkmalen 3 1.4.1 Skalenniveaus 3 1.4.2 Stetige
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrMathematik 2 für Naturwissenschaften
Hans Walser Mathematik 2 für Naturwissenschaften Modul 202 Regressionsgerade und Korrelation Lernumgebung. Teil Hans Walser: Modul 202, Regressionsgerade und Korrelation. Lernumgebung. ii Inhalt Messwertpaare...
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrModelle diskreter Zufallsvariablen
Statistik 2 für SoziologInnen Modelle diskreter Zufallsvariablen Univ.Prof. Dr. Marcus Hudec Zufallsvariable Eine Variable (Merkmal) X, deren numerische Werte als Ergebnisse eines Zufallsvorgangs aufgefasst
MehrStatistik I für Betriebswirte Vorlesung 10
Statistik I für Betriebswirte Vorlesung 10 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 15. Juni 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 10 Version: 13.
MehrKontingenzkoeffizient (nach Pearson)
Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrMedizinisches Beispiel
Problemstellung Stimmen zwei oder mehrere Beobachter in ihrer Einschätzung überein? (im engl.: rater agreement oder interrater agreement) Beispiel: Zwei Professoren beurteilen die Referate oder Seminararbeiten
MehrKreuztabellenanalyse und Assoziationsmaße. Assoziationsmaße. Allgemeines Beispiel Graphiken Notation. Risiken. Drittvariablenkontrolle.
FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 1 Kreuztabellenanalyse und FB 1 W. Ludwig-Mayerhofer Zusammenhänge zwischen Merkmalen 2 Kreuztabellen eignen sich zur Darstellung und Analyse
MehrStatistik I. 1. Klausur Wintersemester 2010/2011 Hamburg, Art der Anmeldung: STiNE FlexNow Zulassung unter Vorbehalt
Statistik I 1. Klausur Wintersemester 2010/2011 Hamburg, 11.02.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrBasis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Korrelation, Regression und diagnostische Tests
Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Korrelation, Regression und diagnostische Tests Mit Datensatz Daten_SPSS_Kurs_I.sav Berechnung der Blutdruckreduktion vom Studienbeginn zum
MehrBeschreibende Statistik Zweidimensionale (bivariate) Daten
Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 8. Mai 2009 Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Stichprobe ( 1,y
MehrInstitut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen
Institut für Soziologie Dipl. Soz. Methoden II Zusammenhangsmaße für kategoriale und metrische Variablen Organisatorisches Prüfungsanmeldung Methoden II Die Anmeldung zur Prüfung läuft über die Tafelübung.
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrZusammenhänge zwischen metrischen Merkmalen
Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl
MehrModul 11: Zur gemeinsamen Analyse mehrerer Merkmale. Prof. Dr. W. Laufner Beschreibende Statistik
Zur gemeinsamen nalyse mehrerer Merkmale 1 ei einer empirischen Untersuchung werden i.. mehrere Merkmale gemessen, d.h., z..,, Z, usw. ei der ersten Datenauswertung werden die Daten einer univariaten nalyse
MehrKlausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Sommersemester 2015 Aufgabe 1 In der aktuellen
MehrBivariate Regressionsanalyse
Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
MehrStatistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.
Zusammenfassung und wichtiges zur Prüfungsvorbereitung 9. Dezember 2008 Begriffe Kenntnis der wichtigen Begriffe und Unterscheidung dieser. Beispiele: Merkmal, Merkmalsraum, etc. Skalierung: Nominal etc
MehrStatistik II: Signifikanztests /2
Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I
MehrForschungsstatistik I
Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun http://blog.ruediger-braun.net Heinrich-Heine-Universität Düsseldorf 10. Dezember 2014 1 Datenpaare Korrelation 2 Lineare Regression Problemstellung Beispiel
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrDeskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j
1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b
MehrStatistik ohne Angst vor Formeln
Statistik ohne Angst vor Formeln Das Studienbuch für Wirtschaftsund Sozialwissenschaftler 4., aktualisierte Auflage Andreas Quatember 1.3 Kennzahlen statistischer Verteilungen 1.3.4 Kennzahlen des statistischen
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrV a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X
Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y 1 60 60 y 0 0 y 3
MehrHeinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren
Heinz Holling & Günther Gediga Statistik - Deskriptive Verfahren Übungen Version 15.12.2010 Inhaltsverzeichnis 1 Übung 1; Kap. 4 3 2 Übung 2; Kap. 5 4 3 Übung 3; Kap. 6 5 4 Übung 4; Kap. 7 6 5 Übung 5;
MehrChi Quadrat-Unabhängigkeitstest
Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland
Mehr1. Grundbegri e. T n i=1 A i = A 1 \ A 2 \ : : : \ A n alle A i treten ein. na = A das zu A komplementäre Ereignis; tritt ein, wenn A nicht eintritt.
. Grundbegri e Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt ein, wenn ein! A eintritt. ist auch das sichere Ereignis,
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrHäufigkeiten. Verteilungen. Lageparameter Mittelwert. oder
Formelsammlung Beschreibende Statistik Univariate Häufigkeitsverteilungen X ist ein diskretes Merkmal, mit k Ausprägungen TR: Mode 2 1 = AC absolute relative Häufigkeit Häufigkeiten Bivariate Häufigkeitsverteilungen
Mehr5.5 PRE-Maße (Fehlerreduktionsmaße)
5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.
MehrTabellarische und graphie Darstellung von univariaten Daten
Part I Wrums 1 Motivation und Einleitung Motivation Satz von Bayes Übersetzten mit Paralleltext Merkmale und Datentypen Skalentypen Norminal Ordinal Intervall Verältnis Merkmalstyp Diskret Stetig Tabellarische
MehrDeskriptive Statistik
Markus Wirtz, Christof Nachtigall Deskriptive Statistik 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Statistische
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2008, Statistik mit SPSS
Sommersemester 2008, Statistik mit SPSS 27. August 2009 27. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Mehrfeldertabelle und Zusammenhangsmaße für nominale Daten 2. Mehrfeldertabelle
MehrWISTA WIRTSCHAFTSSTATISTIK
WISTA WIRTSCHAFTSSTATISTIK PROF. DR. ROLF HÜPEN FAKULTÄT FÜR WIRTSCHAFTSWISSENSCHAFT Seminar für Theoretische Wirtschaftslehre Vorlesungsprogramm 04.06.2013 Zweidimensionale Datensätze 1. Kontingenztabelle
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrGrundlagen der Statistik
Grundlagen der Statistik Übung 2 2010 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrWie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung
Wie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation 5.04.018 Vorlesung 03-1 Chi-Quadrat-Test:
Mehr