Bivariater Zusammenhang in der Mehrfeldertafel PEΣO

Größe: px
Ab Seite anzeigen:

Download "Bivariater Zusammenhang in der Mehrfeldertafel PEΣO"

Transkript

1 Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001

2 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen sondern mehrkategoriale Variablen betrachtet. Prozentsätze können auch in der Mehrfeldertabelle verglichen werden. Leider steht hier anschauliches Maß wie die Prozentsatzdifferenz bei Vierfeldertabellen nicht zur Verfügung. Dennoch kann man über Prozentsatzvergleiche gut einen Eindruck über die Bivariate Verteilung gewinnen. 1

3 Beispielverteilung 2

4 Prüfung der Unabhängigkeit in Mehrfeldertabellen Hypothesenpaar H 0 : π ij = π i π j für alle i,j H 1 : π ij π i π j für mindestens eine Kombination i,j Erwartete Häufigkeiten bei Unabhängigkeit e ij = n p i p j = n i n j n für alle i und j Berechnung der Teststatistik χ 2 χ 2 = I i=1 Ji=j (n ij e ij ) 2 e ij 3

5 Berechnung der Freiheitsgrade der Tabelle Die Anzahl der Freiheitsgrade einer Tabelle ergibt sich durch die Multiplikation der jeweils um 1 verringerten Zahl der Zeilen und Spaltenkategorien. DF = (N Zeilen 1) (N Spalten 1) Bestimmung der empirischen Signifikanzniveaus der Unabhängikkeitshypothese mit Hilfe der χ 2 -Tabelle

6 Beispiel χ 2 -Unabhängigkeitstest 4

7 Standardisierte Residuen Dienen zur Beurteilung der Abweichung zwischen beobachteten und erwarteten Zellenhäufigkeiten bei Unabhängigkeit. Ein negatives Vorzeichen deutet auf eine Unterbesetzung der Zelle in Bezug auf den Erwarteten Wert hin, ein positives auf eine Überbesetztung. Ist das Standardisierte Residuum betragsmäßig größer als 2, ist die Art der Abweichung auf 5 -Niveau signifikant. Formel: sr ij = (n ij e ij ) 2 e ij = n ij e ij eij 5

8 χ 2 -Goodness of Fit-Test Außer zur Prüfung der Hypothese der Unabhängigkeit einer Tabelle kann der Chi-Quadrat- Test immer dann Angewendet werden, wenn aufgrund theoretischer Überlegungen eine Erwartete Verteilung gefordert wird. Die Nullhypothese fordert dann, daß in der Population eine bestimmte Verteilung vorliegt. Im Allgemeinen Fall berechnet sich die Teststatistik χ 2 nach: χ 2 = K i=1 (n k e k ) 2 e k wobei k den Index zur Bezeichnung der Tabellenzellen und K die Anzahl der Tabellenzellen darstellt. Die Freiheitsgrade berechnen sich über: df = N Zellen N zuschaetzendep arameter 6

9 Zusammenhangsmaße in der Mehrfeldertabelle bei nominalskalierten Variablen Zusammenhangsmaße bei nominalskalierten Variablen basieren im allgemeinen auf der Prüfgröße χ 2, welche Aussagen über die Abweichung von den bei Unabhängigkeit erwarteten Verteilungen macht. Um aus χ 2 ein Maß abzuleiten, ist es notwendig, festzustellen, welchen Maximalwert dieses im Fall eines perfekten Zusammenhangs haben kann. Dies geschieht über folgende Formel: χ 2 max = n [ dem geringeren von I-1 oder J-1 ] 7

10 Cramers V Cramers V ist ein symmetrisches Zusammenhangsmaß, welches auf χ 2 und dessen jeweils möglichen Maximalwert basiert. Der Wertebereich von Cramers V liegt zwischen 0 und 1, wobei 0 für keinen und 1 für einen perfekten Zusammenhang steht. Es ist anzumerken, daß Cramers V kein erwartungstreues Maß ist. Signifikanztests sind also immer mit Vorsicht zu genießen. Cramers V berechnet sich über folgende Formel: V = χ 2 χ 2 max 8

11 Pearsons Kontingenzkoeffizient C Da der Maximalwert von C kleiner 1 ist, ist aus interpretierbarkeitsgründen Cramers V vorzuzíehen. Der Kontingenzkoeffizient C berechnet sich über folgende Formel: C = χ 2 χ 2 +n 9

12 Asymmetrische Zusammenhangsmaße in der Mehrfeldertabelle bei nominalskalierten Variablen: λ-koeffizient Ein prominentes asymmetrisches Maß ist der sogenannte Lambda-Koeffizient( λ ). Dieser Koeffizient kann Werte zwischen 0 und 1 annehmen, wobei 0 für keinen und 1 einen totalen Einfluß der abhängigen auf die unabhängige Variable bedeutet. λ basiert auf der sogenannten PRE-Logik, welche Grundlage der meistgenutzten Zusammenhangsmaße ist, und die im folgenden vorgestellt werden soll. 10

13 PRE-Ansatz PRE steht für propotional reduction of error (proportionale Fehlerreduktion). Bei dieser Vorgehensweise betrachtet man den Gewinn an Vorhersagekraft (Fehlerreduktion), wenn man eine (zusätzliche) Variable zur Erklärung einer abhängigen Variable nutzt. Dabei nimmt man an, daß diese zusätzliche Vorhersagekraft durch den Einfluß der zusätzlichen unabhängigen Variable bedingt ist. 11

14 Vorhersagefehler Ohne die Kenntnis einer zusätzlichen Variablen kann man einen Kennwert der Variable auswählen, deren Ausprägungen man prognostizieren möchte. Zum Beispiel ist dies im Falle von nominalskalierten Variablen der Modus. Der Vorhersagefehler E 0 des Modus einer Verteilung auf diese selbst errechnet sich folgendermaßen: E 0 = n n Modalkategorie Dies ist die Anzahl der Fälle, die nicht in der Modalkategorie liegen und damit der Vorhersagefehler des Modus auf seine eigene Verteilung. 12

15 Wird eine zusätzliche Variable in die Prognose mit einbezogen,betrachtet man die bedingten Verteilungen der abhängigen Variablen. Für jede Kategorie der unabhängigen ergibt sich nun eine Verteilung der abhängigen Variablen mit jeweils einem Modus. Werden diese Modi über die Kategorien der unabhängigen Variablen zusammenaddiert, erhält man die Zahl der Fälle der abhängigen Variablen, die mit Kenntnis der unabhängigen Variablen prognostizierbar sind. Der Vorhersagefehler mit Kenntnis einer zusätzlichen (Spalten) Variablen E 1 ergibt sich also durch: E 1 = n J j=1 n Modalzelle

16 proportionale Fehlerreduktion Ist der Fehler bekannt, der sich bei der Prognose einer Verteilung durch einen ihrer Kennwerte ergibt (Selbstprognosefehler), lässt sich ausrechnen, wie stark sich in Relation dazu der Fehler durch Einbeziehen einer zusätzlichen Variable vermindern lässt. Dies ist die sogenannte PRE- Logik. Die Fehlerreduktion wird hierbei als Einfluß der einen auf die andere Variable gedeutet und proportional zum Selbstprognosefehler interpretiert. P RE = E 0 E 1 E 0 = 1 E 1 E 0 wobei: P RE = proportionale Fehlereduktion E 0 = Selbstprognosefehler E 1 = Prognosefehler mit zusätzlicher Variable 13

17 λ-koeffizient Der λ-koeffizient λ yx errechnet sich also Analog zur PRE-Logik mit Modi als Prognosekennwerten: λ yx = 1 E 1 E = 1 E 1=n Jj=1 n Modalzelle 0 E 0 =n n Modalkategorie Zur Erinnerung: λ yx berschreibt den Einfluß einer unabhängigen nominalskalierten Variablen X auf eine abhängige nominalskaliere Variable Y. Ist λ yx = 0 existiert kein Einfluß, ist es gleich 1 wird Y vollständig durch X bestimmt. 14

18 Relative Devianzreduktion Das Prizip der proportionalen Fehlerreduktion kann auch mit anderen Maßen (Fehlerdefinitionen) angewendet werden. Eine Möglichkeit ist die Devianz, ein Streuungsmaß für nominalskalierte Variablen. Die Devianz D Y einer Zeilenvariablen Y berechnet sich wie folgt: D Y = 2 I i=1 n i ln( n i n ) Der Fehler bei Kenntnis beider Variablen errechnet sich über die Devianz der bivariaten Verteilung D Y X : D Y X = 2 J j=1 Ii=1 n ij ln( n ij n j ) 15

19 Aus diesen Definitionen und dem PRE-Prinzip ergibt sich die relative Devianzreduktion P 2 Y X, die auch als Likelihood-Ratio-Index oder Unsicherheitskoeffizient bekannt ist: P 2 Y X = 1 D Y X D Y = 1 D Y X= 2 Jj=1 Ii=1 n ij ln( n ij n j ) D Y = 2 I i=1 n i ln( n i n ) Dieses Maß hat ebenfalls einen Wertebereich von 0 bis 1, wobei 0 für keinen und 1 für einen perfekten Zusammenhang (Fehlerreduktion) steht.

20 Likelihood-Ratio-Test Die statistische Unabhängigkeit einer Tabelle kann alternativ zum χ 2 -Test auch mittels der relativen Devianzreduktion ermittelt werden. Ist diese signifikant von null verschieden, ist die Tabelle statistisch abhängig. Die Teststatistik L 2 ist? verteilt und nimmt für steigende Stichprobengröße asymptotisch den selben Wert wie χ 2 an. Sind χ 2 und L 2 in einer Stichprobe verschieden, bedeutet das, daß aufgrund zu geringer Stichprobengröße beide Maße mit vorsicht zu genießen sind. L 2 = D Y D Y X = 2 I i=1 Jj=1 n ij ln( n ij e ij ) 16

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.

Bivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung

Mehr

Tutorial:Unabhängigkeitstest

Tutorial:Unabhängigkeitstest Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung

Mehr

Bivariate Verteilungen

Bivariate Verteilungen Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin

Mehr

Chi Quadrat-Unabhängigkeitstest

Chi Quadrat-Unabhängigkeitstest Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland

Mehr

Statistik I. Sommersemester 2009

Statistik I. Sommersemester 2009 I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:

Mehr

Statistik I. Sommersemester 2009

Statistik I. Sommersemester 2009 I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:

Mehr

Statistik I im Sommersemester 2007

Statistik I im Sommersemester 2007 Themen am 18.6.2007: Statistik I im Sommersemester 2007 Zusammenhangsanalyse in der Vierfeldertabelle Von der Anteilsdifferenz zur Vierfeldertabelle Probeklausur 2 Lernziele: 1. Aufbau einer Kreuztabelle:

Mehr

Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.

Mehr

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten: Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine

Mehr

Zusammenhangsmaße II

Zusammenhangsmaße II Sommersemester 2009 Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins: Kapitel

Mehr

V a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X

V a r i a b l e X x 1 x 2 x 3 x 4 Σ y y y Σ Variable Y. V a r i a b l e X Ausgangsüberlegung: Verschiedene Kontingenztabellen bei gleicher Randverteilung und gleichem Stichprobenumfang n sind möglich. Beispiel: Variable Y V a r i a b l e X x 1 x x 3 x 4 Σ y 1 60 60 y 0 0 y 3

Mehr

Zusammenhangsmaße II

Zusammenhangsmaße II Sommersemester 2009 Wiederholung/ Eine nominale und eine intervallskalierte Variable χ 2 =?!? Übung von Simone Reutzel Heute im HS1, altes ReWi-Haus Zum Nachlesen Agresti/Finlay: Kapitel 8.5, 9.4 Gehring/Weins:

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009. Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Mehrfeldertabellen und Zusammenhangsmaße 1. Mehrfeldertabellen und Zusammenhangsmaße:

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax

Mehr

Grundlagen der empirischen Sozialforschung

Grundlagen der empirischen Sozialforschung Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Wichtige statistische Koeffizienten und Formeln

Wichtige statistische Koeffizienten und Formeln Wichtige statistische Koeffizienten und Formeln Felix Baumann Skalenniveau Art des Koeffizienten Koeffizient Formel (ab) ominalskala: (Unterscheidung nach Gleichheit/Ungleichheit; jeder Ausprägung eine

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht

Mehr

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation

Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2008, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2008, Statistik mit SPSS Sommersemester 2008, Statistik mit SPSS 27. August 2009 27. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Überblick 1. Mehrfeldertabelle und Zusammenhangsmaße für nominale Daten 2. Mehrfeldertabelle

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von

Mehr

Tutorial: χ 2 -Test auf vorgegebene Verteilung

Tutorial: χ 2 -Test auf vorgegebene Verteilung Tutorial: χ 2 -Test auf vorgegebene Verteilung Das Management eines Kaufhauses will durch eine Werbekampagne eine Verjüngung der Kundschaft erreichen. Bisher war die Verteilung (in %) auf Altersschichten

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen Überblick

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test 1 Zweidimensionaler und Vierfelder Chi²-Test 5 Literatur 6 Eindimensionaler Chi²-Test Berechnen der Effektgröße w² Die empirische Effektgröße

Mehr

Der χ2-test Der χ2-test

Der χ2-test Der χ2-test Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest) Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

11. Zusammenhangsmaße für nominale Variablen

11. Zusammenhangsmaße für nominale Variablen Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße)

5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5 PRE-Maße (Fehlerreduktionsmaße) 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen

Institut für Soziologie Dipl. Soz. Maximilian Sonnauer. Methoden II. Zusammenhangsmaße für kategoriale und metrische Variablen Institut für Soziologie Dipl. Soz. Methoden II Zusammenhangsmaße für kategoriale und metrische Variablen Organisatorisches Prüfungsanmeldung Methoden II Die Anmeldung zur Prüfung läuft über die Tafelübung.

Mehr

Forschungsstatistik I

Forschungsstatistik I Psychologie Prof. Dr. G. Meinhardt 6. Stock, TB II R. 06-206 (Persike) R. 06-321 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Alternative Darstellung des 2-Stcihprobentests für Anteile

Alternative Darstellung des 2-Stcihprobentests für Anteile Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Tutorial: Anpassungstest

Tutorial: Anpassungstest Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.

Mehr

r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings

r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings r=.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 5 6 7 8 9 6 films drownings films drownings films 8 drownings Nicholas Cage Swimming pool drownings

Mehr

Der χ 2 -Test (Chiquadrat-Test)

Der χ 2 -Test (Chiquadrat-Test) Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von

Mehr

STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN

STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN Steffen-M. Kühnel Dagmar Krebs 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße

INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße DAS THEMA: INFERENZSTATISTIK III INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße Inferenzstatistik für Lagemaße Standardfehler

Mehr

Statistik Einführung // Kategoriale Daten 10 p.2/26

Statistik Einführung // Kategoriale Daten 10 p.2/26 Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten

Mehr

Übungsblatt 10: Lineare Regression (Sitzung 11)

Übungsblatt 10: Lineare Regression (Sitzung 11) 1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede

Mehr

Einführung in die sozialwissenschaftliche Statistik

Einführung in die sozialwissenschaftliche Statistik Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße

Mehr

9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen

Mehr

Häufigkeitsverteilungen

Häufigkeitsverteilungen Häufigkeitsverteilungen Eine Häufigkeitsverteilung gibt die Verteilung eines erhobenen Merkmals an und ordnet jeder Ausprägung die jeweilige Häufigkeit zu. Bsp.: 100 Studenten werden gefragt, was sie studieren.

Mehr

Quantitative Auswertung II. Korpuslinguistik Heike Zinsmeister

Quantitative Auswertung II. Korpuslinguistik Heike Zinsmeister Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung - wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit

Mehr

6. Multivariate Verfahren Übersicht

6. Multivariate Verfahren Übersicht 6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression

Mehr

Parametrische und nichtparametrische Tests

Parametrische und nichtparametrische Tests XIII. Nichtparametrische Tests Seite 1 Parametrische und nichtparametrische Tests Parametrische Tests: Hier wird eine bestimmte Verteilung vorausgesetzt, und getestet, ob die gewählten Parameter passen.

Mehr

Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau

Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Lösungen zum Aufgabenblatt 2 1 Lösungen zum Aufgabenblatt 2: Bivariate Kreuztabellen mit nominalem Messniveau Nach dem Laden des Datensatzes (G:\DATEN\METH2\DATEN\EUROBAR\ Euba30.sav) ist zunächst der

Mehr

Herzlich willkommen zur Vorlesung Statistik

Herzlich willkommen zur Vorlesung Statistik FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik Zusammenhänge zwischen nominalen (und/oder ordinalen) Merkmalen: analyse und II: Signifikanztests und Maße der Assoziation

Mehr

"Korrelation" bei Nominaldaten: Kontingenz

Korrelation bei Nominaldaten: Kontingenz "Korrelation" bei Nominaldaten: Kontingenz j 1 2 3 beobachtete Häufigkeiten (KSV Tabelle 6.3): i Augenfar be Haarfarb e blau braun grün 1 blond 42 1 6 2 braun 12 5 22 3 schwarz 0 26 2 4 rot 8 4 0 175 i

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft

Mehr

Tutorial: Vergleich von Anteilen

Tutorial: Vergleich von Anteilen Tutorial: Vergleich von Anteilen Die Sicherung des Pensionssystems ist in vielen Ländern ein heikles Thema. Noch stärker als der Streit, wer wann welche Pension beziehen können soll, tobt ein Streit, welche

Mehr

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer

Mehr

Modul G.1 WS 07/08: Statistik

Modul G.1 WS 07/08: Statistik Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

Bivariate Zusammenhänge

Bivariate Zusammenhänge Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile

Alternative Darstellung des 2-Stichprobentests für Anteile Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile

Alternative Darstellung des 2-Stichprobentests für Anteile Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen

Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen Weisen die in einer Kontingenztafel dargestellten Merkmale zusätzlich Ordinalskalenniveau auf, so kommen auch Kenngrößen zum Einsatz, die in

Mehr

= 0.445, also annähernd die Hälfte aller Männer zugelassen 557

= 0.445, also annähernd die Hälfte aller Männer zugelassen 557 1 Einleitung Es soll anhand des UCBAdmissions Datensatzes die Frage beantwortet werden, ob bei der Zulassung von Studenten Frauen benachteiligt werden. Die Stichprobe lautet zunächst # Daten (UCB

Mehr

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Was sind Kontingenztabellen? Wofür werden Kontingenztabellen verwendet? Aufbau und Interpretation

Mehr

Zusammenhangsanalyse in Kontingenztabellen

Zusammenhangsanalyse in Kontingenztabellen Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013 1. Welche Aussage zur Statistik (in den Sozialwissenschaften) sind richtig? (2 Punkte) ( ) Statistik ist die Lehre von Methoden

Mehr

Kapitel 16 Kreuztabellen

Kapitel 16 Kreuztabellen Kapitel 16 Kreuztabellen Eine Kreuztabelle dient dazu, die kombinierte Häufigkeitsverteilung zweier Variablen darzustellen. Sie bildet somit das Pendant zu einer Häufigkeitstabelle für den 2-Variablen-Fall.

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten

5.2.3 Grafische Darstellung der gemeinsamen Verteilung. Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten 5.2.3 Grafische Darstellung der gemeinsamen Verteilung 5.2 Assoziationsmessung in Kontingenztafeln Verschiedene Darstellungsarten, z.b. als 3D-Säulendiagramm der gemeinsamen Häufigkeiten h ij oder normale

Mehr

Einführung in Web- und Data-Science

Einführung in Web- und Data-Science Einführung in Web- und Data-Science Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Tanya Braun (Übungen) P-Wert (einseitiger Ablehnungsbereich) Hypothesentest H 0 vs. H 1

Mehr

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Statistik I. 2. Klausur Wintersemester 2011/2012 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Statistik I A 2. Klausur Wintersemester 2011/2012 Hamburg, 20.03.2012 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................

Mehr

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen - nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige

Mehr

Prof. Dr. Achim Bühl SPSS 16. Einführung in die moderne Datenanalyse. 11., überarbeitete und erweiterte Auflage

Prof. Dr. Achim Bühl SPSS 16. Einführung in die moderne Datenanalyse. 11., überarbeitete und erweiterte Auflage Prof. Dr. Achim Bühl SPSS 16 Einführung in die moderne Datenanalyse 11., überarbeitete und erweiterte Auflage ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario

Mehr

2. Zusammenhangsmaße

2. Zusammenhangsmaße 2. Zusammenhangsmaße Signifikante χ²-werte von Kreuztabellen weisen auf die Existenz von Zusammenhängen zwischen den zwei untersuchten Variablen X und Y hin. Für die Interpretation interessieren jedoch

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile

Alternative Darstellung des 2-Stichprobentests für Anteile Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Einführung in die Induktive Statistik: Testen von Hypothesen

Einführung in die Induktive Statistik: Testen von Hypothesen Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr