Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17

Größe: px
Ab Seite anzeigen:

Download "Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17"

Transkript

1 Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/17

2 Übersicht Besitzen die Daten, die statistisch ausgewertet werden sollen, kategoriales Skalenniveau, unterscheidet man die folgenden Szenarien: Eine kategoriale Variable Dichtome Daten: Binomialtest (siehe Handbuch) Mehr als 2 Kategorien: χ 2 -Anpassungstest (siehe Handbuch) Zwei kategoriale Variablen Beide Variablen dichotom: Exakter Test nach Fisher Mindestens eine Variable mit mehr als 2 Kategorien: χ 2 -Unabhängigkeitstest 2/17

3 Kontigenztafel Voraussetzungen Für zwei Zufallsvariablen X und Y mit nominalskalierten Werten liegt eine unabhängige Stichprobe (X 1,Y 1 ),...,(X n,y n ) vom Umfang n vor. Für Variablen vom diskreten Typ macht die Erstellung eines Scatterplots natürlich wenig Sinn. Man kann die Daten allerdings mit einer Kontingenztafel ein wenig anschaulicher gestalten. Neben den einzelnen Zellhäufigkeiten ist dabei auch die Gesamthäufigkeit für eine Variablenstufe von Interesse. 3/17

4 Kontigenztafel X := Augenfarbe mit den Ausprägungen X {blau, braun, grün, nuss} Y := Haarfarbe mit den Ausprägungen Y {blond, braun, rot, schwarz} blond braun rot schwarz Gesamt blau braun grün nuss Gesamt /17

5 Kontigenztafel Kontigenztafel in R # Kreuztabelle (tab.haarauge <- table(haarauge)) # Anfügen von Zeilen- und Spaltensummen addmargins(tab.haarauge) # Zeilen- und Spaltenprozente prop.table(tab.haarauge, 1) prop.table(tab.haarauge, 2) 5/17

6 Grafische Veranschaulichung blond braun rot schwarz Haarfarbe Augenfarbe blau braun grün nuss 6/17

7 Grafische Veranschaulichung Balkendiagramm zum Unabhängigkeitstest # Erzeuge eine Tabelle mit den (spaltenweisen) # relativen Häufigkeiten grafik.haarauge <- prop.table(table(haarauge), 2) # Balkendiagramm mit den relativen Häufigkeiten barplot(grafik.haarauge, col = c("darkblue", "saddlebrown", "darkgreen", "tan"), xlim = c(0, 7), xlab = "Haarfarbe") # Erzeuge die Legende am rechten oberen Bildrand legend("topright", legend = rownames(grafik.haarauge), title = "Augenfarbe", fill = c("darkblue", "saddlebrown", "darkgreen", "tan")) 7/17

8 χ 2 -Unabhängigkeitstest Die nominalskalierten Variablen X und Y mit einem statistischen Verfahren auf ihren Zusammenhang zu testen, kann man mit dem χ 2 -Unabhängigkeitstest. Die zu untersuchende Nullhypothese lautet: H 0 : X und Y sind voneinander unabhängig Das Vorgehen des χ 2 -Tests macht man sich am verständlichsten mit Kontingenztafeln deutlich. Das Resultat jeder Sichprobe mit paarweisen Beobachtungen (X i,y i ) lässt sich mit einer Kontingenztafel darstellen. 8/17

9 χ 2 -Unabhängigkeitstest Grundlegender Gedanke: Ausgehend von den vorliegenden Daten berechnet man beim χ 2 -Test die erwarteten Häufigkeiten jeder Faktorstufenkombination unter der Annahme, dass X und Y unabhängig sind. Diese erwarteten Häufigkeiten werden dann mit den tatsächlichen Häufigkeiten verglichen. Trifft H 0 zu, sollte die Differenz der beiden Werte nahe bei Null liegen. Die zugehörige Teststatistik X 2 ist etwas komplizierter vereinfacht gesprochen werden die quadrierten Differenzen für jede Faktorstufenkombination aufsummiert: X 2 := I i=1 j=1 ( J nij n jn i n n j n i n ) 2. Wird diese Gesamtsumme zu groß, wird H 0 verworfen. 9/17

10 χ 2 -Unabhängigkeitstest Der χ 2 -Unabhängigkeitstest ist ein approximatives Testverfahren die zugehörige Teststatistik T P ist nur approximativ χ 2 -verteilt mit (I 1)(J 1) Freiheitsgraden. Das gleiche Problem tritt beispielsweise beim Mann-Whitney-U-Test auf. Damit die Approximation von ausreichender Güte ist, sollte die folgende Faustregel erfüllt sein: Faustregel für den χ 2 -Test (Regel von Cochran) Die erwartete Häufigkeit sollte in jeder Zelle mindestens den Wert 1 betragen und für 80% der Zellen sollte die erwartete Häufigkeit mindestens den Wert 5 betragen. Ist die Regel verletzt, gibt es zwei Möglichkeiten: (i) Weglassen von dünn besetzten Kategorien oder (ii) Zusammenfassen von (fachlich ähnlichen) Kategorien. 10/17

11 χ 2 -Unabhängigkeitstest Der χ 2 -Unabhängigkeitstest in R # Chi-Quadrat-Test chisq.test(haarauge$haar, haarauge$auge) # Erwartete Häufigkeiten chisq.test(haarauge$haar, haarauge$auge)$expected # Residuen der Faktorstufenkombinationen chisq.test(haarauge$haar, haarauge$auge)$residuals 11/17

12 Vierfeldertafel Ein wichtiger Spezialfall tritt auf, wenn die Variablen X und Y beide dichotom sind, d.h. jeweils nur zwei mögliche Ausprägungen besitzen. In diesem Fall spricht man bei der Kontingenztafel auch von einer Vierfeldertafel. Dieser Fall ist unter anderem deshalb so wichtig, weil es für ihn ein spezielles Auswertungsverfahren gibt, dass auf Kontingeztafeln höherer Ordnung nicht anwendbar ist (siehe weiter unten). Allgemeines Schema einer Vierfeldertafel: X/Y n 11 n 12 n 1 2 n 21 n 22 n 2 n 1 n 2 n 12/17

13 Exakter Test nach Fisher Für den Fall zweier binärer Variablen X und Y kann man auf den approximativen χ 2 -Test verzichten. Hierfür ist ein exakter Test möglich, nämlich Fishers exakter Test. Die obigen Faustregeln für eine ausreichende Güte des Tests sind in diesem Fall also nicht zu beachten die Zellenbesetzung in einer Vierfeldertafel kann demzufolge auch sehr dünn sein. Die Nullhypothese H 0 ist hier die gleiche wie beim χ 2 -Test, nämlich dass die beiden Variablen unabhängig voneinander sind. Die Teststatistik ist in diesem Fall sehr einfach definiert durch T F := n 11 also genau der Wert in der linken oberen Zelle. Die Teststatistik T F ist unter H 0 hypergeometrisch verteilt gemäß H(n,n 1,n 1 ). 13/17

14 Exakter Test nach Fisher Fishers exakter Test in R # Fishers exakter Test fisher.test(kino$geschlecht, kino$alter.codiert) 14/17

15 Aufgaben zur Vertiefung I Aufabe zum Datensatz titanic Der Datensatz enthält Informationen über die Klassenzugehörigkeit, das Geschlecht und das Alter aller Passagiere der Titanic. (i) Gibt es einen Zusammenhang zwischen dem Überleben des Schiffsuntergangs und der Klasse? (ii) Gibt es einen Zusammenhang zwischen Überleben und Geschlecht? (iii) Gibt es einen Zusammenhang zwischen Überleben und dem Alter? Erstellen Sie hierfür eine neue Variable mit zwei Kategorien: Passagiere unter 18 Jahre und Passagiere über 18 Jahre. 15/17

16 Aufgaben zur Vertiefung II Aufgabe zum Datensatz suizid Der Datensatz enthält Informationen über die Todesart von Personen, die einen Suizid begangen haben. Gibt es einen Zusammenhang zwischen der Art des Selbstmords und dem Geschlecht? Aufabe zum Datensatz interesse Das Ergebnis einer Umfrage nach den Interesse an Fußball ist im Datensatz interesse dokumentiert. Gibt es einen Zusammenhang zwischen dem Interesse an Fußball und dem Geschlecht der befragten Personen? 16/17

17 Aufgaben zur Vertiefung III Aufgabe zum Datensatz kopfschmerzen Ein neues Medikament (Medikament1) gegen Kopfschmerzen wird gegen ein bereits auf dem Markt zugelassenes Medikament (Medikament2) getestet. Von allen Teilnehmern wird außerdem aufgezeichnet, ob sich ihre Kopfschmerzen durch das Medikament verbessert haben (behandlungserfolg). Untersuche die Fragestellung ob das neue Medikament besser wirkt, als das bereits zugelassene. Aufgabe zum Datensatz kino Öffne den Datensatz kino und definiere die Variable alter.codiert nach dem Schema alter 37 jung alter > 37 alt Gibt es einen Zusammenhang zwischen gender und alter.codiert? 17/17

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Kategoriale und metrische Daten

Kategoriale und metrische Daten Kategoriale und metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/14 Übersicht Abhängig von der Anzahl der Ausprägung der kategorialen Variablen unterscheidet man die folgenden Szenarien:

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen

Mehr

Der χ2-test Der χ2-test

Der χ2-test Der χ2-test Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest) Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Statistik Einführung // Kategoriale Daten 10 p.2/26

Statistik Einführung // Kategoriale Daten 10 p.2/26 Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile

Alternative Darstellung des 2-Stichprobentests für Anteile Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von

Mehr

Alternative Darstellung des 2-Stcihprobentests für Anteile

Alternative Darstellung des 2-Stcihprobentests für Anteile Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile

Alternative Darstellung des 2-Stichprobentests für Anteile Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Der χ 2 -Test (Chiquadrat-Test)

Der χ 2 -Test (Chiquadrat-Test) Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von

Mehr

7 Kategoriale Daten. 7.1 Eine kategoriale Variable Der χ 2 -Anpassungstest

7 Kategoriale Daten. 7.1 Eine kategoriale Variable Der χ 2 -Anpassungstest 7 Kategoriale Daten Kategoriale Daten erhält man durch Klassifikation von auftretenden Beobachtungen in verschiedene Kategorien. Der Definition 6.1.3 folgend, sind dies also Daten, die nominalskaliert

Mehr

Biometrieübung 11 Kontingenztafeln

Biometrieübung 11 Kontingenztafeln Biometrieübung 11 (Kontingenztafeln) - Aufgabe Biometrieübung 11 Kontingenztafeln Aufgabe 1 2x2-Kontingenztafeln 100 weibliche Patienten sind mit einer konventionellen Therapie behandelt worden 85 Patientinnen

Mehr

Alternative Darstellung des 2-Stichprobentests für Anteile

Alternative Darstellung des 2-Stichprobentests für Anteile Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut

Mehr

Parametrische und nichtparametrische Tests

Parametrische und nichtparametrische Tests XIII. Nichtparametrische Tests Seite 1 Parametrische und nichtparametrische Tests Parametrische Tests: Hier wird eine bestimmte Verteilung vorausgesetzt, und getestet, ob die gewählten Parameter passen.

Mehr

Aufgabensammlung. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/9

Aufgabensammlung. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/9 Aufgabensammlung Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/9 Datenimport und Datenexport Lies die folgenden Rohdatensätze in R ein und verwende hierzu entweder die Funktionen read.table()

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann

Mehr

Chi-Quadrat Verfahren

Chi-Quadrat Verfahren Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz

Mehr

THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ

THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN  TORSTEN SCHOLZ W THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI W Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training Dr. Torsten Scholz

Mehr

Tutorial:Unabhängigkeitstest

Tutorial:Unabhängigkeitstest Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung

Mehr

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest

5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest Empirische Wirtschaftsforschung Prof. Dr. Ralf Runde 5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest Ein wesentliches Merkmal nichtparametrischer Testverfahren ist, dass diese im Allgemeinen weniger

Mehr

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08 Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung

Mehr

Tutorial: χ 2 -Test auf vorgegebene Verteilung

Tutorial: χ 2 -Test auf vorgegebene Verteilung Tutorial: χ 2 -Test auf vorgegebene Verteilung Das Management eines Kaufhauses will durch eine Werbekampagne eine Verjüngung der Kundschaft erreichen. Bisher war die Verteilung (in %) auf Altersschichten

Mehr

Tutorial: Anpassungstest

Tutorial: Anpassungstest Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom

Mehr

Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen

Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen Weisen die in einer Kontingenztafel dargestellten Merkmale zusätzlich Ordinalskalenniveau auf, so kommen auch Kenngrößen zum Einsatz, die in

Mehr

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0

1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0 1.4 Der Binomialtest Mit dem Binomialtest kann eine Hypothese bezüglich der Wahrscheinlichkeit für das Auftreten einer Kategorie einer dichotomen (es kommen nur zwei Ausprägungen vor, z.b. 0 und 1) Zufallsvariablen

Mehr

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten: Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine

Mehr

Statistik II. Weitere Statistische Tests. Statistik II

Statistik II. Weitere Statistische Tests. Statistik II Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

5. Lektion: Einfache Signifikanztests

5. Lektion: Einfache Signifikanztests Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen

Mehr

Kategorielle Variablen

Kategorielle Variablen Kategorielle Variablen 06.11.2017 Motivation Bisher: Kontinuierliche Variablen Zusammenhang zwischen kontinuierlichen Variablen? Korrelation und Regression Jetzt: Kategorielle Variablen Zusammenhang zwischen

Mehr

PROC FREQ für Kontingenztafeln

PROC FREQ für Kontingenztafeln zum Überprüfen von Zusammenhängen zweier qualitativer Merkmale Allgemeine Form: PROC FREQ DATA=name Optionen ; TABLES (variablenliste) * (variablenliste) / Optionen ; Beispiel und Beschreibung der Programm-Statements:

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/476 c Ernst W. Mayr

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/476 c Ernst W. Mayr Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Mehrere kategoriale Merkmale

Mehrere kategoriale Merkmale Kapitel 3 Mehrere kategoriale Merkmale 3.1 Wie kann man zwei kategoriale Merkmale numerisch beschreiben? Kontingenztafeln (Kreuztabellen) erzeugt man wiederum mit table: R> CMMRCIAL

Mehr

Tutorial: Vergleich von Anteilen

Tutorial: Vergleich von Anteilen Tutorial: Vergleich von Anteilen Die Sicherung des Pensionssystems ist in vielen Ländern ein heikles Thema. Noch stärker als der Streit, wer wann welche Pension beziehen können soll, tobt ein Streit, welche

Mehr

Statistik für Ingenieure Vorlesung 13

Statistik für Ingenieure Vorlesung 13 Statistik für Ingenieure Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6. Februar 2018 5.1.4. Weitere ausgewählte statistische Tests a) Binomialtest Der Binomialtest

Mehr

Blockpraktikum zur Statistik mit R

Blockpraktikum zur Statistik mit R Blockpraktikum zur Statistik mit R 08. Oktober 2010 Till Breuer, Sebastian Mentemeier und Matti Schneider Institut für Mathematische Statistik Universität Münster WS 2010/11 Gliederung 1 Ein-Stichproben-Fall

Mehr

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

DWT 334/460 csusanne Albers

DWT 334/460 csusanne Albers Die Wahrscheinlichkeit fur den Fehler 1. Art wird mit bezeichnet, und man spricht deshalb gelegentlich vom -Fehler. heit auch Signikanzniveau des Tests. In der Praxis ist es ublich, sich ein Signikanzniveau

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen

Mehr

Analytische Statistik II

Analytische Statistik II Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,

Mehr

Test auf den Erwartungswert

Test auf den Erwartungswert Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen

Mehr

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.

Mehr

Kategorielle Daten. Seminar für Statistik Markus Kalisch

Kategorielle Daten. Seminar für Statistik Markus Kalisch Kategorielle Daten Markus Kalisch 1 Phase 3 Studie: Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Grundfrage: Sind Heilung und Medikamentengabe unabhängig?

Mehr

Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Klausur zur Vorlesung

Klausur zur Vorlesung Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen

Mehr

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung - wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit

Mehr

Was sind Zusammenhangsmaße?

Was sind Zusammenhangsmaße? Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10

Mehr

= 0.445, also annähernd die Hälfte aller Männer zugelassen 557

= 0.445, also annähernd die Hälfte aller Männer zugelassen 557 1 Einleitung Es soll anhand des UCBAdmissions Datensatzes die Frage beantwortet werden, ob bei der Zulassung von Studenten Frauen benachteiligt werden. Die Stichprobe lautet zunächst # Daten (UCB

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019 Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...

1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente... Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,

Mehr

Liegen 2 Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen

Liegen 2 Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei stimulus-response Versuchen Mittelwertsvergleich bei gebundenen Stichproben Liegen Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen Obj.1 Obj.... Obj.n

Mehr

Statistik I. Sommersemester 2009

Statistik I. Sommersemester 2009 I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:

Mehr

Parameterfreie Tests. ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen

Parameterfreie Tests. ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen Parameterfreie Tests ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen ²- Anpassungstest Test auf Vorliegen einer bestimmten Verteilung Binomialtest Vergleich von unbekannten Anteilen

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Bachelorprüfung: Statistik (1 Stunde)

Bachelorprüfung: Statistik (1 Stunde) Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation

Mehr

Chi Quadrat-Unabhängigkeitstest

Chi Quadrat-Unabhängigkeitstest Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland

Mehr

Vorlesung 12a. Kann das Zufall sein? Beispiele von statistischen Tests

Vorlesung 12a. Kann das Zufall sein? Beispiele von statistischen Tests Vorlesung 12a Kann das Zufall sein? Beispiele von statistischen Tests 1 Beispiel 1: Passen die Verhältnisse in den Rahmen? Fishers exakter Test (vgl. Buch S. 130/131 2 Sir Ronald Fisher 1890-1962 3 Aus

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Juni 2014 Waldherr / Christodoulides Einführung in Quantitative Methoden 1/46 Anpassungstests allgemein Gegeben: Häufigkeitsverteilung

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

Wahrscheinlichkeit und Statistik BSc D-INFK

Wahrscheinlichkeit und Statistik BSc D-INFK Prof. Dr. P. Bühlmann ETH Zürich Winter 2010 Wahrscheinlichkeit und Statistik BSc D-INFK 1. (10 Punkte) Bei den folgenden 10 Fragen ist jeweils genau eine Antwort richtig. Es gibt pro richtig beantwortete

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 Statistik II für Betriebswirte Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 2. November 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung

Mehr

9. Übung (Analyse von qualitativen Daten)

9. Übung (Analyse von qualitativen Daten) 9. Übung (Analyse von qualitativen Daten) (Prüfung von Unabhängigkeit, Homogenität und Anpassung) Man unterscheidet vor allem die folgenden Tests: Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen ob die in diesem Datensatz untersuchte

Mehr

Wirtschaftsstatistik-Klausur am

Wirtschaftsstatistik-Klausur am Wirtschaftsstatistik-Klausur am 0.07.017 Aufgabe 1 Ein Handy- und PC-Hersteller verfügt über ein exklusives Filialnetz von 900 Filialen. Der Gewinn (in GE) der Filialen ist in der folgenden Tabelle nach

Mehr

Chi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge

Chi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge Chi² Test und Kontingenzoeffizient Für nominalsalierte Daten: - diese haben unterschiedliche Ausprägung, - aber eine natürliche Reihenfolge 1. Chi² Test Test nominalsalierter Daten Vergleich von beobachteten

Mehr