Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17
|
|
- Felix Brauer
- vor 7 Jahren
- Abrufe
Transkript
1 Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/17
2 Übersicht Besitzen die Daten, die statistisch ausgewertet werden sollen, kategoriales Skalenniveau, unterscheidet man die folgenden Szenarien: Eine kategoriale Variable Dichtome Daten: Binomialtest (siehe Handbuch) Mehr als 2 Kategorien: χ 2 -Anpassungstest (siehe Handbuch) Zwei kategoriale Variablen Beide Variablen dichotom: Exakter Test nach Fisher Mindestens eine Variable mit mehr als 2 Kategorien: χ 2 -Unabhängigkeitstest 2/17
3 Kontigenztafel Voraussetzungen Für zwei Zufallsvariablen X und Y mit nominalskalierten Werten liegt eine unabhängige Stichprobe (X 1,Y 1 ),...,(X n,y n ) vom Umfang n vor. Für Variablen vom diskreten Typ macht die Erstellung eines Scatterplots natürlich wenig Sinn. Man kann die Daten allerdings mit einer Kontingenztafel ein wenig anschaulicher gestalten. Neben den einzelnen Zellhäufigkeiten ist dabei auch die Gesamthäufigkeit für eine Variablenstufe von Interesse. 3/17
4 Kontigenztafel X := Augenfarbe mit den Ausprägungen X {blau, braun, grün, nuss} Y := Haarfarbe mit den Ausprägungen Y {blond, braun, rot, schwarz} blond braun rot schwarz Gesamt blau braun grün nuss Gesamt /17
5 Kontigenztafel Kontigenztafel in R # Kreuztabelle (tab.haarauge <- table(haarauge)) # Anfügen von Zeilen- und Spaltensummen addmargins(tab.haarauge) # Zeilen- und Spaltenprozente prop.table(tab.haarauge, 1) prop.table(tab.haarauge, 2) 5/17
6 Grafische Veranschaulichung blond braun rot schwarz Haarfarbe Augenfarbe blau braun grün nuss 6/17
7 Grafische Veranschaulichung Balkendiagramm zum Unabhängigkeitstest # Erzeuge eine Tabelle mit den (spaltenweisen) # relativen Häufigkeiten grafik.haarauge <- prop.table(table(haarauge), 2) # Balkendiagramm mit den relativen Häufigkeiten barplot(grafik.haarauge, col = c("darkblue", "saddlebrown", "darkgreen", "tan"), xlim = c(0, 7), xlab = "Haarfarbe") # Erzeuge die Legende am rechten oberen Bildrand legend("topright", legend = rownames(grafik.haarauge), title = "Augenfarbe", fill = c("darkblue", "saddlebrown", "darkgreen", "tan")) 7/17
8 χ 2 -Unabhängigkeitstest Die nominalskalierten Variablen X und Y mit einem statistischen Verfahren auf ihren Zusammenhang zu testen, kann man mit dem χ 2 -Unabhängigkeitstest. Die zu untersuchende Nullhypothese lautet: H 0 : X und Y sind voneinander unabhängig Das Vorgehen des χ 2 -Tests macht man sich am verständlichsten mit Kontingenztafeln deutlich. Das Resultat jeder Sichprobe mit paarweisen Beobachtungen (X i,y i ) lässt sich mit einer Kontingenztafel darstellen. 8/17
9 χ 2 -Unabhängigkeitstest Grundlegender Gedanke: Ausgehend von den vorliegenden Daten berechnet man beim χ 2 -Test die erwarteten Häufigkeiten jeder Faktorstufenkombination unter der Annahme, dass X und Y unabhängig sind. Diese erwarteten Häufigkeiten werden dann mit den tatsächlichen Häufigkeiten verglichen. Trifft H 0 zu, sollte die Differenz der beiden Werte nahe bei Null liegen. Die zugehörige Teststatistik X 2 ist etwas komplizierter vereinfacht gesprochen werden die quadrierten Differenzen für jede Faktorstufenkombination aufsummiert: X 2 := I i=1 j=1 ( J nij n jn i n n j n i n ) 2. Wird diese Gesamtsumme zu groß, wird H 0 verworfen. 9/17
10 χ 2 -Unabhängigkeitstest Der χ 2 -Unabhängigkeitstest ist ein approximatives Testverfahren die zugehörige Teststatistik T P ist nur approximativ χ 2 -verteilt mit (I 1)(J 1) Freiheitsgraden. Das gleiche Problem tritt beispielsweise beim Mann-Whitney-U-Test auf. Damit die Approximation von ausreichender Güte ist, sollte die folgende Faustregel erfüllt sein: Faustregel für den χ 2 -Test (Regel von Cochran) Die erwartete Häufigkeit sollte in jeder Zelle mindestens den Wert 1 betragen und für 80% der Zellen sollte die erwartete Häufigkeit mindestens den Wert 5 betragen. Ist die Regel verletzt, gibt es zwei Möglichkeiten: (i) Weglassen von dünn besetzten Kategorien oder (ii) Zusammenfassen von (fachlich ähnlichen) Kategorien. 10/17
11 χ 2 -Unabhängigkeitstest Der χ 2 -Unabhängigkeitstest in R # Chi-Quadrat-Test chisq.test(haarauge$haar, haarauge$auge) # Erwartete Häufigkeiten chisq.test(haarauge$haar, haarauge$auge)$expected # Residuen der Faktorstufenkombinationen chisq.test(haarauge$haar, haarauge$auge)$residuals 11/17
12 Vierfeldertafel Ein wichtiger Spezialfall tritt auf, wenn die Variablen X und Y beide dichotom sind, d.h. jeweils nur zwei mögliche Ausprägungen besitzen. In diesem Fall spricht man bei der Kontingenztafel auch von einer Vierfeldertafel. Dieser Fall ist unter anderem deshalb so wichtig, weil es für ihn ein spezielles Auswertungsverfahren gibt, dass auf Kontingeztafeln höherer Ordnung nicht anwendbar ist (siehe weiter unten). Allgemeines Schema einer Vierfeldertafel: X/Y n 11 n 12 n 1 2 n 21 n 22 n 2 n 1 n 2 n 12/17
13 Exakter Test nach Fisher Für den Fall zweier binärer Variablen X und Y kann man auf den approximativen χ 2 -Test verzichten. Hierfür ist ein exakter Test möglich, nämlich Fishers exakter Test. Die obigen Faustregeln für eine ausreichende Güte des Tests sind in diesem Fall also nicht zu beachten die Zellenbesetzung in einer Vierfeldertafel kann demzufolge auch sehr dünn sein. Die Nullhypothese H 0 ist hier die gleiche wie beim χ 2 -Test, nämlich dass die beiden Variablen unabhängig voneinander sind. Die Teststatistik ist in diesem Fall sehr einfach definiert durch T F := n 11 also genau der Wert in der linken oberen Zelle. Die Teststatistik T F ist unter H 0 hypergeometrisch verteilt gemäß H(n,n 1,n 1 ). 13/17
14 Exakter Test nach Fisher Fishers exakter Test in R # Fishers exakter Test fisher.test(kino$geschlecht, kino$alter.codiert) 14/17
15 Aufgaben zur Vertiefung I Aufabe zum Datensatz titanic Der Datensatz enthält Informationen über die Klassenzugehörigkeit, das Geschlecht und das Alter aller Passagiere der Titanic. (i) Gibt es einen Zusammenhang zwischen dem Überleben des Schiffsuntergangs und der Klasse? (ii) Gibt es einen Zusammenhang zwischen Überleben und Geschlecht? (iii) Gibt es einen Zusammenhang zwischen Überleben und dem Alter? Erstellen Sie hierfür eine neue Variable mit zwei Kategorien: Passagiere unter 18 Jahre und Passagiere über 18 Jahre. 15/17
16 Aufgaben zur Vertiefung II Aufgabe zum Datensatz suizid Der Datensatz enthält Informationen über die Todesart von Personen, die einen Suizid begangen haben. Gibt es einen Zusammenhang zwischen der Art des Selbstmords und dem Geschlecht? Aufabe zum Datensatz interesse Das Ergebnis einer Umfrage nach den Interesse an Fußball ist im Datensatz interesse dokumentiert. Gibt es einen Zusammenhang zwischen dem Interesse an Fußball und dem Geschlecht der befragten Personen? 16/17
17 Aufgaben zur Vertiefung III Aufgabe zum Datensatz kopfschmerzen Ein neues Medikament (Medikament1) gegen Kopfschmerzen wird gegen ein bereits auf dem Markt zugelassenes Medikament (Medikament2) getestet. Von allen Teilnehmern wird außerdem aufgezeichnet, ob sich ihre Kopfschmerzen durch das Medikament verbessert haben (behandlungserfolg). Untersuche die Fragestellung ob das neue Medikament besser wirkt, als das bereits zugelassene. Aufgabe zum Datensatz kino Öffne den Datensatz kino und definiere die Variable alter.codiert nach dem Schema alter 37 jung alter > 37 alt Gibt es einen Zusammenhang zwischen gender und alter.codiert? 17/17
Abhängigkeit zweier Merkmale
Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich
MehrKategoriale und metrische Daten
Kategoriale und metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/14 Übersicht Abhängig von der Anzahl der Ausprägung der kategorialen Variablen unterscheidet man die folgenden Szenarien:
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
Mehr9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen
MehrDer χ2-test Der χ2-test
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrAnalyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrDer χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrStatistik Einführung // Kategoriale Daten 10 p.2/26
Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
Mehr7 Kategoriale Daten. 7.1 Eine kategoriale Variable Der χ 2 -Anpassungstest
7 Kategoriale Daten Kategoriale Daten erhält man durch Klassifikation von auftretenden Beobachtungen in verschiedene Kategorien. Der Definition 6.1.3 folgend, sind dies also Daten, die nominalskaliert
MehrBiometrieübung 11 Kontingenztafeln
Biometrieübung 11 (Kontingenztafeln) - Aufgabe Biometrieübung 11 Kontingenztafeln Aufgabe 1 2x2-Kontingenztafeln 100 weibliche Patienten sind mit einer konventionellen Therapie behandelt worden 85 Patientinnen
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrParametrische und nichtparametrische Tests
XIII. Nichtparametrische Tests Seite 1 Parametrische und nichtparametrische Tests Parametrische Tests: Hier wird eine bestimmte Verteilung vorausgesetzt, und getestet, ob die gewählten Parameter passen.
MehrAufgabensammlung. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/9
Aufgabensammlung Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/9 Datenimport und Datenexport Lies die folgenden Rohdatensätze in R ein und verwende hierzu entweder die Funktionen read.table()
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrTHEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ
W THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI W Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training Dr. Torsten Scholz
MehrTutorial:Unabhängigkeitstest
Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung
Mehr5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest
Empirische Wirtschaftsforschung Prof. Dr. Ralf Runde 5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest Ein wesentliches Merkmal nichtparametrischer Testverfahren ist, dass diese im Allgemeinen weniger
MehrComputergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
MehrTutorial: χ 2 -Test auf vorgegebene Verteilung
Tutorial: χ 2 -Test auf vorgegebene Verteilung Das Management eines Kaufhauses will durch eine Werbekampagne eine Verjüngung der Kundschaft erreichen. Bisher war die Verteilung (in %) auf Altersschichten
MehrTutorial: Anpassungstest
Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom
MehrAnalyse von Kontingenztafeln bei ordinalskalierten Merkmalen
Analyse von Kontingenztafeln bei ordinalskalierten Merkmalen Weisen die in einer Kontingenztafel dargestellten Merkmale zusätzlich Ordinalskalenniveau auf, so kommen auch Kenngrößen zum Einsatz, die in
Mehr1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0
1.4 Der Binomialtest Mit dem Binomialtest kann eine Hypothese bezüglich der Wahrscheinlichkeit für das Auftreten einer Kategorie einer dichotomen (es kommen nur zwei Ausprägungen vor, z.b. 0 und 1) Zufallsvariablen
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
Mehr5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
MehrKategorielle Variablen
Kategorielle Variablen 06.11.2017 Motivation Bisher: Kontinuierliche Variablen Zusammenhang zwischen kontinuierlichen Variablen? Korrelation und Regression Jetzt: Kategorielle Variablen Zusammenhang zwischen
MehrPROC FREQ für Kontingenztafeln
zum Überprüfen von Zusammenhängen zweier qualitativer Merkmale Allgemeine Form: PROC FREQ DATA=name Optionen ; TABLES (variablenliste) * (variablenliste) / Optionen ; Beispiel und Beschreibung der Programm-Statements:
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/476 c Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrMehrere kategoriale Merkmale
Kapitel 3 Mehrere kategoriale Merkmale 3.1 Wie kann man zwei kategoriale Merkmale numerisch beschreiben? Kontingenztafeln (Kreuztabellen) erzeugt man wiederum mit table: R> CMMRCIAL
MehrTutorial: Vergleich von Anteilen
Tutorial: Vergleich von Anteilen Die Sicherung des Pensionssystems ist in vielen Ländern ein heikles Thema. Noch stärker als der Streit, wer wann welche Pension beziehen können soll, tobt ein Streit, welche
MehrStatistik für Ingenieure Vorlesung 13
Statistik für Ingenieure Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6. Februar 2018 5.1.4. Weitere ausgewählte statistische Tests a) Binomialtest Der Binomialtest
MehrBlockpraktikum zur Statistik mit R
Blockpraktikum zur Statistik mit R 08. Oktober 2010 Till Breuer, Sebastian Mentemeier und Matti Schneider Institut für Mathematische Statistik Universität Münster WS 2010/11 Gliederung 1 Ein-Stichproben-Fall
MehrBIOMETRIE I - KLINISCHE EPIDEMIOLOGIE
BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrDWT 334/460 csusanne Albers
Die Wahrscheinlichkeit fur den Fehler 1. Art wird mit bezeichnet, und man spricht deshalb gelegentlich vom -Fehler. heit auch Signikanzniveau des Tests. In der Praxis ist es ublich, sich ein Signikanzniveau
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen
MehrAnalytische Statistik II
Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
MehrKategorielle Daten. Seminar für Statistik Markus Kalisch
Kategorielle Daten Markus Kalisch 1 Phase 3 Studie: Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Grundfrage: Sind Heilung und Medikamentengabe unabhängig?
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Post Hoc Tests A priori Tests (Kontraste) Nicht-parametrischer Vergleich von Mittelwerten 50 Ergebnis der ANOVA Sprossdichte der Seegräser 40 30 20 10
Mehr= 0.445, also annähernd die Hälfte aller Männer zugelassen 557
1 Einleitung Es soll anhand des UCBAdmissions Datensatzes die Frage beantwortet werden, ob bei der Zulassung von Studenten Frauen benachteiligt werden. Die Stichprobe lautet zunächst # Daten (UCB
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrWahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019
Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z
Mehr1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n
3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrLiegen 2 Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen
Mittelwertsvergleich bei gebundenen Stichproben Liegen Beobachtungen an n Objekten vor, spricht man von einer gebundenen Stichprobe Typische Struktur bei "stimulus-response" Versuchen Obj.1 Obj.... Obj.n
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
MehrParameterfreie Tests. ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen
Parameterfreie Tests ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen ²- Anpassungstest Test auf Vorliegen einer bestimmten Verteilung Binomialtest Vergleich von unbekannten Anteilen
MehrSo berechnen Sie einen Schätzer für einen Punkt
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung
MehrBachelorprüfung: Statistik (1 Stunde)
Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation
MehrChi Quadrat-Unabhängigkeitstest
Fragestellung 1: Untersuchung mit Hilfe des Chi-Quadrat-Unabhängigkeitstestes, ob zwischen dem Herkunftsland der Befragten und der Bewertung des Kontaktes zu den Nachbarn aus einem Anderen Herkunftsland
MehrVorlesung 12a. Kann das Zufall sein? Beispiele von statistischen Tests
Vorlesung 12a Kann das Zufall sein? Beispiele von statistischen Tests 1 Beispiel 1: Passen die Verhältnisse in den Rahmen? Fishers exakter Test (vgl. Buch S. 130/131 2 Sir Ronald Fisher 1890-1962 3 Aus
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Juni 2014 Waldherr / Christodoulides Einführung in Quantitative Methoden 1/46 Anpassungstests allgemein Gegeben: Häufigkeitsverteilung
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrWahrscheinlichkeit und Statistik BSc D-INFK
Prof. Dr. P. Bühlmann ETH Zürich Winter 2010 Wahrscheinlichkeit und Statistik BSc D-INFK 1. (10 Punkte) Bei den folgenden 10 Fragen ist jeweils genau eine Antwort richtig. Es gibt pro richtig beantwortete
MehrStatistik II für Betriebswirte Vorlesung 3
Statistik II für Betriebswirte Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 2. November 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung
Mehr9. Übung (Analyse von qualitativen Daten)
9. Übung (Analyse von qualitativen Daten) (Prüfung von Unabhängigkeit, Homogenität und Anpassung) Man unterscheidet vor allem die folgenden Tests: Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen ob die in diesem Datensatz untersuchte
MehrWirtschaftsstatistik-Klausur am
Wirtschaftsstatistik-Klausur am 0.07.017 Aufgabe 1 Ein Handy- und PC-Hersteller verfügt über ein exklusives Filialnetz von 900 Filialen. Der Gewinn (in GE) der Filialen ist in der folgenden Tabelle nach
MehrChi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge
Chi² Test und Kontingenzoeffizient Für nominalsalierte Daten: - diese haben unterschiedliche Ausprägung, - aber eine natürliche Reihenfolge 1. Chi² Test Test nominalsalierter Daten Vergleich von beobachteten
Mehr