9. Übung (Analyse von qualitativen Daten)
|
|
- Jasper Franke
- vor 5 Jahren
- Abrufe
Transkript
1 9. Übung (Analyse von qualitativen Daten) (Prüfung von Unabhängigkeit, Homogenität und Anpassung) Man unterscheidet vor allem die folgenden Tests: Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind. Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind. Es wird überprüft, ob das Verhältnis irgendeiner Eigenschaft in der Stichprobe und Population übereinstimmt. Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen. Vierfelder-Test als Spezialfall des Chi-Quadrat-Tests für (2x2)-Kontingenztabellen. Es werden von den R-Daten Datentabelle Falter gebraucht. Prüfung von Unabhängigkeit Frage 1: Es wurde in einem umfangreichen Versuch das Cholesterinniveau der Patienten gemessen. Sind Cholesterinniveau und Geschlecht unabhängig? Cholesterinniveau erhöht normal Gesamt Männer Damen Gesamt Unsere Hypothesen: H 0 : Cholesterinniveau und Geschlecht sind unabhängig. H 1 : Cholesterinniveau und Geschlecht hängen zusammen. Kontingenztabellen in R hat man durch das folgende Menü Statistics/Contingency tables/enter and analyze two-way table Man tippe die Daten in Kontingenztabelle von R ein. Erst werden die Anzahl von Zeilen und Spalten bestimmt: Nachher tippt man die Daten ein: Verschiedene Prozentverhältnisse kann man abfragen: L. Börzsönyi 1
2 Die letzte Einstellung ist fassungslos. An Hand dieser großen Stichprobe will man ein Chi-Quadrat-Test anwenden, aber man kann den Fisher-Test auch abfragen. >.Table <- matrix(c(397,7135,242,7713), 2, 2, byrow=true) > rownames(.table) <- c('männer', 'Damen') > colnames(.table) <- c('erhöht', 'Normal') >.Table # Counts Erhöht Normal Männer Damen > totpercents(.table) # Percentage of Total Erhöht Normal Total Männer Damen Total >.Test <- chisq.test(.table, correct=false) >.Test Pearson's Chi-squared test X-squared = , df = 1, p-value = 3.17e-12 >.Test$expected # Expected Counts Erhöht Normal Männer Damen > remove(.test) > fisher.test(.table) p-value = 2.806e-12 alternative hypothesis: true odds ratio is not equal to odds ratio L. Börzsönyi 2
3 Der Test wird erst die Zeilen- und Spaltensummen (marginale Häufigkeiten) berechnet. In unserem Falle wird es berechnet, ob wie viele Damen und Männer erhöhtes und kein erhöhtes Cholesterinniveau hatten. Wenn der H 0 Hypothese richtig wäre, dann das Verhältnis des erhöhten Cholesterinniveaus bei Damen und Männer gleich wäre. Von den marginalen Häufigkeiten berechnet der Computer die erwarteten Häufigkeiten, d.h. was wäre die Häufigkeitsverteilung im Falle der Unabhängigkeit. Chi-Quadrat-Test zeigt darauf hin, dass zwischen Cholesterinniveau und Geschlecht ein Zusammenhang besteht, weil p=3.17e-12 < 0.05 ist. Der Fisher-Test zeigt das selbe Ergebnis bei den p-wert p=2.806e-12. Es ist zu vermuten, dass das erhöhte Cholesterinniveau kommt bei Männer wesentlich mehr vor. Bei Männern kommt das erhöhte Cholesterinniveau mit 2.6% und bei Damen 1.6% vor. Trotz der kleinen Prozentzahlen kann es für den Männer doch signifikant sein. Mit Hilfe der Fisher-Test kann man auch einseitig testen. Prüfe man nach: Die Hypothesen: H0: Das erhöhte Cholesterinniveau ist bei Männer und Damen selbe. H1: Das erhöhte Cholesterinniveau ist bei Männer größer, als bei Damen Cholesterinniveau=matrix(c(397,7135,242,7713), 2, 2, byrow=true) fisher.test(cholesterinniveau, alternative="greater") Das Ergebnis: > Cholesterinniveau=matrix(c(397,7135,242,7713), 2, 2, byrow=true) > fisher.test(cholesterinniveau, alternative="greater") data: Cholesterinniveau p-value = 1.784e-12 alternative hypothesis: true odds ratio is greater than Inf odds ratio Der einseitige Fisher-Test zeigt, dass das erhöhte Cholesterinniveau bei Männern signifikant stärker vorkommt, nämlich unserer p-wert ist p=1.784e-12. Der Fisher-Test rechnet die Odds auch aus: Odds bei Männer: 397/7135= Odds bei Damen: 242/7713= Der Quotient ist , bekommt man auch Konfidenzgrenzen. Man lese die Daten Falter ein. Kontingenztafel mit bekannten Daten: Frage 2: Ist die Hypothese zu halten, ob die Nahrung (NAHRUNG) und Temperatur (TEMP) unabhängig sind? Man wähle das folgende Menü: L. Börzsönyi 3
4 Statistik/Contingency tables/two-way table und wähle man die Zeilen- und Spaltenvariable aus: TEMP NAHRUNG erwaermt gekuelht zimmert adlibitum limitalt > totpercents(.table) # Percentage of Total erwaermt gekuelht zimmert Total adlibitum limitalt Total >.Test <- chisq.test(.table, correct=false) >.Test Pearson's Chi-squared test X-squared = , df = 2, p-value = >.Test$expected # Expected Counts TEMP NAHRUNG erwaermt gekuelht zimmert adlibitum limitalt > remove(.test) > fisher.test(.table) p-value = 1 alternative hypothesis: two.sided Die erwarteten Häufigkeiten sind größer, als 5, so gelten die Voraussetzungen der Anwendung der Chi-Quadrat-Test. Der Test zeit eine Unabhängigkeit zwischen Nahrung und Temperatur, weil der p-wert ist p= Der Fisher-Test ergibt das selbe Ergebnis. Verteilungstest oder Anpassungstest (mit chisq.test(.) nicht vom Menü) Frage 3: Sind die deutschen bzw. vereinigten Studenten nach Augenfarbe an Hand der registrierten Daten gleichverteilt? Die beobachteten Häufigkeiten sind folgendes: Deutschen Vereinigten Augenfarbe BL BR G BL BR G Häufigkeit Rel. Hkeit 37% 45% 18% 27% 51% 22% L. Börzsönyi 4
5 Die Ergebnisse sind folgendes: a) Bei Deutschen > chisq.test(x=c(14,17,7), p=c(0.34,0.33,0.33)) data: c(14, 17, 7) X-squared = 4.124, df = 2, p-value = b) Bei Vereinigten > chisq.test(x=c(28,54,23), p=c(0.33,0.34,0.33)) data: c(28, 54, 23) X-squared = , df = 2, p-value = Die Wkeiten müssen 1 sein, darum haben wir p=c(0.34, 0.33, 0.33) so gewählt. H 0 : Die Häufigkeiten nach Augenfarbe sind gleichverteilt. H 1 : Die Häufigkeiten nach Augenfarbe sind nicht gleichverteilt. Bei Deutschen (p=0.1272) hat man eine Gleichverteilung und bei der Vereinigten Gruppe (p=0.0006) keine. c) Bei der Vereinigten lässt sich eine weitere Verteilung z.b. p=c(0.25, 0.50, 0.25) nachzuprüfen. > chisq.test(x=c(28,54,23), p=c(0.25,0.50,0.25)) data: c(28, 54, 23) X-squared = , df = 2, p-value = Diese Verteilung ist schon anzugeben, weil unsere p-wert p= ist Einstichproben Test auf Wkeit oder Anteil (mit chisq.test(.) nicht vom Menü) Man lese die Daten dung von der Datei d+ung-2013 Daten ein und bestimme die Anzahl von männlichen und weiblichen in der Gruppe dung und dung_d. Frage 4: Sind die Männliche- und Weibliche-Anteil 25% : 75% bei den deutschen bzw. vereinigten Studenten an Hand der reg. Daten? a) Bei Deutschen (M:W-13:26) > chisq.test(x=c(13,26), p=c(0.25,0.75)) data: c(13, 26) X-squared = , df = 1, p-value = b) Bei Vereinigten (M:W-33:73) > chisq.test(x=c(33,73), p=c(0.25,0.75)) L. Börzsönyi 5
6 data: c(33, 73) X-squared = , df = 1, p-value = In beiden Fällen entsprechen die M-W Anteil 25%-75% Bei den zwei letzten Beispielen kann man exakten Binomialtest auch anwenden: Man lese die Daten dung von der Datei d+ung-2013 Daten ein und trenne für deutsche und ungarische Gruppe. Man brauche das folgende Menü: Statistics/Proportions/Single-sample proportion test a) Bei Deutschen > binom.test(rbind(.table), alternative='two.sided', p=.25, conf.level=.95) Exact binomial test data: rbind(.table) number of successes = 13, number of trials = 39, p-value = alternative hypothesis: true probability of success is not equal to probability of success b) Bei Vereinigten > binom.test(rbind(.table), alternative='two.sided', p=.25, conf.level=.95) Exact binomial test data: rbind(.table) number of successes = 33, number of trials = 106, p-value = alternative hypothesis: true probability of success is not equal to probability of success Wegen den erhaltenen p-werte bei a) und auch b) behalten wir die H0 Hypothese und halten wir die M-W Anteil 25%-75% für richtig. Die Wkeit der Erfolg sind bei a) 13/39 und bei b) 33/106, wofür eine 95% Konfidenzintervall auch angegeben wurde. Frage 5: Nehmen wir an, 27% der Erwachsenen sind Raucher. Ist dieser Anteil kleiner bei den deutschen bzw. ungarischen Studenten an Hand der registrierten Daten? Erst muss man die Variable rauchen umcodieren: Date/Manage variables in active data set/recode variables 0= nein 1:19= ja Neue Variable: zigarette Die Ergebnisse sind folgendes: L. Börzsönyi 6
7 a) Bei Deutschen zigarette ja nein 6 32 > binom.test(rbind(.table), alternative='less', p=.27, conf.level=.95) Exact binomial test data: rbind(.table) number of successes = 6, number of trials = 38, p-value = alternative hypothesis: true probability of success is less than probability of success b) Bei Ungarischen zigarette ja nein 9 58 > binom.test(rbind(.table), alternative='less', p=.27, conf.level=.95) Exact binomial test data: rbind(.table) number of successes = 9, number of trials = 67, p-value = alternative hypothesis: true probability of success is less than probability of success Bei deutschen Studenten ist es zu glauben, dass 27% raucher sind, bei den ungarischen Studenten gibt es signifikant weniger, als 27% raucher an Hand der registrierten Daten bei 5% Irrtumswkeit. Die übliche eine 95% Konfidenzintervall hat man hier auch. Zusammenhang zwischen zwei qualitativen Variablen Frage 6: Es ist zu überprüfen, dass Schweregrad und Geschlecht unabhängig sind oder weisen sie auf einen Zusammenhang hin. Kein Leicht Mäßig Schwer Gesamt Weiblich Männlich Gesamt Wir haben eine zweidimensionale Häufigkeitstabelle oder eine Kontingenztabelle. Die findet man in folgendem Menü: L. Börzsönyi 7
8 Statistics/Contingency tables/enter and analyze two-way table Trage man erst die Daten ein und lasse das R-Programm laufen. >.Table <- matrix(c(41,31,27,2,15,48,44,12), 2, 4, byrow=true) > rownames(.table) <- c('weiblich', 'Männlich') > colnames(.table) <- c('kein', 'Leicht', 'Mäßig', 'Schwer') >.Table # Counts Kein Leicht Mäßig Schwer Weiblich Männlich > totpercents(.table) # Percentage of Total Kein Leicht Mäßig Schwer Total Weiblich Männlich Total >.Test <- chisq.test(.table, correct=false) >.Test Pearson's Chi-squared test X-squared = , df = 3, p-value = 1.133e-05 >.Test$expected # Expected Counts Kein Leicht Mäßig Schwer Weiblich Männlich > remove(.test) > fisher.test(.table) p-value = 7.612e-06 alternative hypothesis: two.sided Unsere Hypothesen waren: H 0 : Schweregrad und Geschlecht sind unabhängig H 1 : Schweregrad und Geschlecht hängen zusammen Weil der p-wert (p-value = 1.133e-05) d.h. p= <0.05 ist, wird die H 0 abgelehnt und kann man behaupten, zwischen Schweregrad und Geschlecht besteht ein signifikanter Zusammenhang bei 5% Irrtumswkeit. Der Fisher Test gibt den selben Resultat. Ein Homogenitätstest führt man genau so durch, bloß die Fragestellung formuliert man folgendermaßen: L. Börzsönyi 8
9 Sind die Verteilungen nach Schwergrad in den zwei Geschlecht-gruppen unterschiedlich? Sind die Verteilungen nach Geschlecht in den vier Schwergrad-gruppen unterschiedlich? Die Antwort wäre, die Verteilungen sind unterschiedlich, die sind nicht homogen. Einseitiges testen durch Fisher-Test (nicht vom Menü) Mit Fisher-Test lässt sich bei einer Vierfeldertafel auch einseitig testen (für größere Tabellen gilt es nicht mehr!) Betrachte man die Umformung der vorigen Tabelle für 2x2 Tabelle: Symptom Schwer Nicht schwer Gesamt Frauen Männer Gesamt Frage 7: Kommt das Symptom Schwer bei Frauen weniger, als beim Männer vor? Unsere Hypothesen: H 0 : Das Symptom Schwer kommt gleich oft bei Frauen und Männer vor Tippe man die folgenden Befehle ein: H 1 : Das Symptom Schwer kommt bei Frauen weniger vor. symptom=matrix(c(2,99,12,107), 2, 2, byrow=true) fisher.test(symptom, alternative="less") oder symptom=matrix(c(2,99,12,107), nrow=2, byrow=true) fisher.test(symptom, alternative="less") Der Fisher-Test führt zu dem folgenden Ergebnis: data: symptom p-value = alternative hypothesis: true odds ratio is less than odds ratio Weil p= <0.05 ist, so wird die H 0 Hypothese abgelehnt, d.h. bei Frauen. kommt das Symptom schwer signifikant seltener vor. L. Börzsönyi 9
6. Übung (Hypothesenprüfung und einfache Tests)
6. Übung (Hypothesenprüfung und einfache Tests) Es wird eine H0 Hypothese und eine Gegen- oder Arbeitshypothese aufgestellt. Sie schließen sich aus. Es wird von den betreffenden Populationen eine repräsentative
MehrStatistik für Ingenieure Vorlesung 13
Statistik für Ingenieure Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6. Februar 2018 5.1.4. Weitere ausgewählte statistische Tests a) Binomialtest Der Binomialtest
Mehr14.3 Das Einstichprobenproblem in R
14.3. DAS EINSTICHPROBENPROBLEM IN R 343 0.553 0.570 0.576 0.601 0.606 0.606 0.609 0.611 0.615 0.628 0.654 0.662 0.668 0.670 0.672 0.690 0.693 0.749 0.844 0.933 die absoluten Häufikeiten n i der Klassen.
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen ob die in diesem Datensatz untersuchte
MehrGesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)
AUFGABEN 1. In einer Studie wurde ein Blutparameter am Beginn und am Ende einer Therapie bestimmt. Es ergab sich, dass bei 35 Probanden eine Veränderung des Parameters eintrat, und zwar lag der Wert bei
Mehr> read.table("d:\\reifen.txt",header=t) > Reifen
1. Aufgabe: Auf einer Reifenrollentestanlage werden Versuche durchgeführt um die Langlaufeigenschaften zu untersuchen. Insbesondere wird die Untersuchung des Abriebs über simulierte Anfahr- Brems- und
MehrGesamtcholesterin Region A Region B <170 (optimal) 80 >=170 (Risiko)
GRUNDAUFGABEN ZU DEN 1-STICHPROBENVERGLEICHEN 1. In einer Studie wurde ein Blutparameter am Beginn und am Ende einer Therapie bestimmt. Es ergab sich, dass bei 35 Probanden eine Veränderung des Parameters
MehrProportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen
Proportions-Tests Proportions Tests Proportions Test können in zwei Fällen benutzt werden Vergleich von beobachteten vs. erwarteten Proportionen Test der Unabhängigkeit von 2 Faktoren kann auch zum Vergleich
MehrMusterlösung zu Serie 8
Prof. Dr. W. Stahel, Dr. J. Ernest Regression HS 2017 Musterlösung zu Serie 8 1. Im Data Frame http://stat.ethz.ch/teaching/datasets/wbl/umwelt.dat sind die Ergebnisse einer Umfrage zum Umweltschutz gegeben.
Mehr9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrBiostatistik, Sommer Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test. Prof. Dr. Achim Klenke.
1/52 Biostatistik, Sommer 2017 Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 14.07.2017 Entwurf 2/52 Inhalt 1 Nichtparametrische
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
Mehr# Befehl für den Lilliefors-Test
1/5 Matthias Rudolf & Diana Vogel R-Kurs Graduiertenakademie September 2017 Loesungsskript: Tests 1a library(nortest) 1b lillie.test Befehl für den Lilliefors-Test 2a, Datensatz "Schachbeispiel einlesen"
MehrUnterschiedshypothesen bei nominalskalierten Messwerten
Arbeitsblatt 1 STATA Kapitel 7 Seite 1 Unterschiedshypothesen bei nominalskalierten Messwerten Im Folgenden gehen wir davon aus, dass Sie die Datei elporiginal.dta geöffnet, eine log-datei mit dem Namen
MehrPROC FREQ für Kontingenztafeln
zum Überprüfen von Zusammenhängen zweier qualitativer Merkmale Allgemeine Form: PROC FREQ DATA=name Optionen ; TABLES (variablenliste) * (variablenliste) / Optionen ; Beispiel und Beschreibung der Programm-Statements:
MehrGrundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).
Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrBiostatistik. Lösung
Prof. Dr. Achim Klenke Fridolin Kielisch 13. Übung zur Vorlesung Biostatistik im Sommersemester 2015 Lösung Aufgabe 1: a) Ich führe einen zweiseitigen Welch-Test durch, weil ich annehme, dass die Daten
Mehr= 0.445, also annähernd die Hälfte aller Männer zugelassen 557
1 Einleitung Es soll anhand des UCBAdmissions Datensatzes die Frage beantwortet werden, ob bei der Zulassung von Studenten Frauen benachteiligt werden. Die Stichprobe lautet zunächst # Daten (UCB
MehrStatistik für Ingenieure Vorlesung 12
Statistik für Ingenieure Vorlesung 12 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 23. Januar 2017 5.1.1. Tests für eine Stichprobe mit stetiger Skala a) Shapiro-Wilk-Test
MehrBiometrieübung 11 Kontingenztafeln
Biometrieübung 11 (Kontingenztafeln) - Aufgabe Biometrieübung 11 Kontingenztafeln Aufgabe 1 2x2-Kontingenztafeln 100 weibliche Patienten sind mit einer konventionellen Therapie behandelt worden 85 Patientinnen
MehrTutorial:Unabhängigkeitstest
Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung
MehrStatistik-Quiz Wintersemester
Statistik-Quiz Wintersemester Seite 1 von 8 Statistik-Quiz Wintersemester Die richtigen Lösungen sind mit gekennzeichnet. 1a Für 531 Personen liegen Daten zu folgenden Merkmalen vor. Welche der genannten
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrEin kategoriales Merkmal
Kapitel 2 Ein kategoriales Merkmal 2.1 Wie kann man ein kategoriales Merkmal in R darstellen? Oft findet man kategoriale Merkmale dargestellt durch numerische Codes, beispielsweise: R> GENDER
MehrStochastik Praktikum Testtheorie
Stochastik Praktikum Testtheorie Thorsten Dickhaus Humboldt-Universität zu Berlin 11.10.2010 Definition X: Zufallsgröße mit Werten in Ω, (Ω, F, (P ϑ ) ϑ Θ ) statistisches Modell Problem: Teste H 0 : ϑ
MehrDer χ2-test Der χ2-test
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrProportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen
Proportions-Tests Proportions Tests Proportions Test können in zwei Fällen benutzt werden Vergleich von beobachteten vs. erwarteten Proportionen Test der Unabhängigkeit von 2 Faktoren kann auch zum Vergleich
MehrChi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge
Chi² Test und Kontingenzoeffizient Für nominalsalierte Daten: - diese haben unterschiedliche Ausprägung, - aber eine natürliche Reihenfolge 1. Chi² Test Test nominalsalierter Daten Vergleich von beobachteten
MehrDer χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)
Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln
MehrEnglisch Französisch 13 7
Der Binomialtest Beispiel 1 (fiktiv Aline möchte in ihrer Maturaarbeit herausfinden, ob die Schülerinnen an ihrer Schule lieber Englisch oder lieber Französisch lernen. Dazu wählt sie zufällig 20 Schülerinnen
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrHypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1
Hypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1 Inhalt Programmiersprache R Syntax Umgang mit Dateien Tests t Test F Test Wilcoxon Test 2 Test Zusammenfassung 2 Programmiersprache R Programmiersprache
MehrMehrere kategoriale Merkmale
Kapitel 3 Mehrere kategoriale Merkmale 3.1 Wie kann man zwei kategoriale Merkmale numerisch beschreiben? Kontingenztafeln (Kreuztabellen) erzeugt man wiederum mit table: R> CMMRCIAL
MehrErgebnisse VitA und VitVM
Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg
für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2016 Prof. Dr. Stefan Etschberger Hochschule Augsburg Einstichproben-t-Test und approximativer Gaußtest
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Mehr3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrAnalyse 1 Tierkreiszeichen (korrigiert für Bounces).docx Seite 1 von 7. Tierkreiszeichen * Crosstabulation
2012 03 31 Analyse 1 Tierkreiszeichen (korrigiert für Bounces).docx Seite 1 von 7 Count Tierkreiszeichen * Crosstabulation Total nicht Tierkreiszeichen 22.12.-20.01. Steinbock 36278 22383 58661 21.01.-19.02.
MehrStatistisches Testen
Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.
MehrErwin Grüner
FB Psychologie Uni Marburg 19.01.2006 Themenübersicht Die Verteilung zwei- oder mehrdimensionaler kategorialer Daten wird mit Hilfe von beschrieben. In R gibt es dafür den Objekttyp table. Zur Erstellung
MehrVet. Med. Uni. Budapest 4. Übung Biomathematik 2017
4. Übung (Wahrscheinlichkeitsverteilungen) Man wird erst Fragestellung(en) formuliert und dann mit Hilfe des R-Programms gibt man eine Antwort auf die formulierte Frage(n). Verteilung einer Zufallsvariable
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrFragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)
Hypothesen Tests Fragestellungen stab.glu 82 97 92 93 90 94 92 75 87 89 hdl 56 24 37 12 28 69 41 44 49 40 ratio 3.60 6.90 6.20 6.50 8.90 3.60 4.80 5.20 3.60 6.60 glyhb 4.31 4.44 4.64 4.63 7.72 4.81 4.84
MehrÜbung zur Vorlesung Statistik I WS Übungsblatt 9
Übung zur Vorlesung Statistik I WS 2012-2013 Übungsblatt 9 17. Dezember 2012 Aufgabe 26 (4 Punkte): In einer Studie mit n = 10 Patienten soll die Wirksamkeit eines Medikaments gegen Bluthochdruck geprüft
MehrStatistik mit R, Sitzung am
Statistik mit R, Sitzung am 19.06.07 Mike Kühne 1 R-Kurs INHALTSVERZEICHNIS Inhaltsverzeichnis 1 Bivariate Statistik 3 1.1 Tabellen.............................. 3 1.2 Zusammenhangsmaße für nominal skalierte
MehrStatistik Einführung // Kategoriale Daten 10 p.2/26
Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten
MehrGüteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Güteanalyse Prof. Walter F. Tichy Fakultät für Informatik 1 Fakultät für Informatik 2 Nochmal zur Erinnerung: Hypothesentest Am Beispiel
MehrTutorial: Anpassungstest
Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrTeil X. Hypothesentests für eine Stichprobe. Woche 8: Hypothesentests für eine Stichprobe. Lernziele. Statistische Hypothesentests
Woche 8: Hypothesentests für eine Stichprobe Teil X Patric Müller Hypothesentests für eine Stichprobe ETHZ WBL 17/19, 19.06.2017 Wahrscheinlichkeit und Statistik Patric
MehrW-Rechnung und Statistik für Ingenieure Übung 13
W-Rechnung und Statistik für Ingenieure Übung 13 Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen. Aufgabe 1 : Testproblem Testproblem:
MehrTeil VII Hypothesentests für eine Stichprobe
Woche 7: Hypothesentests für eine Stichprobe Teil VII Hypothesentests für eine Stichprobe WBL 15/17, 15.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner Fachhochschule
Mehr1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0
1.4 Der Binomialtest Mit dem Binomialtest kann eine Hypothese bezüglich der Wahrscheinlichkeit für das Auftreten einer Kategorie einer dichotomen (es kommen nur zwei Ausprägungen vor, z.b. 0 und 1) Zufallsvariablen
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Mehr1 kategoriales Merkmal. 2 kategoriale Merkmale. Kategoriale Merkmale in R. Methoden empirischer Sozialforschung. Numerische und grafische Beschreibung
1 kategoriales Merkmal Numerische und grafische Beschreibung Methoden empirischer Sozialforschung Kategoriale Merkmale Kommen alle Kategorien gleich häufig vor? χ 2 -Test auf Gleichverteilung Entsprechen
Mehr1. Nennen Sie den für das Merkmal X geeigneten Skalentyp und begründen Sie Ihre Antwort.
Aufgabe 1 150 Personen gaben bei einer Befragung an, wie viel Geld sie in diesem Jahr für Weihnachtsgeschenke ausgegeben haben. Die Ergebnisse der Befragung sind in nachfolgender Tabelle zusammengefasst,
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 X 2 -Anpassungstest für eine vorgegebene Verteilung 1
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrFH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)
FH- Management & IT Folie 1 Rückblick Häufigkeiten berechnen Mittelwerte berechnen Grafiken ausgeben Grafiken anpassen und als Vorlage abspeichern Variablenoperationen Fälle vergleichen Fälle auswählen
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrAnalyse kategorieller Daten
Analyse kategorieller Daten x Tafel: In der Medizin ist der Vergleich zweier relativer Häufigkeiten wichtig. Es ist neue Operationstechnik entwickelt worden: Bei der Standardoperationsmethode stellte sich
MehrEine Einführung in R: Statistische Tests
I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Eine Einführung in R: Statistische Tests
MehrVl Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen. Absolute Häufigkeitstabelle
Vl. 5.12.11 3. Zweidimensionale Verteilungen Zusammenhangsmaße 3.1. Zwei dimensionale Häufigkeitstabellen schnell mittel langsam 3 Arten von Häufigkeitstabellen: Absolute Häufigkeitstabelle relative Häufigkeitstabelle
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 9. Dezember 2009 Bernd Klaus, Verena Zuber
MehrEin metrisches Merkmal
Kapitel 4 Ein metrisches Merkmal 4.1 Wie kann man ein metrisches Merkmal numerisch beschreiben? Häufigkeitstabellen erzeugt man mit table. Das arithmetische Mittel und den Median berechnet man mit mean
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
Mehrt-tests Lösung: b) und c)
t-tests 2015 Assessmentmodul 1 - Frage B10: Ein Team von Gesundheitspsychologinnen hat ein Programm entwickelt, das die Studierenden der Universität Zürich dazu anregen soll, mehr Sport zu treiben. In
MehrPhilipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler
Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung
MehrAnpassungstests VORGEHENSWEISE
Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel
MehrQuantitative Auswertung II. Korpuslinguistik Heike Zinsmeister
Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrHypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.
Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die
MehrAnalytische Statistik II. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Analytische Statistik II Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten
MehrANGEWANDTE STATISTIK II Prüfungstermin Name:
Die Beantwortung der Rechenaufgaben hat zusätzlich zu den numerischen Ergebnissen zu beinhalten: - Feststellung des Problemtyps, Angabe der Lösungsmethode; - bei den Testverfahren: Hypothesen, P-Wert,
MehrStatistik II für Betriebswirte Vorlesung 3
Statistik II für Betriebswirte Vorlesung 3 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 30. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version:
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
Mehr3.4 Bivariate Datenanalyse in R
90 KAPITEL 3. BIVARIATE ANALYSE 3.4 Bivariate Datenanalyse in R Beginnen wir mit dem Zusammenhang zwischen einem qualitativem und einem quantitativem Merkmal. Wir wollen das Alter der weiblichem Teilnehmer
MehrAnalytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Varianzanpassungstest Untersuchung der Streuung einer bzw.
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrAngewandte Statistik mit R. Eine Einführung für Ökonomen und
Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 3. Auflage Springer Gabler Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur ersten Auflage Vorwort
MehrBiostatistik, Sommer 2017
1/57 Biostatistik, Sommer 2017 : Gepaarter, Ungepaarter t-test, Welch Test Prof. Dr. Achim Klenke http://www.aklenke.de 12. Vorlesung: 07.07.2017 2/57 Inhalt 1 Gepaarter t-test Ungepaarter t-test Ungepaarter
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler & Martin Hutzenthaler http://evol.bio.lmu.de/_statgen 25. Mai 2010 1 X 2 -Anpassungstest
Mehr