Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
|
|
- Leopold Waldfogel
- vor 7 Jahren
- Abrufe
Transkript
1 Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler & Martin Hutzenthaler 5. Mai 00 Inhaltsverzeichnis X -Anpassungstest für eine vorgegebene Verteilung X -Test auf Homogenität bzw. Unabhängigkeit 4 3 Fisher s exakter Test 6 4 X -Test für Modelle mit angepassten Parametern 8 X -Anpassungstest für eine vorgegebene Verteilung Mendels Erbsenexperiment grün (rezessiv) vs. gelb (dominant) rund (dominant) vs. runzlig (rezessiv) Erwartete Häufigkeiten beim Kreuzen von Doppelhybriden: grün runzlig 6 rund 3 6 gelb Im Experiment beobachtet (n = 556): grün gelb runzlig 3 0 rund Passen die Beobachtungen zu den Erwartungen? Relative Häufigkeiten: grün/runz. gelb./runz. grün/rund gelb./rund erwartet beobachtet
2 Können diese Abweichungen plausibel mit Zufallsschwankungen erklärt werden? Wir messen die Abweichungen durch die X -Statistic: X = i (O i E i ) E i wobei E i = erwartet Anzahl in Klasse i und O i = beobachtete (engl. observed) Anzahl in Klasse i. Wieso teilen wir dabei (O i E i ) durch E i = EO i? Sei n die Gesamtzahl und p i die Wahrscheinlichkeit (unter der Nullhypothese) jeder Beobachtung, zu O i beizutragen. Also Unter der Nullhypothese ist O i binomialverteilt: ( ) n Pr(O i = k) = p k i ( p i ) n k. k Wenn p klein ist, gilt n p ( p) n p und Anders ausgedrückt: E(O i E i ) = Var(O i ) = n p ( p). E (O i E i ) E i = Var(O i) EO i = p. die Binomialverteilung mit kleinem p und großem n kann durch die Poissonverteilung mit Parameter λ = n p approximiert werden: ( ) n p k ( p) n k λk k k! e λ mit λ = n p. Eine Zufallsvariable Y, die Werte in 0,,,... annehmen kann, ist poissonverteilt mit Parameter λ, wenn Pr(Y = k) = λk k! e λ. Es gilt dann EY = Var(Y ) = λ. gr/runz ge/runz gr/rund ge/rund sum theorie erw. (E) beob. (O) O E (O E) (O E) E X = 0.47 Ist ein Wert von X = 0.47 ungewöhnlich? Die Verteilung von X hängt ab von der Anzahl der Freiheitsgrade df (eng. degrees of freedom), d.h. die Anzahl der Dimensionen in denen man von der Erwartung abweichen kann.
3 In diesem Fall: Die Summe der Beobachtungen muss die Gesamtzahl n = 556 ergeben. wenn die ersten Zahlen 3, 0, 08 gegeben sind, ist die letzte bestimmt durch 35 = df = 3 Merkregel. Allgemein gilt beim Chi-Quadrat-Anpassungtest mit k Klassen df = k. densitiy of chi square distribution with df=3 densitiy of chi square distribution with df=3 dchisq(x, df = 3) dchisq(x, df = 3) x > pchisq(0.47,df=3)[0.ex] [] [0.ex] > pchisq(0.47,df=3,lower.tail=false)[0.ex] [] p-wert!!! > prob <- c(0.065,0.875,0.875,0.565) > obs <- c(3,0,08,35) > (n <- sum(obs)) [] 556 > (erw <- prob*n) [] > erw-obs [] > (erw-obs)^ [] > (erw-obs)^/erw [] > sum((erw-obs)^/erw) [] > pchisq( ,df=3,lower.tail=false) [] x > obs <- c(3,0,08,35) > prob <- c(0.065,0.875,0.875,0.565) > chisq.test(obs,p=prob) Chi-squared test for given probabilities data: obs X-squared = 0.47, df = 3, p-value =
4 X -Test auf Homogenita t bzw. Unabha ngigkeit Der Kuhsta rling ist ein Brutparasit des Oropendola. photo (c) by J. Oldenettel Literatur [Smi68] N.G. Smith (968) The advantage of being parasitized. Nature, 9(555):690-4 Kuhsta rling-eier sehen Oropendola-Eiern sehr a hnlich. Normalerweise entfernen Oropendolas alles aus ihrem Nest, was nicht genau nach ihren Eiern aussieht. In einigen Gegenden sind Kuhsta rling-eier gut von Oropendola-Eiern zu unterscheiden und werden trotzdem nicht aus den Nestern entfernt. Wieso? Mo gliche Erkla rung: Dasselfliegenlarven to ten ha ufig junge Oropendolas. Nester mit Kuhsta rling-eier sind mo glicherweise besser vor Dasselfliegenlarven geschu tzt. Anzahlen von Nestern, die von Dasselfliegenlarven befallen sind In Prozent: Anzahl Kuhsta rling-eier befallen nicht befallen 0 89% % 5% 85% Anzahl Kuhsta rling-eier befallen nicht befallen % 94% Anscheinend ist der Befall mit Dasselfliegenlarven reduziert, wenn die Nester Kuhsta rlingeier enthalten. statistisch signifikant? Nullhypothese: Die Wahrscheinlichkeit eines Nests, mit Dasselfliegenlarven befallen zu sein ha ngt nicht davon ab, ob oder wieviele Kuhsta rlingeier in dem Nest liegen. P Anzahl Kuhsta rling-eier 0 befallen 6 99 Anzahlen der von Dasselfliegenlarven befallenen Nester nicht P befallen
5 Welche Anzahlen würden wir unter der Nullhypothese erwarten? Das selbe Verhältnis 9/48 in jeder Gruppe. Erwartete Anzahlen von Dasselfliegenlarven befallener Nester, bedingt auf die Zeilen- und Spaltensummen: Anzahl Kuhstärling-Eier 0 befallen nicht befallen = = 5. Alle anderen Werte sind nun festgelegt durch die Summen. beobachtet (O, observed): befallen 6 9 nicht befallen erwartet: (E): O-E: X = i (O i E i ) E i = befallen nicht befallen befallen nicht befallen Wenn die Zeilen- und Spaltensummen gegeben sind, bestimmen bereits Werte in der Tabelle alle anderen Werte df= für Kontingenztafeln mit zwei Zeilen und drei Spalten. Allgemein gilt für n Zeilen und m Spalten: df = (n ) (m ) densitiy of chi square distribution with df= dchisq(x, df = ) x 5
6 > M <- matrix(c(6,,,,,6),nrow=) > M [,] [,] [,3] [,] 6 [,] 6 > chisq.test(m) Pearson s Chi-squared test data: M X-squared = , df =, p-value = 3.83e-07 Der p-wert basiert wieder auf einer Approximation durch die χ -Verteilung. Faustregel: Die χ -Approximation ist akzeptabel, wenn alle Erwartungswerte E i 5 erfüllen. Alternative: approximiere p-werte durch Simulation: > chisq.test(m,simulate.p.value=true,b=50000) Pearson s Chi-squared test with simulated p-value (based on replicates) data: M X-squared = , df = NA, p-value = e-05 3 Fisher s exakter Test Literatur [McK9] J.H. McDonald, M. Kreitman (99) Adaptive protein evolution at the Adh locus in Drosophila. Nature 35: synonym verändernd polymorph 43 fixiert 7 7 > McK <- matrix(c(43,7,,7),, dimnames=list(c("polymorph","fixed"), c("synon","replace"))) > McK synon replace polymorph 43 fixed 7 7 > chisq.test(mck) Pearson s Chi-squared test with Yates continuity correction data: McK X-squared = , df =, p-value = Warning message: In chisq.test(mck) : Chi-Square-Approximation may be incorrect 6
7 Yates Stetigkeitskorrektur: Wegen der kleinen erwarteten Werte wird (O i E i 0.5) i E i > chisq.test(mck,simulate.p.value=true,b=00000) Pearson s Chi-squared test with simulated p-value (based on e+05 replicates) data: McK X-squared = , df = NA, p-value = Fishers exakter Test A B C D Nullhypothese: EA/EC EB/ED = verwendet. Für -Tabellen können die p-werte exakt berechnet werden. (keine Approximation, keine Simulation). > fisher.test(mck) Fisher s Exact Test for Count Data data: McK p-value = alternative hypothesis: true odds ratio is not equal to 95 percent confidence interval: sample estimates: odds ratio a b K c d M U V N Unter der Annahme, dass die Zeilen und Spalten unabhängig sind, ist die Wahrscheinlichkeit, dass links oben in der Tabelle der Wert a bzw. oben recht ein b = K a steht: ) )( M ) d ( K )( M a c Pr(a oben links) = ( N = Pr(b oben rechts) = ( N ) U) V ( K b 7
8 hypergeometrische Verteilung a b 45 c d b Pr(b) Einseitiger Fisher-Test: für b = : p-wert=pr(0) + Pr() + Pr() = für b = 3: p-wert=pr(0) + Pr() + Pr() + Pr(3) = Zweiseitiger Fisher-Test: Addiere alle Wahrscheinlichkeiten, die kleiner oder gleich Pr(b) sind. für b = : p-wert=pr(0) + Pr() + Pr() = für b = 3: p-wert= Pr(0) + Pr() + Pr() + Pr(3) + Pr(9) = X -Test für Modelle mit angepassten Parametern Gegeben sei eine Population im Hardy-Weinberg-Gleichgewicht und ein Gen-Locus mit zwei möglichen Allelen A und B mit Häufigkeiten p und p. Genotyp-Häufigkeiten AA AB BB p p ( p) ( p) Beispiel: M/N Blutgruppen; Stichprobe: Amerikaner europäischer Abstammung beobachtet: MN Geschätzte Allelhäufigkeit p von M: Erwartungswerte: MN p p ( p) ( p) = NM all possible observations (O,O MN,O ) are located on a triangle (simplex) between (,0,0) (0,,0) and (0,0,) NM The points representing the Expected Values (E,E MN,E ) depend on one parameter p between 0 and and thus form a curve in the simplex. 8
9 NM under the null hypothesis, one of these values must be the true one NM The observed (O,O NM,O ) will deviate from the expected. NM We do not know the true expectation values so we estimate (E,E MN,E ) by taking the closest point on the curve of possible values, i.e. we hit the curve in a right angle. Thus, deviations between our our observations (O,O,O ) and NM our (E,E NM,E ) can only be in one dimension: perpendicular to the curve. df = k m k = Anzahl Gruppen (k=3 Genotypen) m = Anzahl Modellparameter (m= Parameter p) im Blutgruppenbeispiel: df = 3 = > obs <- c(787,3037,305) > n <- sum(obs) > p <- (* )/(* ) > probs <- c(p^,*p*(-p),(-p)^) > erw <- probs*n > (X <- sum((obs-erw)^/erw)) [] > (p.value <- pchisq(x,df=,lower.tail=false)) []
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler & Martin Hutzenthaler http://evol.bio.lmu.de/_statgen 25. Mai 2010 1 X 2 -Anpassungstest
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler 22. Mai 2015 Inhaltsverzeichnis 1 X 2 -Anpassungstest für eine vorgegebene Verteilung 1
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler & Martin Hutzenthaler http://evol.bio.lmu.de/_statgen 8. Juni 2011 1 X 2 -Anpassungstest
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler 13. Mai 2016 Inhaltsverzeichnis 1 X 2 -Anpassungstest für eine vorgegebene Verteilung 1
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 6. Chi-Quadrat-Test und Fishers exakter Test Dirk Metzler und Noémie Becker 2. Juni 2017 Inhaltsverzeichnis 1 X 2 -Anpassungstest für eine vorgegebene
MehrBiostatistik, WS 2013/2014 Chi-Quadrat-Test
1/49 Biostatistik, WS 2013/2014 Chi-Quadrat-Test Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 10.1.2014 Wiederholung: Wilcoxons Rangsummentest Motivation 4/49 Bei (ungefähr)
MehrBiostatistik, WS 2010/2011 Rangsummen-Test, Chi-Quadrat-Test
Biostatistik, WS 2010/2011 Rangsummen-Test, Chi-Quadrat-Test Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1011/ 14.1.2011 Wilcoxons Rangsummentest Motivation Bei (ungefähr)
MehrBiostatistik, WS 2010/2011 Rangsummen-Test, Chi-Quadrat-Test
1/49 Biostatistik, WS 2010/2011 Rangsummen-Test, Chi-Quadrat-Test Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1011/ 14.1.2011 2/49 Inhalt Wilcoxons Rangsummentest 1 Wilcoxons
MehrBiostatistik, SS 2016. Kontingenztafeln und Chi-Quadrat-Test
1/54 Biostatistik, SS 2016 Rangsummen-Test, Kontingenztafeln und Chi-Quadrat-Test Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik16/ 17.6.2016 Wilcoxons Rangsummentest Motivation 4/54
MehrBiostatistik, Sommer Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test. Prof. Dr. Achim Klenke.
1/52 Biostatistik, Sommer 2017 Nichtparametrische Statistik: Mediantest, Rangsummentest, χ 2 -Test Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 14.07.2017 Entwurf 2/52 Inhalt 1 Nichtparametrische
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung
MehrProportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen
Proportions-Tests Proportions Tests Proportions Test können in zwei Fällen benutzt werden Vergleich von beobachteten vs. erwarteten Proportionen Test der Unabhängigkeit von 2 Faktoren kann auch zum Vergleich
Mehr14.3 Das Einstichprobenproblem in R
14.3. DAS EINSTICHPROBENPROBLEM IN R 343 0.553 0.570 0.576 0.601 0.606 0.606 0.609 0.611 0.615 0.628 0.654 0.662 0.668 0.670 0.672 0.690 0.693 0.749 0.844 0.933 die absoluten Häufikeiten n i der Klassen.
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
MehrMusterlösung zu Serie 8
Prof. Dr. W. Stahel, Dr. J. Ernest Regression HS 2017 Musterlösung zu Serie 8 1. Im Data Frame http://stat.ethz.ch/teaching/datasets/wbl/umwelt.dat sind die Ergebnisse einer Umfrage zum Umweltschutz gegeben.
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler 20. Mai 2010 Inhaltsverzeichnis
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrStatistik für Ingenieure Vorlesung 13
Statistik für Ingenieure Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6. Februar 2018 5.1.4. Weitere ausgewählte statistische Tests a) Binomialtest Der Binomialtest
MehrStatistics, Data Analysis, and Simulation SS 2015
Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html
MehrPROC FREQ für Kontingenztafeln
zum Überprüfen von Zusammenhängen zweier qualitativer Merkmale Allgemeine Form: PROC FREQ DATA=name Optionen ; TABLES (variablenliste) * (variablenliste) / Optionen ; Beispiel und Beschreibung der Programm-Statements:
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen ob die in diesem Datensatz untersuchte
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehr73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
MehrVergleich von Gruppen I
Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrStatistik für Ingenieure Vorlesung 12
Statistik für Ingenieure Vorlesung 12 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 23. Januar 2017 5.1.1. Tests für eine Stichprobe mit stetiger Skala a) Shapiro-Wilk-Test
MehrAnalyse 1 Tierkreiszeichen (korrigiert für Bounces).docx Seite 1 von 7. Tierkreiszeichen * Crosstabulation
2012 03 31 Analyse 1 Tierkreiszeichen (korrigiert für Bounces).docx Seite 1 von 7 Count Tierkreiszeichen * Crosstabulation Total nicht Tierkreiszeichen 22.12.-20.01. Steinbock 36278 22383 58661 21.01.-19.02.
MehrStatistik für Informatiker, SS Ideen aus der Statistik 2.4 Weitere Tests
1/88 Statistik für Informatiker, SS 2018 2. Ideen aus der Statistik 2.4 Weitere Tests Matthias Birkner http://www.staff.uni-mainz.de/birkner/statinfo18/ 2.7.2018 2/88 Inhalt 1 χ 2 -Tests χ 2 -Test für
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrKlausur Statistik Lösungshinweise
Klausur Statistik Lösungshinweise Prüfungsdatum: 21. Januar 2016 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Punkte: 15, 15, 12, 14, 16, 18 ; Summe der Punkte: 90 Aufgabe 1 15 Punkte Bei
MehrHypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1
Hypothesentests mit R Ashkan Taassob Andreas Reisch 21.04.09 1 Inhalt Programmiersprache R Syntax Umgang mit Dateien Tests t Test F Test Wilcoxon Test 2 Test Zusammenfassung 2 Programmiersprache R Programmiersprache
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrFragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)
Hypothesen Tests Fragestellungen stab.glu 82 97 92 93 90 94 92 75 87 89 hdl 56 24 37 12 28 69 41 44 49 40 ratio 3.60 6.90 6.20 6.50 8.90 3.60 4.80 5.20 3.60 6.60 glyhb 4.31 4.44 4.64 4.63 7.72 4.81 4.84
Mehr9. Übung (Analyse von qualitativen Daten)
9. Übung (Analyse von qualitativen Daten) (Prüfung von Unabhängigkeit, Homogenität und Anpassung) Man unterscheidet vor allem die folgenden Tests: Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrW-Rechnung und Statistik für Ingenieure Übung 13
W-Rechnung und Statistik für Ingenieure Übung 13 Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen. Aufgabe 1 : Testproblem Testproblem:
MehrVerallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen
Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit
MehrKategorielle Daten. Seminar für Statistik Markus Kalisch
Kategorielle Daten Markus Kalisch 1 Phase 3 Studie: Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Grundfrage: Sind Heilung und Medikamentengabe unabhängig?
MehrQuantitative Auswertung II. Korpuslinguistik Heike Zinsmeister
Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige
Mehr4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017
4. Lösung weitere Übungsaufgaben Statistik II WiSe 016/017 1. Aufgabe: Eine sächsische Molkerei füllt Milch in Tetrapacks ab. Es wird vermutet, dass die Füllmenge normalverteilt ist mit einem Erwartungswert
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrBemerkungen zu statistischen Tests
Bemerkungen zu statistischen Tests Einseitige vs. zweiseitige Tests Die Entscheidung für eine einseitige oder zweiseitige Alternative hängt von der Fragestellung ab. Eine einseitige Alternative ist dann
MehrStatistisches Testen
Statistisches Testen Universität Duisburg-Essen, Fak. 4, FG Instrumentelle Analytik 7. Juni 2007 Statistisches Testen Inhaltsverzeichnis Schätzverfahren und Testverfahren sind Anwendungen der Stichprobentheorie.
MehrStochastik Praktikum Testtheorie
Stochastik Praktikum Testtheorie Thorsten Dickhaus Humboldt-Universität zu Berlin 11.10.2010 Definition X: Zufallsgröße mit Werten in Ω, (Ω, F, (P ϑ ) ϑ Θ ) statistisches Modell Problem: Teste H 0 : ϑ
MehrBiostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test
1/22 Biostatistik, WS 2013/2014 Wilcoxons Rangsummen-Test Matthias Birkner http://www.mathematik.uni-mainz.de/~birkner/biostatistik1314/ 20.12.2013 Motivation 4/22 Bei (ungefähr) glockenförmigen und symmetrisch
MehrBiostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
Mehr9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 91 Einleitung Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 9 Kontingenztafeln Qualitative 2-Weg Daten Bsp: UCB Admissions Datensatz mit zwei kategorischen
MehrProportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen
Proportions-Tests Proportions Tests Proportions Test können in zwei Fällen benutzt werden Vergleich von beobachteten vs. erwarteten Proportionen Test der Unabhängigkeit von 2 Faktoren kann auch zum Vergleich
MehrAnalytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Analytische Statistik: Varianzanpassungstest, Varianzhomogenitätstest Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Varianzanpassungstest Untersuchung der Streuung einer bzw.
MehrGüteanalyse. Nochmal zur Erinnerung: Hypothesentest. Binominalverteilung für n=20 und p=0,5. Münzwurf-Beispiel genauer
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Güteanalyse Prof. Walter F. Tichy Fakultät für Informatik 1 Fakultät für Informatik 2 Nochmal zur Erinnerung: Hypothesentest Am Beispiel
Mehr1.4 Der Binomialtest. Die Hypothesen: H 0 : p p 0 gegen. gegen H 1 : p p 0. gegen H 1 : p > p 0
1.4 Der Binomialtest Mit dem Binomialtest kann eine Hypothese bezüglich der Wahrscheinlichkeit für das Auftreten einer Kategorie einer dichotomen (es kommen nur zwei Ausprägungen vor, z.b. 0 und 1) Zufallsvariablen
MehrTeil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie
Woche 9: Hypothesentests für zwei Stichproben Patric Müller Teil XI Hypothesentests für zwei Stichproben ETHZ WBL 17/19, 26.06.2017 Wahrscheinlichkeit und Statistik Patric
MehrTutorial: Vergleich von Anteilen
Tutorial: Vergleich von Anteilen Die Sicherung des Pensionssystems ist in vielen Ländern ein heikles Thema. Noch stärker als der Streit, wer wann welche Pension beziehen können soll, tobt ein Streit, welche
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test. und der Wilcoxon-Test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 5. Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) und der Wilcoxon-Test Dirk Metzler 24. Mai 2017 Inhaltsverzeichnis 1 Wiederholung:
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test Martin Hutzenthaler & Dirk Metzler Inhaltsverzeichnis 1 t-test für gepaarte Stichproben 1 1.1 Beispiel: Orientierung bei Trauerschnäppern..........................
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test Martin Hutzenthaler & Dirk Metzler 6./18. Mai 2010 Inhaltsverzeichnis 1 t-test für gepaarte Stichproben 1 1.1 Beispiel: Orientierung
MehrDipl.-Volksw. Markus Pullen Wintersemester 2012/13
Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel
MehrVergleich zweier Stichproben
zurück zum Inhaltsverzeichnis Die Werte sind verbunden, abhängig oder korreliert. Beispiel: Eine Probe wird mit zwei Messgeräten bestimmt. Es gibt eine paarweise Zuordnung. Die Werte sind unabhängig also
MehrAusgewählte spezielle Verteilungen
Ausgewählte spezielle Verteilungen In Anwendungen werden oft Zufallsvariablen betrachtet, deren Verteilung einem Standardmodell entspricht. Zu den wichtigsten dieser Modelle gehören: diskrete Verteilungen:
Mehr1.6 Der Vorzeichentest
.6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test Matthias Birkner & Dirk Metzler 12. Mai 2009 Inhaltsverzeichnis 1 t-test für gepaarte Stichproben 1 1.1 Beispiel: Orientierung bei Trauerschnäppern..........................
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Frequentistische und Bayessche Statistik
Wahrscheinlichkeitsrechnung und Statistik für Biologen Frequentistische und Bayessche Statistik Dirk Metzler & Martin Hutzenthaler http://evol.bio.lmu.de/_statgen 8. Juni 2009 1 Frequentistische Statistik
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws11/r-kurs/
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr
MehrFRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1
FRAGESTUNDE Dr. Christian Schwarz 1 #2 - Allgemein Q: Müssen wir den Standard Error händisch berechnen können? R: Nein. Q: Hat das Monte Carlo Experiment irgendeine Bedeutung für uns im Hinblick auf die
MehrPROC NPAR1WAY. zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale)
PROC NPAR1WAY zum Durchführen des U-Tests für zwei unverbundene Stichproben (für quantitative nicht-normalverteilte Merkmale) Allgemeine Form: PROC NPAR1WAY DATA=name Optionen ; VAR variablenliste ; CLASS
MehrDr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung
Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter 2014 Musterlösung 1. (11 Punkte) a) Für welchen Parameter ist X ein geeigneter Schätzer? X ist ein geeigneter Schätzer für den Erwartungswert µ
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrBiostatistik, WS 2017/18 Der zwei-stichproben-t-test
1/28 Biostatistik, WS 2017/18 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1718/ 15.12.2017 und 22.12.2017 2/28 Inhalt
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test
Wahrscheinlichkeitsrechnung und Statistik für Biologen 4. Der t-test Matthias Birkner & Dirk Metzler http://www.zi.biologie.uni-muenchen.de/evol/statgen.html 12. Mai 2009 1 t-test für gepaarte Stichproben
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg
für Betriebswirtschaft, Internationales Management, Wirtschaftsinformatik und Informatik Sommersemester 2016 Prof. Dr. Stefan Etschberger Hochschule Augsburg Einstichproben-t-Test und approximativer Gaußtest
MehrHypothesenbewertungen: Übersicht
Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung
Mehr> read.table("d:\\reifen.txt",header=t) > Reifen
1. Aufgabe: Auf einer Reifenrollentestanlage werden Versuche durchgeführt um die Langlaufeigenschaften zu untersuchen. Insbesondere wird die Untersuchung des Abriebs über simulierte Anfahr- Brems- und
MehrLean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrTeil VIII Hypothesentests für zwei Stichproben
Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner
MehrGrundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).
Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,
MehrUnterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13
Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression Robin Ristl Wintersemester 2012/13 1 Exakter Test nach Fisher Alternative zum Chi-Quadrat Unabhängigkeitstest
MehrVorname: Nachname: Matrikel-Nr.: Klausur Statistik
Vorname: Nachname: Matrikel-Nr.: Klausur Statistik Prüfer Etschberger, Heiden, Jansen Prüfungsdatum 21. Januar 2016 Prüfungsort Augsburg Studiengang IM und BW Bearbeitungszeit: 90 Minuten Punkte: 90 Die
MehrNicht-parametrische statistische Verfahren
Nicht-parametrische statistische Verfahren von Peter Pfaffelhuber Version: 7. Dezember 015 Die statistischen Verfahren, die wir bisher kennengelernt haben, basieren auf statistischen Modellen, die immer
MehrStatistik Einführung // Kategoriale Daten 10 p.2/26
Statistik Einführung Kategoriale Daten Kapitel 10 Statistik WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger Statistik Einführung // Kategoriale Daten
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrGrundgesamtheit, Merkmale, Stichprobe. Eigenschaften der Stichprobe. Klasseneinteilung, Histogramm. Arithmetisches Mittel, empirische Varianz
- 1 - Grundgesamtheit, Merkmale, Stichprobe Dimension, Umfang Skalierung Eigenschaften der Stichprobe kennzeichnende Größen Eigenschaften der Stichprobe kennzeichnende Größen Punktediagramm, Regressionsgerade,
MehrSie wissen noch, dass 18.99% der Surfer, die kein Smartphone haben, pro Monat weniger als 20 Stunden das Internet nutzen, d.h. f(y 1 X 2 ) =
Aufgabe 1 In einer Umfrage wird der Besitz eines Smartphones (Merkmal X) und die Nutzungsdauer des Internets pro Monat (Merkmal Y ) untersucht. Merkmal X hat zwei Ausprägungen: X 1 : Besitz und X 2 : Nichtbesitz.
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrStatistik I. Methodologie der Psychologie
Statistik I Methodologie der Psychologie Thomas Schmidt & Lena Frank Wintersemester 2003/2004 Georg-Elias-Müller-Institut für Psychologie Uni Göttingen Literatur: Glantz, S.A. (2002). Primer of Biostatistics.
MehrMathematik 3 für Informatik
Gunter Ochs Wintersemester 20/6 Mathematik 3 für Informatik Lösungen zum Hausaufgabenblatt 4 Lösungshinweise (ohne Ganantie auf Fehlerfreiheit. Wenn man beim Roulette auf Rot oder Schwarz setzt, erhält
MehrEine Einführung in R: Statistische Tests
I. Einführungsbeispiel II. Theorie: Statistische Tests III. Zwei Klassiker: t-test und Wilcoxon-Rangsummen - Test IV. t-test und Wilcoxon-Rangsummen - Test in R Eine Einführung in R: Statistische Tests
MehrArbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg Michael Schomaker Malte Wißmann Christian Heumann Arbeitsbuch zur deskriptiven und induktiven Statistik Zweite, aktualisierte und erweiterte Auflage 4ü Springer Inhaltsverzeichnis 1. Grundlagen
MehrAuswertung und Lösung
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
Mehr1. Grundbegri e der Stochastik
Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt
Mehr