Mathematik 2 für Naturwissenschaften

Ähnliche Dokumente
Statistik für Naturwissenschaftler

Mathematik 2 für Naturwissenschaften

Statistik für Naturwissenschaftler

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften

7.2 Mittelwert einer Stichprobe

Name: Punkte *Total der Punkte der drei am besten gelösten Aufgaben.

Mathematik 2 für Naturwissenschaften

Alternative Darstellung des 2-Stcihprobentests für Anteile

Der χ2-test Der χ2-test

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Mathematik 2 für Naturwissenschaften

erwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:

Der χ 2 -Test (Chiquadrat-Test)

Chi-Quadrat Verfahren

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Mathematik 2 für Naturwissenschaften

Mathematik 2 für Naturwissenschaften

Alternative Darstellung des 2-Stichprobentests für Anteile

Statistisches Testen

Alternative Darstellung des 2-Stichprobentests für Anteile

Mathematik 2 für Naturwissenschaften

Biometrieübung 11 Kontingenztafeln

Mathematik 2 für Naturwissenschaften

Chi² Test und Kontingenzkoeffizient. - aber keine natürliche Reihenfolge

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Statistik II: Signifikanztests /1

Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Biomathematik für Mediziner

Statistische Tests (Signifikanztests)

Mathematik 2 für Naturwissenschaften

"Korrelation" bei Nominaldaten: Kontingenz

Bivariate Verteilungen

Mathematik 1 für Naturwissenschaften. Bernoulli

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Mathematik 2 für Naturwissenschaften

Mathematik 1 für Naturwissenschaften

r=0.666 Number of people who drowned by falling into a pool correlates with Films Nicolas Cage appeared in 140 drownings 6 films 4 films 120 drownings

5. Seminar Statistik

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Zwei kategoriale Merkmale. Homogenität Unabhängigkeit

9.1 Einleitung. Statistik. Qualitative 2-Weg Daten. Bsp: UCB Admissions. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Mathematik 2 für Naturwissenschaften

Tutorial:Unabhängigkeitstest

Alternative Darstellung des 2-Stichprobentests für Anteile

Sven Garbade. Statistik 1

Modul G.1 WS 07/08: Statistik

Wahrscheinlichkeitsrechnung und Statistik

Analyse kategorieller Daten

= 0.445, also annähernd die Hälfte aller Männer zugelassen 557

Wahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019

Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker II

Beurteilende Statistik

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Hypothesentests mit SPSS

Was sind Zusammenhangsmaße?

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Bivariate Zusammenhänge

How To Find Out If A Ball Is In An Urn

Tutorial: Anpassungstest

Klausur zur Vorlesung Analyse mehrdimensionaler Daten, Lösungen WS 2010/2011; 6 Kreditpunkte, 90 min

Quantitative Auswertung II. Korpuslinguistik Heike Zinsmeister

Mathematik 1 für Naturwissenschaften

3) Testvariable: T = X µ 0

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Mathematik 1 für Naturwissenschaften

D-CHAB Frühlingssemester 2017 T =

Mathematische und statistische Methoden II

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen

Statistik Einführung // Kategoriale Daten 10 p.2/26

Klausur Statistik 2 RE Statistik für Soziologen Do,

Analyse von Kontingenztafeln

Online-Aufgaben Statistik (BIOL, CHAB) Auswertung und Lösung

Nachgefragte Aufgaben über spezifische Themen

Tutorial: χ 2 -Test auf vorgegebene Verteilung

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Auswertung und Lösung

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Anpassungstests VORGEHENSWEISE

Klassifikation von Signifikanztests

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Hans Walser. Raumgeometrie. Modul 4 Die Ebene

10 bis bis 75 ohne HA mit HA

Tabelle 4 : Berechnete Konzeptionen pro Monat aus den Ausgangsdaten Lebendgeburten pro Monat am Beispiel der gesamten Kontrollen.

Allgemeines zu Tests. Statistische Hypothesentests

Kategoriale Daten. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/17

Statistik-Quiz Wintersemester

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

Transkript:

Hans Walser Mathematik 2 für Naturwissenschaften 200 180 160 Frauen 140 120 100 80 80 100 120 140 160 180 200 Männer Modul 208 Testen von Hypothesen 2 Lernumgebung. Teil 2

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 ii Modul 208 für die Lehrveranstaltung Mathematik 2 für Naturwissenschaften Sommer 2006 Probeversion Sommer 2007 Ergänzungen und Korrekturen Frühjahr 2008 Ergänzungen. Aufteilung in zwei Teile Frühjahr 2009 Ergänzung Frühjahr 2011 Kürzungen und Erweiterungen. Fehlerkorrektur Frühjahr 2013 Ergänzungen Frühjahr 2014 Straffungen last modified: 5. November 2013 Hans Walser Mathematisches Institut, Rheinsprung 21, 4051 Basel www.walser-h-m.ch/hans

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 iii Inhalt 1 Zeilen- und Spaltensummen... 1 2 Rauchen und Trinken... 1 3 Raucherverhalten und Geschlecht... 2 4 Raucherverhalten und Geschlecht... 3 5 Raucherverhalten und Geschlecht... 4 6 Raucherverhalten und Geschlecht... 5 7 Pharmazie ein Frauenstudium?... 5 8 Pharmazie ein Frauenstudium?... 6 9 Bringen Glücksbringer Glück?... 7 10 Sind Frauen abergläubisch?... 8 11 Veränderung von Chi Quadrat... 9 12 Blond und blaue Augen... 9 13 Prozente, Prozente, Prozente... 10 14 Qualitätskontrolle... 11 15 Qualitätskontrolle... 12 16 Geschlecht und Studienrichtung (2006)... 14 17 Geschlecht und Studienrichtung (2008)... 15 18 Ist Mathe Männersache?... 15 19 Anzahl Freiheitsgrade... 18 20 Sonderfälle beim Chi-Quadrat-Test... 18 21 Veränderung des Stichprobenumfanges... 20 22 95%-Vertrauensintervall... 20 23 Hirsche... 21 24 Vertrauensintervall... 21 25 Vertrauensintervall... 21 26 Reißnagel... 22

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 1 1 Zeilen- und Spaltensummen Eine Matrix (rechteckiges Zahlenschema, Tabelle) hat 32 Zeilen und 60 Spalten. Die Zeilensummen haben den Durchschnitt a, die Spaltensummen den Durchschnitt b. Wie groß ist das Verhältnis a b? Ergebnis a b = 15 8 Wir bezeichnen mit S die Gesamtsumme der in der Matrix vorkommenden Zahlen. Dann ist a = S 32 und b = S. Daraus ergibt sich: 60 2 Rauchen und Trinken S a b = 32 S 60 = 60 32 = 15 8 a) Es wurden 60 Personen befragt, ob sie rauchen oder trinken: Raucher Nichtraucher Trinker 30 10 Nichtrinker 10 10 Nullhypothese: Zwischen den beiden Merkmalen besteht kein Zusammenhang. Prüfen Sie die Nullhypothese auf dem 5%-Niveau. b) Es wurden 300 Personen befragt, ob sie rauchen oder trinken: Raucher Nichtraucher Trinker 150 50 Nichtrinker 50 50 Nullhypothese: Zwischen den beiden Merkmalen besteht kein Zusammenhang. Prüfen Sie die Nullhypothese auf dem 5%-Niveau.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 2 ( ) a) χ 2 60 30 10 10 10 = ( )2 = 3.75. Bei einem Freiheitsgrad ist P χ 2 3.84 40 20 40 20 Ergebnis ist verdächtig, aber nicht signifikant auf dem 5%-Niveau. b) χ 2 = = 0.05. Das 300 ( 150 50 50 50 )2 =18.75. Bei einem Freiheitsgrad ist P χ 2 3.84 200 100 200 100 ( ) = 0.05. Die Nullhypothese muss verworfen werden. Es besteht ein Zusammenhang zwischen Rauchen und Trinken. 3 Raucherverhalten und Geschlecht Im Sommersemester 2006 wurden an der Uni Basel 204 Studierende nach ihrem Raucherverhalten befragt: Frau Mann RaucherIn 8 20 NichtraucherIn 106 70 Nullhypothese: Zwischen dem Raucherverhalten und dem Geschlecht besteht kein Zusammenhang. Prüfen Sie die Nullhypothese auf dem 5%-Niveau. Frau Mann RaucherIn 8 20 28 NichtraucherIn 106 70 176 114 90 204 χ 2 = 204 ( 8 70 20 106 )2 114 90 28 176 ( ) = 9.8189. Bei einem Freiheitsgrad ist P χ 2 3.84 = 0.05. Wegen 9.8189 > 3.84 müssen wir die Nullhypothese verwerfen. Es besteht ein Zusammenhang zwischen Rauchen und Geschlecht.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 3 4 Raucherverhalten und Geschlecht Im Sommersemester 2007 wurden an der Uni Basel 163 Studierende nach ihrem Raucherverhalten befragt: Frau Mann NichtraucherIn 89 43 RaucherIn 12 19 Nullhypothese: Zwischen dem Raucherverhalten und dem Geschlecht besteht kein Zusammenhang. Prüfen Sie die Nullhypothese auf dem 1%-Niveau. Frau Mann Total NichtraucherIn 89 43 132 RaucherIn 12 19 31 Total 101 62 163 χ 2 = 163 ( 89 19 43 12 )2 101 62 132 31 = 8.78249036. Bei einem Freiheitsgrad ist P( χ 2 6.63) = 0.01. Wegen 8.782 > 6.63 können wir die Nullhypothese verwerfen. Es besteht ein Zusammenhang zwischen Rauchen und Geschlecht.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 4 5 Raucherverhalten und Geschlecht Im Frühjahrssemester 2008 wurden an der Uni Basel 173 Studierende nach ihrem Raucherverhalten befragt: Frau Mann NichtraucherIn 80 70 RaucherIn 9 14 Nullhypothese: Zwischen dem Raucherverhalten und dem Geschlecht besteht kein Zusammenhang. Prüfen Sie die Nullhypothese auf dem 1%-Niveau. Frau Mann Total NichtraucherIn 80 70 150 RaucherIn 9 14 23 Total 89 84 173 χ 2 = 1.610459751. Bei einem Freiheitsgrad ist P( χ 2 6.63) = 0.01. Wegen 1.61 < 6.63 müssen wir die Nullhypothese beibehalten. Es besteht kein Zusammenhang zwischen Rauchen und Geschlecht.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 5 6 Raucherverhalten und Geschlecht Frau Mann RaucherIn 24 20 NichtraucherIn 51 35 Nullhypothese: Zwischen dem Raucherverhalten und dem Geschlecht besteht kein Zusammenhang. Prüfen Sie die Nullhypothese auf dem 5%-Niveau. Frau Mann RaucherIn 24 20 44 NichtraucherIn 51 35 86 75 55 130 ( ) χ 2 130 24 35 20 51 = ( )2 = 0.2698. Bei einem Freiheitsgrad ist P χ 2 3.84 = 0.05. Wegen 0.2698 << 3.84 muss die Nullhypothese beibehalten werden. Das Symbol << be- 75 55 44 86 deutet krass kleiner. Es besteht kein Zusammenhang zwischen Rauchen und Geschlecht. 7 Pharmazie ein Frauenstudium? Studierende Sommer 2006, 2. Semester, Uni Basel Studienrichtung Frau Mann Biologie 39 27 Pharmazie 49 8 Nullhypothese: Kein Zusammenhang zwischen Geschlecht und Studienrichtung. Prüfen Sie die Nullhypothese auf dem 0.5%-Niveau.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 6 Studienrichtung Frau Mann Biologie 39 27 66 Pharmazie 49 8 57 88 35 123 χ 2 = 10.85. Bei einem Freiheitsgrad ist P( χ 2 7.88) = 0.05. Wegen 10.85 > 7.88 muss die Nullhypothese verworfen werden. Es besteht ein Zusammenhang zwischen Studienrichtung und Geschlecht. 8 Pharmazie ein Frauenstudium? Studierende Frühjahr 2008, 2. Semester, Uni Basel Studienrichtung Frau Mann Biologie 34 36 Pharmazie 37 22 Nullhypothese: Kein Zusammenhang zwischen Geschlecht und Studienrichtung. Prüfen Sie die Nullhypothese auf dem 0.5%-Niveau. Studienrichtung Frau Mann Biologie 34 36 70 Pharmazie 37 22 59 71 58 129 χ 2 = 2.586896246. Bei einem Freiheitsgrad ist P( χ 2 7.88) = 0.05. Wegen 2.586896246 < 7.88 muss die Nullhypothese beibehalten werden. Es besteht kein Zusammenhang zwischen Studienrichtung und Geschlecht.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 7 9 Bringen Glücksbringer Glück? Coccinella septempunctata Obwohl Glücksbringer häufig in Prüfungssituationen verwendet werden, ist über ihre Auswirkungen auf das Prüfungsergebnis wenig bekannt. Von 1997 bis 1999 wurden jeweils in den Sommer- und Herbstexamen während der dritten schriftlichen Prüfung (Biologie A) des ersten propädeutischen Examens (Medizin, Uni Basel) alle Kandidatinnen und Kandidaten mit Glücksbringern erfasst. bestanden nicht bestanden mit Glücksbringer 45 21 ohne Glücksbringer 390 220 Nullhypothese: Glücksbringer bringen kein besonderes Glück. Prüfen Sie die Nullhypothese auf dem 5%-Niveau. Literatur: [Haag-Wackernagel 2000] Haag-Wackernagel, Daniel: Schwein gehabt? Glücksbringer am ersten Propädeutikum Medizin. Schweiz. Med. Wochenschrift 2000; 130. S. 799-783 bestanden nicht bestanden mit Glücksbringer 45 21 66 ohne Glücksbringer 390 220 610 435 241 676

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 8 χ 2 = 676 ( 45 220 21 390 )2 435 241 610 66 = 0.4683. Bei einem Freiheitsgrad ist P( χ 2 3.84) = 0.05. Wegen 0.4683 << 3.84 muss die Nullhypothese beibehalten werden. Das Symbol << bedeutet krass kleiner. Glücksbringer bringen kein Glück (aber auch kein Unglück). 10 Sind Frauen abergläubisch? Obwohl Glücksbringer häufig in Prüfungssituationen verwendet werden, ist über ihre Auswirkungen auf das Prüfungsergebnis wenig bekannt. Von 1997 bis 1999 wurden jeweils in den Sommer- und Herbstexamen während der dritten schriftlichen Prüfung (Biologie A) des ersten propädeutischen Examens (Medizin, Uni Basel) alle Kandidatinnen und Kandidaten mit Glücksbringern erfasst. mit Glücksbringer ohne Glücksbringer Frauen 49 299 Männer 17 311 Nullhypothese: Es besteht kein Unterschied zwischen Frauen und Männern hinsichtlich des Glaubens an Glücksbringer. Prüfen Sie die Nullhypothese auf dem 0.5%-Niveau. Literatur: [Haag-Wackernagel 2000] Haag-Wackernagel, Daniel: Schwein gehabt? Glücksbringer am ersten Propädeutikum Medizin. Schweiz. Med. Wochenschrift 2000; 130. S. 799-783 mit Glücksbringer ohne Glücksbringer χ 2 = Frauen 49 299 348 Männer 17 311 328 66 610 676 676 ( 49 311 299 17 )2 66 610 328 348 ( ) = 0.005. = 15.1728. Bei einem Freiheitsgrad ist P χ 2 7.88 Wegen 15.1728 > 7.88 muss die Nullhypothese verworfen werden. Signifikant mehr Frauen vertrauen auf Glücksbringer als Männer.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 9 11 Veränderung von Chi Quadrat Wie verändert sich in einer Vierfeldertafel das χ 2, wenn sämtliche Einträge der Tafel mit demselben Faktor λ multipliziert werden? Ergebnis Das χ 2 wird ebenfalls mit dem Faktor λ multipliziert. In der Praxis hieße das, dass die Nullhypothese immer fragwürdiger würde. Aus ergibt sich: 2 χ neu χ 2 n( ad cb) 2 = ( a+b) ( a+c) ( b+d )( c+d ) λn ( λaλd λcλb) 2 = ( λa+λb) ( λa+λc )( λb+λd )( γc+λd ) = λ 5 n( ad cb) 2 ( )( a+c) ( b+d )( c+d ) = λ n( ad cb) 2 ( a+b) ( a+c) ( b+d )( c+d ) = λχ 2 alt λ 4 a+b 12 Blond und blaue Augen Die Tabelle zeigt die Verteilung der Merkmale A (blauäugig) und B (blond) bei 50 Studierenden. A A B 12 6 B 12 20 Nullhypothese: Es besteht kein Zusammenhang zwischen Augenfarbe und Haarfarbe. a) Prüfen Sie die Nullhypothese auf dem 5%-Niveau. b) Prüfen Sie die Nullhypothese auf dem 1%-Niveau. χ 2 = 50 ( 12 20 6 12 )2 24 26 18 32 3.926.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 10 ( ) a) Bei einem Freiheitsgrad ist P χ 2 3.84 = 0.05. Die Nullhypothese kann mit einer Irrtumswahrscheinlichkeit α < 5% verworfen werden. Blonde sind häufiger blauäugig als Dunkelhaarige. ( ) b) Bei einem Freiheitsgrad ist P χ 2 6.63 = 0.01. Die Nullhypothese muss beibehalten werden. Blonde sind nicht hochsignifikant häufiger blauäugig als Dunkelhaarige. 13 Prozente, Prozente, Prozente Warum lässt sich mit folgenden relativen Angaben kein χ 2 -Test bestreiten? B B A 10% 20% 30% A 50% 20% 70% 60% 40% 100% Nullhypothese: Es besteht kein Zusammenhang zwischen den Merkmalen A und B. Je nach Größe der Gesamtheit ergeben sich andere Resultate. Exemplarisch zwei Beispiele mit Prüfung auf dem 5%-Niveau. Erstes Beispiel Wir wählen n = 10, also die Verteilung: B B A 1 2 3 A 5 2 7 6 4 10 Wir erhalten χ 2 1.269841270. Die Nullhypothese kann nicht verworfen werden.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 11 Zweites Beispiel Wir wählen n = 1000, also die Verteilung: B B A 100 200 300 A 500 200 700 600 400 1000 Wir erhalten χ 2 126.9841270. Die Nullhypothese kann verworfen werden. 14 Qualitätskontrolle Die Lieferungen dreier Lieferanten A, B und C werden bezüglich gut und mangelhaft kontrolliert. A B C gut 238 130 416 mangelhaft 41 23 34 Nullhypothese: Die drei Lieferanten sind alle gleich gut. a) Wie viele Freiheitsgrade hat das Problem? b) Prüfen Sie die Nullhypothese auf dem 1%-Niveau. a) Das Problem hat zwei Freiheitsgrade. b) Mit den Randhäufigkeiten A B C gut 238 130 416 784 mangelhaft 41 23 34 98 279 153 450 882 erhalten wir unter der Annahme der Nullhypothese aus A B C gut 784 mangelhaft 98 279 153 450 882 die theoretische Verteilung:

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 12 Damit ergibt sich: A B C gut 248 136 400 784 mangelhaft 31 17 50 98 279 153 450 882 χ 2 = ( 10)2 248 + ( 6)2 136 + 162 400 + 102 31 + 17 62 + 16 50 ( )2 11.771 Beim Freiheitsgrad 2 ist P( χ 2 9.21) = 0.01. Die Nullhypothese ist zu verwerfen. Es sind nicht alle drei Lieferanten gleich gut. 15 Qualitätskontrolle Die Lieferungen dreier Lieferanten A, B und C werden bezüglich gut und mangelhaft kontrolliert. A B C gut 238 130 410 mangelhaft 41 23 40 Nullhypothese: Die drei Lieferanten sind alle gleich gut. a) Wie viele Freiheitsgrade hat das Problem? b) Prüfen Sie die Nullhypothese auf dem 1%-Niveau.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 13 a) Das Problem hat zwei Freiheitsgrade. b) Mit den Randhäufigkeiten A B C gut 238 130 410 778 mangelhaft 41 23 40 104 279 153 450 882 erhalten wir unter der Annahme der Nullhypothese aus A B C gut 778 mangelhaft 104 279 153 450 882 die theoretische Verteilung: A B C gut 246.1020408 134.9591837 396.9387755 778 mangelhaft 32.89795918 18.04081633 53.06122449 104 279 153 450 882 Damit ergibt sich: χ 2 7.452377246 ( ) Beim Freiheitsgrad 2 ist P χ 2 9.21 = 0.01. Die Nullhypothese muss beibehalten werden. Alle Lieferanten sind gleich gut.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 14 16 Geschlecht und Studienrichtung (2006) Uni Basel, Sommer 2006, 2. Semester Bio Chemie Geo Nano Pharma Frau 39 4 12 5 49 Mann 27 14 20 20 8 Nullhypothese: Kein Zusammenhang zwischen Geschlecht und Studienrichtung. Prüfen Sie die Nullhypothese auf dem 1%-Niveau. Wir haben ein Problem mit 4 Freiheitsgraden. Tabelle mit Randwerten: Bio Chemie Geo Nano Pharma Frau 39 4 12 5 49 109 Mann 27 14 20 20 8 89 66 18 32 25 57 198 Aus den Randwerten erhalten wir die theoretische Verteilung bei stochastischer Unabhängigkeit: Bio Chemie Geo Nano Pharma Frau 36.33333 9.90909 17.61616 13.76263 31.37879 109 Mann 29.66667 8.09091 14.38384 11.23737 25.62121 89 66 18 32 25 57 198 Die folgende Tabelle gibt die Differenzen zwischen den tatsächlichen und den theoretischen Häufigkeiten: Bio Chemie Geo Nano Pharma Frau 2.66667-5.90909-5.61616-8.76263 17.62121 Mann -2.66667 5.90909 5.61616 8.76263-17.62121 Quadrate davon: Bio Chemie Geo Nano Pharma Frau 7.11111 34.91736 31.54127 76.78362 310.50712 Mann 7.11111 34.91736 31.54127 76.78362 310.50712 In Relation zu den theoretischen Werten: Bio Chemie Geo Nano Pharma Frau 0.19572 3.52377 1.79047 5.57914 9.89545 Mann 0.23970 4.31563 2.19283 6.83288 12.11914

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 15 Die Summe dieser Zahlen ist χ 2 = 46.68473. Beim Freiheitsgrad 4 ist P( χ 2 13.28) = 0.01. Die Nullhypothese kann verworfen werden. Es besteht ein Zusammenhang zwischen Studienrichtung und Geschlecht. 17 Geschlecht und Studienrichtung (2008) Uni Basel, Frühjahr 2008, Lehrveranstaltung Mathematik 2 für Naturwissenschaften. Bio Chemie Geo Pharma PNA Frau 34 7 8 37 4 Mann 36 11 15 22 1 Nullhypothese: Kein Zusammenhang zwischen Geschlecht und Studienrichtung. Prüfen Sie die Nullhypothese auf dem 1%-Niveau. Wir erhalten χ 2 = 8.554151689. Beim Freiheitsgrad 4 ist P χ 2 13.28 ( ) = 0.01. Die Nullhypothese kann nicht verworfen werden. Es besteht kein Zusammenhang zwischen Studienrichtung und Geschlecht. 18 Ist Mathe Männersache? An einer Prüfung über Mathematik für Naturwissenschaften wurden von 84 Studierenden der Biologie (Uni Basel, Herbst 2006) folgende Resultate erreicht (m=male, f=female). Die Einer erhielten Studierende, die sich für die Prüfung angemeldet hatten, dann aber ohne Rückmeldung der Prüfung fernblieben. 1 1-2 2 2-3 3 3-4 4 4-5 5 5-6 6 m 3 1 1 9 12 6 4 1 f 2 3 15 11 8 5 3

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 16 Prüfen Sie die Nullhypothese: Männer sind nicht bessere Mathematiker als Frauen auf dem 5%-Niveau. Wir erhalten folgende Randsummen. 1 1-2 2 2-3 3 3-4 4 4-5 5 5-6 6 total m 3 0 0 1 1 0 9 12 6 4 1 37 f 0 0 0 0 2 3 15 11 8 5 3 47 total 3 0 0 1 3 3 24 23 14 9 4 84 Die beiden Spalten mit den Spaltensummen Null müssen wir entfernen. Bei der Berechnung der erwarteten Werte ergäbe sich Null, und durch diese Null müsste dividiert werden. Zudem haben wir in einer Spalte (oder in einer Zeile) mit der Summe Null keine Freiheitsgrade, da die Matrixelemente nicht negativ sein dürfen. Wir arbeiten also mit der reduzierten Matrix weiter: 1 2-3 3 3-4 4 4-5 5 5-6 6 total m 3 1 1 0 9 12 6 4 1 37 f 0 0 2 3 15 11 8 5 3 47 total 3 1 3 3 24 23 14 9 4 84 Wir haben jetzt acht Freiheitsgrade. Bei stochastischer Unabhängigkeit wären aus den Randwerten folgende Werte zu erwarten. 1 2-3 3 3-4 4 4-5 5 5-6 6 total m 1.321 0.440 1.321 1.321 10.571 10.131 6.167 3.964 1.762 37 f 1.679 0.560 1.679 1.679 13.429 12.869 7.833 5.036 2.238 47 total 3 1 3 3 24 23 14 9 4 84 Für die Differenzen im Quadrat dividiert durch die erwarteten Werte erhalten wir: 1 2-3 3 3-4 4 4-5 5 5-6 6 m 2.132 0.711 0.078 1.321 0.234 0.345 0.005 0.000 0.329 f 1.679 0.560 0.062 1.040 0.184 0.271 0.004 0.000 0.259 Aufsummieren ergibt χ 2 = 9.214

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 17 Ausschnitt aus der Chi-Quadrat-Tabelle 6 10.64 12.59 14.45 16.81 18.55 7 12.02 14.07 16.01 18.48 20.28 8 13.36 15.51 17.53 20.09 21.95 9 14.68 16.92 19.02 21.67 23.59 10 15.99 18.31 20.48 23.21 25.19 Für den Freiheitsgrad 8 und α = 5% lesen wir den Wert 15.51 ab. Unser berechnetes χ 2 = 9.214 ist kleiner, daher muss die Nullhypothese beibehalten werden. Männer sind keine besseren Mathematiker als Frauen. Bemerkung: Die Funktion CHITEST von Excel ergibt zu diesen Daten p = 0.324587264. Das heißt, die Wahrscheinlichkeit, ein so extremes oder extremeres Resultat zu erhalten, ist 32.46%, also weit über α = 5%. Wir haben keine Signifikanz. Variante Die Frage ist allerdings, ob sich die Sachlage ändert, wenn wir die drei Einer weglassen. Dann bleibt die Tabelle: 2-3 3 3-4 4 4-5 5 5-6 6 total m 1 1 0 9 12 6 4 1 34 f 0 2 3 15 11 8 5 3 47 total 1 3 3 24 23 14 9 4 81 Wir haben nur noch sieben Freiheitsgrade. Bei stochastischer Unabhängigkeit wären aus den Randwerten folgende Werte zu erwarten. 2-3 3 3-4 4 4-5 5 5-6 6 total m 0.420 1.259 1.259 10.074 9.654 5.877 3.778 1.679 34 f 0.580 1.741 1.741 13.926 13.346 8.123 5.222 2.321 47 total 1 3 3 24 23 14 9 4 81

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 18 Für die Differenzen im Quadrat dividiert durch die erwarteten Werte erhalten wir: 2-3 3 3-4 4 4-5 5 5-6 6 m 0.802 0.053 1.259 0.115 0.570 0.003 0.013 0.275 f 0.580 0.039 0.911 0.083 0.412 0.002 0.009 0.199 Aufsummieren ergibt das χ 2 = 5.324 Für den Freiheitsgrad 7 und α = 5% lesen wir den Wert 14.07 ab. Unser berechnetes χ 2 = 5.324 ist kleiner, daher muss die Nullhypothese beibehalten werden. Männer sind keine besseren Mathematiker als Frauen. Bemerkung: Die Funktion CHITEST von Excel ergibt zu diesen Daten p = 0.620444555. Das heißt, die Wahrscheinlichkeit, ein so extremes oder extremeres Resultat zu erhalten, ist 62%, also weit über α = 5%. Wir haben keine Signifikanz. 19 Anzahl Freiheitsgrade Wie viele Freiheitsgrade hat eine m n-felder-tafel? Ergebnis Anzahl der Freiheitsgrade = ( m 1) ( n 1) = mn m n + 1 20 Sonderfälle beim Chi-Quadrat-Test Frage: Wie groß wird das χ 2 bei extremer stochastischer Abhängigkeit, also kausaler Abhängigkeit? Im allgemeinen Fall mit n = a + b + c + d gilt: A A B a b a + b B c d c + d a + c b + d n Im Sonderfall χ 2 n( ad cb) 2 = ( a+b) ( a+c) ( b+d) ( c+d)

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 19 erhalten wir daraus: A A B a 0 B 0 d χ 2 n( ad) 2 = ( a) ( a) ( d) ( d) = n Dasselbe Resultat erhalten wir auch für den Sonderfall: A A B 0 b B c 0 Bemerkungen: Durch Umbezeichnung B B können wir diesen Fall in den obigen Fall überführen. Vergleich mit Tabelle: Bei beispielsweise α = 5% kann die Nullhypothese bereits ab n = 4 verworfen werden. Im Falle einer 3 3-Diagonalmatrix A 1 A 2 A 3 B 1 a 1,1 0 0 B 2 0 a 2,2 0 B 3 0 0 a 3,3 mit n = a 1,1 + a 2,2 + a 3,3 erhalten wir mit einiger Rechnung: χ 2 = 2n. Vergleich mit Tabelle: Bei beispielsweise α = 5% kann die Nullhypothese ab n = 5 verworfen werden. Im Falle einer 4 4-Diagonalmatrix erhalten wir: χ 2 = 3n. Vergleich mit Tabelle: A 1 A 2 A 3 A 4 B 1 a 1,1 0 0 0 B 2 0 a 2,2 0 0 B 3 0 0 a 3,3 0 B 4 0 0 0 a 4,4

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 20 9 14.68 16.92 19.02 21.67 23.59 Bei beispielsweise α = 5% kann die Nullhypothese ab n = 6 verworfen werden. Im Falle einer k k-diagonalmatrix ergibt sich χ 2 = ( k 1)n, wobei n die Summe der Diagonalelemente ist. 21 Veränderung des Stichprobenumfanges In der Vorlesung sahen wir, dass bei 60 zufällig ausgewählten Sträuchern, von denen 18 krank waren, sich für p krank ein 95%-Vertrauensintervall [0.192, 0.434] ergab. Welches ist das 95%-Vertrauensintervall für p krank in folgenden Situationen: a) 600 zufällig ausgewählte Sträucher, davon 180 krank b) 6000 zufällig ausgewählte Sträucher, davon 1800 krank ( ) 2 600 p( 1 p) = ( 180 600 p) 2 hat a) Die zugehörige quadratische Gleichung 1.96 die beiden Lösungen 0.265 und 0.338. Somit ergibt sich das 95%-Vertrauensintervall [0.265, 0.338]. Mit der Faustformel erhalten wir die das Intervall [0.263, 0.337]. ( ) 2 6000 p( 1 p) = ( 1800 6000 p) 2 b) Die zugehörige quadratische Gleichung 1.96 liefert das 95%-Vertrauensintervall [0.289, 0.312]. Mit der Faustformel ergibt sich [0.288, 0.312]. Bei Vergrößerung des Stichprobenumfanges wird das Vertrauensintervall enger, das heißt, die Aussage über p krank wird präziser. Die Resultate der Faustformel weichen immer weniger von den mit der quadratischen Gleichung berechneten Werten ab. 22 95%-Vertrauensintervall Würden Sie die Nullhypothese p = 0.4 auf dem 95 %-Niveau verwerfen, falls a) h Exp = 0.62 und n = 60? b) h Exp = 0.49 und n = 100? c) h Exp = 0.49 und n = 200? d) h Exp = 0.36 und n = 1'000? Ergebnis a) h Exp = 0.62 und n = 60? Nullhypothese verwerfen b) h Exp = 0.49 und n = 100? Nullhypothese beibehalten c) h Exp = 0.49 und n = 200? Nullhypothese verwerfen d) h Exp = 0.36 und n = 1'000? Nullhypothese verwerfen

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 21 23 Hirsche Es wurden 100 Einlingsgeburten bei einer Hirschart beobachtet, wobei man jeweils das Geschlecht des Jungtieres feststellte. Es gab 63 weibliche und 37 männliche Geburten. Ist dieser Häufigkeitsunterschied signifikant? Für die männlichen Geburten haben wir h Exp = 0.37. Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung: [0.281, 0.468] b) Faustregel: [0.275, 0.465] Die Nullhypothese p = 0.5 muss verworfen werden. Es gibt mehr weibliche Geburten als männliche. Bemerkung Wenn wir mit den weiblichen Geburten arbeiten, ergeben sich folgende Daten: Für die weiblichen Geburten haben wir h Exp = 0.63 a) Rechnung: [0.532, 0.718] b) Faustregel: [0.535, 0.725] Die Nullhypothese p = 0.5 muss auch so verworfen werden. Die Grenzen sind jetzt einfach gespiegelt gegenüber dem Fall h Exp = 0.37. Sie ergänzen sich auf Eins. Sie sind also gleich weit von 0.5 entfernt, aber auf der anderen Seite. 24 Vertrauensintervall In einer Zufallsstichprobe des Umfanges 60 trat die interessierende Merkmalsausprägung 46 mal auf. Geben Sie ein 95 %-Vertrauensintervall an für den Anteil dieser Ausprägung in der Grundgesamtheit. h Ex = 46 60 = 0.76 Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung: [0.646, 0.856] b) Faustregel: [0. 660, 0.874] 25 Vertrauensintervall Werfen Sie eine Münze 20 Mal und zählen Sie die Anzahl der Köpfe. Geben Sie ein 95%-Vertrauensintervall für den Anteil der Köpfe an. Wiederholen Sie das Experiment.

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 22 Offene Aufgabe. Ich habe folgendes erhalten: Erster Versuch: n = 20, k = 8. Somit ist h Ex = 8 20 = 0.4. Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung: [0.219, 0.613] b) Faustregel: [0.185, 0.615] Zweiter Versuch: n = 20, k = 12. Somit ist h Ex = 12 20 = 0.6. Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung: [0.387, 0.781] b) Faustregel: [0.385, 0.815] Die Grenzen ergeben sich aus denen des ersten Versuches durch Ergänzen auf 1. Dritter Versuch: n = 20, k = 6. Somit ist h Ex = 6 20 = 0.3. Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung : [0.145, 0.519] b) Faustregel: [0.100, 0.501] 26 Reißnagel Werfen Sie einen Reißnagel 20 Mal. Der Reißnagel fällte entweder auf den Rücken mit Spitze nach oben oder auf die Spitze und den Rand des Rückens. Gesucht ist ein 95%-Vertrauensintervall für den relativen Anteil des ersten Merkmals (Rücken mit Spitze nach oben) in der Grundgesamtheit. Wiederholen Sie den Versuch. Offene Aufgabe. Ich habe erhalten: Erster Versuch: n = 20, k = 8. Somit ist h Ex = 8 20 = 0.4. Für das 95%-Vertrauensintervall erhalten wir:

Hans Walser: Modul 208, Testen von Hypothesen 2. Lernumgebung. Teil 2 23 a) Rechnung: [0.219, 0.613] b) Faustregel: [0.185, 0.615] Zweiter Versuch: n = 20, k = 11. Somit ist h Ex = 8 20 = 0.55. Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung: [0.342, 0.742] b) Faustregel: [0.332, 0.768] Dritter Versuch: n = 20, k = 13. Somit ist h Ex = 8 20 = 0.65. Für das 95%-Vertrauensintervall erhalten wir: a) Rechnung: [0.433, 0.819] b) Faustregel: [0.441, 0.859]