Beurteilende Statistik SIGNIFIKANZ UND HYPOTHESENTESTS 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 1
12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 2
12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 3
Gliederung 1. Stochastik: Wahrscheinlichkeitsrechnung & Statistik 2. Verteilung und Standardabweichung 3. Testen von Hypothesen das Prinzip 4. Fehler 1. und 2. Art 5. Signifikanztest 6. Alternativtest 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 4
Stochastik: Wahrscheinlichkeitsrechnung & Statistik Beschreibende (Deskriptive) Statistik hat das Ziel empirische Daten durch Tabellen, Kenngrößen und Grafiken darzustellen und zu ordnen Wahrscheinlichkeitsrechnung untersucht Zufallsgeschehen in stochastischen Modellen (unendliche Prozesse durch Gesetz der großen Zahlen) schwierig auf endliche Grundgesamtheit zu beziehen Beurteilende Statistik versucht von der beschreibenden Statistik auf die Wahrscheinlichkeitsverteilung in der Grundgesamtheit zu schließen (umgekehrte Fragestellung zur Wahrscheinlichkeitsrechnung) 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 5
Stochastisches Modell vs. Realität Eine ideale Münze wird 100 [1000] Mal geworfen. Sei X die Anzahl von Zahl. a) Berechnen Sie den Erwartungswert. E(X) = 50 E(X) = 500 a) Berechnen Sie die Wahrscheinlichkeit des Erwartungswertes und beurteilen Sie das Ergebnis.??? Kann damit eine Münze ideal sein??? P(X = 50) 7,96 %??? Das sind nur 8 %??? P(X = 500) 2,52 %??? Hier sogar nur 2,5%??? 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 6
12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 7
Das kann meinetwegen noch von 47 bis 53 ideal sein. P(47 X 53) 51,6 % 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 8
Wenn es von 45 bis 55 geht, ist es auch noch in Ordnung. P(45 X 55) 72,9 % 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 9
Es ist zu 96,5 % wahrscheinlich, dass von 40 bis 60 Mal Zahl fällt. P(40 X 60) 96,5 % 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 10
Stochastisches Modell vs. Realität Eine ideale Münze wird 100 [1000] Mal geworfen. Sei X die Anzahl von Zahl. a) Berechnen Sie den Erwartungswert. b) Berechnen Sie die Wahrscheinlichkeit des Erwartungswertes und beurteilen Sie das Ergebnis.??? Kann damit eine Münze ideal sein?????? Das sind nur 7,96%?????? Hier sogar nur 2,5%??? Lösung sind kumulative Wahrscheinlichkeiten Wenn eine Münze 100 Mal geworfen wird, fällt zwischen 40 und 60 Mal Zahl. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 11
Aussagewert der Standardabweichung Maß für die Streuung der Werte um den Erwartungswert für σ 3 trifft die Standardabweichung keine gute Aussage es sollte gelten: σ > 3 (Laplace-Bedingung) k σ Intervalle: 68,2 % μ 95,5 % Quelle: https://de.wikipedia.org/wiki/standardabweichu ng#/media/file:standard_deviation_diagram.svg 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 12
Hypothesentests das Prinzip Hypothese (grch. υποθεσις = Unterstellung) bestehen aus Signifikanztests (lat. significare = bedeuten, anzeigen) Alternativtests (lat. alter = ande(r/s)) Die Ausgangsvermutung bzw. einleitende Behauptung heißt Nullhypothese. Symbolisch: H 0 Für H 0 gibt es einen Ablehnungsbereich A, ҧ in dem die Stichprobenergebnisse enthalten sind, für die H 0 verworfen/abgelehnt wird. Der restliche Bereich heißt Annahmebereich A. Unter einem Test versteht man eine Entscheidungsvorschrift zur Auswertung von Stichprobenergebnissen, aufgrund deren eine Nullhypothese entweder abgelehnt oder nicht abgelehnt wird. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 13
Beispiele von Hypothesentests Soziologie Frauen verdienen weniger als Männer Frauen und Männer haben unterschiedliche Einkommen Psychologie Singles sind gewaltbereiter der Nationalstolz von Ostdeutschen ist höher Medizin es werden mehr Jungen geboren als Mädchen Babys werden zu 0,15% intersexuell geboren Journalismus die XYZ Partei bekommt mehr Wählerstimmen (einseitiger Signifikanztest) (zweiseitiger Signifikanztest) (einseitiger Signifikanztest) (einseitiger Signifikanztest) (einseitiger Signifikanztest) (zweiseitiger Signifikanztest) (einseitiger Signifikanztest) 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 14
Wer von Ihnen hat in der letzten Woche ein gedrucktes Buch gelesen? 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 15
Bücher lesen Der Beweis dieser These ist nicht möglich, weil wir dafür alle Jugendlichen der Welt für einen festen Zeitpunkt untersuchen müssten. Die JIM-Studie (Jugend Informationen Multimedia) hat 1200 Jugendliche befragt und daraus Aussagen formuliert. Eine Aussage ist: 38 % der Jugendlichen lesen pro Woche ein Buch. These: Durch soziale Medien, E-Books, Netflix etc. ist das Leseverhalten von Printmedien geringer geworden. Frage: Ab wann gilt so eine These? Gesucht ist ein Gütekriterium. Aufgabe: Geben Sie für eine Stichprobe von Jugendlichen an, bis zu welcher Anzahl von lesenden Jugendlichen diese These für Sie glaubwürdig wäre? 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 16
Bücher lesen Der Beweis dieser These ist nicht möglich, weil wir dafür alle Jugendlichen der Welt für einen festen Zeitpunkt untersuchen müssten. Die JIM-Studie (Jugend Informationen Multimedia) hat 1200 Jugendliche befragt und daraus Aussagen formuliert. Eine Aussage ist: 38 % der Jugendlichen lesen pro Woche ein Buch. These: Durch soziale Medien, E-Books, Netflix etc. ist das Leseverhalten von Printmedien geringer geworden. Frage: Ab wann gilt so eine These? Gesucht ist ein Gütekriterium. Aufgabe: Geben Sie für eine Stichprobe von Jugendlichen an, bis zu welcher Anzahl von lesenden Jugendlichen diese These für Sie glaubwürdig wäre? 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 17
Signifikanztests Für Signifikanztests ist die Irrtumswahrscheinlichkeit relevant, die den Ablehnungsbereich bildet. In Abhängigkeit vom Ablehnungsbereich, der einer Binomialverteilung zugrunde liegt hat der Signifikanztest einen Fehler 1. Art (nächste Folie) auf Signifikanzniveau α. Gilt 0,01 α < 0,05 spricht man von einem signifikanten Test (Test mit signifikanten Ergebnis). Gilt 0,001 α < 0,01 spricht man von einem hochsignifikanten Test. Gilt α < 0,001 spricht man von einem höchstsignifikanten Test. Die Zahl 1-α heißt Vertrauensintervall (oder Güte) des Tests und gibt die Größe des Annahmebereiches an. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 18
Fehler bei der Testung von Hypothesen Es können 2 Fehler auftreten: In der Grundgesamtheit gilt: Wegen der Stichprobe wird H 0 ist wahr H 0 ist falsch H 0 abgelehnt Entscheidung falsch (Fehler 1. Art α) Entscheidung richtig H 0 nicht abgelehnt Entscheidung richtig Entscheidung falsch (Fehler 2. Art β) 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 19
Signifikanztests Verwerfung Im Annahmebereich Interessiert mich nicht, weil ich dafür keine Kriterien habe, falls H 0 falsch ist. entweder alles O.K. und ich verwerfe oder α ist so klein, dass ich Rest verwerfen kann 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 20
Linksseitiger Signifikanztest B 115;0,6 0,6 < 0,6 0,05 115 Person hört die Musik des Popstars 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 21
Linksseitiger Signifikanztest B 115;0,6 P X 60 0,0537 > 0,05 P X 59 0,0361 < 0,05 Entscheidung: 49 ҧ A Ablehnungsbereich: ҧ A = 0; 1; ; 59 Annahmebereich: A = {60; 61; ; 115} Die Aussagen der Mitschüler von Lars widerlegen die Behauptung der Jugendzeitschrift auf einem signifikanten Niveau. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 22
Ablehnungsbereich Annahmebereich 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 23
Rechtsseitiger Signifikanztest B 100;0,05 0,05 > 0,05 0,1 100 Anzahl der Ausschussteile 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 24
Rechtsseitiger Signifikanztest B 100;0,05 P X 8 0,128 > 0,1 P X 9 0,0631 < 0,1 Ablehnungsbereich: ҧ A = 9; 10; ; 100 Annahmebereich: A = {0; 1; ; 8} Entscheidung: 7 A Die Aussagen wird aufgrund der Stichprobe nicht verworfen. Er sollte die Maschine trotzdem kaufen. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 25
Annahmebereich Ablehnungsbereich 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 26
Zweiseitiger Signifikanztest Ablehnungsbereich teilt sich in linken und rechten Ablehnungsbereich auf. B 100;0,5 = 0,5 0,5, also p < 0,5 oder p > 0,5 0,05 100 Anzahl der schwarzen Karten 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 27
Zweiseitiger Signifikanztest Ablehnungsbereich teilt sich in linken und rechten Ablehnungsbereich auf. B 100;0,05 P X 40 0,0284 > 0,025 P X 39 0,0176 < 0,025 P X 60 0,0283 > 0,025 P X 61 0,0176 < 0,025 Ablehnungsbereich: Annahmebereich: A = {40; 41; ; 60} ҧ A = 0; 1; ; 39 oder {61; 62; ; 100} Entscheidung: 37 Oliver kann Simones Aussage nicht zustimmen. ҧ A 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 28
Ablehnungsbereich Annahmebereich Ablehnungsbereich 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 29
Fehler bei der Testung von Hypothesen Es können 2 Fehler auftreten: In der Grundgesamtheit gilt: Wegen der Stichprobe wird H 0 ist wahr H 0 ist falsch H 0 abgelehnt Entscheidung falsch (Fehler 1. Art α) Entscheidung richtig H 0 nicht abgelehnt Entscheidung richtig Entscheidung falsch (Fehler 2. Art β) 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 30
Alternativtests Für Alternativtests existiert zu H 0 eine zweite Hypothese Gegenhypothese (mit einer anderen Wahrscheinlichkeit p 1 für die Wahrscheinlichkeitsverteilung) sozusagen eine Alternative, H 1. Wenn H 0 angenommen wird, obwohl H 1 zutrifft (weil H 0 falsch ist), begeht man einen Fehler 2. Art β. Das heißt der Fehler 2. Art wird bestimmt, indem man die Wahrscheinlichkeit des Annahmebereiches von H 0 mit der Wahrscheinlichkeit p 1 berechnet. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 31
LB S. 350 f. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 32
Alternativtests Für Alternativtests existiert eine zweite Hypothese Gegenhypothese (mit einer anderen Wahrscheinlichkeit für die Wahrscheinlichkeitsverteilung) sozusagen eine Alternative, H 1. Wenn man den Ablehnungsbereich dieser Gegenhypothese annimmt, erhält man den Fehler 2. Art β. Damit gibt er die Wahrscheinlichkeit an, mit der H 0 nicht verworfen wird, in Wirklichkeit jedoch H 1 eintritt. α 3,55 % β 32,31 % α β 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 33
Fragen? Vielen Dank für die Aufmerksamkeit und nun eine gute Arbeitsphase. 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 34
Kontakt Universität Leipzig Fakultät für Mathematik und Informatik Mathematisches Institut Abteilung Didaktik M. Ed. Holger Wuschke Augustusplatz 10 04109 Leipzig 0341-97-32192 wuschke@math.uni-leipzig.de 12.02.2018 HOLGER WUSCHKE BEURTEILENDE STATISTIK 35