Kapitel 13: Statistische Signifikanztests

Transkript

1 Kapitel 13: Statistische Signifikanztests Motivation Bisher: Punkt- und Intervallschätzungen für unbekannte Parameter einer Verteilung, dabei keine Verwendung von Vorinformationen Jetzt: Vorinformationen/Vermutungen/Behauptungen über Verteilung bzw. einzelne Parameter formuliere Hypothese H 0 und überprüfe diese anhand einer Stichprobe; verwerfe H 0 (d.h. Entscheidung für eine Alternative H 1 ), wenn Stichprobenergebnis in deutlichem(=signifikantem) Gegensatz zu H 0 steht Überprüfungsverfahren heißt Signifikanztest Dr. Matthias Arnold 349

2 Beispiel 13.1 a) Wartezeiten ZfS (vgl. Bsp. 12.1) Behauptung ZfS: Mittlere Wartezeit maximal 10 Minuten Wartezeiten (in Min.) von 16 zufällig ausgew. Besuchern: 12, 20, 5, 15, 8, 1, 30, 25, 10, 4, 17, 11, 20, 10, 6, 2 Annahme: Wartezeiten normalverteilt mit σ =5bekannt Überprüfe ZfS-Behauptung mit statistischem Signifikanztest Situation: uiv X 1,..., X 16 N(μ, 25) Testproblem: H 0 : μ 10 gegen H 1 : μ>10 Dr. Matthias Arnold 350

3 Beispiel 13.1 (Fortsetzung) b) Salz in der Suppe Ein skeptischer Mensagänger möchte an einem bestimmten Tag die Nullhypothese Mindestens die Hälfte aller Suppen ist versalzen. überprüfen. Er will diese Nullhypothese verwerfen, wenn von fünf zufällig ausgewählten Suppen keine einzige versalzen ist. X 1,..., X 5 uiv Bin (1,p) mit X i = { 1 Suppe i versalzen 0 sonst Testproblem: H 0 : p 0, 5 gegen H 1 : p<0, 5 Testentscheidung: T = 5 i=1 X i =0 Entscheidung für H 1 Dr. Matthias Arnold 351

4 Bemerkung Mögliche Konsequenzen einer Testentscheidung Realität Testentscheidung Lehne H 0 nicht ab Lehne H 0 ab H 0 wahr Fehler 1. Art H 0 falsch Fehler 2. Art No test based upon a theory of probability can by itself provide any valuable evidence of the truth or falsehood of a hypothesis. (Neyman & Pearson (1933), On the problem of the most efficient tests of statistical hypotheses, Phil Trans R Soc Lond A 231, ) Dr. Matthias Arnold 352

5 Beispiel 13.2 Suppe in der Mensa versalzen ja/nein? Testentscheidung wie in Bsp Die Wahrscheinlichkeit, weniger als die Hälfte aller Suppen als versalzen einzuordnen, obwohl mindestens die Hälfte aller Suppen versalzen ist, beträgt: P (Fehler 1. Art) = P (H 0 ablehnen H 0 wahr) = maxp (T =0 p 0, 5) p = P (T =0 p =0, 5), da T Bin (5,p) ( ) 5 = 0, 5 0 0, 5 5 =0, = 0, = 3, 125% Dr. Matthias Arnold 353

6 Beispiel 13.2 (Fortsetzung) Die Wahrscheinlichkeit, mindestens die Hälfte aller Suppen als versalzen einzuordnen, obwohl weniger als die Hälfte aller Suppen versalzen ist, beträgt: P (Fehler 2. Art) = P (H 0 nicht ablehnen H 0 falsch) = P (T >0 p<0, 5) = P (0 <T 5 p<0, 5) = 1 P (T =0 p<0, 5), s. Bem. 2 nach Def. 8.4 ( ) 5 = 1 p 0 (1 p) 5, da T Bin (5,p) 0 = 1 (1 p) 5 Dr. Matthias Arnold 354

7 Beispiel 13.2 (Fortsetzung) Fehler 2. Art für p =0, 49 H 1 P (T >0 p =0, 49) = 1 P (T =0 p =0, 49) = 1 0, 035 = 0, 9655 Fehler 2. Art für weitere p H 1 p H 1 0,49 0,45 0,35 0,25, 0,05 P (Fehler 2. Art) 96,55% 94,97% 88,4% 76,27% 22,62% Dr. Matthias Arnold 355

8 Beispiel 13.2 (Fortsetzung) P(H0 nicht ablehnen) H 1 H p Dr. Matthias Arnold 356

9 Beispiel 13.2 (Fortsetzung) P(H0 ablehnen) H 1 H P(Fehler 1. Art) bei der Testentscheidung des Mensagängers erscheint akzeptabel (< 3, 125%), jedoch ist P(Fehler 2. Art) immens hoch (selbst beim weit von H 0 entfernten p =0, 25 H 1 wird die Nullhypothese immer noch mit 76, 27% Wahrscheinlichkeit beibehalten) p Dr. Matthias Arnold 357

10 Definition 13.1 Betrachte Mengen Θ 0 und Θ 1 mit Θ 0 Θ 1 = und θ Θ=Θ 0 Θ 1. Gegeben sei nun ein Test für das Testproblem Dann heißt die Funktion Gütefunktion des Tests. H 0 : θ Θ 0 gegen H 1 : θ Θ 1. g(θ) =P (H 0 ablehnen θ) Dr. Matthias Arnold 358

11 Bemerkung a) In Beispiel 13.1 a) (Wartezeiten ZfS) entspricht Θ 0 = {Mittlere Wartezeit 10 Min.} = {μ 0 μ 0 10} Θ 1 = {Mittlere Wartezeit> 10 Min.} = {μ 1 μ 1 > 10} In Beispiel 13.1 b) (Salz in der Suppe) entspricht Θ 0 = { 50% der Suppen versalzen} = {p 0 p 0 0, 5} Θ 1 = {< 50% der Suppen versalzen} = {p 1 p 1 < 0, 5} b) Interpretation Gütefunktion Unter H 0 : Gütefunktion = P (Fehler 1. Art) Unter H 1 : Gütefunktion = 1 P (Fehler 2. Art) Dr. Matthias Arnold 359

12 Bemerkung (Fortsetzung) c) Gleichzeitiges Minimieren beider Fehlerwahrscheinlichkeiten unmöglich gebe maximale Wahrscheinlichkeit für Fehler 1. Art vor ( Signifikanzniveau ) und minimiere Wahrscheinlichkeit für Fehler 2. Art die abzusichernde Behauptung muss in die Alternative, da nur Fehlerwahrscheinlichkeit 1. Art kontrolliert wird prinzipiell wären auch andere Herangehensweisen denkbar, vielfach ist die Ungleichbehandlung der beiden Fehlerwahrscheinlichkeiten jedoch auch sinnvoll Dr. Matthias Arnold 360

13 Bemerkung (Fortsetzung) d) Jeder statistische Signifikanztest kann nach folgendem Standardschema durchgeführt werden: 1. Aufstellen des Testproblems, Festlegung des Signifikanzniveaus α 2. Bestimmung einer geeigneten Prüfgröße sowie deren Verteilung unter H 0 3. Festlegung des kritischen Bereichs (Verwerfungs- oder Ablehnbereichs) 4. Berechnung der Realisation der Prüfgröße anhand der gezogenen Stichprobe 5. Ablehnen von H 0, wenn sich die Realisation der Prüfgröße im kritischen Bereich befindet Dr. Matthias Arnold 361

14 Bemerkung (Fortsetzung) e) Kritischer Wert/Bereich anhand f(t ) (Dichte der Prüfgröße unter H 0 ) Dr. Matthias Arnold 362

15 Bemerkung (Fortsetzung) f) Gauß-Test uiv Seien X 1,..., X n N(μ, σ 2 ), σ 2 > 0 bekannt. Zu überprüfen sei eines der folgenden Testprobleme: H 0 gegen H 1 (1) μ μ 0 gegen μ>μ 0 (2) μ = μ 0 gegen μ μ 0 (3) μ μ 0 gegen μ<μ 0 Dr. Matthias Arnold 363

16 Bemerkung (Fortsetzung) f) Gauß-Test (Fortsetzung) Die Nullhypothese wird zum Niveau α abgelehnt, wenn die Prüfgröße T = n X μ 0 σ in folgendem kritischen Bereich liegt: (1) (u 1 α, ) ( ) T H 0 N(0, 1) (2) (, u 1 α 1 α, ) 2 2 (3) (, u 1 α ) Dabei ist u γ das γ-quantil der Standardnormalverteilung. Dr. Matthias Arnold 364

17 Beispiel 13.3 (Wartezeiten ZfS) Situation wie in Bsp a), d.h. X 1,..., X 16 uiv N(μ, 25) X i = Wartezeit des i-ten Studierenden (in Minuten) Testproblem: H 0 : μ 10 gegen H 1 : μ>10 Gauß-Test aus Bem. f) nach Def anwendbar (Problem hier entspricht dem ersten der drei dort präsentierten Tests) verwerfe H 0 wenn T (u 1 α, ) Dr. Matthias Arnold 365

18 Beispiel 13.3 (Fortsetzung) Hier: und T = n X μ 0 σ = 16 12, =1, 8 u 1 α = u 0.95 =1, 645, da α =0, 05 Testentscheidung: T =1, 8 (1, 645; ) =(u 1 α, ) H 0 wird zum 5%-Niveau abgelehnt Dr. Matthias Arnold 366

19 Bemerkung t-test uiv Seien X 1,..., X n N(μ, σ 2 ), σ 2 > 0 unbekannt. Zu überprüfen sei eines der folgenden Testprobleme: H 0 gegen H 1 (1) μ μ 0 gegen μ>μ 0 (2) μ = μ 0 gegen μ μ 0 (3) μ μ 0 gegen μ<μ 0 Dr. Matthias Arnold 367

20 Bemerkung (Fortsetzung) t-test (Fortsetzung) Die Nullhypothese wird zum Niveau α abgelehnt, wenn die Prüfgröße T = n X μ ( ) 0 T H 0 t n 1 S X in folgendem kritischen Bereich liegt: (1) (t n 1,1 α, ) (2) (, t n 1,1 α n 1,1 α, ) 2 2 (3) (, t n 1,1 α ) Dabei ist t n 1,γ das γ-quantil der t-verteilung mit n 1 Freiheitsgraden. Dr. Matthias Arnold 368

21 Beispiel 13.4 a) Wartezeiten ZfS Testproblem wie in Bsp a), jedoch sei Varianz nun unbekannt (vgl. Bsp. 12.3) Ausgangslage: X1,..., X 16 uiv N(μ, σ 2 ) Xi = Wartezeit des i-ten Studierenden (in Minuten) Testproblem: H0 : μ 10 gegen H 1 : μ>10 t-test aus Bem. nach Bsp anwendbar (Problem hier entspricht dem ersten der drei dort präsentierten Tests) verwerfe H 0 wenn T (t n 1,1 α, ) Dr. Matthias Arnold 369

22 Beispiel 13.4 (Fortsetzung) a) Wartezeiten ZfS (Fortsetzung) Hier: und T = n X μ 0 = 12, =1, 076 S X 69, 933 t n 1,1 α = t 15,0.95 =1, 753, da n =16 und α =0, 05 Testentscheidung: T =1, 076 / (1, 753; ) =(t n 1,1 α, ) H 0 wird zum 5%-Niveau nicht abgelehnt Dr. Matthias Arnold 370

23 Beispiel 13.4 (Fortsetzung) b) Kündigungsschutz, vgl. Bsp Umfrage unter 65 mittelständischen Unternehmen 26 Betriebe geben an, bei Lockerung des Kündigungsschutzes zusätzliche Mitarbeiter einzustellen Behauptung Gewerkschaft: Auch nach Gesetzesänderung werden max. 30% der Unternehmen zus. Personal einstellen { 1 i-ter Betrieb möchte zusätzl. Mitarb. einst. Definiere X i = 0 sonst X 1,..., X 65 uiv Bin (1,p) Testproblem: H 0 : p 0, 3 gegen H 1 : p>0, 3 Dr. Matthias Arnold 371

24 Bemerkung Seien X 1,..., X n uiv Bin (1,p). Zuüberprüfen ist eines der folgenden Testprobleme: H 0 gegen H 1 (1) p p 0 gegen p>p 0 (2) p = p 0 gegen p p 0 (3) p p 0 gegen p<p 0 Dr. Matthias Arnold 372

25 Bemerkung (Fortsetzung) Approximative Tests für die drei Testprobleme lehnen H 0 jeweils ab, wenn die Prüfgröße T = ( ) X p 0 n T H 0 N(0, 1) p0 (1 p 0 ) in folgenden kritischen Bereichen liegt: (1) (u 1 α, ) (2) (, u 1 α 1 α, ) 2 2 (3) (, u 1 α ) Die Approximation gilt als akzeptabel, wenn (1) n 30, (2) n X 10, (3) n (1 X) 10 Dr. Matthias Arnold 373

26 Beispiel 13.5 (Kündigungsschutz) Situation wie in Bsp b), d.h. X 1,..., X 65 uiv Bin (1,p) Testproblem: H 0 : p 0, 3 gegen H 1 : p>0, 3 der erste der drei Tests aus der Bem. nach Bsp entspricht diesem Problem (Approximation akzeptabel, vgl. Bsp. 12.5) Hier: T = n ˆp p 0 p0 (1 p 0 ) = 0, 4 0, 3 65 =1, 759 0, 3 0, 7 und u 1 α = u 0.95 =1, 645, da α =0, 05 Testentscheidung: T =1, 759 (1, 645; ) =(u 1 α, ) Also wird H 0 zum 5%-Niveau verworfen Dr. Matthias Arnold 374

27 Bemerkung Zwischenfazit zu statistischen Signifikanztests Fehler 1. Art = H 0 ablehnen, obwohl H 0 richtig Fehler 2. Art = H 0 nicht ablehnen, obwohl H 0 falsch Gauß-Test = Test auf unbekannten Erwartungswert einer Normalverteilung mit bekannter Varianz t-test = Test auf unbekannten Erwartungswert einer Normalverteilung mit unbekannter Varianz Approximativer Test auf p bei Bin (n, p) über Standardnormalverteilung möglich Testentscheidung sagt nichts über die Richtigkeit von H 0 aus, da Fehler 2. Art nicht kontrolliert wird Dr. Matthias Arnold 375

28 Interpretation der Testentscheidung Entscheidung zugunsten H 1 :UnterH 0 fällt die Teststatistik nur mit Wahrscheinlichkeit α in den Ablehnungsbereich; da dies dennoch passiert ist, wird H 0 verworfen; signifikantes Ergebnis Entscheidung zugunsten H 0 : Die Daten sprechen nicht signifikant gegen H 0 ; da die Wahrscheinlichkeit für einen Fehler 2. Art jedoch nicht kontrolliert wird, spricht man nicht von einem signifikanten Resultat Dr. Matthias Arnold 376

29 Formulierung der Hypothesen Fazit: Entscheidung zugunsten H 1 liefert eine stärkere Aussage als eine Entscheidung zugunsten H 0 Deshalb: Soll etwas mit Signifikanz nachgewiesen werden, so muss es als H 1 formuliert werden, z.b. verbesserte Wirksamkeit eines neuen Medikamentes, kostendämpfende Wirkung eines bestimmten Versorgungsprogrammes Soll hingegen nur eine Voraussetzung für die Anwendung eines bestimmten Verfahrens überprüft werden (z.b. Daten sind normalverteilt), so formuliert man die Voraussetzung als H 0 und behält die Annahme bei, solange die Daten nicht signifikant etwas anderes aussagen Dr. Matthias Arnold 377

30 Multiples Testen Beliebter Fehler: Hypothesen aus den Daten ableiten, dazu: Häufigkeit von Lottozahlen Lottozahlen Häufigkeit Zahl Dr. Matthias Arnold 378

31 Testproblem Häufigste Zahl ist die 43 (wurde in der Vergangenheit 646 Mal gezogen) Frage: Taucht die 43 signifikant häufiger auf? Anders formuliert: Tritt die Zahl 43 mit einer Wahrscheinlichkeit p auf, die größer als 6 49 ist? Testproblem: H 0 : p 6 49 gegen H 1 : p> 6 49 Kann mit Binomialverteilung oder über Normalapproximation getestet werden, Ergebnis: H 0 wird zum Niveau α =5% verworfen Fazit: Die Zahl 43 taucht signifikant häufiger auf, also sollte man auf die 43 setzen? Dr. Matthias Arnold 379

32 Wo liegt der Fehler? Die Hypothese (testen auf die 43) wurde erst festgelegt, nachdem bereits bekannt war, dass die 43 besonders häufig auftritt häufiger Fehler bei statistischen Analysen Was passiert, wenn man sich die Daten nicht vorher anschaut? führe den gleichen Test für alle 49 Zahlen durch, Ergebnis: bei α =5%wird H 0 in 3 von 49 Fällen (ca. 6%) verworfen bei α = 10% wird H 0 in 6 von 49 Fällen (ca. 12%) verworfen bei α = 20% wird H 0 in 10 von 49 Fällen (ca. 20%) verworfen Dr. Matthias Arnold 380

33 Fazit Fazit: Es liegt keineswegs ein signifikantes Resultat vor, alle 49 Zahlen treten mit Wahrscheinlichkeit 6 49 auf Deshalb: Die Hypothesen müssen immer feststehen, bevor die Daten angeschaut werden Weitere Beispiele erhöhtes Krebsrisiko für eine bestimmte Krebsart in einer bestimmten Altersgruppe in der Umgebung eines bestimmten Kernkraftwerkes Gesundheitswesen: positive Auswirkung eines Versorgungsprogrammes bezüglich einer bestimmten Kennziffer (Deckungsbeitrag, Anzahl Krankenhaustage, Arzneimittelkosten,...) Dr. Matthias Arnold 381

34 Beispiel 13.6 Ein Marktforschungsinstitut behauptet, dass erwerbstätige Personen eher eine Verlängerung der Ladenöffnungszeiten befürworten als nicht erwerbstätige. Angenommen, eine entsprechende Umfrage ergibt folgendes Meinungsbild: Erwerbstätigkeit Verlängerung der Ladenöffnungszeiten befürwortet nicht befürwortet ja nein Spricht Umfrage für Behauptung des Instituts? mit den bisher eingeführten Signifikanztests nicht beantwortbar! Dr. Matthias Arnold 382

35 Bemerkung a) Motivation für Tests auf Unabhängigkeit Bisher: Konstruktion von Konfidenzintervallen und Signifikanztests, dabei wichtige Voraussetzungen: Unabhängigkeit der Zufallsvariablen X 1,..., X n Unterstellung einer bestimmten Verteilung an X 1,..., X n Jetzt: Test auf Unabhängigkeit zweier Zufallsvariablen (später: Test auf eine bestimmte Verteilung einer Zufallsvariablen) Dr. Matthias Arnold 383

36 Bemerkung (Fortsetzung) b) Allgemeine Kontingenztafel Sei X Zufallsvariable mit k möglichen Ausprägungen, Y Zufallsvariable mit l möglichen Ausprägungen, X und Y an ( einem Merkmalsträger gemessen. Betrachte Stichprobe X1 ) ( Y 1,..., Xn ) Y n ; weiter sei Hij = Anzahl an Beobachtungen mit X = i und Y = j ; Kontingenztafel=Tabelle der Form X Y 1 2 l 1 H 11 H 12 H 1l H 1 2 H 21 H 22 H 2l H k H k1 H k2 H kl H k H 1 H 2 H l n Dr. Matthias Arnold 384

37 Bemerkung (Fortsetzung) c) χ 2 -Unabhängigkeitstest Situation wie in b) (X, Y Zufallsvariablen mit k (X) bzw. l (Y ) möglichen Ausprägungen, an den gleichen Merkmalsträgern gemessen; Stichprobe der Größe n) H 0 : H 1 : X und Y stochastisch unabhängig gegen X und Y abhängig Weiter sei H ij = H i H j n, i =1,..., k, j =1,..., l Dr. Matthias Arnold 385

38 bei Unabhängigkeit erwartete Häufigkeiten H i /n ist der Anteil der X-Beobachtungen in Klasse i H j /n ist der Anteil der Y -Beobachtungen in Klasse j erwarteter Anteil für die Schnittmenge, sofern Unabhängigkeit vorliegt (unter H 0 ): H i n H j n = H i H j n 2 erwartete Anzahl bei einer Stichprobe vom Umfang n: n Hi H j n 2 = H i H j n = H ij Testidee: vergleiche diese bei Unabhängigkeit zu erwartenden Häufigkeiten mit den tatsächlich beobachteten Dr. Matthias Arnold 386

39 Bemerkung (Fortsetzung) c) χ 2 -Unabhängigkeitstest (Fortsetzung) Prüfgr. V = k l i=1 j=1 ( V H 0 χ 2 (k 1)(l 1) (H ij H ij ) 2 H ij unter H 0 approx. χ 2 verteilt ) ; verwerfe H 0 wenn V (χ 2 (k 1)(l 1),1 α, ) (χ 2 n,γ = γ-quantil der χ 2 -Verteilung mit n Freiheitsgraden) Approx. χ 2 Verteilung von V unter H 0 akzeptabel, falls H ij 5 für alle i =1,..., k, j =1,..., l Dr. Matthias Arnold 387

40 Beispiel 13.7 (Ladenöffnungszeiten, vgl. Bsp. 13.6) X = Erwerbstätigkeit (1 = ja, 2 = nein), Y =Verlängerung der Ladenöffnungszeiten (1 = befürwortet, 2 = nicht befürwortet) X Y H 0 : Erwerbstätige Personen befürworten verlängerte Ladenöffnungszeiten im Vergleich zu nicht erwerbstätigen Personen nicht anders X und Y stochastisch unabhängig H 1 : X & Y abhängig (=Behauptung Marktforschungsinstitut) Dr. Matthias Arnold 388

41 Beispiel 13.7 (Fortsetzung) Berechnung der unter H 0 erwarteten Häufigkeiten: H 11 = = 180 H12 = = 120 H 21 = = 120 H22 = =80 V = ( ) ( )2 120 α =5% χ 2 (k 1)(l 1),1 α = χ2 1;0,95 + (100 80)2 80 =3, 841 =13, 889 Insgesamt: V =13, 889 (3, 841; ) =(χ 2 (k 1)(l 1),1 α, ) H 0 wird zum 5%- Niveau verworfen Dr. Matthias Arnold 389

42 Bemerkung a) Gilt in der Situation von Bem. c) nach Bsp k = l =2,so vereinfacht sich die Prüfgröße des χ 2 -Unabhängigkeitstests zu V = n (H 11 H 22 H 12 H 21 ) 2 H 1 H 2 H 1 H 2 (in Bsp (Ladenöffnungszeiten) gilt k = l =2 V = 500 ( ) = =13, 889) b) Bei stetigen Zufallsvariablen X, Y ist χ 2 -Unabhängigkeitstest nach geeigneter Klassierung ebenfalls anwendbar. H ij entspricht nun der Anzahl Beobachtungen, für die X in Klasse i und gleichzeitig Y in Klasse j fällt. Dr. Matthias Arnold 390

43 Beispiel 13.8 Der Personalchef eines großen Unternehmens vermutet, dass die Wahrscheinlichkeit für eine Krankmeldung im Unternehmen montags bis donnerstags gleich und freitags doppelt so groß ist wie an einem der übrigen Wochentage. Innerhalb eines Jahres registriert er folgende Häufigkeiten von Krankmeldungen: Wochentag Mo Di Mi Do Fr Anzahl der Krankmeldungen Stützen diese Beobachtungen seine Vermutung? mit den bisherigen eingeführten Tests auf Lage bzw. Unabhängigkeit nicht beantwortbar! Dr. Matthias Arnold 391

44 Bemerkung a) Motivation für Tests auf Verteilung (vgl. Bem. a) nach Bsp. 13.6) Bisher: Zunächst Konstruktion von Konfidenzintervallen und Signifikanztests, dabei wichtige Voraussetzung: Unabhängigkeit der Zufallsvariablen X 1,..., X n χ 2 Test auf Unabhängigkeit zweier Zufallsvariablen Ebenfalls jedoch notwendig bei Konstruktion von Konfidenzintervallen und Signifikanztests: Unterstellung einer bestimmten Verteilung an X1,..., X n Jetzt: Test auf eine bestimmte Verteilung einer Zufallsvariablen Dr. Matthias Arnold 392

45 Bemerkung (Fortsetzung) b) χ 2 Anpassungstest Seien X 1,..., X n uiv Zufallsvariablen mit k möglichen Ausprägungen, p 1,..., p k [0, 1] mit k i=1 p i =1fest vorgegeben. Testproblem: H 0 : P (X j = i) =p i für alle i {1,...,k} gegen H 1 : P (X j = i) p i für mind. ein i {1,...,k} Weiter sei H i die Anzahl Beobachtungen j mit X j = i (i {1,..., k}) Dr. Matthias Arnold 393

46 Bemerkung (Fortsetzung) b) χ 2 -Anpassungstest (Fortsetzung) k (H i np i ) 2 Prüfgr. V = unter H 0 approx. χ 2 k 1 np verteilt i=1 i ( ) V H 0 χ 2 k 1 ; verwerfe H 0,wennV (χ 2 k 1,1 α, ) (χ 2 n,γ = γ-quantil der χ 2 -Verteilung mit n Freiheitsgraden) Approx. χ 2 Verteilung von V unter H 0 akzeptabel, falls (1) np i 1 für alle i =1,...,k (2) np i 5 für mindestens 80% aller Klassen i Dr. Matthias Arnold 394

47 Beispiel 13.9 (Krankmeldungen, vgl. Bsp. 13.8) Aufstellung des Testproblems: Vermutung Personalchef: P(Krankmeldung) montags bis donnerstags gleich und freitags doppelt so groß ist wie an einem der übrigen Wochentage Definiere p i = P(Wochentag i krank krank während der Woche), i =1,..., 5, 1=Mo, 2=Di usw. D.h. Vermutung Personalchef p 1 = p 2 = p 3 = p 4 & p 5 =2p 1 }{{} Weiter ist 1= 5 p i = p 1 + p 2 + p 3 + p 4 + p 5 =6p1 p 1 =1/6 i=1 Dr. Matthias Arnold 395

48 Beispiel 13.9 (Fortsetzung) Testproblem: H 0 : p 1 = p 2 = p 3 = p 4 = 1 6 und p 5 = 1 3 gegen H 1 : p j 1 6 für ein j {1,..., 4} oder p Prüfgröße: V = ( ) ( ) = 12 = ( ) (70 50) ( ) (40 50) Dr. Matthias Arnold 396

49 Beispiel 13.9 (Fortsetzung) Niveau 5%, d.h. χ 2 k 1,1 α = χ2 4;0,95 =9, 49 Also Testentscheidung V =12 (9, 49; ) =(χ 2 k 1,1 α, ) Somit kann zum 5%-Niveau gezeigt werden, dass der Personalchef unrecht hat (H 0 wird verworfen) Dr. Matthias Arnold 397

50 Statistische Tests: Hypothesenpaar Formulierung der Hypothesen kann Ergebnis beeinflussen: Im Beispiel hat der Personalchef nur deshalb Unrecht, weil die Krankmeldungen von montags bis donnerstags nicht gleichverteilt sind; freitags liegt tatsächlich die doppelte Anzahl an Krankmeldungen vor Wichtig: Hypothese darf nicht aus Daten abgeleitet werden (vgl. Lottozahlen) Weiterer wichtiger Punkt Testentscheidung hängt auch von der Stichprobengröße ab Dr. Matthias Arnold 398

51 Stichprobengröße und Signifikanz Wochentag Mo Di Mi Do Fr Anzahl der Krankmeldungen Teststatistik: V =12, kritischer Wert: χ 2 4;0,95 H 0 wird verworfen =9, 49 Anderer Datensatz, identische Fragestellung Wochentag Mo Di Mi Do Fr Anzahl der Krankmeldungen Teststatistik: V =1.2, kritischer Wert: χ 2 4;0,95 H 0 wird nicht verworfen =9, 49 Dr. Matthias Arnold 399

52 Fazit Trotz identischer relativer Häufigkeiten wird einmal verworfen, ein anderes Mal nicht verworfen Grund: statistische Signifikanz umso leichter nachzuweisen, je größer die Stichprobe ist Auswirkung: In sehr großen Datensätzen werden auch minimale Abweichungen von der Nullhypothese als signifikant erkannt Deshalb immer zusätzlich beachten: Ist die Abweichung von der Nullhypothese auch ökonomisch bedeutsam? Dr. Matthias Arnold 400

53 Bemerkung a) Für stetige Zufallsvariablen X 1,..., X n ist χ 2 -Anpassungstest nach geeigneter Klassierung ebenfalls anwendbar. H i entspricht nun der Anzahl an Beobachtungen, für die X in Klasse i fällt. b) Zweites Fazit zu statistischen Signifikanztests (vgl. auch Bem. nach Bsp. 13.5) χ 2 -Unabhängigkeitstest zur Überprüfung der Unabhängigkeit zweier Zufallsvariablen χ 2 -Anpassungstest als Test auf eine bestimmte Verteilung einer Zufallsvariablen Dr. Matthias Arnold 401

54 Kapitel 14: Regressionsanalyse Motivation Streudiagramm zweier metrisch skalierter Merkmale X und Y Dr. Matthias Arnold 402

55 Ziel Zusammenhang zwischen X und Y erfassen durch eine Gerade der Form y i = a + b x i (i =1,...,n) Vorteile einer linearen Modellierung: einfacher und leicht berechenbarer Zusammenhang ausführlich erforschte Theorie linearer Zusammenhang oftmals guter Ersatz für kompliziertere Zusammenhänge Dr. Matthias Arnold 403

56 Fragestellungen Wie bzw. nach welchen Kriterien soll die Gerade durch das Streudiagramm der Beobachtungen gelegt werden? Mit anderen Worten: Wie sollen a und b gewählt werden? Wie gut beschreibt die so ermittelte Gerade den Zusammenhang zwischen X und Y? Dr. Matthias Arnold 404

57 Zusammenhang via Augenmaß Dr. Matthias Arnold 405

58 Zusammenhang via Extrempunkte Dr. Matthias Arnold 406

59 Zusammenhang via absolute Abweichungen Dr. Matthias Arnold 407

60 Zusammenhang via quadrierte Abweichungen Dr. Matthias Arnold 408

61 Definition 14.1 Das Modell y = a + b x + u, heißt einfaches lineares Regressionsmodell. Die Gerade y =â + ˆb x durch die Punktewolke {(x i,y i )} n i=1, die die Summe der quadrierten (vertikalen) Abstände der Beobachtungen von der Geraden minimiert, heißt KQ-Gerade. Dr. Matthias Arnold 409

62 Lösung des Minimierungsproblems Die Koeffizienten der KQ-Geraden sind gegeben durch: ˆb = s xy s 2 x = n (x i x)(y i ȳ) i=1 â = ȳ ˆb x. und n (x i x) 2 i=1 Dr. Matthias Arnold 410

63 Beispiel 14.1 Monatliche Konsumausgaben von Haushalten in Abhängigkeit vom verfügbaren Einkommen Dr. Matthias Arnold 411

64 Beispiel 14.2 Monatliche Konsumausgaben von Haushalten in Abhängigkeit vom verfügbaren Einkommen (Fortsetzung) Die Koeffizienten der KQ-Geraden lauten (hier nur Ergebnis ohne Angabe der einzelnen Datenpunkte): Die KQ-Gerade lautet damit: s xy ˆb = s 2 = 6877 =0, 52 und x â = , = 751. ŷ i = , 52 x i. Interpretation: Bei einem Anstieg des verfügbaren Einkommens um einen Euro erhöhen sich die Konsumausgaben des Haushaltes um 52 Cent. Dr. Matthias Arnold 412

65 Definition 14.2 Die Größe R 2 = s2 ŷ s 2 y = n (ŷ i ȳ) 2 i=1 n (y i ȳ) 2 i=1 heißt Bestimmtheitsmaß. Interpretation Das Bestimmtheitsmaß R 2 ist der Anteil an Variation der Y -Werte, welcher sich durch die Regressionsbeziehung erklären lässt. Dr. Matthias Arnold 413

66 Beispiel 14.3 Bestimmtheitsmaß der Regression der Konsumausgaben auf das verfügbare Einkommen x i y i ŷ i = , 52 x i (ŷ i ȳ) Dr. Matthias Arnold 414

67 Beispiel 14.4 Bestimmtheitsmaß der Regression der Konsumausgaben auf das verfügbare Einkommen (Fortsetzung) hier ergibt sich: außerdem: also: s 2 ŷ = 1 8 s 2 y = 3748 R 2 = = 3555 =0, 95 Dr. Matthias Arnold 415

68 Eigenschaften von R 2 Für das Bestimmtheitsmaß gilt: a) 0 R 2 1. b) Je näher R 2 bei 1 liegt, desto besser erklärt die KQ-Gerade den linearen Zusammenhang zwischen X und Y. c) Je näher R 2 bei 0 liegt, desto kleiner ist der Erklärungsgehalt von X auf die Variabilität von Y (R 2 =0 kein Erklärungsgehalt). Dr. Matthias Arnold 416

69 Fazit zur elementaren Regressionsrechnung modelliert linearen Zusammenhang zwischen zwei metrisch skalierten Merkmalen Ursache und Wirkung dabei bekannt modellierter Zusammenhang auf gegebenen Datenbereich beschränkt naheliegende Erweiterung: mehr als eine Einflussgröße Dr. Matthias Arnold 417

70 Multiples Regressionsmodell häufig: Zielgröße y hängt von mehr als einer Einflussgröße x ab dann erforderlich: Erweiterung des einfachen Regressionsmodells Modellgleichung y = a + b 1 x b k x k + u Dr. Matthias Arnold 418

71 Modellgleichung Beispiel: Gesundheitsvorsorge y = a + b 1 x b k x k + u typische Einflussgrößen: Teilnahme an Versorgungsprogramm ja/nein, Alter, Geschlecht,... wichtig: alle relevanten Einflussgrößen müssen im Modell enthalten sein, auch dann, wenn sie nicht frei wählbar sind (z.b. Alter, Geschlecht) falls relevante Einflussgrößen fehlen: falsche Ergebnisse Dr. Matthias Arnold 419

72 typische Fragestellungen Frage: Haben Teilnehmer an einem Versorgungsprogramm einen anderen Deckungsbeitrag als Nichtteilnehmer? Regression des Deckungsbeitrags auf die Einflussgröße Teilnahme ja/nein Ergebnis kann verzerrt sein, wenn wichtige Einflussgrößen fehlen Wenn die Teilnehmer im Schnitt älter sind als die Nichtteilnehmer, kann das die Ergebnisse verfälschen Ausweg: Alter mit ins Modell aufnehmen Dr. Matthias Arnold 420

73 Zusammenfassung: Kapitel 11, Punktschätzung Teil B: Verteilung der Zufallsvariablen bekannt Erwartungswert, Varianz, Kovarianz, Korrelation ausrechnen Wahrscheinlichkeiten ausrechnen realistischerer Fall: Verteilung unbekannt Schätzen der Verteilung ohne jegliche Annahmen: anspruchsvoll bei bekanntem Verteilungstyp (z.b. Binomialverteilung, Normalverteilung): nur noch einzelne Parameter zu schätzen Dr. Matthias Arnold 421

74 Zusammenfassung: Kapitel 11, Punktschätzung Schätzen von Parametern Schätzfunktion (Schätzer) und Schätzwert Erwartungstreue und Verzerrung Effizienz Dr. Matthias Arnold 422

75 Zusammenfassung: Kapitel 12, Intervallschätzung Irrtumswahrscheinlichkeit α = P (θ / [V u,v o ]) Konfidenzniveau (Vertrauenswahrscheinlichkeit) 1 α = P (θ [V u,v o ]) Interpretation θ ist ein fester Wert, wenn auch unbekannt zufällig sind die Intervallgrenzen V u und V o Dr. Matthias Arnold 423

76 Zusammenfassung: Kapitel 12, Intervallschätzung normalverteilte Grundgesamtheit, Varianz bekannt [ KI 1 α (μ) = X u 1 α 2 σ n, X + u 1 α 2 ] σ n normalverteilte Grundgesamtheit, Varianz unbekannt χ 2 -Verteilung t-verteilung [ KI 1 α (μ) = X t n 1,1 α 2 S X n, X + t n 1,1 α 2 ] S X n Dr. Matthias Arnold 424

77 Zusammenfassung: Kapitel 12, Intervallschätzung Approximatives Konfidenzintervall für p KI 1 α (p) = [ ˆp u 1 α 2 ˆσ n, ˆp + u 1 α 2 ] ˆσ n mit ˆp = X, ˆσ = ˆp (1 ˆp) Breite eines Konfidenzintervalles Abhängigkeit von α, σ 2 und n erforderlicher Stichprobenumfang quadratischer Zusammenhang Dr. Matthias Arnold 425

78 Zusammenfassung: Kapitel 13, Statistische Signifikanztests Testproblem Nullhypothese H 0 und Alternative H 1 Testentscheidung Fehler 1. Art und Fehler 2. Art Gütefunktion statistischer Test Prüfgröße Verteilung unter H 0 Ablehnungsbereich (Verwerfungsbereich) und Annahmebereich Dr. Matthias Arnold 426

79 Zusammenfassung: Kapitel 13, Statistische Signifikanztests Gauß-Test und t-test Approximativer Test für p Interpretation der Testentscheidung Unterschiedliche Aussagekraft bei Ablehnung bzw. Annahme der Nullhypothese Aufstellen der Hypothesen Hypothesen nicht aus Daten ableiten Dr. Matthias Arnold 427

80 Zusammenfassung: Kapitel 13, Statistische Signifikanztests χ 2 -Unahängigkeitstest Kontingenztafel Vergleich erwarteter Häufigkeiten mit beobachteten Häufigkeiten χ 2 -Anpassungstest Signifikanz und Stichprobengröße statistische Signifikanz und ökonomische Signifikanz Dr. Matthias Arnold 428

81 Zusammenfassung: Kapitel 14, Regressionsanalyse zwei Merkmale X und Y linearer Zusammenhang, Ausgleichsgerade einfaches lineares Regressionsmodell KQ-Gerade Bestimmtheitsmaß Interpretation der Größen Multiples Regressionsmodell mehr als eine Einflussgröße Dr. Matthias Arnold 429