Kapitel 13: Statistische Signifikanztests
|
|
- Gesche Gärtner
- vor 7 Jahren
- Abrufe
Transkript
1 Kapitel 13: Statistische Signifikanztests Motivation Bisher: Punkt- und Intervallschätzungen für unbekannte Parameter einer Verteilung, dabei keine Verwendung von Vorinformationen Jetzt: Vorinformationen/Vermutungen/Behauptungen über Verteilung bzw. einzelne Parameter formuliere Hypothese H 0 und überprüfe diese anhand einer Stichprobe; verwerfe H 0 (d.h. Entscheidung für eine Alternative H 1 ), wenn Stichprobenergebnis in deutlichem(=signifikantem) Gegensatz zu H 0 steht Überprüfungsverfahren heißt Signifikanztest Dr. Matthias Arnold 349
2 Beispiel 13.1 a) Wartezeiten ZfS (vgl. Bsp. 12.1) Behauptung ZfS: Mittlere Wartezeit maximal 10 Minuten Wartezeiten (in Min.) von 16 zufällig ausgew. Besuchern: 12, 20, 5, 15, 8, 1, 30, 25, 10, 4, 17, 11, 20, 10, 6, 2 Annahme: Wartezeiten normalverteilt mit σ =5bekannt Überprüfe ZfS-Behauptung mit statistischem Signifikanztest Situation: uiv X 1,..., X 16 N(μ, 25) Testproblem: H 0 : μ 10 gegen H 1 : μ>10 Dr. Matthias Arnold 350
3 Beispiel 13.1 (Fortsetzung) b) Salz in der Suppe Ein skeptischer Mensagänger möchte an einem bestimmten Tag die Nullhypothese Mindestens die Hälfte aller Suppen ist versalzen. überprüfen. Er will diese Nullhypothese verwerfen, wenn von fünf zufällig ausgewählten Suppen keine einzige versalzen ist. X 1,..., X 5 uiv Bin (1,p) mit X i = { 1 Suppe i versalzen 0 sonst Testproblem: H 0 : p 0, 5 gegen H 1 : p<0, 5 Testentscheidung: T = 5 i=1 X i =0 Entscheidung für H 1 Dr. Matthias Arnold 351
4 Bemerkung Mögliche Konsequenzen einer Testentscheidung Realität Testentscheidung Lehne H 0 nicht ab Lehne H 0 ab H 0 wahr Fehler 1. Art H 0 falsch Fehler 2. Art No test based upon a theory of probability can by itself provide any valuable evidence of the truth or falsehood of a hypothesis. (Neyman & Pearson (1933), On the problem of the most efficient tests of statistical hypotheses, Phil Trans R Soc Lond A 231, ) Dr. Matthias Arnold 352
5 Beispiel 13.2 Suppe in der Mensa versalzen ja/nein? Testentscheidung wie in Bsp Die Wahrscheinlichkeit, weniger als die Hälfte aller Suppen als versalzen einzuordnen, obwohl mindestens die Hälfte aller Suppen versalzen ist, beträgt: P (Fehler 1. Art) = P (H 0 ablehnen H 0 wahr) = maxp (T =0 p 0, 5) p = P (T =0 p =0, 5), da T Bin (5,p) ( ) 5 = 0, 5 0 0, 5 5 =0, = 0, = 3, 125% Dr. Matthias Arnold 353
6 Beispiel 13.2 (Fortsetzung) Die Wahrscheinlichkeit, mindestens die Hälfte aller Suppen als versalzen einzuordnen, obwohl weniger als die Hälfte aller Suppen versalzen ist, beträgt: P (Fehler 2. Art) = P (H 0 nicht ablehnen H 0 falsch) = P (T >0 p<0, 5) = P (0 <T 5 p<0, 5) = 1 P (T =0 p<0, 5), s. Bem. 2 nach Def. 8.4 ( ) 5 = 1 p 0 (1 p) 5, da T Bin (5,p) 0 = 1 (1 p) 5 Dr. Matthias Arnold 354
7 Beispiel 13.2 (Fortsetzung) Fehler 2. Art für p =0, 49 H 1 P (T >0 p =0, 49) = 1 P (T =0 p =0, 49) = 1 0, 035 = 0, 9655 Fehler 2. Art für weitere p H 1 p H 1 0,49 0,45 0,35 0,25, 0,05 P (Fehler 2. Art) 96,55% 94,97% 88,4% 76,27% 22,62% Dr. Matthias Arnold 355
8 Beispiel 13.2 (Fortsetzung) P(H0 nicht ablehnen) H 1 H p Dr. Matthias Arnold 356
9 Beispiel 13.2 (Fortsetzung) P(H0 ablehnen) H 1 H P(Fehler 1. Art) bei der Testentscheidung des Mensagängers erscheint akzeptabel (< 3, 125%), jedoch ist P(Fehler 2. Art) immens hoch (selbst beim weit von H 0 entfernten p =0, 25 H 1 wird die Nullhypothese immer noch mit 76, 27% Wahrscheinlichkeit beibehalten) p Dr. Matthias Arnold 357
10 Definition 13.1 Betrachte Mengen Θ 0 und Θ 1 mit Θ 0 Θ 1 = und θ Θ=Θ 0 Θ 1. Gegeben sei nun ein Test für das Testproblem Dann heißt die Funktion Gütefunktion des Tests. H 0 : θ Θ 0 gegen H 1 : θ Θ 1. g(θ) =P (H 0 ablehnen θ) Dr. Matthias Arnold 358
11 Bemerkung a) In Beispiel 13.1 a) (Wartezeiten ZfS) entspricht Θ 0 = {Mittlere Wartezeit 10 Min.} = {μ 0 μ 0 10} Θ 1 = {Mittlere Wartezeit> 10 Min.} = {μ 1 μ 1 > 10} In Beispiel 13.1 b) (Salz in der Suppe) entspricht Θ 0 = { 50% der Suppen versalzen} = {p 0 p 0 0, 5} Θ 1 = {< 50% der Suppen versalzen} = {p 1 p 1 < 0, 5} b) Interpretation Gütefunktion Unter H 0 : Gütefunktion = P (Fehler 1. Art) Unter H 1 : Gütefunktion = 1 P (Fehler 2. Art) Dr. Matthias Arnold 359
12 Bemerkung (Fortsetzung) c) Gleichzeitiges Minimieren beider Fehlerwahrscheinlichkeiten unmöglich gebe maximale Wahrscheinlichkeit für Fehler 1. Art vor ( Signifikanzniveau ) und minimiere Wahrscheinlichkeit für Fehler 2. Art die abzusichernde Behauptung muss in die Alternative, da nur Fehlerwahrscheinlichkeit 1. Art kontrolliert wird prinzipiell wären auch andere Herangehensweisen denkbar, vielfach ist die Ungleichbehandlung der beiden Fehlerwahrscheinlichkeiten jedoch auch sinnvoll Dr. Matthias Arnold 360
13 Bemerkung (Fortsetzung) d) Jeder statistische Signifikanztest kann nach folgendem Standardschema durchgeführt werden: 1. Aufstellen des Testproblems, Festlegung des Signifikanzniveaus α 2. Bestimmung einer geeigneten Prüfgröße sowie deren Verteilung unter H 0 3. Festlegung des kritischen Bereichs (Verwerfungs- oder Ablehnbereichs) 4. Berechnung der Realisation der Prüfgröße anhand der gezogenen Stichprobe 5. Ablehnen von H 0, wenn sich die Realisation der Prüfgröße im kritischen Bereich befindet Dr. Matthias Arnold 361
14 Bemerkung (Fortsetzung) e) Kritischer Wert/Bereich anhand f(t ) (Dichte der Prüfgröße unter H 0 ) Dr. Matthias Arnold 362
15 Bemerkung (Fortsetzung) f) Gauß-Test uiv Seien X 1,..., X n N(μ, σ 2 ), σ 2 > 0 bekannt. Zu überprüfen sei eines der folgenden Testprobleme: H 0 gegen H 1 (1) μ μ 0 gegen μ>μ 0 (2) μ = μ 0 gegen μ μ 0 (3) μ μ 0 gegen μ<μ 0 Dr. Matthias Arnold 363
16 Bemerkung (Fortsetzung) f) Gauß-Test (Fortsetzung) Die Nullhypothese wird zum Niveau α abgelehnt, wenn die Prüfgröße T = n X μ 0 σ in folgendem kritischen Bereich liegt: (1) (u 1 α, ) ( ) T H 0 N(0, 1) (2) (, u 1 α 1 α, ) 2 2 (3) (, u 1 α ) Dabei ist u γ das γ-quantil der Standardnormalverteilung. Dr. Matthias Arnold 364
17 Beispiel 13.3 (Wartezeiten ZfS) Situation wie in Bsp a), d.h. X 1,..., X 16 uiv N(μ, 25) X i = Wartezeit des i-ten Studierenden (in Minuten) Testproblem: H 0 : μ 10 gegen H 1 : μ>10 Gauß-Test aus Bem. f) nach Def anwendbar (Problem hier entspricht dem ersten der drei dort präsentierten Tests) verwerfe H 0 wenn T (u 1 α, ) Dr. Matthias Arnold 365
18 Beispiel 13.3 (Fortsetzung) Hier: und T = n X μ 0 σ = 16 12, =1, 8 u 1 α = u 0.95 =1, 645, da α =0, 05 Testentscheidung: T =1, 8 (1, 645; ) =(u 1 α, ) H 0 wird zum 5%-Niveau abgelehnt Dr. Matthias Arnold 366
19 Bemerkung t-test uiv Seien X 1,..., X n N(μ, σ 2 ), σ 2 > 0 unbekannt. Zu überprüfen sei eines der folgenden Testprobleme: H 0 gegen H 1 (1) μ μ 0 gegen μ>μ 0 (2) μ = μ 0 gegen μ μ 0 (3) μ μ 0 gegen μ<μ 0 Dr. Matthias Arnold 367
20 Bemerkung (Fortsetzung) t-test (Fortsetzung) Die Nullhypothese wird zum Niveau α abgelehnt, wenn die Prüfgröße T = n X μ ( ) 0 T H 0 t n 1 S X in folgendem kritischen Bereich liegt: (1) (t n 1,1 α, ) (2) (, t n 1,1 α n 1,1 α, ) 2 2 (3) (, t n 1,1 α ) Dabei ist t n 1,γ das γ-quantil der t-verteilung mit n 1 Freiheitsgraden. Dr. Matthias Arnold 368
21 Beispiel 13.4 a) Wartezeiten ZfS Testproblem wie in Bsp a), jedoch sei Varianz nun unbekannt (vgl. Bsp. 12.3) Ausgangslage: X1,..., X 16 uiv N(μ, σ 2 ) Xi = Wartezeit des i-ten Studierenden (in Minuten) Testproblem: H0 : μ 10 gegen H 1 : μ>10 t-test aus Bem. nach Bsp anwendbar (Problem hier entspricht dem ersten der drei dort präsentierten Tests) verwerfe H 0 wenn T (t n 1,1 α, ) Dr. Matthias Arnold 369
22 Beispiel 13.4 (Fortsetzung) a) Wartezeiten ZfS (Fortsetzung) Hier: und T = n X μ 0 = 12, =1, 076 S X 69, 933 t n 1,1 α = t 15,0.95 =1, 753, da n =16 und α =0, 05 Testentscheidung: T =1, 076 / (1, 753; ) =(t n 1,1 α, ) H 0 wird zum 5%-Niveau nicht abgelehnt Dr. Matthias Arnold 370
23 Beispiel 13.4 (Fortsetzung) b) Kündigungsschutz, vgl. Bsp Umfrage unter 65 mittelständischen Unternehmen 26 Betriebe geben an, bei Lockerung des Kündigungsschutzes zusätzliche Mitarbeiter einzustellen Behauptung Gewerkschaft: Auch nach Gesetzesänderung werden max. 30% der Unternehmen zus. Personal einstellen { 1 i-ter Betrieb möchte zusätzl. Mitarb. einst. Definiere X i = 0 sonst X 1,..., X 65 uiv Bin (1,p) Testproblem: H 0 : p 0, 3 gegen H 1 : p>0, 3 Dr. Matthias Arnold 371
24 Bemerkung Seien X 1,..., X n uiv Bin (1,p). Zuüberprüfen ist eines der folgenden Testprobleme: H 0 gegen H 1 (1) p p 0 gegen p>p 0 (2) p = p 0 gegen p p 0 (3) p p 0 gegen p<p 0 Dr. Matthias Arnold 372
25 Bemerkung (Fortsetzung) Approximative Tests für die drei Testprobleme lehnen H 0 jeweils ab, wenn die Prüfgröße T = ( ) X p 0 n T H 0 N(0, 1) p0 (1 p 0 ) in folgenden kritischen Bereichen liegt: (1) (u 1 α, ) (2) (, u 1 α 1 α, ) 2 2 (3) (, u 1 α ) Die Approximation gilt als akzeptabel, wenn (1) n 30, (2) n X 10, (3) n (1 X) 10 Dr. Matthias Arnold 373
26 Beispiel 13.5 (Kündigungsschutz) Situation wie in Bsp b), d.h. X 1,..., X 65 uiv Bin (1,p) Testproblem: H 0 : p 0, 3 gegen H 1 : p>0, 3 der erste der drei Tests aus der Bem. nach Bsp entspricht diesem Problem (Approximation akzeptabel, vgl. Bsp. 12.5) Hier: T = n ˆp p 0 p0 (1 p 0 ) = 0, 4 0, 3 65 =1, 759 0, 3 0, 7 und u 1 α = u 0.95 =1, 645, da α =0, 05 Testentscheidung: T =1, 759 (1, 645; ) =(u 1 α, ) Also wird H 0 zum 5%-Niveau verworfen Dr. Matthias Arnold 374
27 Bemerkung Zwischenfazit zu statistischen Signifikanztests Fehler 1. Art = H 0 ablehnen, obwohl H 0 richtig Fehler 2. Art = H 0 nicht ablehnen, obwohl H 0 falsch Gauß-Test = Test auf unbekannten Erwartungswert einer Normalverteilung mit bekannter Varianz t-test = Test auf unbekannten Erwartungswert einer Normalverteilung mit unbekannter Varianz Approximativer Test auf p bei Bin (n, p) über Standardnormalverteilung möglich Testentscheidung sagt nichts über die Richtigkeit von H 0 aus, da Fehler 2. Art nicht kontrolliert wird Dr. Matthias Arnold 375
28 Interpretation der Testentscheidung Entscheidung zugunsten H 1 :UnterH 0 fällt die Teststatistik nur mit Wahrscheinlichkeit α in den Ablehnungsbereich; da dies dennoch passiert ist, wird H 0 verworfen; signifikantes Ergebnis Entscheidung zugunsten H 0 : Die Daten sprechen nicht signifikant gegen H 0 ; da die Wahrscheinlichkeit für einen Fehler 2. Art jedoch nicht kontrolliert wird, spricht man nicht von einem signifikanten Resultat Dr. Matthias Arnold 376
29 Formulierung der Hypothesen Fazit: Entscheidung zugunsten H 1 liefert eine stärkere Aussage als eine Entscheidung zugunsten H 0 Deshalb: Soll etwas mit Signifikanz nachgewiesen werden, so muss es als H 1 formuliert werden, z.b. verbesserte Wirksamkeit eines neuen Medikamentes, kostendämpfende Wirkung eines bestimmten Versorgungsprogrammes Soll hingegen nur eine Voraussetzung für die Anwendung eines bestimmten Verfahrens überprüft werden (z.b. Daten sind normalverteilt), so formuliert man die Voraussetzung als H 0 und behält die Annahme bei, solange die Daten nicht signifikant etwas anderes aussagen Dr. Matthias Arnold 377
30 Multiples Testen Beliebter Fehler: Hypothesen aus den Daten ableiten, dazu: Häufigkeit von Lottozahlen Lottozahlen Häufigkeit Zahl Dr. Matthias Arnold 378
31 Testproblem Häufigste Zahl ist die 43 (wurde in der Vergangenheit 646 Mal gezogen) Frage: Taucht die 43 signifikant häufiger auf? Anders formuliert: Tritt die Zahl 43 mit einer Wahrscheinlichkeit p auf, die größer als 6 49 ist? Testproblem: H 0 : p 6 49 gegen H 1 : p> 6 49 Kann mit Binomialverteilung oder über Normalapproximation getestet werden, Ergebnis: H 0 wird zum Niveau α =5% verworfen Fazit: Die Zahl 43 taucht signifikant häufiger auf, also sollte man auf die 43 setzen? Dr. Matthias Arnold 379
32 Wo liegt der Fehler? Die Hypothese (testen auf die 43) wurde erst festgelegt, nachdem bereits bekannt war, dass die 43 besonders häufig auftritt häufiger Fehler bei statistischen Analysen Was passiert, wenn man sich die Daten nicht vorher anschaut? führe den gleichen Test für alle 49 Zahlen durch, Ergebnis: bei α =5%wird H 0 in 3 von 49 Fällen (ca. 6%) verworfen bei α = 10% wird H 0 in 6 von 49 Fällen (ca. 12%) verworfen bei α = 20% wird H 0 in 10 von 49 Fällen (ca. 20%) verworfen Dr. Matthias Arnold 380
33 Fazit Fazit: Es liegt keineswegs ein signifikantes Resultat vor, alle 49 Zahlen treten mit Wahrscheinlichkeit 6 49 auf Deshalb: Die Hypothesen müssen immer feststehen, bevor die Daten angeschaut werden Weitere Beispiele erhöhtes Krebsrisiko für eine bestimmte Krebsart in einer bestimmten Altersgruppe in der Umgebung eines bestimmten Kernkraftwerkes Gesundheitswesen: positive Auswirkung eines Versorgungsprogrammes bezüglich einer bestimmten Kennziffer (Deckungsbeitrag, Anzahl Krankenhaustage, Arzneimittelkosten,...) Dr. Matthias Arnold 381
34 Beispiel 13.6 Ein Marktforschungsinstitut behauptet, dass erwerbstätige Personen eher eine Verlängerung der Ladenöffnungszeiten befürworten als nicht erwerbstätige. Angenommen, eine entsprechende Umfrage ergibt folgendes Meinungsbild: Erwerbstätigkeit Verlängerung der Ladenöffnungszeiten befürwortet nicht befürwortet ja nein Spricht Umfrage für Behauptung des Instituts? mit den bisher eingeführten Signifikanztests nicht beantwortbar! Dr. Matthias Arnold 382
35 Bemerkung a) Motivation für Tests auf Unabhängigkeit Bisher: Konstruktion von Konfidenzintervallen und Signifikanztests, dabei wichtige Voraussetzungen: Unabhängigkeit der Zufallsvariablen X 1,..., X n Unterstellung einer bestimmten Verteilung an X 1,..., X n Jetzt: Test auf Unabhängigkeit zweier Zufallsvariablen (später: Test auf eine bestimmte Verteilung einer Zufallsvariablen) Dr. Matthias Arnold 383
36 Bemerkung (Fortsetzung) b) Allgemeine Kontingenztafel Sei X Zufallsvariable mit k möglichen Ausprägungen, Y Zufallsvariable mit l möglichen Ausprägungen, X und Y an ( einem Merkmalsträger gemessen. Betrachte Stichprobe X1 ) ( Y 1,..., Xn ) Y n ; weiter sei Hij = Anzahl an Beobachtungen mit X = i und Y = j ; Kontingenztafel=Tabelle der Form X Y 1 2 l 1 H 11 H 12 H 1l H 1 2 H 21 H 22 H 2l H k H k1 H k2 H kl H k H 1 H 2 H l n Dr. Matthias Arnold 384
37 Bemerkung (Fortsetzung) c) χ 2 -Unabhängigkeitstest Situation wie in b) (X, Y Zufallsvariablen mit k (X) bzw. l (Y ) möglichen Ausprägungen, an den gleichen Merkmalsträgern gemessen; Stichprobe der Größe n) H 0 : H 1 : X und Y stochastisch unabhängig gegen X und Y abhängig Weiter sei H ij = H i H j n, i =1,..., k, j =1,..., l Dr. Matthias Arnold 385
38 bei Unabhängigkeit erwartete Häufigkeiten H i /n ist der Anteil der X-Beobachtungen in Klasse i H j /n ist der Anteil der Y -Beobachtungen in Klasse j erwarteter Anteil für die Schnittmenge, sofern Unabhängigkeit vorliegt (unter H 0 ): H i n H j n = H i H j n 2 erwartete Anzahl bei einer Stichprobe vom Umfang n: n Hi H j n 2 = H i H j n = H ij Testidee: vergleiche diese bei Unabhängigkeit zu erwartenden Häufigkeiten mit den tatsächlich beobachteten Dr. Matthias Arnold 386
39 Bemerkung (Fortsetzung) c) χ 2 -Unabhängigkeitstest (Fortsetzung) Prüfgr. V = k l i=1 j=1 ( V H 0 χ 2 (k 1)(l 1) (H ij H ij ) 2 H ij unter H 0 approx. χ 2 verteilt ) ; verwerfe H 0 wenn V (χ 2 (k 1)(l 1),1 α, ) (χ 2 n,γ = γ-quantil der χ 2 -Verteilung mit n Freiheitsgraden) Approx. χ 2 Verteilung von V unter H 0 akzeptabel, falls H ij 5 für alle i =1,..., k, j =1,..., l Dr. Matthias Arnold 387
40 Beispiel 13.7 (Ladenöffnungszeiten, vgl. Bsp. 13.6) X = Erwerbstätigkeit (1 = ja, 2 = nein), Y =Verlängerung der Ladenöffnungszeiten (1 = befürwortet, 2 = nicht befürwortet) X Y H 0 : Erwerbstätige Personen befürworten verlängerte Ladenöffnungszeiten im Vergleich zu nicht erwerbstätigen Personen nicht anders X und Y stochastisch unabhängig H 1 : X & Y abhängig (=Behauptung Marktforschungsinstitut) Dr. Matthias Arnold 388
41 Beispiel 13.7 (Fortsetzung) Berechnung der unter H 0 erwarteten Häufigkeiten: H 11 = = 180 H12 = = 120 H 21 = = 120 H22 = =80 V = ( ) ( )2 120 α =5% χ 2 (k 1)(l 1),1 α = χ2 1;0,95 + (100 80)2 80 =3, 841 =13, 889 Insgesamt: V =13, 889 (3, 841; ) =(χ 2 (k 1)(l 1),1 α, ) H 0 wird zum 5%- Niveau verworfen Dr. Matthias Arnold 389
42 Bemerkung a) Gilt in der Situation von Bem. c) nach Bsp k = l =2,so vereinfacht sich die Prüfgröße des χ 2 -Unabhängigkeitstests zu V = n (H 11 H 22 H 12 H 21 ) 2 H 1 H 2 H 1 H 2 (in Bsp (Ladenöffnungszeiten) gilt k = l =2 V = 500 ( ) = =13, 889) b) Bei stetigen Zufallsvariablen X, Y ist χ 2 -Unabhängigkeitstest nach geeigneter Klassierung ebenfalls anwendbar. H ij entspricht nun der Anzahl Beobachtungen, für die X in Klasse i und gleichzeitig Y in Klasse j fällt. Dr. Matthias Arnold 390
43 Beispiel 13.8 Der Personalchef eines großen Unternehmens vermutet, dass die Wahrscheinlichkeit für eine Krankmeldung im Unternehmen montags bis donnerstags gleich und freitags doppelt so groß ist wie an einem der übrigen Wochentage. Innerhalb eines Jahres registriert er folgende Häufigkeiten von Krankmeldungen: Wochentag Mo Di Mi Do Fr Anzahl der Krankmeldungen Stützen diese Beobachtungen seine Vermutung? mit den bisherigen eingeführten Tests auf Lage bzw. Unabhängigkeit nicht beantwortbar! Dr. Matthias Arnold 391
44 Bemerkung a) Motivation für Tests auf Verteilung (vgl. Bem. a) nach Bsp. 13.6) Bisher: Zunächst Konstruktion von Konfidenzintervallen und Signifikanztests, dabei wichtige Voraussetzung: Unabhängigkeit der Zufallsvariablen X 1,..., X n χ 2 Test auf Unabhängigkeit zweier Zufallsvariablen Ebenfalls jedoch notwendig bei Konstruktion von Konfidenzintervallen und Signifikanztests: Unterstellung einer bestimmten Verteilung an X1,..., X n Jetzt: Test auf eine bestimmte Verteilung einer Zufallsvariablen Dr. Matthias Arnold 392
45 Bemerkung (Fortsetzung) b) χ 2 Anpassungstest Seien X 1,..., X n uiv Zufallsvariablen mit k möglichen Ausprägungen, p 1,..., p k [0, 1] mit k i=1 p i =1fest vorgegeben. Testproblem: H 0 : P (X j = i) =p i für alle i {1,...,k} gegen H 1 : P (X j = i) p i für mind. ein i {1,...,k} Weiter sei H i die Anzahl Beobachtungen j mit X j = i (i {1,..., k}) Dr. Matthias Arnold 393
46 Bemerkung (Fortsetzung) b) χ 2 -Anpassungstest (Fortsetzung) k (H i np i ) 2 Prüfgr. V = unter H 0 approx. χ 2 k 1 np verteilt i=1 i ( ) V H 0 χ 2 k 1 ; verwerfe H 0,wennV (χ 2 k 1,1 α, ) (χ 2 n,γ = γ-quantil der χ 2 -Verteilung mit n Freiheitsgraden) Approx. χ 2 Verteilung von V unter H 0 akzeptabel, falls (1) np i 1 für alle i =1,...,k (2) np i 5 für mindestens 80% aller Klassen i Dr. Matthias Arnold 394
47 Beispiel 13.9 (Krankmeldungen, vgl. Bsp. 13.8) Aufstellung des Testproblems: Vermutung Personalchef: P(Krankmeldung) montags bis donnerstags gleich und freitags doppelt so groß ist wie an einem der übrigen Wochentage Definiere p i = P(Wochentag i krank krank während der Woche), i =1,..., 5, 1=Mo, 2=Di usw. D.h. Vermutung Personalchef p 1 = p 2 = p 3 = p 4 & p 5 =2p 1 }{{} Weiter ist 1= 5 p i = p 1 + p 2 + p 3 + p 4 + p 5 =6p1 p 1 =1/6 i=1 Dr. Matthias Arnold 395
48 Beispiel 13.9 (Fortsetzung) Testproblem: H 0 : p 1 = p 2 = p 3 = p 4 = 1 6 und p 5 = 1 3 gegen H 1 : p j 1 6 für ein j {1,..., 4} oder p Prüfgröße: V = ( ) ( ) = 12 = ( ) (70 50) ( ) (40 50) Dr. Matthias Arnold 396
49 Beispiel 13.9 (Fortsetzung) Niveau 5%, d.h. χ 2 k 1,1 α = χ2 4;0,95 =9, 49 Also Testentscheidung V =12 (9, 49; ) =(χ 2 k 1,1 α, ) Somit kann zum 5%-Niveau gezeigt werden, dass der Personalchef unrecht hat (H 0 wird verworfen) Dr. Matthias Arnold 397
50 Statistische Tests: Hypothesenpaar Formulierung der Hypothesen kann Ergebnis beeinflussen: Im Beispiel hat der Personalchef nur deshalb Unrecht, weil die Krankmeldungen von montags bis donnerstags nicht gleichverteilt sind; freitags liegt tatsächlich die doppelte Anzahl an Krankmeldungen vor Wichtig: Hypothese darf nicht aus Daten abgeleitet werden (vgl. Lottozahlen) Weiterer wichtiger Punkt Testentscheidung hängt auch von der Stichprobengröße ab Dr. Matthias Arnold 398
51 Stichprobengröße und Signifikanz Wochentag Mo Di Mi Do Fr Anzahl der Krankmeldungen Teststatistik: V =12, kritischer Wert: χ 2 4;0,95 H 0 wird verworfen =9, 49 Anderer Datensatz, identische Fragestellung Wochentag Mo Di Mi Do Fr Anzahl der Krankmeldungen Teststatistik: V =1.2, kritischer Wert: χ 2 4;0,95 H 0 wird nicht verworfen =9, 49 Dr. Matthias Arnold 399
52 Fazit Trotz identischer relativer Häufigkeiten wird einmal verworfen, ein anderes Mal nicht verworfen Grund: statistische Signifikanz umso leichter nachzuweisen, je größer die Stichprobe ist Auswirkung: In sehr großen Datensätzen werden auch minimale Abweichungen von der Nullhypothese als signifikant erkannt Deshalb immer zusätzlich beachten: Ist die Abweichung von der Nullhypothese auch ökonomisch bedeutsam? Dr. Matthias Arnold 400
53 Bemerkung a) Für stetige Zufallsvariablen X 1,..., X n ist χ 2 -Anpassungstest nach geeigneter Klassierung ebenfalls anwendbar. H i entspricht nun der Anzahl an Beobachtungen, für die X in Klasse i fällt. b) Zweites Fazit zu statistischen Signifikanztests (vgl. auch Bem. nach Bsp. 13.5) χ 2 -Unabhängigkeitstest zur Überprüfung der Unabhängigkeit zweier Zufallsvariablen χ 2 -Anpassungstest als Test auf eine bestimmte Verteilung einer Zufallsvariablen Dr. Matthias Arnold 401
54 Kapitel 14: Regressionsanalyse Motivation Streudiagramm zweier metrisch skalierter Merkmale X und Y Dr. Matthias Arnold 402
55 Ziel Zusammenhang zwischen X und Y erfassen durch eine Gerade der Form y i = a + b x i (i =1,...,n) Vorteile einer linearen Modellierung: einfacher und leicht berechenbarer Zusammenhang ausführlich erforschte Theorie linearer Zusammenhang oftmals guter Ersatz für kompliziertere Zusammenhänge Dr. Matthias Arnold 403
56 Fragestellungen Wie bzw. nach welchen Kriterien soll die Gerade durch das Streudiagramm der Beobachtungen gelegt werden? Mit anderen Worten: Wie sollen a und b gewählt werden? Wie gut beschreibt die so ermittelte Gerade den Zusammenhang zwischen X und Y? Dr. Matthias Arnold 404
57 Zusammenhang via Augenmaß Dr. Matthias Arnold 405
58 Zusammenhang via Extrempunkte Dr. Matthias Arnold 406
59 Zusammenhang via absolute Abweichungen Dr. Matthias Arnold 407
60 Zusammenhang via quadrierte Abweichungen Dr. Matthias Arnold 408
61 Definition 14.1 Das Modell y = a + b x + u, heißt einfaches lineares Regressionsmodell. Die Gerade y =â + ˆb x durch die Punktewolke {(x i,y i )} n i=1, die die Summe der quadrierten (vertikalen) Abstände der Beobachtungen von der Geraden minimiert, heißt KQ-Gerade. Dr. Matthias Arnold 409
62 Lösung des Minimierungsproblems Die Koeffizienten der KQ-Geraden sind gegeben durch: ˆb = s xy s 2 x = n (x i x)(y i ȳ) i=1 â = ȳ ˆb x. und n (x i x) 2 i=1 Dr. Matthias Arnold 410
63 Beispiel 14.1 Monatliche Konsumausgaben von Haushalten in Abhängigkeit vom verfügbaren Einkommen Dr. Matthias Arnold 411
64 Beispiel 14.2 Monatliche Konsumausgaben von Haushalten in Abhängigkeit vom verfügbaren Einkommen (Fortsetzung) Die Koeffizienten der KQ-Geraden lauten (hier nur Ergebnis ohne Angabe der einzelnen Datenpunkte): Die KQ-Gerade lautet damit: s xy ˆb = s 2 = 6877 =0, 52 und x â = , = 751. ŷ i = , 52 x i. Interpretation: Bei einem Anstieg des verfügbaren Einkommens um einen Euro erhöhen sich die Konsumausgaben des Haushaltes um 52 Cent. Dr. Matthias Arnold 412
65 Definition 14.2 Die Größe R 2 = s2 ŷ s 2 y = n (ŷ i ȳ) 2 i=1 n (y i ȳ) 2 i=1 heißt Bestimmtheitsmaß. Interpretation Das Bestimmtheitsmaß R 2 ist der Anteil an Variation der Y -Werte, welcher sich durch die Regressionsbeziehung erklären lässt. Dr. Matthias Arnold 413
66 Beispiel 14.3 Bestimmtheitsmaß der Regression der Konsumausgaben auf das verfügbare Einkommen x i y i ŷ i = , 52 x i (ŷ i ȳ) Dr. Matthias Arnold 414
67 Beispiel 14.4 Bestimmtheitsmaß der Regression der Konsumausgaben auf das verfügbare Einkommen (Fortsetzung) hier ergibt sich: außerdem: also: s 2 ŷ = 1 8 s 2 y = 3748 R 2 = = 3555 =0, 95 Dr. Matthias Arnold 415
68 Eigenschaften von R 2 Für das Bestimmtheitsmaß gilt: a) 0 R 2 1. b) Je näher R 2 bei 1 liegt, desto besser erklärt die KQ-Gerade den linearen Zusammenhang zwischen X und Y. c) Je näher R 2 bei 0 liegt, desto kleiner ist der Erklärungsgehalt von X auf die Variabilität von Y (R 2 =0 kein Erklärungsgehalt). Dr. Matthias Arnold 416
69 Fazit zur elementaren Regressionsrechnung modelliert linearen Zusammenhang zwischen zwei metrisch skalierten Merkmalen Ursache und Wirkung dabei bekannt modellierter Zusammenhang auf gegebenen Datenbereich beschränkt naheliegende Erweiterung: mehr als eine Einflussgröße Dr. Matthias Arnold 417
70 Multiples Regressionsmodell häufig: Zielgröße y hängt von mehr als einer Einflussgröße x ab dann erforderlich: Erweiterung des einfachen Regressionsmodells Modellgleichung y = a + b 1 x b k x k + u Dr. Matthias Arnold 418
71 Modellgleichung Beispiel: Gesundheitsvorsorge y = a + b 1 x b k x k + u typische Einflussgrößen: Teilnahme an Versorgungsprogramm ja/nein, Alter, Geschlecht,... wichtig: alle relevanten Einflussgrößen müssen im Modell enthalten sein, auch dann, wenn sie nicht frei wählbar sind (z.b. Alter, Geschlecht) falls relevante Einflussgrößen fehlen: falsche Ergebnisse Dr. Matthias Arnold 419
72 typische Fragestellungen Frage: Haben Teilnehmer an einem Versorgungsprogramm einen anderen Deckungsbeitrag als Nichtteilnehmer? Regression des Deckungsbeitrags auf die Einflussgröße Teilnahme ja/nein Ergebnis kann verzerrt sein, wenn wichtige Einflussgrößen fehlen Wenn die Teilnehmer im Schnitt älter sind als die Nichtteilnehmer, kann das die Ergebnisse verfälschen Ausweg: Alter mit ins Modell aufnehmen Dr. Matthias Arnold 420
73 Zusammenfassung: Kapitel 11, Punktschätzung Teil B: Verteilung der Zufallsvariablen bekannt Erwartungswert, Varianz, Kovarianz, Korrelation ausrechnen Wahrscheinlichkeiten ausrechnen realistischerer Fall: Verteilung unbekannt Schätzen der Verteilung ohne jegliche Annahmen: anspruchsvoll bei bekanntem Verteilungstyp (z.b. Binomialverteilung, Normalverteilung): nur noch einzelne Parameter zu schätzen Dr. Matthias Arnold 421
74 Zusammenfassung: Kapitel 11, Punktschätzung Schätzen von Parametern Schätzfunktion (Schätzer) und Schätzwert Erwartungstreue und Verzerrung Effizienz Dr. Matthias Arnold 422
75 Zusammenfassung: Kapitel 12, Intervallschätzung Irrtumswahrscheinlichkeit α = P (θ / [V u,v o ]) Konfidenzniveau (Vertrauenswahrscheinlichkeit) 1 α = P (θ [V u,v o ]) Interpretation θ ist ein fester Wert, wenn auch unbekannt zufällig sind die Intervallgrenzen V u und V o Dr. Matthias Arnold 423
76 Zusammenfassung: Kapitel 12, Intervallschätzung normalverteilte Grundgesamtheit, Varianz bekannt [ KI 1 α (μ) = X u 1 α 2 σ n, X + u 1 α 2 ] σ n normalverteilte Grundgesamtheit, Varianz unbekannt χ 2 -Verteilung t-verteilung [ KI 1 α (μ) = X t n 1,1 α 2 S X n, X + t n 1,1 α 2 ] S X n Dr. Matthias Arnold 424
77 Zusammenfassung: Kapitel 12, Intervallschätzung Approximatives Konfidenzintervall für p KI 1 α (p) = [ ˆp u 1 α 2 ˆσ n, ˆp + u 1 α 2 ] ˆσ n mit ˆp = X, ˆσ = ˆp (1 ˆp) Breite eines Konfidenzintervalles Abhängigkeit von α, σ 2 und n erforderlicher Stichprobenumfang quadratischer Zusammenhang Dr. Matthias Arnold 425
78 Zusammenfassung: Kapitel 13, Statistische Signifikanztests Testproblem Nullhypothese H 0 und Alternative H 1 Testentscheidung Fehler 1. Art und Fehler 2. Art Gütefunktion statistischer Test Prüfgröße Verteilung unter H 0 Ablehnungsbereich (Verwerfungsbereich) und Annahmebereich Dr. Matthias Arnold 426
79 Zusammenfassung: Kapitel 13, Statistische Signifikanztests Gauß-Test und t-test Approximativer Test für p Interpretation der Testentscheidung Unterschiedliche Aussagekraft bei Ablehnung bzw. Annahme der Nullhypothese Aufstellen der Hypothesen Hypothesen nicht aus Daten ableiten Dr. Matthias Arnold 427
80 Zusammenfassung: Kapitel 13, Statistische Signifikanztests χ 2 -Unahängigkeitstest Kontingenztafel Vergleich erwarteter Häufigkeiten mit beobachteten Häufigkeiten χ 2 -Anpassungstest Signifikanz und Stichprobengröße statistische Signifikanz und ökonomische Signifikanz Dr. Matthias Arnold 428
81 Zusammenfassung: Kapitel 14, Regressionsanalyse zwei Merkmale X und Y linearer Zusammenhang, Ausgleichsgerade einfaches lineares Regressionsmodell KQ-Gerade Bestimmtheitsmaß Interpretation der Größen Multiples Regressionsmodell mehr als eine Einflussgröße Dr. Matthias Arnold 429
Kapitel 3 Schließende Statistik
Bemerkung 3.34: Die hier betrachteten Konfidenzintervalle für unbekannte Erwartungswerte sind umso schmaler, je größer der Stichprobenumfang n ist, je kleiner die (geschätzte) Standardabweichung σ (bzw.
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrElementare Regressionsrechnung
Elementare Regressionsrechnung Motivation: Streudiagramm zweier metrisch skalierter Merkmale X und Y Y X Dr. Karsten Webel 107 Ziel: Erfassung des Zusammenhangs zwischen X und Y durch eine Gerade der Form
MehrZusammenfassung: Kapitel 5, Zusammenhangsmaße
Zusammenfassung: Kapitel 5, Zusammenhangsmaße Kovarianz s xy = 1 n n (x i x)(y i ȳ) i=1 Korrelationskoeffizient nach Bravais-Pearson r xy = s xy s x s y = n (x i x)(y i ȳ) i=1 n (x i x) 2 i=1 n (y i ȳ)
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrSo berechnen Sie einen Schätzer für einen Punkt
htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung
Mehr4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
Mehr7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)
7. Hypothesentests Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang X habe die unbekannte VF F X (x) Interessieren uns für einen unbekannten Parameter θ der Verteilung von X 350 Bisher:
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 5.5.2006 1 Ausgangslage Wir können Schätzen (z.b. den Erwartungswert) Wir können abschätzen, wie zuverlässig unsere Schätzungen sind: In welchem Intervall
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrStatistik II. Version A. 1. Klausur Sommersemester 2011 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik II Version A 1. Klausur Sommersemester 2011 Hamburg, 27.07.2011 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
MehrAufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:
Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
MehrStatistik II für Betriebswirte Vorlesung 1
Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version:
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrTHEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ
WEBINAR@LUNCHTIME THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ EINLEITENDES BEISPIEL SAT: Standardisierter Test, der von Studienplatzbewerbern an amerikanischen Unis gefordert
Mehr2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:
2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrGoethe-Universität Frankfurt
Goethe-Universität Frankfurt Fachbereich Wirtschaftswissenschaft PD Dr. Martin Biewen Dr. Ralf Wilke Sommersemester 2006 Klausur Statistik II 1. Alle Aufgaben sind zu beantworten. 2. Bitte runden Sie Ihre
MehrStatistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrGrundlagen der Statistik
Grundlagen der Statistik Übung 15 009 FernUniversität in Hagen Alle Rechte vorbehalten Fachbereich Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrStatistik I für Betriebswirte Vorlesung 14
Statistik I für Betriebswirte Vorlesung 14 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 13. Juli 017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 14 Version: 8. Juli
MehrKapitel 3 Schließende Statistik
Motivation Grundgesamtheit mit unbekannter Verteilung F Stichprobe X 1,...,X n mit Verteilung F Realisation x 1,...,x n der Stichprobe Rückschluss auf F Dr. Karsten Webel 160 Motivation (Fortsetzung) Kapitel
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrHypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.
Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die
MehrLösungen zum Aufgabenblatt 14
Lösungen zum Aufgabenblatt 14 61. Das Gewicht von Brötchen (gemessen in g) sei zufallsabhängig und werde durch eine normalverteilte Zufallsgröße X N(µ, 2 ) beschrieben, deren Varianz 2 = 49 g 2 bekannt
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrGrundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).
Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,
MehrKlausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester Aufgabenstellung und Ergebnisse
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester 2010 Aufgabenstellung und Ergebnisse Prof. Dr. Ralph Friedmann / Dr. Martin Becker Hinweise für die Klausurteilnehmer
MehrPrüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).
Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Aus praktischen Gründen
MehrBeispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10
6 Hypothesentests Gauß-Test für den Mittelwert bei bekannter Varianz 6.3 Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10 G(µ) 0 α 0. 0.4 0.6 0.8 1 n = 10 n =
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management
Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
Mehr7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.
7. Übung: Aufgabe 1 b), c), e) Aufgabe a), c), e) Aufgabe 3 c), e) Aufgabe 4 b) Aufgabe 5 a) Aufgabe 6 b) Aufgabe 7 e) Aufgabe 8 c) Aufgabe 9 a), c), e) Aufgabe 10 b), d) Aufgabe 11 a) Aufgabe 1 b) Aufgabe
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrWahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -
wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit
MehrProbeklausur - Statistik II, SoSe 2017
Probeklausur - Statistik II, SoSe 2017 Aufgabe 1: Mehrdimensionale Zufallsvariablen (15 Punkte) Gegeben sei ein zweidimensionaler stetiger Zufallsvektor X = (X 1, X 2 ) T mit der gemeinsamen Dichtefunktion
MehrStatistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik
Statistik Zusätzliche Beispiele SS 2018 Blatt 3: Schließende Statistik 1. I Ein Personalchef führt so lange Vorstellungsgespräche durch bis der erste geeignete Bewerber darunter ist und stellt diesen an.
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrWirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester Namensschild
Wirtschaftswissenschaftliches Prüfungsamt Bachelor-Studiengang Schließende Statistik Sommersemester 2010 Namensschild Prof. Dr. Ralph Friedmann / Dr. Martin Becker Hinweise für die Klausurteilnehmer ˆ
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
Mehr2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X
Hypothesentests Bisher betrachtet: Punkt- bzw. Intervallschätzung des unbekannten Mittelwerts Hierzu: Verwendung der 1 theoretischen Information über Verteilung von X empirischen Information aus Stichprobenrealisation
Mehr2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht
43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,
MehrWahrscheinlichkeitsrechnung und Statistik. 11. Vorlesung /2019
Wahrscheinlichkeitsrechnung und Statistik 11. Vorlesung - 2018/2019 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 2 heißt Median. P(X < z
Mehr6. Schätzverfahren für Parameter
6. Schätzverfahren für Parameter Ausgangssituation: Ein interessierender Zufallsvorgang werde durch die ZV X repräsentiert X habe eine unbekannte Verteilungsfunktion F X (x) Wir interessieren uns für einen
MehrJe genauer und sicherer, desto größer muss der Stichprobenumfang sein
2.3 Intervallschätzung 2.3.5 Bestimmung des Stichprobenumfangs Eine große praktische Bedeutung haben Konfidenzintervalle auch für die Stichprobenplanung. Sie werden herangezogen, um den benötigten Stichprobenumfang
MehrKATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert
KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert 0. Das eigentliche Forschungsziel ist: Beweis der eigenen Hypothese H 1 Dafür muss Nullhypothese H 0 falsifiziert werden können Achtung!
Mehr3. Das Prüfen von Hypothesen. Hypothese?! Stichprobe Signifikanztests in der Wirtschaft
3. Das Prüfen von Hypothesen Hypothese?! Stichprobe 3.1. Signifikanztests in der Wirtschaft Prüfung, ob eine (theoretische) Hypothese über die Verteilung eines Merkmals X und ihre Parameter mit einer (empirischen)
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
MehrKapitel 13. Grundbegriffe statistischer Tests
Kapitel 13 Grundbegriffe statistischer Tests Oft hat man eine Vermutung über die Verteilung einer Zufallsvariablen X. Diese Vermutung formuliert man als Hypothese H 0.Sokönnte man daran interessiert sein
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.11. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler 2009 war genau 33.7%. Wie groß ist die Wahrscheinlichkeit, in einer Zufallsstichprobe von 1000 Personen genau
MehrWahrscheinlichkeitsrechnung und Statistik
10. Vorlesung - 017 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 heißt Median. P(X < z α ) α P(X z α ). Falls X stetige zufällige Variable
MehrHypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
MehrSTATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik
Kapitel 15 Statistische Testverfahren 15.1. Arten statistischer Test Klassifikation von Stichproben-Tests Einstichproben-Test Zweistichproben-Test - nach der Anzahl der Stichproben - in Abhängigkeit von
Mehr73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
MehrInduktive Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung
Induktive Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Georg Bol bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de
MehrEinführung in die statistische Testtheorie
1 Seminar Simulation und Bildanalyse mit Java von Benjamin Burr und Philipp Orth 2 Inhalt 1. Ein erstes Beispiel 2. 3. Die Gütefunktion 4. Gleichmäßig beste Tests (UMP-Tests) 1 Einführendes Beispiel 3
MehrR. Brinkmann Seite
R. Brinkmann http://brinkmann-du.de Seite 1 17.3.21 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit
Mehr3.3 Konfidenzintervalle für Regressionskoeffizienten
3.3 Konfidenzintervalle für Regressionskoeffizienten Konfidenzintervall (Intervallschätzung): Angabe des Bereichs, in dem der "wahre" Regressionskoeffizient mit einer großen Wahrscheinlichkeit liegen wird
MehrKonfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt
Konfidenzintervalle Annahme: X 1,..., X n iid F θ. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt P θ (U θ O) = 1 α, α (0, 1). Das Intervall [U, O] ist ein Konfidenzintervall
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrBiostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 : Binomial, Gauß Prof. Dr. Achim Klenke http://www.aklenke.de 10. Vorlesung: 20.01.2012 1/31 Inhalt 1 Einführung Binomialtest 2/31 Beispiel Einführung Bohnenlieferant liefert
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
MehrStatistik II Februar 2005
Statistik II Februar 5 Aufgabe Zufällig ausgewählten Personen der Zielgruppe wird der Prototyp eines neuen Konsumgutes vorgelegt, um die Zahlungsbereitschaft Z ( pro Einheit des Konsumgutes) zu ermitteln.
MehrKlausur zu Statistik II
Goethe-Universität Frankfurt Prof. Dr. Uwe Hassler FB Wirtschaftswissenschaften Sommersemester 2005 Klausur zu Statistik II Version B Bitte tragen Sie hier und auf den Lösungsblättern (oben links) Ihre
MehrEpidemiologie / Biometrie
Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de
MehrUwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler
Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen
MehrKapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller
MehrStatistische Tests Version 1.2
Statistische Tests Version 1.2 Uwe Ziegenhagen ziegenhagen@wiwi.hu-berlin.de 7. Dezember 2006 1 Einführung Ein statistischer Test dient der Überprüfung einer statistischen Hypothese. Mithilfe des Tests
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrStatistische Tests Übersicht
Statistische Tests Übersicht Diskrete Stetige 1. Einführung und Übersicht 2. Das Einstichprobenproblem 3. Vergleich zweier unabhängiger Gruppen (unverbundene Stichproben) 4. Vergleich zweier abhängiger
MehrR. Brinkmann Seite
R. Brinkmann http://brinkmann-du.de Seite 1 24.2.214 Grundlagen zum Hypothesentest Einführung: Wer Entscheidungen zu treffen hat, weiß oft erst im nachhinein ob seine Entscheidung richtig war. Die Unsicherheit
MehrBiometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1
Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.
MehrParametrische und nichtparametrische Tests
XIII. Nichtparametrische Tests Seite 1 Parametrische und nichtparametrische Tests Parametrische Tests: Hier wird eine bestimmte Verteilung vorausgesetzt, und getestet, ob die gewählten Parameter passen.
MehrKapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Induktive Statistik Prof. Dr. W.-D.
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrStatistik II für Studierende der Soziologie und Nebenfachstudierende
2.4.3 Typische Tests I: Tests auf Lageparameter Hier werden exemplarisch nur wenige, ausgewählte Test, die typisch sind, besprochen. Das Grundprinzip ist bei anderen Tests analog. Aufgabe: Konstruiere
Mehr1 Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsräume. Ein erster mathematischer Blick auf Zufallsexperimente...
Inhaltsverzeichnis 1 Grundlagen der Wahrscheinlichkeitsrechnung 1 1.1 Wahrscheinlichkeitsräume Ein erster mathematischer Blick auf Zufallsexperimente.......... 1 1.1.1 Wahrscheinlichkeit, Ergebnisraum,
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrBeurteilende Statistik
Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten
Mehr