Sandra Schlick Seite 1 4.Seminar2014.doc 4. Seminar Statistik 30 Kurztest 3 3x30 Stichproben, Punktschätzungen, Parameterschätzungen 60 Übungen Schätzungen Hausaufgaben: Sachs Kap. 4.1 4.3 Aufgaben S. 145 Nr. 4.1 4.3, S. S. 161 f. Nr. 4.4 4.9 Thema: Schliessende Statistik Auswahlverfahren für Stichproben: Zufallsauswahl Uneingeschränkte Zufallsauswahl: jede Stichprobe hat gleiche Chance gezogen zu werden. Systematische Zufallsauswahl: Auswahl der Stichprobe nach Regeln. Mehrstufige Zufallsauswahl (hier wird die 2-Stufige Zufallsauswahl beschrieben): 1. Zerlegen der Grundgesamtheit in Teilgesamtheiten, 2. Auswahl einiger Teilgesamtheiten, 3. Entnahme von Elementen aus den gewählten Teilgesamtheiten. Klumpenauswahl: Zerlegen der Grundgesamtheit in Klumpen (z. B. Studienfortschritt, Geschlecht, Alter), Wahl der Klumpen und Entnahme Stichprobe. Die interessierende Variable darf natürlich nicht den Klumpen messen (Studienfortschritt), sondern etwas anderes (z. B. Miete). Auswahlverfahren für Stichproben: Nicht-Zufallsauswahl Quotenauswahlverfahren: Falls eine Annahme über Quoten besteht, kann diese anhand einer derart organisierten Stichprobe überprüft werden. Wenn die Quoten bereits überprüft wurden, dann kann anhand der Quoten eine Auswahl der Stichprobe getroffen werden. Vorteil: man identifiziert z. B. eine ganz bestimmte Personengruppe, die leicht zu befragen ist. Konzentrationsprinzip: Falls sich ein Merkmal auf nur wenige beschränkt, können diese wenigen Elemente in die Stichprobe aufgenommen werden. Dies funktioniert nur bedingt, wenn nämlich z. B. das Durchschnittseinkommen der Bevölkerung anhand der 10 reichsten Personen ermittelt würde. Hingegen macht es Sinn, um Trends zu ermitteln (Trend der Summe der Merkmalswerte nicht durch n dividieren, da sonst Mittelwert). Typische Elemente: Elemente, welche die Grundgesamtheit typisch vertreten werden gewählt. Kommentar: In Verbindung mit dem Quotenverfahren sinnvoller. Schlußfolgerungen von Stichproben - Grundgesamtheit Schluss von der Stichprobe auf Grundgesamtheit. Inklusionsschluss: Schluss von der Grundgesamtheit auf die Stichprobenwerte Repräsentationsschluss: Schluss von Stichprobe auf Grundgesamtheit Ablauf der schliessenden Statistik: Grundgesamtheit Stichprobe Eigenschaft der Stichprobe erfassen und analysieren Rückschluss auf Grundgesamtheit. Zweck: Geld- und Zeitersparnis, manchmal ist die Messung der Grundgesamtheit gar nicht möglich, da zu gross oder da wenn Elemente durch Prüfung zerstört werden. Punktschätzung: Verwendete Mittelwert und Varianz Formeln sind Schätzer. Schätzungen von Konfidenzintervallen (Unsicherheiten abschätzen) Schätzungen für den Anteilswert Anteilswert: Anteil der Elemente X mit einer bestimmten Eigenschaft an der Stichprobe. P = X 1 + X 2 + X 3 +...+ X n n = X n E(X) = n Θ; VAR(X) = n Θ (1- Θ) Für den Anteilswert ergibt sich : E(P) = Θ resp. P (erwartungstreu) P (1- P) Varianz Anteilswert : VAR(X) = n -1 Θ : der zu schätzende Anteilswert, P : Schätzfunktion Schätzfunktion ist angenähert normalverteilt, wenn n P (1- P) > 9 Konfidenzintervall (basierend auf Normalverteilung) ohne Zurücklegen:
Sandra Schlick Seite 2 4.Seminar2014.doc P (1- P) P (1- P) W(P - z Θ P + z ) =1 α n -1 n -1 Beispiel Bekanntheitsgrad. n = 400, P = 30% (Waschmittel ist 30% der Personen bekannt). Beidseitiges Konfidenzintervall für Wahrscheinlichkeit Θ = 95% Kann Normalverteilung verwendet werden? 400 0.3 (1-0.3) = 84 > 9 Normalverteilung OK Schätzung der Standardabweichung ( Sigma Hut ): P (1- P) 0.3 (1-0.3) σ^ (P) = = = 0.023 n -1 400-1 Ermitteln von z aus Tabelle: z(0.975) = 1.96 Maximaler Schätzfehler: Berechnung Grenzen Konfidenzintervall: Konfidenzintervall mit zurücklegen: (P) = 1.96 0.023 = 0.045 W(0.3 0.045 Θ 0.3 + 0.045) = 0.95 z σ^ W(0.255 Θ 0.345) = 0.95 Varianzschätzung wird korrigiert, wenn gilt: n 0.05, sonst Formel oben verwenden. N P (1- P) Formel für Varianz Anteilswert ohne Zurücklegen : VAR(X) = 1 n n -1 N Beispiel Kommunalwahlen (Bourier S. 271). 3000 Wahlberechtigte, Stichprobe von 300. 69 Wahlberechtigte (23%) sind für Partei A. Partei A möchte mindestens 25% der Stimmen erhalten. E(P) = 0.23 Approximativ normalverteilt? n P (1- P) = 300 0.23 0.77 = 53.13 > 9 i. O. σ^ p = 0.23 0.77 300 1 300 1 3000 = 0.023 z-wert für α = 0.05 d. h. 1 - α = 0.95, z = 1.96 Maximaler Schätzfehler (MSE): z σ^ p =1.96 0.023 = 0.045 Konfidenzintervall Grenzen: E(P) E(P) ± z σ^ p = 0.23 ±1.96 0.023 0.185;0.275 [ ] entspricht 95% Intervall D. h. es ist zu 95% wahrscheinlich, dass zwischen 18.5 und 27.5 % der Bevölkerung Partei A wählen. Nach unten begrenztes Intervall (mindestens 25% der Stimmen) E(P) z σ^ p = 0.25 = 0.23 z σ^ p = 0.23 z 0.023 z = 0.87 1 α = 0.1922 D. h. es ist zu 19.22% wahrscheinlich, dass mindestens 25% für Partei A stimmen. Inklusionsschluss Vorgehen: Berechnen von charakteristischen Parametern aus der Stichprobe (Mittelwert, Varianz). Schluss von den Messwerten auf die Grundgesamtheit mit Hilfe von Modellen und Analysen. Folgerungen: Verteilung des Stichprobenmittelwerts nähert sich bei wachsendem n dem Stichprobenmittel der Normalverteilung an. Der Stichprobenmittelwert hat darum eine Varianz, die mit wachsendem n kleiner wird (da sich dieser Mittelwert ja dem idealen Mittelwert annähert. Daraus ergibt sich die Formel für den Mittelwert und die neue Formel für die Varianz: E(X) = µ; VAR(X) = σ 2 X = σ 2. Damit ist ein Schätzer für den n Stichprobenmittelwert gefunden, sofern n genügend gross ist (n > 30). Bsp. Wie gross ist die Wahrscheinlichkeit, dass sich der durchschnittliche Kaffeekonsum von 100 Personen um ± 0.2 Tassen vom arithmetischen Mittel 2.4 der Grundgesamtheit entfernt? Varianz aus Vorgaben berechnet. Var(X) = 0.84.
Sandra Schlick Seite 3 4.Seminar2014.doc Berechnung von VAR(X) ergibt :VAR(X) = σ 2 X = 0.84 n VAR(X) = 0.84 100 σ = 0.84 X 100 = 0.0917 Standardisieren: z = x µ = σ X 2.6-2.4 0.0917 (σ aus Messungen berechnet) - 2.4 = 2.18 resp.2.2 0.0917 = -2.18 z σ = x µ wobei x µ = ± 0.2 X Tabellenwerte bei z = 2. 18; - 2.18 ergibt die gesuchte Wahrscheinlichkeit: W = 0.9854-0.0146 = 0.9708, d. h. mit 97 %iger Wahrscheinlichkeit befindet sich der Mittelwert im Intervall [2.2; 2.6]. Excel: Formel: P(µ z σ X X µ + z σ X ) = vorgegebene Wahrscheinlichkeit Repräsentationsschluss Vorgehen: Berechnen des Mittelwerts aus einer vorgegebenen Stichprobe und anschliessend Vergleich mit Grundgesamtheit. µ 1.645 0.84 0.84 ;µ +1.645 Intervall für x 1.645 = Tabelle für z (P = 90 %). 200 200 Excel: 1.6449 =NORMINV(0.95;0;1) 1.645 = Tabellenwert von z für 90% (beidseitig). Ersetzen von µ durch x (Messwert) = 2.35. Interpretation: Mit 90%iger Wahrscheinlichkeit liegt der wahre Mittelwert im Mittelwerts-Intervall [2.35 0.1066; 2.35 + 0.1066] = [2.2434; 2.4566] der Messung. Berechnung ganz analog zum 1-s-Intervall = Mittelwert ± 1 Standardabweichung. Unterschied: Die Standardabweichung vom Mittelwert. Diese zeigt an, wie stark der Mittelwert streuen könnte, wenn man verschiedene Stichprobenmittelwerte miteinander vergleicht. Excel Befehl für Konfidenzintervall: Formel: P 2.2434 µ 2.4566 [ ] = 0.9 0.98541 =NORMVERT(2.6;2.4;0.0917;1) 0.01459 =NORMVERT(2.2;2.4;0.0917;1) 0.106655 =KONFIDENZ(0.1;0.917;200) Formel: P(X z σ µ X + z σ ) = 1 α X X 1 α =Konfidenzintervall z σ X = maximaler Schätzfehler Konfidenzintervall Erwartungswerte, Vergleich Wahrscheinlichkeiten, Steigung Regressionsgerade, Varianz: Sachs S. 153 160. t-verteilung Mittelwert (Erwartungswert) ist t-verteilt, wenn die Varianz geschätzt werden muss (Stichprobenvarianz). Die t-verteilung verläuft ähnlich wie die Normalverteilung, sie ist etwas flacher, d. h. die geschätzte Varianz ist etwas grösser als der wahre Wert. Der t-test wird zur Schätzung der Unterschiede in den Mittelwerten von zwei Gruppen verwendet. Die Gruppen können unabhängig (z. B. der Blutdruck von Patienten, die ein Medikament bekamen, und von einer Kontrollgruppe, die ein Placebo erhielt) oder abhängig sein (z. B. der Blutdruck von Patienten "bevor" sie ein Medikament bekamen, und "danach"). Theoretisch kann der t-test benutzt werden, wenn der Stichprobenumfang sehr klein ist (z. B. 10), solange die Variablen annähernd normalverteilt sind und die Schwankung der Ergebnisse in den zwei Gruppen nicht wesentlich differiert. t-test für abhängige Stichproben. Wenn zwei Messgruppen, die miteinander verglichen werden, auf der gleichen Gruppe von Beobachtungseinheiten, die zweimal getestet wurden (z. B. "vorher" und "nachher"), basieren, kann ein wesentlicher Teil der Inner-Gruppen-Streuung in beiden Ergebnisgruppen den Unterschieden zwischen den Fällen zugeordnet und vom Fehler abgezogen werden.
Sandra Schlick Seite 4 4.Seminar2014.doc t-test für einzelne Stichproben. Hier wird der beobachtete Mittelwert mit einem erwarteten Mittelwert der Grundgesamtheit verglichen. Die Streuung in der Grundgesamtheit (Varianz) wird auf Basis der Streuung in der beobachteten Stichprobe geschätzt. www.statsoft.de/glossary/t/ttestforindependentanddependentsamples.htm Thema: χ 2 Tests vgl. http://de.wikipedia.org/wiki/chi-quadrat-test Test Name Verwendung bei Prüfgrösse Kritischer Wert Excel ℵ 2 - Test Verteilungseigenschaften Quadrierte Differenzen CHIINV(α;df) Testentscheidung: ℵ 2 Test: berechnetes ℵ 2 > kritischer Wert: H 0 verwerfen. Mit dem ℵ 2 -Test (Chi-Quadrat-Test) untersucht man Verteilungseigenschaften einer statistischen Grundgesamtheit. 1. Es gibt zwei ℵ 2 - Tests: 2. Verteilungstest oder Anpassungstest: Man prüft, ob vorliegende Daten einer bestimmten nicht bekannten Verteilung F entstammen. Man betrachtet ein statistisches Merkmal x, dessen Wahrscheinlichkeiten in der Grundgesamtheit unbekannt sind. Es wird bezüglich der Wahrscheinlichkeiten von x eine allgemein formulierte Nullhypothese aufgestellt: H 0 : Das Merkmal x hat die Wahrscheinlichkeitsverteilung F = F 0 (x) = Normalverteilung Vorgehen: Die n Beobachtungen von x liegen in m verschiedenen Kategorien j (j = 1,... m) vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise in m Klassen zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Die Zahl der Beobachtungen in einer Kategorie ist die beobachtete Häufigkeit n j. Man überlegt sich nun, wie viele Beobachtungen im Mittel in einer Kategorie liegen müssten, wenn x tatsächlich die hypothetische Verteilung hat. Dazu berechnet man zunächst die Wahrscheinlichkeit F 0 (x) j, dass x in diese Kategorie fällt. Die unter H 0 zu erwartende Häufigkeit ist: n j0 = F 0 (x) j n m ( n Die Prüfgröße für den Test ist: χ 2 j n j0 ) 2 = Die Prüfgröße ℵ 2 ist bei ausreichend großen nj annähernd ℵ 2 -verteilt mit m-1 Freiheitsgraden (degree of freedom=df). Wenn die Nullhypothese wahr ist, sollte der Unterschied zwischen der beobachteten und der theoretisch erwarteten Häufigkeit klein sein. Also wird H 0 bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für H 0 liegt rechts. Bei einem Signifikanzniveau α wird H 0 abgelehnt, wenn ℵ 2 > ℵ 2 (1-α; m-1), dem (1-α)-Quantil der ℵ 2 -Verteilung mit m-1 Freiheitsgraden ist. Es existieren Tabellen für die ℵ 2 -Schwellenwerte in Abhängigkeit von der Anzahl der Freiheitsgrade und vom gewünschten Signifikanzniveau, z. B. http://de.wikibooks.org/wiki/mathematik:_statistik:_tabelle_der_chi-quadrat- Verteilung oder (knapper) http://www.faes.de/basis/basis-statistik/basis-statistik-chi-quad- Test/Basis-Statistik-Chi-Quad-Tabel/basis-statistik-chi-quad-tabel.html Soll die Sicherheitsschwelle (=Signifikanzniveau) von einem bestimmten ℵ 2 bestimmt werden, so wird aus der Tabelle ein interpoliert. Einfacher geht s mit Excel. Beispiel 1 Anpassungstest Nullhypothese: belgische 1-Euro Münzen sind fair. Eine Versuchsreihe von n = 250 Würfen zeigte 140 mal Kopf und 110 mal Zahl. Vergleich mit erwarteten Anzahlen: Kopf Zahl Beobachtete Anzahlen n 1 = 140 N 2 = 110 Wahrscheinlichkeiten unter H 0 p 1 = 0.5 p 2 = 0.5 j=1 n j0
Sandra Schlick Seite 5 4.Seminar2014.doc Erwartete Anzahlen unter H 0 n p 1 = 125 n p 2 = 125 2 (n χ 2 = j n p j ) 2 = n p j j=1 (140 125)2 125 + (110 125)2 125 = 2 225 125 = 3.6 Eine Verteilung ist ℵ 2 verteilt, wenn sie die quadrierten Abweichungen zu den hypothetischen Häufigkeiten ins Verhältnis setzt. Da nur Kopf oder Zahl geworfen werden können, hat dieses Beispiel nur 1 Freiheitsgrad. Signifikanzniveau α = 5%. Der kritische Wert wird aus Excel folgendermassen berechnet: 3.8414 =CHIINV(0.05;1) Testentscheidung: Wenn berechnetes ℵ 2 < kritischer Wert: Nullhypothese beibehalten, sonst (ℵ 2 > kritischer Wert) H 0 verwerfen. Hier: ℵ 2 < kritischer Wert H 0 Beibehalten. 3. Unabhängigkeitstest: Prüfung, ob zwei Merkmale stochastisch unabhängig sind. k l (n Testregel : ij E ij ) 2 2 > χ (k 1)(l 1) 1 α i=1 j=1 E ij [ ] H 0 verwerfen. Beachte: es werden 2 Freiheitsgrade bestimmt der Merkmale mit Anzahl Ausprägungen je Merkmal k und l. Beispiel 2 Unabhängigkeitstest Gehen männliche und weibliche Jugendliche in Deutschland in die gleichen Berufe? Folgende Tabelle ( Kontingenztabelle = Darstellung der gemeinsamen Verteilung von x und y vertikale Richtung: k Ausprägungen, horizontale Richtung: L Ausprägungen) ist vorgegeben: Beobachtete Anzahlen Ausbildungsbereich Männlich Weiblich Total Industrie und Handel 471.5 361.5 833 Handwerk 485.5 131.4 616.9 Öffentlicher Dienst 17.6 29.9 47.5 Total 974.6 522.8 1497.4 Erwartete Anzahlen (je Zelle Spalten- mal Zeilensumme geteilt durch Gesamttotal) Ausbildungsbereich Männlich Weiblich Total Industrie und Handel 542.17 290.83 833 Handwerk 401.52 215.38 616.9 Öffentlicher Dienst 30.92 16.58 47.5 Total 974.6 522.8 1497.4 Berechnung Prüfgröße aus erwartet und gemessen Ausbildungsbereich Männlich Weiblich Total Industrie und Handel 9.21 17.17 26.38 Handwerk 17.57 32.75 50.31 Öffentlicher Dienst 5.74 10.69 16.43 Total 32.51 60.61 93.12 Die quadratische Kontingenz wurde zu 93.12 berechnet. Berechnung des kritischen Werts: Anzahl Freiheitsgrade: (k-1)(l-1) = (2 1)(3 1) = 2, Signifikanzniveau α = 0.001 (Vorgabewert). Excel: 13.815 =CHIINV(0.001;2) Testentscheidung: χ 2 = 93.12 > 13.82 H 0 verwerfen Berufswahl und Geschlecht sind nicht voneinander unabhängig. Weitere kritische Werte: α = 1% 9.21; α = 5% 5.99; α = 10% 4.61; D. h. auf dem 1%-Niveau wird H 0 angenommen. Aufgaben χ2-test 1. Überprüfen Sie die Berechnungen zur quadratische Kontingenz aus Beispiel 2. 2. Aufgabe 16. 6. aus Schira: Statistische Methoden der VWL und BWL : Ist der Würfel gefälscht? Mit einem Anpassungstest soll geprüft werden, ob ein bestimmter Würfel so ebenmässig gefertigt ist, dass er als fair gelten kann, so dass alle Augenzahlen mit der gleichen Wahrscheinlichkeit auftreten. Dazu wird eine Versuchsreihe mit 100 Würfen durchgeführt, mit folgendem Ergebnis: Augenzahlen 1 2 3 4 5 6
Sandra Schlick Seite 6 4.Seminar2014.doc Beobachtete Anzahlen 14 20 23 13 20 10 a) Wie gross sind Prüfgrösse und Anzahl der Freiheitsgrade? b) Testen Sie die Nullhypothese eines fairen Würfels. 3. Aus: Bourier Statistik-Übungen S. 205. In einer repräsentativen Umfrage wurden 2002 weibliche Wahlberechtigte aus dem früheren Bundesgebiet nach ihrem Wahlverhalten befragt. Die Befragten wurden in 5 Altersklassen eingeteilt. In der Tabelle (Excel-Template Testen.xls Tabelle BourierStatÜbAlterWahlverh sind die Befragungsergebnisse für die CDU/CSU, SPD, die Grünen und die FDP wiedergegeben. Beobachtet Partei CDU/CSU SPD Grüne FPD Total Alter 18-24 50 63 19 13 145 25-34 92 110 37 24 263 35-44 134 169 62 26 391 45-59 213 191 50 35 489 60 und mehr 360 280 32 42 714 Total 849 813 200 140 2002 Prüfen Sie bei einem Signifikanzniveau von 1%, ob Alter und Wahlentscheid der weiblichen Wahlberechtigten im früheren Bundesgebiet voneinander abhängig waren. Lösungshinweise: 2. Berechnung quadratische Kontingenz als Prüfgrösse. Augenzahlen 1 2 3 4 5 6 Summe Beobachtete Anzahlen 14 20 23 13 20 10 Wahrscheinlichkeiten unter H 0 0.167 0.167 0.167 0.167 0.167 0.167 Erwartete Anzahlen unter H 0 16.667 16.667 16.667 16.667 16.667 16.667 (his - hie)^2 / (hie) 0.427 0.667 2.407 0.807 0.667 2.667 7.640 df = (6-1)=5 15.09 = CHIINV(0.001;5) Kritischer Wert: α = 1% 15.09; (weitere Werte: α = 5% 11.07; α = 10% 9.24) 3. Erwartet Partei j CDU/CSU SPD Grüne FPD Total Alter i 18-24 61.5 58.9 14.5 10.1 145.0 25-34 111.5 106.8 26.3 18.4 263.0 35-44 165.8 158.8 39.1 27.3 391.0 45-59 207.4 198.6 48.9 34.2 489.0 60 und mehr 302.8 290.0 71.3 49.9 714.0 Total 849.0 813.0 200.0 140.0 2002.0 Berechnung Prüfgrösse CDU/CSU SPD Grüne FPD Summe 2.15 0.29 1.41 0.81 3.42 0.10 4.38 1.71 6.10 0.66 13.47 0.07 0.15 0.29 0.03 0.02 10.81 0.34 21.68 1.26 22.63 1.67 40.97 3.86 69.14 Berechneter Wert 26.22 Liegt im Ablehnungsbereich (15.09 < 26.22), d. h. Wahl von Alter bei weiblicher Bevölkerung abhängig.