4. Seminar Statistik

Ähnliche Dokumente
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Anpassungstests VORGEHENSWEISE

Chi-Quadrat Verfahren

Statistik I für Betriebswirte Vorlesung 14

Statistik und Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung und schließende Statistik

Einführung in die Induktive Statistik: Testen von Hypothesen

8. Konfidenzintervalle und Hypothesentests

Statistische Tests für unbekannte Parameter

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Willkommen zur Vorlesung Statistik (Master)

Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007

Jost Reinecke. 7. Juni 2005

Grundgesamtheit und Stichprobe

3 Grundlagen statistischer Tests (Kap. 8 IS)

Grundlagen der Statistik

Probleme bei kleinen Stichprobenumfängen und t-verteilung

Mathematische und statistische Methoden II

Grundgesamtheit und Stichprobe

Klassifikation von Signifikanztests

Statistische Tests (Signifikanztests)

Prüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).

Test auf den Erwartungswert

Einfache Varianzanalyse für unabhängige Stichproben

Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr

Lösungen zu den Übungsaufgaben in Kapitel 10

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Klausur zu Statistik II

Konfidenzintervalle. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09

Zentraler Grenzwertsatz/Konfidenzintervalle

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

Allgemeines zu Tests. Statistische Hypothesentests

Statistik II. Statistische Tests. Statistik II

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Testen von Hypothesen:

Schließende Statistik

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Kapitel 3 Schließende Statistik

Webinar Induktive Statistik. - Wahrscheinlichkeitsrechnung - Stichprobentheorie

10. Die Normalverteilungsannahme

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests

Biometrieübung 11 Kontingenztafeln

Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.

Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1

Zufallsvariablen [random variable]

Ablaufschema beim Testen

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

Grundlegende Eigenschaften von Punktschätzern

Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Beurteilende Statistik

Übungsscheinklausur,

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Biomathematik für Mediziner, Klausur SS 2001 Seite 1

Hypothesentests mit SPSS. Beispiel für einen t-test

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Statistik II: Signifikanztests /1

Inhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...

Tutorial: Anpassungstest

2 Aufgaben aus [Teschl, Band 2]

1 Dichte- und Verteilungsfunktion

Regression und Korrelation

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Analyse von Kontingenztafeln

Mathematik für Biologen

Hypothesentest, ein einfacher Zugang mit Würfeln

Der χ 2 -Test (Chiquadrat-Test)

Macht des statistischen Tests (power)

Einführung in die computergestützte Datenanalyse

7.3 Chi-Quadrat-Streuungstest und F-Test

5. Spezielle stetige Verteilungen

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Übung zur Vorlesung Statistik I WS Übungsblatt 9

9. Schätzen und Testen bei unbekannter Varianz

Vorlesung: Statistik II für Wirtschaftswissenschaft

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Angewandte Statistik 3. Semester

Wiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)

Parametrische vs. Non-Parametrische Testverfahren

Teilklausur des Moduls Kurs 42221: Vertiefung der Statistik

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Diskrete Wahrscheinlichkeitstheorie

Analyse von Querschnittsdaten. Signifikanztests I Basics

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

Übungsaufgaben zu Statistik II

Transkript:

Sandra Schlick Seite 1 4.Seminar2014.doc 4. Seminar Statistik 30 Kurztest 3 3x30 Stichproben, Punktschätzungen, Parameterschätzungen 60 Übungen Schätzungen Hausaufgaben: Sachs Kap. 4.1 4.3 Aufgaben S. 145 Nr. 4.1 4.3, S. S. 161 f. Nr. 4.4 4.9 Thema: Schliessende Statistik Auswahlverfahren für Stichproben: Zufallsauswahl Uneingeschränkte Zufallsauswahl: jede Stichprobe hat gleiche Chance gezogen zu werden. Systematische Zufallsauswahl: Auswahl der Stichprobe nach Regeln. Mehrstufige Zufallsauswahl (hier wird die 2-Stufige Zufallsauswahl beschrieben): 1. Zerlegen der Grundgesamtheit in Teilgesamtheiten, 2. Auswahl einiger Teilgesamtheiten, 3. Entnahme von Elementen aus den gewählten Teilgesamtheiten. Klumpenauswahl: Zerlegen der Grundgesamtheit in Klumpen (z. B. Studienfortschritt, Geschlecht, Alter), Wahl der Klumpen und Entnahme Stichprobe. Die interessierende Variable darf natürlich nicht den Klumpen messen (Studienfortschritt), sondern etwas anderes (z. B. Miete). Auswahlverfahren für Stichproben: Nicht-Zufallsauswahl Quotenauswahlverfahren: Falls eine Annahme über Quoten besteht, kann diese anhand einer derart organisierten Stichprobe überprüft werden. Wenn die Quoten bereits überprüft wurden, dann kann anhand der Quoten eine Auswahl der Stichprobe getroffen werden. Vorteil: man identifiziert z. B. eine ganz bestimmte Personengruppe, die leicht zu befragen ist. Konzentrationsprinzip: Falls sich ein Merkmal auf nur wenige beschränkt, können diese wenigen Elemente in die Stichprobe aufgenommen werden. Dies funktioniert nur bedingt, wenn nämlich z. B. das Durchschnittseinkommen der Bevölkerung anhand der 10 reichsten Personen ermittelt würde. Hingegen macht es Sinn, um Trends zu ermitteln (Trend der Summe der Merkmalswerte nicht durch n dividieren, da sonst Mittelwert). Typische Elemente: Elemente, welche die Grundgesamtheit typisch vertreten werden gewählt. Kommentar: In Verbindung mit dem Quotenverfahren sinnvoller. Schlußfolgerungen von Stichproben - Grundgesamtheit Schluss von der Stichprobe auf Grundgesamtheit. Inklusionsschluss: Schluss von der Grundgesamtheit auf die Stichprobenwerte Repräsentationsschluss: Schluss von Stichprobe auf Grundgesamtheit Ablauf der schliessenden Statistik: Grundgesamtheit Stichprobe Eigenschaft der Stichprobe erfassen und analysieren Rückschluss auf Grundgesamtheit. Zweck: Geld- und Zeitersparnis, manchmal ist die Messung der Grundgesamtheit gar nicht möglich, da zu gross oder da wenn Elemente durch Prüfung zerstört werden. Punktschätzung: Verwendete Mittelwert und Varianz Formeln sind Schätzer. Schätzungen von Konfidenzintervallen (Unsicherheiten abschätzen) Schätzungen für den Anteilswert Anteilswert: Anteil der Elemente X mit einer bestimmten Eigenschaft an der Stichprobe. P = X 1 + X 2 + X 3 +...+ X n n = X n E(X) = n Θ; VAR(X) = n Θ (1- Θ) Für den Anteilswert ergibt sich : E(P) = Θ resp. P (erwartungstreu) P (1- P) Varianz Anteilswert : VAR(X) = n -1 Θ : der zu schätzende Anteilswert, P : Schätzfunktion Schätzfunktion ist angenähert normalverteilt, wenn n P (1- P) > 9 Konfidenzintervall (basierend auf Normalverteilung) ohne Zurücklegen:

Sandra Schlick Seite 2 4.Seminar2014.doc P (1- P) P (1- P) W(P - z Θ P + z ) =1 α n -1 n -1 Beispiel Bekanntheitsgrad. n = 400, P = 30% (Waschmittel ist 30% der Personen bekannt). Beidseitiges Konfidenzintervall für Wahrscheinlichkeit Θ = 95% Kann Normalverteilung verwendet werden? 400 0.3 (1-0.3) = 84 > 9 Normalverteilung OK Schätzung der Standardabweichung ( Sigma Hut ): P (1- P) 0.3 (1-0.3) σ^ (P) = = = 0.023 n -1 400-1 Ermitteln von z aus Tabelle: z(0.975) = 1.96 Maximaler Schätzfehler: Berechnung Grenzen Konfidenzintervall: Konfidenzintervall mit zurücklegen: (P) = 1.96 0.023 = 0.045 W(0.3 0.045 Θ 0.3 + 0.045) = 0.95 z σ^ W(0.255 Θ 0.345) = 0.95 Varianzschätzung wird korrigiert, wenn gilt: n 0.05, sonst Formel oben verwenden. N P (1- P) Formel für Varianz Anteilswert ohne Zurücklegen : VAR(X) = 1 n n -1 N Beispiel Kommunalwahlen (Bourier S. 271). 3000 Wahlberechtigte, Stichprobe von 300. 69 Wahlberechtigte (23%) sind für Partei A. Partei A möchte mindestens 25% der Stimmen erhalten. E(P) = 0.23 Approximativ normalverteilt? n P (1- P) = 300 0.23 0.77 = 53.13 > 9 i. O. σ^ p = 0.23 0.77 300 1 300 1 3000 = 0.023 z-wert für α = 0.05 d. h. 1 - α = 0.95, z = 1.96 Maximaler Schätzfehler (MSE): z σ^ p =1.96 0.023 = 0.045 Konfidenzintervall Grenzen: E(P) E(P) ± z σ^ p = 0.23 ±1.96 0.023 0.185;0.275 [ ] entspricht 95% Intervall D. h. es ist zu 95% wahrscheinlich, dass zwischen 18.5 und 27.5 % der Bevölkerung Partei A wählen. Nach unten begrenztes Intervall (mindestens 25% der Stimmen) E(P) z σ^ p = 0.25 = 0.23 z σ^ p = 0.23 z 0.023 z = 0.87 1 α = 0.1922 D. h. es ist zu 19.22% wahrscheinlich, dass mindestens 25% für Partei A stimmen. Inklusionsschluss Vorgehen: Berechnen von charakteristischen Parametern aus der Stichprobe (Mittelwert, Varianz). Schluss von den Messwerten auf die Grundgesamtheit mit Hilfe von Modellen und Analysen. Folgerungen: Verteilung des Stichprobenmittelwerts nähert sich bei wachsendem n dem Stichprobenmittel der Normalverteilung an. Der Stichprobenmittelwert hat darum eine Varianz, die mit wachsendem n kleiner wird (da sich dieser Mittelwert ja dem idealen Mittelwert annähert. Daraus ergibt sich die Formel für den Mittelwert und die neue Formel für die Varianz: E(X) = µ; VAR(X) = σ 2 X = σ 2. Damit ist ein Schätzer für den n Stichprobenmittelwert gefunden, sofern n genügend gross ist (n > 30). Bsp. Wie gross ist die Wahrscheinlichkeit, dass sich der durchschnittliche Kaffeekonsum von 100 Personen um ± 0.2 Tassen vom arithmetischen Mittel 2.4 der Grundgesamtheit entfernt? Varianz aus Vorgaben berechnet. Var(X) = 0.84.

Sandra Schlick Seite 3 4.Seminar2014.doc Berechnung von VAR(X) ergibt :VAR(X) = σ 2 X = 0.84 n VAR(X) = 0.84 100 σ = 0.84 X 100 = 0.0917 Standardisieren: z = x µ = σ X 2.6-2.4 0.0917 (σ aus Messungen berechnet) - 2.4 = 2.18 resp.2.2 0.0917 = -2.18 z σ = x µ wobei x µ = ± 0.2 X Tabellenwerte bei z = 2. 18; - 2.18 ergibt die gesuchte Wahrscheinlichkeit: W = 0.9854-0.0146 = 0.9708, d. h. mit 97 %iger Wahrscheinlichkeit befindet sich der Mittelwert im Intervall [2.2; 2.6]. Excel: Formel: P(µ z σ X X µ + z σ X ) = vorgegebene Wahrscheinlichkeit Repräsentationsschluss Vorgehen: Berechnen des Mittelwerts aus einer vorgegebenen Stichprobe und anschliessend Vergleich mit Grundgesamtheit. µ 1.645 0.84 0.84 ;µ +1.645 Intervall für x 1.645 = Tabelle für z (P = 90 %). 200 200 Excel: 1.6449 =NORMINV(0.95;0;1) 1.645 = Tabellenwert von z für 90% (beidseitig). Ersetzen von µ durch x (Messwert) = 2.35. Interpretation: Mit 90%iger Wahrscheinlichkeit liegt der wahre Mittelwert im Mittelwerts-Intervall [2.35 0.1066; 2.35 + 0.1066] = [2.2434; 2.4566] der Messung. Berechnung ganz analog zum 1-s-Intervall = Mittelwert ± 1 Standardabweichung. Unterschied: Die Standardabweichung vom Mittelwert. Diese zeigt an, wie stark der Mittelwert streuen könnte, wenn man verschiedene Stichprobenmittelwerte miteinander vergleicht. Excel Befehl für Konfidenzintervall: Formel: P 2.2434 µ 2.4566 [ ] = 0.9 0.98541 =NORMVERT(2.6;2.4;0.0917;1) 0.01459 =NORMVERT(2.2;2.4;0.0917;1) 0.106655 =KONFIDENZ(0.1;0.917;200) Formel: P(X z σ µ X + z σ ) = 1 α X X 1 α =Konfidenzintervall z σ X = maximaler Schätzfehler Konfidenzintervall Erwartungswerte, Vergleich Wahrscheinlichkeiten, Steigung Regressionsgerade, Varianz: Sachs S. 153 160. t-verteilung Mittelwert (Erwartungswert) ist t-verteilt, wenn die Varianz geschätzt werden muss (Stichprobenvarianz). Die t-verteilung verläuft ähnlich wie die Normalverteilung, sie ist etwas flacher, d. h. die geschätzte Varianz ist etwas grösser als der wahre Wert. Der t-test wird zur Schätzung der Unterschiede in den Mittelwerten von zwei Gruppen verwendet. Die Gruppen können unabhängig (z. B. der Blutdruck von Patienten, die ein Medikament bekamen, und von einer Kontrollgruppe, die ein Placebo erhielt) oder abhängig sein (z. B. der Blutdruck von Patienten "bevor" sie ein Medikament bekamen, und "danach"). Theoretisch kann der t-test benutzt werden, wenn der Stichprobenumfang sehr klein ist (z. B. 10), solange die Variablen annähernd normalverteilt sind und die Schwankung der Ergebnisse in den zwei Gruppen nicht wesentlich differiert. t-test für abhängige Stichproben. Wenn zwei Messgruppen, die miteinander verglichen werden, auf der gleichen Gruppe von Beobachtungseinheiten, die zweimal getestet wurden (z. B. "vorher" und "nachher"), basieren, kann ein wesentlicher Teil der Inner-Gruppen-Streuung in beiden Ergebnisgruppen den Unterschieden zwischen den Fällen zugeordnet und vom Fehler abgezogen werden.

Sandra Schlick Seite 4 4.Seminar2014.doc t-test für einzelne Stichproben. Hier wird der beobachtete Mittelwert mit einem erwarteten Mittelwert der Grundgesamtheit verglichen. Die Streuung in der Grundgesamtheit (Varianz) wird auf Basis der Streuung in der beobachteten Stichprobe geschätzt. www.statsoft.de/glossary/t/ttestforindependentanddependentsamples.htm Thema: χ 2 Tests vgl. http://de.wikipedia.org/wiki/chi-quadrat-test Test Name Verwendung bei Prüfgrösse Kritischer Wert Excel ℵ 2 - Test Verteilungseigenschaften Quadrierte Differenzen CHIINV(α;df) Testentscheidung: ℵ 2 Test: berechnetes ℵ 2 > kritischer Wert: H 0 verwerfen. Mit dem ℵ 2 -Test (Chi-Quadrat-Test) untersucht man Verteilungseigenschaften einer statistischen Grundgesamtheit. 1. Es gibt zwei ℵ 2 - Tests: 2. Verteilungstest oder Anpassungstest: Man prüft, ob vorliegende Daten einer bestimmten nicht bekannten Verteilung F entstammen. Man betrachtet ein statistisches Merkmal x, dessen Wahrscheinlichkeiten in der Grundgesamtheit unbekannt sind. Es wird bezüglich der Wahrscheinlichkeiten von x eine allgemein formulierte Nullhypothese aufgestellt: H 0 : Das Merkmal x hat die Wahrscheinlichkeitsverteilung F = F 0 (x) = Normalverteilung Vorgehen: Die n Beobachtungen von x liegen in m verschiedenen Kategorien j (j = 1,... m) vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise in m Klassen zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Die Zahl der Beobachtungen in einer Kategorie ist die beobachtete Häufigkeit n j. Man überlegt sich nun, wie viele Beobachtungen im Mittel in einer Kategorie liegen müssten, wenn x tatsächlich die hypothetische Verteilung hat. Dazu berechnet man zunächst die Wahrscheinlichkeit F 0 (x) j, dass x in diese Kategorie fällt. Die unter H 0 zu erwartende Häufigkeit ist: n j0 = F 0 (x) j n m ( n Die Prüfgröße für den Test ist: χ 2 j n j0 ) 2 = Die Prüfgröße ℵ 2 ist bei ausreichend großen nj annähernd ℵ 2 -verteilt mit m-1 Freiheitsgraden (degree of freedom=df). Wenn die Nullhypothese wahr ist, sollte der Unterschied zwischen der beobachteten und der theoretisch erwarteten Häufigkeit klein sein. Also wird H 0 bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für H 0 liegt rechts. Bei einem Signifikanzniveau α wird H 0 abgelehnt, wenn ℵ 2 > ℵ 2 (1-α; m-1), dem (1-α)-Quantil der ℵ 2 -Verteilung mit m-1 Freiheitsgraden ist. Es existieren Tabellen für die ℵ 2 -Schwellenwerte in Abhängigkeit von der Anzahl der Freiheitsgrade und vom gewünschten Signifikanzniveau, z. B. http://de.wikibooks.org/wiki/mathematik:_statistik:_tabelle_der_chi-quadrat- Verteilung oder (knapper) http://www.faes.de/basis/basis-statistik/basis-statistik-chi-quad- Test/Basis-Statistik-Chi-Quad-Tabel/basis-statistik-chi-quad-tabel.html Soll die Sicherheitsschwelle (=Signifikanzniveau) von einem bestimmten ℵ 2 bestimmt werden, so wird aus der Tabelle ein interpoliert. Einfacher geht s mit Excel. Beispiel 1 Anpassungstest Nullhypothese: belgische 1-Euro Münzen sind fair. Eine Versuchsreihe von n = 250 Würfen zeigte 140 mal Kopf und 110 mal Zahl. Vergleich mit erwarteten Anzahlen: Kopf Zahl Beobachtete Anzahlen n 1 = 140 N 2 = 110 Wahrscheinlichkeiten unter H 0 p 1 = 0.5 p 2 = 0.5 j=1 n j0

Sandra Schlick Seite 5 4.Seminar2014.doc Erwartete Anzahlen unter H 0 n p 1 = 125 n p 2 = 125 2 (n χ 2 = j n p j ) 2 = n p j j=1 (140 125)2 125 + (110 125)2 125 = 2 225 125 = 3.6 Eine Verteilung ist ℵ 2 verteilt, wenn sie die quadrierten Abweichungen zu den hypothetischen Häufigkeiten ins Verhältnis setzt. Da nur Kopf oder Zahl geworfen werden können, hat dieses Beispiel nur 1 Freiheitsgrad. Signifikanzniveau α = 5%. Der kritische Wert wird aus Excel folgendermassen berechnet: 3.8414 =CHIINV(0.05;1) Testentscheidung: Wenn berechnetes ℵ 2 < kritischer Wert: Nullhypothese beibehalten, sonst (ℵ 2 > kritischer Wert) H 0 verwerfen. Hier: ℵ 2 < kritischer Wert H 0 Beibehalten. 3. Unabhängigkeitstest: Prüfung, ob zwei Merkmale stochastisch unabhängig sind. k l (n Testregel : ij E ij ) 2 2 > χ (k 1)(l 1) 1 α i=1 j=1 E ij [ ] H 0 verwerfen. Beachte: es werden 2 Freiheitsgrade bestimmt der Merkmale mit Anzahl Ausprägungen je Merkmal k und l. Beispiel 2 Unabhängigkeitstest Gehen männliche und weibliche Jugendliche in Deutschland in die gleichen Berufe? Folgende Tabelle ( Kontingenztabelle = Darstellung der gemeinsamen Verteilung von x und y vertikale Richtung: k Ausprägungen, horizontale Richtung: L Ausprägungen) ist vorgegeben: Beobachtete Anzahlen Ausbildungsbereich Männlich Weiblich Total Industrie und Handel 471.5 361.5 833 Handwerk 485.5 131.4 616.9 Öffentlicher Dienst 17.6 29.9 47.5 Total 974.6 522.8 1497.4 Erwartete Anzahlen (je Zelle Spalten- mal Zeilensumme geteilt durch Gesamttotal) Ausbildungsbereich Männlich Weiblich Total Industrie und Handel 542.17 290.83 833 Handwerk 401.52 215.38 616.9 Öffentlicher Dienst 30.92 16.58 47.5 Total 974.6 522.8 1497.4 Berechnung Prüfgröße aus erwartet und gemessen Ausbildungsbereich Männlich Weiblich Total Industrie und Handel 9.21 17.17 26.38 Handwerk 17.57 32.75 50.31 Öffentlicher Dienst 5.74 10.69 16.43 Total 32.51 60.61 93.12 Die quadratische Kontingenz wurde zu 93.12 berechnet. Berechnung des kritischen Werts: Anzahl Freiheitsgrade: (k-1)(l-1) = (2 1)(3 1) = 2, Signifikanzniveau α = 0.001 (Vorgabewert). Excel: 13.815 =CHIINV(0.001;2) Testentscheidung: χ 2 = 93.12 > 13.82 H 0 verwerfen Berufswahl und Geschlecht sind nicht voneinander unabhängig. Weitere kritische Werte: α = 1% 9.21; α = 5% 5.99; α = 10% 4.61; D. h. auf dem 1%-Niveau wird H 0 angenommen. Aufgaben χ2-test 1. Überprüfen Sie die Berechnungen zur quadratische Kontingenz aus Beispiel 2. 2. Aufgabe 16. 6. aus Schira: Statistische Methoden der VWL und BWL : Ist der Würfel gefälscht? Mit einem Anpassungstest soll geprüft werden, ob ein bestimmter Würfel so ebenmässig gefertigt ist, dass er als fair gelten kann, so dass alle Augenzahlen mit der gleichen Wahrscheinlichkeit auftreten. Dazu wird eine Versuchsreihe mit 100 Würfen durchgeführt, mit folgendem Ergebnis: Augenzahlen 1 2 3 4 5 6

Sandra Schlick Seite 6 4.Seminar2014.doc Beobachtete Anzahlen 14 20 23 13 20 10 a) Wie gross sind Prüfgrösse und Anzahl der Freiheitsgrade? b) Testen Sie die Nullhypothese eines fairen Würfels. 3. Aus: Bourier Statistik-Übungen S. 205. In einer repräsentativen Umfrage wurden 2002 weibliche Wahlberechtigte aus dem früheren Bundesgebiet nach ihrem Wahlverhalten befragt. Die Befragten wurden in 5 Altersklassen eingeteilt. In der Tabelle (Excel-Template Testen.xls Tabelle BourierStatÜbAlterWahlverh sind die Befragungsergebnisse für die CDU/CSU, SPD, die Grünen und die FDP wiedergegeben. Beobachtet Partei CDU/CSU SPD Grüne FPD Total Alter 18-24 50 63 19 13 145 25-34 92 110 37 24 263 35-44 134 169 62 26 391 45-59 213 191 50 35 489 60 und mehr 360 280 32 42 714 Total 849 813 200 140 2002 Prüfen Sie bei einem Signifikanzniveau von 1%, ob Alter und Wahlentscheid der weiblichen Wahlberechtigten im früheren Bundesgebiet voneinander abhängig waren. Lösungshinweise: 2. Berechnung quadratische Kontingenz als Prüfgrösse. Augenzahlen 1 2 3 4 5 6 Summe Beobachtete Anzahlen 14 20 23 13 20 10 Wahrscheinlichkeiten unter H 0 0.167 0.167 0.167 0.167 0.167 0.167 Erwartete Anzahlen unter H 0 16.667 16.667 16.667 16.667 16.667 16.667 (his - hie)^2 / (hie) 0.427 0.667 2.407 0.807 0.667 2.667 7.640 df = (6-1)=5 15.09 = CHIINV(0.001;5) Kritischer Wert: α = 1% 15.09; (weitere Werte: α = 5% 11.07; α = 10% 9.24) 3. Erwartet Partei j CDU/CSU SPD Grüne FPD Total Alter i 18-24 61.5 58.9 14.5 10.1 145.0 25-34 111.5 106.8 26.3 18.4 263.0 35-44 165.8 158.8 39.1 27.3 391.0 45-59 207.4 198.6 48.9 34.2 489.0 60 und mehr 302.8 290.0 71.3 49.9 714.0 Total 849.0 813.0 200.0 140.0 2002.0 Berechnung Prüfgrösse CDU/CSU SPD Grüne FPD Summe 2.15 0.29 1.41 0.81 3.42 0.10 4.38 1.71 6.10 0.66 13.47 0.07 0.15 0.29 0.03 0.02 10.81 0.34 21.68 1.26 22.63 1.67 40.97 3.86 69.14 Berechneter Wert 26.22 Liegt im Ablehnungsbereich (15.09 < 26.22), d. h. Wahl von Alter bei weiblicher Bevölkerung abhängig.