Wald- und Wilson-Konfidenzintervall, mehrere Seiten

Ähnliche Dokumente
Sigma-Umgebung. Vergleichen wir die beiden Binomialverteilungen: n = 30 p = 0,5. n = 20 p = 0,75

Je größer n und je näher p bei 0,5 liegt, desto besser wird i. A. die Näherung. Als Faustregel gilt, dass die Näherung geeignet ist, wenn.

Abiturprüfung Mathematik, Leistungskurs

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Um zu entscheiden, welchen Inhalt die Urne hat, werden der Urne nacheinander 5 Kugeln mit Zurücklegen entnommen und ihre Farben notiert.

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Statistik I für Betriebswirte Vorlesung 14

Statistische Tests für unbekannte Parameter

Statistiktutorium (Kurs Frau Jacobsen)

So berechnen Sie einen Schätzer für einen Punkt

Überblick Hypothesentests bei Binomialverteilungen (Ac)

Normalverteilung und Standardisierung

7. Übung: Aufgabe 1. b), c), e) Aufgabe 2. a), c), e) Aufgabe 3. c), e) Aufgabe 4. Aufgabe 5. Aufgabe 6. Aufgabe 7. Aufgabe 8. Aufgabe 9.

R. Brinkmann Seite

Statistische Tests für unbekannte Parameter

R. Brinkmann Seite

Pfadregel. 400 Kugeln durchlaufen die möglichen Pfade. Das Diagramm zeigt das Ergebnis am Ende der Versuchsdurchführung.

Prüfungsteil 2, Aufgabe 8 Stochastik

p = h n (K)= Juli vl smart vp qk notebook Praktische Lösung des Problems: mit den Werten

Binomialverteilung Vertrauensbereich für den Anteil

Hypothesentest. Ablehnungsbereich. Hypothese Annahme, unbewiesene Voraussetzung. Anzahl Kreise

Hypothesentest, ein einfacher Zugang mit Würfeln

Statistik I für Betriebswirte Vorlesung 13

Test von Hypothesen: Signifikanz des Zusammenhangs (F-Test)

Teilaufgabe 1.1 (4 BE) Untersuchen Sie, ob die Ereignisse B und D stochastisch unabhängig sind. PB ( ) = 0.80 PD ( ) = 0.15 PB D = 0.05 = 0.

AUFGABENTYPEN. 2. Bekannt ist die Irrtumswahrscheinlichkeit α ; zu berechnen ist der Annahme- und Ablehnungsbereich, also die Entscheidungsregel.

Aufgabe 8: Stochastik (WTR)

Fit for Abi & Study Stochastik

Konfidenzintervalle. Einführung von Ac

2005 Nachtermin Nichttechnik 12 Testen korrigiert! Analysis

Stichproben Parameterschätzung Konfidenzintervalle:

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Lösungen zum Aufgabenblatt 14

Arbeitsblatt 4.1: Nutzung einer Tabelle der kumulierten Binomialverteilung

Testen von Hypothesen, Beurteilende Statistik

Bedingte Wahrscheinlichkeiten: Ein Baumdiagramm der nachstehenden Art bzw. die zugehörige Vierfeldertafel gibt jeweils absolute Häufigkeiten an.

Beurteilende Statistik

M13 Übungsaufgaben / pl

Alternativtest Einführung und Aufgabenbeispiele

Dr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik

Empirische Wirtschaftsforschung

Statistische Überlegungen: Eine kleine Einführung in das 1 x 1

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

2.3 Intervallschätzung

Wahrscheinlichkeitsverteilungen

1. Einführung in die induktive Statistik

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

Abitur 2011 G8 Abitur Mathematik Stochastik IV

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Stoffverteilungsplan Mathematik Grundkurs. Lambacher Schweizer Stochastik ISBN Klassenarbeit

Stoffverteilungsplan Mathematik Leistungskurs. Lambacher Schweizer Stochastik ISBN Klassenarbeit

Wirtschaftsstatistik-Klausur am

Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter].

Grundlagen der Stochastik

Bereiche der Statistik

Das Konfidenzintervall und der Goldbär

2. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

2.3 Intervallschätzung

7. Übung. Einfache statistische Schätzverfahren. Aufgabe 1. Mögliche Parameter der Grundgesamtheit sind. a) S. c) N. d) n.

Klassifikation von Signifikanztests

R. Brinkmann Seite

1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...

Anzahl der Fahrschüler Bild 1

Statistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management

Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Dokumentation Mathematik

Handelt es sich bei den folgenden um diskrete oder stetige Zufallsvariablen?

Prüfungsteil 2, Aufgabe 8 Stochastik

1 Verteilungsfunktionen, Zufallsvariable etc.

8. Konfidenzintervalle und Hypothesentests

Grundproblem der Inferenzstatistik

Gurkensamen. Stochastik ABITUR Torsten Möller. - Mathematik - Prüfungsaufgabe Schleswig-Holstein

Grundproblem der Inferenzstatistik

Mögliche Fehler beim Testen

( ) = PD ( ) = =

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Nachklausur zur Vorlesung

Konfidenzintervalle. Gesucht: U = U(X 1,..., X n ), O = O(X 1,..., X n ), sodass für das wahre θ gilt

5. Seminar Statistik

Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik

Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1

Sigma-Umgebung. Vergleichen wir die beiden Binomialverteilungen: n = 30 p = 0,5. n = 20 p = 0,75

Jost Reinecke. 7. Juni 2005

Lösungen zu Übungsblatt 9 Höhere Mathematik2/Stochastik 2 Master KI/PI

Mathematik für Biologen

Biostatistik, WS 2013/2014 Konfidenzintervalle

Abiturvorbereitung Alkoholsünder, bedingte Wahrscheinlichkeit, Hypothesentest Aufgabenblatt

Lösungen zur Biomathe-Klausur Gruppe B Montag, den 16. Juli 2001

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Wahrscheinlichkeitsrechnung und schließende Statistik

3.Wiederholung: Toleranzbereiche Für EX Geg:

Die Familie der χ 2 (n)-verteilungen

Transkript:

Prognose-Intervall Wilson-Konfidenzintervall, grafische Lösung Ergänzung zur grafischen Lösung Konfidenzintervall und Hyothesentest Wald- und Wilson-Konfidenzintervall, mehrere Seiten Symmetrie zur Geraden y = x Überdeckungswahrscheinlichkeit für Wilson-Konfidenzintervalle Überdeckungswahrscheinlichkeit für Wald-Konfidenzintervalle

Prognose-Intervall Wir gehen von einer Binomialverteilung einer Stichrobe (n, sind gegeben) und der zσ-umgebung des Erwartungswerts zur Sicherheitswahrscheinlichkeit α aus. µ µ zσ µ+zσ Die Stichrobenergebnisse werden mit der Sicherheitswahrscheinlichkeit α in der zσ-umgebung liegen. Diese heißt auch Schwankungs- oder Prognoseintervall für die Stichrobenergebnisse. Die relativen Häufigkeiten k zσ n der Stichrobenergebnisse liegen dann in [ n + zσ n ], dem Prognoseintervall für die relativen Häufigkeiten. zσ n + zσ n rel. Häufigkeiten Zu gegebenem sind also Aussagen über die zu erwartenden Stichrobenergebnisse bzw. über die relativen Häufigkeiten möglich (man schließt von der Gesamtheit auf die Stichrobe). Während die Prognoseintervalle für die Stichrobenergebnisse mit wachsendem n immer größer werden, ziehen sich die Prognoseintervalle für die relativen Häufigkeiten immer mehr zusammen. Für ein unbekanntes kann eine Punktschätzung X n eine Näherung sein. Ein Intervall, das mit einer vorgegebenen Sicherheitswahrscheinlichkeit die wahre aber unbekannte Wahrscheinlichkeit überdeckt, heißt Konfidenzintervall. Es liege ein Stichrobenergebnis h = k n vor. Das Wald-Konfidenzintervall erhalten wir, indem wir zu h das Prognoseintervall für die relativen Häufigkeiten bilden. Zur Erinnerung: z =Φ 1 ( 1+α ) 2 1

Wilson-Konfidenzintervall, grafische Lösung Eine Maschine roduziert Werkstücke. Diese sind immer noch mit der Wahrscheinlichkeit verfärbt.... Der Produktion wird eine Stichrobe vom Umfang n = 80 entnommen. X sei die Anzahl verfärbter Werkstücke in der Stichrobe. Sei z.b. k = 38. (X kann mit randbin(n, ) simuliert werden.) Was sagt das Stichrobenergebnis über aus? Die Sicherheitswahrscheinlichkeit sei α = 95%. verborgen = 0,4 24 26 28 30 µ 34 36 38 40 µ zσ µ+zσ sichtbar n = 80, k = 38 Wir fragen nach allen Wahrscheinlichkeiten, die dem Zufallsversuch zugrunde liegen könnten, d. h. wir fragen nach allen Wahrscheinlichkeiten, deren zσ-umgebung k enthält, die also k wahrscheinlich machen würden, d.h. für die gilt: µ zσ k µ+zσ Eine grafische Lösung dieser Ungleichungskette ist lehrreich. 80 k 70 60 50 40 30 20 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson-Konfidenzintervall [ 0,3692 0,5830] 2

Wilson-Konfidenzintervall, Ergänzung zur grafischen Lösung Es wurden die Grahen der Funktionen f 1 () = n +zσ f 2 () = n zσ f 3 () = k mit n = 80, z = 1,96, k = 38 dargestellt. Zu jedem ist das Schwankungsintervall vertikal ablesbar, sowie seine Überdeckung von k = 38. Der Übergang zu den relativen Häufigkeiten und ein Vertauschen der Achsen ist hier nicht erforderlich. 80 k 70 60 50 40 30 20 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 3

Konfidenzintervall und Hyothesentest Beim Hyothesentest ist nur ein Stichrobenergebnis, das in den Ablehnungsbereich fällt, aussagekräftig. Die angenommene Wahrscheinlichkeit (Nullhyothese) kann dann nicht weiter aufrecht erhalten werden, da mit ihr dieses Ereignis zu unwahrscheinlich wäre. Es geht hier also nur um den Ausschluss einer Wahrscheinlichkeit und nicht um deren Bestätigung. Die Grenzen des Hyothesentests werden häufig übersehen. Zur Verwirrung trägt der Begriff Annahmebereich bei, mit dem der Nicht-Ablehnungsbereich gemeint ist und auch die Formulierung: Die Nullhyothese wird angenommen, statt: Die Nullhyothese kann aufgrund des Testergebnisses nicht abgelehnt werden, jedoch können auch andere Wahrscheinlichkeit dem Zufallsversuch zugrunde liegen. Mit einem Konfidenzintervall zu einem Stichrobenergebnis X = k können auch (mit einer gewissen Sicherheitswahrscheinlichkeit) Wahrscheinlichkeiten ausgeschlossen werden, die nicht mit dem Stichrobenergebnis verträglich sind, d. h. für die k nicht in deren zσ-umgebung liegt. Darüberhinaus enthält das Konfidenzintervall genau die Wahrscheinlichkeiten, die mit dem Stichrobenergebnis verträglich sind. Die relative Häufigkeit h = k n ist eine Schätzung der zugrunde liegenden Wahrscheinlichkeit. Mit dem GTR kann mit 1-ProZInt (STAT-Tests-Menü) das Wald-Konfidenzintervall direkt ermittelt werden. 4

Wald- und Wilson-Konfidenzintervall Zum Vergleich betrachte man die Konfidenzellisen. n = 80, Stichrobenergebnis k = 38 Sicherheitswahrscheinlichkeit 95% 80 k 70 60 50 40 30 20 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson-Konfidenzintervall [ 0,3692 0,5830] Wald-Konfidenzintervall [ 0,3656 0,5844] 5

Wald- und Wilson-Konfidenzintervall Zum Vergleich betrachte man die Konfidenzellisen. n = 50 Sicherheitswahrscheinlichkeit 95% 50 k 40 30 20 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson Wald 6

Wald- und Wilson-Konfidenzintervall Zum Vergleich betrachte man die Konfidenzellisen. n = 0 Sicherheitswahrscheinlichkeit 95% 0 k 90 80 70 60 50 40 30 20 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson Wald 7

Wald- und Wilson-Konfidenzintervall Zum Vergleich betrachte man die Konfidenzellisen. n = 150 Sicherheitswahrscheinlichkeit 95% 150 140 k 130 120 1 0 90 80 70 60 50 40 30 20 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson Wald 8

Symmetrie zur Geraden y = x Die beiden Konfidenzellisen gehen jeweils durch Siegelung an der Winkelhalbierenden auseinander hervor. Für den rechnerischen Nachweis (Vertauschung der Koordinaten) muss die y-achse mit h = k n skaliert werden. 1,0 h 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson Wald h = ±z = h±z (1 ) n h (1 h) n k = n±z n (1 ) 9

Überdeckungswahrscheinlichkeit für Wilson-Konfidenzintervalle n = 50 Sicherheitswahrscheinlichkeit 95% k 50 40 30 20 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Wilson Das Diagramm enthält einige Konfidenzintervalle (horizontale Strecken) zu möglichen Stichrobenergebnissen k. Um herauszufinden, mit welcher Wahrscheinlichkeit der (angenommen wahre) Anteil 0,4 an der Grundgesamtheit von den Konfidenzintervallen überdeckt wird, ist hier die Wahrscheinlichkeit P 50 0,4 (14 X 26) = 94,0% zu ermitteln.

Überdeckungswahrscheinlichkeit für Wilson-Konfidenzintervalle Die vorige Überlegung kann für jedes angestellt werden. Das Diagramm beinhaltet die Überdeckungswahrscheinlichkeiten. n = 50 Sicherheitswahrscheinlichkeit 95% 0% 90% 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 11

Überdeckungswahrscheinlichkeit für Wald-Konfidenzintervalle n = 50 Sicherheitswahrscheinlichkeit 95% 0% 90% 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Die Daten wurden mit GeoGebra ermittelt. 12

Startseite 13