Wir gehen wieder von einem allgemeinen (parametrischen) statistischen Modell aus, (

Ähnliche Dokumente
Konfidenzbereiche. Kapitel Grundlagen. Wir gehen wieder von einem allgemeinen (parametrischen) statistischen Modell aus,

Punktschätzer Optimalitätskonzepte

Statistik I für Betriebswirte Vorlesung 14

Mathematische Statistik Aufgaben zum Üben. Schätzer

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

3 Grundlagen statistischer Tests (Kap. 8 IS)

Wichtige Definitionen und Aussagen

73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Kapitel 3 Schließende Statistik

Chi-Quadrat-Verteilung

Stochastische Unabhängigkeit, bedingte Wahrscheinlichkeiten

Die Familie der χ 2 (n)-verteilungen

Einführung in die Induktive Statistik: Testen von Hypothesen

Mathematik für Biologen

Schwache Konvergenz von W-Verteilungen auf der Zahlengeraden

Blockpraktikum zur Statistik mit R

4.1. Nullhypothese, Gegenhypothese und Entscheidung

Fit for Abi & Study Stochastik

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=

Praktikum zur Statistik

Statistik und Wahrscheinlichkeitsrechnung

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

6. Schätzverfahren für Parameter

Seminar stabile Zufallsprozesse

8. Konfidenzintervalle und Hypothesentests

Klassifikation von Signifikanztests

Anhang: Statistische Tafeln und Funktionen

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Kapitel 3 Schließende Statistik

Kapitel XI - Operationscharakteristik und Gütefunktion

Statistisches Testen

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

5. Stichproben und Statistiken

Kapitel 1: Elemente der Statistik

2.3 Intervallschätzung

5. Spezielle stetige Verteilungen

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

1 wenn Erfolg im j-ten Versuch

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind

Biostatistik, Winter 2011/12

Einführung und Grundlagen

Kapitel VII - Funktion und Transformation von Zufallsvariablen

Kapitel 3 Schließende Statistik

Test auf den Erwartungswert

Statistik II. Statistische Tests. Statistik II

Spezielle stetige Verteilungen

Einführung in die statistische Testtheorie

Kapitel 9. Schätzverfahren und Konfidenzintervalle. 9.1 Grundlagen zu Schätzverfahren

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Kapitel II Kontinuierliche Wahrscheinlichkeitsräume

Klassifikation von Signifikanztests

Kapitel XIV - Anpassungstests

Wahrscheinlichkeit und Statistik BSc D-INFK

2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Vorlesung: Statistik II für Wirtschaftswissenschaft

Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Diskrete Wahrscheinlichkeitstheorie

Übung zu Empirische Ökonomie für Fortgeschrittene SS 2009

5. Seminar Statistik

1.3 Wiederholung der Konvergenzkonzepte

Reelle Zufallsvariablen

Klausur zu Statistik II

2 Aufgaben aus [Teschl, Band 2]

Klausur zur Vorlesung

Kapitel 6. Suffiziente Statistiken. 6.1 Vorbetrachtungen

Willkommen zur Vorlesung Statistik (Master)

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Statistik. Andrej Depperschmidt. Sommersemester 2016

70 Wichtige kontinuierliche Verteilungen

Charakteristische Funktionen

Willkommen zur Vorlesung Statistik (Master)

Grundgesamtheit, Merkmale, Stichprobe. Eigenschaften der Stichprobe. Klasseneinteilung, Histogramm. Arithmetisches Mittel, empirische Varianz

k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr

Klausur Stochastik und Statistik 31. Juli 2012

Statistik II. IV. Hypothesentests. Martin Huber

Wahrscheinlichkeit und Statistik: Zusammenfassung

Biostatistik, Winter 2011/12

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Statistische Intervalle

Lösung Übungsblatt 5

Statistik II. Weitere Statistische Tests. Statistik II

2 Zufallsvariable, Verteilungen, Erwartungswert

Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)

Mathematische Statistik Teil III Testen

Blockpraktikum zur Statistik mit R

Grundlagen der Wahrscheinlichkeitstheorie

8. Formelsammlung. Pr[ ] = 0. 0 Pr[A] 1. Pr[Ā] = 1 Pr[A] A B = Pr[A] Pr[B] DWT 8.1 Gesetze zum Rechnen mit Ereignissen 203/467 Ernst W.

Vorlesung: Statistik II für Wirtschaftswissenschaft

Willkommen zur Vorlesung Statistik (Master)

Statistische Tests für unbekannte Parameter

4 Statistik der Extremwertverteilungen

Probeklausur zu Mathematik 3 für Informatik Lösungshinweise (ohne Garantie auf Fehlefreiheit)

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

Grundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).

Statistische Tests (Signifikanztests)

Transkript:

Kapitel 4 Konfidenzbereiche Wir gehen wieder von einem allgemeinen parametrischen statistischen Modell aus, M, A, P ϑ ; sei eine Funktion des Parameters gegeben, die einen interessierenden Teil-Parameter γϑ beschreibt, γ : Θ G, wobei G eine nicht-leere Menge ist. ϑ Θ Definition 4.1 Bereichsschätzer, Konfidenzbereich Ein Bereichsschätzer für γϑ ist eine Mengen-wertige Abbildung Ŝ : M PG, die in folgendem Sinne messbar ist: { } { } Ŝ z := x M : Ŝx z A z G. Die Wahrscheinlichkeiten P ϑ Ŝ γϑ, ϑ Θ, heißen die Überdeckungswahrscheinlichkeiten des Bereichsschätzers Ŝ für γϑ; wenn für ein gegebenes α 0, 1 gilt: P ϑ Ŝ γϑ 1 α ϑ Θ, dann heißt Ŝ ein 1 α-konfidenzbereich für γϑ. Bemerkung: Intervallschätzer, Konfidenzintervall Im Fall eines reellen Parameters γϑ, d.h. G R, verwendet man meistens Intervall-förmige Bereichsschätzer und Konfidenzbereiche Ŝ, d.h. Ŝx ist ein Intervall in G für jedes x M. Man spricht dann von einem Intervallschätzer bzw. einem Konfidenzintervall für γϑ, und wir schreiben Î statt Ŝ. Bisweilen sind auch einseitige 1 α-konfidenzintervalle von Interesse, also z.b. ein 1 α- Konfidenzintervall Îu der Form Îux = γ u x, G, wobei γ u : M, A R, B 1. Die Statistik γ u heißt dann eine untere 1 α-konfidenzschranke für γϑ. 28

Kapitel 4: Konfidenzbereiche 29 4.1 Allgemeine Resultate Lemma 4.2 Konstruktion eines Konfidenzbereichs durch ein Pivot Sei T z z G eine Familie von Statistiken T z : M N messbar für jedes z G, wobei N, B ein Messraum ist, mit der Eigenschaft, dass die Verteilungen P T γϑ ϑ für alle ϑ Θ identisch sind: Die Familie T z z G nennt man ein Pivot für γϑ. P T γϑ ϑ = Q ϑ Θ. Sei α 0, 1 gegeben, und sei B 0 B mit QB 0 1 α gewählt. Dann ist durch ein 1 α-konfidenzbereich für γϑ gegeben. Ŝx := { z G : T z x B 0 } x M, Bemerkung: Reellwertiges Pivot Im Fall eines reellwertigen Pivot T z z G, also N, B = R, B 1, wählt man meistens B 0 = a 0, b 0, wobei a 0 ein p 1 -Quantil von Q, b 0 ein p 2 -Quantil von Q und p 1, p 2 0, 1 mit p 2 p 1 = 1 α sind. Dann ist in der Tat Q a 0, b 0 = F Q b 0 F Q a 0 p 2 p 1 = 1 α. Die Standardwahl für p 1, p 2 ist: p 1 = α 2 und p 2 = 1 α 2. Aber auch die Wahl B 0 =, b 0 mit einem 1 α-quantil b 0 von Q oder die Wahl B 0 = a 0, mit einem α-quantil a 0 von Q sind bisweilen von Interesse. Lemma 4.3 Konfidenzbereich und nicht-randomisierte Signifikanztests a Sei Ŝ ein 1 α-konfidenzbereich für γϑ. Definiere für jedes z G : { 1, falls z φ z x := Ŝx 0, falls z Ŝx x M. Dann ist φ z z G eine Familie von nicht-randomisierten Tests auf M mit der Eigenschaft P ϑ φz = 1 α ϑ γ 1 {z}, z G. D.h. für jedes z G ist φ z ein nicht-randomisierter α-signifikanztest für das Testproblem H 0,z : γϑ = z gegen H 1,z : γϑ z, sofern γ 1 {z}. b Sei umgekehrt φ z z G eine Familie von nicht-randomisierten Tests auf M mit der Eigenschaft. Dann ist durch Ŝx := { z G : φ z x = 0 } x M, ein 1 α-konfidenzbereich für γϑ gegeben.

Kapitel 4: Konfidenzbereiche 30 Eine allgemeine einfache Methode, aus mehreren Konfidenzbereichen einen neuen Konfidenzbereich zu konstruieren, zeigt das folgende Lemma. Lemma 4.4 Bonferroni-Konstruktionen Seien r N, r 2, α l 0, 1 für l = 1,..., r mit α := r α l < 1. a Für jedes l = 1,..., r sei Ŝl ein 1 α l -Konfidenzbereich für γϑ. Dann ist Ŝx := r Ŝ l x, x M, ein 1 α-konfidenzbereich für γϑ. b Die Menge G Wertevorrat von γ sei das cartesische Produkt von Mengen G 1,..., G r, G = r G l, und γϑ = γ 1 ϑ,..., γ r ϑ, ϑ Θ, mit Funktionen γ l : Θ G l, 1 l r. Für jedes l = 1,..., r sei Ŝl ein 1 α l -Konfidenzbereich für γ l ϑ. Dann ist ein 1 α-konfidenzbereich für γϑ. Ŝx := r Ŝ l x, x M, 4.2 Normalverteilungsmodell In diesem Abschnitt legen wir das Modell mit n 2 u.i.v. Nβ, σ 2 -verteilten Zufallsvariablen zugrunde wobei β R und σ 2 0, die Parameter sind, d.h.: M = R n, P β,σ 2 = Nβ, σ 2 n, β, σ 2 R 0,. Konfidenzintervalle für den Erwartungswert β : Sei γβ, σ 2 = β. wobei x = 1 n Betrachte T z x := n x z x R n, z R, sx x i und sx = x i x 2. 1 n 1 Streng genommen ist für gegebenes z R die Statistik T z nur auf dem Teilbereich {s > 0} von R n definiert. Auf der Menge {s = 0} λ n -Nullmenge sei T z irgendwie messbar definiert, z.b. gleich 0. Die Familie T z z R ist ein Pivot für β mit der Pivotverteilung Q = t n 1 : P T β β,σ 2 = t n 1 β, σ 2, t n 1 die t-verteilung mit n 1 Freiheitsgraden. Lemma 4.2 liefert die nachfolgenden 1 α-konfidenzintervalle entsprechend der Wahl von B 0 als B 0 = t n 1, 1 α, t n 1, 1 α 2 2, bzw. B0 =, t n 1, 1 α, bzw. B0 = t n 1, 1 α,. Dieselben Konfidenzintervalle ergeben sich mit Lemma 4.3 aus den Familien der t-tests φ j,β 0 β 0 R, j = 1, 2, 3, von Theorem 3.4.

Kapitel 4: Konfidenzbereiche 31 Lemma 4.5 Konfidenzintervalle für den Erwartungswert β Wir haben die folgenden 1 α-konfidenzintervalle für β : Îx = x sx t n 1, 1 α n 2 Î u x = Î o x = x sx n t n 1, 1 α, x + sx n t n 1, 1 α 2,, x + sx n t n 1, 1 α x R n ; x R n. x R n ; Konfidenzintervalle für die Varianz σ 2 : Sei γβ, σ 2 = σ 2. Betrachte T z x = x i x 2/ z x R n, z 0,. Die Familie T z z 0, ist ein Pivot für σ 2 mit der Pivotverteilung Q = χ 2 n 1 : P T σ 2 β,σ 2 = χ 2 n 1 β, σ 2. Mit Lemma 4.2 erhalten wir die nachfolgenden Konfidenzintervalle. Diese erhält man mit Lemma 4.3 auch aus den Familien der Chi-Quadrat-Tests von Theorem 3.11 b und Theorem 3.10. Lemma 4.6 Konfidenzintervalle für die Varianz σ 2 Wir haben die folgenden 1 α-konfidenzintervalle für σ 2 : Îx = i x x 2/ χ 2 n 1, 1 α, i x 2 x 2/ χ 2 n 1, α 2 Î u x = x i x 2/ χ 2 n 1, 1 α, x R n ; Î o x = 0, x i x 2/ χ 2 n 1, α x R n. x R n ; 4.3 Binomialmodell Binomialmodell: M = {0, 1..., n}, P p = Bin, p, p 0, 1, n N gegeben. Betrachte die Familien der optimalen einseitigen α-signifikanztests φ j,p 0 p 0, j = 1, 2, von Abschnitt 0, 1 2.3. Allerdings sind dies randomisierte Tests; wir runden sie zu nicht-randomisierten Tests φj,p0 p 0, j = 1, 2, indem wir den Randomisierungswert jeweils durch den Wert 0 ersetzen der 0, 1 Randomisierungsbereich wird also dem Annahmebereich für die Nullhypothese zugeschlagen. Damit ergeben sich wiederum α-signifikanztests für das jeweilige Testproblem, die allerdings nur suboptimal sind. Es ergeben sich die folgenden einseitigen Konfidenzintervalle Konfidenzschranken für p. Dabei bezeichnet F n,p die Verteilungsfunktion von Bin, p.

Kapitel 4: Konfidenzbereiche 32 Untere Konfidenzschranke: Die untere 1 α-konfidenzschranke p u x für p ist die eindeutige Lösung für p 0, 1 der Gleichung F n,p x 1 = 1 α, sofern x 1; im Fall x = 0 ist p u x = 0. Wir haben also das einseitige 1 α-konfidenzintervall für p : Î u x = p u x, 1, x {0, 1..., n}. Obere Konfidenzschranke: Die obere 1 α-konfidenzschranke p o x für p ist die eindeutige Lösung für p 0, 1 der Gleichung F n,p x = α, sofern x n 1; im Fall x = n ist p o x = 1. Wir haben also das einseitige 1 α-konfidenzintervall für p : Î o x = 0, p o x, x {0, 1..., n}. Ein zweiseitiges Konfidenzintervall für p erhalten wir durch Bonferroni-Konstruktion Lemma 4.4 aus den beiden obigen einseitigen Konfidenzintervallen: Zweiseitiges Konfidenzintervall: Ein 1 α-konfidenzintervall für p ist gegeben durch Îx = p u x, p o x, x {0, 1,..., n}, wobei: p u x ist die Lösung für p 0, 1 der Gleichung F n,p x 1 = 1 α 2, sofern x 1; p u0 = 0. p o x ist die Lösung für p 0, 1 der Gleichung F n,p x = α 2, sofern x n 1; p on = 1. Bemerkung: Approximative Konfidenzintervalle durch Normalapproximation Für großes n und gegebenes p 0, 1 ist die Statistik T p x := x np n n x 1 x n, x {1,..., n 1}, beliebig für x = 0, n, unter Bin, p approximativ standard-normal verteilt. Also haben wir für großes n mit T p p 0, 1 ein approximatives Pivot mit Pivotverteilung N0, 1. Es resultieren approximative einseitige 1 α- Konfidenzschranken für p : p u, appr x = x n 1 n p o, appr x = x n + 1 n x 1 x Φ 1 1 α, n n x 1 x Φ 1 1 α. n n

Kapitel 4: Konfidenzbereiche 33 4.4 Exponentialverteilungsmodell Betrachte das Modell mit n u.i.v. Expλ-verteilten Zufallsvariablen X 1,..., X n, wobei λ 0, der Parameter ist : M = 0, n, P λ = Expλ n, λ 0,. Wir wollen Konfidenzbereiche für den Erwartungswert γλ = 1/λ konstruieren. Ein Pivot für 1/λ ist gegeben durch mit der Pivotverteilung Q = χ 2 2n. T z x = 2nx /z, x = x 1,..., x n 0, n, z 0,, Konfidenzintervalle für den Erwartungswert: Wir haben die folgenden 1 α-konfidenzintervalle für 1/λ : 2n x 2n x Îx =, x 0, n ; χ 2 2n,1 α 2 χ 2 2n, α 2 Î u x = Î o x = 2n x χ 2, 2n,1 α 2n x 0, χ 2 2n, α x 0, n ; x 0, n. Anmerkung: Die beiden einseitigen Konfidenzintervalle erhält man auch aus den einseitigen Chi- Quadrat-Tests für den Erwartungswert von Abschnitt 2.3, und den zweiseitigen Konfidenzbereich erhält man auch durch Bonferroni aus den beiden einseitigen.