Kapitel 4 Konfidenzbereiche Wir gehen wieder von einem allgemeinen parametrischen statistischen Modell aus, M, A, P ϑ ; sei eine Funktion des Parameters gegeben, die einen interessierenden Teil-Parameter γϑ beschreibt, γ : Θ G, wobei G eine nicht-leere Menge ist. ϑ Θ Definition 4.1 Bereichsschätzer, Konfidenzbereich Ein Bereichsschätzer für γϑ ist eine Mengen-wertige Abbildung Ŝ : M PG, die in folgendem Sinne messbar ist: { } { } Ŝ z := x M : Ŝx z A z G. Die Wahrscheinlichkeiten P ϑ Ŝ γϑ, ϑ Θ, heißen die Überdeckungswahrscheinlichkeiten des Bereichsschätzers Ŝ für γϑ; wenn für ein gegebenes α 0, 1 gilt: P ϑ Ŝ γϑ 1 α ϑ Θ, dann heißt Ŝ ein 1 α-konfidenzbereich für γϑ. Bemerkung: Intervallschätzer, Konfidenzintervall Im Fall eines reellen Parameters γϑ, d.h. G R, verwendet man meistens Intervall-förmige Bereichsschätzer und Konfidenzbereiche Ŝ, d.h. Ŝx ist ein Intervall in G für jedes x M. Man spricht dann von einem Intervallschätzer bzw. einem Konfidenzintervall für γϑ, und wir schreiben Î statt Ŝ. Bisweilen sind auch einseitige 1 α-konfidenzintervalle von Interesse, also z.b. ein 1 α- Konfidenzintervall Îu der Form Îux = γ u x, G, wobei γ u : M, A R, B 1. Die Statistik γ u heißt dann eine untere 1 α-konfidenzschranke für γϑ. 28
Kapitel 4: Konfidenzbereiche 29 4.1 Allgemeine Resultate Lemma 4.2 Konstruktion eines Konfidenzbereichs durch ein Pivot Sei T z z G eine Familie von Statistiken T z : M N messbar für jedes z G, wobei N, B ein Messraum ist, mit der Eigenschaft, dass die Verteilungen P T γϑ ϑ für alle ϑ Θ identisch sind: Die Familie T z z G nennt man ein Pivot für γϑ. P T γϑ ϑ = Q ϑ Θ. Sei α 0, 1 gegeben, und sei B 0 B mit QB 0 1 α gewählt. Dann ist durch ein 1 α-konfidenzbereich für γϑ gegeben. Ŝx := { z G : T z x B 0 } x M, Bemerkung: Reellwertiges Pivot Im Fall eines reellwertigen Pivot T z z G, also N, B = R, B 1, wählt man meistens B 0 = a 0, b 0, wobei a 0 ein p 1 -Quantil von Q, b 0 ein p 2 -Quantil von Q und p 1, p 2 0, 1 mit p 2 p 1 = 1 α sind. Dann ist in der Tat Q a 0, b 0 = F Q b 0 F Q a 0 p 2 p 1 = 1 α. Die Standardwahl für p 1, p 2 ist: p 1 = α 2 und p 2 = 1 α 2. Aber auch die Wahl B 0 =, b 0 mit einem 1 α-quantil b 0 von Q oder die Wahl B 0 = a 0, mit einem α-quantil a 0 von Q sind bisweilen von Interesse. Lemma 4.3 Konfidenzbereich und nicht-randomisierte Signifikanztests a Sei Ŝ ein 1 α-konfidenzbereich für γϑ. Definiere für jedes z G : { 1, falls z φ z x := Ŝx 0, falls z Ŝx x M. Dann ist φ z z G eine Familie von nicht-randomisierten Tests auf M mit der Eigenschaft P ϑ φz = 1 α ϑ γ 1 {z}, z G. D.h. für jedes z G ist φ z ein nicht-randomisierter α-signifikanztest für das Testproblem H 0,z : γϑ = z gegen H 1,z : γϑ z, sofern γ 1 {z}. b Sei umgekehrt φ z z G eine Familie von nicht-randomisierten Tests auf M mit der Eigenschaft. Dann ist durch Ŝx := { z G : φ z x = 0 } x M, ein 1 α-konfidenzbereich für γϑ gegeben.
Kapitel 4: Konfidenzbereiche 30 Eine allgemeine einfache Methode, aus mehreren Konfidenzbereichen einen neuen Konfidenzbereich zu konstruieren, zeigt das folgende Lemma. Lemma 4.4 Bonferroni-Konstruktionen Seien r N, r 2, α l 0, 1 für l = 1,..., r mit α := r α l < 1. a Für jedes l = 1,..., r sei Ŝl ein 1 α l -Konfidenzbereich für γϑ. Dann ist Ŝx := r Ŝ l x, x M, ein 1 α-konfidenzbereich für γϑ. b Die Menge G Wertevorrat von γ sei das cartesische Produkt von Mengen G 1,..., G r, G = r G l, und γϑ = γ 1 ϑ,..., γ r ϑ, ϑ Θ, mit Funktionen γ l : Θ G l, 1 l r. Für jedes l = 1,..., r sei Ŝl ein 1 α l -Konfidenzbereich für γ l ϑ. Dann ist ein 1 α-konfidenzbereich für γϑ. Ŝx := r Ŝ l x, x M, 4.2 Normalverteilungsmodell In diesem Abschnitt legen wir das Modell mit n 2 u.i.v. Nβ, σ 2 -verteilten Zufallsvariablen zugrunde wobei β R und σ 2 0, die Parameter sind, d.h.: M = R n, P β,σ 2 = Nβ, σ 2 n, β, σ 2 R 0,. Konfidenzintervalle für den Erwartungswert β : Sei γβ, σ 2 = β. wobei x = 1 n Betrachte T z x := n x z x R n, z R, sx x i und sx = x i x 2. 1 n 1 Streng genommen ist für gegebenes z R die Statistik T z nur auf dem Teilbereich {s > 0} von R n definiert. Auf der Menge {s = 0} λ n -Nullmenge sei T z irgendwie messbar definiert, z.b. gleich 0. Die Familie T z z R ist ein Pivot für β mit der Pivotverteilung Q = t n 1 : P T β β,σ 2 = t n 1 β, σ 2, t n 1 die t-verteilung mit n 1 Freiheitsgraden. Lemma 4.2 liefert die nachfolgenden 1 α-konfidenzintervalle entsprechend der Wahl von B 0 als B 0 = t n 1, 1 α, t n 1, 1 α 2 2, bzw. B0 =, t n 1, 1 α, bzw. B0 = t n 1, 1 α,. Dieselben Konfidenzintervalle ergeben sich mit Lemma 4.3 aus den Familien der t-tests φ j,β 0 β 0 R, j = 1, 2, 3, von Theorem 3.4.
Kapitel 4: Konfidenzbereiche 31 Lemma 4.5 Konfidenzintervalle für den Erwartungswert β Wir haben die folgenden 1 α-konfidenzintervalle für β : Îx = x sx t n 1, 1 α n 2 Î u x = Î o x = x sx n t n 1, 1 α, x + sx n t n 1, 1 α 2,, x + sx n t n 1, 1 α x R n ; x R n. x R n ; Konfidenzintervalle für die Varianz σ 2 : Sei γβ, σ 2 = σ 2. Betrachte T z x = x i x 2/ z x R n, z 0,. Die Familie T z z 0, ist ein Pivot für σ 2 mit der Pivotverteilung Q = χ 2 n 1 : P T σ 2 β,σ 2 = χ 2 n 1 β, σ 2. Mit Lemma 4.2 erhalten wir die nachfolgenden Konfidenzintervalle. Diese erhält man mit Lemma 4.3 auch aus den Familien der Chi-Quadrat-Tests von Theorem 3.11 b und Theorem 3.10. Lemma 4.6 Konfidenzintervalle für die Varianz σ 2 Wir haben die folgenden 1 α-konfidenzintervalle für σ 2 : Îx = i x x 2/ χ 2 n 1, 1 α, i x 2 x 2/ χ 2 n 1, α 2 Î u x = x i x 2/ χ 2 n 1, 1 α, x R n ; Î o x = 0, x i x 2/ χ 2 n 1, α x R n. x R n ; 4.3 Binomialmodell Binomialmodell: M = {0, 1..., n}, P p = Bin, p, p 0, 1, n N gegeben. Betrachte die Familien der optimalen einseitigen α-signifikanztests φ j,p 0 p 0, j = 1, 2, von Abschnitt 0, 1 2.3. Allerdings sind dies randomisierte Tests; wir runden sie zu nicht-randomisierten Tests φj,p0 p 0, j = 1, 2, indem wir den Randomisierungswert jeweils durch den Wert 0 ersetzen der 0, 1 Randomisierungsbereich wird also dem Annahmebereich für die Nullhypothese zugeschlagen. Damit ergeben sich wiederum α-signifikanztests für das jeweilige Testproblem, die allerdings nur suboptimal sind. Es ergeben sich die folgenden einseitigen Konfidenzintervalle Konfidenzschranken für p. Dabei bezeichnet F n,p die Verteilungsfunktion von Bin, p.
Kapitel 4: Konfidenzbereiche 32 Untere Konfidenzschranke: Die untere 1 α-konfidenzschranke p u x für p ist die eindeutige Lösung für p 0, 1 der Gleichung F n,p x 1 = 1 α, sofern x 1; im Fall x = 0 ist p u x = 0. Wir haben also das einseitige 1 α-konfidenzintervall für p : Î u x = p u x, 1, x {0, 1..., n}. Obere Konfidenzschranke: Die obere 1 α-konfidenzschranke p o x für p ist die eindeutige Lösung für p 0, 1 der Gleichung F n,p x = α, sofern x n 1; im Fall x = n ist p o x = 1. Wir haben also das einseitige 1 α-konfidenzintervall für p : Î o x = 0, p o x, x {0, 1..., n}. Ein zweiseitiges Konfidenzintervall für p erhalten wir durch Bonferroni-Konstruktion Lemma 4.4 aus den beiden obigen einseitigen Konfidenzintervallen: Zweiseitiges Konfidenzintervall: Ein 1 α-konfidenzintervall für p ist gegeben durch Îx = p u x, p o x, x {0, 1,..., n}, wobei: p u x ist die Lösung für p 0, 1 der Gleichung F n,p x 1 = 1 α 2, sofern x 1; p u0 = 0. p o x ist die Lösung für p 0, 1 der Gleichung F n,p x = α 2, sofern x n 1; p on = 1. Bemerkung: Approximative Konfidenzintervalle durch Normalapproximation Für großes n und gegebenes p 0, 1 ist die Statistik T p x := x np n n x 1 x n, x {1,..., n 1}, beliebig für x = 0, n, unter Bin, p approximativ standard-normal verteilt. Also haben wir für großes n mit T p p 0, 1 ein approximatives Pivot mit Pivotverteilung N0, 1. Es resultieren approximative einseitige 1 α- Konfidenzschranken für p : p u, appr x = x n 1 n p o, appr x = x n + 1 n x 1 x Φ 1 1 α, n n x 1 x Φ 1 1 α. n n
Kapitel 4: Konfidenzbereiche 33 4.4 Exponentialverteilungsmodell Betrachte das Modell mit n u.i.v. Expλ-verteilten Zufallsvariablen X 1,..., X n, wobei λ 0, der Parameter ist : M = 0, n, P λ = Expλ n, λ 0,. Wir wollen Konfidenzbereiche für den Erwartungswert γλ = 1/λ konstruieren. Ein Pivot für 1/λ ist gegeben durch mit der Pivotverteilung Q = χ 2 2n. T z x = 2nx /z, x = x 1,..., x n 0, n, z 0,, Konfidenzintervalle für den Erwartungswert: Wir haben die folgenden 1 α-konfidenzintervalle für 1/λ : 2n x 2n x Îx =, x 0, n ; χ 2 2n,1 α 2 χ 2 2n, α 2 Î u x = Î o x = 2n x χ 2, 2n,1 α 2n x 0, χ 2 2n, α x 0, n ; x 0, n. Anmerkung: Die beiden einseitigen Konfidenzintervalle erhält man auch aus den einseitigen Chi- Quadrat-Tests für den Erwartungswert von Abschnitt 2.3, und den zweiseitigen Konfidenzbereich erhält man auch durch Bonferroni aus den beiden einseitigen.