Signifikanztests Optimalitätstheorie

Ähnliche Dokumente
Punktschätzer Optimalitätskonzepte

Einführung in die statistische Testtheorie

Mathematische Statistik Aufgaben zum Üben. Schätzer

2.2 Klassische Testtheorie

Reelle Zufallsvariablen

Wichtige Definitionen und Aussagen

3 Grundlagen statistischer Tests (Kap. 8 IS)

Kapitel XI - Operationscharakteristik und Gütefunktion

Einführung und Grundlagen

Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

Induktive Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung

7. Hypothesentests. Ausgangssituation erneut: ZV X repräsentiere einen Zufallsvorgang. X habe die unbekannte VF F X (x)

DWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr

Stochastische Unabhängigkeit, bedingte Wahrscheinlichkeiten

Suffizienz und Vollständigkeit

Kapitel 6. Suffiziente Statistiken. 6.1 Vorbetrachtungen

Einführung in die Induktive Statistik: Testen von Hypothesen

Schwache Konvergenz von W-Verteilungen auf der Zahlengeraden

4 Messbare Funktionen

Kapitel 3 Schließende Statistik

Allgemeines zu Tests. Statistische Hypothesentests

3. Gemeinsame und bedingte Verteilung, stochastische Unabhängigkeit

Die Familie der χ 2 (n)-verteilungen

Scheinklausur zur Vorlesung Stochastik II

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

Konvergenz gegen einen Prozess mit unabhängigen Zuwächsen - Anwendungen

Kapitel VIII - Tests zum Niveau α

4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion

5. Stichproben und Statistiken

Schwache Konvergenz von W-Verteilungen

Statistik II. Statistische Tests. Statistik II

Statistik. Andrej Depperschmidt. Sommersemester 2016

Finite Elemente Methode für elliptische Differentialgleichungen

Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen

Kapitel 13. Grundbegriffe statistischer Tests

Kapitel IX - Neyman-Pearson-Tests

Statistik und Wahrscheinlichkeitsrechnung

OLS-Schätzung: asymptotische Eigenschaften

Zufallsvariable, Verteilung, Verteilungsfunktion

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Charakteristische Funktionen

Statistik I für Betriebswirte Vorlesung 14

2. Prinzipien der Datenreduktion

Risikotheorie. (Stochastische Risikomodellierung und statistische Methoden) Fachbereich Mathematik, Aktuarswissenschaften Hochschule Regensburg

Zusammenfassung der Lebesgue-Integrationstheorie

Formelsammlung zur Vorlesung Schätzen und Testen I

Zulassungsprüfung Stochastik,

Vorlesung Mathematische Statistik. Inhalt in Stichworten. Reinhard Höpfner. Vorlesung 2004/2005 und 2007/2008

12 Der Gaußsche Integralsatz

3.3 Methoden zur Evaluierung von Schätzern

Extremalpunkte und der Satz von Krein-Milman. 1 Lokalkonvexe topologische Vektorräume

1.3 Zufallsvariablen

6. Statistische Hypothesentests

Bootstrap-Methoden zur Ermittlung kritischer Werte für asymptotische FWER-Kontrolle

2.3 Basis und Dimension

2. Ein Zufallsvektor X IR d ist multivariat normal verteilt dann und nur dann wenn seine charakteristische Funktion folgendermaßen gegeben ist:

Nachholklausur zur Vorlesung Schätzen und Testen I. 04. April Bitte ausfüllen und unterschreiben!!!

Lösung zu den Übungsaufgaben zur Lebesgueschen Integrationstheorie. Tobias Ried

Statistik II für Betriebswirte Vorlesung 1

Darstellungssatz von Riesz in vollständig regulären Räumen. Carina Pöll Wintersemester 2012

Lösungsmenge L I = {x R 3x + 5 = 9} = L II = {x R 3x = 4} = L III = { }

Chi-Quadrat-Verteilung

Klausur zur Vorlesung

Stochastik I. Vorlesungsmitschrift

Klassifikation von Signifikanztests

Elemente in Φ werden Wurzeln genannt. Bemerkung 3.2. (a) Zu einem Wurzelsystem können wir immer eine Spiegelungsgruppe definieren

Vorlesung 7b. Unabhängigkeit bei Dichten. und die mehrdimensionale Standardnormalverteilung

Zufallsvariablen. Diskret. Stetig. Verteilung der Stichprobenkennzahlen. Binomial Hypergeometrisch Poisson. Normal Lognormal Exponential

Mathematische Grundlagen für die Vorlesung. Differentialgeometrie

Einführung in die Statistik Kapitel 6: Crash-Course in Statistik: Testtheorie

Zufallsvariablen [random variable]

Das Lebesgue-Maß im R p

Kapitel 4. Stochastische Grundlagen. 4.1 Filtrationen und Stoppzeiten

1 Relevante Beispiele für Verteilungen auf R

Kapitel 1: Elemente der Statistik

Wahrscheinlichkeitsrechnung und Statistik

Stochastik für die Naturwissenschaften

1. Übungsblatt zur Statistik III - Schätzen und Testen

Einführung in die Stochastik 6. Übungsblatt

Parameterschätzung. Kapitel 14. Modell Es sei {P θ θ Θ}, Θ R m eine Familie von Verteilungen auf χ (sog. Stichprobenraum),

68 Abschätzungen für Abweichungen vom Erwartungswert

4.1. Nullhypothese, Gegenhypothese und Entscheidung

8. Konfidenzintervalle und Hypothesentests

Übungen zu bedingten Erwartungswerten. Tutorium Stochastische Prozesse 13. Dezember 2016

Multivariate Verteilungen

Vorlesung: Statistik II für Wirtschaftswissenschaft

Transkript:

Kapitel Signifikanztests Optimalitätstheorie Randomisierte Tests In einem statistischen Modell M, A, P ϑ sei ein Testproblem gegeben: H : ϑ Θ gegen H : ϑ Θ ; wobei also durch Θ Θ Θ eine Zerlegung des Parameterbereichs gegeben ist Ein nicht-randomisierter Test ϕ ist eine Entscheidungsregel, die zwischen den beiden Hypothesen H und H entscheidet auf Grund einer Beobachtung x M : ϕ : M, A, }, P, } ; mit der Kodierung / für Entscheidung für H /H Hinsichtlich der Optimalitätstheorie für Signifikanztests ist es mathematisch vorteilhaft, den Begriff eines Tests zu relaxieren: Definition Randomisierter Test Sei ein Testproblem wie oben gegeben Ein randomisierter Test ist eine messbare Funktion ϕ : M, A [, ], B [, ] Für einen randomisierten Test ϕ heißen E ϑ ϕ für alle ϑ Θ Fehlerwahrscheinlichkeiten erster Art des Tests ϕ, und E ϑ ϕ für alle ϑ Θ Fehlerwahrscheinlichkeiten zweiter Art des Tests ϕ; die Funktion des Parameters ϑ Θ, E ϑ ϕ für alle ϑ Θ, heißt die Gütefunktion engl power function von ϕ Ein randomisierter Test ϕ heißt ein α-niveau-signifikanztest oder kurz ein α-signifikanztest, wobei α,, wenn E ϑ ϕ α ϑ Θ 8

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie 9 Im Folgenden lassen wir den Zusatz randomisierter Test fort und verwenden einfach die Bezeichnung Test Die ursprünglichen --wertigen Tests die für die Anwendungen natürlich am wichtigsten sind nennen wir nicht-randomisierte Tests Die Begriffe Fehlerwahrscheinlichkeiten erster / zweiter Art, α- Signifikanztest sowie Gütefunktion, die sich aus Definition speziell für nicht-randomisierte Tests ergeben, sind dieselben wie früher definiert Bemerkung: Testproblem als Schätzproblem Wir können das Testproblem auch als Schätzproblem für den --wertigen Parameter γϑ : Θ ϑ auffassen Fassen wir auf: γ : Θ G : [, ], so ist ein Schätzer für γϑ Θ ϑ dasselbe wir ein Test ϕ Wir nehmen als Verlustfunktion die absolute Abweichung, die hier Neyman-Pearson- Verlustfunktion genannt wird: Lz, ϑ z Θ ϑ z, falls ϑ Θ z, falls ϑ Θ z [, ] ϑ Θ Als Risikofunktion eines Tests ϕ ergeben sich dann die Fehlerwahrscheinlichkeiten aus Definition : Eϑ ϕ, falls ϑ Θ Rϕ, ϑ E ϑ ϕ, falls ϑ Θ Definition Gleichmäßig optimaler α-signifikanztest, engl: UMP Level-α Test Seien ein Testproblem wie oben gegeben und ein α, Ein α-signifikanztest ϕ heißt gleichmäßig optimaler α-signifikanztest, engl uniformly most powerful level-α test, wenn für jeden anderen α-signifikanztest ϕ gilt: E ϑ ϕ E ϑ ϕ ϑ Θ Einfache Hypothesen: Neyman-Pearson-Lemma Zunächst ein kleiner w-theoretischer Einschub über Quantile von W-Verteilungen auf B Borel sche Sigma-Algebra in R Mit WB sei die Menge aller W-Verteilungen auf B bezeichnet Definition 3 Quantile einer W-Verteilung P WB Seien P WB und p, Eine reelle Zahl c heißt ein p-quantil von P, wenn gilt: P, c ] p und P, c p Bemerkung: Bezeichne F die Verteilungsfunktion von P Offensichtlich, für c R und p, : c ist ein p-quantil von P F c p und F c p

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie Lemma 4 Die Menge aller p-quantile von P WB Seien P WB und p, Dann gilt: a Die Menge aller p-quantile von P ist ein nicht-leeres kompaktes Intervall [ c, c ], wobei c min x R : F x p } und c max x R : F x p }, und F die Verteilungsfunktion von P bezeichnet b Für c R sind die folgenden drei Bedingungen i, ii und iii äquivalent i c ist ein p-quantil von P ii Es existiert ein ρ [, ] mit P, c + ρ P c} p iii Es existiert ein ρ [, ] mit P c, + ρ P c} p Das folgende Theorem Fundamental-Lemma von Neyman & Pearson bezieht sich auf die folgende simple Situation: Gegeben sei ein statistisches Modell mit einem zwei-elementigen Parameterraum, also Θ, Θ ϑ, ϑ }, M, A, P ϑ, P ϑ ; wir betrachten das einfache Testproblem H : ϑ ϑ gegen H : ϑ ϑ Theorem 5 Neyman-Pearson-Lemma Sei ein einfaches Testproblem wie oben gegeben und α, Seien noch ein sigma-endliches Maß µ auf A und reellwertige µ-dichten f von P ϑ und f von P ϑ gegeben Dann gilt : Es existiert ein Test ϕ mit den unten genannten Eigenschaften i und ii, und jeder solche Test ist ein optimaler α-signifikanztest für das einfache Testproblem i E ϑ ϕ α ii Es existiert ein K [,, so dass ϕ x, falls f x K f x für alle x M Bemerkungen: Ein sigma-endliches Maß µ auf A und µ-dichten von P ϑj, j,, existieren immer: ZB ist µ : P ϑ + P ϑ ein endliches Maß auf A, und dieses dominiert die beiden W-Verteilungen P ϑ und P ϑ jede µ-nullmenge in A ist auch eine P ϑj -Nullmenge, j, Nach dem Satz von Radon-Nikodym existieren daher µ-dichten von P ϑj, j, Eine vollständige Formel für einen optimalen α-signifikanztest ϕ von Theorem 5 ist: ϕ x ρ, falls f x K f x x M,

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie wobei K [, und ρ [, ] Lösung der folgenden Gleichung sind: P ϑ f Kf + ρ Pϑ f Kf α Dh nach Lemma 4, Teil iii: K ist ein α-quantil von P q ϑ, wobei q der Dichtequotient ist, q : M R, qx : f x/f x, falls f x, falls f x 3 Verteilungsfamilien mit isotonen Dichtequotienten Die hier betrachteten statistischen Modelle beinhalten nur einen reellen Parameter, dh ihr Parameterbereich Θ ist eine Teilmenge von R, in der Regel ein Intervall Definition 6 Familie mit isotonen DQ, engl: Monotone Likelihood Ratio Seien M, A, P ϑ, mit Θ R, ein statistisches Modell und T : M, A R, B Die Verteilungsfamilie P ϑ heißt eine Familie mit isotonen Dichtequotienten in der Statistik T, wenn gilt: Es existieren ein sigma-endliches Maß µ auf A und reelle µ-dichten f ϑ von P ϑ für alle ϑ Θ mit der folgenden Eigenschaft Zu jedem Paar ϑ, ϑ Θ mit ϑ ϑ existiert eine isotone Funktion q ϑ,ϑ : R [, ] mit f ϑ x f ϑ x q ϑ,ϑ T x x f ϑ } f ϑ }, wobei hier a : für a R, a definiert sei Jetzt ein kleiner w-theoretischer Exkurs: Definition 7 Stochastische Halbordnung auf WB Seien P, Q WB und F P und F Q ihre Verteilungsfunktionen Dann wird definiert: P st Q def F P x F Q x x R Bemerkung: Offensichtlich gilt die Äquivalenz: P st Q P x, Q x, x R Wie man leicht sieht, gilt auch die Äquivalenz: Lemma 8 P st Q P [ x, Q [ x, x R Seien P, Q WB Dann sind die beiden folgenden Bedingungen i und ii äquivalent i P st Q ii E P ψ E Q ψ für jede nicht-negative isotone Funktion ψ : R R

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie Lemma 9 Familie mit isotonen DQ und stochastische Halbordnung Sei M, A, P ϑ, mit Θ R, ein statistisches Modell mit isotonen DQ in einer Statistik T : M, A R, B Dann ist die Familie der Verteilungen dieser Statistik, Pϑ T, ϑ Θ, stochastisch isoton, dh es gilt: P T ϑ st P T ϑ ϑ, ϑ Θ mit ϑ ϑ In einem einparametrigen statistischen Modell dh Θ R sind oft sog einseitige Testprobleme von Interesse: TP H : ϑ ϑ gegen H : ϑ ϑ, und auch ein umgekehrtes Testproblem: TP H : ϑ ϑ gegen H : ϑ ϑ Dabei ist jeweils ϑ Θ gegeben Im Testproblem TP sind also Θ, ϑ ] Θ und Θ ϑ, Θ; natürlich wird bei der Betrachtung von TP vorausgesetzt, dass Θ Entsprechendes gilt für Testproblem TP Theorem Einseitige Testprobleme für Familien mit isotonen DQ Sei M, A, P ϑ, mit Θ R, ein statistisches Modell mit isotonen DQ in einer Statistik T : M, A R, B Sei ein α, gegeben Dann gilt: Ein gleichmäßig optimaler α-signifikanztest für das Testproblem TP ist gegeben durch: ϕ x ρ, falls T x c x M, wobei c ein α-quantil von P T ϑ und ρ [, ] sind mit P T ϑ c, + ρ P T ϑ c } α Ein gleichmäßig optimaler α-signifikanztest für das Testproblem TP ist gegeben durch: ϕ x ρ, falls T x c x M, wobei c ein α-quantil von P T ϑ und ρ [, ] sind mit P T ϑ, c + ρ P T ϑ c } α

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie 3 Bemerkung: Im Fall, dass die Verteilung Pϑ T eine stetige Verteilungsfunktion besitzt, ist Pϑ T cj }, j,, so dass wir ρ und ρ gleich Null wählen können Dann sind also die gleichmäßig optimalen α-signifikanztests ϕ und ϕ nicht-randomisierte Tests: ϕ x, falls T x c, ϕ x, falls T x c Das Binomialmodell, das vereinfachte Normalverteilungsmodell und das Exponentialverteilungsmodell sind Beispiele für Familien mit isotonen Dichtequotienten, s Abschnitt 4 unten Die optimalen einseitigen Signifikanztests gemäß Theorem lauten wie folgt Beispiel: Einseitige Binomialtests Statistisches Modell: M,,, n}, P p Bin, p, p, Für ein gegebenes p, betrachten wir die beiden einseitigen Testprobleme ϕ x TP H : p p gegen H : p p ; TP H : p p gegen H : p p Es liegt eine Familie mit isotonen DQ in der Statistik T x x, x M,, n} vor Die gleichmäßig optimalen α-signifikanztests ϕ und ϕ für TP und TP lauten: ρ, falls x c, ϕ x ρ, falls x die kritischen Werte c und c und die Randomisierungswerte ρ und ρ sind mit Bezeichnungen: F n,p die Verteilungsfunktion und f n,p die Zähldichte der Bin, p -Verteilung } c min i,,, n} : F n,p i α, ρ F n,p c α f n,p c } c max i,,, n} : F n,p i α, ρ α F n,p c f n,p c c ; ; Die Ablehnungsbereiche der Tests ϕ und ϕ für jedes x,,, n} gilt: lassen sich auch in P-Value-Darstellungen angeben, da ϕ x F n,p x α, ϕ x F n,p x α Beispiel: Einseitige Gauß-Tests Vereinfachtes Normalverteilungsmodell: M R n, A B n, P β n Nβ, σ, β R; σ gegeben Für ein gegebenes β R betrachten wir die beiden einseitigen Testprobleme TP H : β β gegen H : β β ; TP H : β β gegen H : β β Es liegt eine Familie mit isotonen DQ in der Statistik T x n x i, x x,, x n R n vor Wegen Pβ T Nnβ, nσ

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie 4 sind ρ und ρ wählbar und c nβ + n σ Φ α, c nβ + n σ Φ α Wir erhalten die einseitigen Gauß-Tests: ϕ x, falls n x β σ Φ α, und ϕ x, falls n x β σ Φ α Beispiel: Exponentialverteilungsmodell Statistisches Modell: M R n, A B n, P ϑ n Exp/ϑ, ϑ, ; Für ein gegebenes ϑ, betrachten wir die beiden einseitigen Testprobleme TP H : ϑ ϑ gegen H : ϑ ϑ, TP H : ϑ ϑ gegen H : ϑ ϑ Es liegt eine Verteilungsfamilie mit isotonen DQ in der Statistik T x x x,, x n R n vor Wegen P T ϑ Gan, /ϑ sind ρ und ρ wählbar und somit: ϕ n x, falls x i c und ϕ x n, falls x i, n x i c, wobei c F Gan,/ϑ α und c F Gan,/ϑ α α-quantil und α-quantil von Gan, /ϑ Eine optisch andere Darstellung der Tests als Chi-Quadrat-Tests ist üblich: Wegen und ϕ x n ϑ F Gan,/ϑ x i F nx Gan,/ϑ α ϑ α F, falls n x ϑ Gan,/ F α und ϕ χ x n F ϑ Gan,/ϑ α, α F α, und entsprechend für ϕ χ, n n x, falls ϑ F α χ n 4 Exponentialfamilien Definition Ein-parametrige Exponentialfamilie Seien M, A, P ϑ, Θ irgendein Parameterbereich, ein statistisches Modell und T : M, A R, B sowie b : Θ R Die Verteilungsfamilie P ϑ heißt eine ein-parametrige Exponentialfamilie in b und T, wenn gilt: Es existieren ein sigma-endliches Maß µ auf A und µ-dichten f ϑ von P ϑ für alle ϑ Θ der Form f ϑ x aϑ hx exp bϑ T x, x M, ϑ Θ, mit zwei Funktionen h : M, A R, B, h, und a : Θ,

Norbert Gaffke: Vorlesung Mathematische Statistik, Wintersemester / Kapitel : Signifikanztests Optimalitätstheorie 5 Lemma Wenn die Verteilungsfamilie P ϑ, wobei Θ R, eine ein-parametrige Exponentialfamilie in b und T ist und die Funktion b isoton ist, dann ist die Verteilungsfamile auch eine Familie mit isotonen Dichtequotienten in T Beispiele Binomialverteilungsmodell: Die Familie Bin, p ist eine ein-parametrige Exponentialfamilie in bp ln p p, p, p,, und T x x, x,,, n} n Vereinfachtes Normalverteilungsmodell: Die Familie Nβ, σ ist eine ein-parametrige β R Exponentialfamilie in bβ β/σ, β R, und T x n x i, x x,, x n R n n 3 Exponentialverteilungsmodell: Die Familie Exp/ϑ ist eine ein-parametrige Exponentialfamilie in bϑ /ϑ, ϑ,, und T x Der Begriff der Exponentialfamilie wird verallgemeinert: n ϑ, x i, x x,, x n R n Definition 3 k-parametrige Exponentialfamilie Seien M, A, P ϑ, Θ irgendein Parameterbereich, ein statistisches Modell, k N und T T,, T k : M, A R k, B k sowie b b,, b k : Θ R k Die Verteilungsfamilie P ϑ heißt eine k-parametrige Exponentialfamilie in b und T, wenn gilt: Es existieren ein sigma-endliches Maß µ auf A und µ-dichten f ϑ von P ϑ für alle ϑ Θ der Form k f ϑ x aϑ hx exp b j ϑ T j x, x M, ϑ Θ, j mit zwei Funktionen h : M, A R, B, h, und a : Θ, Beispiel: Normalverteilungsmodell Statistisches Modell: R n, B n, n Nβ, σ β,σ R, Die Verteilungsfamilie ist eine -parametrige Exponentialfamilie in bβ, σ β σ, σ und T x n x i, n x i Beispiel: Lineares Normalverteilungsmodell Statistisches Modell: R n, B n, NBβ, σ I n, β,σ R k, mit einer gegebenen n k Matrix B, Vektoren hier als Spaltenvektoren geschrieben Die Verteilungsfamilie ist eine k + -parametrige Exponentialfamilie in bβ, σ β σ B t x und T x x t x σ