3 Schließende Statistik im Normalverteilungsmodell

Ähnliche Dokumente
11 Likelihoodquotiententests

Tests statistischer Hypothesen

3. Grundbegrie der Schätztheorie

Wirksamkeit, Effizienz

Empirische Verteilungsfunktion

Streukreisberechnungen bei ballistischen Versuchen unter der zweidimensionalen Normalverteilungsannahme

Kapitel 6 : Punkt und Intervallschätzer

Wahrscheinlichkeitsrechnung & Statistik - Ergänzung zum Skript

Eingangsprüfung Stochastik,

Konfidenzintervalle. Praktische Übung Stochastik SS 2017 Lektion 10 1

Statistik und Wahrscheinlichkeitsrechnung

Statistik, Abschnitt (1) Gegeben sei der Stichprobenvektor (X 1,..., X n ). Die Stichprobenfunktion. ˆµ k := 1 n. Xi k (1) i=1.

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

1. Einführung. 1 A (T (x 1,..., x n )) P θ (dx 1 )... P θ (dx n ) X. P θ {T n (X 1,..., X n ) A} =

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

3 Vergleich zweier unverbundener Stichproben

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Wirksamkeit, Effizienz

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Statistische Modelle und Parameterschätzung

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Kapitel 5: Schließende Statistik

2. Repetition relevanter Teilbereiche der Statistik

Wahrscheinlichkeitstheorie und Statistik vom

Parameterschätzung. Numero, pondere et mensura Deus omnia condidit

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Maximum Likelihood Version 1.6

2 Induktive Statistik

Formelsammlung Statistik 29. Januar 2019

Kovarianz und Korrelation

Schätzen von Populationswerten

4 Schwankungsintervalle Schwankungsintervalle 4.2

Prof. Dr. Holger Dette Musterlösung Statistik I Sommersemester 2009 Dr. Melanie Birke Blatt 5

Parameterschätzung. Kapitel Schätzfunktionen

Auszüge der nichtparametrischen Statisik

5 Allgemeine Verfahren zum Testen von Hypothesen

Statistik und Wahrscheinlichkeitsrechnung

Einführung in die Stochastik 10. Übungsblatt

Schätzen von Populationswerten

D-MATH Topologie FS 15 Theo Bühler. Musterlösung 2

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Kapitel 9: Schätzungen

X in einer Grundgesamtheit vollständig beschreiben.

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Diplomvorprüfung Stochastik

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Kompaktheit und gleichgradige Stetigkeit. 1 Einführung in die Kompaktheit in C 0

Ökonometrie Formeln und Tabellen

5. Übungsblatt - Lösungsskizzen

6 Vergleich mehrerer unverbundener Stichproben

5.4.2 Die empirische Verteilungsfunktion als Ausgangspunkt

X X Schätzen von Vertrauensintervallen Schwankungsintervall

3 Exponentielle Familien

Statistik und Wahrscheinlichkeitsrechnung

Vorbereitung auf 6. Übungsblatt (Präsenzübungen) - Lösungen

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

Wiederholung: Linearer Ausgleich 1. Linearer Ausgleich. Vorlesung April. Aufgabe Gegeben Naturgesetz

mit (a 1 ) (0,0,,0). Dann ist die Menge,,a n,a 2 eine endliche Menge und besitzt ein grösstes Element ggt(a 1

Statistik und Wahrscheinlichkeitsrechnung

Empirische Ökonomie 1 Sommersemester Formelsammlung. Statistische Grundlagen. Erwartungswert und Varianz einer Zufallsvariable.

Stochastik I (Statistik)

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

5-1 Elementare Zahlentheorie

4.2 Methoden um Tests zu finden: Likelihood Quotienten Tests (LRT) Falls X 1,..., X n iid aus f(x θ), so gilt für die Likelihood Funktion

Statistische Tests zu ausgewählten Problemen

Multivariate Analysemethoden und Multivariates Testen

3 Folgen, Reihen, Grenzwerte 3.1 Zahlenfolgen. Beispiele: 1, 2, 3, 4, 5,. 1, 3, 5, 7, 9, 3, 6, 9, 12, 15, 2, 4, 8, 16, 32, 64, 10, 100, 1.000, 10.

2 Einführung in die mathematische Statistik

1. Wahrscheinlichkeitsrechnung. 2. Diskrete Zufallsvariable. 3. Stetige Zufallsvariable. 4. Grenzwertsätze. 5. Mehrdimensionale Zufallsvariable

4 Konvergenz von Folgen

D-ITET Wahrscheinlichkeitstheorie und Statistik FS 2017 Prof. P. Nolin. Musterlösung 11 = Φ( 6/5) = 1 Φ(6/5) = = 0.

Methoden zur Konstruktion von Schätzern

Herleitung der Parameter-Gleichungen für die einfache lineare Regression

Lineare Abbildungen und Matrizen

Analysis I Lösungsvorschläge zum 3. Übungsblatt Abgabe: Bis Donnerstag, den , um 11:30 Uhr

Klausur zu,,einführung in die Wahrscheinlichkeitstheorie. Musterlösungen

Kapitel 6 Differenzierbarkeit

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Inhaltsverzeichnis. Wirtschaftswissenschaftliches Zentrum 11 Universität Basel. Mathematik 2

Analysis I für M, LaG/M, Ph 4.Übungsblatt

Zusammenfassung: Folgen und Konvergenz

Leitfaden Bielefeld SS 2007 III-4

Übungen zur Analysis 1 für Informatiker und Statistiker. Lösung zu Blatt 8

Formelsammlung. PD Dr. C. Heumann

Maschinelle Sprachverarbeitung: Mathematische Grundlagen

Methode der kleinsten Quadrate

Gaußsches Integral und Stirling-Formel

}) = ϑ Einsen (1 ϑ) Nullen,

Übungsblatt 9 zur Vorlesung. Statistische Methoden

10. Übungsblatt zur Einführung in die Stochastik

Für eine n n-matrix A müssen wir die Gleichung. lösen. Falls (A λi) invertierbar ist, dann ist. Dann ist aber λ kein Eigenwert.

Nicht-Anwendbarkeit des Master- Theorems

Langrange-Multiplikators und Hinreichende Bedingungen

Musterlösung. Prüfung Statistik Herbstsemester 2011

3.2 Wilcoxon Rangsummentest

Transkript:

3 Schließede Statistik im Normalverteilugsmodell 3.1 Kurze Erierug a Schätze ud Teste i parametrische Modelle Sei X 1,..., X eie Stichprobe uabhägig idetisch verteilter ZVe mit Verteilug F θ, ud Dichte f θ, θ Θ, Θ R k offe, ud X = (X 1,..., X ) die zugehörige Datematrix. Defiitio 3.1. Scorefuktio, Fisher-Iformatio Die Score-Fuktio s : R k R k ist der Gradiet der Log-Likelihood. ( ) s(θ; X) = θ log L(θ; X) = θ log 1 f θ (X i ) = f θ (X i ) θ f θ(x i ) Erierug 1: die Likelihood L(θ; X) ist die gemeisame Dichte der Date iterpretiert als Fuktio des ubekate Parameters θ. Erierug 2: der Gradiet φ eier Fuktio φ : R k R ist der Vektor der partielle Ableituge als Spalte geschriebe, also ψ(x) = (Dψ(x)).) Die Iformatiosmatrix vo Fisher ist die Kovariazmatrix F = Var(s(θ; X)). Bemerkug 3.2. Für X 1,..., X uabhägig idetisch verteilt gilt F = F 1. Beispiel 3.3. Sei F θ = N d (µ, I d ), d.h. θ = µ, Θ = R d. ( s(θ; X) = µ log (2π) 2d exp = (X i µ) = (X µ) 1 2 (X i µ) (X i µ) }) F = Var ( (X µ) ) = I d 35

Satz 3.4. (Cramér-Rao) Für jede uverzerrte Schätzer T = T(X) vo θ gilt uter Regularitätsbediguge Var(T ) F 1. Gilt =, so et ma de Schätzer T effiziet. Satz 3.5. Seie X 1,..., X i.i.d. mit Verteilug F θ. Sei ˆθ = arg max θ Θ der ML-Schätzer für θ. Da gilt uter Regularitätsaahme log L(θ; X) a) d ( ) (ˆθ θ) N d 0, F 1, 1 d. h. der ML-Schätzer ist asymptotisch uverzerrt, effiziet ud ormalverteilt. b) (ˆθ θ) ˆ F 1 (ˆθ θ) d χ 2 d, wobei ˆ F 1 ei kosisteter Schätzer vo F 1 ist. Daher ist θ : (ˆθ θ) } Fˆ 1 (ˆθ θ) χ 2 d;1 α ei asymptotisches Kofidezellipsoid für θ zum Niveau 1 α. Seie Θ 0, Θ 1 Θ ud Θ 0 Θ 1 =. Wir möchte H 0 : θ Θ 0 gege H 1 : θ Θ 1 teste. Der Likelihood-Quotiete-Test (LRT) leht H 0 ab, falls der Likelihood- Quotiet (LR) LR(Θ 0, Θ 1 ; X) = max L(θ; X) θ Θ 0 max L(θ; X) θ Θ 1 kleie Werte aimmt. Häufig betrachtet ma statt LR(Θ 0, Θ; X) die mooto (falled) trasformierte Teststatistik λ(θ 0, Θ 1 ; X) = 2 log LR(Θ 0, Θ 1 ; X) ( ) = 2 max log L(θ, X) max log L(θ, X). θ Θ 1 θ Θ 0 H 0 wird für große Werte vo λ abgeleht. 36

Satz 3.6. Sei Θ 0 ei m-dimesioaler Uterraum vo Θ R k ud Θ 1 = Θ \ Θ 0. Da gilt uter Regularitätsbediguge λ(θ 0, Θ 1 ; X) d χ 2 k m für alle θ Θ 0 (also uter H 0 ). Damit ergibt sich für de LRT der asymptotische Ablehugsbereich R = X : λ(θ 0, Θ 1 ; X) > χ 2 k m;1 α}. 3.2 Schätze Das Normalverteilugsmodell Im Folgede betrachte wir folgedes statistisches Modell } N d (µ, Σ) µ R d, Σ R d d symmetrisch, positiv defiit 4. 11. 2013 7. Vorlesug Der Parameter i diesem Modell ist θ = (µ, Σ). Da Σ symmetrisch ist, ist der Parameter eigetlich k = d + d(d + 1)/2 dimesioal. Der eigetliche Parametervektor ist θ = (µ 1,..., µ d, σ 11, σ 21,..., σ d1, σ 2,2,..., σ d,2,..., σ dd ) R d(d+3)/2. Diese Symmetrie-Redudaz i der Darstellug θ = (µ, Σ) ist icht problematisch, aber lästig, we ma z. B. ach θ ableite möchte. Ei Versuch, de Parameter-Raum präzise azugebe: Sei v : R d d R d(d+1)/2 folgedermaße defiiert: v(a) ist der d(d + 1)/2-stellige Vektor, der etsteht, idem ma die Spalte vo A übereiader schreibt ud die Über-Diagoal-Elemete rausstreicht. Da bezeiche v 1 die Umkehrabbildug, so dass die etstehede Matrix symmetrisch ist. Da ist } Θ = R d σ R d(d+1)/2 v 1 (σ) ist positiv defiit R d(d+3)/2. Diese Mege ist tatsächlich offe i R d(d+3)/2. 37

Satz 3.7. Maximum-Likelihood-Schätzer Seie X 1,..., X uabhägig, N d (µ, Σ). die Log-Likelihood: log L(µ, Σ; X) = 1 2 ML-Schätzer für µ: ˆµ = X, ML-Schätzer für Σ: ˆΣ = 1 l(det(2πσ)) + (X i X)(X i X). Erierug: ˆΣ ist ei verzerrter Schätzer für Σ: Es gilt E( ˆΣ) = 1 E(S) = 1 Σ. (X i µ) Σ 1 (X i µ) }, Beispiel 3.8. Körpergröße ud Gewicht (Fortsetzug vo Bsp. 1.2) Sei X = (X 1, X 2 ) N 2 (µ, Σ) mit µ ud Σ ubekat. Stichprobe x 1,..., x 100 }, x i = (x i1, x i2 ) (Größe, Gewicht Perso i). Schätzug für µ: x = 1 x i = (174.9, 76.7), Schätzuge der Kovariazmatrix: 18.9 9.2 19.1 9.3 ˆΣ = S = 9.2 8.4 9.3 8.5 Satz 3.9. Seie X 1,..., X,... uabhägig, idetisch verteilt mit edliche zweite Momete. Da gilt (X µ) d N d (0, Σ). Gilt zusätzlich X i N d (µ, Σ), da (X µ) Nd (0, Σ) ( also X Nd (µ, 1 Σ) ). 38

Bei der Kovariazmatrix stoße wir auf die Wishart-Verteilug: Satz 3.10. Sei X die Datematrix vo uabhägige Realisieruge eier N d (0, Σ)-Verteilug ud C eie symmetrische ( )-Matrix. Da: X CX λ i W d (Σ, 1), wobei λ 1,..., λ die EW d vo C sid. X CX ist geau da Wishart-verteilt, we C 2 = C. Da: X CX W d (Σ, r), wobei r = Rag(C) = Spur(C). Satz 3.11. Seie X 1,..., X uabhägig, N d (µ, Σ). Da gilt a) X ud S sid uabhägig, b) ˆΣ = ( 1)S = X H X W d (Σ, 1), c) ( 1)(X µ) ˆΣ 1 (X µ) = (X µ) S 1 (X µ) T 2 (d, 1). Bemerkug 3.12. Die letzte Aussage lässt sich äquivalet formuliere: d (X µ) ˆΣ 1 (X µ) F d, d. d Korollar 3.13. Seie X 1,..., X uabhägig, N d (µ, Σ), Sei Y i = AX i, i = 1,...,, für eie (k d)-matrix mit k d ud Rag(A) = k. Da gilt: Y N k (Aµ, 1 AΣA ), ˆΣ Y W k (AΣA, 1), ( 1)(Y Aµ) (A ˆΣ X A ) 1 (Y Aµ) T 2 (k, 1). 3.3 Teste Test 3.14. Test auf de Erwartugswert µ für Σ bekat Parametrisches Modell: N d (µ, Σ) µ R }, d d. h. θ = µ, Θ = R d. 11. 11. 2013 8. Vorlesug 39

H 0 : µ = µ 0 vs. H 1 : µ = µ 0 Lehe H 0 zum Sigifikaz-Niveau α ab, falls ˆT = (X µ 0 ) Σ 1 (X µ 0 ) > χ 2 d;1 α Herleitug 1: Uter H 0 : X N d (µ 0, 1 Σ). Σ 1/2 (X µ 0 ) N d (0, I d ) (X µ 0 ) Σ 1 (X µ 0 ) χ 2 d. Herleitug 2: Das ist der LRT. Θ 0 = µ 0 } ist hier 0-dimesioal. Log-Likelihood: } log L(µ; X) = 1 2 K + (X i µ) Σ 1 (X i µ) (K steht für Kostate; hägt icht vo µ ab). LR-Teststatistik: ( ) ˆT = λ(θ 0, Θ 1 ; X) = 2 max log L(θ, X) max log L(θ, X) θ Θ 1 θ Θ 0 ( } = 2 max 1 µ R d \µ 0 } 2 K 1 2 (X i µ) Σ 1 (X i µ) } 1 2 K 1 ) (X i µ 2 0 ) Σ 1 (X i µ 0 ) = = (X i µ 0 ) Σ 1 (X i µ 0 ) mi (X i µ 0 ) Σ 1 (X i µ 0 ) = (X µ 0 ) Σ 1 (X µ 0 ) Da ach Satz 3.6: ˆT µ R d (X i µ) Σ 1 (X i µ) (X i X) Σ 1 (X i X) d χ 2 d. Hier gilt sogar., 40

Bemerkug 3.15. Sehr ützlich ud i 3.14 verwedet: Für alle µ R d gilt: (x i µ) Σ 1 (x i µ) = (x i x) Σ 1 (x i x) + (µ x) Σ 1 (µ x) Test 3.16. Test auf de Erwartugswert für Σ ubekat Seie X 1,..., X uabhägig, N d (µ, Σ). H 0 : µ = µ 0 vs. H 1 : µ = µ 0 Lehe H 0 zum Sigifikaz-Niveau α ab, falls ˆT = ( 1)(X µ 0 ) ˆΣ 1 (X µ 0 ) > T 2 1 α(d, 1) = oder (äquivalet dazu) falls d (X µ d 0 ) ˆΣ 1 (X µ 0 ) > F d, d;1 α ( 1)d d F d, d;1 α Herleitug: siehe Satz 3.11. Beispiel 3.17. Gefälschte Bakote 100 echte (e) ud 100 falsche ( f ) Schweizer Bakote, 6 Variable: X 1 : Läge, X 2 : like Höhe, X 3 : rechte Höhe, X 4 : Abstad Rahme - uterer Rad, X 5 : Abstad Rahme - oberer Rad, X 6 : Diagoalläge ieres Bild Der Mittelwertsvektor der echte Bakote ist µ 0 = x e = (214.9, 129.9, 129.7, 8.3, 10.1., 141.5). 41

Wir wolle teste, ob dies der ubekate Erwartugswertvektor µ f der gefälschte Bakote sei ka, also H 0 : µ f = µ 0 vs. H 1 : µ f = µ 0 Eriug: x f = (214.8, 130.3, 130.2, 10.5, 11.1, 139.4) ˆΣ f 0.123 0.031 0.023 0.099 0.019 0.011 0.031 0.064 0.046 0.024 0.012 0.005 0.024 0.046 0.088 0.018 0.000 0.034 = 0.099 0.024 0.018 1.268 0.485 0.236 0.019 0.012 0.000 0.485 0.400 0.022 0.011 0.005 0.034 0.236 0.022 0.308 Die Teststatistik ˆT = ( 1)(x µ 0 ) ˆΣ 1 f (x µ 0 ) = 7288 ist deutlich größer als T 2 0.95(6, 99) = 99 6 94 F 6,94;0.95 = 13.88 H 0 wird zum Sigifikaz-Niveau 0.05 abgeleht. Hier wurde icht µ f = µ e getestet! Bemerkug 3.18. Kofidezellipsoid zum Niveau 1 α: } µ : ( 1)(x µ) ˆΣ 1 (x µ) T1 α 2 (d, 1) = Kofidezitervall für a µ: 1(a x a µ) T(a) = a ˆΣa t 1;1 α/2 42 µ : (x µ) ˆΣ 1 (x µ) d d F d, d;1 α }

Aus max a T 2 (a) = ( 1)(X µ) ˆΣ 1 (X µ) T 2 (d, 1) ergibt sich ei simultaes Kofidezitervall für alle a µ, a R d : 1(a x a µ) a ˆΣa T1 α 2 (d, 1) Beispiel 3.19. Gefälschte Bakote 95% Kofidezellipsoid für µ f : µ R 6 : (µ x f ) ˆΣ 1 f (µ x f ) 6 } 94 F 6,94;0.95 Simultae Kofidezitervalle (1 α = 95%): 214.692 µ 1 214.954 130.205 µ 2 130.395 130.082 µ 3 130.304 10.108 µ 4 10.952 10.896 µ 5 11.370 139.242 µ 6 139.658 1.211 µ 4 µ 5 0.005 Test 3.20. Test auf die Kovariazmatrix Σ H 0 : Σ = Σ 0 vs. H 1 : Σ = Σ 0 Lehe H 0 zum Niveau α ab, falls ˆT = Spur(Σ 1 0 wobei p = d(d + 1)/2. ˆΣ) l det(σ 1 0 ˆΣ) d } > χ 2 p;1 α, 43

Herleitug: LRT; Erierug (Satz 3.6): ( ) λ(h 0, H 1 ; X) = 2 max log L(θ, X) max log L(θ, X) H 1 H 0 wobei hier log L(µ, Σ; X) = 1 2 l(det(2πσ)) + d χ 2 k m, (X i µ) Σ 1 (X i µ) Daher (vgl. Test 3.14) max log L(θ, X) = } l(det(2πσ 0 )) + Spur( ˆΣ Σ0 1 H 0 2 ) ud (vgl. Satz 3.7) max log L(θ, X) = } l(det(2π ˆΣ)) + d. H 1 2 }, 18. 11. 2013 9. Vorlesug Beispiel 3.21. Idustriesektore (Datesatz U.S. Compaies) Eergiesektor ( = 15), Vermöge (Assets) X 1, Umsatz (Sales) X 2 ; X = 4084 ˆΣ = 10 7 1.6635 1.2410 2580.5 1.2410 1.3747 Teste Hypothese H 0 : Σ = Σ 0 = 10 7 1.2248 1.1425 1.1425 1.5112 (Σ 0 ist die empirische Kovariazmatrix des Produktiossektors.) Teststatistik ˆT = 2.7365, wird vergliche mit dem kritische Wert χ 2 3;0.95 = 7.814728. (p-wert 0.4341) H 0 wird akzeptiert. 44

Lieare Restriktioe Test 3.22. Lieare Hypothese a µ (Σ bekat oder ubekat) Sei C R k d mit Rag k, a R k : H 0 : Cµ = a vs. H 1 : Cµ = a Wir setze Y i = CX i N k (µ Y, Σ Y ) mit µ Y = Cµ ud Σ Y = CΣ X C ud erier a Korrolar 3.13. Für Σ bekat: (CX a) (CΣ X C ) 1 (CX a) H 0 χ 2 k Für Σ ubekat: ( 1)(CX a) (C ˆΣ X C ) 1 (CX a) H 0 T 2 (k, 1) oder (äquivalet dazu): k (CX a) (C ˆΣ X C ) 1 (CX a) H 0 F k, k k Beispiel 3.23. Gefälschte Bakote Sid die mittlere Abstäde vom Bild zum obere Rad ud zum utere Rad bei de gefälschte Bakote gleich? H 0 : µ 4 = µ 5 vs. H 1 : µ 4 = µ 5 Formulierug als Cµ = a mit C = (0, 0, 0, 1, 1, 0), a = 0: ˆT 99 = 99(CX f ) ( C ˆΣ f C ) 1 CX f = 13.638 > 3.9371 = F 1,99;0.95 H 0 wird abgeleht. 45

Beispiel 3.24. Zweistichprobetest bei gleicher Stichprobegröße Datesituatio: X 1,..., X N d (µ 1, Σ 1 ), Y 1,..., Y N d (µ 2, Σ 2 ) iid. Formulierug als eie Stichprobe: Z i = X i N 2d µ 1, Σ 1 0, Y i 0 Σ 2 µ 2 Hypothese H 0 : µ 1 = µ 2 (vs. H 1 : µ 1 = µ 2 ) wird formuliert als Cµ = a mit µ = µ ] 1 R 2d, C = [I d I d R d 2d, a = 0 d R d µ 2 Awedug vo Test 3.22: (uter H 0 ) wobei ˆT = ( 1)(X Y) ( ˆΣ X + ˆΣ Y ˆΣ X,Y ˆΣ Y,X ) 1 (X Y) T 2 (d, 1), ˆΣ Y,X = ˆΣ X,Y = 1 Alterativ: (uter H 0 ) (X i X)(Y i Y). ( 1)(X Y) ( ˆΣ X + ˆΣ Y ) 1 (X Y) d χ 2 d. iid. Beispiel 3.25. Gefälschte Bakote Sid die gemessee Läge bei de echte ud gefälschte Bakote im Schitt gleich, d. h. µ f = µ e. µ = (µ e, µ f ) = (214.9,129.9,129.7,8.3,10.1.,141.5,214.8,130.3,130.2,10.5,11.1,139.4) Teststatistik: ˆT = 99 (X e X f ) ( ˆΣ e + ˆΣ f ˆΣ e, f ˆΣ f,e ) 1 (X e X f ) = 2507 > 13.88 = T0.95(6, 2 99) H 0 wird abgeleht. 46

Beispiel 3.26. G. P. Frets: Geetica 3, 1921, S. 193-384 (Verfügbar i R im Package SMPracticals) Messug der Schädelläge (l1,l2) ud -breite (b1,b2) der erste beide Söhe vo = 25 Familie i mm. l1 140 155 130 140 150 160 170 190 140 155 b1 l2 160 180 200 170 190 130 145 160 160 180 200 b2 Wir teste auf Uterschiede zwische Erst- ud Zweitgeboree. Die Erstgeboree: x = (185.72, 151.12), die Zweitgeboree: y = (183.84, 149.24) T 2 = 25 24 (1.88, 1.88) 1362.64 287.64 287.64 702.64 1 1.88 1.88 = 3.612 < 7.1416 = d( 1) 2 3.422 = d( 1) 2 F d, d;0.95 47

Beispiel 3.27. Wiederholte Messuge d Messuge a uabhägige Versuchsobjekte (z. B. Patiete kriege d verschiedee Medikamete) Messuge für i-tes Versuchsobjekt: X i = (X i1,..., X id ) N d (µ, Σ) H 0 : µ 1 =... = µ d vs. H 1 : i, j : µ i = µ j Hierzu: 1 1 0 0 0 1 1.... H 0 : Cµ = 0 mit C =.......... 0 0 0 1 1 Teststatistik (vgl. 3.22, k = d 1): ˆF = ( d + 1) X C (C ˆΣC ) 1 CX H 0 F d 1; d+1 d 1 Kotraste: Vektore b R d mit b 1 = 0 z.b. für d = 3: b = (1, 1, 0) oder b = (1, 0.5, 0.5). Für beliebiges a R d 1 ist a C ei Kotrast. R (d 1) d Simultae Kofidezitervalle: ( ) P a Cµ a CX ± d 1 d + 1 F d 1, d+1;1 αa C ˆΣC a a R d 1 = 1 α Beispiel 3.28. Vokabeltests für = 40 Kider vo 8. bis 11. Klasse (d = 4)(vgl. Bock 1975) H 0 : µ 1 =... = µ 4 vs. H 1 : i, j : µ i = µ j (x 1, x 2, x 3, x 4 ) = (1.086, 2.544, 2.851, 3.420) 2.902 2.438 2.963 2.183 2.438 3.049 2.775 2.319 ˆΣ = 2.963 2.775 4.281 2.939 2.183 2.319 2.939 3.162 48

C wie im vorige Beispiel vergleicht aufeiaderfolgede Jahre. ˆF = 53.134 ist hoch sigifikat für F 3;37 = 2.86. Simultae Kofidezitervalle zum Niveau 95%: 1.958 µ 1 µ 2 0.959 0.949 µ 2 µ 3 0.335 1.171 µ 3 µ 4 0.036 2.283 µ 1 µ 2 + µ 3 + µ 4 3 0.742 1.479 µ 2 µ 4 0.272 Zwei-Stichprobe-Tests Test 3.29. Erwartugswertvergleich bei gleicher Variaz Σ 1 = Σ 2 Seie X 1,..., X 1, Y 1,..., Y 2 uabhägige ZVe mit X i N d (µ 1, Σ), Y i N d (µ 2, Σ). H 0 : µ 1 = µ 2 vs. H 1 : µ 1 = µ 2 H 0 wird zum Niveau α abgeleht, falls ˆT = 1 2 ( 1 + 2 2) ( 1 + 2 ) 2 (X Y) ˆΣ 1 (X Y) > T 2 1 α(d, 1 + 2 2) oder (alterative Formulierug) falls ˆF = 1 2 ( 1 + 2 d 1) d( 1 + 2 ) 2 (X Y) ˆΣ 1 (X Y) > F d,1 + 2 d 1;1 α, wobei ˆΣ = ( 1 + 2 ) 1 ( 1 ˆΣ 1 + 2 ˆΣ 2 ). 49

Herleitug: Sei δ = µ 1 µ 2. Stichprobevariable: X, Y ud ˆΣ i, i = 1, 2. ( X Y N d δ, ) 1 + 2 Σ 1 2 ( 1 + 2 ) ˆΣ = 1 ˆΣ 1 + 2 ˆΣ 2 W d (Σ, 1 + 2 2) Mit Satz 3.11: 20. 11. 2013 1 2 ( 1 + 2 2) ( 1 + 2 ) 2 (X Y δ) ˆΣ 1 (X Y δ) T 2 (d, 1 + 2 2) Simultae (1 α)-kofidezitervalle für a δ: a δ a d( (X Y) ± 1 + 2 ) 2 1 2 ( 1 + 2 d 1) F d, 1 + 2 d 1;1 αa ˆΣa isbesodere für a = (0,..., 0, 1, 0,..., 0) (jte Kompoete): d( δ j (X j Y j ) ± 1 + 2 ) 2 1 2 ( 1 + 2 d 1) F d, 1 + 2 d 1;1 α ˆσ jj 10.Vorlesug Beispiel 3.30. Idustriesektore Vermöge ud Umsatz im Eergiesektor ( 1 = 15): (X 1,1, X 1,2 ),..., (X 10,1, X 10,2 ), im Produktiossektor ( 2 = 10): (Y 1,1, Y 1,2 ),..., (Y 10,1, Y 10,2 ) x = 4084, y = 4307.2, 2580.5 4925.2 ˆΣ 1 = 10 7 1.6635 1.2410, 1.2410 1.3747 ˆΣ = 10 7 1.4880 1.2016 1.2016 1.4293 ˆF = 2.7036 < F 2,22;0.95 = 3.4434 ˆΣ 2 = 10 7 1.2248 1.1425 1.1425 1.5112 H 0 wird zum Niveau 5% akzeptiert. Simultae Kofidezitervalle: 4628.6 µ 1,1 µ 2,1 4182.2 6662.4 µ 1,2 µ 2,2 1973.0 50

Beispiel 3.31. Gefälschte Bakote (Wir tu so, also ob echte ud gefälschte Bakote die gleiche Kovariazmatrix hätte.) Simultae Kofidezitervalle für die Differeze der kompoeteweise Mittelwerte: 0.0443 δ 1 0.3363 0.5186 δ 2 0.1954 0.6416 δ 3 0.3044 2.6981 δ 4 1.7519 1.2952 δ 5 0.6348 1.8072 δ 6 2.3268 Test 3.32. Erwartugswertvergleich, verschiedee Variaze: Σ 1 = Σ 2 Seie X 1,..., X 1, Y 1,..., Y 2 uabhägige ZVe mit X i N d (µ 1, Σ 1 ), Y i N d (µ 2, Σ 2 ). Erierug: im Fall 1 = 2 = : siehe Bsp. 3.24. Jetzt allgemei für uterschiedliche Stichprobegröße. (für 1 ud 2 groß) H 0 : µ 1 = µ 2 vs. H 1 : µ 1 = µ 2 Lehe H 0 zum Niveau α ab, falls (X Y) ( 1 1 ˆΣ 1 + 1 2 ˆΣ 2 ) 1 (X Y) > χ 2 d;1 α Herleitug: Mit δ = µ 1 µ 2 ist X Y N d (δ, 1 1 Σ 1 + 1 2 Σ 2) 51

Daher (X Y) ( 1 1 Σ 1 + 1 2 Σ 2) 1 (X Y) χ 2 d ud mit Slutsky-Lemma (X Y) ( 1 1 ˆΣ 1 + 1 2 ˆΣ 2 ) 1 (X Y) d χ 2 d für Test 3.33. Vergleich vo Kovariazmatrize Sei X j,i N d (µ j, Σ j ) uabhägig, j = 1,..., g, i = 1,..., j (g Gruppe). H 0 : Σ 1 =... = Σ g, H 1 : Σ 1,..., Σ g beliebig Lehe H 0 zum Niveau α ab, falls ˆT = l det( ˆΣ) g j l det( ˆΣ j ) > χ 2 (g 1)d(d+1)/2;1 α, j=1 wobei ˆΣ j Kovariazschätzug vo Gruppe j = 1,..., g ud ˆΣ = 1 g j=1 j ˆΣ j. Beispiel 3.34. Eergie- vs. Produktiossektor (Variable Vermöge ud Umsatz) H 0 : Σ E = Σ Prod ˆT = 0.9076, 95%-Quatil vo χ 2 3 = 7.81 (p-wert = 0.82). H 0 wird akzeptiert. 52

Beispiel 3.35. Gefälschte Bakote H 0 : Σ e = Σ f ˆT = 127.9, 95%-Quatil vo χ 2 3 H 0 wird abgeleht. = 32.7 (p-wert = 0.0). Test 3.36. Profile aalysis (Lieare Hypothese im Zwei-Stichprobe-Fall) d wiederholte Messuge für zwei Gruppe j = 1, 2 mit j Idividue z.b. Blutdruck i Behadlugs- ud Kotrollgruppe X ji N d (µ j, Σ) uabhägig, j = 1, 2, i = 1,..., j Grudlegede Frage: a) Sid die beide Profile parallel? (gleicher Verlauf auf verschiedee Niveaus) H 0 : C(µ 1 µ 2 ) = 0 C = T 2 = 1 1 0 0 0 1 1 0........... 0 0 0 1 1 1 2 ( 1 + 2 ) 2 ( 1 + 2 2)(X Y) C (C ˆΣC ) 1 C(X Y) H 0 T 2 (d 1, 1 + 2 2) b) We die Profile parallel sid, sid sie gar gleich? H 0 : 1 (µ 1 µ 2 ) = 0 ( 1 (X Y) N 1 (µ 1 µ 2 ), ) 1 + 2 1 Σ1 1 2 53

( 1 + 2 )1 ˆΣ1 W 1 (1 Σ1, 1 + 2 2) T 2 1 2 = ( 1 + 2 ) 2 ( 1 + 2 2)[1 (X Y)] 2 (1 ˆΣ1) 1 H 0 T 2 (1, 1 + 2 2) c) We die Profile parallel sid, sid sie horizotal? H 0 : C(µ 1 + µ 2 ) = 0 X = 1 ( 1 X 1 + 2 X 2 ) N d ( 1 ( 1 µ 1 + 2 µ 2 ), 1 Σ) H 0 CX Nd (0, CΣC ) T 2 = ( 1 + 2 2)X C (C ˆΣC ) 1 CX H 0 T 2 (d 1, 1 + 2 2) Beispiel 3.37. Wechsler Erwachsee Itelligezskala (Morriso, 1990) Vergleichstests geetisch verschiedeer Persoegruppe ( 1 = 37, 2 = 12) Wisse X 1, Zuordug X 2, Reche X 3, Bildvervollstädigug X 4 (etspreched Y i, i = 1,..., 4 für Gruppe 2) x = (12.57, 9.57, 11.49, 7.97) y = (8.57, 5.33, 8.50, 4.75) ˆΣ 1 = ˆΣ 2 = 11.164 8.840 6.210 2.020 8.840 11.759 5.778 0.529 6.210 5.778 10.790 1.743 2.020 0.529 1.743 3.594 9.688 9.583 8.875 7.021 9.583 16.722 11.083 8.167 8.875 11.083 12.083 4.875 7.021 8.167 4.875 11.688 Die Teststatistike samt p-werte für die drei Fragestelluge aus 3.36: F 1 = 0.4634, p 1 = 0.71, F 2 = 17.21, p 2 = 10 4, F 3 = 53.32, p 3 = 10 14 54