3 Schließede Statistik im Normalverteilugsmodell 3.1 Kurze Erierug a Schätze ud Teste i parametrische Modelle Sei X 1,..., X eie Stichprobe uabhägig idetisch verteilter ZVe mit Verteilug F θ, ud Dichte f θ, θ Θ, Θ R k offe, ud X = (X 1,..., X ) die zugehörige Datematrix. Defiitio 3.1. Scorefuktio, Fisher-Iformatio Die Score-Fuktio s : R k R k ist der Gradiet der Log-Likelihood. ( ) s(θ; X) = θ log L(θ; X) = θ log 1 f θ (X i ) = f θ (X i ) θ f θ(x i ) Erierug 1: die Likelihood L(θ; X) ist die gemeisame Dichte der Date iterpretiert als Fuktio des ubekate Parameters θ. Erierug 2: der Gradiet φ eier Fuktio φ : R k R ist der Vektor der partielle Ableituge als Spalte geschriebe, also ψ(x) = (Dψ(x)).) Die Iformatiosmatrix vo Fisher ist die Kovariazmatrix F = Var(s(θ; X)). Bemerkug 3.2. Für X 1,..., X uabhägig idetisch verteilt gilt F = F 1. Beispiel 3.3. Sei F θ = N d (µ, I d ), d.h. θ = µ, Θ = R d. ( s(θ; X) = µ log (2π) 2d exp = (X i µ) = (X µ) 1 2 (X i µ) (X i µ) }) F = Var ( (X µ) ) = I d 35
Satz 3.4. (Cramér-Rao) Für jede uverzerrte Schätzer T = T(X) vo θ gilt uter Regularitätsbediguge Var(T ) F 1. Gilt =, so et ma de Schätzer T effiziet. Satz 3.5. Seie X 1,..., X i.i.d. mit Verteilug F θ. Sei ˆθ = arg max θ Θ der ML-Schätzer für θ. Da gilt uter Regularitätsaahme log L(θ; X) a) d ( ) (ˆθ θ) N d 0, F 1, 1 d. h. der ML-Schätzer ist asymptotisch uverzerrt, effiziet ud ormalverteilt. b) (ˆθ θ) ˆ F 1 (ˆθ θ) d χ 2 d, wobei ˆ F 1 ei kosisteter Schätzer vo F 1 ist. Daher ist θ : (ˆθ θ) } Fˆ 1 (ˆθ θ) χ 2 d;1 α ei asymptotisches Kofidezellipsoid für θ zum Niveau 1 α. Seie Θ 0, Θ 1 Θ ud Θ 0 Θ 1 =. Wir möchte H 0 : θ Θ 0 gege H 1 : θ Θ 1 teste. Der Likelihood-Quotiete-Test (LRT) leht H 0 ab, falls der Likelihood- Quotiet (LR) LR(Θ 0, Θ 1 ; X) = max L(θ; X) θ Θ 0 max L(θ; X) θ Θ 1 kleie Werte aimmt. Häufig betrachtet ma statt LR(Θ 0, Θ; X) die mooto (falled) trasformierte Teststatistik λ(θ 0, Θ 1 ; X) = 2 log LR(Θ 0, Θ 1 ; X) ( ) = 2 max log L(θ, X) max log L(θ, X). θ Θ 1 θ Θ 0 H 0 wird für große Werte vo λ abgeleht. 36
Satz 3.6. Sei Θ 0 ei m-dimesioaler Uterraum vo Θ R k ud Θ 1 = Θ \ Θ 0. Da gilt uter Regularitätsbediguge λ(θ 0, Θ 1 ; X) d χ 2 k m für alle θ Θ 0 (also uter H 0 ). Damit ergibt sich für de LRT der asymptotische Ablehugsbereich R = X : λ(θ 0, Θ 1 ; X) > χ 2 k m;1 α}. 3.2 Schätze Das Normalverteilugsmodell Im Folgede betrachte wir folgedes statistisches Modell } N d (µ, Σ) µ R d, Σ R d d symmetrisch, positiv defiit 4. 11. 2013 7. Vorlesug Der Parameter i diesem Modell ist θ = (µ, Σ). Da Σ symmetrisch ist, ist der Parameter eigetlich k = d + d(d + 1)/2 dimesioal. Der eigetliche Parametervektor ist θ = (µ 1,..., µ d, σ 11, σ 21,..., σ d1, σ 2,2,..., σ d,2,..., σ dd ) R d(d+3)/2. Diese Symmetrie-Redudaz i der Darstellug θ = (µ, Σ) ist icht problematisch, aber lästig, we ma z. B. ach θ ableite möchte. Ei Versuch, de Parameter-Raum präzise azugebe: Sei v : R d d R d(d+1)/2 folgedermaße defiiert: v(a) ist der d(d + 1)/2-stellige Vektor, der etsteht, idem ma die Spalte vo A übereiader schreibt ud die Über-Diagoal-Elemete rausstreicht. Da bezeiche v 1 die Umkehrabbildug, so dass die etstehede Matrix symmetrisch ist. Da ist } Θ = R d σ R d(d+1)/2 v 1 (σ) ist positiv defiit R d(d+3)/2. Diese Mege ist tatsächlich offe i R d(d+3)/2. 37
Satz 3.7. Maximum-Likelihood-Schätzer Seie X 1,..., X uabhägig, N d (µ, Σ). die Log-Likelihood: log L(µ, Σ; X) = 1 2 ML-Schätzer für µ: ˆµ = X, ML-Schätzer für Σ: ˆΣ = 1 l(det(2πσ)) + (X i X)(X i X). Erierug: ˆΣ ist ei verzerrter Schätzer für Σ: Es gilt E( ˆΣ) = 1 E(S) = 1 Σ. (X i µ) Σ 1 (X i µ) }, Beispiel 3.8. Körpergröße ud Gewicht (Fortsetzug vo Bsp. 1.2) Sei X = (X 1, X 2 ) N 2 (µ, Σ) mit µ ud Σ ubekat. Stichprobe x 1,..., x 100 }, x i = (x i1, x i2 ) (Größe, Gewicht Perso i). Schätzug für µ: x = 1 x i = (174.9, 76.7), Schätzuge der Kovariazmatrix: 18.9 9.2 19.1 9.3 ˆΣ = S = 9.2 8.4 9.3 8.5 Satz 3.9. Seie X 1,..., X,... uabhägig, idetisch verteilt mit edliche zweite Momete. Da gilt (X µ) d N d (0, Σ). Gilt zusätzlich X i N d (µ, Σ), da (X µ) Nd (0, Σ) ( also X Nd (µ, 1 Σ) ). 38
Bei der Kovariazmatrix stoße wir auf die Wishart-Verteilug: Satz 3.10. Sei X die Datematrix vo uabhägige Realisieruge eier N d (0, Σ)-Verteilug ud C eie symmetrische ( )-Matrix. Da: X CX λ i W d (Σ, 1), wobei λ 1,..., λ die EW d vo C sid. X CX ist geau da Wishart-verteilt, we C 2 = C. Da: X CX W d (Σ, r), wobei r = Rag(C) = Spur(C). Satz 3.11. Seie X 1,..., X uabhägig, N d (µ, Σ). Da gilt a) X ud S sid uabhägig, b) ˆΣ = ( 1)S = X H X W d (Σ, 1), c) ( 1)(X µ) ˆΣ 1 (X µ) = (X µ) S 1 (X µ) T 2 (d, 1). Bemerkug 3.12. Die letzte Aussage lässt sich äquivalet formuliere: d (X µ) ˆΣ 1 (X µ) F d, d. d Korollar 3.13. Seie X 1,..., X uabhägig, N d (µ, Σ), Sei Y i = AX i, i = 1,...,, für eie (k d)-matrix mit k d ud Rag(A) = k. Da gilt: Y N k (Aµ, 1 AΣA ), ˆΣ Y W k (AΣA, 1), ( 1)(Y Aµ) (A ˆΣ X A ) 1 (Y Aµ) T 2 (k, 1). 3.3 Teste Test 3.14. Test auf de Erwartugswert µ für Σ bekat Parametrisches Modell: N d (µ, Σ) µ R }, d d. h. θ = µ, Θ = R d. 11. 11. 2013 8. Vorlesug 39
H 0 : µ = µ 0 vs. H 1 : µ = µ 0 Lehe H 0 zum Sigifikaz-Niveau α ab, falls ˆT = (X µ 0 ) Σ 1 (X µ 0 ) > χ 2 d;1 α Herleitug 1: Uter H 0 : X N d (µ 0, 1 Σ). Σ 1/2 (X µ 0 ) N d (0, I d ) (X µ 0 ) Σ 1 (X µ 0 ) χ 2 d. Herleitug 2: Das ist der LRT. Θ 0 = µ 0 } ist hier 0-dimesioal. Log-Likelihood: } log L(µ; X) = 1 2 K + (X i µ) Σ 1 (X i µ) (K steht für Kostate; hägt icht vo µ ab). LR-Teststatistik: ( ) ˆT = λ(θ 0, Θ 1 ; X) = 2 max log L(θ, X) max log L(θ, X) θ Θ 1 θ Θ 0 ( } = 2 max 1 µ R d \µ 0 } 2 K 1 2 (X i µ) Σ 1 (X i µ) } 1 2 K 1 ) (X i µ 2 0 ) Σ 1 (X i µ 0 ) = = (X i µ 0 ) Σ 1 (X i µ 0 ) mi (X i µ 0 ) Σ 1 (X i µ 0 ) = (X µ 0 ) Σ 1 (X µ 0 ) Da ach Satz 3.6: ˆT µ R d (X i µ) Σ 1 (X i µ) (X i X) Σ 1 (X i X) d χ 2 d. Hier gilt sogar., 40
Bemerkug 3.15. Sehr ützlich ud i 3.14 verwedet: Für alle µ R d gilt: (x i µ) Σ 1 (x i µ) = (x i x) Σ 1 (x i x) + (µ x) Σ 1 (µ x) Test 3.16. Test auf de Erwartugswert für Σ ubekat Seie X 1,..., X uabhägig, N d (µ, Σ). H 0 : µ = µ 0 vs. H 1 : µ = µ 0 Lehe H 0 zum Sigifikaz-Niveau α ab, falls ˆT = ( 1)(X µ 0 ) ˆΣ 1 (X µ 0 ) > T 2 1 α(d, 1) = oder (äquivalet dazu) falls d (X µ d 0 ) ˆΣ 1 (X µ 0 ) > F d, d;1 α ( 1)d d F d, d;1 α Herleitug: siehe Satz 3.11. Beispiel 3.17. Gefälschte Bakote 100 echte (e) ud 100 falsche ( f ) Schweizer Bakote, 6 Variable: X 1 : Läge, X 2 : like Höhe, X 3 : rechte Höhe, X 4 : Abstad Rahme - uterer Rad, X 5 : Abstad Rahme - oberer Rad, X 6 : Diagoalläge ieres Bild Der Mittelwertsvektor der echte Bakote ist µ 0 = x e = (214.9, 129.9, 129.7, 8.3, 10.1., 141.5). 41
Wir wolle teste, ob dies der ubekate Erwartugswertvektor µ f der gefälschte Bakote sei ka, also H 0 : µ f = µ 0 vs. H 1 : µ f = µ 0 Eriug: x f = (214.8, 130.3, 130.2, 10.5, 11.1, 139.4) ˆΣ f 0.123 0.031 0.023 0.099 0.019 0.011 0.031 0.064 0.046 0.024 0.012 0.005 0.024 0.046 0.088 0.018 0.000 0.034 = 0.099 0.024 0.018 1.268 0.485 0.236 0.019 0.012 0.000 0.485 0.400 0.022 0.011 0.005 0.034 0.236 0.022 0.308 Die Teststatistik ˆT = ( 1)(x µ 0 ) ˆΣ 1 f (x µ 0 ) = 7288 ist deutlich größer als T 2 0.95(6, 99) = 99 6 94 F 6,94;0.95 = 13.88 H 0 wird zum Sigifikaz-Niveau 0.05 abgeleht. Hier wurde icht µ f = µ e getestet! Bemerkug 3.18. Kofidezellipsoid zum Niveau 1 α: } µ : ( 1)(x µ) ˆΣ 1 (x µ) T1 α 2 (d, 1) = Kofidezitervall für a µ: 1(a x a µ) T(a) = a ˆΣa t 1;1 α/2 42 µ : (x µ) ˆΣ 1 (x µ) d d F d, d;1 α }
Aus max a T 2 (a) = ( 1)(X µ) ˆΣ 1 (X µ) T 2 (d, 1) ergibt sich ei simultaes Kofidezitervall für alle a µ, a R d : 1(a x a µ) a ˆΣa T1 α 2 (d, 1) Beispiel 3.19. Gefälschte Bakote 95% Kofidezellipsoid für µ f : µ R 6 : (µ x f ) ˆΣ 1 f (µ x f ) 6 } 94 F 6,94;0.95 Simultae Kofidezitervalle (1 α = 95%): 214.692 µ 1 214.954 130.205 µ 2 130.395 130.082 µ 3 130.304 10.108 µ 4 10.952 10.896 µ 5 11.370 139.242 µ 6 139.658 1.211 µ 4 µ 5 0.005 Test 3.20. Test auf die Kovariazmatrix Σ H 0 : Σ = Σ 0 vs. H 1 : Σ = Σ 0 Lehe H 0 zum Niveau α ab, falls ˆT = Spur(Σ 1 0 wobei p = d(d + 1)/2. ˆΣ) l det(σ 1 0 ˆΣ) d } > χ 2 p;1 α, 43
Herleitug: LRT; Erierug (Satz 3.6): ( ) λ(h 0, H 1 ; X) = 2 max log L(θ, X) max log L(θ, X) H 1 H 0 wobei hier log L(µ, Σ; X) = 1 2 l(det(2πσ)) + d χ 2 k m, (X i µ) Σ 1 (X i µ) Daher (vgl. Test 3.14) max log L(θ, X) = } l(det(2πσ 0 )) + Spur( ˆΣ Σ0 1 H 0 2 ) ud (vgl. Satz 3.7) max log L(θ, X) = } l(det(2π ˆΣ)) + d. H 1 2 }, 18. 11. 2013 9. Vorlesug Beispiel 3.21. Idustriesektore (Datesatz U.S. Compaies) Eergiesektor ( = 15), Vermöge (Assets) X 1, Umsatz (Sales) X 2 ; X = 4084 ˆΣ = 10 7 1.6635 1.2410 2580.5 1.2410 1.3747 Teste Hypothese H 0 : Σ = Σ 0 = 10 7 1.2248 1.1425 1.1425 1.5112 (Σ 0 ist die empirische Kovariazmatrix des Produktiossektors.) Teststatistik ˆT = 2.7365, wird vergliche mit dem kritische Wert χ 2 3;0.95 = 7.814728. (p-wert 0.4341) H 0 wird akzeptiert. 44
Lieare Restriktioe Test 3.22. Lieare Hypothese a µ (Σ bekat oder ubekat) Sei C R k d mit Rag k, a R k : H 0 : Cµ = a vs. H 1 : Cµ = a Wir setze Y i = CX i N k (µ Y, Σ Y ) mit µ Y = Cµ ud Σ Y = CΣ X C ud erier a Korrolar 3.13. Für Σ bekat: (CX a) (CΣ X C ) 1 (CX a) H 0 χ 2 k Für Σ ubekat: ( 1)(CX a) (C ˆΣ X C ) 1 (CX a) H 0 T 2 (k, 1) oder (äquivalet dazu): k (CX a) (C ˆΣ X C ) 1 (CX a) H 0 F k, k k Beispiel 3.23. Gefälschte Bakote Sid die mittlere Abstäde vom Bild zum obere Rad ud zum utere Rad bei de gefälschte Bakote gleich? H 0 : µ 4 = µ 5 vs. H 1 : µ 4 = µ 5 Formulierug als Cµ = a mit C = (0, 0, 0, 1, 1, 0), a = 0: ˆT 99 = 99(CX f ) ( C ˆΣ f C ) 1 CX f = 13.638 > 3.9371 = F 1,99;0.95 H 0 wird abgeleht. 45
Beispiel 3.24. Zweistichprobetest bei gleicher Stichprobegröße Datesituatio: X 1,..., X N d (µ 1, Σ 1 ), Y 1,..., Y N d (µ 2, Σ 2 ) iid. Formulierug als eie Stichprobe: Z i = X i N 2d µ 1, Σ 1 0, Y i 0 Σ 2 µ 2 Hypothese H 0 : µ 1 = µ 2 (vs. H 1 : µ 1 = µ 2 ) wird formuliert als Cµ = a mit µ = µ ] 1 R 2d, C = [I d I d R d 2d, a = 0 d R d µ 2 Awedug vo Test 3.22: (uter H 0 ) wobei ˆT = ( 1)(X Y) ( ˆΣ X + ˆΣ Y ˆΣ X,Y ˆΣ Y,X ) 1 (X Y) T 2 (d, 1), ˆΣ Y,X = ˆΣ X,Y = 1 Alterativ: (uter H 0 ) (X i X)(Y i Y). ( 1)(X Y) ( ˆΣ X + ˆΣ Y ) 1 (X Y) d χ 2 d. iid. Beispiel 3.25. Gefälschte Bakote Sid die gemessee Läge bei de echte ud gefälschte Bakote im Schitt gleich, d. h. µ f = µ e. µ = (µ e, µ f ) = (214.9,129.9,129.7,8.3,10.1.,141.5,214.8,130.3,130.2,10.5,11.1,139.4) Teststatistik: ˆT = 99 (X e X f ) ( ˆΣ e + ˆΣ f ˆΣ e, f ˆΣ f,e ) 1 (X e X f ) = 2507 > 13.88 = T0.95(6, 2 99) H 0 wird abgeleht. 46
Beispiel 3.26. G. P. Frets: Geetica 3, 1921, S. 193-384 (Verfügbar i R im Package SMPracticals) Messug der Schädelläge (l1,l2) ud -breite (b1,b2) der erste beide Söhe vo = 25 Familie i mm. l1 140 155 130 140 150 160 170 190 140 155 b1 l2 160 180 200 170 190 130 145 160 160 180 200 b2 Wir teste auf Uterschiede zwische Erst- ud Zweitgeboree. Die Erstgeboree: x = (185.72, 151.12), die Zweitgeboree: y = (183.84, 149.24) T 2 = 25 24 (1.88, 1.88) 1362.64 287.64 287.64 702.64 1 1.88 1.88 = 3.612 < 7.1416 = d( 1) 2 3.422 = d( 1) 2 F d, d;0.95 47
Beispiel 3.27. Wiederholte Messuge d Messuge a uabhägige Versuchsobjekte (z. B. Patiete kriege d verschiedee Medikamete) Messuge für i-tes Versuchsobjekt: X i = (X i1,..., X id ) N d (µ, Σ) H 0 : µ 1 =... = µ d vs. H 1 : i, j : µ i = µ j Hierzu: 1 1 0 0 0 1 1.... H 0 : Cµ = 0 mit C =.......... 0 0 0 1 1 Teststatistik (vgl. 3.22, k = d 1): ˆF = ( d + 1) X C (C ˆΣC ) 1 CX H 0 F d 1; d+1 d 1 Kotraste: Vektore b R d mit b 1 = 0 z.b. für d = 3: b = (1, 1, 0) oder b = (1, 0.5, 0.5). Für beliebiges a R d 1 ist a C ei Kotrast. R (d 1) d Simultae Kofidezitervalle: ( ) P a Cµ a CX ± d 1 d + 1 F d 1, d+1;1 αa C ˆΣC a a R d 1 = 1 α Beispiel 3.28. Vokabeltests für = 40 Kider vo 8. bis 11. Klasse (d = 4)(vgl. Bock 1975) H 0 : µ 1 =... = µ 4 vs. H 1 : i, j : µ i = µ j (x 1, x 2, x 3, x 4 ) = (1.086, 2.544, 2.851, 3.420) 2.902 2.438 2.963 2.183 2.438 3.049 2.775 2.319 ˆΣ = 2.963 2.775 4.281 2.939 2.183 2.319 2.939 3.162 48
C wie im vorige Beispiel vergleicht aufeiaderfolgede Jahre. ˆF = 53.134 ist hoch sigifikat für F 3;37 = 2.86. Simultae Kofidezitervalle zum Niveau 95%: 1.958 µ 1 µ 2 0.959 0.949 µ 2 µ 3 0.335 1.171 µ 3 µ 4 0.036 2.283 µ 1 µ 2 + µ 3 + µ 4 3 0.742 1.479 µ 2 µ 4 0.272 Zwei-Stichprobe-Tests Test 3.29. Erwartugswertvergleich bei gleicher Variaz Σ 1 = Σ 2 Seie X 1,..., X 1, Y 1,..., Y 2 uabhägige ZVe mit X i N d (µ 1, Σ), Y i N d (µ 2, Σ). H 0 : µ 1 = µ 2 vs. H 1 : µ 1 = µ 2 H 0 wird zum Niveau α abgeleht, falls ˆT = 1 2 ( 1 + 2 2) ( 1 + 2 ) 2 (X Y) ˆΣ 1 (X Y) > T 2 1 α(d, 1 + 2 2) oder (alterative Formulierug) falls ˆF = 1 2 ( 1 + 2 d 1) d( 1 + 2 ) 2 (X Y) ˆΣ 1 (X Y) > F d,1 + 2 d 1;1 α, wobei ˆΣ = ( 1 + 2 ) 1 ( 1 ˆΣ 1 + 2 ˆΣ 2 ). 49
Herleitug: Sei δ = µ 1 µ 2. Stichprobevariable: X, Y ud ˆΣ i, i = 1, 2. ( X Y N d δ, ) 1 + 2 Σ 1 2 ( 1 + 2 ) ˆΣ = 1 ˆΣ 1 + 2 ˆΣ 2 W d (Σ, 1 + 2 2) Mit Satz 3.11: 20. 11. 2013 1 2 ( 1 + 2 2) ( 1 + 2 ) 2 (X Y δ) ˆΣ 1 (X Y δ) T 2 (d, 1 + 2 2) Simultae (1 α)-kofidezitervalle für a δ: a δ a d( (X Y) ± 1 + 2 ) 2 1 2 ( 1 + 2 d 1) F d, 1 + 2 d 1;1 αa ˆΣa isbesodere für a = (0,..., 0, 1, 0,..., 0) (jte Kompoete): d( δ j (X j Y j ) ± 1 + 2 ) 2 1 2 ( 1 + 2 d 1) F d, 1 + 2 d 1;1 α ˆσ jj 10.Vorlesug Beispiel 3.30. Idustriesektore Vermöge ud Umsatz im Eergiesektor ( 1 = 15): (X 1,1, X 1,2 ),..., (X 10,1, X 10,2 ), im Produktiossektor ( 2 = 10): (Y 1,1, Y 1,2 ),..., (Y 10,1, Y 10,2 ) x = 4084, y = 4307.2, 2580.5 4925.2 ˆΣ 1 = 10 7 1.6635 1.2410, 1.2410 1.3747 ˆΣ = 10 7 1.4880 1.2016 1.2016 1.4293 ˆF = 2.7036 < F 2,22;0.95 = 3.4434 ˆΣ 2 = 10 7 1.2248 1.1425 1.1425 1.5112 H 0 wird zum Niveau 5% akzeptiert. Simultae Kofidezitervalle: 4628.6 µ 1,1 µ 2,1 4182.2 6662.4 µ 1,2 µ 2,2 1973.0 50
Beispiel 3.31. Gefälschte Bakote (Wir tu so, also ob echte ud gefälschte Bakote die gleiche Kovariazmatrix hätte.) Simultae Kofidezitervalle für die Differeze der kompoeteweise Mittelwerte: 0.0443 δ 1 0.3363 0.5186 δ 2 0.1954 0.6416 δ 3 0.3044 2.6981 δ 4 1.7519 1.2952 δ 5 0.6348 1.8072 δ 6 2.3268 Test 3.32. Erwartugswertvergleich, verschiedee Variaze: Σ 1 = Σ 2 Seie X 1,..., X 1, Y 1,..., Y 2 uabhägige ZVe mit X i N d (µ 1, Σ 1 ), Y i N d (µ 2, Σ 2 ). Erierug: im Fall 1 = 2 = : siehe Bsp. 3.24. Jetzt allgemei für uterschiedliche Stichprobegröße. (für 1 ud 2 groß) H 0 : µ 1 = µ 2 vs. H 1 : µ 1 = µ 2 Lehe H 0 zum Niveau α ab, falls (X Y) ( 1 1 ˆΣ 1 + 1 2 ˆΣ 2 ) 1 (X Y) > χ 2 d;1 α Herleitug: Mit δ = µ 1 µ 2 ist X Y N d (δ, 1 1 Σ 1 + 1 2 Σ 2) 51
Daher (X Y) ( 1 1 Σ 1 + 1 2 Σ 2) 1 (X Y) χ 2 d ud mit Slutsky-Lemma (X Y) ( 1 1 ˆΣ 1 + 1 2 ˆΣ 2 ) 1 (X Y) d χ 2 d für Test 3.33. Vergleich vo Kovariazmatrize Sei X j,i N d (µ j, Σ j ) uabhägig, j = 1,..., g, i = 1,..., j (g Gruppe). H 0 : Σ 1 =... = Σ g, H 1 : Σ 1,..., Σ g beliebig Lehe H 0 zum Niveau α ab, falls ˆT = l det( ˆΣ) g j l det( ˆΣ j ) > χ 2 (g 1)d(d+1)/2;1 α, j=1 wobei ˆΣ j Kovariazschätzug vo Gruppe j = 1,..., g ud ˆΣ = 1 g j=1 j ˆΣ j. Beispiel 3.34. Eergie- vs. Produktiossektor (Variable Vermöge ud Umsatz) H 0 : Σ E = Σ Prod ˆT = 0.9076, 95%-Quatil vo χ 2 3 = 7.81 (p-wert = 0.82). H 0 wird akzeptiert. 52
Beispiel 3.35. Gefälschte Bakote H 0 : Σ e = Σ f ˆT = 127.9, 95%-Quatil vo χ 2 3 H 0 wird abgeleht. = 32.7 (p-wert = 0.0). Test 3.36. Profile aalysis (Lieare Hypothese im Zwei-Stichprobe-Fall) d wiederholte Messuge für zwei Gruppe j = 1, 2 mit j Idividue z.b. Blutdruck i Behadlugs- ud Kotrollgruppe X ji N d (µ j, Σ) uabhägig, j = 1, 2, i = 1,..., j Grudlegede Frage: a) Sid die beide Profile parallel? (gleicher Verlauf auf verschiedee Niveaus) H 0 : C(µ 1 µ 2 ) = 0 C = T 2 = 1 1 0 0 0 1 1 0........... 0 0 0 1 1 1 2 ( 1 + 2 ) 2 ( 1 + 2 2)(X Y) C (C ˆΣC ) 1 C(X Y) H 0 T 2 (d 1, 1 + 2 2) b) We die Profile parallel sid, sid sie gar gleich? H 0 : 1 (µ 1 µ 2 ) = 0 ( 1 (X Y) N 1 (µ 1 µ 2 ), ) 1 + 2 1 Σ1 1 2 53
( 1 + 2 )1 ˆΣ1 W 1 (1 Σ1, 1 + 2 2) T 2 1 2 = ( 1 + 2 ) 2 ( 1 + 2 2)[1 (X Y)] 2 (1 ˆΣ1) 1 H 0 T 2 (1, 1 + 2 2) c) We die Profile parallel sid, sid sie horizotal? H 0 : C(µ 1 + µ 2 ) = 0 X = 1 ( 1 X 1 + 2 X 2 ) N d ( 1 ( 1 µ 1 + 2 µ 2 ), 1 Σ) H 0 CX Nd (0, CΣC ) T 2 = ( 1 + 2 2)X C (C ˆΣC ) 1 CX H 0 T 2 (d 1, 1 + 2 2) Beispiel 3.37. Wechsler Erwachsee Itelligezskala (Morriso, 1990) Vergleichstests geetisch verschiedeer Persoegruppe ( 1 = 37, 2 = 12) Wisse X 1, Zuordug X 2, Reche X 3, Bildvervollstädigug X 4 (etspreched Y i, i = 1,..., 4 für Gruppe 2) x = (12.57, 9.57, 11.49, 7.97) y = (8.57, 5.33, 8.50, 4.75) ˆΣ 1 = ˆΣ 2 = 11.164 8.840 6.210 2.020 8.840 11.759 5.778 0.529 6.210 5.778 10.790 1.743 2.020 0.529 1.743 3.594 9.688 9.583 8.875 7.021 9.583 16.722 11.083 8.167 8.875 11.083 12.083 4.875 7.021 8.167 4.875 11.688 Die Teststatistike samt p-werte für die drei Fragestelluge aus 3.36: F 1 = 0.4634, p 1 = 0.71, F 2 = 17.21, p 2 = 10 4, F 3 = 53.32, p 3 = 10 14 54