Statistik für Informatiker, SS Ideen aus der Statistik 2.2 Schätzer und Tests für (Populations-)Mittelwerte

Schätzer ud Kofidezitervall Statistische Tests 1/51 Statistik für Iformatiker, SS 2017 2. Idee aus der Statistik 2.2 Schätzer ud Tests für (Populatios-)Mittelwerte Matthias Birker http://www.staff.ui-maiz.de/birker/statifo17/ 28.6.2017

Schätzer ud Kofidezitervall Statistische Tests 2/51 Eie Stadardsituatio i der Statistik: Wir habe Beobachtugswerte x 1,..., x (z.b. die Carapaxläge der gefagee Sprigkrebse aus dem Eistiegsbeispiel zur deskriptive Statistik) ud möchte ahad desse etwas über die Gesamtpopulatio, aus der die Date stamme, aussage. Die grudlegede Idee: Die Date werde als Realisieruge vo Zufallsvariable aufgefasst, die i eiem stochastische Modell spezifiert werde. Ma versucht da, ahad der Date Rückschlüsse auf Parameter des Modells zu ziehe, ud so systematische Effekte vo Zufälligem zu tree.

Schätzer ud Kofidezitervall Statistische Tests Wir formuliere dies folgedermaße ( abstrakt ): Ei statistisches Modell besteht aus eiem Zufallsexperimet X (d.h. eier Schar vo Zufallsvariable, die die mögliche Beobachtugswerte repräsetiere) zusamme mit eier Mege vo Wahrscheilichkeite P ϑ, ϑ Θ. (Θ ka eie recht allgemeie Idexmege sei.) Die verschiedee P ϑ beschreibe uterschiedliche Arte, wie der Zufall wirke ka (d.h. uterschiedliche Verteiluge der Zufallsvariable i X ). Im Kotext des Modells ehme wir a, dass die Date gemäß eiem gewisse P ϑ geeriert wurde, wir kee aber das wahre ϑ icht. Die Aufgabe der (schließede) Statistik besteht grob gesproche dari, ahad der Beobachtuge Iformatioe über das zugrudeliegede ϑ zu gewie. 3/51

6/51 Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Lageschätzug Modell: X 1,..., X uabhägige ZV mit derselbe Verteilug ϑ (die wir möglicherweise icht kee), mit Mittelwert µ (= µ(ϑ)) ud Variaz σ 2 (= σ 2 (ϑ)) X ist ei Schätzer für µ. X ist erwartugstreu: E ϑ [X] = 1 i=1 X = 1 X i i=1 E ϑ [X i ] = E ϑ [X 1 ] = µ = µ(ϑ) uter P ϑ, egal, was der tatsächliche Wert vo µ ist

7/51 Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Lageschätzug X 1,..., X uabhägige ZV mit derselbe Verteilug, mit Mittelwert µ (= µ(ϑ)) ud Variaz σ 2 (= σ 2 (ϑ)) X ist kosistet: X = 1 i=1 X i stoch. µ = µ(ϑ) (gemäß dem Gesetz der große Zahle). uter P ϑ Allgemei: Wir iteressiere us für eie gewisse (umerische) Eigeschaft h(ϑ) der Verteilug ϑ der X i, eie Fuktio Y der X 1,..., X ist ei erwartugstreuer Schätzer für h(ϑ), we stets gilt E ϑ [Y ] = h(ϑ)

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 8/51 X = 1 X i i=1 (ist ei Puktschätzer für µ = E ϑ [X i ] mit gute Eigeschafte) Soweit, so schö, aber: wie geau ist die Schätzug? Es ist Var ϑ [X] = 1 2 i=1 Var ϑ [X i ] = σ2. Wir mache zuächst user Lebe leicht : Nehme wir a, dass wir σ kee, ud dass die Date aus eier Normalverteilug stamme (im Modell: X i u.i.v., N µ,σ 2).

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Kofidezitervall für de Mittelwert im ormale Modell bei bekater Variaz X 1, X 2,..., X u.i.v. ϑ = N µ,σ 2 mit (us ubekatem) µ R, σ 2 > 0 sei bekat (ud fest). Sei α (0, 1) [z.b. α = 0.05 oder α = 0.01], q = Φ 1 (1 α 2 ) das (1 α/2)-quatil der Stadardormalverteilug [mit R : qorm(1 α/2)]. Das (ahad der Date kostruierte) Itervall hat die Eigeschaft I = [X q σ σ, X + q ] P ϑ (µ I) = 1 α (egal, was µ ist) 10/51

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 11/51 I = [X q σ σ, X + q ] P ϑ (µ I) = 1 α de X q σ σ µ X + q q X µ σ q ud (egal was µ ud σ 2 sid) stets ist uter P ϑ X µ σ N 0,1

12/51 Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Kofidezitervall Allgemei heißt ei (ahad der Beobachtugswerte zu kostruieredes) Itervall I ei Kofidezitervall (machmal auch Vertrauesitervall ) für µ zum (Sicherheits-)Niveau 1 α (bzw. Irrtumsiveau α), we gilt ϑ Θ P ϑ (µ I) 1 α. (mit Notatio µ = µ(ϑ)). Beachte: I ist zufällig, icht aber ϑ (zumidest i userer (sogeate frequetistische) Iterpretatio). Offebar möchte ma i.a. I so kurz wie möglich wähle (soweit verträglich mit dem geforderte Niveau).

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 13/51 Bemerkug. Auch we die X i icht wörtlich ormalverteilt sid (soder uabhägig ud idetisch verteilt mit eier gewisse Verteilug ϑ, die Mittelwert µ ud Variaz σ 2 hat), so ist X µ σ = X 1 + X 2 + + X µ σ d N 0,1 gemäß dem zetrale Grezwertsatz. Daher ist auch für allgemeie Verteilug das auf Normalität fußede Kofidezitervall zumidest für große approximativ korrekt (ma muss aber σ kee, um es zu kostruiere).

15/51 Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi We ma die Variaz icht ket...... ka ma sie immerhi schätze: S 2 = 1 1 i=1 (X i X) 2 [im Sie der deskriptive Statistik wäre dies die korrigierte Stichprobevariaz ] ist erwartugstreuer Schätzer für σ 2 : E ϑ [ (X i X) 2 ] = E ϑ [(X i X) 2 ] = Var ϑ [X i X] i=1 = Var ϑ [ 1 X 1 1 i=2 X i ] = (( 1 )2 Var ϑ [X 1 ] + 1 Var 2 ϑ [X 1 ]) = ( 1)Var ϑ [X 1 ] = ( 1)σ 2

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 16/51 S 2 ist kosistet (als Folge i betrachtet): 1 S2 = 1 = ( 1 i=1 (X i X) 2 = ( 1 X 2 i=1 i=1 X 2 i ) 2( 1 i=1 X i X) + (X) 2 i ) (X) 2 stoch. E ϑ[x 2 1 ] (E ϑ[x 1 ]) 2 = σ 2 (verwede jeweils das Gesetz der große Zahle). Wir wisse bereits: Die Stadardabweichug vo X ist σ. Somit ist S ei (aheliegeder) Schätzer für die (ubekate) Stadardabweichug vo X, ma et es auch de Stadardfehler.

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 17/51 Satz (Studet (=William Gosset), 1908). X 1,..., X u.i.v. N µ,σ 2 mit µ R, σ > 0, X = 1 i=1 X i, S 2 = 1 1 i=1 (X i X) 2. Da besitzt T = (X µ) S 2 die Dichte t 1 (x), wobei t m (x) = m+1 Γ( 2 ) 1 Γ( 1 2 )Γ( m 2 ) (1 + x 2 m+1 m m ) 2 t m ist die Dichte der Studet-t-Verteilug mit m Freiheitsgrade (machmal auch Studet-Verteilug oder t-verteilug geat).

18/51 Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Dichte der t-verteilug desity 0.0 0.1 0.2 0.3 0.4 dorm() dt(,df=4) dt(,df=8) dt(,df=16) desity 0.0 0.1 0.2 0.3 0.4 dorm() dt(,df=30

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 19/51 Bemerkug. Die t-verteilug wurde vo William Gosset erforscht ud vo ihm 1908 veröffetlicht, währed er i eier Guiess-Brauerei arbeitete. Da sei Arbeitgeber die Veröffetlichug icht gestattete, veröffetlichte Gosset sie uter dem Pseudoym Studet. Beweise fide sich i der Literatur, siehe z.b. Kerstig & Wakolbiger, Kap.22 oder Georgii, Satz 9.17 (Es gibt dazu ei schöes geometrisches Argumet, das die Rotatiosivariaz der multivariate Normalverteilug ausutzt.)

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Freiheitsgrade? Beispiel: Es gibt 5 Freiheitsgrade im Vektor x = (x 1, x 2, x 3, x 4, x 5 ) da 5 Werte frei wählbar sid. Der Vektor v = x x = (x 1 x, x 2 x, x 3 x, x 4 x, x 5 x) hat 4 Freiheitsgrade, de ach Wahl vo v 1, v 2, v 3, v 4 ist v 5 festgelegt wege v 1 + + v 4 + v 5 = 0. Die Bezeichug Studet-Verteilug mit 1 Freiheitsgrade ist motiviert durch die Tatsache, dass t = (x µ)/(s/ ), wo s = s 2 = 1 1 ((x 1 x) 2 + + (x x) 2 ) 1/2 (bis auf Normierug) die Läge eies Vektors mit 1 Freiheitsgrade ist. 20/51

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Studet-Kofidezitervall für de Erwartugswert im ormale Modell Uter P ϑ, ϑ = (µ, σ 2 ) R (0, ) seie X 1, X 2,..., X u.i.v. N µ,σ 2. Sei α (0, 1), q = q 1,1 α/2 das 1 α 2 -Quatil der Studet-Verteilug mit 1 Freiheitsgrade [mit R : qt(1 α/2, df= 1)], X = 1 i=1 X i, S 2 = 1 1 i=1 (X i X) 2. Da ist I = [X q S 2, X + q S 2 ] ei Kofidezitervall für µ zum Irrtumsiveau α. 21/51

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 22/51 I = [X q S 2, X + q S 2 ] ist ei Kofidezitervall für µ zum Irrtumsiveau α, de T = (X µ) S ist Studet-verteilt mit 1 2 Freiheitsgrade (für jede Wahl vo µ ud σ 2 ), also S P (µ,σ )(X q 2 2 µ X + q S 2 ) = P( q T q) = P(T q) P(T q) = 1 α 2 α 2 = 1 α.

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi Beispiel. 10 Patiete erhielte i aufeiaderfolgede Nächte Schlafmittel A, da Mittel B. Die Date 1 (x i = Az. Stude Schlaf mit Mittel A - Az. Stude Schlaf mit Mittel B bei Patiet Nr. i): i 1 2 3 4 5 6 7 8 9 10 x i 1,2 2,4 1,3 1,3 0,0 1,0 1,8 0,8 4,6 1,4 Es ist x = 1 10 10 i=1 x i 1,58, s = ( 1 9 10 i=1 (x i x) 2 ) 1/2 1,23. 1 Aus Studet (William S. Gosset), The Probable Error of a Mea, Biometrika 6:1 25 (1908) 23/51

Schätzer ud Kofidezitervall Statistische Tests Puktschätzer Kofidezitervall, bekate Variaz Kofidezi 24/51 x 1,58, s 1,23 Es ist q 9, 0,995 3,25 (aus eier Quatiltabelle oder beispielsweise mit R berechet), demach ist [x ± q s ] [0,31, 2,85] ei Kofidezitervall für µ (die mittlere zusätzliche Azahl Stude Schlaf, die Medikamet A mehr brigt als Medikamet B) zum Sicherheitsiveau 0,99 = 1 0,01. Beachte: (Silos) geaue Werte mit Rechergeauigkeit sid x q s 0,3159481, x + q s 2,8440519, ma sollte allerdigs die Greze eies Kofidezitervalls stets koservativ, d.h. ach auße, rude.

27/51 Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Die Fragestellug statistischer Tests Sei (X, (P ϑ ) ϑ Θ ) ei statistisches Modell, Θ = Θ 0 Θ 1 disjukte Zerlegug i Nullhypothese ud Alterative (auch Gegehypothese ). Wir suche ei Verfahre, um ahad vo Beobachtugswerte x 1,..., x zu etscheide, ob wir H 0 ϑ Θ 0 H 1 ϑ Θ 1 (die Nullhypothese) oder (die Alterative) für plausibler halte (ud zugleich eie geeigete Art, plausibler zu quatifiziere).

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Die Fragestellug statistischer Tests Abstrakt ist ei statistischer Test vo Θ 0 gege Θ 1 eie Fuktio ϕ(x 1,..., x ) der Beobachtuge mit Werte {0, 1} ud der Etscheidugsregel: ϕ(x 1,..., x ) = 0 da etscheide für H 0 ( behalte die Nullhypothese bei ) ϕ(x 1,..., x ) = 1 da etscheide für H 1 ( verwirf die Nullhypothese zuguste der Alterative ) Sei α (0, 1). Der Test ϕ hat Niveau α, we gilt sup ϑ Θ 0 P ϑ (ϕ(x 1,..., X ) = 1) α (d.h. die W keit für eie Fehler 1. Art (die Nullhypothese fälschlicherweise zu verwerfe) ist α) 28/51

29/51 Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Die Fragestellug statistischer Tests Zugleich ist wüscheswert: P ϑ (ϕ(x 1,..., X ) = 0)! = möglichst klei für ϑ Θ 1, die W keit für eie Fehler 2. Art (die Nullhypothese fälschlicherweise zu akzeptiere) sollte klei sei. Da hat ϕ große Schärfe oder Macht.

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Statistischer Tests: Niveau vs. p-wert I der Praxis habe Tests meist die folgede Form: Bereche eie gewisse (Test-)Statistik Y = Y (x 1,..., x ), setze ϕ(x 1,..., x ) = 1(Y (x 1,..., x ) > q) für eie gewisse Wert q = q(α), der i Abhägigkeit vo de Parameter des Tests gewählt wird. Sei y = Y (x 1,..., x ) beobachtet worde. Da et ma (speziell we Θ 0 = {ϑ 0 }) P ϑ0 (Y (X 1,..., X > y)) de p-wert des Test(ergebisses). Dies ist die W keit, bei Gültigkeit der Nullhypothese eie midestes so extreme Wert der Teststatistik zu fide wie de tatsächlich ahad der Date beobachtete. (Es gilt: Test leht H 0 zum Niveau α ab gd.w. p-wert α.) 30/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe ei Stichprobe-t-Test Modell: u.i.v. Beobachtuge X 1,..., X, X i N µ,σ 2, µ R ud σ 2 > 0 ubekat. X = 1 i=1 X i, S 2 = 1 1 1 i=1 (X i X) 2 Wir wisse: Für jedes µ R, σ 2 > 0 ist uter P (µ0,σ 2 ) T = X µ 0 S 2 Studet-( 1) Sigifikaziveau α (0, 1): Zweiseitiger Test vo H 0 {µ = µ 0 } gege H 1 {µ µ 0 }: Lehe H 0 ab, we T > q 1,1 α/2, wobei q 1,1 α/2 = (1 α/2)-quatil der Studet-( 1)-Vert. Eiseitiger Test vo H 0 {µ µ 0 } gege H 1 {µ > µ 0 }: Lehe H 0 ab, we T > q 1,1 α, wobei q 1,1 α = (1 α)-quatil der Studet-( 1)-Vert. 32/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 33/51 Beispiel: Die Wirksamkeit eies gewisse Schlafmittels soll geprüft werde. 10 Patiete erhalte das Schlafmittel, die Azahl zusätzlicher Stude Schlaf wird i eier Nacht beobachtet. Wir ehme a, die Beob. sid u.i.v. N µ,σ 2 ud wir möchte die Nullhypothese µ = 0, sage wir, zum Niveau α = 0.05 teste.

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 34/51 Die Date Patiet i 1 2 3 4 5 6 7 8 9 10 zus. Schl. 0.7-1.6-0.2-1.2-0.1 3.4 3.7 0.8 0.0 2.0 Es ist = 10, x = 1 10 10 i=1 x i = 0.75, s 2 = 1 9 10 i=1(x i x) 2 1.79, t = x 0 s/ 1.326 10 Das 0.975-Quatil der Studet-9-Verteilug ist 2.262, demach köe wir die Nullhypothese icht ablehe. (Für ei Studet-9-verteiltes T ist P( T 1.326) 0.2176, dies ist der p-wert des Tests.) Aus Studet (William S. Gosset), The Probable Error of a Mea, Biometrika 6:1 25 (1908)

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 35/51 Ma ka usere Befud folgedermaße formuliere: Die Beobachtuge sid mit der Nullhypothese µ = 0 (im statistische Sie) verträglich. oder Die beobachtete Abweichug x = 0.75 ist icht sigifikat vo 0 verschiede (t-test, α = 0.05).

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 36/51 Das Beispiel i R: > schlaf <- c(0.7, -1.6, -0.2, -1.2, -0.1, 3.4, 3.7, 0.8, 0.0, 2.0) > t.test(schlaf) Oe Sample t-test data: schlaf t = 1.3257, df = 9, p-value = 0.2176 alterative hypothesis: true mea is ot equal 95 percet cofidece iterval: -0.5297804 2.0297804 sample estimates: mea of x 0.75

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 37/51 Beispiel: Die Wirksamkeit eies Schlafmittels soll mit der eies adere vergliche werde 10 Patiete erhalte Schlafmittel A, die Azahl zusätzlicher Stude Schlaf wird i eier Nacht beobachtet. Da erhalte dieselbe 10 Patiete Schlafmittel B, wieder wird die Azahl zusätzlicher Stude Schlaf wird i eier Nacht beobachtet. Da dieselbe Patiete utersucht werde, köe (ud sollte) wir die Messuge paare: Wir iteressiere us bei jedem Patiete für die Differez des (zusätzliche) Schlafs bei Mittel B ud bei Mittel A.

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Wir ehme a, die beobachtete Differeze sid Realisieruge vo u.i.v. ZV mit Vert. N µ,σ 2 ud wir möchte die Nullhypothese µ 0 gege die Alterative µ > 0, sage wir, zum Niveau α = 0.05 teste. Dies wäre beispielsweise i folgeder Situatio agemesse: Wir möchte darlege, dass Mittel B wirksamer ist als Mittel A, idem wir die Nullhypothese µ 0 etkräfte. Die Date Patiet i 1 2 3 4 5 6 7 8 9 10 Mittel A 0.7-1.6-0.2-1.2-0.1 3.4 3.7 0.8 0.0 2.0 Mittel B 1.9 0.8 1.1 0.1-0.1 4.4 5.5 1.6 4.6 3.4 Diff. 1.2 2.4 1.3 1.3 0.0 1.0 1.8 0.8 4.6 1.4 Aus Studet (William S. Gosset), The Probable Error of a Mea, Biometrika 6:1 25 (1908) 38/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 39/51 Patiet i 1 2 3 4 5 6 7 8 9 10 Diff. 1.2 2.4 1.3 1.3 0.0 1.0 1.8 0.8 4.6 1.4 Es ist = 10, x = 1 10 10 i=1 x i = 1.58, s 2 = 1 9 10 i=1(x i x) 2 1.23, t = x 0 s/ 4.062 10 Das 0.95-Quatil der Studet-9-Verteilug ist 1.833, demach köe wir die Nullhypothese ablehe. (Für ei Studet-9-verteiltes T ist P(T > 4.062) 0.0014, dies ist der p-wert des Tests.) Mögliche kappe Formulierug: Die beobachtete Differez x = 1.58 ist sigifikat größer als 0 (eiseitiger t-test, α = 0.05).

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 40/51 Das Beispiel i R: > diff <- c(1.2, 2.4, 1.3, 1.3, 0.0, 1.0, 1.8, 0.8, 4.6, 1.4) > t.test(diff, alterative="greater") Oe Sample t-test data: diff t = 4.0621, df = 9, p-value = 0.001416 alterative hypothesis: true mea is greater th 95 percet cofidece iterval: 0.8669947 If sample estimates: mea of x 1.58

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe ugepaarter t-test: Modell m u.i.v. Beobachtuge X 1,..., X m ud davo uabhägig u.i.v. BeobachtugeY 1,..., Y, uter P ϑ X i N µ1,σ 2, Y j N µ2,σ 2 mit ϑ = (µ 1, µ 2, σ 2 ) R R (0, ) Seie S 2 X = 1 m 1 X = 1 m m i=1 m i=1 X i, Y = 1 j=1 (X i X) 2, SY 2 = 1 1 Y j j=1 (Y j Y ) 2, S 2 = (m 1)S2 X + ( 1)S2 Y m + 2 (bem.: E (µ1,µ 2,σ 2 ) [S2 ] = σ 2 ) T = X Y. 1 S m + 1 1 (= ( m+ 2 (X i X) 2 + i=1 j=1 (Y j Y ) 2 )), 42/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 43/51 Für µ 0 R, σ 2 > 0 ist uter P (µ0,µ 0,σ 2 ) T = X Y 1 S m + 1 Studet-(m + 2) Sigifikaziveau α (0, 1): Zweiseitiger Test vo H 0 {µ 1 = µ 2 } gege H 1 {µ 1 µ 2 }: Lehe H 0 ab, we T > q m+ 2,1 α/2, wobei q m+ 2,1 α/2 = (1 α/2)-quatil der Studet-( 1)-Vert. Eiseitiger Test vo H 0 {µ 1 µ 2 } gege H 1 {µ 1 > µ 2 }: Lehe H 0 ab, we T > q m+ 2,1 α, wobei q m+ 2,1 α = (1 α)-quatil der Studet-( 1)-Vert.

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Beispiel: Es wurde fossile Backezähe gefude, die zwei Arte vo Urpferde zugeordet wurde, ud jeweils die ( mesiodistale ) Läge bestimmt. Wir möchte die (Null-)Hypothese prüfe, ob die mittlere Zahläge bei de beide Arte gleich ist. Die Date H. libycum H. africaum x A = 25.9, s A = 2.2 x A s A x L s L x A + s A x L = 28.4, s L = 4.3 x L + s L 25 30 35 40 Hippario africaum A = 39 x A = 25.9 s A = 2.2 Hippario lybicum L = 38 x L = 28.4 s L = 4.3 mesiodistale Läge [mm] 44/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Wir verwede Sigifikaziveau α = 0.01, das 99,5%-Quatil der Studet-Vert. mit 75 Freiheitsgrade ist 2.64. Es ist s 2 = ( A 1)s 2 A + ( L 1)s 2 L A + L 1 11.94, t = x A x L s 1 A + 1 L 3.229, Wir köe die Nullhypothese die mittlere mesiodistale Läge bei H. lybicum ud bei H. africaum sid gleich zum Sigifikaziveau 1% ablehe. (Für ei Studet-75-verteiltes T ist P( T > 3.229) 0.0018, dies ist der p-wert des Tests.) Mögliche Formulierug useres Befuds: Die mittlere mesiodistale Läge war sigifikat größer (28.4 mm) bei H. libycum als bei H. africaum (25.9 mm) (t-test, α = 0,01). 45/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 46/51 Das Beispiel i R: > t.test(md[art=="africaum"],md[art=="libycum" var.equal=true) Two Sample t-test data: md[art == "africaum"] ad md[art == "li t = -3.2289, df = 75, p-value = 0.001845 alterative hypothesis: true differece i meas is ot equal to 0 95 percet cofidece iterval: -4.0811448-0.9667634 sample estimates: mea of x mea of y 25.91026 28.43421

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 47/51 Betrachte wir (spaßeshalber) ochmal die Schlafmittel-Date, diesmal ugepaart: > meda <- c(0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0.0, > medb <- c(1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,4.6,3.4 > t.test(medb, meda, var.equal=true) Two Sample t-test data: medb ad meda t = 1.8608, df = 18, p-value = 0.07919 alterative hypothesis: true differece i mea 95 percet cofidece iterval: -0.203874 3.363874 sample estimates: mea of x mea of y 2.33 0.75

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe t-statistik ohe Aahme gleicher Variaz Es gibt auch eie Versio des zwei-stichprobe-t-tests, der die Aahme gleicher Variaze icht trifft (wir werde ih im Verlauf der Vorlesug allerdigs icht verwede): Wäre eie beobachtete Abweichug x y mit der Nullhypothese verträglich, dass µ X = µ Y? Wir schätze die Streuug vo X Y durch S2 X + S2 Y X Y ud bilde T =. X Y + S2 Y Y S 2 X X Uter P (µ0,µ 0,σ1 2,σ2 2 ) ist T approximativ Studet-verteilt mit g Freiheitsgrade ( s2 X X + s2 Y Y ) 2 wobei g aus de Date geschätzt wird, g= s X 4 X 2 ( X 1) + s4 Y Y 2 ( Y 1) 49/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe Welchs zwei Stichprobe-t-Test T = X Y S 2 X X ( s2 X X + s2 Y Y ) 2, g= + S2 s X 4 Y X 2 ( X 1) + s4 Y Y 2 ( Y 1) Y Ma verwirft die Nullhypothese µ 1 = µ 2 (zum Niveau α), we pt( t, df=g, lower.tail=false) α/2 ist, d.h. we die Wahrscheilichkeit, dass eie Studet-verteilte Zufallsgröße mit g Freiheitsgrade eie betragsmäßig midestes so große Wert wie de beobachtete t-wert aimmt, α ist. (Aaloges Vorgehe für eiseitige Tests) B. L. Welch, The Sigificace of the Differece betwee Two Meas Whe the Populatio Variaces Are Uequal, Biometrika 29:350 362, (1938) 50/51

Schätzer ud Kofidezitervall Statistische Tests Abstrakter Rahme ei Stichprobe- oder gepaarter t-test zwe 51/51 Zwei-Stichprobe-t-Test mit R: > A <- md[art=="africaum"] > L <- md[art=="libycum"] > t.test(l,a) Welch Two Sample t-test data: L ad A t = 3.2043, df = 54.975, p-value = 0.002255 alterative hypothesis: true differece i mea is ot equal to 0 95 percet cofidece iterval: 0.9453745 4.1025338 sample estimates: mea of x mea of y 28.43421 25.91026