Formelsammlung Statistik II 1. 1 Numerische und graphische Zusammenfassung quantitativer

Transkript

1 TU Kaiserslautern Sommer 202 FB Mathematik Stand Prof Dr Jörn Saß Formelsammlung Statistik II umerische und graphische Zusammenfassung quantitativer Daten Beobachtet werden Daten x,,x Die Ordungsstatistiken x () x (2) x () sind die der Größe nach sortierten Daten Stichprobenmittel x = x i i= { x(m+), falls = 2m+ Stichprobenmedian ẋ = 2 (x (m) +x (m+) ), falls = 2m Stichprobenstandardabweichung s = (x i x ) 2 Stichprobenvarianz s 2 Spannweite d = x () x () Unterer und oberer Viertelwert v u bzw vo sind definiert durch x (m), falls + = 4m 3 v u 4 = x (m) + 4 x (m+), falls + = 4m+ 2 x (m) + 2 x (m+), falls + = 4m+2 4 x (m) x (m+), falls + = 4m+3 x (3m), falls + = 4m v o 4 = x (3m) x (3m+), falls + = 4m+ 2 x (3m+) + 2 x (3m+2), falls + = 4m x (3m+2) + 4 x (3m+3), falls + = 4m+3 Viertelweite d v = vo vu Als Ausreißer für die Zeichnung eines Boxplots definieren wir Datenwerte, die um mehr als,5d v oberhalb von v0 oder unterhalb von vu liegen Histogramm der Anzahlen H (x) = Z n für x I n, n Z, Histogramm der relativen Häufigkeiten H (x) = Zn für x I n, n Z, wobei für Startwert a und Intervallbreite b die Intervalle I n definiert sind durch i= I n = (a+(n )b,a+nb] und Z n die Anzahl der Daten bezeichnet, die in Intervall I n fallen Basierend auf dem Skript von Prof Dr Franke

2 Faustregel: Wähle a und b so, dass ẋ etwa in einer Intervallmitte liegt, dass [x (),x () ] von 5 bis 20 Intervallen überdeckt wird, und dass mindestens das 5-fache der Anzahl der nicht-leeren Intervalle ist Verteilungseigenschaften, die man an einem Histogramm gut erkennen kann, sind Schiefe der Verteilung: Wir unterscheiden Rechtsschiefe, die typischerweise mit x >> ẋ einhergeht und Linksschiefe, für die typischerweise x << ẋ gilt Mehrgipfligkeit: Die Verteilung der Daten wird uni-, bi-, mulitmodal genannt, falls in ihr ein, zwei, oder mehr Gipfel beobachtet werden können Messenwiran ObjektenjeweilszweiMerkmale,soerhaltenwirzweiDatensätzex,,x und y,,y Abhängigkeitsmaße sind: Stichprobenkovarianz ĉ = (x i x )(y i y ) i= ĉ Stichprobenkorrelation ˆρ = s,x s,y wobei Stichprobenmittelwerte und -standardabweichungen sich wie oben berechnen, dh x = x i, y = y i, i= i= s,x = (x i x ) 2, s,y = (y i y ) 2 i= Die Stichprobenkorrelation ˆρ hat stets Werte zwischen - und 2 Wahrscheinlichkeitstheoretische Grundlagen Ein Wahrscheinlichkeitsraum (Ω, A, P) besteht aus Ergebnismenge Ω Ein Element ω Ω wird als Ergebnis eines Zufallsexperiments interpretiert Ω sollte alle Ergebnisse umfassen, die in dem Experiment möglich sind Menge von Ereignissen A Ein Ereignis A ist geeignete Teilmenge von Ω, dh A Ω Wahrscheinlichkeit P, die jedem Ereignis A seine Wahrscheinlichkeit zuordnet Ereignisse und ihre Verknüpfung Spezialfälle: Elementarereignis {ω} für ω Ω, sicheres Ereignis Ω, unmögliches Ereignis A und B : A B (Durchschnitt) A oder B : A B (Vereinigung) A, aber nicht B : A\B (A ohne B) Gegenereignis, nicht A : A c = Ω\A (Komplement von A) A, B schließen sich aus : A B = (A und B sind disjunkt) Ereignissystem A: Falls Ω nur endlich viele Elemente hat, kann stets A = P(Ω) gewählt werden Dabei bezeichnet P(Ω) die Menge aller Teilmengen von Ω (Potenzmenge) Ist Ω nicht endlich, so muss man für die Definition von Wahrscheinlichkeiten gewisse pathologische Mengen ausschließen Es ist sehr schwierig, solche pathologischen Mengen zu konstruieren, sie werden uns in der Praxis nicht begegnen Wir verzichten daher auf eine genauere Darstellung Die Wahrscheinlichkeit P : A [0,] ist eine Funktion, die jedem Ereignis A seine Wahrscheinlichkeit P(A) zuordnet Es gelten für alle Ereignisse A, B, A, A 2, die Rechenregeln i= 2

3 P(A) 0, P( ) = 0, P(Ω) = P(A A 2 ) = P(A )+P(A 2 )+, falls A i A j = für alle i j P(A B) = P(A)+P(B) P(A B) P(A c ) = P(A) P(A) P(B), falls A B Zufallsgrößen Eine Zufallsgröße X mit Werten in einer Menge X ist eine Abbildung X : Ω X Bei Beobachtung des Wertes (der Realisation) von X in einem Zufallsexperiment, kann entschieden werden, ob ein Ereignis der Form {X B} = {ω Ω : X(ω) B} eingetreten istdieverteilungp X gibtdiewahrscheinlichkeitdieserereignisseanundistdefiniertdurch P X (B) = P({X B}) für alle geeigneten Teilmengen B X (geeignet = nicht pathologisch, siehe oben) Weitere otationen: ZB {X x} = {X (,x]}, P(X x) = P({X x}) Diskrete Verteilungen Eine Zufallsgröße X mit Werten in {0,,,n} heißt binomialverteilt mit Erfolgswahrscheinlichkeit p, falls ( ) n P(X = k) = p k ( p) n k, k = 0,,,n k Bezeichnung: X B(n, p) Interpretation: n unabhängige Zufallsexperimente mit Ausgang Erfolg/Misserfolg, p Erfolgswahrscheinlichkeit in einem Experiment, X Anzahl der Erfolge Binomialkoeffizient ( ) n k = n! k!(n k)! = n(n ) (k(k ))((n k)(n k )) = n(n (n k+) k(k ) ) gibt die Anzahl der Möglichkeiten an, k Objekte aus n verschiedenartigen Objekten ( n k auszuwählen (oder k Einsen auf n Stellen zu verteilen) Für n, M heißt eine Zufallsgröße X mit Werten in {0,,,min{n,M}} hypergeometrisch verteilt, falls ( M M ) P(X = k) = k)( n k (, k = 0,,,min{n,M} n) Bezeichnung: X H(n, M, ) Interpretation: Objekte, M davon mit bestimmten Merkmal, n Stichprobengröße, X Anzahl der gezogenen Objekte mit diesem Merkmal Eine Zufallsgröße X mit Werten in einer endlichen Menge {a,,a m } heißt Laplaceverteilt, falls P(X = a i ) = m, i =,,m Eine Zufallsgröße X mit Werten in {0,,2,} heißt Poisson-verteilt mit Parameter λ > 0, falls P(X = k) = λk k! e λ, k = 0,,2, Bezeichnung: X P(λ) oder X Poi(λ) Interpretation: X Anzahl pro Zeitintervall eines in unregelmäßigen Abständen auftretenden Ereignisses, λ mittlere Häufigkeit des Ereignisses pro Zeitintervall 3

4 Alle bisher betrachteten Verteilungen sind diskret, dh sie sind von der Form, dass X Werte in einer höchstens abzählbaren Menge {a,a 2,} annimmt und für i =,2, ist P(X = a i ) = p i, wobei p i 0, p i = i= Verteilungen mit Dichte Eine Zufallsgröße X mit Werten in IR ist verteilt mit (Wahrscheinlichkeits-)Dichte p(x), falls für alle nicht pathologischen B IR gilt P(X B) = p(x)dx, wobei p(x) 0, p(x)dx = B Insbesondere ist P(a < X < b) = P(a X b) = P(X [a,b]) = b a p(x)dx X heißt uniform verteilt (oder Rechteck-, gleichverteilt) in [a, b], falls p(x) = b a für x [a,b] und p(x) = 0 sonst X heißt normalverteilt mit Parametern µ, σ 2 (oder σ), falls p(x) = ϕ µ,σ 2(x) = 2πσ 2 e (x µ)2 2σ 2 Bezeichnung: X (µ,σ 2 ) Dann ist Z = X µ σ standard-normalverteilt, dh Z (0, ) Gilt umgekehrt Z (0,), so ist X = µ+σz (µ,σ 2 ) X mitwertenin(0, )heißtlognormalverteiltmitparameternµ,σ 2,fallsln(X) (µ,σ 2 ) X heißt exponentialverteilt mit Parameter λ > 0, falls p(x) = λe λx für x 0 und p(x) = 0 für x < 0 Bezeichnung: X Exp(λ) X heißt Weibull verteilt mit Parametern λ > 0, β > 0, falls X β Exp(λ) Verteilungsfunktion, Quantile, Erwartungswert und Varianz Die Verteilungsfunktion von X ist definiert durch F(x) = P(X x), x IR Eigenschaften: F( ) = 0, F( ) =, P(X > x) = F(x), P(a < X b) = F(b) F(a) Für X (0,) schreibe Φ(x) = F(x) Die Werte sind tabelliert für x > 0, nutze Φ( x) = Φ(x) für negative Werte Für stetiges X ist das α-quantil q α definiert durch α = F(q α ) Spezialfälle: Med(X) = q 0,5 Median, q 0,25 unterer und q 0,75 oberer Viertelwert Viertelweite: Q(X) = q 0,75 q 0,25 Für diskretes X ist q α ein α-quantil, falls P(X < q α ) α P(X q α ) Ist X diskret mit Werten in {a,a 2,} und P(X = a i ) = p i, i =,2,, so heißt E(X) = 4 p i a i i=

5 Erwartungswert von X (auch Mittelwert) Ist X stetig mit Dichte p(x), so E(X) = p(x)x dx Ist X diskret oder stetig, so werden die Varianz Var(X) und die Standardabweichung σ(x) von X definiert durch Var(X) = E ( (X E(X)) 2), σ(x) = Var(X) Beachte: Dabei benutzen wir, dass f(x) für eine Funktion f : IR IR wieder eine Zufallsgröße ist, deren Erwartungswert sich berechnet zu E(f(X)) = p i f(a i ) bzw E(f(X)) = i= p(x)f(x) dx Rechenregeln und Eigenschaften: Für Zufallsgrößen X, Y und a, b IR gelten E(aX +by) = ae(x)+be(y), wegen E() = insbesondere E(aX +b) = ae(x)+b Var(aX +b) = a 2 Var(X), σ(ax +b) = a σ(x) Var(X) = E(X 2 ) (E(X)) 2 Erwartungswerte und Varianzen einiger Verteilungen Verteilung von X E(X) Var(X) binomial B(n, p) np np( p) hypergeometrisch H(n,M,) n M nm( M)( n) 2 ( ) Poisson P(λ) λ λ uniform in [α,β] α+β 2 2 (β α)2 normal (µ,σ 2 ) µ σ 2 lognormal mit (µ,σ 2 ) exponential Exp(λ) λ Weibull mit (λ,β) λ β Γ(+ β ) λ 2 β e µ+σ2 2 e 2µ+σ2 2 (e σ2 ) λ 2 (Γ(+ 2β ) (Γ(+ β ))2 ) Dabei bezeichnet Γ die Gamma-Funktion, eine Verallgemeinerung der Fakultät Es gilt Γ(n+ ) = n! für n = 0,,2, Die Werte für Γ(x), x 0, können nachgeschlagen werden äherungsformeln für Wahrscheinlichkeiten H(n,M,) B(n, M ), falls M >> n und M >> n B(n,p) P(np), falls np mittlere Größe, p klein Faustregel: Gut, falls n 00, np 0; befriedigend, falls n 20, p 0,05 B(n,p) (np,np( p)), falls n groß, p nicht zu dicht bei 0 oder Faustregel: np 5 und n( p) 5 5

6 Unabhängigkeit und Korrelation n Zufallsgrößen X,,X mit Werten in X heißen unabhängig, falls P(X A,,X A ) = P(X A ) P(X A ) für alle nicht-pathologischen Teilmengen A,,A X X,,X heißen unabhängig identisch verteilt (uiv), falls sie zusätzlich die gleiche Verteilung besitzen Sind X,,X unabhängige Zufallsgrößen mit Werten in IR und existierenden Erwartungswerten und Varianzen, so gelten E(X X ) = E(X ) E(X ) und Var(X ++X ) = Var(X n ) Für zwei Zufallsgrößen X, Y mit Werten in IR und endlichen Varianzen 0 heißen n= Cov(X,Y) = E((X E(X))(Y E(Y))) und Corr(X,Y) = Cov(X,Y) σ(x)σ(y) Kovarianz bzw Korrelation von X und Y Ist Corr(X,Y) = 0, so heißen X, Y unkorreliert Eigenschaften und Rechenregeln: Cov(X,Y) = E(XY) - E(X) E(Y), Cov(X,Y+Z) = Cov(X,Y) +Cov(X,Z), Es gelten Cov(aX+c,bY +d) = abcov(x,y) und Corr(aX+c,bY +d) = Corr(X,Y) für a,b > 0 und c,d IR, Corr(X,Y), wobei Corr(X,Y) =, falls Y = ax+b, und Corr(X,Y) =, falls Y = ax +b, jeweils für a > 0 Sind X, Y unabhängig, so sind X und Y unkorreliert Die Umkehrung vom letzten Punkt gilt im Spezialfall gemeinsam normalverteilter X, Y Im Allgemeinen folgt aus der Unkorreliertheit aber nicht die Unabhängigkeit 3 Schätzer für Verteilungsparameter Statistisches Modell: Beobachtet werden uiv Zufallsgrößen X,,X, deren Verteilung P ϑ von einem unbekannten Parameter ϑ Θ IR d abhängt, aber die ansonsten bekannt ist Der Erwartungswert bei Verteilung P ϑ wird mit E ϑ bezeichnet Punktschätzer Schätzfunktion T : IR Θ Schätzerfürϑist ˆϑ = T(X,,X )BeibeobachtetenWertenx,,x (Realisierungen von X,,X ) sprechen wir auch vom Schätzwert T(x,,x ) Ein Schätzer ˆϑ heißt konsistent, falls P ϑ (lim ˆϑ = ϑ) = Ein Schätzer ˆϑ heißt erwartungstreu, falls E ϑ (ˆϑ ) = ϑ Die Stichprobenkennzahlen X, s 2 sind konsistent und erwartungstreu für E[X ], Var(X ) Unter schwachen Bedingungen an die Verteilung sind auch Ẋ und die Stichprobenquantile konsistente Schätzer für Med(X ) und die entsprechenden Quantile der Verteilung Für eine stetige Funktion f sind f(x ) und i= f(x i) konsistent für f(e(x )) bzw E(f(X )) 6

7 Ein Maß für die Güte des Schätzers ˆϑ ist der mittlere quadratische Fehler ( MSE(ˆϑ ) = E (ˆϑ ϑ) 2) ( 2 = Var(ˆϑ )+ E(ˆϑ ) ϑ) Dabei heißt E(ˆϑ ) ϑ der Bias vom Schätzer ˆϑ Ein guter Schätzer muss MSE(ˆϑ ) 0 für erfüllen Eine Liste guter Schätzer für einige Verteilungsparameter liefert folgende Tabelle: Verteilung von X bekannt ϑ Schätzer X B(n,p) n p ˆp = X n X H(n,M,) n, M ˆM = X n X,,X uiv P(λ) λ ˆλ = X X,,X uiv Exp(λ) λ ˆλ = X X,,X uiv (µ,σ 2 ) σ 2 µ ˆµ = X X,,X uiv (µ,σ 2 ) (µ,σ 2 ) ˆµ = X ˆσ 2 = s 2 X,,X uiv (µ,σ 2 ) ˆµ = i= lnx i und lognormal mit (µ,σ 2 ) ˆσ 2 = i= (ln(x i) ˆµ) 2 Konfidenzintervalle Ein Konfidenzintervall (Intervallschätzer, Vetrauensbereich) für ϑ zum Sicherheitsniveau α ist ein (zufälliges) Intervall [T,T 2 ] mit Grenzen T i = g i (X,,X ), i =,2, so dass P(ϑ [T,T 2 ]) α für alle ϑ Θ Bei ormalverteilung können die Konfidenzintervalle exakt bestimmt werden Seien also X,,X uiv (µ,σ 2 ) Wir unterscheiden drei Fälle: (a) X i (µ,σ 2 ), µ unbekannt, σ 2 bekannt, schätze µ Dann ist [T,T 2 ] = X ± σ q α/2 = ein α Konfidenzintervall für µ [ X σ q α/2, X + σ q α/2 ] Dabei bezeichnet q α/2 das ( α/2)-quantil der Standardnormalverteilung (b) X i (µ,σ 2 ), µ unbekannt, σ 2 unbekannt, schätze µ Dann ist [T,T 2 ] = X ± s t, α/2 = ein α Konfidenzintervall für µ [ X s t, α/2, X + s t, α/2 ] Dabei bezeichnet t, α/2 das ( α/2)-quantil der t-verteilung mit Freiheitsgraden Die Werte sind tabelliert 7

8 (c) X i (µ,σ 2 ), µ unbekannt, σ 2 unbekannt, schätze σ 2 Dann ist [ ] ( )s 2 [T,T 2 ] = χ 2, ( )s2, α/2 χ 2,α/2 ein α Konfidenzintervall für σ 2 Dabei bezeichnen χ 2,α/2 und χ2, α/2 die α/2- und ( α/2)-quantile der Chi- Quadrat-Verteilung mit Freiheitsgraden Die Werte sind auch tabelliert Liegt keine ormalverteilung vor, so kann für X,,X uiv mit µ = E(X i ), σ 2 = Var(X i )mithilfedeszentralengrenzwertsatzeseinapproximatives( α)-konfidenzintervall bestimmt werden: (d) Approximatives Konfidenzintervall für µ bei bekanntem σ 2 : [T,T 2 ] = X ± σ q α/2 = [ X σ q α/2, X + σ q α/2 ] (e) Approximatives Konfidenzintervall für µ bei unbekanntem σ 2 : [T,T 2 ] = X ± s t, α/2 = [ X s t, α/2, X + s t, α/2 ] (f) Im Spezialfall der Binomialverteilung, dh X B(n, p) erhält man mit einem weiteren Approximationsargument ein ( α)-konfidenzintervall für p: [ ] ˆp( ˆp) ˆp( ˆp) [T,T 2 ] = ˆp q α/2, ˆp+q α/2, ˆp = X n n n Kovarianz und Korrelationsschätzer Die zweidimensionale Zufallsgrößen (X,Y ),,(X,Y ) seien uiv mit existierenden Varianzenungleich0DannsinddieStichprobenkovarianzĉ unddiestichprobenkorrelation ˆρ gute Schätzer für die Kovarianz Cov(X i,y i ) bzw die Korrelation Corr(X i,y i ) Da die Verteilung von ˆρ schief und auf [,] begrenzt ist, wird eine Transformation benutzt: ŵ = 2 ln ( + ˆρ ˆρ ist für 50, ρ <<, ungefähr (w, 3 )-verteilt mit w = 2 ln(+ρ ρ ), wobei ρ = Corr(X i,y i ) Ein approximatives ( α)-konfidenzintervall für w ist ) [T,T 2 ] = ŵ ± q α/2 3, wobei q α/2 das ( α 2 )-Quantil der Standardnormalverteilung ist Aus den Grenzen ergibt sich durch Rücktransformation ein approximatives ( α)-konfidenzintervall für ρ zu [ e 2T ] [R,R 2 ] = e 2T +, e2t2 e 2T2 + Verteilung einiger Schätzer Bei der Berechnung der Konfidenzintervalle wurden folgende Aussagen für uiv X,,X benutzt: (a) Falls X i (µ,σ 2 ), so ist X µ σ standard-normalverteilt 8

9 (b) Falls X i (µ,σ 2 ), so ist X µ s (c) Falls X i (µ,σ 2 ), so ist ( )s2 σ 2 t-verteilt mit Freiheitsgraden Chi-Quadrat-verteilt mit Freiheitsgraden (d) FürnichtnormalverteilteX i giltderzentralegrenzwertsatz:existierenµ = E(X i )und σ 2 = Var(X i ) > 0, so ist X µ σ für große ungefähr standard-normalverteilt, genauer ( ) lim P X µ z = Φ(z) σ (e) Ist X B(n,p), so gilt für geeignete n,p (siehe Kap 2), dass X ungefähr (np,np( p))-verteilt ist (f) In der Situation vom letzten Abschnitt ist für geeignete und ρ(siehe oben) die transformierte Größe ŵ = ln(+ˆρ 2 ˆρ ) ungefähr (w, 3 )-verteilt für w = 2 ln(+ρ ρ ) 4 Lineare Regression Regressionsmodell: Beobachtet werden unabhängige Datenpaare (X,Y ),,(X,Y ) und es wird ein Zusammenhang Y i = g(x i )+ε i, i =,,, angenommen mit Regressionsfunktion g und uiv Messfehlern ε,,ε mit E(ε i ) = 0, Var(ε i ) = σε 2 Methode der kleinsten Quadrate: Wähle g aus einer geeigneten Klasse von Funktionen so, dass (Y i g(x i )) 2 i= minimiert wird Bei der linearen Regression werden Funktionen g der Form g(x) = b f (x)+b 2 f 2 (x)+b d f d (x) betrachtet, wobei f,f d bekannte vorgegebene Funktionen sind und b,,b d durch die Methode der kleinsten Quadrate zu schätzen sind Spezialfälle: Regressionsgerade g(x) = b + b 2 x In diesem Fall ergibt sich mit der Methode der kleinsten Quadrate ˆb2 = ĉ s 2, ˆb = Y ˆb 2 X,x Regressionspolynom 2 Ordnung g(x) = b +b 2 x+b 3 x 2 5 Statistische Entscheidungsverfahren (Tests) Bei einem Hypothesentest wird eine Hypothese H 0 (ullhypothese) gegen eine Alternative H (Alternativhypothese) getestet Dabei können folgende Fehler auftreten: akzeptiere H 0 verwerfe H 0 H 0 wahr richtig Fehler Art H 0 falsch Fehler 2 Art richtig 9

10 Bei einem statistischen Test wird auf Basis der Stichprobe eine Testgröße berechnet, anhand dererh 0 abgelehntoderbeibehalten(besser:nichtabgelehnt)wirdbeieinemsignifikanztest zum iveau α (Signifikanzniveau) wird das Kriterium so gewählt, dass im ungünstigsten Fall der Fehler Art gleich α ist Typische Werte für α sind 0,05, 0,0 oder 0,00 Es können nicht gleichzeitig Fehler Art und Fehler 2 Art kontrolliert werden Daher wählt man beim Signifikanztest möglichst das, was gezeigt werden soll (das mit den schwerwiegenderen Konsequenzen) als Alternative: Wenn wir H 0 ablehnen, dh uns für die gewünschte Alternative entscheiden, wissen wir, dass der Fehler höchstens α ist Gauß-Test Voraussetzung: X,,X uiv, (µ,σ 2 ) mit bekanntem σ Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : µ = µ 0 (oder µ µ 0 ), H : µ > µ 0 (ii) H 0 : µ = µ 0 (oder µ µ 0 ), H : µ < µ 0 (iii) H 0 : µ = µ 0, H : µ µ 0 3 Beobachte X,X und berechne Testgröße Z = X µ0 σ 4 Lehne H 0 ab, falls in (i) Z > q α, in (ii) Z < q α, in (iii) Z < q α/2 oder Z > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist Einstichproben t-test Voraussetzung: X,,X uiv, (µ,σ 2 ) mit unbekanntem σ Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : µ µ 0, H : µ > µ 0, (ii) H 0 : µ µ 0, H : µ < µ 0 oder (iii) H 0 : µ = µ 0, H : µ µ 0 3 Beobachte X,,X und berechne Testgröße t = X µ0 s 4 Lehne H 0 ab, falls in (i) t > t, α, in (ii) t < t,α, bzw in (iii) t < t,α/2 oder t > t, α/2, wobei t,β das β-quantil der t-verteilung mit Freiheitsgraden ist Anwendung auf Vergleich des Mittelwertes unabhängiger identisch gemeinsam normalverteilter Paare (X,Y ),(X,Y ): Es seien µ = E(X i ), µ 2 = E(Y i ) Die Differenzen D i = X i Y i,i =,, sinddannuiv (µ,σ 2 )mitµ = µ µ 2 unddereinstichprobent-test mit Alternative (i) µ > 0, (ii) µ < 0, (iii) µ 0 kann verwendet werden, um auf (i) µ > µ 2, (ii) µ < µ 2, oder (iii) µ µ 2 zu testen Zweistichproben t-test Voraussetzung: X,,X,Y,,Y M unabhängig mit X,,X uiv (µ,σ 2 ) und Y,,Y M uiv (µ 2,σ 2 ) mit unbekanntem σ Vorgehen: 0

11 Wähle die zu testende Hypothese: (i) H 0 : µ µ 2, d H : µ > µ 2, (ii) H 0 : µ µ 2, H : µ < µ 2, oder (iii) H 0 : µ = µ 2, H : µ µ 2 3 Beobachte X,X,Y,,Y M und berechne Testgröße t = X Y M s,m + M, wobei s 2,M = ( )s2,x +(M )s2 M,y +M 2 4 Lehne H 0 ab, falls in (i) t > t +M 2, α, in (ii) t < t +M 2,α, bzw in (iii) t < t +M 2,α/2 oder t > t +M 2, α/2, wobei t +M 2,β das β-quantil der t-verteilung mit +M 2 Freiheitsgraden ist F-Test Voraussetzung: X,,X,Y,,Y M unabhängig mit X,,X uiv (µ,σ 2 ) und Y,,Y M uiv (µ 2,σ 2 2) mit unbekannten σ, σ 2 Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : σ 2 σ 2 2, H : σ 2 > σ 2 2 (ii) H 0 : σ 2 σ 2 2, H : σ 2 < σ 2 2 oder (iii) H 0 : σ 2 = σ 2 2, H : σ 2 σ Beobachte X,X,Y,,Y M und berechne Testgröße F = s2,x s 2 M,y 4 Lehne H 0 ab, falls in (i) F > f,m, α, in (ii) F < f,m,α, bzw in (iii) F < f,m,α/2 oder F > f,m, α/2, wobei f,m,β das β-quantil der F-Verteilung mit (,M ) Freiheitsgraden ist Die Quantile sind tabelliert für β > 0,5 undkönnen für β < 0,5 bestimmt werden aus f,m,β = /f M,, β χ 2 -Test für die Varianz Voraussetzung: X,,X uiv (µ,σ 2 ) mit unbekanntem σ Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : σ 2 σ 2 0, H : σ 2 > σ 2 0, (ii) H 0 : σ 2 σ 2 0, H : σ 2 < σ 2 0 oder (iii) H 0 : σ 2 = σ 2 0, H : σ 2 σ Beobachte X,X und berechne Testgröße S 2 = ( )s2 σ0 2 4 Lehne H 0 ab, falls in (i) S 2 > χ 2, α, in (ii) S2 < χ 2,α, bzw in (iii) S2 < χ 2,α/2 oders2 > χ 2, α/2,wobeiχ2,β dasβ-quantilderchi-quadrat-verteilung mit Freiheitsgraden ist Korrelationstest (und Test auf Unabhängigkeit) Voraussetzung: (X,Y ),,(X,Y ) unabhängige, identisch gemeinsam normalverteilte Paare mit Korrelation ρ = Corr(X i,y i ) Anwendbar, falls 50 und ρ nicht zu dicht bei Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : ρ ρ 0, H : ρ > ρ 0, (ii) H 0 : ρ ρ 0, H : ρ < ρ 0 oder (iii) H 0 : ρ = ρ 0, H : ρ ρ 0

12 3 Beobachte (X,Y ),,(X,Y ) und berechne Testgröße Z = 3(ŵ w 0 ), wobei ŵ = 2 ln ( + ˆρ ˆρ ), w 0 = 2 ln ( +ρ0 ρ 0 4 Lehne H 0 ab, falls in (i) Z > q α, in (ii) Z < q α, bzw in (iii) Z < q α/2 oder Z > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist Wird gegen ρ 0 = 0 getestet, so ist dies auch ein Test auf Unabhängigkeit, da normalverteilte (X i,y i ) angenommen sind Test auf Unabhängigkeit (auf korreliert/unabhängig, auch für kleine ) Voraussetzung: (X,Y ),,(X,Y ) unabhängige, identisch gemeinsam normalverteilte Paare mit Korrelation ρ = Corr(X i,y i ) Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : ρ 0, H : ρ > 0, (ii) H 0 : ρ 0, H : ρ < 0 oder (iii) H 0 : ρ = 0, H : ρ 0 3 Beobachte (X,Y ),,(X,Y ) und berechne Testgröße R = ˆρ 2 ˆρ 2 ) 4 Lehne H 0 ab, falls in (i) R > t 2, α, in (ii) R < t 2,α, bzw in (iii) R < t 2,α/2 oder R > t 2, α/2, wobei t 2,β jeweils das β-quantil der t-verteilung mit 2 Freiheitsgraden bezeichnet Chi-Quadrat-Anpassungstest zum iveau α Modell: Objekte fallen unabhängig voneinander in d Klassen A,,A d Für i =,, werden Zufallsgrößen Y i definiert durch Y i = k, falls Objekt i in A k fällt (k =,,d) Es seien Y,,Y uiv mit p k = P(Y i = k), k =,,d Ferner sei X k die Anzahl der i, für die Y i = k Unter der Hypothese p k = p 0 k für alle k =,,d bei vorgegebenen p0 k gelte Faustregel (FRD): p 0 k für alle k {,,d} und p0 k 5 für mindestens 80% der k {,,d} Gilt die Faustregel nicht, so muss man kleine Klassen zusammenlegen, bis sie gilt Es sollten aber nicht mehr Klassen als nötig zusammengelegt werden, da mit der Zusammenlegung der Fehler 2 Art steigt Der Test erlaubt, bestimmte Verteilungsannahmen zu vorgegebenem Signifikanzniveau α zu prüfen Drei wichtige Anwendungen sind: (a) Chi-Quadrat-Anpassungstest bei endlicher Verteilung Voraussetzung: Wie im Modell oben Es gelte (FRD) Vorgehen: H 0 : p k = p 0 k für alle k =,,d, H : p k p 0 k für mind ein k {,,d} 2 Wähle α 3 Berechne Testgröße D = d k= 4 H 0 ablehnen, falls D > χ 2 d, α (X k p 0 k )2 p 0 k 2

13 (b) Chi-Quadrat-Anpassungstest für die Poissonverteilung Voraussetzung: Y,,Y uiv mit Werten in {0,,2,}, X k = Anzahl der i mit Y i = k X m = Anzahl der i mit Y i m für k = 0,,m, Schätze ˆλ = Y und ˆp k = ˆλ k k! e ˆλ, k = 0,,m sowie ˆp m = ˆp 0 ˆp m Die Faustregel (FRD) gelte für ˆp k, k = 0,,m Vorgehen: H 0 : Y,,Y Poisson-verteilt, H : Y,,Y nicht Poisson-verteilt 2 Wähle α 3 Berechne Testgröße D = m k=0 4 Lehne H 0 ab, falls D > χ 2 m, α (X k ˆp k ) 2 ˆp k (c) Chi-Quadrat-Anpassungstest für die ormalverteilung Voraussetzung:Y,,Y uivmitwerteninirfürschätzer ˆµ = Y, ˆσ 2 = s2, berechne zu Intervallen I = (,s ], I 2 = (s,s 2 ],, I d = (s d 2,s d ], I d = (s d, ) die Wahrscheinlichkeiten ˆp k = Φ( s k ˆµ ˆσ ) Φ(s k ˆµ ˆσ ) für k = 2,,d sowie ˆp = Φ( s ˆµ ˆσ ) und ˆp d = Φ( s d ˆµ ˆσ ) Die Faustregel (FRD) gelte für ˆp k, k =,,d X k sei die Anzahl der i mit Y i I k für k =,,d Vorgehen: H 0 : Y,,Y normalverteilt, H : Y,,Y nicht normalverteilt 2 Wähle α 3 Berechne Testgröße D = d k= 4 Lehne H 0 ab, falls D > χ 2 d 3, α (X k ˆp k ) 2 ˆp k Achtung:SollaufeineP(λ)bzw(µ,σ 2 )-Verteilungzuvorgegebenenλbzwµ,σ 2 getestet werden, so sind wir nicht in der Situation von (b) oder (c), sondern in der Situation von (a), wo wir dann die p 0 k über die vorgegebene Verteilung berechnen und die Testgröße mit den Quantilen der Chi-Quadrat-Verteilung mit d Freiheitsgraden vergleichen Chi-Quadrat-Unabhängigkeitstest Modell: (X,Y ),,(X,Y ) uiv mit Werten in {(k,l) : k =,,m; l =,,n} und p kl = P(X i = k,y i = l) Es bezeichne Z kl die Anzahl der i für die (X i,y i ) = (k,l), sowie Z l = Z l ++Z ml, Z k = Z k ++Z kn und ˆp 0 kl = Z k Z l / 2 für k =,,m, l =,,n Es gelte die Faustregel ˆp 0 kl für alle k,l und ˆp 0 kl 5 für mindestens 80% der Paare (k,l) Vorgehen: H 0 : X,Y unabhängig, H : X,Y nicht unabhängig 2 Wähle Signifikanzniveau α 3 Berechne Testgröße D = m n k= l= (Z kl ˆp 0 kl )2 ˆp 0 kl 3

14 4 Lehne H 0 ab, falls D > χ 2 (m )(n ), α Die Z kl, Z k, Z l können übersichtlich in einer Kontingenztafel zusammengestellt werden Approximativer Binomialtest Voraussetzung: X B(n,p) Für die vermutete Erfolgswahrscheinlichkeit p 0 gelte die Faustregel: np 0 5 und n( p 0 ) 5 Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : p = p 0 (oder p p 0 ), H : p > p 0, (ii) H 0 : p = p 0 (oder p p 0 ), H : p < p 0 oder (iii) H 0 : p = p 0, H : p p 0 3 Beobachte X und berechne Testgröße Z = X np0 np0( p 0) 4 Lehne H 0 ab, falls in (i) Z > q α, in (ii) Z < q α, bzw in (iii) Z < q α/2 oder Z > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist Exakter Binomialtest Voraussetzung: X B(n, p), n klein oder Faustregel für den approximativen Binomialtest gilt nicht Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : p = p 0 (oder p p 0 ), H : p > p 0, (ii) H 0 : p = p 0 (oder p p 0 ), H : p < p 0 oder (iii) H 0 : p = p 0, H : p p 0 3 Beobachte X 4 Lehne H 0 ab, falls in (i) X > b n,p0, α, in (ii) X < b n,p0,α, bzw in (iii) X < b n,p0,α oder X > b n,p0, α 2 mit α,α 2 α/2, α + α 2 = α, wobei b n,p0β ein β-quantil der BinomialverteilungmitParamternnundp 0 bezeichnettabelliertsindquantileb n,p0,β für verschieden Kombinationen von n und p 0 Sie können für kleine n aber auch selbst berechnet werden Vorzeichentest Modell: Beobachtet werden n Datenpaare (y i,z i ), die unabhängig voneinander erhoben wurden Ziel: Test, ob die ersten (alten) Datenwerte y i eher größer oder besser als die z i sind Vorgehen: Es werden alle Datenpaare mit y i = z i gestrichen Die Anzahl der verbleibenden Paare sei n und X die Anzahl der verbleibenden Paare, für die y i > z i ist Dann gilt X B(n,p) Gibt es eher keinen Unterschied, so wäre p = 2 und wir können die gewünschten Aussage für die Hypothese H 0 : p = p 0 mit p 0 = 2 unter Benutzung des approximativen oder exakten Binomialtests testen Zweistichproben-Binomialtest Voraussetzung: X B(n,p ) und Y B(m,p 2 ) mit hinreichend großen n, m für eine gute Approximation durch die ormalverteilung Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : p = p 2 (oder p p 2 ), H : p > p 2, (ii) H 0 : p = p 2 (oder p p 2 ), H : p < p 2 oder (iii) H 0 : p = p 2, H : p p 2 3 Beobachte X und Y und berechne Testgröße = und ˆp = X+M n+m ˆp ˆp 2 ˆp( ˆp) n+m nm, wobei ˆp = X n, ˆp 2 = Y m 4 Lehne H 0 ab, falls in (i) > q α, in (ii) < q α, bzw in (iii) < q α/2 oder > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist 4