Kapitel 10 Statistik 10.1 Wahrscheilichkeit Das Ergebis eier Messug oder Beobachtug wird Ereigis geat. Ereigisse werde mit de Buchstabe A, B,...bezeichet. Die Messug eier kotiuierliche Variable x gibt i der Regel (icht abzählbar) uedlich viele verschiedee Ereigisse, die jedoch zu abzählbar viele Ereigisse zusamme gefaßt werde köe (für eie kotiuierlichezufallsvariablex ka z.b. das Ereigis 0.5 x 1.0 betrachtet werde). Das Ereigis, daß die Messug irgedei Ereigis liefert, wird als Eiheitsereigis E bezeichet. Eie plausible Defiitio der Wahrscheilichkeit P (A) für das Auftrete vo Ereigis A ist der Quotiet aus der Zahl vo Beobachtuge vo A ud der Gesamtheit N der Beobachtuge im Limes N : P (A) = lim N N Folgede Schreibweise werde beutzt: Ereigis Wahrscheilichkeit A P (A) A oder B P (A + B) A ud B P (AB) B, wea P (B A) Der Wahrscheilichkeitstheorie köe die folgede Axiome zugrude gelegt werde: P (A) 0 P (E) =1 P (A + B) =P (A)+P (B), we die Ereigisse A ud B sich gegeseitig ausschließe. P (AB) =P (A) P (B A) Aus de Axiome folge die Aussage: Für komplemetäre Ereigisse A ud Ā gilt: P (A + Ā) =P (A)+P (Ā) =1 0 P (A) 1 Zwei Ereigisse A ud B heiße uabhägig,we P (B) icht davo abhägt,ob A bei der gleiche Beobachtug eigetrete ist oder icht: P (B A) =P (B) P (AB) =P (A) P (B) 10. Zufallsvariable Meßgröße sid Zufallsvariable. Alle Messuge oder Beobachtuge uterliege zufällige Schwakuge, daher sid die Zahlewerte vo Messuge oder Beobachtuge icht exakt vorhersagbar; Grud ist die begrezte Meßgeauigkeit oder der statistische Charakter der utersuchte Größe selbst. Je achdem die Meßgröße x 51
kotiuierliche oder diskrete Werte aehme köe, werde sie kotiuierliche oder diskrete Zufallsvariable geat. Beide liegt eie statistische Verteilug zugrude. Die Verteilug eier kotiuierliche Zufallsvariable x wird bestimmt durch ihre Dichtefuktio f(x) mit de Eigeschafte f(x) 0 f(x) dx =1 Die durch F (x) = x f(x ) dx defiierte Fuktio F (x) heißt Verteilugsfuktio der Zufallsvariable x. Es gilt: f(x) = df (x) dx Die Wahrscheilichkeit, daß ei Eizelwert x i das Itervall [x 1,x ]fällt, ist gegebe durch P (x 1 x x )= x x 1 f(x) dx = F (x ) F (x 1 ) Wichtige Eigeschafte eier Verteilug lasse sich durch weige Parameter agebe. Die beide wichtigste Parameter eier Verteilug sid Mittelwert (Positiosparameter), ud Stadardabweichug (Streuugsparameter). Der Mittelwert oder Erwartugswert der Größe x wird mit µ bezeichet ud ist defiiert durch (f(x) = Wahrscheilichkeitsdichte) µ = E[x] = x f(x) dx. Allgemei sid Erwartugswerte vo Fuktioe g(x) der Zufallsvariable x defiiert durch E[g(x)] = g(x) f(x) dx. Der Mittelwert µ ist der Erwartugswert für g(x) = x. Die Stadardabweichug, bezeichet mit σ, ist die Quadratwurzel aus der Variaz, die defiiert ist als der Erwartugswert vo g(x) =(x µ) : σ = V (x) =E[(x µ) ]= (x µ) f(x) dx. Die Variaz σ der Verteilug eier Zufallsvariable x ka durch die Erwartugswerte vo x ud x ausgedrückt werde: σ = E[(x µ) ]=E[x xµ + µ ]= x f(x) dx µ x f(x) dx + µ f(x) dx = E[x ] µ + µ = E[x ] (E[x]). Die gemeisame Verteilug vo zwei Zufallsvariable x ud y wird durch die Dichtefuktio f(x, y) mitder Normierug f(x, y) dx dy =1 bestimmt. Die Mittelwerte µ x ud µ y der beide Variable x ud y sid defiiert durch µ x = x f(x, y) dx dy µ y = y f(x, y) dx dy
Nebe de Variaze σ x ud σ y, defiiert durch σ x = gibt es och die Kovariaz σ xy, defiiert durch (x µ x ) f(x, y) dx dy σ y = σ xy = (x µ x )(y µ y ) f(x, y) dx dy (y µ y ) f(x, y) dx dy Der durch ρ = σ xy /(σ x σ y ) defiierte Korrelatioskoeffiziet ka Werte zwische +1 ud -1 aehme. Bei ρ = 0 heiße die beide Variable x ud y ukorreliert. We die beide Variable statistisch uabhägig sid, läßt sich ihre Wahrscheilichkeitsdichte i der Form f(x, y) =f 1 (x) f (y) schreibe ud der Korrelatioskoeffiziet ist 0. Bei eier diskrete Zufallsvariable sid ur diskrete Werte x i,i =1,... möglich. Jedem mögliche Wert x i ka eie Wahrscheilichkeit P (i) zugeordet werde mit de Eigeschafte: P (i) 0 P (i) =1 Mittelwert ud Variaz sid durch Summe über alle mögliche Werte defiiert: i µ = E[x] = i σ = V (x) = i x i P (i) (x i µ) P (i) =E[x ] (E[x]). Theoretische Verteiluge Normalverteilug. Die Normalverteilug, auch Gaußverteilug geat, wird durch die beide Parameter Mittelwert µ ud Stadardabweichug σ vollstädig festgelegt; die Dichtefuktio lautet: f(x) = 1 e (x µ) /σ πσ Aus dieser Dichte ergebe sich durch Itegratio die folgede Aussage über die Abweichug eies Eizelwertes x vom Mittelwert µ um ei, zwei ud drei Stadardabweichuge: P (µ 1σ x µ +1σ) = 68.7% P (µ σ x µ +σ) = 95.45% P (µ 3σ x µ +3σ) = 99.73% Bei der Normalverteilug ist die volle Breite bei halbem Maximalwert (Halbwertsbreite) gleich.34 σ. Die Verteilugsfuktio der Normalverteilug ist x F (x) = f(u) du = 1 + 1 ( ) x µ erf σ Viele Verteiluge der Praxis komme der Normalverteilug sehr ahe ud werde daher durch die Normalverteilug approximiert. Gleichverteilug. Die Dichte der Gleichverteilug zwische de Greze a ud b ist { 1/(b a) a x b f(x) = 0 sost Für Mittelwert ud Stadardabweichug ergebe sich die Werte: µ = a + b σ = b a 1
Expoetialverteilug. Die Dichte der Expoetialverteilug hat ur eie Parameter λ: { λe λx x 0 f(x) = 0 x<0 Für Mittelwert ud Stadardabweichug ergebe sich: µ = 1 λ σ = 1 λ Die Expoetialverteilug beschreibt z. B. die Häufigkeit vo Ereigisse, die zeitlich zufällig mit eier kostate Wahrscheilichkeit erfolge. Biomialverteilug. Ei Ereigis A trete bei eiem Versuch mit der Wahrscheilichkeit p auf; etspreched ist die Wahrscheilichkeit für das Nicht-Auftrete vo A gleich q =1 p. Gesucht ist die Wahrscheilichkeit, daß bei Versuche das Ereigis Akmalauftritt. Die Wahrscheilichkeit, daß i de erste k Versuche das Ereigis A ud i de restliche ( k) Versuche das Ereigis Ā auftritt, ist das Produkt p k q k. Das Ereigis k mal A bei Versuche ka i verschiedee Reihefolge auftrete. Daher ist die Wahrscheilichkeit, k daß bei Versuche k mal das Ereigis A auftritt, gegebe durch ( ) P (k) = p k k q k Dies etspricht dem Biomische Lehrsatz ( ) (p + q) = p k k q k =1 k=0 Mittelwert ud Variaz der Biomialverteilug sid E[k] =µ = p σ = pq ( )! = k k!( k)! Poissoverteilug. We ma i der Biomialverteilug wachse läßt, dabei jedoch de Mittelwert µ = p kostat hält, geht die Biomialverteilug i die Poissoverteilug über: P (k) = µk k! e µ Mittelwert ud Variaz sid E[k] =µ σ = µ σ = µ Die (diskrete) Poissoverteilug geht für große Werte vo µ über i die spezielle Normalverteilug (σ = µ) P (k) = 1 πµ e (k µ) /µ 10.3 Fuktioe vo Zufallsvariable Fuktioe vo Zufallsvariable sid selbst wieder Zufallsvariable, für die Mittelwerte ud Variaze agegebewerdeköe. Die Berechug der Variaz eier Fuktio vo Zufallsvariable aus de Variaze der Veräderliche der Fuktio et ma Fehlerfortpflazug (error propagatio). Fuktioe eier Zufallsvariable. Betrachtet wird eie Fuktio w = w(x) der Zufallsvariablex, dieeier Verteilug mit Mittelwert µ x ud Stadardabweichug σ x folgt. Der Mittelwert µ w ka wie folgt berechet werde. Ausgehed vo der Taylor-Etwicklug w(x) w(µ x )+ dw dx (x µ x ) µx ergibt sich als Mittelwert vo w: µ w = E[w] w(µ x )+ dw dx E[x µ x ] = w(µ x ) µx
Für lieare Fuktioe ist diese Beziehug exakt; bei ichtlieare Fuktioe w(x) würde zwar der quadratische Term der Tayloretwicklug eie (kleie) Korrektur liefer, diese ist i der Praxis jedoch i.a. verachlässigbar. Für die Variaz vo w ergibt sich bei Beutzug der Tayloretwicklug als Erwartugwert vo (w(x) w(µ x )) : [ σw = E (w(x) µ w ) ] = E [ ( (x µ x ) ] dw dx µx ) ( = σx dw dx. µx) Daher folgt: dw σ w σ x dx x=µx Fuktioe mehrerer Zufallsvariabler. Betrachtet wird zuächst eie Fuktio w(x, y) vo zwei Zufallsvariable x ud y, die Mittelwerte µ x ud µ y ud Stadardabweichuge σ x ud σ y habe. Etspreched der lieare Näherug w(x, y) w(µ x,µ y )+ w x (x µ x ) + w y (y µ y ) ergibt sich für Mittelwert ud Variaz der Größe w: µ w w(µ x,µ y ) ( σw w σ x x ) + σ y Diese Formel gelte für de Fall vo uabhägige Zufallsvariablex ud y. We die Zufallsvariablex ud y icht statistisch uabhägig sid, ergibt sich für de Ausdruck vo σw ei (positiver oder egativer) Zusatzterm: ( ( σw σx w w x +σ xy ) x ( w y ) ( w y ) ) ( + σy w y Die Verallgemeierug auf eie Fuktio w vo statistisch uabhägige Zufallsvariable x 1,x...x ergibt: Spezialfälle. We w vo der Form (Summe ud Differeze) ist, ergibt die Formel µ w w(µ 1,µ...µ ) σw ( σi w x i i w = x + y z µ1,...µ σ w = σ x + σ y + σ z + we σ x, σ y, σ z...die Stadardabweichuge der uabhägige Zufallsvariable x, y, z...sid; die Quadrate der eizele Stadardabweichuge addiere sich. We w vo der Form w = x y z (Produkte ud Quotiete) ist, ergibt die Formel bei uabhägige Zufallsvariable ach Umformug de Ausdruck ( ) ( ) ( ) ( ) σw σx σy σz = + + + ) ) Die Quadrate der relative Stadardabweichuge addiere sich. Für die Fuktio (Mittelwert) w = 1 (x 1 + x +...+ x ), µ w µ x µ y µ z
wobei alle Zufallsvariable x i der gleiche Verteilug mit Mittelwert µ x ud Stadardabweichug σ x etstamme ud statistisch uabhägig sid, gilt: σw = σx 1 = σ x. Die Stadardabweichug des Mittelwerts vo uabhägige Zufallsvariable immt also bei Vergrößerug der Zahl der Messuge proportioal zu 1/ ab. Zetraler Grezwertsatz: Sid die Zufallsgröße x i uabhägig verteilt mit Mittelwert µ ud Variaz σx, so ist der Mittelwert 1 x i im Grezfall ormalverteilt mit Mittelwert µ ud Variaz σ x/. 10.4 Auswertug vo Messuge Ei Meßwert x eier Meßgröße mit wahrem Wert µ folge eier Normalverteilug mit der durch die Meßapparatur bedigte Stadardabweichug σ (Meßfehler). Ausgehed vo der für die Normalverteilug geltede Aussage erhält ma durch Umformug der Ugleichuge P (µ σ x µ + σ) =68.7% µ σ x x µ + σ i die Ugleichuge die Aussage µ x + σ x σ µ P (x σ µ x + σ) =68.7% Diese Aussage bedeutet, daß der wahre Wert µ mit eier Wahrscheilichkeit vo 68.7 % ierhalb der (eifache) durch die Stadardabweichug gegebee Fehlergreze um de Meßwert liege. Die Aahme eier Normalverteilug ist bei Messuge meist gerechtfertigt (eie theoretische Begrüdug liefert der zetrale Grezwertsatz). Meßergebisse werde i der Form Meßwert ± Fehler x ± σ agegebe, wobei als Fehler die (eifache) Stadardabweichug agegebe wird. Empirische Werte vo Mittelwert ud Variaz. Zur Bestimmug vo Parameter der zugrude liegede Verteilug aus statistisch verteilte Date x i,,... werde Schätzfuktioe t(x 1,x,...x ) beutzt; diese sid als Fuktioe der Date selbst Zufallsvariable ud sollte u.a. die Eigeschaft habe, daß ihre Erwartugswerte im Grezwert (Kosistez) ud bei edliche Werte vo (Erwartugstreue) gleich de zu schätzede Parameter der Verteilug ist. Eie Schätzfuktio m für de Mittelwert eier Meßreihe x i,,... ist m = 1 x i Der Erwartugswert vo m ist E[m] = 1 E[x i ]=µ bei E[x i ]=µ ud damit ist m eie erwartugstreue Schätzfuktio. Eie erwartugstreue Schätzfuktio für die Variaz ist s x = 1 (x i m) 1
Zum Nachweis der Erwartugstreue wird zuächst die Summe umgeformt: (x i m) = = ((x i µ) (m µ)) = (x i µ) (m µ) (x i µ)+(m µ) (x i µ) (m µ), de es gilt (x i µ) =(m µ). Der Erwartugswert der Summe ist: [ ] [ ] E (x i m) = E (x i µ) Also ist der Erwartugswert vo s x E [ (m µ) ] = σ x σ x =( 1)σ x. E[s x ]= 1 1 ( 1)σ x = σ x ud damit ist s x eie erwartugstreue Schätzfuktio für σ x. Die empirische Stadardabweichug s x wird oft wie die wahre Stadardabweichug behadelt. Tatsächlich ist sie jedoch als Fuktio vo Zufallsvariable selbst eie Zufallsvariable ud damit statistische Schwakuge uterworfe. Für große Werte vo (etwa 10) ist die statistische Schwakug gerig ud meist verachlässigbar, bei sehr kleie Werte vo ist jedoch Vorsicht gebote. Formel. Die folgede Formel sid awedbar zur Berechug vo Mittelwert ud Stadardabweichuge, we Eizelwerte x 1,x...x gleicher Geauigkeit vorliege. Die Formel ethalte zur Erhöhug der umerische Geauigkeit eie geeiget zu wählede Wert x 0, der ugefähr gleich dem Mittelwert sei sollte. Gebildet werde zuächst die Summe: S x = (x i x 0 ) S xx = (x i x 0 ) Der Mittelwert x, die Stadardabweichug des Mittelwerts s x ud die Stadardabweichug der Eizelwerte s x ergebe sich aus: x = x 0 + S x s x = ( ) 1 S xx S x ( 1) s x = 1 ( ) S xx S x 1 Geradeapassug. Bei Meßreihe wird häufig eie Zufallsvariable y als Fuktio vo eier jeweils fest eistellbare Größe x gemesse. We für die Größe y eie fuktioelle Abhägigkeit vo x bekat ist, köe die Date x i,y i,,...beutzt werde, um Parameter, die i der fuktioelle Abhägigkeit vorkomme, zu bestimme. Bei eier lieare Abhägigkeit der Form y = y(x) =a + bx lasse sich die Parameter a ud b bestimme. Ei allgemeies Verfahre, um solche Probleme zu behadel, ist die Methode der kleiste Quadrate. Im Falle der Apassug eier Gerade a Date verfährt ma wie folgt. Zu gegebee Werte der Parameter a ud b köe die Residue ɛ i = y i (a + bx i ) berechet werde. Nach der Methode der kleiste Quadrate sid optimale Schätzwerte für a ud b die Werte, für die die Summe der Quadrate der Residue S(a, b) = ɛ i = (y i (a + bx i )) [ ] y i ay i bx i y i + a +abx i + b x i.
miimal ist. Zur Bestimmug des Miimums vo S bezüglich a ud b werde die partielle Ableituge vo S ach a ud b gebildet: S a S b = = ( y i + a + bx i ) ( ) xi y i + ax i + bx i, Die Bedigug, daß die Ableituge am Miimum verschwide, führt auf das lieare Gleichugssystem a + b x i = a x i + b x i = y i x i y i Zur Vereifachug werde die folgede Summe defiiert: S x = x i S xx = x i S y = y i S xy = Mit diese Größe lautet das lieare Gleichugssystem für a ud b: Es wird gelöst durch: a = S ys xx S xy S x S xx S x a + bs x = S y as x + bs xx = S xy. x i y i S yy = b = S xy S y S x S xx S x Die Variaze ud Kovariaze (die Parameter a ud b sid voeiader statistisch abhägig) ergebe sich ach de Gesetze der Fehlerfortpflazug zu y i S xx σa = σ S xx Sx σb = σ S xx Sx σ ab = σ S x, S xx Sx we die Stadardabweichug σ der Eizeldate y i bekat ist. We die Stadardabweichug der Eizeldate icht bekat ist, ka sie durch die Formel abgeschätzt werde. s = 1 (y i (a + bx i )) = 1 (S yy as y bs xy )