Formelsammlung Statistik II 1. 1 Numerische und graphische Zusammenfassung quantitativer
|
|
- Karin Bieber
- vor 6 Jahren
- Abrufe
Transkript
1 TU Kaiserslautern Sommer 202 FB Mathematik Stand Prof Dr Jörn Saß Formelsammlung Statistik II umerische und graphische Zusammenfassung quantitativer Daten Beobachtet werden Daten x,,x Die Ordungsstatistiken x () x (2) x () sind die der Größe nach sortierten Daten Stichprobenmittel x = x i i= { x(m+), falls = 2m+ Stichprobenmedian ẋ = 2 (x (m) +x (m+) ), falls = 2m Stichprobenstandardabweichung s = (x i x ) 2 Stichprobenvarianz s 2 Spannweite d = x () x () Unterer und oberer Viertelwert v u bzw vo sind definiert durch x (m), falls + = 4m 3 v u 4 = x (m) + 4 x (m+), falls + = 4m+ 2 x (m) + 2 x (m+), falls + = 4m+2 4 x (m) x (m+), falls + = 4m+3 x (3m), falls + = 4m v o 4 = x (3m) x (3m+), falls + = 4m+ 2 x (3m+) + 2 x (3m+2), falls + = 4m x (3m+2) + 4 x (3m+3), falls + = 4m+3 Viertelweite d v = vo vu Als Ausreißer für die Zeichnung eines Boxplots definieren wir Datenwerte, die um mehr als,5d v oberhalb von v0 oder unterhalb von vu liegen Histogramm der Anzahlen H (x) = Z n für x I n, n Z, Histogramm der relativen Häufigkeiten H (x) = Zn für x I n, n Z, wobei für Startwert a und Intervallbreite b die Intervalle I n definiert sind durch i= I n = (a+(n )b,a+nb] und Z n die Anzahl der Daten bezeichnet, die in Intervall I n fallen Basierend auf dem Skript von Prof Dr Franke
2 Faustregel: Wähle a und b so, dass ẋ etwa in einer Intervallmitte liegt, dass [x (),x () ] von 5 bis 20 Intervallen überdeckt wird, und dass mindestens das 5-fache der Anzahl der nicht-leeren Intervalle ist Verteilungseigenschaften, die man an einem Histogramm gut erkennen kann, sind Schiefe der Verteilung: Wir unterscheiden Rechtsschiefe, die typischerweise mit x >> ẋ einhergeht und Linksschiefe, für die typischerweise x << ẋ gilt Mehrgipfligkeit: Die Verteilung der Daten wird uni-, bi-, mulitmodal genannt, falls in ihr ein, zwei, oder mehr Gipfel beobachtet werden können Messenwiran ObjektenjeweilszweiMerkmale,soerhaltenwirzweiDatensätzex,,x und y,,y Abhängigkeitsmaße sind: Stichprobenkovarianz ĉ = (x i x )(y i y ) i= ĉ Stichprobenkorrelation ˆρ = s,x s,y wobei Stichprobenmittelwerte und -standardabweichungen sich wie oben berechnen, dh x = x i, y = y i, i= i= s,x = (x i x ) 2, s,y = (y i y ) 2 i= Die Stichprobenkorrelation ˆρ hat stets Werte zwischen - und 2 Wahrscheinlichkeitstheoretische Grundlagen Ein Wahrscheinlichkeitsraum (Ω, A, P) besteht aus Ergebnismenge Ω Ein Element ω Ω wird als Ergebnis eines Zufallsexperiments interpretiert Ω sollte alle Ergebnisse umfassen, die in dem Experiment möglich sind Menge von Ereignissen A Ein Ereignis A ist geeignete Teilmenge von Ω, dh A Ω Wahrscheinlichkeit P, die jedem Ereignis A seine Wahrscheinlichkeit zuordnet Ereignisse und ihre Verknüpfung Spezialfälle: Elementarereignis {ω} für ω Ω, sicheres Ereignis Ω, unmögliches Ereignis A und B : A B (Durchschnitt) A oder B : A B (Vereinigung) A, aber nicht B : A\B (A ohne B) Gegenereignis, nicht A : A c = Ω\A (Komplement von A) A, B schließen sich aus : A B = (A und B sind disjunkt) Ereignissystem A: Falls Ω nur endlich viele Elemente hat, kann stets A = P(Ω) gewählt werden Dabei bezeichnet P(Ω) die Menge aller Teilmengen von Ω (Potenzmenge) Ist Ω nicht endlich, so muss man für die Definition von Wahrscheinlichkeiten gewisse pathologische Mengen ausschließen Es ist sehr schwierig, solche pathologischen Mengen zu konstruieren, sie werden uns in der Praxis nicht begegnen Wir verzichten daher auf eine genauere Darstellung Die Wahrscheinlichkeit P : A [0,] ist eine Funktion, die jedem Ereignis A seine Wahrscheinlichkeit P(A) zuordnet Es gelten für alle Ereignisse A, B, A, A 2, die Rechenregeln i= 2
3 P(A) 0, P( ) = 0, P(Ω) = P(A A 2 ) = P(A )+P(A 2 )+, falls A i A j = für alle i j P(A B) = P(A)+P(B) P(A B) P(A c ) = P(A) P(A) P(B), falls A B Zufallsgrößen Eine Zufallsgröße X mit Werten in einer Menge X ist eine Abbildung X : Ω X Bei Beobachtung des Wertes (der Realisation) von X in einem Zufallsexperiment, kann entschieden werden, ob ein Ereignis der Form {X B} = {ω Ω : X(ω) B} eingetreten istdieverteilungp X gibtdiewahrscheinlichkeitdieserereignisseanundistdefiniertdurch P X (B) = P({X B}) für alle geeigneten Teilmengen B X (geeignet = nicht pathologisch, siehe oben) Weitere otationen: ZB {X x} = {X (,x]}, P(X x) = P({X x}) Diskrete Verteilungen Eine Zufallsgröße X mit Werten in {0,,,n} heißt binomialverteilt mit Erfolgswahrscheinlichkeit p, falls ( ) n P(X = k) = p k ( p) n k, k = 0,,,n k Bezeichnung: X B(n, p) Interpretation: n unabhängige Zufallsexperimente mit Ausgang Erfolg/Misserfolg, p Erfolgswahrscheinlichkeit in einem Experiment, X Anzahl der Erfolge Binomialkoeffizient ( ) n k = n! k!(n k)! = n(n ) (k(k ))((n k)(n k )) = n(n (n k+) k(k ) ) gibt die Anzahl der Möglichkeiten an, k Objekte aus n verschiedenartigen Objekten ( n k auszuwählen (oder k Einsen auf n Stellen zu verteilen) Für n, M heißt eine Zufallsgröße X mit Werten in {0,,,min{n,M}} hypergeometrisch verteilt, falls ( M M ) P(X = k) = k)( n k (, k = 0,,,min{n,M} n) Bezeichnung: X H(n, M, ) Interpretation: Objekte, M davon mit bestimmten Merkmal, n Stichprobengröße, X Anzahl der gezogenen Objekte mit diesem Merkmal Eine Zufallsgröße X mit Werten in einer endlichen Menge {a,,a m } heißt Laplaceverteilt, falls P(X = a i ) = m, i =,,m Eine Zufallsgröße X mit Werten in {0,,2,} heißt Poisson-verteilt mit Parameter λ > 0, falls P(X = k) = λk k! e λ, k = 0,,2, Bezeichnung: X P(λ) oder X Poi(λ) Interpretation: X Anzahl pro Zeitintervall eines in unregelmäßigen Abständen auftretenden Ereignisses, λ mittlere Häufigkeit des Ereignisses pro Zeitintervall 3
4 Alle bisher betrachteten Verteilungen sind diskret, dh sie sind von der Form, dass X Werte in einer höchstens abzählbaren Menge {a,a 2,} annimmt und für i =,2, ist P(X = a i ) = p i, wobei p i 0, p i = i= Verteilungen mit Dichte Eine Zufallsgröße X mit Werten in IR ist verteilt mit (Wahrscheinlichkeits-)Dichte p(x), falls für alle nicht pathologischen B IR gilt P(X B) = p(x)dx, wobei p(x) 0, p(x)dx = B Insbesondere ist P(a < X < b) = P(a X b) = P(X [a,b]) = b a p(x)dx X heißt uniform verteilt (oder Rechteck-, gleichverteilt) in [a, b], falls p(x) = b a für x [a,b] und p(x) = 0 sonst X heißt normalverteilt mit Parametern µ, σ 2 (oder σ), falls p(x) = ϕ µ,σ 2(x) = 2πσ 2 e (x µ)2 2σ 2 Bezeichnung: X (µ,σ 2 ) Dann ist Z = X µ σ standard-normalverteilt, dh Z (0, ) Gilt umgekehrt Z (0,), so ist X = µ+σz (µ,σ 2 ) X mitwertenin(0, )heißtlognormalverteiltmitparameternµ,σ 2,fallsln(X) (µ,σ 2 ) X heißt exponentialverteilt mit Parameter λ > 0, falls p(x) = λe λx für x 0 und p(x) = 0 für x < 0 Bezeichnung: X Exp(λ) X heißt Weibull verteilt mit Parametern λ > 0, β > 0, falls X β Exp(λ) Verteilungsfunktion, Quantile, Erwartungswert und Varianz Die Verteilungsfunktion von X ist definiert durch F(x) = P(X x), x IR Eigenschaften: F( ) = 0, F( ) =, P(X > x) = F(x), P(a < X b) = F(b) F(a) Für X (0,) schreibe Φ(x) = F(x) Die Werte sind tabelliert für x > 0, nutze Φ( x) = Φ(x) für negative Werte Für stetiges X ist das α-quantil q α definiert durch α = F(q α ) Spezialfälle: Med(X) = q 0,5 Median, q 0,25 unterer und q 0,75 oberer Viertelwert Viertelweite: Q(X) = q 0,75 q 0,25 Für diskretes X ist q α ein α-quantil, falls P(X < q α ) α P(X q α ) Ist X diskret mit Werten in {a,a 2,} und P(X = a i ) = p i, i =,2,, so heißt E(X) = 4 p i a i i=
5 Erwartungswert von X (auch Mittelwert) Ist X stetig mit Dichte p(x), so E(X) = p(x)x dx Ist X diskret oder stetig, so werden die Varianz Var(X) und die Standardabweichung σ(x) von X definiert durch Var(X) = E ( (X E(X)) 2), σ(x) = Var(X) Beachte: Dabei benutzen wir, dass f(x) für eine Funktion f : IR IR wieder eine Zufallsgröße ist, deren Erwartungswert sich berechnet zu E(f(X)) = p i f(a i ) bzw E(f(X)) = i= p(x)f(x) dx Rechenregeln und Eigenschaften: Für Zufallsgrößen X, Y und a, b IR gelten E(aX +by) = ae(x)+be(y), wegen E() = insbesondere E(aX +b) = ae(x)+b Var(aX +b) = a 2 Var(X), σ(ax +b) = a σ(x) Var(X) = E(X 2 ) (E(X)) 2 Erwartungswerte und Varianzen einiger Verteilungen Verteilung von X E(X) Var(X) binomial B(n, p) np np( p) hypergeometrisch H(n,M,) n M nm( M)( n) 2 ( ) Poisson P(λ) λ λ uniform in [α,β] α+β 2 2 (β α)2 normal (µ,σ 2 ) µ σ 2 lognormal mit (µ,σ 2 ) exponential Exp(λ) λ Weibull mit (λ,β) λ β Γ(+ β ) λ 2 β e µ+σ2 2 e 2µ+σ2 2 (e σ2 ) λ 2 (Γ(+ 2β ) (Γ(+ β ))2 ) Dabei bezeichnet Γ die Gamma-Funktion, eine Verallgemeinerung der Fakultät Es gilt Γ(n+ ) = n! für n = 0,,2, Die Werte für Γ(x), x 0, können nachgeschlagen werden äherungsformeln für Wahrscheinlichkeiten H(n,M,) B(n, M ), falls M >> n und M >> n B(n,p) P(np), falls np mittlere Größe, p klein Faustregel: Gut, falls n 00, np 0; befriedigend, falls n 20, p 0,05 B(n,p) (np,np( p)), falls n groß, p nicht zu dicht bei 0 oder Faustregel: np 5 und n( p) 5 5
6 Unabhängigkeit und Korrelation n Zufallsgrößen X,,X mit Werten in X heißen unabhängig, falls P(X A,,X A ) = P(X A ) P(X A ) für alle nicht-pathologischen Teilmengen A,,A X X,,X heißen unabhängig identisch verteilt (uiv), falls sie zusätzlich die gleiche Verteilung besitzen Sind X,,X unabhängige Zufallsgrößen mit Werten in IR und existierenden Erwartungswerten und Varianzen, so gelten E(X X ) = E(X ) E(X ) und Var(X ++X ) = Var(X n ) Für zwei Zufallsgrößen X, Y mit Werten in IR und endlichen Varianzen 0 heißen n= Cov(X,Y) = E((X E(X))(Y E(Y))) und Corr(X,Y) = Cov(X,Y) σ(x)σ(y) Kovarianz bzw Korrelation von X und Y Ist Corr(X,Y) = 0, so heißen X, Y unkorreliert Eigenschaften und Rechenregeln: Cov(X,Y) = E(XY) - E(X) E(Y), Cov(X,Y+Z) = Cov(X,Y) +Cov(X,Z), Es gelten Cov(aX+c,bY +d) = abcov(x,y) und Corr(aX+c,bY +d) = Corr(X,Y) für a,b > 0 und c,d IR, Corr(X,Y), wobei Corr(X,Y) =, falls Y = ax+b, und Corr(X,Y) =, falls Y = ax +b, jeweils für a > 0 Sind X, Y unabhängig, so sind X und Y unkorreliert Die Umkehrung vom letzten Punkt gilt im Spezialfall gemeinsam normalverteilter X, Y Im Allgemeinen folgt aus der Unkorreliertheit aber nicht die Unabhängigkeit 3 Schätzer für Verteilungsparameter Statistisches Modell: Beobachtet werden uiv Zufallsgrößen X,,X, deren Verteilung P ϑ von einem unbekannten Parameter ϑ Θ IR d abhängt, aber die ansonsten bekannt ist Der Erwartungswert bei Verteilung P ϑ wird mit E ϑ bezeichnet Punktschätzer Schätzfunktion T : IR Θ Schätzerfürϑist ˆϑ = T(X,,X )BeibeobachtetenWertenx,,x (Realisierungen von X,,X ) sprechen wir auch vom Schätzwert T(x,,x ) Ein Schätzer ˆϑ heißt konsistent, falls P ϑ (lim ˆϑ = ϑ) = Ein Schätzer ˆϑ heißt erwartungstreu, falls E ϑ (ˆϑ ) = ϑ Die Stichprobenkennzahlen X, s 2 sind konsistent und erwartungstreu für E[X ], Var(X ) Unter schwachen Bedingungen an die Verteilung sind auch Ẋ und die Stichprobenquantile konsistente Schätzer für Med(X ) und die entsprechenden Quantile der Verteilung Für eine stetige Funktion f sind f(x ) und i= f(x i) konsistent für f(e(x )) bzw E(f(X )) 6
7 Ein Maß für die Güte des Schätzers ˆϑ ist der mittlere quadratische Fehler ( MSE(ˆϑ ) = E (ˆϑ ϑ) 2) ( 2 = Var(ˆϑ )+ E(ˆϑ ) ϑ) Dabei heißt E(ˆϑ ) ϑ der Bias vom Schätzer ˆϑ Ein guter Schätzer muss MSE(ˆϑ ) 0 für erfüllen Eine Liste guter Schätzer für einige Verteilungsparameter liefert folgende Tabelle: Verteilung von X bekannt ϑ Schätzer X B(n,p) n p ˆp = X n X H(n,M,) n, M ˆM = X n X,,X uiv P(λ) λ ˆλ = X X,,X uiv Exp(λ) λ ˆλ = X X,,X uiv (µ,σ 2 ) σ 2 µ ˆµ = X X,,X uiv (µ,σ 2 ) (µ,σ 2 ) ˆµ = X ˆσ 2 = s 2 X,,X uiv (µ,σ 2 ) ˆµ = i= lnx i und lognormal mit (µ,σ 2 ) ˆσ 2 = i= (ln(x i) ˆµ) 2 Konfidenzintervalle Ein Konfidenzintervall (Intervallschätzer, Vetrauensbereich) für ϑ zum Sicherheitsniveau α ist ein (zufälliges) Intervall [T,T 2 ] mit Grenzen T i = g i (X,,X ), i =,2, so dass P(ϑ [T,T 2 ]) α für alle ϑ Θ Bei ormalverteilung können die Konfidenzintervalle exakt bestimmt werden Seien also X,,X uiv (µ,σ 2 ) Wir unterscheiden drei Fälle: (a) X i (µ,σ 2 ), µ unbekannt, σ 2 bekannt, schätze µ Dann ist [T,T 2 ] = X ± σ q α/2 = ein α Konfidenzintervall für µ [ X σ q α/2, X + σ q α/2 ] Dabei bezeichnet q α/2 das ( α/2)-quantil der Standardnormalverteilung (b) X i (µ,σ 2 ), µ unbekannt, σ 2 unbekannt, schätze µ Dann ist [T,T 2 ] = X ± s t, α/2 = ein α Konfidenzintervall für µ [ X s t, α/2, X + s t, α/2 ] Dabei bezeichnet t, α/2 das ( α/2)-quantil der t-verteilung mit Freiheitsgraden Die Werte sind tabelliert 7
8 (c) X i (µ,σ 2 ), µ unbekannt, σ 2 unbekannt, schätze σ 2 Dann ist [ ] ( )s 2 [T,T 2 ] = χ 2, ( )s2, α/2 χ 2,α/2 ein α Konfidenzintervall für σ 2 Dabei bezeichnen χ 2,α/2 und χ2, α/2 die α/2- und ( α/2)-quantile der Chi- Quadrat-Verteilung mit Freiheitsgraden Die Werte sind auch tabelliert Liegt keine ormalverteilung vor, so kann für X,,X uiv mit µ = E(X i ), σ 2 = Var(X i )mithilfedeszentralengrenzwertsatzeseinapproximatives( α)-konfidenzintervall bestimmt werden: (d) Approximatives Konfidenzintervall für µ bei bekanntem σ 2 : [T,T 2 ] = X ± σ q α/2 = [ X σ q α/2, X + σ q α/2 ] (e) Approximatives Konfidenzintervall für µ bei unbekanntem σ 2 : [T,T 2 ] = X ± s t, α/2 = [ X s t, α/2, X + s t, α/2 ] (f) Im Spezialfall der Binomialverteilung, dh X B(n, p) erhält man mit einem weiteren Approximationsargument ein ( α)-konfidenzintervall für p: [ ] ˆp( ˆp) ˆp( ˆp) [T,T 2 ] = ˆp q α/2, ˆp+q α/2, ˆp = X n n n Kovarianz und Korrelationsschätzer Die zweidimensionale Zufallsgrößen (X,Y ),,(X,Y ) seien uiv mit existierenden Varianzenungleich0DannsinddieStichprobenkovarianzĉ unddiestichprobenkorrelation ˆρ gute Schätzer für die Kovarianz Cov(X i,y i ) bzw die Korrelation Corr(X i,y i ) Da die Verteilung von ˆρ schief und auf [,] begrenzt ist, wird eine Transformation benutzt: ŵ = 2 ln ( + ˆρ ˆρ ist für 50, ρ <<, ungefähr (w, 3 )-verteilt mit w = 2 ln(+ρ ρ ), wobei ρ = Corr(X i,y i ) Ein approximatives ( α)-konfidenzintervall für w ist ) [T,T 2 ] = ŵ ± q α/2 3, wobei q α/2 das ( α 2 )-Quantil der Standardnormalverteilung ist Aus den Grenzen ergibt sich durch Rücktransformation ein approximatives ( α)-konfidenzintervall für ρ zu [ e 2T ] [R,R 2 ] = e 2T +, e2t2 e 2T2 + Verteilung einiger Schätzer Bei der Berechnung der Konfidenzintervalle wurden folgende Aussagen für uiv X,,X benutzt: (a) Falls X i (µ,σ 2 ), so ist X µ σ standard-normalverteilt 8
9 (b) Falls X i (µ,σ 2 ), so ist X µ s (c) Falls X i (µ,σ 2 ), so ist ( )s2 σ 2 t-verteilt mit Freiheitsgraden Chi-Quadrat-verteilt mit Freiheitsgraden (d) FürnichtnormalverteilteX i giltderzentralegrenzwertsatz:existierenµ = E(X i )und σ 2 = Var(X i ) > 0, so ist X µ σ für große ungefähr standard-normalverteilt, genauer ( ) lim P X µ z = Φ(z) σ (e) Ist X B(n,p), so gilt für geeignete n,p (siehe Kap 2), dass X ungefähr (np,np( p))-verteilt ist (f) In der Situation vom letzten Abschnitt ist für geeignete und ρ(siehe oben) die transformierte Größe ŵ = ln(+ˆρ 2 ˆρ ) ungefähr (w, 3 )-verteilt für w = 2 ln(+ρ ρ ) 4 Lineare Regression Regressionsmodell: Beobachtet werden unabhängige Datenpaare (X,Y ),,(X,Y ) und es wird ein Zusammenhang Y i = g(x i )+ε i, i =,,, angenommen mit Regressionsfunktion g und uiv Messfehlern ε,,ε mit E(ε i ) = 0, Var(ε i ) = σε 2 Methode der kleinsten Quadrate: Wähle g aus einer geeigneten Klasse von Funktionen so, dass (Y i g(x i )) 2 i= minimiert wird Bei der linearen Regression werden Funktionen g der Form g(x) = b f (x)+b 2 f 2 (x)+b d f d (x) betrachtet, wobei f,f d bekannte vorgegebene Funktionen sind und b,,b d durch die Methode der kleinsten Quadrate zu schätzen sind Spezialfälle: Regressionsgerade g(x) = b + b 2 x In diesem Fall ergibt sich mit der Methode der kleinsten Quadrate ˆb2 = ĉ s 2, ˆb = Y ˆb 2 X,x Regressionspolynom 2 Ordnung g(x) = b +b 2 x+b 3 x 2 5 Statistische Entscheidungsverfahren (Tests) Bei einem Hypothesentest wird eine Hypothese H 0 (ullhypothese) gegen eine Alternative H (Alternativhypothese) getestet Dabei können folgende Fehler auftreten: akzeptiere H 0 verwerfe H 0 H 0 wahr richtig Fehler Art H 0 falsch Fehler 2 Art richtig 9
10 Bei einem statistischen Test wird auf Basis der Stichprobe eine Testgröße berechnet, anhand dererh 0 abgelehntoderbeibehalten(besser:nichtabgelehnt)wirdbeieinemsignifikanztest zum iveau α (Signifikanzniveau) wird das Kriterium so gewählt, dass im ungünstigsten Fall der Fehler Art gleich α ist Typische Werte für α sind 0,05, 0,0 oder 0,00 Es können nicht gleichzeitig Fehler Art und Fehler 2 Art kontrolliert werden Daher wählt man beim Signifikanztest möglichst das, was gezeigt werden soll (das mit den schwerwiegenderen Konsequenzen) als Alternative: Wenn wir H 0 ablehnen, dh uns für die gewünschte Alternative entscheiden, wissen wir, dass der Fehler höchstens α ist Gauß-Test Voraussetzung: X,,X uiv, (µ,σ 2 ) mit bekanntem σ Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : µ = µ 0 (oder µ µ 0 ), H : µ > µ 0 (ii) H 0 : µ = µ 0 (oder µ µ 0 ), H : µ < µ 0 (iii) H 0 : µ = µ 0, H : µ µ 0 3 Beobachte X,X und berechne Testgröße Z = X µ0 σ 4 Lehne H 0 ab, falls in (i) Z > q α, in (ii) Z < q α, in (iii) Z < q α/2 oder Z > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist Einstichproben t-test Voraussetzung: X,,X uiv, (µ,σ 2 ) mit unbekanntem σ Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : µ µ 0, H : µ > µ 0, (ii) H 0 : µ µ 0, H : µ < µ 0 oder (iii) H 0 : µ = µ 0, H : µ µ 0 3 Beobachte X,,X und berechne Testgröße t = X µ0 s 4 Lehne H 0 ab, falls in (i) t > t, α, in (ii) t < t,α, bzw in (iii) t < t,α/2 oder t > t, α/2, wobei t,β das β-quantil der t-verteilung mit Freiheitsgraden ist Anwendung auf Vergleich des Mittelwertes unabhängiger identisch gemeinsam normalverteilter Paare (X,Y ),(X,Y ): Es seien µ = E(X i ), µ 2 = E(Y i ) Die Differenzen D i = X i Y i,i =,, sinddannuiv (µ,σ 2 )mitµ = µ µ 2 unddereinstichprobent-test mit Alternative (i) µ > 0, (ii) µ < 0, (iii) µ 0 kann verwendet werden, um auf (i) µ > µ 2, (ii) µ < µ 2, oder (iii) µ µ 2 zu testen Zweistichproben t-test Voraussetzung: X,,X,Y,,Y M unabhängig mit X,,X uiv (µ,σ 2 ) und Y,,Y M uiv (µ 2,σ 2 ) mit unbekanntem σ Vorgehen: 0
11 Wähle die zu testende Hypothese: (i) H 0 : µ µ 2, d H : µ > µ 2, (ii) H 0 : µ µ 2, H : µ < µ 2, oder (iii) H 0 : µ = µ 2, H : µ µ 2 3 Beobachte X,X,Y,,Y M und berechne Testgröße t = X Y M s,m + M, wobei s 2,M = ( )s2,x +(M )s2 M,y +M 2 4 Lehne H 0 ab, falls in (i) t > t +M 2, α, in (ii) t < t +M 2,α, bzw in (iii) t < t +M 2,α/2 oder t > t +M 2, α/2, wobei t +M 2,β das β-quantil der t-verteilung mit +M 2 Freiheitsgraden ist F-Test Voraussetzung: X,,X,Y,,Y M unabhängig mit X,,X uiv (µ,σ 2 ) und Y,,Y M uiv (µ 2,σ 2 2) mit unbekannten σ, σ 2 Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : σ 2 σ 2 2, H : σ 2 > σ 2 2 (ii) H 0 : σ 2 σ 2 2, H : σ 2 < σ 2 2 oder (iii) H 0 : σ 2 = σ 2 2, H : σ 2 σ Beobachte X,X,Y,,Y M und berechne Testgröße F = s2,x s 2 M,y 4 Lehne H 0 ab, falls in (i) F > f,m, α, in (ii) F < f,m,α, bzw in (iii) F < f,m,α/2 oder F > f,m, α/2, wobei f,m,β das β-quantil der F-Verteilung mit (,M ) Freiheitsgraden ist Die Quantile sind tabelliert für β > 0,5 undkönnen für β < 0,5 bestimmt werden aus f,m,β = /f M,, β χ 2 -Test für die Varianz Voraussetzung: X,,X uiv (µ,σ 2 ) mit unbekanntem σ Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : σ 2 σ 2 0, H : σ 2 > σ 2 0, (ii) H 0 : σ 2 σ 2 0, H : σ 2 < σ 2 0 oder (iii) H 0 : σ 2 = σ 2 0, H : σ 2 σ Beobachte X,X und berechne Testgröße S 2 = ( )s2 σ0 2 4 Lehne H 0 ab, falls in (i) S 2 > χ 2, α, in (ii) S2 < χ 2,α, bzw in (iii) S2 < χ 2,α/2 oders2 > χ 2, α/2,wobeiχ2,β dasβ-quantilderchi-quadrat-verteilung mit Freiheitsgraden ist Korrelationstest (und Test auf Unabhängigkeit) Voraussetzung: (X,Y ),,(X,Y ) unabhängige, identisch gemeinsam normalverteilte Paare mit Korrelation ρ = Corr(X i,y i ) Anwendbar, falls 50 und ρ nicht zu dicht bei Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : ρ ρ 0, H : ρ > ρ 0, (ii) H 0 : ρ ρ 0, H : ρ < ρ 0 oder (iii) H 0 : ρ = ρ 0, H : ρ ρ 0
12 3 Beobachte (X,Y ),,(X,Y ) und berechne Testgröße Z = 3(ŵ w 0 ), wobei ŵ = 2 ln ( + ˆρ ˆρ ), w 0 = 2 ln ( +ρ0 ρ 0 4 Lehne H 0 ab, falls in (i) Z > q α, in (ii) Z < q α, bzw in (iii) Z < q α/2 oder Z > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist Wird gegen ρ 0 = 0 getestet, so ist dies auch ein Test auf Unabhängigkeit, da normalverteilte (X i,y i ) angenommen sind Test auf Unabhängigkeit (auf korreliert/unabhängig, auch für kleine ) Voraussetzung: (X,Y ),,(X,Y ) unabhängige, identisch gemeinsam normalverteilte Paare mit Korrelation ρ = Corr(X i,y i ) Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : ρ 0, H : ρ > 0, (ii) H 0 : ρ 0, H : ρ < 0 oder (iii) H 0 : ρ = 0, H : ρ 0 3 Beobachte (X,Y ),,(X,Y ) und berechne Testgröße R = ˆρ 2 ˆρ 2 ) 4 Lehne H 0 ab, falls in (i) R > t 2, α, in (ii) R < t 2,α, bzw in (iii) R < t 2,α/2 oder R > t 2, α/2, wobei t 2,β jeweils das β-quantil der t-verteilung mit 2 Freiheitsgraden bezeichnet Chi-Quadrat-Anpassungstest zum iveau α Modell: Objekte fallen unabhängig voneinander in d Klassen A,,A d Für i =,, werden Zufallsgrößen Y i definiert durch Y i = k, falls Objekt i in A k fällt (k =,,d) Es seien Y,,Y uiv mit p k = P(Y i = k), k =,,d Ferner sei X k die Anzahl der i, für die Y i = k Unter der Hypothese p k = p 0 k für alle k =,,d bei vorgegebenen p0 k gelte Faustregel (FRD): p 0 k für alle k {,,d} und p0 k 5 für mindestens 80% der k {,,d} Gilt die Faustregel nicht, so muss man kleine Klassen zusammenlegen, bis sie gilt Es sollten aber nicht mehr Klassen als nötig zusammengelegt werden, da mit der Zusammenlegung der Fehler 2 Art steigt Der Test erlaubt, bestimmte Verteilungsannahmen zu vorgegebenem Signifikanzniveau α zu prüfen Drei wichtige Anwendungen sind: (a) Chi-Quadrat-Anpassungstest bei endlicher Verteilung Voraussetzung: Wie im Modell oben Es gelte (FRD) Vorgehen: H 0 : p k = p 0 k für alle k =,,d, H : p k p 0 k für mind ein k {,,d} 2 Wähle α 3 Berechne Testgröße D = d k= 4 H 0 ablehnen, falls D > χ 2 d, α (X k p 0 k )2 p 0 k 2
13 (b) Chi-Quadrat-Anpassungstest für die Poissonverteilung Voraussetzung: Y,,Y uiv mit Werten in {0,,2,}, X k = Anzahl der i mit Y i = k X m = Anzahl der i mit Y i m für k = 0,,m, Schätze ˆλ = Y und ˆp k = ˆλ k k! e ˆλ, k = 0,,m sowie ˆp m = ˆp 0 ˆp m Die Faustregel (FRD) gelte für ˆp k, k = 0,,m Vorgehen: H 0 : Y,,Y Poisson-verteilt, H : Y,,Y nicht Poisson-verteilt 2 Wähle α 3 Berechne Testgröße D = m k=0 4 Lehne H 0 ab, falls D > χ 2 m, α (X k ˆp k ) 2 ˆp k (c) Chi-Quadrat-Anpassungstest für die ormalverteilung Voraussetzung:Y,,Y uivmitwerteninirfürschätzer ˆµ = Y, ˆσ 2 = s2, berechne zu Intervallen I = (,s ], I 2 = (s,s 2 ],, I d = (s d 2,s d ], I d = (s d, ) die Wahrscheinlichkeiten ˆp k = Φ( s k ˆµ ˆσ ) Φ(s k ˆµ ˆσ ) für k = 2,,d sowie ˆp = Φ( s ˆµ ˆσ ) und ˆp d = Φ( s d ˆµ ˆσ ) Die Faustregel (FRD) gelte für ˆp k, k =,,d X k sei die Anzahl der i mit Y i I k für k =,,d Vorgehen: H 0 : Y,,Y normalverteilt, H : Y,,Y nicht normalverteilt 2 Wähle α 3 Berechne Testgröße D = d k= 4 Lehne H 0 ab, falls D > χ 2 d 3, α (X k ˆp k ) 2 ˆp k Achtung:SollaufeineP(λ)bzw(µ,σ 2 )-Verteilungzuvorgegebenenλbzwµ,σ 2 getestet werden, so sind wir nicht in der Situation von (b) oder (c), sondern in der Situation von (a), wo wir dann die p 0 k über die vorgegebene Verteilung berechnen und die Testgröße mit den Quantilen der Chi-Quadrat-Verteilung mit d Freiheitsgraden vergleichen Chi-Quadrat-Unabhängigkeitstest Modell: (X,Y ),,(X,Y ) uiv mit Werten in {(k,l) : k =,,m; l =,,n} und p kl = P(X i = k,y i = l) Es bezeichne Z kl die Anzahl der i für die (X i,y i ) = (k,l), sowie Z l = Z l ++Z ml, Z k = Z k ++Z kn und ˆp 0 kl = Z k Z l / 2 für k =,,m, l =,,n Es gelte die Faustregel ˆp 0 kl für alle k,l und ˆp 0 kl 5 für mindestens 80% der Paare (k,l) Vorgehen: H 0 : X,Y unabhängig, H : X,Y nicht unabhängig 2 Wähle Signifikanzniveau α 3 Berechne Testgröße D = m n k= l= (Z kl ˆp 0 kl )2 ˆp 0 kl 3
14 4 Lehne H 0 ab, falls D > χ 2 (m )(n ), α Die Z kl, Z k, Z l können übersichtlich in einer Kontingenztafel zusammengestellt werden Approximativer Binomialtest Voraussetzung: X B(n,p) Für die vermutete Erfolgswahrscheinlichkeit p 0 gelte die Faustregel: np 0 5 und n( p 0 ) 5 Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : p = p 0 (oder p p 0 ), H : p > p 0, (ii) H 0 : p = p 0 (oder p p 0 ), H : p < p 0 oder (iii) H 0 : p = p 0, H : p p 0 3 Beobachte X und berechne Testgröße Z = X np0 np0( p 0) 4 Lehne H 0 ab, falls in (i) Z > q α, in (ii) Z < q α, bzw in (iii) Z < q α/2 oder Z > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist Exakter Binomialtest Voraussetzung: X B(n, p), n klein oder Faustregel für den approximativen Binomialtest gilt nicht Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : p = p 0 (oder p p 0 ), H : p > p 0, (ii) H 0 : p = p 0 (oder p p 0 ), H : p < p 0 oder (iii) H 0 : p = p 0, H : p p 0 3 Beobachte X 4 Lehne H 0 ab, falls in (i) X > b n,p0, α, in (ii) X < b n,p0,α, bzw in (iii) X < b n,p0,α oder X > b n,p0, α 2 mit α,α 2 α/2, α + α 2 = α, wobei b n,p0β ein β-quantil der BinomialverteilungmitParamternnundp 0 bezeichnettabelliertsindquantileb n,p0,β für verschieden Kombinationen von n und p 0 Sie können für kleine n aber auch selbst berechnet werden Vorzeichentest Modell: Beobachtet werden n Datenpaare (y i,z i ), die unabhängig voneinander erhoben wurden Ziel: Test, ob die ersten (alten) Datenwerte y i eher größer oder besser als die z i sind Vorgehen: Es werden alle Datenpaare mit y i = z i gestrichen Die Anzahl der verbleibenden Paare sei n und X die Anzahl der verbleibenden Paare, für die y i > z i ist Dann gilt X B(n,p) Gibt es eher keinen Unterschied, so wäre p = 2 und wir können die gewünschten Aussage für die Hypothese H 0 : p = p 0 mit p 0 = 2 unter Benutzung des approximativen oder exakten Binomialtests testen Zweistichproben-Binomialtest Voraussetzung: X B(n,p ) und Y B(m,p 2 ) mit hinreichend großen n, m für eine gute Approximation durch die ormalverteilung Vorgehen: Wähle die zu testende Hypothese: (i) H 0 : p = p 2 (oder p p 2 ), H : p > p 2, (ii) H 0 : p = p 2 (oder p p 2 ), H : p < p 2 oder (iii) H 0 : p = p 2, H : p p 2 3 Beobachte X und Y und berechne Testgröße = und ˆp = X+M n+m ˆp ˆp 2 ˆp( ˆp) n+m nm, wobei ˆp = X n, ˆp 2 = Y m 4 Lehne H 0 ab, falls in (i) > q α, in (ii) < q α, bzw in (iii) < q α/2 oder > q α/2, wobei q β das β-quantil der Standardnormalverteilung ist 4
Formelsammlung Statistik II (SS 2010) 1. 1 Numerische und graphische Zusammenfassung quantitativer
TU Kaiserslautern 40700 FB Mathematik Prof Dr Jörn Saß Formelsammlung Statistik II (SS 00) umerische und graphische Zusammenfassung quantitativer Daten Beobachtet werden Daten x,, x Die Ordungsstatistiken
MehrStatistik II für Wirtschaftswissenschaftler
Statistik II für Wirtschaftswissenschaftler Sommer 202 Jörn Saß sass@mathematik.uni-kl.de FB Mathematik TU Kaiserslautern 20. Juli 202 Basierend auf dem Skript von Prof. Dr. Franke Ziel dieses Skriptes
MehrVarianz und Kovarianz
KAPITEL 9 Varianz und Kovarianz 9.1. Varianz Definition 9.1.1. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω eine Zufallsvariable. Wir benutzen die Notation (1) X L 1, falls E[ X ]
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrZusammenfassung Stochastik I + II
Zusammenfassung Stochastik I + II Stephan Kuschel Vorlesung von Dr. Nagel Stochastik I: WS 007/08 Stochastik II: SS 008 zuletzt aktualisiert: 7. Juli 009 Da diese Zusammenfassung den Menschen, die sie
MehrWahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrEntscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
MehrDie Varianz (Streuung) Definition
Die (Streuung) Definition Diskrete Stetige Ang., die betrachteten e existieren. var(x) = E(X EX) 2 heißt der Zufallsvariable X. σ = Var(X) heißt Standardabweichung der X. Bez.: var(x), Var(X), varx, σ
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrStatistik Workshop. 12. und 14. Januar Prof. Dr. Stefan Etschberger HSA
Workshop Mini-Einführung und Auffrischung zu einigen Teilen der angewandten 12. und 14. Prof. Dr. Stefan Etschberger HSA Outline 1 : Einführung Fehler durch Gute und schlechte Grafiken Begriff Grundbegriffe
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
Mehr2 Zufallsvariable, Verteilungen, Erwartungswert
2 Zufallsvariable, Verteilungen, Erwartungswert Bisher: Zufallsexperimente beschrieben durch W-Räume (Ω, A, P) Häufig interessiert nur eine zufällige Größe X = X(ω), die vom Ergebnis ω des Zufallsexperiments
MehrSchätzer (vgl. Kapitel 1): Stichprobenmittel X N. Stichprobenmedian X N
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 8.1 Schätzer für Lage- und Skalenparameter und Verteilungsmodellwahl Lageparameter (l(x + a) = l(x) + a): Erwartungswert EX Median von X
MehrSchätzer und Konfidenzintervalle
Kapitel 2 Schätzer und Konfidenzintervalle Bisher haben wir eine mathematische Theorie entwickelt, die es uns erlaubt, gewisse zufällige Phänomene zu modellieren. Zum Beispiel modellieren wir die Anzahl
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
MehrWir gehen wieder von einem allgemeinen (parametrischen) statistischen Modell aus, (
Kapitel 4 Konfidenzbereiche Wir gehen wieder von einem allgemeinen parametrischen statistischen Modell aus, M, A, P ϑ ; sei eine Funktion des Parameters gegeben, die einen interessierenden Teil-Parameter
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrLösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
MehrKlausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
Mehr1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6
Wirtschaftswissenschaftliches Zentrum 0 Universität Basel Mathematik Dr. Thomas Zehrt Grenzwertsätze Benötigtes Vorwissen: Der Stoff der Vorlesung,,Statistik wird als bekannt vorausgesetzt, insbesondere
MehrÜbung 1: Wiederholung Wahrscheinlichkeitstheorie
Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable
Mehr8. Stetige Zufallsvariablen
8. Stetige Zufallsvariablen Idee: Eine Zufallsvariable X ist stetig, falls ihr Träger eine überabzählbare Teilmenge der reellen Zahlen R ist. Beispiel: Glücksrad mit stetigem Wertebereich [0, 2π] Von Interesse
MehrLösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die
MehrBiometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1
Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrKlausur Stochastik und Statistik 31. Juli 2012
Klausur Stochastik und Statistik 31. Juli 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf
MehrAllgemeine Wahrscheinlichkeitsräume
Kapitel 3 Allgemeine Wahrscheinlichkeitsräume 3. Einleitung Wir hatten schon bemerkt, dass der Begriff des diskreten Wahrscheinlichkeitsraums nicht ausreicht, um das unendliche Wiederholen eines Zufallsexperiments
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
MehrK8 Stetige Zufallsvariablen Theorie und Praxis
K8 Stetige Zufallsvariablen Theorie und Praxis 8.1 Theoretischer Hintergrund Wir haben (nicht abzählbare) Wahrscheinlichkeitsräume Meßbare Funktionen Zufallsvariablen Verteilungsfunktionen Dichten in R
MehrStochastik und Statistik für Ingenieure Vorlesung 4
Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Stochastik und Statistik für Ingenieure Vorlesung 4 30. Oktober 2012 Quantile einer stetigen Zufallsgröße Die reelle Zahl
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrStochastik für die Naturwissenschaften
Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger 6. Ausgewählte Verteilungen (Distributions) * diskret: Bernoulli, Binomial, Geometrisch, Poisson * stetig: Uniform, Exponential, Normal, χ 2,
MehrKlausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK. für Studierende der INFORMATIK
Institut für Stochastik Prof. Dr. Daniel Hug Name: Vorname: Matr.-Nr.: Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK Datum: 08. Februar 0 Dauer:
MehrGrundbegriffe der Wahrscheinlichkeitsrechnung
Algorithmen und Datenstrukturen 349 A Grundbegriffe der Wahrscheinlichkeitsrechnung Für Entwurf und Analyse randomisierter Algorithmen sind Hilfsmittel aus der Wahrscheinlichkeitsrechnung erforderlich.
Mehr9 Die Normalverteilung
9 Die Normalverteilung Dichte: f(x) = 1 2πσ e (x µ)2 /2σ 2, µ R,σ > 0 9.1 Standard-Normalverteilung µ = 0, σ 2 = 1 ϕ(x) = 1 2π e x2 /2 Dichte Φ(x) = 1 x 2π e t2 /2 dt Verteilungsfunktion 331 W.Kössler,
MehrScheinklausur Stochastik 1 für Studierende des Lehramts und der Diplom-Pädagogik
Universität Karlsruhe (TH) Institut für Stochastik Dr. Bernhard Klar Dipl.-Math. oec. Volker Baumstark Name Vorname Matr.-Nr.: Scheinklausur Stochastik für Studierende des Lehramts und der Diplom-Pädagogik
Mehr1 Dichte- und Verteilungsfunktion
Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen Yannick.Schroer@rub.de 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
MehrEinführung in die Statistik Gliederung zur Vorlesung im Sommersemester Markus Reiß Universität Heidelberg
Einführung in die Statistik Gliederung zur Vorlesung im Sommersemester 2005 Markus Reiß Universität Heidelberg 9. Januar 2006 Inhaltsverzeichnis 1 Diskrete Wahrscheinlichkeitsräume 1 1.1 Grundbegriffe.............................
MehrInhaltsverzeichnis. 2 Kurzbeschreibung von SPSS Der SPSS-Dateneditor Statistische Analysen mit SPSS DieDaten...
Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R... 3 1.1 Installieren und Starten von R... 3 1.2 R-Befehleausführen... 3 1.3 R-Workspace speichern... 4 1.4 R-History sichern........ 4 1.5
Mehr3. Kombinatorik und Wahrscheinlichkeit
3. Kombinatorik und Wahrscheinlichkeit Es geht hier um die Bestimmung der Kardinalität endlicher Mengen. Erinnerung: Seien A, B, A 1,..., A n endliche Mengen. Dann gilt A = B ϕ: A B bijektiv Summenregel:
MehrETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)
ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels
MehrSpezielle stetige Verteilungen
Spezielle stetige Verteilungen schon bekannt: Die Exponentialverteilung mit Parameter k R, k > 0 hat die Dichte f (x) = ke kx für x 0 und die Verteilungsfunktion F (x) = 1 e kx für x 0. Eigenschaften Für
Mehr9. Schätzen und Testen bei unbekannter Varianz
9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,
MehrDiskrete Wahrscheinlichkeitstheorie - Probeklausur
Diskrete Wahrscheinlichkeitstheorie - robeklausur Sommersemester 2007 - Lösung Name: Vorname: Matrikelnr.: Studiengang: Hinweise Sie sollten insgesamt Blätter erhalten haben. Tragen Sie bitte Ihre Antworten
MehrP (X = 2) = 1/36, P (X = 3) = 2/36,...
2.3 Zufallsvariablen 2.3 Zufallsvariablen Meist sind die Ereignisse eines Zufallseperiments bereits reelle Zahlen. Ist dies nicht der Fall, kann man Ereignissen eine reelle Zahl zuordnen. Zum Beispiel
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrEinführung in die statistische Testtheorie II
1 Seminar: Simulation und Bildanalyse mit Java Einführung in die statistische Testtheorie II Guntram Seitz Sommersemester 2004 1 WIEDERHOLUNG 2 1 Wiederholung Grundprinzip: Annahme: Beobachtungen bzw.
MehrLösungen ausgewählter Übungsaufgaben zum Buch. Elementare Stochastik (Springer Spektrum, 2012) Teil 3: Aufgaben zu den Kapiteln 5 und 6
1 Lösungen ausgewählter Übungsaufgaben zum Buch Elementare Stochastik (Springer Spektrum, 2012) Teil 3: Aufgaben zu den Kapiteln 5 und 6 Aufgaben zu Kapitel 5 Zu Abschnitt 5.1 Ü5.1.1 Finden Sie eine maximum-likelihood-schätzung
MehrVertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)
Selbstkontrollarbeit 1 Vertiefung der Wirtschaftsmathematik und Statistik (Teil Statistik) 18. Januar 2011 Aufgaben Aufgabe 1 Gegeben sei eine binomialverteilte Zufallsvariablen X mit den Parametern N
Mehr3 Bedingte Wahrscheinlichkeit, Unabhängigkeit
3 Bedingte Wahrscheinlichkeit, Unabhängigkeit Bisher : (Ω, A, P) zur Beschreibung eines Zufallsexperiments Jetzt : Zusatzinformation über den Ausgang des Experiments, etwa (das Ereignis) B ist eingetreten.
MehrGrundgesamtheit und Stichprobe
Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U
Mehr3.3 Bedingte Wahrscheinlichkeit
28 3.3 Bedingte Wahrscheinlichkeit Oft ist die Wahrscheinlichkeit eines Ereignisses B gesucht unter der Bedingung (bzw. dem Wissen), dass ein Ereignis A bereits eingetreten ist. Man bezeichnet diese Wahrscheinlichkeit
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrBiomathematik für Mediziner, Klausur SS 2001 Seite 1
Biomathematik für Mediziner, Klausur SS 2001 Seite 1 Aufgabe 1: Von den Patienten einer Klinik geben 70% an, Masern gehabt zu haben, und 60% erinnerten sich an eine Windpockeninfektion. An mindestens einer
MehrKenngrößen von Zufallsvariablen
Kenngrößen von Zufallsvariablen Die Wahrscheinlichkeitsverteilung kann durch die sogenannten Kenngrößen beschrieben werden, sie charakterisieren sozusagen die Verteilung. Der Erwartungswert Der Erwartungswert
MehrBiostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 / Übungsaufgaben Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 10.02.2012 1/51 Aufgabe 1 Aufgabenstellung Übungsaufgaben Ein Pharmakonzern möchte ein neues Schlankheitsmedikament
MehrStatistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt
MehrEinführung in die (induktive) Statistik
Einführung in die (induktive) Statistik Typische Fragestellung der Statistik: Auf Grund einer Problemmodellierung sind wir interessiert an: Zufallsexperiment beschrieben durch ZV X. Problem: Verteilung
MehrInhaltsverzeichnis. Teil I Einführung
Inhaltsverzeichnis Teil I Einführung 1 Statistik-Programme... 1.1 Kleine Einführung in R... 1.1.1 Installieren und Starten von R. 1.1.2 R-Konsole... 1.1.3 R-Workspace... 1.1.4 R-History... 1.1.5 R-Skripteditor...
MehrKapitel 1: Elemente der Statistik
1 Kapitel 1: Elemente der Statistik 1.1 Beispiel Ein Elektromarkt erhält eine Lieferung von N = 10000 Glühbirnen. Darunter ist eine unbekannte Anzahl h defekt, wobei h 0 1 = {0, 1,..., N}. Um Kenntnisse
MehrÜ b u n g s b l a t t 13
Einführung in die Stochastik Sommersemester 06 Dr. Walter Oevel 5. 6. 006 Ü b u n g s b l a t t 3 Mit und gekennzeichnete Aufgaben können zum Sammeln von Bonuspunkten verwendet werden. Lösungen von -Aufgaben
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrStatistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage
Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung
Mehr11.4 Korrelation. Def. 44 Es seien X 1 und X 2 zwei zufällige Variablen, für die gilt: 0 < σ X1,σ X2 < +. Dann heißt der Quotient
11.4 Korrelation Def. 44 Es seien X 1 und X 2 zwei zufällige Variablen, für die gilt: 0 < σ X1,σ X2 < +. Dann heißt der Quotient (X 1,X 2 ) = cov (X 1,X 2 ) σ X1 σ X2 Korrelationskoeffizient der Zufallsgrößen
MehrKlausur Stochastik und Statistik 18. September 2012
Klausur Stochastik und Statistik 18. September 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht
MehrChi-Quadrat-Verteilung
Chi-Quadrat-Verteilung Die Verteilung einer Summe X +X +...+X n, wobei X,..., X n unabhängige standardnormalverteilte Zufallsvariablen sind, heißt χ -Verteilung mit n Freiheitsgraden. Eine N(, )-verteilte
MehrKapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Induktive Statistik Prof. Dr. W.-D.
MehrSTATISTIK Teil 2 Wahrscheinlichkeitsrechnung und schließende Statistik. Mögliche Ergebnisse, auch Elementarereignisse bezeichnet
Kapitel 10 Zufall und Wahrscheinlichkeit 10.1. Grundbegriffe Wahrscheinlichkeitsrechnung Zufallsvorgang Klein-Omega ω Groß-Omega Ω Stellt Modelle bereit, die es erlauben zufallsabhängige Prozesse abzuschätzen
Mehr4 Unabhängige Zufallsvariablen. Gemeinsame Verteilung
4 Unabhängige Zufallsvariablen. Gemeinsame Verteilung Häufig werden mehrere Zufallsvariablen gleichzeitig betrachtet, z.b. Beispiel 4.1. Ein Computersystem bestehe aus n Teilsystemen. X i sei der Ausfallzeitpunkt
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen 3. Grundlagen aus der Wahrscheinlichkeitstheorie
Wahrscheinlichkeitsrechnung und Statistik für Biologen 3. Grundlagen aus der Wahrscheinlichkeitstheorie Martin Hutzenthaler & Dirk Metzler 11. Mai 2011 Inhaltsverzeichnis 1 Deterministische und zufällige
Mehr10. Die Normalverteilungsannahme
10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man
MehrStatistik für Ökonomen
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS 2., überarbeitete Auflage 4ü Springer Gabler Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R '! 3 1.1 Installieren
MehrUnivariates Datenmaterial
Univariates Datenmaterial 1.6.1 Deskriptive Statistik Zufallstichprobe: Umfang n, d.h. Stichprobe von n Zufallsvariablen o Merkmal/Zufallsvariablen: Y = {Y 1, Y 2,..., Y n } o Realisationen/Daten: x =
Mehr1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6
Inhaltsverzeichnis 1 Vorbemerkungen 1 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2 3 Wahrscheinlichkeitsaxiome 4 4 Laplace-Experimente 5 Hilfsmittel aus der Kombinatorik 7 Bedingte
MehrDiskrete Verteilungen
KAPITEL 6 Disrete Verteilungen Nun werden wir verschiedene Beispiele von disreten Zufallsvariablen betrachten. 1. Gleichverteilung Definition 6.1. Eine Zufallsvariable X : Ω R heißt gleichverteilt (oder
MehrI. Deskriptive Statistik 1
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................
MehrZufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten
Zufallsgrößen Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt 0 Einführung Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests
MehrFormelsammlung Biometrie und Methodik
Formelsammlung Biometrie und Methodik Beschreibende Statistik UnivariateDatenanalyse (Beobachtungswerte x,...,x n ) Absolute Häufigkeit n k = Anzahlder ω i mit x i = a k Relative H keit/empirische Verteilung
MehrInformatik II Grundbegriffe der Wahrscheinlichkeitsrechnung
lausthal Informatik II rundbegriffe der Wahrscheinlichkeitsrechnung. Zachmann lausthal University, ermany zach@in.tu-clausthal.de Begriffe Definition: Unter einem Zufallsexperiment versteht man einen,
MehrNachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14
Prof. Dr. Rainer Schwabe 08.07.2014 Otto-von-Guericke-Universität Magdeburg Institut für Mathematische Stochastik Nachhol-Klausur - Schätzen und Testen - Wintersemester 2013/14 Name:, Vorname: Matr.-Nr.
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
MehrLösungen zu den Übungsaufgaben in Kapitel 10
Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert
MehrHypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
MehrHinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet.
11.01.2012 Prof. Dr. Ingo Klein Klausur zur VWA-Statistik Hinweis: Es sind 4 aus 6 Aufgaben zu bearbeiten. Werden mehr als 4 Aufgaben bearbeitet, werden nur die ersten vier Aufgaben gewertet. Aufgabe 1:
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
Mehr5. Statistische Schätztheorie
5. Statistische Schätztheorie Problem: Sei X eine Zufallsvariable (oder X ein Zufallsvektor), die einen interessierenden Zufallsvorgang repräsentiere Man möchte die tatsächliche Verteilung von X (oder
MehrWahrscheinlichkeitsrechnung und Quantentheorie
Physikalische Chemie II: Atombau und chemische Bindung Winter 2013/14 Wahrscheinlichkeitsrechnung und Quantentheorie Messergebnisse können in der Quantenmechanik ganz prinzipiell nur noch mit einer bestimmten
MehrÜbungsblatt 9. f(x) = e x, für 0 x
Aufgabe 1: Übungsblatt 9 Basketball. Ein Profi wirft beim Training aus einer Entfernung von sieben Metern auf den Korb. Er trifft bei jedem Wurf mit einer Wahrscheinlichkeit von p = 1/2. Die Zufallsvariable
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Kurze Zusammenfassung der letzten Vorlesung Schätzung und Modellentwicklung Überblick Statistische Signifikanztests
MehrWahrscheinlichkeitsrechnung und schließende Statistik
Günther Bourier Wahrscheinlichkeitsrechnung und schließende Statistik Praxisorientierte Einführung Mit Aufgaben und Lösungen 3. F überarbeitete Auflage GABLER Inhaltsverzeichnis Vorwort Inhaltsverzeichnis
Mehr3.4 Asymptotische Evaluierung von Sch atzer Konsistenz Konsistenz Definition 3.4.1: konsistente Folge von Sch atzer
3.4 Asymptotische Evaluierung von Schätzer 3.4.1 Konsistenz Bis jetzt haben wir Kriterien basierend auf endlichen Stichproben betrachtet. Konsistenz ist ein asymptotisches Kriterium (n ) und bezieht sich
Mehr$ % + 0 sonst. " p für X =1 $
31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses
Mehr0, t 0,5
XIII. Die Normalverteilung ==================================================================. Der lokale Grenzwertsatz --------------------------------------------------------------------------------------------------------------
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
Mehr