Statistische Intervalle
|
|
|
- Bella Lorenz
- vor 8 Jahren
- Abrufe
Transkript
1 Statistische Intervalle Andreas Handl Inhaltsverzeichnis 1 Statistische Intervalle 2 2 Intervalle bei Normalverteilung Konfidenzintervalle Konfidenzintervall für µ Konfidenzintervall für σ Prognoseintervalle Toleranzintervalle A Die simulierten Daten 25 B Tabellen 26 1
2 1 Statistische Intervalle Bei der Veröffentlichung der Ergebnisse statistischer Erhebungen werden vielfach Punktschätzer angegeben. So ist beim Umwelt- und Prognose-Institut am folgende Aussage zu finden: Die durchschnittliche Fahrleistung des Autofahrers liegt seit Jahren stabil bei Kilometern im Jahr. Dieser Wert ist eine Schätzung. Dies merkt man schon daran, dass es sich um eine runde Zahl handelt. Es fehlt aber eine Genauigkeitsangabe in Form der Varianz. Oft wird ein Intervall angegeben. Dies trägt dem Umstand Rechnung, dass die Schätzung fehlerbehaftet ist. Wir wollen uns im Folgenden Intervalle anschauen. Dabei gehen wir von einer Zufallsstichprobe x 1,...,x n aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F X x aus. Die Beobachtungen x 1,...,x n sind also Realisationen der unabhängigen, identisch mit Verteilungsfunktion F X x verteilten Zufallsvariablen X 1,...,X n. Wir betrachten im Folgenden das Intervall [ x1,x n ] 1 Dabei ist x 1 die kleinste und x n die größte Beobachtung in der Stichprobe. Beispiel 1 Ein Arbeitnehmer hat eine neue Stelle angenommen. Er will wissen, welche Charakteristika die Fahrzeit zur Arbeitsstelle besitzt. Deshalb notiert er die Fahrzeit an 9 aufeinander folgenden Tagen. Hier sind die Werte in Sekunden: Es gilt x 1 = 1600 und x 9 = Wir betrachten also das Intervall [1600, 2000] 2 In Abhängigkeit von der Fragestellung kann man das Intervall in Gleichung 1 unterschiedlich interpretieren. Ist man an einem Parameter wie dem Erwartungswert EX oder dem Median X 0.5 interessiert, so wird man ein Konfidenzintervall aufstellen. Definition 1.1 Seien X 1,...,X n unabhängige, identisch verteilte Zufallsvariablen, deren Verteilungsfunktion F X x von einem Parameter θ abhängt. Außerdem seien 2
3 T 1 = g 1 X 1,...,X n und T 2 = g 2 X 1,...,X n zwei Stichprobenfunktionen. Dann heißt das Intervall mit [T 1,T 2 ] 3 P T 1 θ T 2 =1 α 4 zweiseitiges Konfidenzintervall für θ zum Konfidenzniveau 1 α. Ist der Parameter θ gleich dem Median X 0.5,sokönnen wir das Intervall in Gleichung 1 auf Seite 2 als Konfidenzintervall für den Median X 0.5 auffassen. Es ist einfach, das Konfidenzniveau des Intervalls [ x 1,x n ] bestimmen. Es gilt P X 1 X 0.5 X n =1 [ P X1 >X P Xn <X 0.5 ] Nun gilt P X 1 >X 0.5 = P alle Xi >X 0.5 =P X 1 >X 0.5,...,X n >X 0.5 Analog erhalten wir Somit gilt = P X 1 >X 0.5 P X n >X 0.5 =0.5 n P X n <X 0.5 =0.5 n P X 1 X 0.5 X n = n =1 0.5 n 1 Beispiel 1 fortgesetzt von Seite 2 Der Arbeitnehmer ist an der mittleren Fahrzeit interessiert, die er mit dem Median misst. Das Konfidenzintervall für den Median ist in Gleichung 2 auf Seite 2 zu finden. Das Konfidenzniveau beträgt 1 α = =0.996 Wir wollen verdeutlichen, wie das Konfidenzniveau zu interpretieren ist. Für ein konkretes Intervall gibt es nur zwei Möglichkeiten. Der unbekannte Wert des Parameters liegt in dem Intervall oder er liegt nicht in dem Intervall. Wir wissen nicht, welche der beiden Möglichkeiten zutrifft. Wir können aber die Wahrscheinlichkeit bestimmen, dass wir ein Intervall gefunden haben, das den Wert des Parameters überdeckt. Hierzu führen wir eine Simulation durch. 3
4 Wir unterstellen Standardnormalverteilung und ziehen 20 Stichproben vom Umfang n =9.Für jede dieser Stichproben stellen wir das Konfidenzintervall aus Gleichung 1 auf Seite 2 für X 0.5 auf. Die Daten sind in Tabelle 1 auf 25 zu finden. Die erste simulierte Stichprobe lautet: Das Intervall ist [ 1.59, 1.85]. Der Wert von X 0.5 ist uns bekannt. Er ist 0. Das Intervall enthält den Wert von X 0.5. Abbildung 1 verdeutlicht dies und zeigt die anderen 19 Konfidenzintervalle. Abbildung 1: 20 Konfidenzintervalle Wir sehen, dass 19 Konfidenzintervalle den Wert 0 enthalten. Das Konfidenzniveau bezieht sich auf den Prozess und nicht das konkrete Intervall. Stellen wir sehr viele Konfidenzintervalle zum Konfidenzniveau 1 α auf, so erwarten wir, dass α Prozent den wahren Wert des Parameters überdecken. Ist 1 α nahe bei 1, so können wir uns bei einem konkreten Intervall also ziemlich sein, dass es den wahren Wert des Parameters enthält. Im Beispiel haben wir den Stichprobenumfang vorgegeben. Wollen wir das Intervall [ x 1,x n ] als Konfidenzintervall zum vorgegebenen Konfidenzniveau 1 α aufstellen, so bestimmen wir den Stichprobenumfang n folgendermaßen: n 1+ ln α ln 0.5 4
5 Dies sieht man folgendermaßen: n 1 1 α 0.5 n 1 α n 1 ln 0.5 ln α n 1 ln α ln 0.5 n 1+ln α ln 0.5 Beispiel 2 Wollen wir das Intervall [ x 1,x n ] als Konfidenzintervall zum Konfidenzniveau 0.95, so benötigen wir eine Stichprobe vom Umfang 6, denn ln n 1+ =5.32 ln 0.5 Wir können auch einseitige Konfidenzintervalle aufstellen. Definition 1.2 Seien X 1,...,X n unabhängige, identisch verteilte Zufallsvariablen, deren Verteilungsfunktion F X x von einem Parameter θ abhängt. Außerdem seien T 1 = g 1 X 1,...,X n und T 2 = g 2 X 1,...,X n zwei Stichprobenfunktionen. Dann heißen die Intervalle,T 2 ] 5 mit P θ T 2 =1 α 6 und [T 1, 7 mit P T 1 θ =1 α 8 einseitige Konfidenzintervalle für θ zum Konfidenzniveau 1 α. Einseitige Konfidenzintervalle werden verwendet, wenn man angeben will, welchen Wert ein Parameter mit einer vorgegebenen Wahrscheinlichkeit 1 α mindestens oder höchstens annehmen kann. Die Intervalle [ x1, 9 und ],xn 10 kann man als einseitige Konfidenzintervalle für den Median auffassen. Für beide Intervalle gilt 1 α =1 0.5 n 5
6 Ein Konfidenzintervall ist ein Intervall für einen Parameter. Will man aber einen zukünftigen Wert x n+1 einer Zufallsvariablen auf Basis einer Stichprobe x 1,...,x n vorhersagen, so spricht man von Prognose. Wie bei der Schätzung kann man auch bei der Prognose Intervalle für den zukünftigen Wert angeben. Definition 1.3 Seien X 1,...,X n,x n+1 unabhängige, identisch mit Verteilungsfunktion F X x verteilte Zufallsvariablen. Außerdem seien T 1 = g 1 X 1,...,X n und T 2 = g 2 X 1,...,X n zwei Stichprobenfunktionen. Dann heißt das Intervall mit [T 1,T 2 ] 11 P T 1 X n+1 T 2 =1 α 12 Prognoseintervall für X n+1 zur Sicherheit 1 α. Wir können das Intervall [ ] x 1,x n als Prognoseintervall auffassen. Es gilt für jede stetige Verteilung 1 α = n 1 13 n +1 Bevor wir uns überlegen, warum 1 α diesen Wert annimmt, wollen wir zunächst 1 α interpretieren. Wie auch bei Konfidenzintervallen gibt es bei Prognoseintervallen für ein konkretes Intervall [t 1,t 2 ]zweimöglichkeiten. Die Realisation x n+1 liegt im Intervall [t 1,t 2 ] oder sie liegt nicht im Intervall [t 1,t 2 ]. Die Wahrscheinlichkeitsaussage bezieht sich auch hier nicht auf das Intervall sondern auf die Prozedur. Wenn wir sehr viele Stichproben x 1,...,x n,x n+1 vom Umfang n+1 ziehen und für x 1,...,x n das Prognoseintervall bestimmen, so erwarten wir, dass in α Prozent der Prognoseintervalle der Wert x n+1 liegt. Wir wollen dies für das Intervall [ ] x 1,x n mit einer Simulation veranschaulichen. Wir unterstellen Standardnormalverteilung und ziehen 20 Stichproben vom Umfang n = 9.Für jede dieser Stichproben stellen wir das Prognoseintervall [ ] x 1,x n auf. Die Daten sind in Tabelle 1 auf 25 zu finden. Die erste simulierte Stichprobe lautet: Das Intervall ist [ 1.59, 1.85]. Der Wert von x 10 ist Das Intervall enthält den Wert von x 10. Abbildung 2 verdeutlicht dies. Außerdem sind noch die anderen 19 Prognoseintervalle zu finden. 6
7 Abbildung 2: 20 Prognoseintervalle Wir sehen, dass 16 Prognoseintervalle den Wert x n+1 enthalten. Beispiel 1 fortgesetzt von Seite 3 Will er nur wissen, wie lange er bei der nächsten Fahrt unterwegs ist, so wird er eine Prognose bestimmen. Ein Prognoseintervall sagt ihm, zwischen welchen Grenzen die nächste Fahrzeit liegen wird. Verwendet er das Intervall [1600, 2000] als Prognoseintervall, so gilt 1 α = =0.8 Wenden wir uns jetzt der Frage zu, warum Gleichung 13 auf Seite 6 gilt. Wenn die Verteilungsfunktion F X x bekannt ist, gilt P X 1 X X n = P FX X1 FX X F X Xn 14 Besitzt X die Verteilungsfunktion F X x, so ist die Zufallsvariable F X X gleichverteilt auf 0, 1. Der Beweis ist bei Randles and Wolfe 1979 auf der Seite 6 zu finden. F X X i ist also die i-te Orderstatistik einer Zufallsstichprobe vom Umfang n aus einer Gleichverteilung auf 0, 1. Diese bezeichnen wir mit U i. Bickel and Doksum 2001 zeigen auf Seite 254: P X 1 X X n = E Un E U1 7
8 Es gilt E i U i = n +1 siehe dazu Randles and Wolfe 1979, S. 7. Hieraus folgt E n U n U 1 = n +1 1 n +1 = n 1 n +1 Im Beispiel haben wir den Stichprobenumfang vorgegeben. Wollen wir das Intervall in Gleichung 1 auf Seite 2 als Prognoseintervall zum vorgegebenen Prognoseniveau 1 α aufstellen, so bestimmen wir den Stichprobenumfang n folgendermaßen: n 2 α α Dies sieht man folgendermaßen: n 1 n +1 1 α n 1 n + 11 α n 1 n1 α+1 α nα 2 α n 2 α α Beispiel 3 Verwenden wir das Intervall [ ] x 1,x n als Prognoseintervall zur Sicherheit 0.95, so benötigen wir eine Stichprobe vom Umfang 39, denn n = Wir können auch einseitige Prognoseintervalle aufstellen. Definition 1.4 Seien X 1,...,X n,x n+1 unabhängige, identisch mit Verteilungsfunktion F X x verteilte Zufallsvariablen. Außerdem seien T 1 = g 1 X 1,...,X n und T 2 = g 2 X 1,...,X n zwei Stichprobenfunktionen. Dann heißen die Intervalle mit und,t 2 ] 15 P X n+1 T 2 =1 α 16 [T 1, 17 8
9 mit P T 1 X n+1 =1 α 18 einseitige Prognoseintervalle für x n+1 zur Sicherheit 1 α. Einseitige Prognoseintervalle werden verwendet, wenn man angeben will, welchen Wert eine zukünftige Beobachtung mit einer vorgegebenen Wahrscheinlichkeit 1 α mindestens oder höchstens annehmen kann. Die Intervalle [ x1, 19 und,xn ] 20 kann man als einseitige Prognoseintervalle auffassen. Für beide Intervalle gilt 1 α = n n +1 Hahn 1970 nennt das Prognoseintervall auch das Astronauten-Intervall. Ein Astronaut interessiert sich nur für den nächsten Flug und will wissen, welche Werte der interessierenden Merkmale er erwarten kann. Der Hersteller eines Produktes ist aber nicht nur an einer Beobachtung interessiert, sondern an der gesamten zukünftigen Produktion. Er will ein Intervall angeben, in dem sich mindestens der Anteil p aller zukünftigen Beobachtungen befindet. Definition 1.5 Seien X 1,...,X n unabhängige, identisch mit Verteilungsfunktion F X x verteilte Zufallsvariablen. Außerdem seien T 1 = g 1 X 1,...,X n und T 2 = g 2 X 1,...,X n zweistichprobenfunktionen. Dann heißt das Intervall mit [T 1,T 2 ] 21 P P T 1 X n+1 T 2 p =1 α 22 Toleranzintervall für den Mindestanteil p zur Sicherheit 1 α. 9
10 Wie können wir diese Wahrscheinlichkeit interpretieren? Das Toleranzintervall soll mindestens 100 p Prozent aller Realisationen der Zufallsvariablen enthalten. Für ein konkretes Intervall gibt es zwei Möglichkeiten. Es enthält mindestens die Wahrscheinlichkeitsmasse p oder es enthält sie nicht. Wir wollen dies für das Intervall [ x 1,x n ] mit einer Simulation veranschaulichen. Wir unterstellen Standardnormalverteilung und ziehen 20 Stichproben vom Umfang n = 9.Für jede dieser Stichproben stellen wir das Konfidenzintervall aus Gleichung 1 auf Seite 2 für X 0.5 auf. Die Daten sind in Tabelle 1 auf 25 zu finden. Nehmen wir an, die erste simulierte Stichprobe lautet Das Intervall ist [ 1.59, 1.85]. Sei p = 0.9. Ist X standardnormalverteilt, so gilt P 1.59 X 1.85 = Φ1.85 Φ 1.59 = Das Intervall [ 1.59, 1.85] enthält Prozent aller Realisationen einer standardnormalverteilten Zufallsvariablen. Abbildung 3 verdeutlicht dies und zeigt die 19 anderen Intervalle. Wir sehen, dass 11 Toleranzintervalle, also 55 Prozent mindestens die Wahrscheinlichkeitsmasse 0.8 enthalten. Abbildung 3: 20 Toleranzzintervalle
11 Bei einem Toleranzintervall bezieht sich die innere Wahrscheinlichkeitsaussage in Gleichung 22 auf Seite 9 auf das Intervall, während sich die äußere Wahrscheinlichkeitsaussage auf die Prozedur bezieht. Wenn wir sehr viele Stichproben x 1,...,x n und für jede das Toleranzintervall [t 1,t 2 ] bestimmen, so erwarten wir, dass α Prozent der Intervalle mindestens die Wahrscheinlichkeitsmasse p enthalten. Fassen wir das Intervall [ x 1,x n ] als Toleranzintervall mit Mindestanteil p auf, so gilt für jede stetige Verteilung 1 α =1 p n n1 pp n 1 23 Diese Beziehung wird in Mood et al auf den Seiten hergeleitet. Beispiel 1 fortgesetzt von Seite 7 Der Arbeitnehmer ist an einem Toleranzintervall mit Mindestanteil 0.8 interessiert. Verwendet er das Intervall [1600, 2000] als Toleranzintervall mit Mindestanteil 0.8, so beträgt die Sicherheit 1 α = =0.624 Im Beispiel haben wir den Stichprobenumfang vorgegeben. Wollen wir das Intervall [ ] x 1,x n als Toleranzintervall mit Mindestanteil p zur vorgegebenen Sicherheit 1 α aufstellen, so müssen wir die Gleichung 23 nach n auflösen. Dies ist nicht explizit möglich. Eine gute Approximation ist bei Conover 1999 auf Seite 151 zu finden. Sie lautet n 1+p 4 1 p χ2 1 α, Dabei ist χ 2 1 α,4 das 1 α-quantil der χ 2 -Verteilung mit 4 Freiheitsgraden. Beispiel 4 Wollen wir das Intervall [ ] x 1,x n als Toleranzintervall für den Mindesanteil 0.9 zur Sicherheit 0.95 verwenden, so benötigen wir eine Stichprobe vom Umfang 46, denn n = Setzen wir n = 46 und p =0.9 in Gleichung 23 ein, so erhalten wir Für n = 45 und p =0.9 gilt 1 α = = α = =
12 Wir können auch einseitige Toleranzintervalle aufstellen. Definition 1.6 Seien X 1,...,X n unabhängige, identisch mit Verteilungsfunktion F X x verteilte Zufallsvariablen. Außerdem seien T 1 = g 1 X 1,...,X n und T 2 = g 2 X 1,...,X n zweistichprobenfunktionen. Dann heißen die Intervalle mit und mit,t 2 ] 25 P P X T 2 p =1 α 26 [T 1, 27 P P X T 1 p =1 α 28 einseitige Toleranzintervalle für den Mindestanteil p zur Sicherheit 1 α. Die Intervalle [ x1, 29 und,xn ] 30 kann man als einseitige Toleranzintervalle auffassen. Für beide Intervalle gilt 1 α =1 p n 2 Intervalle bei Normalverteilung Im letzten Kapitel haben wir uns mit verteilungsfreien Intervallen beschäftigt. Ist die Verteilung der Grundgesamtheit bekannt, so kann man Intervalle aufstellen, die bei gleichem Niveau wesentlich schmaler sind. Wir wollen im Folgenden nur Normalverteilung unterstellen. Wir gehen also davon aus, dass die Zufallsvariablen X 1,...,X n unabhängig und mit den Parametern µ und σ 2 normalverteilt sind. 12
13 2.1 Konfidenzintervalle Die Dichtefunktion der Normalverteilung hängt von den Parametern µ und σ 2 ab. Wir wollen im Folgenden Konfidenzintervalle für jeden der beiden Parameter herleiten. Wie man ein simultanes Konfidenzintervall für beide Parameter erhält, wird von Mood et al auf den Seiten beschrieben Konfidenzintervall für µ Ist die Varianz der Grundgesamtheit bekannt, so ist das Konfidenzintervall für µ bei Normalverteilung gegeben durch: [ X z 1 α/2 σ n, X + z 1 α/2 σ n ] 31 Dabei ist z 1 α/2 das 1 α/2-quantil der Standardnormalverteilung. Es gilt nämlich σ P X z 1 α/2 n µ X σ + z 1 α/2 n σ = P z 1 α/2 n µ X σ z 1 α/2 n σ = P z 1 α/2 n X σ µ z 1 α/2 n = P z 1 α/2 X µ σ/ n z 1 α/2 =Φz 1 α/2 Φ z 1 α/2 =1 α Schauen wir uns das Konfidenzintervall in Gleichung 31 unter praxisrelevanten Gesichtspunkten an. Bei einer Datenanalyse wird σ 2 in der Regel unbekannt sein. Es liegt nahe, σ 2 durch S 2 = 1 n 1 n Xi X 2 i=1 13
14 zu schätzen und diesen Schätzer in Gleichung 31 für σ 2 einzusetzen. Das Intervall sieht also folgendermaßen aus: [ X z 1 α/2 S n, X + z 1 α/2 S n ]. 32 Für kleine Stichprobenumfänge gilt aber S P X z 1 α/2 n µ X S + z 1 α/2 n 1 α. 33 Eine kleine Simulation zeigt dies. Wir erzeugen 5000 Stichproben vom Umfang 4 aus der Standardnormalverteilung, stellen für jede das Konfidenzintervall in Gleichung 32 auf und zählen, wie viele der Konfidenzintervalle den Wert 0 überdecken. Das geschätze Konfidenzniveau beträgt Die Konfidenzintervalle sind also im Mittel zu schmal. Um zu sehen, woran dies liegt, formen wir den Ausdruck in der Klammer auf der linken Seite von Gleichung 33 um: X z 1 α/2 S n µ X + z 1 α/2 S n z 1 α/2 S n µ X z 1 α/2 S n z 1 α/2 S n X µ z 1 α/2 S n z 1 α/2 X µ S/ n z 1 α/2 Wir müssen also folgende Wahrscheinlichkeit bestimmen: P z 1 α/2 X µ S/ n z 1 α/2 Die Zufallsvariable t = X µ S/ n ist nicht standardnormalverteilt, wenn die X 1,...,X n unabhängig und mit den Parametern µ und σ 2 normalverteilt sind. Die Schätzung von σ 2 führt dazu, dass t stärker streut als die Standardnormalverteilung. Von Gossett 1908 wurde gezeigt, dass t eine t-verteilung mit n 1 Freiheitsgraden besitzt. Ist 14
15 t n 1;1 α/2 das 1 α/2-quantil der t-verteilung mit n 1 Freiheitsgraden, so gilt P t n 1;1 α/2 X µ S/ n t n 1;1 α/2 =1 α 34 Wir formen den Ausdruck in der Klammer auf der linken Seite von Gleichung 34 so um, dass zwischen den Ungleichheitszeichen nur noch µ steht. Es gilt P X t n 1;1 α/2 S n µ X + t n 1;1 α/2 S n =1 α Durch diese Umformung haben wir ein Konfidenzintervall für µ bei Normalverteilung mit unbekannten σ 2 gefunden. Es lautet: [ X t n 1;1 α/2 S n, X + t n 1;1 α/2 S n ]. 35 Dabei ist t n 1;1 α/2 das 1 α/2-quantil der t-verteilung mit n 1 Freiheitsgraden. Beispiel 1 fortgesetzt von Seite 11 Wir unterstellen Normalverteilung und stellen das Konfidenzintervall für µ zum Konfidenzniveau 0.95 auf. Es gilt x = 1800 und s = Mit n = 9 gilt also s/ n = Der Tabelle der t-verteilung entnehmen wir t 8;0.975 = Mit t n 1;1 α/2 s n = Wir erhalten also folgendes Konfidenzintervall [1695.9, ] Das verteilungsfreie Konfidenzintervall [ x 1,x n ] lautet [1600, 2000]. Das Konfidenzniveau ist Zum Vergleich stellen wir noch das Konfidenzintervall für µ zum Konfidenzniveau auf. Es gilt t 8;0.998 =3.99. Also erhalten wir folgendes Konfidenzintervall [1619.9, ] Dieses ist schmaler als das verteilungsfreie Konfidenzintervall. 15
16 Schauen wir die Länge L des Konfidenzintervalls an. Es gilt Dies sieht man folgendermaßen L =2t n 1;1 α/2 L = x + t n 1;1 α/2 s n = 2t n 1;1 α/2 s n s n 36 x t n 1;1 α/2 s n Das Intervall wird breiter, wenn wir das Konfidenzniveau 1 α vergrößern. Es wird aber nicht notwendigerweise schmaler, wenn wir den Stichprobenumfang erhöhen. Für eine neue Stichprobe werden wir auch einen anderen Wert von s erhalten, sodass das Intervall größer werden kann. Es ist auch nicht möglich den Mindeststichprobenumfang zu bestimmen, um eine vorgegebene Länge des Intervalls nicht zu überschreiten, da der Stichprobenumfang von s abhängt. Aus L l folgt nämlich n 4 t2 n 1;1 α/2 s2. l 2 Die einseitigen Konfidenzintervalle für µ bei Normalverteilung sind. ], X S + t n 1;1 α n. 37 und [ X t n 1;1 α S n,. 38 Dabei ist t n 1;1 α das 1 α-quantil der t-verteilung mit n 1 Freiheitsgraden. Beispiel 1 fortgesetzt von Seite 15 Wir suchen den Wert, den µ mit Wahrscheinlichkeit 0.95 mindestens annimmt. Es gilt t 0.95,8 =1.86. Mit x = 1800, s = und s/ n =45.13 ist dieser Wert also gleich =
17 2.1.2 Konfidenzintervall für σ 2 Wir gehen wiederum davon aus, dass Normalverteilung vorliegt und wollen ein Konfidenzintervall für σ 2 aufstellen. Um zu verstehen, wie man dies erhält, schauen wir uns noch einmal das Konfidenzintervall für µ an. Bei diesem sind wir von X µ S/ n ausgegangen. Diese Zufallsvariable ist mit n 1 Freiheitsgraden t-verteilt, wenn die Zufallsvariablen X 1,...,X n unabhängig und mit den Parametern µ und σ 2 normalverteilt sind. Somit gilt P t n 1,1 α/2 X µ S/ n t n 1,1 α/2 =1 α Formen wir den Ausdruck in der Klammer so um, dass µ isoliert ist, so haben wir das Konfidenzintervall für µ gefunden. Die Vorgehensweise zeigt, wie man ein Konfidenzintervall für einen Parameter finden kann. Man benötigt eine Stichprobenfunktion, 1. die von dem unbekannten Parameter abhängt 2. deren Verteilung bekannt ist Um ein Konfidenzintervall für σ 2 aufzustellen, liegt es nahe, von S 2 = 1 n 1 n Xi X 2 i=1 auszugehen, da S 2 eine erwartungstreue Schätzfunktion von σ 2 ist. Multipliziert man S 2 mit n 1 und dividiert die so gewonnene Größe durch σ 2,so erhält man n 1 S 2 39 σ 2 Die Zufallsvariable in Gleichung 39 genügt den Anfoderungen 1 und 2. Sie hängt von σ 2 ab und ist χ 2 -verteilt mit n 1 Freiheitsgraden. Dies zeigen Mood et al auf den Seiten Somit gilt P χ 2n 1,α/2 n 1 S2 σ 2 χ 2 n 1,1 α/2 =1 α 40 Dabei sind χ 2 n 1,α/2 das α/2-quantil und χ2 n 1,1 α/2 χ 2 -Verteilung mit n 1 Freiheitsgraden. das 1 α/2-quantil der 17
18 Wir formen den Ausdruck in der Klammer in Gleichung 40 so um, dass σ 2 isoliert ist. χ 2 n 1,α/2 n 1 S2 σ 2 χ 2 n 1,1 α/2 1 χ 2 n 1,α/2 σ 2 n 1 S 1 2 χ 2 n 1,1 α/2 n 1 S2 χ 2 n 1,1 α/2 σ 2 n 1 S2 χ 2 n 1,α/2 Das Konfidenzintervall für σ 2 bei Normalverteilung ist also: [ ] n 1 S 2 n 1 S2, χ 2 n 1,1 α/2 χ 2 n 1,α/2 41 Beispiel 1 fortgesetzt von Seite 16 Wir unterstellen Normalverteilung und stellen das Konfidenzintervall für σ 2 zum Konfidenzniveau 0.95 auf. Es gilt s 2 = Der Tabelle der χ 2 -Verteilung entnehmen wir χ 2 8;0.025 = 2.18 und χ 2 8;0.975 = Wir erhalten also folgendes Konfidenzintervall [ , ] 2.2 Prognoseintervalle Sind die Parameter µ und σ 2 bekannt, so ist das zentrale Schwankungsintervall ein Prognoseintervall, denn es gilt [µ z 1 α/2 σ, µ + z 1 α/2 σ] 42 P µ z 1 α/2 σ X µ + z 1 α/2 σ=1 α In der Regel sind µ und σ 2 aber unbekannt. Es liegt nahe, diese zu schätzen und die Schätzwerte in die Gleichung 42 einzusetzen. Dies ist aber nur für sehr große Stichprobenumfänge sinnvoll. Für kleine Stichprobenumfänge hingegen ist das exakte Prognoseintervall bei Normalverteilung gegeben durch [ x t n 1;1 α/2 s 1+1/n, x + t n 1;1 α/2 s 1+1/n] 43 18
19 Dabei ist t n 1;1 α/2 das 1 α/2-quantil der t-verteilung mit n 1 Freiheitsgraden. Schauen wir uns ein Beispiel an, bevor wir zeigen, wie man dieses Intervall gewinnt. Beispiel 1 fortgesetzt von Seite 18 Der Arbeitnehmer sucht ein Prognoseintervall für die Fahrzeit des nächsten Tages zur sicherheit Es gilt n = 9, x = 1800 und s = Mit t 8;0.975 =2.306 erhalten wir folgendes Prognoseintervall [1470.9, ] Um das Intervall herzuleiten, fragen wir uns zunächst, wie wir den Wert von X n+1 prognostizieren sollen. Da er möglichst nahe an allen Beobachtungen liegen sollte, bieten sich zwei Kriterien an. Wählt man als Maß für die Nähe, die euklidische Distanz, so erhält man folgendes Kriterium n min x i x n+1 44 i=1 Die quadrierte euklidische Distanz liefert n min x i x n i=1 Im ersten Fall prognostiziert man x n+1 durch den Median, im zweiten Fall durch den Mittelwert der Beobachtungen. Da die Verteilung des Mittelwerts angegeben werden kann, verwenden wir diesen. Als Ausgangspunkt der Konstruktion des Prognoseintervalls wählen wir X n+1 X. Wir gehen im Folgenden davon aus, dass die Zufallsvariablen X 1,...,X n,x n+1 unabhängig und identisch mit den Parametern µ und σ 2 normalverteilt sind. Unter diesen Annahmen gilt und EX n+1 X =EX n+1 E X =µ µ =0 VarX n+1 X =VarX n+1 +Var X =σ 2 + σ2 n = σ /n Außerdem ist X n+1 X normalverteilt. Also ist X n+1 X σ 1+1/n 46 19
20 standardnormalverteilt. Schätzen wir σ durch S und setzen es in Gleichung 46 ein, so erhalten wir folgende mit n 1 Freiheitsgraden t-verteilte Zufallsvariable X n+1 X Es gilt also [ P t n 1;1 α/2 S 1+1/n X n+1 X ] S 1+1/n t n 1;1 α/2 =1 α 47 Formen wir diesen Ausdruck so um, dass zwischen den Ungleichungen X n+1 steht, so erhalten wir das Prognoseintervall in Gleichung 43: t n 1;1 α/2 X n+1 X S 1+1/n t n 1;1 α/2 t n 1;1 α/2 S 1+1/n X n+1 X t n 1;1 α/2 S 1+1/n X t n 1;1 α/2 S 1+1/n X n+1 X + t n 1;1 α/2 S 1+1/n Da ein Konfidenzintervall ein Intervall für den Wert eines Parameters und ein Prognoseintervall ein Intervall für eine Realisation einer Zufallsvariablen ist, ist die Aussage beim Prognoseintervall mit größerer Unsicherheit behaftet. Dies zeigt sich in der größeren Länge des Prognoseintervalls. Die Länge des Konfidenzintervalls für µ ist nämlich L =2t n 1;1 α/2 s 1/n Die Länge des Prognoseintervalls beträgt Da gilt L =2t n 1;1 α/2 s 1+1/n 1+ 1 n > 1 n gilt auch 1+ 1 n > 1 n Die Länge des Konfidenzintervalls konvergiert gegen 0, während die Länge des Prognoseintervalls gegen die Länge des zentralen Schwankungsintervalls konvergiert. 20
21 Oft sucht man einseitige Prognoseintervalle. Man will also wissen, welchen Wert die nächste Beobachtung mindestens oder höchsten annimmt. Bei Normalverteilung gibt es folgende einseitige Prognoseintervalle [ x t n 1;1 α s 1+1/n, 48, x + t n 1;1 α s 1+1/n] 49 Dabei ist t n 1;1 α das 1 α-quantil der t-verteilung mit n 1 Freiheitsgraden. Beispiel 1 fortgesetzt von Seite 19 Der Arbeitnehmer will wissen, welchen Wert seine Fahrzeit am nächsten Tag nicht überschreiten wird. Er stellt ein einseitiges Prognoseintervall zur Sicherheit 0.95 auf. Es gilt n =9, x = 1800 und s = Mit t 8;0.95 =1.86 erhalten wir folgendes Prognoseintervall, ] Will er wissen, welchen Wert seine Fahrzeit am nächsten Tag überschreiten wird, so erhält er folgendes einseitige Prognoseintervall zur Sicherheit 0.95: [1534.6, 2.3 Toleranzintervalle Sind die Parameter µ und σ 2 unbekannt, so ist das zweiseitige Toleranzintervall bei Normalverteilung gegeben durch [ x q 1 α,p,n s, x + q 1 α,p,n s] 50 Dabei gilt n 1 q 1 α,p,n = r χ 2 α,n 1 51 mit 1 1 Φ n + r Φ n r = p 52 Dabei ist χ 2 α,n 1 das α-quantil der χ 2 -Verteilung mit n 1 Freiheitsgraden und Φz der Wert der Verteilungsfunktion der Standardnormalverteilung an der Stelle z. 21
22 Die Gleichungen 51 und 52 werden von Kendall et al auf den Seiten hergeleitet. Tabellen für q 1 α,p,n sind bei Hahn and Meeker 1991, Rinne 1997 und auf den Seiten 26 und 27 zu finden. Wir können q 1 α,p,n aber auch numerisch bestimmen. Hierzu müssen wir zuerst den Wert von r bestimmen, der die Gleichung 52 erfüllt. Lösen wir die Gleichung 52 nach 0 auf, so erhalten wir 1 1 Φ n + r Φ n r p =0 Wir suchen also die Nullstelle von 1 fr =Φ n + r 1 Φ n r p Ein numerisches Verfahren ist das Newton-Raphson-Verfahren. Ist die Nullstelle der Funktion fr gesucht, so iteriert man hier beginnend mit dem Startwert r 0 r n = r n 1 fr n 1 53 f r n 1 für n =1, 1,... so lange, bis r n sich stabilisiert. Als Startwert r 0 kann man den Wert von r wählen, der für n die Gleichung 52 erfüllt. Für gegebenes p wird der Wert r 0 gesucht mit Wegen muss also gelten Somit folgt Mit Φr 0 Φ r 0 =p Φ r 0 =1 Φr 0 2Φr 0 1=p p +1 r 0 =Φ f r =φ n + r + φ n r können wir die Iteration aus Gleichung 53 auf Seite 22 also durchführen. Dabei gilt φz = z2 e 2 π 22
23 Beispiel 1 fortgesetzt von Seit 21 Der Arbeitnehmer will wissen, in welchem Intervall mindestens 90 Prozent der Fahrzeiten mit einer Wahrscheinlichkeit von 0.95 liegen. Es gilt also p =0.9 und 1 α =0.95. Wir bestimmen zunächst r. Es gilt Somit gilt r 1 = r 0 =Φ =Φ = Φ Φ π e 0.51/ π e 0.51/ Φ1.98 Φ = π e 0.51/ π e 0.51/ = = =1.728 Ausgehend von r 1 bestimmen wir r 2 und erhalten r 2 = Auch r 3 ist gleich Wir können also q 0.95,0.9,9 bestimmen. Mit χ ,8 = gilt q 0.95,0.9,9 = =2.967 Dieser Wert stimmt mit den Werten in den Tabellen in Hahn and Meeker 1991 und Rinne 1997 überein. Mit x = 1800 und s = erhalten wir folgendes Toleranzintervall [1398.3, ] Wir können auch einseitige Toleranzintervalle bestimmen: [ x w 1 α,p,n s, 54, x + w 1 α,p,n s] 55 Die Werte von w ue 1 α,p,n sind bei Hahn and Meeker 1991 und Rinne 1997 tabelliert. 23
24 Literatur Bickel, P. J. and Doksum, K. A Mathematical statistics. Prentice Hall, Upper Saddle River, NJ, 2 edition. Conover, W. J Practical nonparametric statistics. Wiley, New York, 3edition. Gossett, W. S The probable error of a mean. Biometrika, 6:1 25. Hahn, G. J Statistical intervals for a normal population: part 1, tables, examples, and applications. Journal of Quality Technology, 2: Hahn, G. J. and Meeker, W. Q Statistical intervals : a guide for practitioners. Wiley, New York, 1 edition. Kendall, M. G., Stuart, A., and Ord, J. K The advanced theory of statistics., volume 2 Classical inference and relationship. Arnold, London, 5edition. Mood, A. M., Graybill, F. A., and Boes, D. C Introduction to the theory of statistics. McGraw-Hill, New York. Randles, R. H. and Wolfe, D. A Introduction to the theory of nonparametric statistics. Wiley, New York, 1 edition. Rinne, H Taschenbuch der Statistik. Deutsch, Thun, 2 edition. 24
25 A Die simulierten Daten Tabelle 1: 20 Stichproben vom Umfang n = 9 aus der Standardnormalverteilung Stichprobe standardnormalverteilte Zufallszahlenn
26 B Tabellen Tabelle 2: Werte von q 0.95,p,n für p =0.9, 0.95, 0.99 und n =2, 3,...,20 n p
27 Tabelle 3: Werte von q 0.99,p,n für p =0.9, 0.95, 0.99 und n =2, 3,...,20 n p
28 Tabelle 4: Verteilungsfunktion Φz der Standardnormalverteilung z
29 Tabelle 5: Quantil z p der Standardnormalverteilung p
30 Tabelle 6: Quantil z p der Standardnormalverteilung p
31 Tabelle 7: Quantile der χ 2 -Verteilung mit k Freiheitsgraden k χ 2 k;0.025 χ 2 k;0.05 χ 2 k;0.1 χ 2 k;0.9 χ 2 k;0.95 χ 2 k;
5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
Mathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 9. Dezember 2010 1 Konfidenzintervalle Idee Schätzung eines Konfidenzintervalls mit der 3-sigma-Regel Grundlagen
Willkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
ETWR Teil B. Spezielle Wahrscheinlichkeitsverteilungen (stetig)
ETWR Teil B 2 Ziele Bisher (eindimensionale, mehrdimensionale) Zufallsvariablen besprochen Lageparameter von Zufallsvariablen besprochen Übertragung des gelernten auf diskrete Verteilungen Ziel des Kapitels
1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung
0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau
Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Tabelle 11.2 zeigt die gemeinsame Wahrscheinlichkeitsfunktion und die Randverteilungen
Kapitel 11 Stichprobenfunktionen Um eine Aussage über den Wert eines unbekannten Parameters θ zu machen, zieht man eine Zufallsstichprobe vom Umfang n aus der Grundgesamtheit. Das Merkmal wird in diesem
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
1 Dichte- und Verteilungsfunktion
Tutorium Yannick Schrör Klausurvorbereitungsaufgaben Statistik Lösungen [email protected] 9.2.26 ID /455 Dichte- und Verteilungsfunktion Ein tüchtiger Professor lässt jährlich 2 Bücher drucken. Die
Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Gleichmäßig beste unverfälschte Tests und Tests zur Normalverteilung Induktive Statistik Prof. Dr. W.-D.
Klausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
Definition Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) :=
Definition 2.34. Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f. Dann heißt E(X) := x f(x)dx der Erwartungswert von X, sofern dieses Integral existiert. Entsprechend wird die Varianz V(X)
Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
Statistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
Einführung in die Maximum Likelihood Methodik
in die Maximum Likelihood Methodik Thushyanthan Baskaran [email protected] Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood
8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
Statistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Statistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 3.1 3.1 Punktschätzer für Mittelwert µ und Varianz σ 2 Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden
Klausur Stochastik und Statistik 31. Juli 2012
Klausur Stochastik und Statistik 31. Juli 2012 Prof. Dr. Matthias Schmid Institut für Statistik, LMU München Wichtig: ˆ Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf
2 Aufgaben aus [Teschl, Band 2]
20 2 Aufgaben aus [Teschl, Band 2] 2.1 Kap. 25: Beschreibende Statistik 25.3 Übungsaufgabe 25.3 a i. Arithmetisches Mittel: 10.5 ii. Median: 10.4 iii. Quartile: x 0.25 Y 4 10.1, x 0.75 Y 12 11.1 iv. Varianz:
Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung
Kapitel 2 Wahrscheinlichkeitsrechnung
Definition 2.77: Normalverteilung & Standardnormalverteilung Es sei µ R und 0 < σ 2 R. Besitzt eine stetige Zufallsvariable X die Dichte f(x) = 1 2 πσ 2 e 1 2 ( x µ σ ) 2, x R, so heißt X normalverteilt
Kapitel 12 Stetige Zufallsvariablen Dichtefunktion und Verteilungsfunktion. stetig. Verteilungsfunktion
Kapitel 12 Stetige Zufallsvariablen 12.1. Dichtefunktion und Verteilungsfunktion stetig Verteilungsfunktion Trägermenge T, also die Menge der möglichen Realisationen, ist durch ein Intervall gegeben Häufig
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
Statistik. R. Frühwirth Teil 1: Deskriptive Statistik. Statistik. Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und
Übersicht über die Vorlesung Teil : Deskriptive [email protected] VO 42.090 http://tinyurl.com/tu42090 Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable und Verteilungen Februar 200 Teil 4:
Auswahl von Schätzfunktionen
Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung
die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen
Kapitel 8 Schätzung von Parametern 8.1 Schätzmethoden Gegeben seien Beobachtungen Ü Ü ¾ Ü Ò die wir als Realisationen von unabhängig und identisch verteilten Zufallsvariablen ¾ Ò auffassen. Die Verteilung
Biostatistik, Winter 2011/12
Biostatistik, Winter 2011/12 / Übungsaufgaben Prof. Dr. Achim Klenke http://www.aklenke.de 13. Vorlesung: 10.02.2012 1/51 Aufgabe 1 Aufgabenstellung Übungsaufgaben Ein Pharmakonzern möchte ein neues Schlankheitsmedikament
Dipl.-Volksw. Markus Pullen Wintersemester 2012/13
Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel
Kapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
k np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
Kapitel 5. Univariate Zufallsvariablen. 5.1 Diskrete Zufallsvariablen
Kapitel 5 Univariate Zufallsvariablen Im ersten Teil dieses Skriptes haben wir uns mit Daten beschäftigt und gezeigt, wie man die Verteilung eines Merkmals beschreiben kann. Ist man nur an der Population
1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
Kapitel 13. Grundbegriffe statistischer Tests
Kapitel 13 Grundbegriffe statistischer Tests Oft hat man eine Vermutung über die Verteilung einer Zufallsvariablen X. Diese Vermutung formuliert man als Hypothese H 0.Sokönnte man daran interessiert sein
Demokurs. Modul Grundlagen der Wirtschaftsmathematik Grundlagen der Statistik
Demokurs Modul 31101 Grundlagen der Wirtschaftsmathematik und Statistik Kurs 40601 Grundlagen der Statistik 13. Juli 2010 KE 1 2.4 Schiefe und Wölbung einer Verteilung Seite: 53 2.4 Schiefe und Wölbung
Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
Kapitel XI - Operationscharakteristik und Gütefunktion
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XI - Operationscharakteristik und Gütefunktion Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo
Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung
Statistik 2 RE Statistik f. Soziologen Klausur MÄRZ 2009 LÖSUNGSVORSCHLAG
1. Familie Feuerstein kauft sich ein neues Auto, vorher aber lassen sie ihr altes verschrotten. Auf dem Weg dorthin werden sie in einer Wohnstrasse, wo nur 30 km/h erlaubt sind, geblitzt. Als sie ihre
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
Statistik 2 für SoziologInnen. Normalverteilung. Univ.Prof. Dr. Marcus Hudec. Themen dieses Kapitels sind:
Statistik 2 für SoziologInnen Normalverteilung Univ.Prof. Dr. Marcus Hudec Statistik 2 für SoziologInnen 1 Normalverteilung Inhalte Themen dieses Kapitels sind: Das Konzept stetiger Zufallsvariablen Die
Übungsaufgaben zu Statistik II
Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben
1 Stochastische Konvergenz 2. 2 Das Gesetz der grossen Zahlen 4. 3 Der Satz von Bernoulli 6
Wirtschaftswissenschaftliches Zentrum 0 Universität Basel Mathematik Dr. Thomas Zehrt Grenzwertsätze Benötigtes Vorwissen: Der Stoff der Vorlesung,,Statistik wird als bekannt vorausgesetzt, insbesondere
Hypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
TECHNISCHE UNIVERSITÄT DORTMUND Wintersemester 2010/2011 FAKULTÄT STATISTIK Dr. H. Hansen
TECHNISCHE UNIVERSITÄT DORTMUND Wintersemester 2010/2011 FAKULTÄT STATISTIK 11.02.2011 Dr. H. Hansen Klausur für den Bachelorstudiengang zur Vorlesung Statistik für Ökonomen Bitte in Druckschrift ausfüllen
Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
3 Konfidenzintervalle
3 Konfidenzintervalle Konfidenzintervalle sind das Ergebnis von Intervallschätzungen. Sicheres Wissen über Grundgesamtheiten kann man anhand von Stichproben nicht gewinnen. Aber mit Hilfe der Statistik
Vertiefung der. Wirtschaftsmathematik. und Statistik (Teil Statistik)
Selbstkontrollarbeit 1 Vertiefung der Wirtschaftsmathematik und Statistik (Teil Statistik) 18. Januar 2011 Aufgaben Aufgabe 1 Gegeben sei eine binomialverteilte Zufallsvariablen X mit den Parametern N
Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK)
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK (STOCHASTIK) für Studierende des Maschinenbaus vom 7. Juli (Dauer: 8 Minuten) Übersicht über die
Numerische Methoden und Algorithmen in der Physik
Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate
Einführung in die (induktive) Statistik
Einführung in die (induktive) Statistik Typische Fragestellung der Statistik: Auf Grund einer Problemmodellierung sind wir interessiert an: Zufallsexperiment beschrieben durch ZV X. Problem: Verteilung
Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests
Kapitel 10 Mittelwert-Tests 10.1 Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests 10.1 Einstichproben- Mittelwert-Tests 10.1.1 Einstichproben- Gauß-Test Dichtefunktion der Standard-Normalverteilung
Wahrscheinlichkeitstheorie und Statistik vom
INSTITUT FÜR STOCHASTIK SS 2007 UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Dipl.-Math. oec. W. Lao Klausur (Maschineningenieure) Wahrscheinlichkeitstheorie und Statistik vom 2.9.2007 Musterlösungen
Statistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
10. Die Normalverteilungsannahme
10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man
Regression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
Einführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen
Einführung in die Stochastik für Informatiker Übungsaufgaben mit Lösungen David Geier und Sven Middelberg RWTH Aachen, Sommersemester 27 Inhaltsverzeichnis Information 2 Aufgabe 4 Aufgabe 2 6 4 Aufgabe
7.5 Erwartungswert, Varianz
7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k
Mathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
Zufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
Übung 1: Wiederholung Wahrscheinlichkeitstheorie
Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable
Zusammenfassung Mathe II. Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen
Zusammenfassung Mathe II Themenschwerpunkt 2: Stochastik (ean) 1. Ein- und mehrstufige Zufallsexperimente; Ergebnismengen Zufallsexperiment: Ein Vorgang, bei dem mindestens zwei Ereignisse möglich sind
Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1
Biometrie und Methodik (Statistik) - WiSem08/09 Probeklausur 1 Aufgabe 1 (10 Punkte). 10 Schüler der zehnten Klasse unterziehen sich zur Vorbereitung auf die Abschlussprüfung einem Mathematiktrainingsprogramm.
Grundgesamtheit und Stichprobe
Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U
Mathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 8. Dezember 2010 Teil V Schließende Statistik 1 Parameterschätzung Erwartungstreue und Konsistenz Maximum-Likelihood
Einführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
Grundlagen der Statistik
Grundlagen der Statistik Übung 15 009 FernUniversität in Hagen Alle Rechte vorbehalten Fachbereich Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe
6. Stochastische Modelle II: Stetige Wahrscheinlichkeitsverteilungen, insbesondere Normalverteilungen
6. Stochastische Modelle II: Stetige Wahrscheinlichkeitsverteilungen, insbesondere Normalverteilungen Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher: Diskrete Zufallsvariablen,
1 Erwartungswert und Kovarianzmatrix von Zufallsvektoren
Erwartungswert und Kovarianzmatrix von Zufallsvektoren Erwartungswert und Kovarianzmatrix von Zufallsvektoren. Definition Ist X X,...,X p ein p-dimensionaler Zufallsvektor mit E X j < für alle j, so heißt
Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am von 10:00 bis 11:00 Uhr
Klausur (Modulprüfung) zum Lehrerweiterbildungskurs Stochastik am 5..201 von 10:00 bis 11:00 Uhr Bearbeiten Sie zwei der drei folgenden Aufgaben! Sätze aus der Vorlesung und den Übungen dürfen Sie ohne
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
9 Die Normalverteilung
9 Die Normalverteilung Dichte: f(x) = 1 2πσ e (x µ)2 /2σ 2, µ R,σ > 0 9.1 Standard-Normalverteilung µ = 0, σ 2 = 1 ϕ(x) = 1 2π e x2 /2 Dichte Φ(x) = 1 x 2π e t2 /2 dt Verteilungsfunktion 331 W.Kössler,
Schätzer und Konfidenzintervalle
Kapitel 2 Schätzer und Konfidenzintervalle Bisher haben wir eine mathematische Theorie entwickelt, die es uns erlaubt, gewisse zufällige Phänomene zu modellieren. Zum Beispiel modellieren wir die Anzahl
9. Schätzen und Testen bei unbekannter Varianz
9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,
- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
3.3 Methoden zur Evaluierung von Schätzern
3.3 Methoden zur Evaluierung von Schätzern Bis jetzt haben wir nur glaubwürdige Techniken zur Konstruktion von Punktschätzern besprochen. Falls unterschiedliche Schätzer für einen Parameter resultieren,
1.6 Der Vorzeichentest
.6 Der Vorzeichentest In diesem Kapitel soll der Vorzeichentest bzw. Zeichentest vorgestellt werden, mit dem man Hypothesen bezüglich des Medians der unabhängig und identisch stetig verteilten Zufallsvariablen
Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XIII - p-wert und Beziehung zwischen Tests und Konfidenzintervallen Induktive Statistik Prof. Dr. W.-D. Heller
Allgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
Wahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen
Wahrscheinlichkeitstheorie Kapitel V - Stetige Verteilungen Georg Bol [email protected] Markus Höchstötter [email protected] Stetige Verteilungen Definition: Sei
Grundgesamtheit und Stichprobe
Grundgesamtheit und Stichprobe Definition 1 Die Menge der Untersuchungseinheiten {U 1,U 2,...,U N } heißt Grundgesamtheit. Die Anzahl N der Einheiten ist der Umfang der Grundgesamtheit. Jeder Einheit U
b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!
Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies
I. Deskriptive Statistik 1
I. Deskriptive Statistik 1 1. Einführung 3 1.1. Grundgesamtheit und Stichprobe.................. 5 1.2. Merkmale und Verteilungen..................... 6 1.3. Tabellen und Grafiken........................
Stetige Verteilungen. A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch
6 Stetige Verteilungen 1 Kapitel 6: Stetige Verteilungen A: Beispiele Beispiel 1: a) In den folgenden Abbildungen sind die Dichtefunktionen von drei bekannten Verteilungen graphisch dargestellt. 0.2 6
Statistik III. Walter Zucchini Fred Böker Andreas Stadie
Statistik III Walter Zucchini Fred Böker Andreas Stadie Inhaltsverzeichnis 1 Zufallsvariablen und ihre Verteilung 1 1.1 Diskrete Zufallsvariablen........................... 1 1.2 Stetige Zufallsvariablen............................
Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK. für Studierende der INFORMATIK
Institut für Stochastik Prof. Dr. Daniel Hug Name: Vorname: Matr.-Nr.: Klausur zum Fach GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK Datum: 08. Februar 0 Dauer:
