2 Einführung in die mathematische Statistik

Ähnliche Dokumente
Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Tests statistischer Hypothesen

4 Schwankungsintervalle Schwankungsintervalle 4.2

X X Schätzen von Vertrauensintervallen Schwankungsintervall

Kapitel 5: Schließende Statistik

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Wirksamkeit, Effizienz

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Parameterschätzung. Kapitel Schätzfunktionen

Schätzen von Populationswerten

Schätzen von Populationswerten

Empirische Verteilungsfunktion

Eingangsprüfung Stochastik,

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

X in einer Grundgesamtheit vollständig beschreiben.

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Testen statistischer Hypothesen

Statistische Modelle und Parameterschätzung

TESTEN VON HYPOTHESEN

Kapitel 9: Schätzungen

Statistik und Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitstheorie und Statistik vom

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Induktive Schlussweise. Schätzfunktionen und Schätzverfahren. Bibliografie

Einführung in die Stochastik 10. Übungsblatt

10. Intervallschätzung 10.1 Begriff des Konfidenzintervalls

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Statistische Tests zu ausgewählten Problemen

Übungsblatt 9 zur Vorlesung. Statistische Methoden

10. Übungsblatt zur Einführung in die Stochastik

Konfidenzintervalle. Praktische Übung Stochastik SS 2017 Lektion 10 1

KAPITEL 7. Zahlenfolgen. 7.1 Konvergente Zahlenfolgen Grenzwertbestimmung Grenzwertbestimmung durch Abschätzung...

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

11 Likelihoodquotiententests

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Übungen zu QM III Mindeststichprobenumfang

Maximum Likelihood Version 1.6

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

Nennenswertes zur Stetigkeit

Kapitel 11 DIE NORMAL-VERTEILUNG

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

Methoden zur Konstruktion von Schätzern

Kapitel 6: Statistische Qualitätskontrolle

5.4.2 Die empirische Verteilungsfunktion als Ausgangspunkt

$Id: reihen.tex,v /06/14 13:59:06 hk Exp $

Erläuterung Beispiel III

KAPITEL 2. Zahlenfolgen

Wallis-Produkt, Gammafunktion und n-dimensionale Kugeln

Tests für beliebige Zufallsvariable

6. Übung - Differenzengleichungen

Klausur zu,,einführung in die Wahrscheinlichkeitstheorie. Musterlösungen

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2015/2016. Aufgabe 1

Logarithmusfunktion, Rechenregeln für Logarithmen, Ableiten von Logarithmen (die Ableitung nach p wird hier stets als p geschrieben)

Maximum-Likelihood-Methode (ML-Methode)

4 Konvergenz von Folgen

Aufgaben zu Kapitel 40

Übungen mit dem Applet erwartungstreu

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Einstichprobentests für das arithmetische Mittel

Zinsratenmodelle in stetiger Zeit: Teil II

Konfidenzintervall_fuer_pi.doc Seite 1 von 6. Konfidenzintervall für den Anteilswert π am Beispiel einer Meinungsumfrage

4.1 Dezimalzahlen und Intervallschachtelungen. a) Reelle Zahlen werden meist als Dezimalzahlen dargestellt, etwa

Methode der kleinsten Quadrate

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Bei 95%iger Konfidenz wäre der Mittelwert der GG zwischen 1421,17DM und 1778,83DM zu erwarten.

3. Einführung in die Statistik

Analysis I Lösungsvorschläge zum 3. Übungsblatt Abgabe: Bis Donnerstag, den , um 11:30 Uhr

TECHNISCHE UNIVERSITÄT MÜNCHEN

6. Übungsblatt Aufgaben mit Lösungen + Selbsttest-Auflösung

Stochastisches Integral

Zahlenfolgen und Konvergenzkriterien

Wir wiederholen zunächst das Majorantenkriterium aus Satz des Vorlesungsskripts Analysis von W. Kimmerle und M. Stroppel.

Klausur vom

Wahrscheinlichkeitsrechnung & Statistik - Ergänzung zum Skript

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

(4) = 37,7 % mit 37,7 % Wahrscheinlichkeit sind es höchstens 4 Fahrräder, das ist recht hoch; man kann also die Behauptung nicht wirklich ablehnen.

Übungsrunde 12, Gruppe 2 LVA , Übungsrunde 12, Gruppe 2, Markus Nemetz, TU Wien,

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

Das kollektive Risikomodell. 12. Mai 2009

Evaluation & Forschungsstrategien

Prof. Dr. Roland Füss Statistik II SS 2008

D-MATH Topologie FS 15 Theo Bühler. Musterlösung 2

Übungsblatt 5 zur Vorlesung. Statistische Methoden

2.3 Kontingenztafeln und Chi-Quadrat-Test

Angewandte Stochastik II

Analysis ZAHLENFOLGEN Teil 4 : Monotonie

Kapitel 3: Bedingte Wahrscheinlichkeiten und Unabhängigkeit

Teil II Zählstatistik

Normalverteilung. Standardnormalverteilung. Intervallwahrscheinlichkeiten. Verteilungsfunktion

Stochastik I (Statistik)

Tests statistischer Hypothesen

Bayessches Lernen (II)

1. Einführung. 1 A (T (x 1,..., x n )) P θ (dx 1 )... P θ (dx n ) X. P θ {T n (X 1,..., X n ) A} =

Tutorial zum Grenzwert reeller Zahlenfolgen

Transkript:

2 Eiführug i die mathematische Statistik Die Hauptaufgabe der mathematische Statistik ist es, ahad der Eigeschafte eies Teils eier Mege vo Objekte auf die Eigeschafte aller Objekte i dieser Mege zu schließe. Diese Objekte köe zum Beispiel Glühlampe sei ud wir betrachte dere Lebesdauer. Jeder Glühlampehersteller möchte atürlich wisse, wie lag seie Glühlampe bree. Um dies exakt herauszubekomme, müsste ma die Lebesdauer jeder Lampe bestimme. Auf Grud der hohe Azahl (z.b. Tagesproduktio), aber auch weil die Glühlampe dabei zerstört werde, ist dies icht möglich. Stattdesse wählt ma zufällig eiige Glühlampe aus ud schließt aus dere Bredauer mit Hilfe der Methode der mathematische Statistik auf die durchschittliche Lebesdauer. Weiter ute werde wir dieses Beispiel geauer betrachte. 2.1 Grudbegriffe Grudgesamtheit: Eie Mege vo gleichartige Objekte, die hisichtlich eier bestimmte Eigeschaft utersucht werde solle, ee wir Grudgesamtheit. Diese Eigeschaft beschreibe wir dabei durch eie Zufallsgröße X. Die Verteilugsfuktio vo X bezeiche wir mit F ϑ, d.h. F ϑ (x) = P(X < x), wobei ϑ für eie oder mehrere och zu bestimmede Parameter der Verteilug steht. Stichprobe: Seie X 1,...,X Realisieruge der Zufallsgröße X, d.h. X 1,...,X ud X sid uabhägig ud weise idetische Verteiluge auf, kurz: sie sid vom Typ i.i.d. Da bezeiche wir de Zufallige Vektor (X 1,...,X ) als Stichprobe vom Umfag. Auch ei kokreter Wert (x 1,...,x ) R dieses Vektors wird als (kokrete) Stichprobe bezeichet. Stichproberaum: Sei (X 1,...,X ) eie Stichprobe vom Umfag. Da bezeiche wir mit X die Mege aller mögliche Werte dieses zufällige Vektors. Diese Mege heißt Stichproberaum ud es gilt X R. Parameterraum: Die Mege aller mögliche Parameterwerte ϑ der Verteilugsfuktio F ϑ der Zufallsgröße X heißt Parameterraum ud wird mit Θ bezeichet. Stichprobefuktio: Eie Fuktio T : X R heißt Stichprobefuktio. Es hadelt sich also um eie Fuktio, die eier kokrete Stichprobe eie reelle Zahl T (x 1,...,x ) zuordet. Beispiel. Nachdem wir u die grudlegede Begriffe der mathematische Statistik kee, wolle wir ochmals auf das obige Beispiel der Glühlampeproduktio eigehe. Als Grudgesamtheit betrachte wir die a eiem feste Tag hergestellte Glühlampe. Dere zufällige Lebesdauer bezeiche wir mit X. Us iteressiert u, wie die Lebesdauer der Lampe verteilt ist, d.h. wir suche die Verteilugsfuktio F ϑ vo X. Dazu wähle wir zufällig Glühlampe aus ud bestimme dere Lebesdauer, wir etehme also eie Stichprobe (X 1,...,X ) vom 56

Umfag. Der Stichproberaum X umfasst somit alle -dimesioale Vektore mit ichtegative Kompoete. Ist die Art der Verteilug bekat (z.b. X N(µ,σ 2 ) ud somit ϑ = (µ,σ 2 ) Θ = R R), köe wir de Parameter mit Hilfe eier kokrete Stichprobe (x 1,...,x ) schätze. Wie dies geau fuktioiert, behadel wir weiter ute. Beispiel. Als weiteres eiführedes Beispiel betrachte wir aalog zum obige Beispiel die Produktio vo elektrische Sicheruge. Als Grudgesamtheit wähle wir die Tagesproduktio ud utersuche die Zufallsgröße { 1, Sicherug defekt X = 0, Sicherug fuktioiert, dere Verteilugsfuktio F ϑ gesucht ist. X B(1,p) ist eie biomialverteilte Zufallsgröße mit dem Parameter ϑ = p Θ = (0,1), wobei p die Wahrscheilichkeit für eie Defekt agibt. Es ist also P(X = 1) = p ud P(X = 0) = 1 p. Als Stichproberaum erhalte wir X = { (x 1,...,x ) R : x i = 1 x i = 0 }. Ei Beispiel für eie Stichprobefuktio ist das arithmetische Mittel X = 1 (X 1+ +X ). Im folgede Bezeiche wir mit ˆϑ de Schätzwert eies Parameters ϑ. Um die Parameter eier Verteilug zu schätze, gibt es zwei grudlegede Heragehesweise, die wir i de folgede Abschitte behadel werde: Puktschätzug: Aus eier Stichprobe (x 1,...,x ) wird ei kokreter Wert ˆϑ für de Parameter ϑ berechet. Bereichsschätzug: Aus eier Stichprobe (x 1,...,x ) werde zwei Zahle U(x 1,...,x ) ud O(x 1,...,x ) berechet, so dass für ei kleies gegebees α der wirkliche Parameter ϑ mit eier Wahrscheilichkeit vo 1 α im Itervall [U(x 1,...,x ),O(x 1,...,x )], dem sogeate Kofidez- oder Vertrauesitervall, liegt. 2.2 Puktschätzug Eie Stichprobefuktioe T : X Θ mit Werte im Parameterraum bezeiche wir als Schätzfuktio. Ziel der Puktschätzug ist es, auf Grudlage eier solche Schätzfuktio für de ubekate Parameter ϑ Θ der Grudgesamtheit (geauer: der Verteilugsfuktio der i Zusammehag mit der Grudgesamtheit betrachtete Zufallsgröße X) eie möglichst gute Schätzwert ˆϑ = T (X 1,...,X ) zu bestimme. Wa eie Schätzug gut ist, müsse wir och äher utersuche. Häufig wird icht der Parameter ϑ selbst geschätzt, soder eie Fuktio τ(ϑ). Für X N(µ,σ 2 ) ud ϑ = (µ,σ 2 ) köe wir zum Beispiel durch getrete Betrachtug vo µ = τ 1 (ϑ) ud σ 2 = τ 2 (ϑ) die Schätzug i die zwei Schätzprobleme ˆτ 1 (ϑ) ud ˆτ 2 (ϑ) zerlege. Eie Schätzfuktio T für de Parameter ϑ ist als Fuktio der eizele Kompoete X 1,...,X eier Stichprobe (X 1,...,X ) selbst wieder eie Zufallsgröße. Somit köe wir de Erwartugswert ET ud die Variaz D 2 T betrachte. 57

Defiitio 2.2.1. Eie Schätzfuktio T für eie Fuktio τ(ϑ) des ubekate Parameters ϑ heißt erwartugstreu, we für jede Parameterwert ϑ Θ gilt: ET = τ(ϑ). Satz 2.2.2. Existiere i eier Grudgesamtheit X sowohl der Erwartugswert EX als auch die Variaz D 2 X ud ist (X 1,...,X ) eie Stichprobe, so gilt: a) Eie erwartugstreue Schätzfuktio für τ(ϑ) = EX ist X = 1 X i. b) Eie erwartugstreue Schätzfuktio für τ(ϑ) = D 2 X ist Beweis. S 2 = 1 1 (X i X ) 2. a) Es gilt E X = E ( 1 ) X i = 1 EX i = 1 EX = EX = τ(ϑ). b) Für i = 1,..., gilt E(X i X ) 2 = E(X i X (EX EX)) 2 = E(X i X (EX i X )) 2 = E(X i X E(X i X )) 2 = D 2 (X i X ) = D 2 X i 1 2 k=1 D 2 X k = D 2 X 2D2 X = 1 D2 X ud somit ist ( ) ES 2 1 = E (X i 1 X ) 2 = 1 1 E(X i X ) 2 = 1 1 1 D2 X = D 2 X = τ(ϑ). Bei der Kostruktio vo S 2 sid wir davo ausgegage, dass der Erwartugswert EX ubekat ist. Sollte der Erwartugswert µ = EX jedoch bekat sei, so ka ma a Stelle vo S 2 als Schätzfuktio für τ(ϑ) = D 2 X auch V 2 = 1 (X i µ) 2 58

verwede. V 2 ist ebefalls erwartugstreu (Beweis: Übug!). Defiitio 2.2.3. Eie Schätzfuktio T für eie Fuktio τ(ϑ) des ubekate Parameters ϑ heißt kosistet, we für alle ϑ Θ ud beliebig kleies reelles ε > 0 gilt: lim = P( T (X 1,...,X ) ϑ > ε) = 0. Satz 2.2.4. Die Schätzfuktio X für τ(ϑ) = EX ist kosistet. Gilt EX 4 <, so ist auch die Schätzfuktio S 2 für τ(ϑ) = D 2 X kosistet. Bemerkug. Für X folgt die Behauptug umittelbar aus dem Gesetz der große Zahle. Für ormalverteiltes X N(µ,σ 2 ) ist EX 4 < erfüllt. Defiitio 2.2.5. Besitzt die erwartugstreue Schätzfuktio T uter alle erwartugstreue Schätzfuktioe für τ(ϑ) die kleiste Variaz, so heißt T wirksamste Schätzfuktio. Satz 2.2.6. Ist X N(µ,σ 2 ) ormalverteilt, so ist X die wirksamste Schätzfuktio für τ(ϑ) = EX. 2.3 Verteiluge wichtiger Stichprobefuktioe Bevor wir eiige wichtige Stichprobefuktioe betrachte, führe wir zuächst ebe de scho bekate stetige Verteiluge Gleich-, Expoetial- ud Normalverteilug och drei weitere stetige Verteiluge ud de Begriff des Quatils ei. 2.3.1 Quatile Defiitio 2.3.1. Sei X eie stetige Zufallsgröße mit der Dichtefuktio f ud α (0, 1). Da heißt die Zahl q α α-quatil zur Zufallsgröße X, we gilt: q α f(x)dx = α. Bemerkug. α-quatile werde i der Literatur machmal auch als α-fraktile bezeichet. Zudem sid i eiige Bücher ud Tabelle die Größe q α ud q 1 α vertauscht. Beispiel. Für α = 0,5 ist das α-quatil q 0,5 gleich dem Media der Zufallsgröße X, d.h. es gilt P(X < q 0,5 ) = P(X > q 0,5 ). Im Fall eier symmetrische Verteilug liegt der Media auf der Symmetrieachse. Bemerkug. Das α-quatil der Normalverteilug wird mit z α bezeichet. 59

2.3.2 Weitere stetige Verteiluge 2.3.2.1 χ 2 -Verteilug Zur Defiitio der χ 2 -Verteilug (Chi-Quadrat-Verteilug) beötige wir die Gammafuktio Für = 0,1,2,... gilt Γ(+1) =!. Γ(x) = 0 t x 1 e t dt. Defiitio 2.3.2. Besitzt die stetige Zufallsgröße X die Dichtefuktio 0, x 0 f (x) = 1 2 2 Γ( 2 1 e x 2, x > 0, 2 )x so ee wir X χ 2 -verteilt mit Freiheitsgrade oder kurz χ 2 -verteilt ud schreibe X χ 2. f (x) 0 x Bemerkug. Die α-quatile der χ 2 -Verteilug werde mit χ 2,α bezeichet. Die χ 2 -Verteilug wird später bei der Bestimmug der Variaz eier ormalverteilte Zufallsgröße eie wichtige Rolle spiele. 60

2.3.2.2 t-verteilug Defiitio 2.3.3. Besitzt die stetige Zufallsgröße X die Dichtefuktio f (x) = Γ(+1 2 ) Γ( 2 ) π ) +1 (1+ x2 2, so ee wir X t-verteilt mit Freiheitsgrade ud schreibe X t. Die t-verteilug wird auch als Studet-Verteilug 1 bezeichet. f (x) 0 x Bemerkug. Die α-quatile der t-verteilug werde mit t,α bezeichet. Die t-verteilug wird später bei der Bestimmug des Erwartugswertes eier ormalverteilte Zufallsgröße eie wichtige Rolle spiele. 2.3.2.3 F-Verteilug Zur Defiitio der F-Verteilug beötige wir die Betafuktio B(a,b) = Für k,l N gilt B(k,l) = (k 1)!(l 1)! (k+l 1)!. 1 0 t a 1 (1 t) b 1 dt = Γ(a)Γ(b) Γ(a+b). Defiitio 2.3.4. Besitzt die stetige Zufallsgröße X die Dichtefuktio 0, x 0 f m, (x) = ( m ) m2 x m 2 1 ( B( 1+ m m 2, 2 ) x) m+ 2, x > 0, so ee wir X F-verteilt mit de Parameter m ud ud schreibe X F m,. Die F-Verteilug wird auch als Fisher sche Verteilug bezeichet. 1 Diese Verteilug wurde vom Mathematiker Gosset uter dem Pseudoym Studet veröffetlicht 61

f (x) 0 x Bemerkug. Die α-quatile der F-Verteilug werde mit F m,,α bezeichet ud es gilt F m,,α = 1 F m,,1 α. 2.3.3 Stichprobefuktioe bei biomialverteilter Grudgesamtheit Im Folgede sei X B(1,p) eie biomialverteilte Grudgesamtheit ud (X 1,...,X ) eie Stichprobe. X i ud X sid also Zufallsgröße vom Typ i.i.d. für i = 1,...,. Da gilt T (0) = X i B(,p) ud für hireiched großes ist ach dem Grezverteilugssatz vo Moivre/Laplace T (0) N(p, p(1 p)) ud somit T (1) = X = 1 Durch Stadardisierug vo T (1) erhalte wir ( X i N p, p(1 p) ). T (2) = X p p(1 p) N(0,1). 2.3.4 Stichprobefuktioe bei ormalverteilter Grudgesamtheit Sei X N(µ,σ 2 ) eie ormalverteilte Grudgesamtheit ud (X 1,...,X ) eie Stichprobe. X i ud X sid also Zufallsgröße vom Typ i.i.d. für i = 1,...,. Da gilt X = 1 ud durch Stadardisierug erhalte wir T (3) ) X i N (µ, σ2 = X µ N(0,1). σ 62

Weiter gilt ud Mit S = S 2 ist T (5) = 1 σ 2 T (4) = 1 σ 2 (X i µ) 2 χ 2 (X i X ) 2 = ( 1)S2 σ 2 χ 2 1. T (6) = 1 1 X µ X µ = (X i X ) 2 S t 1 Allgemei gilt für stochastisch uabhägige Zufallsgröße X N(0,1) ud Y χ 2 T (7) = X Y t. Sid X N(µ 1,σ1 2) ud Y N(µ 2,σ2 2 ) stochastisch uabhägige, ormalverteilte Grudgesamtheite ud (X 1,...,X 1 ) ud (Y 1,...,Y 2 ) etsprechede Stichprobe, so ist 2.4 Bereichsschätzug T 1, 2 = σ2 2 S2 1 σ 2 1 S2 2 F 1 1, 2 1. Ziel der Bereichsschätzug ist es, mit Hilfe eier Stichprobe (X 1,...,X ) zur Grudgesamtheit X mit der Verteilugsfuktio F ϑ zwei Schätzfuktioe U : X Θ ud O : X Θ für de ubekate Parameter ϑ Θ der Verteilug vo X zu fide, so dass ϑ mit eier Wahrscheilichkeit vo midestes 1 α im Itervall [U(X 1,...,X ),O(X 1,...,X )], dem sogeate Kofidez- oder Vertrauesitervall, liegt. Dabei heißt die Zahl α (0, 1) Irrtumswahrscheilichkeit ud der Wert 1 α heißt Kofideziveau. Als Formel ausgedrückt soll also gelte: P ( U(X 1,...,X ) ϑ O(X 1,...,X ) ) 1 α. Die Irrtumswahrscheilichkeit α ist dabei stets vorzugebe. Typische Werte sid zum Beispiel α = 0,05 ud α = 0,01. 2.4.1 Kofidezitervalle bei biomialverteilter Grudgesamtheit Im Folgede sei X B(1,p) eie mit dem Parameter ϑ = p = P(X = 1) Θ = (0,1) biomialverteilte Grudgesamtheit ud (X 1,...,X ) eie Stichprobe. Wir suche u die Greze eies Kofidezitervalls für das Kofideziveau 1 α. Dazu utze wir die für hireiched großes stadardormalverteilte Stichprobefuktio T (2) N(0,1) aus Abschitt 2.3.3 ud das Quatil z 1 α/2 der Stadardormalverteilug. Uter Verwedug der Beziehug 63

Φ(z a α/2 ) = 1 α 2 ergibt sich daraus zuächst P ( z 1 α/2 X p p(1 p) z1 α/2 ) = Φ(z 1 α/2 ) Φ( z 1 α/2 ) = 2Φ(z 1 α/2 ) 1 = 1 α. Durch Umrechug i die Form P ( U(X 1,...,X ) p O(X 1,...,X ) ) = 1 α erhalte wir für die Greze des Kofidezitervalls: [ U(X 1,...,X ) = X +z1 α/2 2 + z2 1 α/2 X 2 z (1 X ) 1 α/2 + [ O(X 1,...,X ) = X + z2 1 α/2 X 2 +z (1 X ) 1 α/2 + +z 2 1 α/2 ( z1 α/2 2 ( z1 α/2 Beispiel. Aus der laufede Produktio vo Sicheruge wird eie Stichprobe vom Umfag = 100 etomme ud überprüft. Dabei erweise sich 2 Sicheruge als defekt, also ist ˆp = X = 2 100 = 0,02. Gesucht wird ei Kofidezitervall zum Kofideziveau 1 α = 0,95. Aus eier Tabelle etehme wir z 1 α/2 = z 0,975 = 1,96 ud somit erhalte wir durch Eisetze i die beide Formel das Itervall [0,0055; 0,0700]. Bei eier Stichprobe vom Umfag = 1000 mit 20 defekte Sicheruge ist p = X = 0,02 ud für 1 α = 0,95 ergibt sich das Kofidezitervall [0,0130; 0,0304]. Wir sehe, dass mit steigedem die Läge des Itervalls abimmt, d.h. je größer die Stichprobe, desto geauer die Schätzug. 2.4.2 Kofidezitervalle bei ormalverteilter Grudgesamtheit Im Folgede sei X N(µ,σ 2 ) eie ormalverteilte Grudgesamtheit ud (X 1,...,X ) eie Stichprobe. Wir suche Kofidezitervalle zum Kofideziveau 1 α für die beide Parameter µ ud σ 2 der Normalverteilug. 2.4.2.1 Kofidezitervall für µ bei bekatem σ 2 Wir verwede die aus Abschitt 2.3.4 bekate Stichprobefuktio T (3) N(0,1) ud das Quatil z 1 α/2 der Stadardormalverteilug. Aus ergibt sich da mit ( P z 1 α/2 X ) µ z1 α/2 = 1 α σ P ( U(X 1,...,X ) µ O(X 1,...,X ) ) = 1 α U(X 1,...,X ) = X z 1 α/2 σ, 2 O(X 1,...,X ) = X +z 1 α/2 σ. ) 2 ] ) 2 ],. 64

2.4.2.2 Kofidezitervall für µ bei ubekatem σ 2 Der Parameter σ 2 sei ubekat ud mittels S 2 geschätzt. Wir verwede die aus Abschitt 2.3.4 bekate Stichprobefuktio T (6) t 1 ud das Quatil t 1,1 α/2 der t-verteilug. Aus ( P t 1,1 α/2 X ) µ t 1,1 α/2 = 1 α S ergibt sich da mit P ( U(X 1,...,X ) µ O(X 1,...,X ) ) = 1 α U(X 1,...,X ) = X t 1,1 α/2 S, O(X 1,...,X ) = X +t 1,1 α/2 S. 2.4.2.3 Kofidezitervall für σ 2 bei bekatem µ Wir verwede die aus Abschitt 2.3.4 bekate Stichprobefuktio T (4) χ 2 ud die Quatile χ,1 α/2 ud χ,α/2 der χ 2 -Verteilug. Aus ergibt sich da mit U(X 1,...,X ) = P ( ) χ,α/2 1 σ 2 (X i µ) 2 χ,1 α/2 = 1 α P ( U(X 1,...,X ) σ 2 O(X 1,...,X ) ) = 1 α 1 χ 2,1 α/2 (X i µ) 2, O(X 1,...,X ) = 1 χ 2,α/2 2.4.2.4 Kofidezitervall für σ 2 bei ubekatem µ (X i µ) 2. Der Parameter µ sei ubekat ud mittels X geschätzt. Wir verwede die aus Abschitt 2.3.4 bekate Stichprobefuktio T (5) χ 2 1 ud die Quatile χ 1,1 α/2 ud χ 1,α/2 der χ 2 -Verteilug. Aus ( ) P χ 1,α/2 ( 1)S2 σ 2 χ 1,1 α/2 = 1 α ergibt sich da mit P ( U(X 1,...,X ) σ 2 O(X 1,...,X ) ) = 1 α U(X 1,...,X ) = ( 1)S2 χ 2, O(X 1,...,X ) = ( 1)S2 1,1 α/2 χ 2. 1,α/2 65

2.4.3 Eiseitige Kofidezitervalle I mache Fälle sid ur eiseitige Kofidezitervalle gesucht, d.h. es iteressiert die Wahrscheilichkeit P ( U(X 1,...,X ) ϑ ) = 1 α oder P ( ϑ O(X 1,...,X ) ) = 1 α. Um solche eiseitige Kofidezitervalle zu bereche, utzt ma die Formel für die etsprechede Itervallgreze mit α statt α 2. 2.5 Tests Wir betrachte eie Grudgesamtheit X mit der us ubekate Verteilugsfuktio F ϑ ud eie etsprechede Stichprobe (X 1,...,X ). Si ud Zweck vo Tests ist es u, ahad der Stichprobe Aussage über die Art der Verteilug der Grudgesamtheit (parameterfreie Tests) oder, bei bekater Verteilugsart, über de Parameter ϑ Θ der Verteilug (Parametertests) zu überprüfe. Es wird also getestet, ob die aufgestellte Behauptug über die Grudgesamtheit bzw. über dere Verteilugsparameter i sigifikater Weise vo de aus der Stichprobe gewoee Iformatioe abweicht oder icht. Daher heiße solche Tests auch Sigifikaztests. 2.5.1 Allgemeies Schema für Parametertests Jeder Parametertest wird ach dem folgede Schema durchgeführt: 1. Wir formuliere usere Behauptug über de ubekate Parameter ϑ der Verteilug der Grudgesamtheit X als sogeate Nullhypothese H 0 ud stelle die etsprechede Alterativhypothese H 1 auf; diese ist das Komplemet der Nullhypothese H 0. Für bekates ϑ 0 komme zum Beispiel die folgede Hypothese i Frage: H 0 : ϑ = ϑ 0 ud H 1 : ϑ ϑ 0, H 0 : ϑ ϑ 0 ud H 1 : ϑ > ϑ 0, H 0 : ϑ ϑ 0 ud H 1 : ϑ < ϑ 0. Wir möchte u wisse, ob die Behauptug H 0 mit de i der Stichprobe (X 1,...,X ) ethaltee Iformatioe vereibar ist oder ob wir H 0 ablehe müsse ud somit H 1 für richtig befide. 2. Wir wähle eie sogeate Irrtumswahrscheilichkeit α. Dies ist die Wahrscheilichkeit dafür, dass H 0 auf Grud der Stichprobe abgeleht wird, obwohl H 0 richtig ist. 3. Wir wähle eie Stichprobefuktio T (Testfuktio), dere Verteilug bei Gültigkeit vo H 0 bekat ist. Mit Hilfe dieser Testfuktio erhalte wir i Form eier reelle Zahl Iformatioe über die Stichprobe. (Im Folgede werde wir für die Zufallsgröße T (X 1,...,X ) ud die kokrete Fuktioswerte T (x 1,...,x ) zur bessere Übersicht kurz T schreibe.) 4. Wir wähle eie kritische Bereich K für die Werte der Testfuktio T, so dass P H0 (T K) α gilt. D.h. falls die Nullhypothese H 0 richtig ist, soll die Wahrscheilichkeit dafür, dass der Wert der Testfuktio im kritische Bereich liegt, kleier oder gleich der Irrtumswahrscheilichkeit sei. 66

5. Sollte für die kokrete, zum Zwecke des Tests etommee Stichprobe der Fuktioswert der Testfuktio T i de kritische Bereich falle, so müsse wir H 0 ablehe. Aderfalls spricht die Stichprobe icht gege die Hypothese H 0. I Formel: T K H 0 wird ageomme, T K H 0 wird abgelehmt. Da das Ergebis eies Parametertests ur auf Stichprobe beruht, köe die zwei folgede Fehler auftrete. Fehler 1. Art: Die Hypothese H 0 ist richtig, wird aber auf Grud der Stichprobe abgeleht. Die Wahrscheilichkeit für diese Fehler beträgt α. Fehler 2. Art: Die Hypothese H 0 ist falsch, wird aber icht abgeleht, da die Stichprobe für H 0 spricht. Die Wahrscheilichkeit für das Auftrete dieses Fehlers ist im Allgemeie ubekat. 2.5.2 Parametertests bei biomialverteilter Grudgesamtheit Sei X B(1, p) eie mit dem Parameter p biomialverteilte Grudgesamtheit ud sei der Wert p 0 gegebe. Als Beispiel für eie Parametertest möchte wir ahad eier Stichprobe (X 1,...,X ) vom Umfag die Hypothese H 0 : p p 0 überprüfe. Die etsprechede Alterativhypothese ist H 1 : p > p 0. α sei die Irrtumswahrscheilichkeit. Eie geeigete Testfuktio ist die us bereits bekate Stichprobefuktio T (0) = X i B(,p). Etscheided für das Testergebis ist u die Wahrscheilichkeit P H0 (T (0) c) = 1 P H0 (T (0) < c) = 1 c 1 c 1 P H0 (T (0) = k) = 1 k=0 k=0 ( ) p k k 0(1 p 0 ) k. Ist diese kleier oder gleich α, so müsse wir H 0 ablehe; ist sie größer als α, so köe wir davo ausgehe, dass H 0 richtig ist. Beispiel. Wir betrachte ochmals die Produktio vo Sicheruge, d.h. X B(1, p), wobei p die Wahrscheilichkeit für eie Defekt agibt. Usere Hypothese sei H 0 : p p 0 mit p 0 = 0,01. Wir setze α = 0,05 ud etehme eie Stichprobe (x 1,...,x 100 ) vom Umfag = 100 mit c = T (0) (x 1,...,x 100 ) = 2; es sid also zwei Sicheruge defekt i userer Stichprobe. Spreche zwei defekte Sicheruge bei 100 überprüfte für usere Hypothese H 0 oder icht? Durch Eisetze der gegebee Werte i obige Gleichug erhalte wir P H0 (T (0) 2) = 1 ( 100 0 ) 0,01 0 0,99 100 ( 100 1 ) 0,01 1 0,99 99 = 0,264238 > 0,05 = α. 67

Somit köe wir die Hypothese p 0,01 als richtig aehme. Aalog köe wir die Rechug für Stichprobe mit c = 3 oder c = 4 usw. durchführe. Ab c = 4 müsse wir die Hypothese da jedoch ablehe. Gehe wir ach dem obe beschriebee allgemeie Schema für Parametertests vor, so köe wir zum Test der drei Hypothese p = p 0 p p 0 H 0 : p p 0 mit H 1 : p > p 0 p p 0 p < p 0 bei hireiched großem die Testfuktio T (2) = X p 0 p0 (1 p 0 ) N(0,1) ud de kritische Bereich verwede. T > z 1 α/2 K = T > z 1 α T < z 1 α 2.5.3 Parametertests bei ormalverteilter Grudgesamtheit Sei X N(µ,σ 2 ) eie ormalverteilte Grudgesamtheit ud (X 1,...,X ) eie Stichprobe ud sei die Irrtumswahrscheilichkeit α vorgegebe. Wir betrachte im Folgede Hypothese über de Erwartugswert µ bei bekater ud ubekater Variaz σ 2 ud über die Variaz bei ubekatem Erwartugswert. Auf Hypothese über die Variaz bei bekatem Erwartugswert gehe wir icht ei. 2.5.3.1 Hypothese über µ bei bekatem σ 2 Sei σ 2 bekat ud der Wert µ 0 vorgegebe. Wir teste drei verschiedee Nullhypothese H 0 mit der jeweilige Alterativhypothese H 1 : µ = µ 0 µ µ 0 H 0 : µ µ 0 ud H 1 : µ > µ 0. µ µ 0 µ < µ 0 Als Testfuktio wähle wir (X 1,...,X ) = X µ 0 N(0,1). σ T (3) 68

Als kritischer Bereich ergibt sich {x : x > z 1 α/2 } K = {x : x > z 1 α } {x : x < z 1 α }, da gilt: ( X µ 1 P 0 ) σ z1 α/2 ( P H0 (T K) = P X µ 0 ) σ > z1 α ( P X µ 0 ) σ < z1 α 2 2Φ(z 1 α/2 ) α = α = α. 1 Φ(z 1 α ) α 1 (Φ(z α/2 ) Φ( z 1 α/2 )) = 1 Φ(z 1 α ) Φ( z 1 α ) 2.5.3.2 Hypothese über µ bei ubekatem σ 2 Sei σ 2 ubekat ud durch S 2 geschätzt ud der Wert µ 0 vorgegebe. Wir teste drei verschiedee Nullhypothese H 0 mit der jeweilige Alterativhypothese H 1 : µ = µ 0 µ µ 0 H 0 : µ µ 0 ud H 1 : µ > µ 0. µ µ 0 µ < µ 0 Als Testfuktio wähle wir T (6) (X 1,...,X ) = X µ 0 S t 1. Als kritischer Bereich ergibt sich {x : x > t 1,1 α/2 } K = {x : x > t 1,1 α } {x : x < t 1,1 α }. Beispiel. Zur Beurteilug der Qualität eies eue Streckemessgeräts wird eie 1 km lage Referezstrecke = 10 mal gemesse. Das Messgerät liefert dabei für x 1,...,x die folgede Werte (i Meter): 998,0; 1001,0; 1003,0; 1000,5; 999,0; 997,5; 1000,0; 999,5; 996,0; 998,5. Wir ehme die Zufallsgröße gemessee Läge als ormalverteilt a. Aus de Messwerte erhalte wir X = 999,3 m, s 2 = 3,9 m 2, s = 1,975 m. Us iteressiert u, ob das Gerät im Mittel die korrekte Etferug liefert, d.h. wir teste die 69

Hypothese H 0 : µ = µ 0 = 1000 m. Die Alterativhypothese ist H 1 : µ µ 0. Die Irrtumswahrscheilichkeit sei α = 0,05 ud als kritische Bereich habe wir Die Testfuktio liefert K = {x : x > t 9;0,975 = 2,262} = ( ; 2,262) (2,262; ). T (6) (x 1,...,x ) = X µ 0 999,3 1000 = 10 = 1,12 K. s 1,975 Die Messwerte spreche also icht gege usere Behauptug. Wir köe somit aehme, dass das Messgerät im Mittel korrekt arbeitet. 2.5.3.3 Hypothese über σ 2 bei ubekatem µ Sei µ ubekat ud durch X geschätzt ud der Wert σ0 2 vorgegebe. Wir teste drei verschiedee Nullhypothese H 0 mit der jeweilige Alterativhypothese H 1 : σ 2 = σ0 2 σ 2 σ0 2 H 0 : σ 2 σ0 2 ud H 1 : σ 2 > σ0 2. σ 2 σ0 2 σ 2 < σ0 2 Als Testfuktio wähle wir T (5) (X 1,...,X ) = 1 σ 2 Als kritischer Bereich ergibt sich (X i X ) 2 = ( 1)S2 σ 2 {x : x < χ 2 1,α/2 x > χ2 1,1 α/2 } K = {x : x > χ 2 1,1 α } {x : x < χ 1,α } χ 2 1.. Beispiel. Wir betrachte ochmals das vorhergehede Beispiel des Streckemessgeräts. Wir möchte u weitere Aussage über die Qualität des Geräts mache, idem wir die Hypothese H 0 : σ 2 σ0 2 = 4 m teste. Da ist H 1 : σ 2 < σ0 2 ud mit α = 0,05 ud liefert die Testfuktio K = {x : x < χ 2 9;0,05 = 3,325} = (0;3,325) T (5) (x 1,...,x ) = ( 1)S2 σ 2 = 9 3,9 = 8,775 K, 4 d.h. die Messwerte spreche icht gege die Hypothese. Aus praktischer Sicht ist die hohe Variaz ei Merkmal für schlechte Messqualität. 70

2.5.4 Vergleich zweier ormalverteilter Grudgesamtheite Wir betrachte die zwei ormalverteilte Grudgesamtheite X (1) N(µ 1,σ1 2) ud X(2) N(µ 2,σ2 2 ). Die zufällige Vektore (X(1) 1,...,X(1) 1 ) ud (X (2) 1,...,X(2) 2 ) seie etsprechede Stichprobe. Wir gehe davo aus, dass σ1 2 = σ2 2 gilt ud möchte wisse, ob die Erwartugswerte der beide Grudgesamtheite übereistimme, d.h. wir teste die Hypothese H 0 : µ 1 = µ 2. Die Alterativhypothese isth 1 : µ 1 µ 2 udαsei die Irrtumswahrscheilichkeit. Wir verwede als Testfuktio T (X (1) 1,...,X(1) 1,X (2) X 1,...,X(2) 1 2 ) = X 2 1 2 t 1 + 1 + 2 2 2 (2 1)S 2 1 +( 2 1)S 2 2 1 + 2 2 ud als kritische Bereich K = {x : x > t 1 + 2 2,1 α/2}. Beispiel. Ei TV-Gerätehersteller bezieht Trasistore vo zwei verschiedee Lieferate. Die gelieferte Trasistore solle eie Stromverstärkugsfaktor vo 100 habe. Us iteressiert u, ob die Mittelwerte µ 1 ud µ 2 der Stromverstärkugsfaktore bei beide Lieferate übereistimme, we wir davo ausgehe, dass σ1 2 = σ2 2 gilt. Es sei α = 0,05 ud die beide Stichprobe liefer Der kritische Bereich ist 1 = 36, x 1 = 108,1, s 2 1 = 13,6, 2 = 28, x 2 = 99,8, s 2 2 = 16,7. K = {x : x > t 62;0,975 = 1,999} = ( ;-1,999) (1,999; ) ud aus der Testfuktio erhalte wir T = 8,519 K. Somit wird die Hypothese abgeleht, d.h. die Erwartugswerte der Stromverstärkugsfaktore beider Lieferate stimme icht überei. Beim Test der Erwartugswerte der beide Grudgesamtheite auf Gleichheit habe wir die Gleichheit der beide Streuuge vorausgesetzt. Auch dies köe wir als Hypothese verwede, d.h. wir teste H 0 : σ 2 1 = σ2 2 mit der etsprechede Alterativhypothese H 1 : σ 2 1 σ2 2. Als Testfuktio utze wir ud als kritische Bereich T (X (1) 1,...,X(1) 1,X (2) 1,...,X(2) 2 ) = S2 1 S 2 F 1 1, 2 1 2 K = {x : x < F 1 1, 2 1,α/2 x > F 1 1, 2 1,1 α/2}. Beispiel. Für das vorhergehede Beispiel erhalte wir beim Test auf Streuugsgleichheit mit α = 0,1 K = {x : x < F 35;27;0,05 x > F 35;27;0,95 } = (0;0,553) (1,857; ) 71

ud T = 0,814 K. Wir köe somit davo ausgehe, dass die Streuuge bei beide Lieferate gleich sid. Für α = 0,05 erhält ma K = (0;0,493) (2,097; ). 2.5.5 χ 2 -Test Beim χ 2 -Test (Chi-Quadrat-Test) hadelt es sich um eie parameterfreie Test, d.h. wir teste ahad eier Stichprobe (X 1,...,X ), ob die Verteilugsfuktio F eier Grudgesamtheit X mit eier vorgegebee Verteilugsfuktio F 0 übereistimmt. Das Testschema für Parametertests ka mit gerige Apassuge auch für parameterfreie Tests verwedet werde. Als Nullhypothese habe wir H 0 : F(x) = F 0 (x) mit der Alterativhypothese H 1 : F(x) F 0 (x). Hauptproblem bei parameterfreie Tests ist das Fide eier geeigete Testfuktio. Vorgehesweise. Als erste Schritt uterteile wir die reelle Zahle i r paarweise disjukte Itervalle I 1,...,I r : R = I 1 I r = (,a 1 ) [a 1,a 2 ) [a r 2,a r 1 ) [a r 1, ). Da bestimme wir für jedes Itervall die Azahl y i der Stichprobeelemete im Itervall I i (es gilt r y i = ) ud die ideale Azahl yi 0 vo Stichprobeelemete im Itervall I i, d.h. die der vorgegebee Verteilug F 0 etsprechede Azahl. Uter der Aahme, dass H 0 richtig ist, gilt also yi 0 = P H 0 (X I i ). Als Testfuktio verwede wir T = r (y i y 0 i )2 y 0 i χ 2 r 1 m, wobei m die Azahl der ubekate ud somit zu schätzede Parameter der ageommee Verteilug ist. Bezeiche wir mit α die Irrtumswahrscheilichkeit, so erhalte wir als kritische Bereich K = {x : x > χ 2 r 1 m,1 α}. Bemerkug. Um de bei dieser Vorgehesweise gemachte Fehler gerig zu halte, sollte die Faustregel yi 0 5 beachtet werde. Beispiel. Beim maschielle Zuschitt vo Holzleiste wird ahad eier Stichprobe die Abweichug der tatsächliche Läge vom Nemaß utersucht. Wir vermute, dass es sich bei der Zufallsgröße Betrag der Abweichug vom Nemaß um eie ormalverteilte Zufallsgröße hadelt. Die Nullhypothese ist also ( ) X µ H 0 : F(x) = Φ σ ud wir habe m = 2 (die Parameter µ ud σ 2 sid ubekat ud müsse geschätzt werde). Aus der Stichprobe erhalte wir die folgede Date: = 150, µ x = 40,48, σ s = 5,71. 72

Wir wähle als Irrtumswahrscheilichkeit α = 0,1 ud zerlege die reelle Zahle i r = 8 Itervalle wie i der Tabelle agegebe: Der kritische Bereich ist ud die Testfuktio liefert i I i y i yi 0 1 0 30,5 5 6,03 2 30,5 33,5 13 10,59 3 33,5 36,5 23 19,81 4 36,5 39,5 22 28,35 5 39,5 42,5 29 30,94 6 42,5 45,5 29 25,81 7 45,5 48,5 16 16,44 8 48,5 13 12,01 K = {x : x > χ 2 r 1 m,1 α = χ 2 5;0,9 = 9,27} = (9,27; ) T = 8 (y i y 0 i )2 y 0 i = 3,27 K. Wir köe also davo ausgehe, dass die betragsmäßige Abweichug vom Newert ormalverteilt ist. 2.6 Spezielle Schätzverfahre 2.6.1 Maximum-Likelihood-Methode Im Folgede sei X eie Grudgesamtheit mit der Verteilugsfuktio F ϑ ud (X 1,...,X ) eie Stichprobe. Der Parameter ϑ Θ der Verteilug der Grudgesamtheit ist ubekat ud soll geschätzt werde. Ziel der Maximum-Likelihood-Schätzug (kurz: MLS) ist es, de Schätzwert ˆϑ ML für ϑ so zu wähle, dass die zur Schätzug verwedete Stichprobe uter alle dekbare Stichprobe die höchste Wahrscheilichkeit aufweist. Dazu drückt ma die Wahrscheilichkeit der Stichprobe als Fuktio vo ϑ aus ud sucht das Maximum. Eie solche Fuktio heißt Likelihood-Fuktio ud wird mit like(ϑ) bezeichet. Meist ist es eifacher, das Maximum der Fuktio L(ϑ) := llike(ϑ) zu bestimme. Da die Logarithmusfuktio streg mooto wachsed ist, ädert sie ichts a de Extremwerte. Die Maximierug erfolgt wie üblich durch Nullsetze der erste Ableitug L (ϑ). Eigeschafte der Maximum-Likelihood-Schätzug Alle MLS sid kosistet. Existiert eie wirksamste Schätzfuktio, so erhält ma diese durch die MLS. MLS sid assymptotisch ormalverteilt mit dem Erwartugswert ϑ. 73