Stichprobenverteilungen, Schätz und Testtheorie

Ähnliche Dokumente
Wirksamkeit, Effizienz

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Wirksamkeit, Effizienz

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Kapitel 5: Schließende Statistik

Schätzen von Populationswerten

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Schätzen von Populationswerten

Tests statistischer Hypothesen

X in einer Grundgesamtheit vollständig beschreiben.

4 Schwankungsintervalle Schwankungsintervalle 4.2

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

10. Testen von Hypothesen Seite 1 von 6

Kapitel 6 : Punkt und Intervallschätzer

2. Repetition relevanter Teilbereiche der Statistik

3. Grundbegrie der Schätztheorie

Prof. Dr. Roland Füss Statistik II SS 2008

X X Schätzen von Vertrauensintervallen Schwankungsintervall

Induktive Schlussweise. Schätzfunktionen und Schätzverfahren. Bibliografie

Empirische Verteilungsfunktion

Anwendung für Mittelwerte

7. Stichproben und Punktschätzung

2 Induktive Statistik

TESTEN VON HYPOTHESEN

Testen statistischer Hypothesen

Parameterschätzung. Kapitel Schätzfunktionen

Statistik. 2. Semester. Begleitendes Skriptum zur Vorlesung. im FH-Masterstudiengang. Technisches Management. von. Günther Karigl

II. Grundzüge der Stichprobentheorie

Formelsammlung Statistik 29. Januar 2019

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Bei 95%iger Konfidenz wäre der Mittelwert der GG zwischen 1421,17DM und 1778,83DM zu erwarten.

Evaluation & Forschungsstrategien

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Statistik, Abschnitt (1) Gegeben sei der Stichprobenvektor (X 1,..., X n ). Die Stichprobenfunktion. ˆµ k := 1 n. Xi k (1) i=1.

Parameterschätzung. Numero, pondere et mensura Deus omnia condidit

10. Intervallschätzung 10.1 Begriff des Konfidenzintervalls

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

Eingangsprüfung Stochastik,

Statistik und Wahrscheinlichkeitsrechnung

Inhaltsverzeichnis. Wirtschaftswissenschaftliches Zentrum 11 Universität Basel. Mathematik 2

3 Vergleich zweier unverbundener Stichproben

Statistik und Wahrscheinlichkeitsrechnung

Maximum Likelihood Version 1.6

Induktive Statistik. Formelsammlung. Prof. Dr. W. Assenmacher. Stichprobenraum: Ω = {ω 1, ω 2,...,ω m }

Übungen mit dem Applet erwartungstreu

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Logarithmusfunktion, Rechenregeln für Logarithmen, Ableiten von Logarithmen (die Ableitung nach p wird hier stets als p geschrieben)

Konfidenzintervalle. Praktische Übung Stochastik SS 2017 Lektion 10 1

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Parametrische Einstichprobentests

Diplomvorprüfung Stochastik

Einstichprobentests für das arithmetische Mittel

Wahrscheinlichkeitstheorie und Statistik vom

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

6 Vergleich mehrerer unverbundener Stichproben

Statistische Modelle und Parameterschätzung

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

2 Einführung in die mathematische Statistik

5.4.2 Die empirische Verteilungsfunktion als Ausgangspunkt

Testverfahren zur Prüfung von Hypothesen über Parameter oder Verteilungen

Testverfahren zur Prüfung von Hypothesen über Parameter oder Verteilungen. Einstichprobentest für die Varianz einer Normalverteilung

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Einführung in die Stochastik 10. Übungsblatt

(4) = 37,7 % mit 37,7 % Wahrscheinlichkeit sind es höchstens 4 Fahrräder, das ist recht hoch; man kann also die Behauptung nicht wirklich ablehnen.

Es werden 120 Schüler befragt, ob sie ein Handy besitzen. Das Ergebnis der Umfrage lautet: Von 120 Schülern besitzen 99 ein Handy.

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

11 Likelihoodquotiententests

Diskrete Zufallsvariablen

Grundproblem der Inferenzstatistik

Formelsammlung. PD Dr. C. Heumann

Kapitel VI. Einige spezielle diskrete Verteilungen

Statistische Tests zu ausgewählten Problemen

Kapitel 9: Schätzungen

Grundlagen der Biostatistik und Informatik

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2015/2016. Aufgabe 1

2 ISO/BIPM-Leitfaden Guide to the Expression of Uncertainty in Measurement, GUM (2008 überarbeitet, die deutsche Fassung ist [3])

Zenraler Grenzwertsatz

Maximum-Likelihood-Methode (ML-Methode)

Maximum-Likelihood-Methode (ML-Methode)

Aufgaben zu Kapitel 40

Lösungsvorschlag Probeklausur zur Elementaren Wahrscheinlichkeitsrechnung

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Kapitel 2. Induktive Statistik. 2.1 Grundprinzipien der induktiven Statistik

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Transkript:

Stichprobeverteiluge, Schätz ud Testtheorie Begleitede Uterlage zur Übug Iduktive Statistik Michael Westerma Uiversität Esse Ihaltsverzeichis 1 Grudzüge der Stichprobetheorie..................................... 2 1.1 Stichprobe ud Stichprobefuktioe............................... 2 1.2 Verteiluge vo Stichprobefuktioe............................... 3 1.3 Stichprobeverteilug des arithmetische Mittels.......................... 4 1.4 Stichprobeverteilug des Ateilswertes............................... 4 2 Grudzüge der Schätztheorie........................................ 5 2.1 Erwartugstreue............................................. 5 2.2 Ef ziez................................................. 5 2.3 Asymptotische Erwartugstreue.................................... 6 2.4 Kosistez................................................ 6 2.5 Methode zur Gewiug vo Puktschätzuge......................... 7 2.6 Itervallschätzug vo Ateils ud Erwartugswerte...................... 8 3 Testtheorie................................................... 11 3.1 Eiführug................................................ 11 3.2 Eistichprobetest............................................ 12 3.3 Zweistichprobetest........................................... 13 3.4 α ud β Fehler............................................. 15 3.5 Zusammehag vo Ko dezitervalle ud Hypothesetests................. 16 Literaturempfehluge.............................................. 16 Vorwort Diese Seite sid als begleiteder Text zur Übug Iduktive Statistik gedacht. Dabei geht es wie der Titel scho verrät um die Theme Schätz ud Testtheorie. Der Text soll keiesfalls de Besuch der Lehrverastaltuge bzw. die Lektüre der eischlägige Literatur ersetze, soder lediglich dazu diee, de i de relevate Sitzuge behadelte Stoff ochmals grob zusammezufasse ud die Zusammehäge zu verdeutliche.

1 Grudzüge der Stichprobetheorie Gegestad der iduktive Statistik ist der sogeate Repräsetativschluß. Mithilfe der Date, welche aus eier Stichprobe gewoe werde, solle Rückschlüsse auf die Grudgesamtheit, aus der diese Stichprobe stammt, gezoge werde. Diese Rückschlüsse köe auf zwei Arte geschehe: Schätze: Teste: Bestimmug eies Näherugswertes eies ubekate Parameters der Grudgesamtheit aufgrud der Beobachtuge i der Stichprobe (ohe Vorketisse). Geschieht durch Pukt oder Itervallschätzug. Überprüfe vo statistische Aussage (Hypothese) über die Verteilug eier Zufallsvariable oder über eie ubekate Parameter (mit Vorketisse). Die Voraussetzug für die Durchführug dieser beide Verfahre ist das Vorliege eier Stichprobe. 1.1 Stichprobe ud Stichprobefuktioe Bei der Ziehug eier Stichprobe, werde Elemete aus der N Elemete umfassede Grudgesamtheit etomme. We = N ist, spricht ma icht mehr vo eier Stichprobe, soder vo eier Totalerhebug. Das Ziehe eier Stichprobe besteht dari, Elemete x 1,..., x aus der Grudgesamtheit auszuwähle ud a ihe die Auspräguge des Merkmals zu beobachte. Dabei heißt der Quotiet / N Auswahlsatz. Die Art, wie die Stichprobe etomme werde, heißt Auswahlverfahre. Dabei ist es vo besoderer Bedeutug, daß das Prizip der Zufallsauswahl eigehalte wird. Nur da köe die Methode der schließede Statistik auf diese Stichprobe agewedet werde. De itio 1 (Stichprobe) Eie durch Zufallsauswahl gewoee, edliche Mege vo Beobachtugswerte x 1,..., x aus eier edliche oder uedliche Grudgesamtheit heißt ueigeschräkte Zufallsauswahl, we jedes Elemet der Grudgesamtheit die Möglichkeit besitzt, i die Stichprobe zu gelage, ueigeschräkte, eifache Zufallsauswahl, we die Wahrscheilichkeit, i die Stichprobe zu gelage, bei jedem Elemet der Grudgesamtheit gleich groß ist. Bei der Etahme der Elemete aus der Grudgesamtheit ist weiterhi zu berücksichtige, ob diese mit oder ohe Zurücklege geschieht (zmz, zoz). Uabhägig vo dieser Fragestellug bleibt folgedes festzuhalte: I der Grudgesamtheit besitzt das Merkmal X die (ubekate) Verteilugsfuktio F(X) mit de (ubekate) Parameter (Momete) E(X) = µ ud V(X) = σ 2. Die Elemete der Stichprobe köe als Realisatioe vo Zufallsvariable X 1,..., X agesehe werde. Für alle diese Zufallsvariable gilt: Sie stamme aus der gleiche Grudgesamtheit für die die obe geate Eigeschafte gelte. (E(X) = µ ud V(X) = σ 2 ) Die Realisatioe aller X i sid uabhägig voeiader. Alle Elemete der Stichprobe sid somit uabhägig, idetisch verteilt, oder kurz i.i.d. (für idepedet, idetically distributed). Auf der Basis der Stichprobe soll der ubekate Parameter θ eier Grudgesamtheit geschätzt werde. 1 Diese Schätzug wird mittels eier Schätz oder Stichprobefuktio vorgeomme. Dabei hadelt es sich um eie Fuktio ^θ = g(x 1,..., X ), 1 Im weitere Verlauf werde bestimmte Parameter der Grudgesamtheit, wie Mittel ud Ateilswerte, oder die Variaz allgemei mit θ gekezeichet. Diese Parameter der Grudgesamtheit werde durch die eizele Realisatioe der Grudgesamtheit bestimmt. 2

welche lediglich vo de Realisatioe der Stichprobevariable abhägt. Deswege stellt g( ) selbst ebefalls eie Zufallsvariable dar. Werde die kokrete Stichproberealisatioe x 1,... x i diese Fuktio eigesetzt geht die Stichprobefuktio i eie kokrete Schätzwert über. Dieser Wert heißt da Puktschätzer. 1.2 Verteiluge vo Stichprobefuktioe Wie ebe beschriebe, hadelt es sich bei der Fuktio g( ) um eie Zufallsvariable. Die Verteilug dieser Zufallsvariable wird Stichprobeverteilug des Schätzers ^θ geat. Diese Stichprobeverteilug besitzt eie Erwartugswert ud eie Variaz, welche Stichprobefehler oder Stadardfehler geat wird. Beispiel 1 (Vgl. vo der Lippe (1998), Aufgabe 7.2.7) Die Grudgesamtheit ist zweipuktverteilt mit P(x = 1) = 0, 5 ud P(x = 2) = 0, 5. Wie lautet die Stichprobeverteilug des arithmetische Mittels X = 1 Xi des geometrische Mittels X G = X 1 X bei Stichprobe vom Umfag = 2 ud = 3 (Ziehe mit Zurücklege)? Was fällt bei der Betrachtug der Stichprobeverteilug vo X G auf? Es existiere isgesamt 2 Elemetarereigisse ud das Experimet wird = 2 Mal durchgeführt. Der Stichproberaum Ω besteht aus 2 2 = 4 Elemete, ämlich Ω = {(1, 1); (1, 2); (2, 1); (2, 2)}. Das arithmetische Mittel ka bei diese mögliche Stichprobe die Werte 1, 1,5 ud 2 aehme. Für das geometrische Mittel erhält ma die mögliche Realisatioe 1, 2, ud 2. Die etsprechede Wahrscheilichkeite sid i der folgede Tabelle dargestellt: Stichprobe x P( X = x) x G P( X G = x G ) (1,1) 1 0, 5 0, 5 = 0, 25 (1,2)(2,1) 1,5 2 0, 5 0, 5 = 0, 5 (2,2) 2 0, 5 0, 5 = 0, 25 1 1 = 1 0,25 1 2 = 2 0,5 2 2 = 2 0,25 Ma erhält folgede Wahrscheilichkeitsfuktio: 0, 25, für x = 1 0, 5, für x = 1, 5 f( x) = 0, 25, für x = 2 0 sost 0, 25, für x G = 1 0, 5, für x G = 2 f( x G ) = 0, 25, für x G = 2 0 sost Die beide Stichprobeverteiluge besitze also die folgede Parameter: E( X) = 1, 5 E( X G ) = 1, 4571 V( X) = 0, 125 V( X G ) = 0, 1268 Es fällt auf, daß der Erwartugswert vo X G icht dem Erwartugswert der Grudgesamtheit etspricht (µ = 1.5). Weiterhi besitzt X G eie größere Stichprobefehler als X (0, 1268 > 0, 125). Vo Iteresse ist die Verteilug dieser Stichprobefuktioe. Bei bekater Verteilug vo X (z.b. der Normalverteilug) ist es möglich, die Verteilug der Stichprobefuktio exakt zu bestimme. Ist die Verteilug icht bekat, so lasse sich jedoch auf der Basis der Aussage der (zetrale) Grezwertsätze zumidest approximativ die Verteilugseigeschafte agebe. 3

1.3 Stichprobeverteilug des arithmetische Mittels Aus eier (heterograde) Grudgesamtheit mit E(X) = µ ud V(X) = σ 2 werde alle Stichprobe gezoge. Berechet ma für alle diese Stichprobe das arithmetische Mittel x, so gelagt ma zur Stichprobeverteilug vo x. Die Schätzfuktio g( ) wird somit spezi ziert ud lautet u g(x 1,..., X ) = X = 1 X i. i=1 Die Stichprobeverteilug lässt sich durch de Erwartugswert ud die Variaz charakterisiere. E( X) = E ( 1 ) X i = 1 i=1 E(X i ) = 1 i=1 µ = 1 µ = µ. i=1 Bei der Berechug der Variaz muß berücksichtigt werde, ob das Experimet mit oder ohe Zurücklege durchgeführt wird. Für de Fall uabhägiger Stichprobevariable (zmz) erhält ma V( X) = V ( 1 ) X i = 1 2 V(X i ) = 1 2 i=1 i=1 i=1 σ 2 = 1 2 σ2 = σ2. Die Variaz für de Fall abhägiger Stichprobevariable (zoz) lautet (ohe Herleitug) V( X) = σ2 N N 1. 1.4 Stichprobeverteilug des Ateilswertes Ist das Merkmal X i der Grudgesamtheit Beroulli verteilt mit de Wahrscheilichkeite P(X = 1) = π (Erfolg) ud P(X = 0) = 1 π (Mißerfolg), so sid alle Elemete eier Elemete umfassede Stichprobe idetisch Beroulli verteilt mit E(X i ) = π ud V(X i ) = π(1 π). Da gibt die Summe i=1 X i die Azahl ud der Ausdruck 1 i=1 X i de Ateil der Erfolge a. Die Stichprobefuktio für de Ateil der Erfolge soll mit p = 1 i=1 X i gekezeichet werde. Die Verteilugseigeschafte der Stichprobefuktio köe wege der vorliegede Verteilugsiformatio über die Grudgesamtheit geau agegebe werde. Bei Ziehe mit Zurücklege ist der Ateil relativiert biomialverteilt ud bei Ziehe ohe Zurücklege ist er relativiert hypergeometrisch verteilt. Der Erwartugswert der Stichprobeverteilug ist da gegebe durch E(p) = π ud die Variaz ergibt sich als V(p) = π(1 π) (zmz) bzw. V(p) = π(1 π) N N 1 (zoz). Abbildug 1 faßt das bis hierher Beschriebee ochmal zusamme. 4

Abb. 1 Grudgesamtheit ud Stichprobe Grudgesamtheit Umfag: N Elemete: X 1,..., X N Parameter (ubekat) θ F(X) E(X) = µ V(X) = σ 2 Ziehe eier Stichprobe mit Zurücklege: ( ) N+ 1 mögliche Stichprobe ohe Zurücklege: ( N ) mögliche Stichprobe Stichprobe Umfag: Elemete: x 1,..., x Parameter (geschätzt) ^θ z.b. x ud s 2 x bzw. ^σ 2 x p alle mögliche Stichprobe Stichprobeverteilug P( x) vo x x 2 Grudzüge der Schätztheorie Wie bereits erwäht wurde, hadelt es sich bei der Schätzfuktio ^θ um eie Zufallsvariable mit eier bestimmte Stichprobeverteilug. Das bedeutet aber, daß kokrete Schätzwerte mehr oder weiger stark vo θ abweiche köe. Es muß u aus der Vielzahl der mögliche Schätzfuktioe g( ) diejeige ausgewählt werde, welche die Kriterie für gute Schätzer erfüllt. Kokret heißt das: Warum wird z.b. gerade das arithmetische Mittel zur Mometschätzug heragezoge ud icht irgedei aderer Schätzer? 2.1 Erwartugstreue Die allgemeie Zielsetzug bei der Beurteilug vo Schätzfuktioe soll sei, daß ma mit der Schätzfuktio ^θ Werte erhält, welche lediglich zufällig ud icht systematisch vom tatsächliche Parameter θ abweiche. Ist dies der Fall, spricht ma vo eiem erwartugstreue Schätzer. Ist die Abweichug icht zufällig, spricht ma vo verzerrte Schätzer. Der Erwartugswert des Schätzfehlers (der Bias) sollte für jede Stichprobeumfag verschwide: B = E(^θ θ) = 0 bzw. E(^θ) = θ. 2.2 Ef ziez Aus der Klasse der erwartugstreue Schätzer, wird derjeige mit der gerigste Variaz ausgewählt. Sid also ^θ 1 ud ^θ 2 zwei erwartugstreue Schätzer, da ist der Schätzer ^θ 1 da ef zieter als ^θ 2, we bei gleichem Stichprobeumfag gilt: V(^θ 1, ) < V(^θ 2, ). 5

2.3 Asymptotische Erwartugstreue Bei verzerrte Schätzer ist der Bias ugleich ull. Diese Schätzer heiße jedoch da asymptotisch erwartugstreu, we diese Verzerrug mit wachsedem Stichprobeumfag gege Null strebt, also lim E(^θ θ) = 0 bzw. lim E(^θ) = θ. 2.4 Kosistez Kosistez bedeutet, daß die Variaz vo (erwartugstreue) Schätzer mit zuehmedem Stichprobeumfag gege ull kovergiert. Für die praktische Durchführug vo z.b. Stichprobeerhebuge bedeutet das, daß ei Mehraufwad bei der Erhebug (größerer Stichprobeumfag) auch ei besseres 2 Resultat bei der Schätzug liefert. Damit ei Schätzer kosistet ist, muß also gelte lim V(^θ) = 0. Bei verzerrte Schätzer geschieht die Überprüfug auf Kosistez mittels des Mea Square Errors (MSE). Dieser ist de iert als MSE = E (^θ θ ) 2. Durch eie Zerlegug ka dieser Ausdruck auf eie getrete Betrachtug des Bias ud der Variaz des Schätzers reduziert werde. E (^θ θ ) ] 2 2 = E [(^θ E(^θ)) + (E(^θ) θ) }{{} =0 = E [^θ E(^θ) ] [ 2 +2E }{{} V(^θ) = V(^θ) + B 2 (^θ E(^θ)) (E(^θ) θ) }{{} =0 ] + E [ E(^θ) θ ] 2 }{{} =B 2 Damit der verzerrte Schätzer kosistet ist, muß der Grezwert des MSE ull sei, also [ lim MSE = lim (^θ E θ ) ] 2 = 0 = lim [ V(^θ) + B 2] = 0 = lim V(^θ) + lim B2 = 0 Da beide Ausdrücke icht egativ sei köe, liegt Kosistez da vor, we sowohl die Variaz als auch der Bias mit zuehmedem Stichprobeumfag verschwide. Ei kosisteter Schätzer muß also midestes asymptotisch erwartugstreu sei. Beispiel 2 Gegebe sei die Schätzfuktio X = 1 i=1 X i als Schätzfuktio für de Erwartugswert µ der Grudgesamtheit. Es gilt da E( X) = 1 ( ) E Xi = 1 E(Xi ) = 1 µ = µ Das bedeutet, daß das arithmetische Mittel ei erwartugstreuer Schätzer für de Erwartugswert ist. 2 Besser i dem Si, daß die Wahrscheilichkeit für große Schätzfehler durch eie Vergrößerug des Stichprobeumfags deutlich verrigert werde ka. 6

Die Variaz des arithmetische Mittels wurde weiter obe bereits hergeleitet. Diese beträgt V( X) = σ 2/. Ma sieht, daß dieser Ausdruck mit zuehmedem Stichprobeumfag verschwidet lim V( σ X) 2 = lim = 0, ud somit hadelt es sich bei der Schätzfuktio X um eie erwartugstreue ud kosistete Schätzer für de Erwartugswert µ i der Grudgesamtheit. Betrachte wir u die Stichprobevariaz s 2 = 1 i=1 (x i x) 2 = x 2 x 2 als Schätzer für die Variaz σ 2 der Grudgesamtheit. Als Erwartugswert erhält ma (ohe Herleitug) E(s 2 ) = 1 σ2 σ 2. Die Stichprobevariaz ist somit kei erwartugstreuer Schätzer für die Variaz der Grudgesamtheit. Ma erket jedoch, daß dieser Schätzer asymptotisch erwartugstreu ist, da gilt ( 1 lim E(s2 ) = lim σ2 = lim 1 1 ) σ 2 = σ 2 2.5 Methode zur Gewiug vo Puktschätzuge Methode der Momete: Zur Schätzug werde die Momete der empirische Häu gkeitsverteilug, wie x, s 2,... heragezoge. Methode der kleiste Quadrate: Die Schätzfuktio ^θ wird so bestimmt, daß die Summe S der Abweichugsquadrate (X i θ) 2 miimal wird, also S = (X i ^θ) 2 Mi! Beispiel 3 (Vgl. Assemacher (2000), Beispiel 8.2) Der Parameter µ soll mit der Methode der kleiste Quadrate geschätzt werde. Die zu miimierede Größe lautet demach S = (X i ^µ) 2 Mi! Die Lösug der erste Ableitug ergibt ds d^µ = 2 (X i ^µ)! = 0 (X i ^µ) = 0 X i ^µ = 0 X i = ^µ ^µ = 1 Xi = x Maximum Likelihood Methode: Die Wahrscheilichkeit, eie bestimmte Stichprobe x 1,..., x ud damit auch eie kokrete Schätzwert ^θ zu erhalte, ist vom Parameter der Grudgesamtheit θ abhägig. Der Parameter wird u so geschätzt, daß die Wahrscheilichkeit für das Eitrete der kokret vorliegede Stichprobe maximal wird. Diese Wahrscheilichkeit ka für uabhägige Zufallsvariable folgedermaße geschriebe werde: f(x 1,..., x θ) = [f(x 1 θ) f(x 2 θ) f(x θ)] = L(x θ) Die Fuktio L et ma Likelihoodfuktio. Die Maximum Likelihood Methode basiert darauf, de Parameter θ, so zu bestimme, daß diese Fuktio maximal wird: L(^θ) = max L(θ). θ Die Lösug des Maximierugsproblems liefert da de Maximum Likelihood Schätzer (ML) für θ. 7

Beispiel 4 (Vgl. vo der Lippe (1998), Aufgabe 8.1.1) Aus eier Ure mit N = 4 Kugel werde eie Stichprobe vom Umfag = 2 mit Zurücklege gezoge. Die Ure ethält eie ubekate Azahl M vo schwarze ud N M vo weiße Kugel. Eie Stichprobe ergab eie schwarze ud eie weiße Kugel. Bei welchem Wert für M (also M = 1, 2, 3 oder 4) ist es am wahrscheilichste, daß gerade ei solches Stichprobeergebis (also eie schwarze ud eie weiße Kugel) etsteht? Ma differeziere die Likelihood- Fuktio ach M ud ermittle so de ubekate Wert M! Das Mischugsverhältis i der Ure (d.h. die Azahl schwarzer M ud weißer N M Kugel) ist ubekat. Es wurde eie Stichprobe vom Umfag = 2 gezoge, die eie weiße ud eie schwarze Kugel ethielt. Der Ateil p i der Stichprobe der schwarze Kugel beträgt p = 0, 5. Ma überlegt sich u folgedes. Isgesamt sid 4 Kugel i der Ure. Folglich köe die folgede Ure existiere: Für welche dieser füf Ure ist u die gezogee Stichprobe am wahrscheilichkste? Dazu stellt ma die Likelihoodfuktio auf. Diese lautet: ( ) ( ) x ( ) x M N M f(x) = L(x, M, N) = x N N ( ) = π x (1 π) x x = L(π) Diese Fuktio immt für die verschiedee Werte vo π folgede Fuktioswerte a: ( ) ( ) 2 L(0) = 0 1 1 1 2 = 0 L(0, 25) = 0, 25 1 0, 75 1 = 0, 375 1 1 ( ) ( ) 2 L(0, 5) = 0, 5 1 0, 5 1 2 = 0, 5 L(0, 75) = 0, 75 1 0, 25 1 = 0, 375 1 1 ( ) 2 L(1) = 1 1 0 1 = 0 1 Diese Fuktio immt für ^π = 0, 5 de maximale Wert a. Daraus folgt, die Azahl der schwarze Kugel beträgt ^M = 2. Die allgemeie Lösug lautet folgedermaße: ( ) ( ) 1 ( ) 1 2 M 4 M L(x, M, N) = = 1 1 4 4 8 M(4 M) = 1 2 M 1 8 M2 Ma erhält da dl dm = 1 2 1 4 M! = 0 ^M = 2 d 2 L dm 2 = 1 4 < 0 ud somit ^M = 2 als ML Schätzer für M. otw. Bed. für Maximum hir. Bed. für Maximum 2.6 Itervallschätzug vo Ateils ud Erwartugswerte Bei der Kostruktio vo Kofidezitervalle macht ma sich die Schätz ud Verteilugseigeschafte vo Puktschätzer zuutze. Das Stichprobemittel X ist bekatlich ei erwartugstreuer Schätzer für de Erwartugswert µ i der Grudgesamtheit. Weiterhi ist bekat, daß die Stichprobeverteilug des arithmetische Mittels der Normalverteilug gehorcht ud 8

zwar etweder auf der Basis der Grezwertsätze für > 30 oder wege der Reproduktioseigeschafte der Normalverteilug, we alle X i ormalverteilt sid. Somit gilt (approximativ) X N ) (µ; σ2 z = X µ σ / z N (0; 1). Aufgrud der Verteilugseigeschafte des arithmetische Mittels ka ma u eie Bereich bestimme, i dem sich mit eier bestimmte Sicherheitswahrscheilichkeit eie kokrete Realisatio vo X ereiget. Dazu berechet ma ( P z α X ) µ σ / +z α = 1 α. Jeder kokrete Schätzwert liefert eie erwartugstreue Schätzug für de ubekate Parameter. Löst ma u die Ugleichug i der Klammer ach µ auf, erhält ma ( P X z α σ µ X + z α σ ) = 1 α. Das so kostruierte Itervall gibt also eie Badbreite vo Realisatioe vo X a, welche mit eier Wahrscheilichkeit vo 1 α de ubekate Parameter eischließe. Iterpretatio vo Kofidezitervalle: Beim Kofidezitervall sid die bestimmede Werte der Zufallsvariable icht bekat. Die Greze des Itervalls sid zufällig, da sie vo vo der Realisatio der Stichprobe abhäge. Der wahre Parameter dagege ist eie Kostate. Es ka folglich auch icht gesagt werde, daß der Parameter zwische x u ud x o liegt. Die richtige Aussage bei Kofidezitervalle lautet vielmehr: Mit eier Wahrscheilichkeit vo 1 α ethält das kostruierte Kofidezitervall de wahre Parameter. Oder aders: Würde das Zufallsexperimet beliebig oft wiederholt, so würde die kostruierte Kofidezitervalle i 95 vo 100 Fälle de wahre Parameter ethalte. Allgemeie Form vo Kofidezitervalle: lautet: Das Kofidezitervall i seier allgemeie Form P (^θ z α σ^θ θ ^θ + z α σ^θ) = 1 α. Die Greze des Kofidezitervalls laute demach [^θ z α σ^θ ; ] ^θ + z α σ^θ. De Mittelpukt des Kofidezitervalls bildet dabei der Schätzwert ^θ i der Stichprobe. We die Grudgesamtheit heterograd ist, bildet das arithmetische Mittel x eie erwartugstreue Schätzug für de Parameter µ i der Grudgesamtheit. Bei homograde Grudgesamtheite wird der Ateil der Erfolge i der Stichprobe p = X / als erwartugstreue Schätzug für die Erfolgswahrscheilichkeit π i der Grudgesamtheit heragezoge. Die Breite des Kofidezitervalls berechet sich als 2 z α σ^θ ud wird durch die folgede Größe beei ußt: 9

1. Vom Stichprobefehler σ^θ. Dieser wird ach der ute folgede Übersicht bestimmt (Vgl. vo der Lippe (1998), Übersicht 8.9). Je größer der Stichprobefehler ist, desto breiter wird das Kofidezitervall. 2. Vo der Vertraueswahrscheilichkeit 1 α. Diese Wahrscheilichkeit legt das dazugehörige 1 α Quatil der Normalverteilug bzw. der t Verteilug fest. Mit steigeder Sicherheit,wird der etsprechede z α Wert immer größer ud das Itervall immer breiter. (Extremfall: Mit 100%iger Sicherheit be det sich der Parameter i eiem Itervall vo bis + ) 3. Vom Stichprobeumfag : Bei sost gleiche Parameter bewirkt eie Erhöhug des Stichprobeumfags, daß der Stichprobefehler abimmt ud somit das Kofidezitervall icht mehr so breit ist. Bei der Ermittlug des Stichprobefehlers ud des der Sicherheitswahrscheilichkeit 1 α zugeordete z Wertes ka Abbildug 2 heragezoge werde. 3 Beispiel 5 Aus eier Gesamtheit vo Mäer ud Fraue, die sich eier statioäre Etwöhugsbehadlug für Alkoholabhägige uterzoge hatte, wurde eie Stichprobe vom Umfag = 808 gezoge. Nach 18 Moate ware vo diese Persoe 290 ugebessert. Zu bestimme ist ei 99%iges Kofidezitervall für die Mißerfolgswahrscheilichkeit. I diesem Fall hadelt es sich um die Bestimmug eies Kofidezitervalls für Ateilswerte. Der Umfag der Grudgesamtheit ist ubekat, folglich wird die Edlichkeitskorrektur verachlässigt. Die Variaz der Grudgesamtheit ist ubekat, folglich wird der Stichprobefehler gemäß der Übersicht bestimmt durch pq ^σ q = 1 Das Kofidezitervall hat also folgede Gestalt: P (q z^σ q 1 π q + z^σ q ) = 1 α. Das Vertrauesiveau determiiert de z Wert, welcher hier eigetlich i der t Verteilug abgelese werde müsste. Da der Stichprobeumfag aber größer als 30 ist, ka wieder die Stadardormalverteilug heragezoge werde. Es ergebe sich also folgede Bestimmugsgröße für das Kofidezitervall: q = 290 = 0, 3589 808 0, 6411 0, 3589 ^σ q = = 0, 0169 807 1 α = 0, 99 α = 0, 01 z α = 2, 5758 Das Kofidezitervall lautet also 0, 3589 2, 5758 0, 0169 (1 π) 0, 3589 + 2, 5758 0, 0169 0, 3154 (1 π) 0, 4024 3 Vgl. auch vo der Lippe (1998), Übersicht 8.9, S.88. 10

Abb. 2 Stichprobefehler ud 1 α Quatil Bestimmug des Stichprobefehlers σ ˆθ heterograd homograd σ 2 der GG bekat? ja zmz σ π(1 π) zoz σ N N 1 π(1 π) N N 1 ei heterograd a homograd zmz ^σ pq 1 zoz ^σ N N pq 1 N N Bestimmug vo z σ 2 der GG bekat? ja Der z Wert etspricht dem 1 α Quatil der Stadardormalverteilug Ablesebeispiel: 1 α = 0, 95 Φ(z) = 0, 95 z = ±1, 96 ei > 30 Der z Wert etspricht dem 1 α Quatil 2 der t Verteilug b mit 1 Freiheitsgrade Ablesebeispiel: = 20 r = 1 = 19 1 α = 0, 95 α = 0, 05 1 α = 0, 975 2 t 19;0,975 = 2, 09 a Dabei stellt ^σ 2 = 1 (xi x) 2 die geschätzte Variaz der Grudgesamtheit dar. 1 b Vgl. vo der Lippe (1998), Tabelle T 4, S. 120 3 Testtheorie 3.1 Eiführug I de vorherige Abschitte wurde Puktschätzer ud Kofidezitervalle behadelt, d.h., ma hat versucht auf der Basis der Stichprobe eie kokrete Wert bzw. ei Itervall potetieller Werte für de ubekate Parameter zu bestimme. 11

Im folgede werde Aahme/Vermutuge (Hypothese) über die Parameter der Verteilug eier Grudgesamtheit überprüft (statistischer Test). Dabei sid folgede Begriffe vo Bedeutug: Statistische Hypothese: Statistischer Test: Aahme/Vermutug über die Verteilug der Grudgesamtheit. Auf der Basis eier Prüfgröße T ( Stichprobefuktio) wird mit eier vorgegebee Irrtumswahrscheilichkeit α (Sigi kaziveau) über die Verwerfug oder Nichtverwerfug eier Hypothese etschiede. 3.2 Eistichprobetest Uabhägig vo dem kokret durchzuführede Test (Parameter oder Verteilugstest) verläuft die Durchführug eies statistische Tests ach dem folgede Schema: Formulierug der Nullhypothese ud der Alterativhypothese: H 0 : θ = θ 0 vs. H 1 : θ > θ 0 eiseitig ach obe < θ 0 eiseitig ach ute θ 0 zweiseitig Bestimmug der Prüfgröße/Teststatistik: Aufgrud der Stichprobeverteilug der Schätzer wird eie Prüfgröße oder auch Teststatistik kostruiert. Das geschieht, idem ma uter der Bedigug der Gültigkeit der Nullhypothese eie bestimmte Wert T ermittelt. Zur Ermittlug der Prüfgröße ka Abbildug 3 heragezoge werde. 4 Festlegug des Sigi kaziveaus α, Bestimmug des kritische Wertes: Die Wahl des Sigi kaziveaus bestimmt de kritische Wert. Der kritische Wert etspricht dem dem Sigi kaziveau zugeordete Quatil der (theoretische) Stichprobeverteilug der Prüfgröße. I usere Fälle ist das die Stadardormal bzw. t Verteilug. Für de Fall der Normalverteilug ud eiem Sigi kaziveau vo α = 0, 05 erhält ma folgede mögliche Werte: c = +1, 6449 c = 1, 6449 c = ±1, 96 eiseitig ach obe eiseitig ach ute zweiseitig Vergleich der Realisatio der Teststatistik mit dem kritische Wert c: Die empirische Größe (Prüfgröße) wird mit der theoretische Größe (kritischer Wert) vergliche. We die Wahrscheilichkeit für die Realisatio des empirische Wertes kleier als das vorgeschriebee Sigi kaziveau ist, emp ehlt es sich, die Nullhypothese abzulehe. Die Etscheidug über die Aahme bzw. Ablehug (besser Nichtaahme) der Nullhypothese geschieht mit folgede Etscheidugshilfe: Lehe H 0 ab, we gilt: T > c eiseitig ach obe T < c eiseitig ach ute T > c zweiseitig 4 Vgl. auch vo der Lippe (1998), Übersicht 9.3, S.97. 12

Abb. 3 Prüfgröße T ud kritischer Wert c im Eistichprobe Fall Bestimmug vo T σ 2 bekat σ 2 ubekat a Heterograd zmz X µ 0 X µ 0 σ ^σ zoz X µ 0 σ N N 1 X µ 0 ^σ N N 1 σ 2 bekat b zmz p π 0 π0 (1 π 0 ) Homograd zoz p π 0 π0 (1 π 0 ) N N Bestimmug des kritische Wertes c σ 2 der GG bekat? ja ei > 30 Der kritische Wert c etspricht dem 1 α Quatil der Stadardormalverteilug Ablesebeispiel: 1 α = 0, 95 zweiseitiger Test Φ(z) = 0, 95 z = ±1, 96 Der kritische Wert c etspricht dem 1 α Quatil (beim eiseitige Test) bzw. dem 1 α Quatil (beim zweiseitige Test) der 2 t Verteilug c mit 1 Freiheitsgrade Ablesebeispiel: = 20 r = 1 = 19 1 α = 0, 95 eiseitiger Test t 19;0,95 = 1, 73 a Dabei stellt ^σ 2 = 1 (xi x) 2 die geschätzte Variaz der Grudgesamtheit dar. 1 b Die Variaz der Grudgesamtheit wird dabei hypothetisch ageomme. c Vgl. vo der Lippe (1998), Tabelle T 4, S. 120 3.3 Zweistichprobetest Häu g werde statistische Tests zum Vergleich zweier Populatioe bzw. zweier Verteiluge heragezoge. Dies geschieht, um eideutige Kausalaussage mache zu köe, wie z.b. über die Wirksamkeit vo Medikamete. Zur Durchführug ist eie Experimetgruppe ud eie Kotrollgruppe otwedig. Diese beide Gruppe werde da hisichtlich eies bestimmte 13

Merkmals utersucht ud überprüft, ob sich die Merkmalswerte i de beide Gruppe sigi kat uterscheide. Dabei wird ageomme, daß zwei uabhägige Stichprobe vorliege, d.h., über die Zugehörigkeit eier Perso (oder eies Elemets) zur eie oder adere Gruppe wird ach dem Zufallsprizip etschiede. Für die Elemete der Gruppe 1 sei ageomme, daß sie aus eier Grudgesamtheit N(µ 1 ; σ 2 1 ) bzw. Z(π 1) stamme ud für die Elemete der Gruppe 2 aalog. Heterograder Fall: Die Hypothese laute: bzw. ( Vergleich zweier Mittelwerte) H 0 : µ 1 = µ 2 vs. H 1 : µ 1 µ 2 H 0 : µ 1 µ 2 = = 0 vs. H 1 : µ 1 µ 2 = 0 > 0 < 0 Das arithmetische Mittel ist ei erwartugstreuer Schätzer für de Parameterwert der Grudgesamtheit µ. Bei uabhägige Stichprobe gilt für die Differez zweier Mittelwerte somit: E(x 1 x 2 ) = E(x 1 ) E(x 2 ) = µ 1 µ 2 V(x 1 x 2 ) = V(x 1 ) + V(x 2 ) = σ2 1 1 + σ2 2 2. Eie Stadardisierug der Mittelwertdifferez führt zu T = (x 1 x 2 ) (µ 1 µ 2 ) σ 2 1 + σ2 2 1 2 Uter der Gültigkeit der Nullhypothese erhält ma: T H0 = (x 1 x 2 ) σ 2 1 + σ2 2 1 2 N(0; 1) we σ 2 1 ud σ 2 2 bekat sid. Fall 1 ud 2! t 2, mit = 1 + 2, we σ 2 1 ud σ 2 2 ubekat aber gleich sid. Fall 3! t ν, we σ 2 1 ud σ 2 2 ubekat ud ugleich sid. Fall 4! Homograder Fall: ( Vergleich vo Ateilswerte) H 0 : = π 1 π 2 = 0 vs. H 1 : = π 1 π 2 0 Als Prüfgröße erhält ma mit p 1 p 2 T = ( 1 P(1 P) + 1 ) N(0; 1) 1 2 P = 1p 1 + 2 p 2 1 + 2. > 0 < 0 14

3.4 α ud β Fehler Bei der Etscheidug für eie der beide Hypothese köe zwei Arte vo Fehler begage werde: Testetscheidug wirklicher Zustad H 0 ist wahr H 1 ist wahr H 0 kei Fehler Fehler 2. Art ( 1 α) (β Fehler β) H 1 Fehler 1. Art kei Fehler (α Fehler α) ( 1 β) Uter der Aahme, daß H 0 zutreffed ist, soll gelte P(T K α H 0 ) α, wobei K α de Ablehugsbereich kezeichet. Daraus folgt umittelbar P(T / K α H 0 ) 1 α. Die Wahrscheilichkeit β, d.h. die Wahrscheilichkeit dafür, H 0 fälschlicherweise azuehme, beträgt somit P(T / K α H 1 ) β. Die Prüfgröße fällt also i de Aahmebereich, welcher bei Gültigkeit vo H 0 spezi ziert ist, obwohl H 1 gültig ist. Beispiel 6 (homograder Fall) Ei Pharmakozer hat ei eues Medikamet auf de Markt gebracht. Der Kozer behauptet, daß die Heilugschace bei der Verwedug dieses Medikamets bei 0.75 liege. Diese Aussage ist eie statistische Hypothese, welche durch eie Stichprobe überprüft werde ka, z.b. durch = 40 Patiete, die mit dem Medikamet behadelt werde. Da das Medikamet icht a alle potetielle Patiete getestet werde ka, soder ur a diese 40, ka ma icht sicher sei, ob die aufgestellte Hypothese richtig oder falsch ist. I eiem Versuch wurde vo = 40 Versuchspersoe x = 25 Patiete geheilt (p = 25/40 = 0, 625). Das bestärkt die Krakekasseverbäde i der Aahme, daß das eue Medikamet icht die agegebee Heilugschace besitzt. Aufgrud der vorliegede Stichprobe wird u ei Hypothesetest durchgeführt, a desse Ede die Etscheidug für eie der beide Hypothese steht. 1. Formulierug der Hypothese bzw. der Gegehypothese: H 0 : π = 0, 75 vs. H 1 : π < 0, 75 2. Aufstelle der Teststatistik: homograder Fall, zmz da der Umfag der Grudgesamtheit icht bekat ist: T = p π 0 π 0 (1 π 0 ) = 0, 625 0, 75 0,75(1 0,75) 40 = 1, 8257. 3. Ermittlug des kritische Wertes: Bei der Wahl für ei Sigi kaziveau (hier: α = 0, 05) gelagt ma zu eiem kritische Wert, der i diesem Fall der Normalverteilug etomme wird. (c = 1, 6449) 4. Etscheidug: Da der Wert der Teststatistik kleier als der kritische Wert ist (T < c), ka die Nullhypothese zum Niveau α = 0, 05 abgeleht werde. Das bedeutet, daß sich das Stichprobeergebis sigi kat vom hypothetische Parameterwert uterscheidet. Die Aussage des Pharmakozers ka auf der Basis der vorliegede Stichprobe icht bestätigt werde. 15

5. Berechug des β Fehlers: Vorab wird der kritische Ateilswert berechet, d.h., der Wert, bei dem keie Etscheidug getroffe werde ka. I diesem Fall muß gelte: T = c T = c p c π 0 π 0 (1 π 0 ) = 1.6449 p c = 0.6374. We u der Ateilswert i der Stichprobe kleier als p c ist, fällt die Etscheidug zuguste vo H 1, ist er größer als p c, etscheidet ma sich für H 0. Der β Fehler bedeutet, daß ma sich für H 0 etscheidet d.h. p > p c, obwohl H 1 gültig ist: P(T / K α H 1 ) β. 0.6374 0.5 P T H1 > = 1 P(T 1.7378) = 0.0406. 0.5 0.5 40 3.5 Zusammehag vo Kofidezitervalle ud Hypothesetests Das Ergebis eies statistische Tests heißt sigi kat, we H 0 abgeleht wird. Daraus läßt sich folgedes formuliere: Sigi kat bedeutet, daß das um de Stichprobewert ^θ kostruierte Kofidezitervall de hypothetische Parameterwert θ 0 icht ethält. Die Greze des Kofidezitervalls schließe de ubekate Parameterwert mit eier Vertraueswahrscheilichkeit vo 1 α ei. D.h., jeder Wert im Kofidezitervall ist verträglich mit der Hypothese H 0. Das bedeutet aber icht, daß H 0 auch wahr ist, soder lediglich, daß das Stichprobeergebis icht gege de hypothetische Parameterwert spricht. We der hypothetische Parameterwert icht im Kofidezitervall liegt, so bedeutet dies, daß sich der wahre ud der hypothetische Parameterwert uterscheide. Sie sid statistisch uterscheidbar oder ebe sigi kat! Literaturempfehluge ASSENMACHER, W. (2000): Iduktive Statistik; Berli u.a., Spriger. BAMBERG, G., BAUER, F. (1998): Statistik, 10. Au age; M üche u.a., Oldebourg. BLEYMÜLLER, J., GEHLERT, G. ud GÜLICHER, H. (1996): Statistik für Wirtschaftswisseschaftler, 10. Au age; Müche, Vahle. GONICK, L, SMITH, W. (1993): The cartoo guide to Statistics; New York, Harper Pereial. HARTUNG, J., HEINE, B. (1996): Statistik Übuge: Iduktive Statistik, 3. Au age; M üche u.a., Oldebourg. LINDGREN, B. W. (1976): Statistical Theory, 3rd Editio; New York, Macmilla. LIPPE, P. VON DER (1998): Iduktive Statistik: Formel, Aufgabe, Klausuretraiig, 5. Au age; Müche u.a., Oldebourg. SCHLITTGEN, R. (1998): Eiführug i die Statistik: Aalyse ud Modellierug vo Date, 8. Au age; Müche u.a., Oldebourg. SCHWARZE, J. (1997): Grudlage der Statistik II: Wahrscheilichkeitsrechug ud iduktive Statistik, 6. Au age; Here, Berli, Neue Wirtschafts Briefe. SCHWARZE, J. (1999): Aufgabesammlug zur Statistik, 3. Au age; Here, Berli, Neue Wirtschafts Briefe. 16