Kapitel 2. Induktive Statistik. 2.1 Grundprinzipien der induktiven Statistik

Ähnliche Dokumente
Wirksamkeit, Effizienz

Wirksamkeit, Effizienz

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

4 Schwankungsintervalle Schwankungsintervalle 4.2

Kapitel 6 : Punkt und Intervallschätzer

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

3. Grundbegrie der Schätztheorie

Schätzen von Populationswerten

2 Induktive Statistik

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

X X Schätzen von Vertrauensintervallen Schwankungsintervall

Schätzen von Populationswerten

X in einer Grundgesamtheit vollständig beschreiben.

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Statistische Modelle und Parameterschätzung

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Kapitel 5: Schließende Statistik

Statistik, Abschnitt (1) Gegeben sei der Stichprobenvektor (X 1,..., X n ). Die Stichprobenfunktion. ˆµ k := 1 n. Xi k (1) i=1.

Tests statistischer Hypothesen

Parameterschätzung. Numero, pondere et mensura Deus omnia condidit

Konfidenzintervalle. Praktische Übung Stochastik SS 2017 Lektion 10 1

2. Repetition relevanter Teilbereiche der Statistik

Wahrscheinlichkeitstheorie und Statistik vom

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Parameterschätzung. Kapitel Schätzfunktionen

7. Stichproben und Punktschätzung

Anwendung für Mittelwerte

2.3 Intervallschätzung

Empirische Verteilungsfunktion

Induktive Schlussweise. Schätzfunktionen und Schätzverfahren. Bibliografie

Statistik und Wahrscheinlichkeitsrechnung

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

Eingangsprüfung Stochastik,

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Maximum Likelihood Version 1.6

Übungen zu QM III Mindeststichprobenumfang

Statistik. 2. Semester. Begleitendes Skriptum zur Vorlesung. im FH-Masterstudiengang. Technisches Management. von. Günther Karigl

Inhaltsverzeichnis. Wirtschaftswissenschaftliches Zentrum 11 Universität Basel. Mathematik 2

Übungen mit dem Applet erwartungstreu

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

10. Intervallschätzung 10.1 Begriff des Konfidenzintervalls

Logarithmusfunktion, Rechenregeln für Logarithmen, Ableiten von Logarithmen (die Ableitung nach p wird hier stets als p geschrieben)

Formelsammlung Statistik 29. Januar 2019

10. Testen von Hypothesen Seite 1 von 6

Kapitel 12. Schätzung von Parametern

2.3 Intervallschätzung

1.8 Mehrdimensionale Zufallsvariablen

3 Vergleich zweier unverbundener Stichproben

Prof. Dr. Roland Füss Statistik II SS 2008

Einführung in die Stochastik 10. Übungsblatt

2 Induktive Statistik

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft.

Maximum-Likelihood-Methode (ML-Methode)

Maximum-Likelihood-Methode (ML-Methode)

Grundproblem der Inferenzstatistik

Erläuterung Beispiel III

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Lösungsvorschlag Probeklausur zur Elementaren Wahrscheinlichkeitsrechnung

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2015/2016. Aufgabe 1

Grenzwert. 1. Der Grenzwert von monotonen, beschränkten Folgen

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Ulrich Stein Fehlerrechnung

Klausur vom

Wahrscheinlichkeitsrechnung & Statistik - Ergänzung zum Skript

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Kapitel 3: Bedingte Wahrscheinlichkeiten und Unabhängigkeit

Kapitel 9: Schätzungen

2 Einführung in die mathematische Statistik

11 Likelihoodquotiententests

Diskrete Wahrscheinlichkeitstheorie Wiederholungsklausur

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung

Übungsblatt 9 zur Vorlesung. Statistische Methoden

Statistische Experimente, statistische Modelle

Schließende Statistik

Schließende Statistik

Schließende Statistik

Schließende Statistik

Schließende Statistik

Schließende Statistik

Testen statistischer Hypothesen

Schließende Statistik

Diskrete Zufallsvariablen

Stochastik für WiWi - Klausurvorbereitung

1. Wahrscheinlichkeitsrechnung. 2. Diskrete Zufallsvariable. 3. Stetige Zufallsvariable. 4. Grenzwertsätze. 5. Mehrdimensionale Zufallsvariable

Statistik und Wahrscheinlichkeitsrechnung

Einführung in die Wahrscheinlichkeitstheorie Lösungen zum Wiederholungsblatt

Diplomvorprüfung Stochastik

Teil II Zählstatistik

Transkript:

Kapitel Iduktive Statistik.1 Grudprizipie der iduktive Statistik Ziel: Iferezschluss, Repräsetatiosschluss: Schluss vo eier Stichprobe auf Eigeschafte der Grudgesamtheit, aus der sie stammt. Vo Iteresse sei ei Merkmal X i der Grudgesamtheit Ω. Ziehe eie Stichprobe ω 1,..., ω vo Elemete aus Ω ud werte X jeweils aus. Ma erhält Werte x 1,..., x. Diese sid Realisatioe der i.i.d Zufallsvariable oder Zufallselemete X 1,..., X wobei die Wahrscheilichkeitsverteilug der X 1,..., X geau die Häufigkeitsverhältisse i der Grudgesamtheit widerspiegelt. Die Frage lautet also: wie kommt ma vo Realisatioe x 1,..., x vo i.i.d. Zufallsvariable X 1,..., X auf die Verteilug der X i? Dazu immt ma häufig a, ma kee de Grudtyp der Verteilug der X 1,..., X. Ubekat seie ur eizele Parameter davo. Beispiel: X i sei ormalverteilt, ubekat seie ur µ, σ. = parametrische Verteilugsaahme meist im Folgede Alterativ: Verteilugstyp icht oder ur schwach festgelegt z.b. symmetrische Verteilug = ichtparametrische Modelle Klarerweise gilt im Allgemeie geerelles Problem bei der Modellierug: Parametrische Modelle liefer schärfere Aussage we ihre Aahme zutreffe. We ihre Aahme icht zutreffe, da existiert die große Gefahr vo Fehlschlüsse. Wichtige Fragestelluge der iduktive Statistik: Zufallsstichprobe möglichst gute Aussage Treffe mittels der Auswertug eier 63

64.. Pukschätzug über bestimmte Charakteristika der Grudgesamtheit. Welche Charakteristika sid für die Fragestellug relevat? Natürlich werde für die Iferez bezüglich des Erwartugswerts adere Methode als für Schlüsse über die Variaz beötigt. verschiedee Forme: Puktschätzug: z.b. wahrer Ateil 0.4751 Itervallschätzug: z.b. wahrer Ateil liegt zwische 0.46 ud 0.48 Hpothesetest: der Ateil liegt höchstes bei 50% Was heißt gut? Festlegug vo Gütekriterie Geauigkeit? Wahrscheilichkeit eies Fehlers gerig? Wie kostruiert ma ei gutes/optimales Verfahre?. Pukschätzug Ziel: Fide eie möglichst gute Schätzwert für eie bestimmte Kegröße ϑ Parameter der Grudgesamtheit, z.b. de wahre Ateil der rot/grü-wähler, de wahre Mittelwert, die wahre Variaz, aber auch z.b. das wahre Maximum Widgeschwidigkeit...1 Schätzfuktioe Gegebe sei die i Kapitel.1 beschriebee Situatio: X 1,..., X i.i.d. Stichprobe eies Merkmales X. Defiitio: Sei X 1,..., X i.i.d. Stichprobe. Eie Fuktio heißt Schätzer oder Schätzfuktio. T = gx 1,..., X Beachte ochmals: Vor Ziehug der Stichprobe sid die Werte vo T zufällig, deshalb werde Schätzfuktioe mit Großbuchstabe bezeichet wie Zufallsvariable Typische Beispiele für Schätzfuktioe: 1. Arithmetisches Mittel der Stichprobe: X = gx 1,..., X = 1 Für biäre, dummy-kodierte X i ist X auch die relative Häufigkeit des Auftretes vo X i = 1 i der Stichprobe X i

Kapitel. Iduktive Statistik 65. Stichprobevariaz: S = gx 1,..., X = 1 X i X 3. Korrigierte Stichprobevariaz: S = gx 1,..., X = 1 1 4. Größter Stichprobewert: 5. Kleister Stichprobewert: X i X = 1 1 X = gx 1,..., X = max,..., X i X 1 = gx 1,..., X = mi,..., X i Xi X Schätzfuktio ud Schätzwert: Da X 1,..., X zufällig sid, ist auch die Schätzfuktio T = gx 1,..., X zufällig. Zieht ma mehrere Stichprobe, so erhält ma jeweils adere Realisatioe vo X 1,..., X, ud damit auch vo T. Die Realisatio t kokreter Wert der Zufallsvariable T Variable heißt Schätzwert. X 1,... X Zufallsvariable T = gx 1,..., X x 1,... x Realisatioe t = gx 1,..., x Ma hat i der Praxis meist ur eie kokrete Stichprobe ud damit auch ur eie kokrete Wert t vo T. Zur Beurteilug der mathematische Eigeschafte werde aber alle dekbare Stichprobe ud die zugehörige Realisatioe der Schätzfuktio T heragezoge. D.h. beurteilt wird icht der eizele Schätzwert als solcher, soder die Schätzfuktio, als Methode, d.h. als Regel zur Berechug des Schätzwerts aus der Stichprobe. Adere Notatio i der Literatur: ˆϑ Schätzer für ϑ. Dabei wird icht mehr direkt uterschiede zwische Zufallsvariable bei us Großbuchstabe ud Realisatio bei us klei. = Schreibe ˆϑX 1,..., X bzw. ˆϑx 1,..., x we die Uterscheidug beötigt wird. Beispiel: Durchschittliche Azahl der Statistikbücher i eier Grudgesamtheit vo Studete schätze.

66.. Pukschätzug Grudgesamtheit: Drei Persoe Ω = { ω 1, ω, ω 3 }. Merkmal X: Azahl der Statistikbücher Wahrer Durchschittswert: µ =. X ω 1 = 3 X ω = 1 X ω3 =. Stichprobe X 1, X ohe Zurücklege Stichprobeumfag = : wobei Betrachte folgede mögliche Schätzer: X 1 = Xω 1 X = Xω ω 1 erste gezogee Perso, ω zweite gezogee Perso. T 1 = g 1 X 1, X = X = X 1 + X T = X 1 T 3 = gx 1, X = 1 X = maxx 1, X Zur Beurteilug: Alle mögliche Stichprobe vom Umfag =, ohe Zurücklege betrachte: Nummer Persoe Realisatioe vo der Stichprobe X 1 X T 1 T T 3 1 ω 1, ω 3 1 3 3 ω 1, ω 3 3.5 3 3 3 ω, ω 1 1 3 1 3 4 ω, ω 3 1 1.5 1 1 5 ω 3, ω 1 3.5 3 6 ω 3, ω 1 1.5 1.. Gütekriterie Beurteile die Schätzfuktioe, also das Verfahre a sich, icht de eizele Schätzwert. Besoders bei komplexere Schätzprobleme sid klar festgelegte Güteeigeschafte wichtig. Natürlich ist auch festzulege, was geschätzt werde soll. Im Folgede sei der Parameter ϑ stets eie eidimesioale Kegröße der Grudgesamtheit z.b. Mittelwert, Variaz, Maximum Da T zufällig ist, ka ma icht erwarte, dass ma immer de richtige Wert trifft, aber de Erwartugswert vo T bereche: Erstes Kriterium: keie systematische Uter- oder Überschätzug, d.h. Erwartugswert des Schätzers = wahrer Wert

Kapitel. Iduktive Statistik 67 Erwartugstreue, Bias: Gegebe sei eie Stichprobe X 1,..., X ud eie Schätzfuktio T = gx 1,..., X mit existieredem Erwartugswert. T heißt erwartugstreu für de Parameter ϑ, falls gilt für alle ϑ. Die Größe E ϑ T = ϑ Bias ϑ T = E ϑ T ϑ heißt Bias oder Verzerrug der Schätzfuktio. Erwartugstreue Schätzfuktioe habe per Defiitio eie Bias vo 0. Ma schreibt E ϑ T ud Bias ϑ T, um deutlich zu mache, dass die Größe vo dem wahre ϑ abhäge. Aschauliche Iterpretatio: Erwartugstreue bedeutet, dass ma im Mittel bei wiederholter Durchführug des Experimets de wahre Wert trifft. Fortsetzug des Beispiels: Stichprobeziehug gemäß reier Zufallsauswahl, d.h. jede Stichprobe hat dieselbe Wahrscheilichkeit gezoge zu werde hier 1 6. Es gilt: bei ϑ = µ = E µ T 1 = 1 6 +.5 + + 1.5 +.5 + 1.5 = 1 6 = I der Tat gilt allgemei: Das arithmetische Mittel ist erwartugstreu für de Erwartugswert. E µ T = 1 3 + 3 + 1 + 1 + + = 6 Wieder gilt allgemei: Eizele Stichprobevariable ergebe erwartugstreue Schätzer für de Erwartugswert. E µ T 3 = 1 6 4 3 + 1 = 4 3 T 3 ist icht erwartugstreu. Bias µ T 3 = E µ T 3 = 4 3 6 3 = 3 Bias ud Erwartugstreue bei eiige typische Schätzfuktioe Das arithmetische Mittel X = 1 X i ist erwartugstreu für de Mittelwert µ eier Grudgesamtheit: Aus X 1,..., X i.i.d. ud E µ X 1 = E µ X =... = µ folgt: E X 1 = E µ X i = 1 E µ X i = 1 EX i = 1 µ = 1 µ = µ

68.. Pukschätzug Sei σ die Variaz i der Grudgesamtheit. Es gilt also ist S icht erwartugstreu für σ. E σ S = 1 σ, Bias σ S = 1 σ σ = 1 σ Für die korrigierte Stichprobevariaz gilt dagege: E σ S 1 = E σ X i 1 X 1 = E σ 1 X i X = E σ 1 S = 1 1 σ = σ Also ist S erwartugstreu für σ. Diese Eigeschaft ist auch die Motivatio für die Korrektur der Stichprobevariaz. Vorsicht: Im Allgemeie gilt für beliebige, ichtlieare Fuktioe g E gx gex. Ma ka also icht eifach z.b. ud E vertausche. I der Tat gilt: S ist zwar erwartugstreu für σ, aber S ist icht erwartugstreu für σ = σ. Beispiel Wahlumfrage: Gegebe sei eie Stichprobe der wahlberechtigte Budesbürger. Gebe Sie eie erwartugstreue Schätzer des Ateils der rot-grü Wähler a. Grudgesamtheit: Dichotomes Merkmal { 1 rot/grü: ja X = 0 rot/grü: ei Der Mittelwert π vo X ist der Ateil der rot/grü-wähler i der Grudgesamtheit. Stichprobe X 1,..., X vom Umfag : { 1 i-te Perso wählt rot/grü X i = 0 sost Aus de Überleguge zum arithmetische Mittel folgt, dass X = 1 X i ei erwartugstreuer Schätzer für de hier betrachtete Parameter π ist.

Kapitel. Iduktive Statistik 69 Also verwedet ma die relative Häufigkeit i der Stichprobe, um de wahre Ateil π i der Grudgesamtheit zu schätze. Bedeutug der Erwartugstreue: Erwartugstreue ist ei schwaches Kriterium! Betrachte die offesichtlich usiige Schätzfuktio T = g X 1,..., X = X 1, d.h. T = 100%, falls der erste Befragte rot-grü wählt ud T = 0% sost. Die Schätzfuktio igoriert fast alle Date, ist aber erwartugtreu: ET = EX 1 = µ Deshalb betrachtet ma zusätzlich die Effiziez eies Schätzers, s.u. Asymptotische Erwartugstreue Eie Schätzfuktio heißt asymptotisch erwartugstreu, falls bzw. gelte. lim Eˆθ = θ. lim Biasˆθ = 0. Abschwächug des Begriffs der Erwartugstreue: Gilt ur och bei eier uedlich große Stichprobe. Erwartugstreue Schätzer sid auch asmptotisch erwartugstreu. Sowohl S als auch S sid asymptotisch erwartugstreu...3 Effiziez Beispiel Wahlumfrage: Gegebe sid die drei erwartugstreue Schätzer sei gerade: T 1 = 1 T = 1 / X i / X i Was uterscheidet T 1 vo dem usiige Schätzer T, der die i der Stichprobe ethaltee Iformatio icht vollstädig ausutzt? Vergleiche die Schätzer über ihre Variaz, icht ur über de Erwartugswert!

70.. Pukschätzug We so groß ist, dass der zetrale Grezwertsatz agewedet werde ka, da gilt approximativ ud damit 1 X i π = X i π = π1 π π1 π Aalog ka ma zeige: T 1 = 1 T = 1 / X i N / X i N π; π, 1 X i π π1 π π1 π. π1 π. / N 0; 1 T 1 ud T sid approximativ ormalverteilt, wobei T 1 eie deutlich kleiere Variaz als T hat. T 1 ud T treffe beide im Durchschitt de richtige Wert π. T 1 schwakt aber weiger um das wahre π, ist also im Durchschitt geauer. Adere Iterpretatio: Dichte vo T 1 Dichte vo T π π π + Für jede Pukt π + > π ist damit P T 1 > π + < P T > π + ud für jede Pukt π < π ist P T 1 < π < P T < π. Es ist also die Wahrscheilichkeit, midstes um π + π bzw. π π daebe zu liege, bei T stets größer als bei T 1. Ei kokreter Wert ist damit verlässlicher, we er vo T 1, als we er vo T stammt. Diese Überlegug gilt gaz allgemei: Ei erwartugstreuer Schätzer ist umso besser, je kleier seie Variaz ist. VarT = Erwartete quadratische Abweichug vo T vo ET }{{} =ϑ! Je kleier die Variaz, umso mehr kozetriert sich die Verteilug eies erwartugstreue Schätzers um de wahre Wert. Dies ist umso wichtiger, da der Schätzer de wahre Wert i.a. ur selte exakt trifft.

Kapitel. Iduktive Statistik 71 Effiziez: Gegebe seie zwei erwartugstreue Schätzfuktioe T 1 ud T für eie Parameter ϑ. Gilt Var ϑ T 1 Var ϑ T für alle ϑ ud so heißt T 1 effizieter als T. Var ϑ T 1 < Var ϑ T für midestes ei ϑ Eie für ϑ erwartugstreue Schätzfuktio T heißt UMVU-Schätzfuktio für ϑ uiformly miimum v ariace ubiased, falls Var ϑ T Var ϑ T für alle ϑ ud für alle erwartugstreue Schätzfuktioe T. Bemerkuge: Ihaltliche Bemerkug: Der tiefere Si vo Optimalitätskriterie wird klassischerweise isbesodere auch i der Gewährleistug vo Objektivität gesehe. Ohe wisseschaftliche Koses darüber, welcher Schätzer i welcher Situatio zu wähle ist, wäre die Auswertug eier Stichprobe willkürlich ud der Maipulatio Tür ud Tor geöffet. Ist X 1,..., X eie i.i.d. Stichprobe mit X i N µ, σ, da ist X UMVU-Schätzfuktio für µ ud S UMVU-Schätzfuktio für σ. Ist X 1,..., X mit X i {0, 1} eie i.i.d. Stichprobe mit π = P X i = 1, da ist die relative Häufigkeit X UMVU-Schätzfuktio für π. Bei icht erwartugstreue Schätzer macht es keie Si, sich ausschließlich auf die Variaz zu kozetriere. Z.B. hat der usiige Schätzer T = gx 1,..., X = 4, der die Stichprobe icht beachtet, Variaz 0. Ma zieht da de sogeate Mea Squared Error zur Beurteilug hera. Es gilt MSE ϑ T := E ϑ T ϑ MSE ϑ T = Var ϑ T + Bias ϑ T. Der MSE ka als Kompromiss zwische zwei Auffassuge vo Präzisio gesehe werde: möglichst gerige systematische Verzerrug Bias ud möglichst gerige Schwakug Variaz.

7.. Pukschätzug Kosistez Ei Schätzer heißt MSE-kosistet, we gilt lim MSET = 0. Beispiel: Der MSE vo X ist gegebe durch MSE X = Var X + Bias X = σ + 0 = σ 0. X ist also eie MSE-kosistete Schätzug für de Erwartugswert. Ei Schätzer heißt kosistet, we gilt X ist also auch kosistet. lim VarT = 0...4 Kostruktiosprizipie guter Schätzer Die Methode der kleiste Quadrate = Regressiosaalyse Das Maximum-Likelihood-Prizip Aufgabe: Schätze de Parameter ϑ eies parametrische Modells ahad eier i.i.d. Stichprobe X 1,..., X mit der kokrete Realisatio x 1,..., x. Idee der Maximium-Likelihood ML Schätzug für diskrete Verteiluge: Ma ka für jedes ϑ die Wahrscheilichkeit ausreche, geau die Stichprobe x 1,..., x zu erhalte: P ϑ X 1 = x 1, X = x,..., X = x = P ϑ X i = x i Je größer für ei gegebees ϑ 0 diese Wahrscheilichkeit ist, umso plausibler ist es, dass tatsächlich ϑ 0 der wahre Wert ist gute Übereistimmug zwische Modell ud Date. Beispiel: I.i.d. Stichprobe vom Umfag = 5 aus eier B10, π-verteilug: 6 5 3 4 4

Kapitel. Iduktive Statistik 73 Wahrscheilichkeit der Stichprobe für gegebees π: P X 1 = 6,..., X 5 = 4 π = P X 1 = 6 π... P X 5 = 4 π 10 10 = π 6 1 π 4... π 4 1 π 6. 6 4 Wahrscheilichkeit für eiige Werte vo π: π P X 1 = 6,..., X 5 = 4 π 0.1 0.0000000000001 0. 0.0000000700 0.3 0.0000040450 0.4 0.000305481000 0.5 0.000487367000 0.6 0.000006561150 0.7 0.000000050490 0.8 0.0000000000055 0.9 0.0000000000000 Ma et daher Lϑ = P ϑ X 1 = x 1,..., X = x, u als Fuktio vo ϑ gesehe, die Likelihood deutsch: Plausibilität, Mutmaßlichkeit vo ϑ gegebe die Realisatio x 1,..., x. Derjeige Wert ˆϑ = ˆϑx 1,..., x, der Lϑ maximiert, heißt Maximum-Likelihood- Schätzwert; die zugehörige Schätzfuktio T X 1,..., X Maximum-Likelihood-Schätzer. Bemerkuge: Für stetige Verteiluge gilt P ϑ X 1 = x 1, X = x,..., X = x = 0 für beliebige Werte ϑ. I diesem Fall verwedet ma die Dichte als Maß für die Plausibilität vo ϑ. f ϑ x 1,..., x = f ϑ x i Für die praktische Berechug maximiert ma statt der Likelihood typischerweise die Log-Likelihood lϑ = llϑ = l P ϑ X i = x i = l P ϑ X i = x i bzw. lϑ = l f ϑ x i = l f ϑ x i. Dies liefert deselbe Schätzwert ˆϑ ud erspart beim Differeziere die Awedug der Produktregel.

74.. Pukschätzug Der Logarithmus ist streg mooto wachsed. Allgemei gilt für streg mooto wachsede Fuktioe g: x 0 Stelle des Maximums vo Lx x 0 auch Stelle des Maximums vo glx. Defiitio: Gegebe sei die Realisatio x 1,..., x eier i.i.d. Stichprobe. Die Fuktio i ϑ P ϑ X i = x i falls X i diskret Lϑ = f ϑ x i falls X i stetig. heißt Likelihood des Parameters ϑ bei der Beobachtug x 1,..., x. Derjeige Wert ˆϑ = ˆϑx 1,..., x, der Lϑ maximiert, heißt Maximum-Likelihood-Schätzwert; die zugehörige Schätzfuktio T X 1,..., X Maximum-Likelihood-Schätzer. Beispiel: Wahlumfrage X i = Verteilug der X i : Biomialverteilug Likelihood: Logarithmierte Likelihood: P X i = 1 = π P X i = 0 = 1 π { 1 falls Rot/Grü 0 sost P X i = x i = π xi 1 π 1 x i, x i {0; 1}. Lπ = P X 1 = x 1,..., X = x = π x i 1 π 1 x i lϑ = lp X 1 = x 1,..., X = x = Ableite ach ϑ: π lπ = Nullsetze ud ach π Auflöse: π lπ = 0 = π xi 1 π x i π x i x i + x i lπ + 1 π x i 1 x i π = 1 π 1 π x i = π π x i l1 π x i

Kapitel. Iduktive Statistik 75 also x i = π ˆπ = x i ML-Schätzug bei Normalverteilug 1. Schritt: Bestimme die Likelihoodfuktio Lµ, σ 1 = πσ 1 1 = exp π σ exp 1 1 σ σ x i µ x i µ. Schritt: Bestimme die Log-Likelihoodfuktio lµ, σ = llµ, σ = l1 lπ lσ 1 σ x i µ 3. Schritt: Ableite ud Nullsetze der Loglikelihoodfuktio lµ, σ µ = 1 σ x i µ = 0 lµ, σ = 1 σ σ + 1 σ x i µ = 0 4. Schritt: Auflöse der beide Gleichuge ach µ ud σ Aus der erste Gleichug erhalte wir x i µ = 0 also ˆµ = x. Aus der zweite Gleichug erhalte wir durch Eisetze vo ˆµ = x x i x = σ also ˆσ = 1 x i x

76.3. Itervallschätzug Fazit: Der ML-Schätzer ˆµ = X für µ stimmt mit dem übliche Schätzer für de Erwartugswert überei. Der ML-Schätzer ˆσ = S für σ ist verzerrt, d.h. icht erwartugstreu. Eiige allgemeie Eigeschafte vo ML-Schätzer ML-Schätzer ˆθ sid im Allgemeie icht erwartugstreu. ML-Schätzer ˆθ sid asymptotisch erwartugstreu. ML-Schätzer ˆθ sid kosistet..3 Itervallschätzug.3.1 Motivatio ud Hiführug Beispiel Wahlumfrage: Der wahre Ateil der rot-grü Wähler 00 war geau 47.1%. Wie groß ist die Wahrscheilichkeit, i eier Zufallsstichprobe vo 1000 Persoe geau eie relative Ateil vo 47.1% vo rot-grü Ahäger erhalte zu habe? X i = { 1, rot/grü 0, sost P X i = 1 = π = 0.471 X = X i B, π mit = 1000 P X = 471 = π x 1 π x x 1000 = 0.471 471 1 0.471 59 471 = 0.0567 D.h., mit Wahrscheilichkeit vo etwa 97.4%, verfehlt der Schätzer de wahre Wert. Hat ma ei stetiges Merkmal, so ist sogar P X = a = 0 für jedes a, d.h. der wahre Wert wird mit Wahrscheilichkeit 1 verfehlt. Kosequeze: Isbesodere Vorsicht bei der Iterpretatio kapper Ergebisse z.b. Ateil 50.%

Kapitel. Iduktive Statistik 77 Suche Schätzer mit möglichst kleier Variaz, um im Durchschitt möglichst ahe dra zu sei Es ist häufig auch gar icht ötig, sich geau auf eie Wert festzulege. Oft reicht die Agabe eies Itervalls, vo dem ma hofft, dass es de wahre Wert überdeckt: Itervallschätzug Symmetrische Itervallschätzug basiered auf eier Schätzfuktio T = gx 1,..., X : IT = [T a, T + a] Trade off bei der Wahl vo a: Je größer ma a wählt, also je breiter ma das Itervall IT macht, umso größer ist die Wahrscheilichkeit, dass IT de wahre Wert überdeckt, aber umso weiger aussagekräftig ist da die Schätzug. Extremfall im Wahlbeispiel: IT = [0, 1] überdeckt sicher π, macht aber eie wertlose Aussage Wie soll ma a wähle? Typisches Vorgehe: Ma gebe sich eie Sicherheitsgrad Kofideziveau γ vor. Da kostruiert ma das Itervall so, dass es midestes mit der Wahrscheilichkeit γ de wahre Parameter überdeckt..3. Defiitio vo Kofidezitervalle: Gegebe sei eie i.i.d. Stichprobe X 1,..., X zur Schätzug eies Parameters ϑ ud eie Zahl γ 0; 1. Ei zufälliges Itervall CX 1,..., X heißt Kofidezitervall zum Sicherheitsgrad γ Kofideziveau γ, falls für jedes ϑ gilt: Bemerkuge: P ϑ ϑ CX 1,..., X γ. }{{} zufälliges Itervall Die Wahrscheilichkeitsaussage bezieht sich auf das Ereigis, dass das zufällige Itervall de feste, wahre Parameter überdeckt. Streg geomme darf ma im objektivistische Verstädis vo Wahrscheilichkeit icht vo der Wahrscheilichkeit spreche, dass ϑ i dem Itervall liegt, da ϑ icht zufällig ist ud somit keie Wahrscheilichkeitsverteilug besitzt. Typischerweise kostruiert ma Kofidezitervalle symmetrisch um eie Schätzer T. Es sid aber auch machmal z.b. eiseitige Kofidezitervalle, etwa der Form [ X, X + b], sivoll beispielsweise bei sozial uerwüschte Ereigisse.

78.3. Itervallschätzug.3.3 Kostruktio vo Kofidezitervalle Für die Kostruktio praktische Vorgehesweise: Suche Zufallsvariable Z, die de gesuchte Parameter ϑ ethält ud dere Verteilug aber icht mehr vo dem Parameter abhägt, Pivotgröße, dt. Agelpukt. Da wähle de Bereich C Z so, dass P ϑ Z C Z = γ ud löse ach ϑ auf. Kofidezitervall für de Mittelwert eies ormalverteilte Merkmals bei bekater Variaz: X 1,..., X i.i.d. Stichprobe gemäß X i N µ, σ, wobei σ bekat sei. Starte mit der Verteilug vo X: Da erfüllt X N µ, σ /. Z = X µ σ die obige Bediguge a eie Pivotgröße. N 0; 1 Bestimme jetzt eie Bereich [ z, z], wobei z so gewählt sei, dass P Z [ z; z] = γ Bestimmug vo z: beziehugsweise 1 γ γ -z 0 z 1 γ P Z [ z; z] = γ P Z z = 1 γ P Z z = 1 1 γ = 1 + γ = 1 + γ. Der etsprechede Wert lässt sich aus der Tabelle der Stadardormalverteilug ablese. Typische Beispiele:

Kapitel. Iduktive Statistik 79 γ = 90% 1+γ = 95% z = 1.65 γ = 95% 1+γ = 97.5% z = 1.96 γ = 99% 1+γ = 99.5% z =.58 Die Größe z heißt das 1+γ -Quatil ud wird mit z 1+γ Damit gilt also P z 1+γ Z z 1+γ = P z 1+γ bezeichet. X µ σ z 1+γ Jetzt ach µ auflöse: γ = P z 1+γ σ X µ z 1+γ σ = P X z 1+γ σ µ X + z 1+γ σ = P X z 1+γ σ µ X + z 1+γ σ Damit ergibt sich das Kofidezitervall [ X z 1+γ σ, X + z 1+γ σ ] [ = X ± z 1+γ σ ] = γ Bemerkuge: Je größer σ, desto größer das Itervall! Größeres σ Grudgesamtheit bezüglich des betrachtete Merkmals heterogeer, also größere Streuug vo X ugeauere Aussage. Je größer γ, desto größer z 1+γ Je mehr Sicherheit/Vorsicht desto breiter das Itervall Je größer ud damit, desto schmaler ist das Itervall Je größer der Stichprobeumfag ist, desto geauer! Ka ma zur Stichprobeplaug verwede! Kofidezitervall für de Mittelwert eies ormalverteilte Merkmals bei ubekater Variaz: Nebe dem Erwartugswert ist auch σ ubekat ud muss etspreched durch de UMVU-Schätzer S = 1 1 X i X, mit S = S geschätzt werde. Allerdigs ist Z = X µ S

80.3. Itervallschätzug jetzt icht mehr ormalverteilt, de S ist zufällig. Wir führe deshalb ei eues Verteilugsmodell ei. t-verteilug: Gegebe sei eie i.i.d. Stichprobe X 1,..., X mit X i N µ, σ. Da heißt die Verteilug vo Z = X µ S t-verteilug oder Studet-Verteilug mit ν = 1 Freiheitsgrade. I Zeiche: Z tν. Iformelle Erklärug zum Begriff Freiheitsgrade: Bei Ketis vo x ur 1 frei variierbare Date. Wichtige Werte der t-verteilug sid tabelliert. Agegebe sid, für verschiedee δ, die Lösug t δ der Gleichug P Z t ν δ = δ, wobei t ν δ vo der Azahl ν der Freiheitsgrade abhägt. t δ ist das δ-quatil der etsprechede t-verteilug aalog zu z δ als Quatil der Stadardormalverteilug. Die Dichte eier t-verteilug ist der Dichte der Stadardormalverteilug sehr ählich: Sie ist auch symmetrisch um 0, besitzt aber etwas höhere Dichte für extreme Werte schwerere Ede. fx 0.4 0.3 0. 0.1 0.0-4 - 0 4 x Dichte vo t-verteiluge für ν = 1, =, = 5 - - - ud = 0 Freiheitsgrade. Usicherheit durch zusätzliche Schätzug vo σ lässt Date stärker schwake. Je größer ν ist, umso ählicher sid sich die tν-verteilug ud die Stadardormalverteilug. Für ν sid sie gleich, ab ν = 30 gilt der Uterschied als verachlässigbar. Je größer, desto geriger ist der Uterschied zwische S ud σ ud damit zwische X µ S ud X µ σ. Kofidezitervall zum Kofideziveau γ:

Kapitel. Iduktive Statistik 81 Ausgehed vo P t 1+γ 1 X µ S t 1+γ 1 = γ wie im Beispiel mit bekater Variaz ach µ auflöse mit S statt σ P X t 1+γ 1 S µ X + t 1+γ 1 S = γ Damit ergibt sich das Kofidezitervall [ X ± t ] 1+γ 1 S Bemerkuge: Es gelte aaloge Aussage zum Stichprobeumfag ud Kofideziveau wie bei bekater Variaz. Für jedes γ ud jedes ν gilt t 1+γ > z 1+γ also ist das t-verteilugs-kofidezitervall etwas breiter. Da σ ubekat ist, muss es geschätzt werde. Dies führt zu etwas größerer Ugeauigkeit. Je größer ν, umso kleier ist der Uterschied. Für 30 rechet ma eifach auch bei der t-verteilug mit z 1+γ. Beispiel: Eie Maschie füllt Gummibärche i Tüte ab, die laut Aufdruck 50g Füllgewicht verspreche. Wir ehme im folgede a, dass das Füllgewicht ormalverteilt ist. Bei 16 zufällig aus der Produktio herausgegriffee Tüte wird ei mittleres Füllgewicht vo 45g ud eie Stichprobestreuug Stadardabweichug vo 10g festgestellt. a Bereche Sie ei Kofidezitervall für das mittlere Füllgewicht zum Sicherheitsiveau vo 95%. b We Ihe zusätzlich bekat würde, dass die Stichprobestreuug gleich der tatsächliche Streuug ist, wäre da das uter a zu berechede Kofidezitervall für das mittlere Füllgewicht breiter oder schmäler? Begrüde Sie ihre Atwort ohe Rechug. Füllgewicht ormalverteilt. 16 Tüte gezoge = 16. Mittleres Füllgewicht i der Stichprobe: x = 45g. Stichprobestreuug: s = 10g.

8.3. Itervallschätzug zu a Kostruktio des Kofidezitervalls: Da die Variaz σ ubekat ist, muss das Kofidezitervall basiered auf der t-verteilug kostruiert werde: [ X S ± t 1+γ 1 ] Aus dem Sicherheitsiveau γ = 0.95 errechet sich 1+γ = 0.975. Nachschaue i t-tabelle bei 0.975 ud 15 Freiheitsgrade T = verteilt mit -1 Freiheitsgerade liefert t 0.975 =.13. X µ S ist t- Eisetze liefert damit [45 ±.13 10 ] = [39.675; 50.35] 4 zu b Jetzt sei σ bekat. Da ka ma mit dem Normalverteilugs-Itervall reche: [ X ± z 1+γ σ ] Da jetzt σ bekat, ist die Usicherheit geriger ud damit das Kofidezitervall schmaler. I der Tat ist z 1+γ < t 1+γ. Recherisch ergibt sich mit z 1+γ = 1.96 das Kofidezitervall [40.100; 49.900] Beispiel: Klausurergebisse i pukte i pukte i pukte i pukte i pukte i pukte 1 16.5 7 7.5 13 3 19 14 5 19.5 31 35.5 16.5 8 14 15 0 1 6 18 3 1.5 3 5.5 9 16.5 15 31 1 19.5 7 37.5 33 5 4 5 10 8 16 6 17.5 8 15.5 34 5.5 5 0.5 11 33.5 17 13.5 3 36 9 7.5 35 18.5 6 7.5 1 19.5 18 4 4 31.5 30 18 Mittelwert ud Variaz der Grudgesamtheit alle 35 Klausure: ˆµ = pukte = 1.81 ˆσ = s pukte = 7.56 Wir ziehe isgesamt 80 Stichprobe vom Umfag = 5, = 10, = 0, = 35 ud bestimme Kofidezitervalle zum Niveau 95%.

Kapitel. Iduktive Statistik 83 95% KI s, Stichprobeumfag =5 5 10 15 0 5 30 35 40 4 6 8 10 1 14 16 18 0 4 6 8 30 3 34 36 38 40 4 44 46 48 50 5 54 56 58 60 6 64 66 68 70 7 74 76 78 80 Stichprobe 95% KI s, Stichprobeumfag =10 5 10 15 0 5 30 35 40 4 6 8 10 1 14 16 18 0 4 6 8 30 3 34 36 38 40 4 44 46 48 50 5 54 56 58 60 6 64 66 68 70 7 74 76 78 80 Stichprobe Puktzahl der Klausur Statistik I: Kofidezitervalle für 80 Stichprobe mit jeweiligem Stichprobeumfag = 5 obe ud = 10 ute. 95% KI s, Stichprobeumfag =0 5 10 15 0 5 30 35 40 4 6 8 10 1 14 16 18 0 4 6 8 30 3 34 36 38 40 4 44 46 48 50 5 54 56 58 60 6 64 66 68 70 7 74 76 78 80 Stichprobe 95% KI s, Stichprobeumfag =35 5 10 15 0 5 30 35 40 4 6 8 10 1 14 16 18 0 4 6 8 30 3 34 36 38 40 4 44 46 48 50 5 54 56 58 60 6 64 66 68 70 7 74 76 78 80 Stichprobe Puktzahl der Klausur Statistik I: Kofidezitervalle für 80 Stichprobe mit jeweiligem Stichprobeumfag = 0 obe, = 35 ute.

84.3. Itervallschätzug 95% KI s, Stichprobeumfag =5 5 10 15 0 5 30 35 40 4 6 8 10 1 14 16 18 0 4 6 8 30 3 34 36 38 40 4 44 46 48 50 5 54 56 58 60 6 64 66 68 70 7 74 76 78 80 Stichprobe 95% KI s, Stichprobeumfag =5, Variaz bekat 5 10 15 0 5 30 35 40 4 6 8 10 1 14 16 18 0 4 6 8 30 3 34 36 38 40 4 44 46 48 50 5 54 56 58 60 6 64 66 68 70 7 74 76 78 80 Stichprobe Puktzahl der Klausur Statistik I: Kofidezitervalle für 80 Stichprobe mit Stichprobeumfag = 5. Obe ist die Variaz ubekat, ute als bekat vorausgesetzt. Ergebis: Die Breite der Kofidezitervalle immt mit wachsedem ab. Nicht alle Kofidezitervalle ethalte de wahre Mittelwert µ = 3.1 per Kostruktio mit Wahrscheilichkeit 5%. Die Itervalle mit bekater Variaz sid im Mittel eger. Die Itervalle mit bekater Variaz sid immer gleich lag. Approximative Kofidezitervalle: Ist der Stichprobeumfag groß geug, so ka wege des zetrale Grezwertsatzes das Normalverteilugs-Kofidezitervall auf de Erwartugswert beliebiger Merkmale mit existiereder Variaz agewedet werde ud erhält approximative Kofidezitervalle. Beispiel: Kofidezitervall für de Ateil π: Seie X 1,..., X i.i.d. mit { 1 X i =, P X i = 1 = π. 0 EX i = π VarX i = π 1 π E X = π Var X = π 1 π

Kapitel. Iduktive Statistik 85 ud approximativ für großes : X π π 1 π N 0, 1 π im Zähler: ubekater Ateil = iteressiereder Parameter π1 π π im Neer: ubekate Variaz vo X; schätze, idem X für π eigesetzt wirdim Neer γ P z 1+γ X π z 1+γ X1 X = P X z 1+γ X1 X π X + z 1+γ X1 X ud damit das Kofidezitervall [ X ± z 1+γ ] X1 X Beispiel Wahlumfrage: Seie = 500, X = 46.5% ud γ = 95%. z 1+γ = 1.96 Kofidezitervall: [ X ± z 1+γ ] X1 X = [ 0.465 ± 1.96 ] 0.4651 0.465 500 = [0.41; 0.508]