2. Repetition relevanter Teilbereiche der Statistik

Ähnliche Dokumente
Kapitel 6 : Punkt und Intervallschätzer

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Kapitel 5: Schließende Statistik

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

X in einer Grundgesamtheit vollständig beschreiben.

Tests statistischer Hypothesen

Wirksamkeit, Effizienz

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Schätzen von Populationswerten

3 Vergleich zweier unverbundener Stichproben

Schätzen von Populationswerten

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3. Grundbegrie der Schätztheorie

4 Schwankungsintervalle Schwankungsintervalle 4.2

X X Schätzen von Vertrauensintervallen Schwankungsintervall

Empirische Verteilungsfunktion

Wirksamkeit, Effizienz

Statistik und Wahrscheinlichkeitsrechnung

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Anwendung für Mittelwerte

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

6 Vergleich mehrerer unverbundener Stichproben

Eingangsprüfung Stochastik,

Prof. Dr. Roland Füss Statistik II SS 2008

Statistische Modelle und Parameterschätzung

Übungen mit dem Applet erwartungstreu

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Induktive Schlussweise. Schätzfunktionen und Schätzverfahren. Bibliografie

Kapitel VI. Einige spezielle diskrete Verteilungen

Parameterschätzung. Numero, pondere et mensura Deus omnia condidit

Maschinelle Sprachverarbeitung: Mathematische Grundlagen

1. Wahrscheinlichkeitsrechnung. 2. Diskrete Zufallsvariable. 3. Stetige Zufallsvariable. 4. Grenzwertsätze. 5. Mehrdimensionale Zufallsvariable

10. Testen von Hypothesen Seite 1 von 6

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Statistik. 2. Semester. Begleitendes Skriptum zur Vorlesung. im FH-Masterstudiengang. Technisches Management. von. Günther Karigl

1) Wahrscheinlichkeitsbegriff und Rechnen mit Wahrscheinlichkeiten. P A = lim r N LI: ={ 1 LII: LIII: P A =1 P A

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

Statistik und Wahrscheinlichkeitsrechnung

3.2 Wilcoxon Rangsummentest

Formelsammlung Statistik 29. Januar 2019

Statistik und Wahrscheinlichkeitsrechnung

Parameterschätzung. Kapitel Schätzfunktionen

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Evaluation & Forschungsstrategien

Ereignis Wahrscheinlichkeit P (A) A oder B P (A + B) A und B P (AB) B, wenna P (B A)

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

5.4.2 Die empirische Verteilungsfunktion als Ausgangspunkt

Tests für beliebige Zufallsvariable

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

Einstichprobentests für das arithmetische Mittel

Einführung in die Wahrscheinlichkeitstheorie Lösungen zum Wiederholungsblatt

Diskrete Wahrscheinlichkeitstheorie Wiederholungsklausur

Zufallsvariable. Die Wahrscheinlichkeitsverteilung p (probability function) ist definiert durch: p(x i ) := P (X = x i ),

Klausur zu,,einführung in die Wahrscheinlichkeitstheorie. Musterlösungen

Auszüge der nichtparametrischen Statisik

7. Stichproben und Punktschätzung

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert

Maximum Likelihood Version 1.6

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

II. Grundzüge der Stichprobentheorie

Kontingenztabellen. Chi-Quadrat-Test. Korrelationsanalyse zwischen kategorischen Merkmalen. 1. Unabhängigkeitstest

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Stochastisches Integral

Wahrscheinlichkeitstheorie und Statistik vom

10. Übungsblatt zur Einführung in die Stochastik

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

2 Einführung in die mathematische Statistik

Einführung in die Stochastik 10. Übungsblatt

SBP Mathe Aufbaukurs 1. Absolute und relative Häufigkeit. Das arithmetische Mittel und seine Eigenschaften. Das arithmetische Mittel und Häufigkeit

A = Ereignisraum = σ-algebra (Sigma-Algebra) = Menge aller messbaren Ergebnisse über eine definierte Grundmenge Ω

Statistische Tests zu ausgewählten Problemen

Bayessches Lernen (II)

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Mathematik 2 für Naturwissenschaften

Testen statistischer Hypothesen

Kleine Formelsammlung Beschreibende Statistik

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Anwendungen der Wahrscheinlichkeit II. Markovketten

2.3 Kontingenztafeln und Chi-Quadrat-Test

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Statistik und Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitstheorie Aufgabensammlung

Ökonometrie Formeln und Tabellen

Ulrich Stein Fehlerrechnung

Kapitel 2: Stochastische Prozesse. Copyright M. Gross, ETH Zürich 2006, 2007

Mathematik 2 für Naturwissenschaften

Wahrscheinlichkeit und Statistik Zusammenfassung

Transkript:

. Repetitio Statistik Ökoometrie I - Peter Stalder. Repetitio relevater Teilbereiche der Statistik (Maddala Kapitel ) Zufallsvariable ud Wahrscheilichkeitsverteiluge Zufallsvariable X (stochastische Variable) Realisatio vo X: x diskret: X ka ur eie edliche Azahl vo Werte aehme kotiuierlich: X ka (i eiem bestimmte Itervall) jede Wert aehme Das Verhalte vo Zufallsvariable ist durch ihre Wahrscheilichkeitsverteilug defiiert. Diese wird für kotiuierliche Zufallsvariable mit der sogeate Dichtefuktio dargestellt (probabilit desit fuctio, p.d.f.). Diskret (z.b. Müze): Prob(X = 0) = 0.5 Prob(X = ) = 0.5 Kotiuierlich: Dichtefuktio f(x) mit de Eigeschafte f ( x) 0 für alle x f( x) dx. Durch Itegratio lässt sich die Wahrscheilichkeit bestimme, dass X i ei bestimmtes Itervall [a,b] fällt: Prob( a X b ) b a f( x) dx c Kumulative Verteilugsfuktio: Fc ( ) Prob( X c) = f( x) dx somit gilt: Prob( a X b) F(b) - F(a) f(x) Prob( a X b) 0 a b x

. Repetitio Statistik Ökoometrie I - Peter Stalder Gemeisame Verteilug vo zwei (oder mehr) Zufallsvariable Im Fall vo zwei (oder mehr) Zufallsvariable ist zu uterscheide zwische der gemeisame Verteilug, der margiale Verteilug (auch Radverteilug geat) ud der bedigte Verteilug: Die gemeisame Verteilug vo X ud Y ist durch die Wahrscheilichkeite für alle mögliche Realisatioe X = x ud Y = defiiert. Die margiale Verteilug vo X zeigt die Wahrscheilichkeite für die Realisatioe X = x, egal welche Wert Y aimmt (aalog für Y). Die bedigte Verteilug vo X zeigt die Wahrscheilichkeite für die Realisatioe X = x, gegebe eie bestimmte Realisatio Y = (aalog für Y). I Maddala, Seite 8/9, fidet sich ei Zahlebeispiel für die gemeisame Verteilug vo zwei diskrete Zufallsvariable, die voeiader uabhägig bzw. abhägig sid. Im Fall vo zwei kotiuierliche Zufallsvariable X ud Y ist die Verteilug durch die gemeisame Dichtefuktio f(x,) gegebe. Die margiale Dichtefuktioe vo X bzw. Y erhält ma durch Itegratio vo f(x,) über bzw. x: f(x) = f ( x, ) d f() = f ( x, ) dx (Ituitiv bedeutet z.b. Itegratio über : Ma lässt alle Werte vo zu.) Die bedigte Verteiluge sid durch die Dichtefuktioe f(x ) (Verteilug vo X gegebe eie bestimmte Realisatio Y = ) bzw. f( x) (Verteilug vo Y gegebe eie bestimmte Realisatio X = x) defiiert. Die gemeisame Dichtefuktio ka stets als Produkt vo margialer ud bedigter Dichtefuktio geschriebe werde: f(x,) = f(x ) f() = f( x) f(x)

. Repetitio Statistik Ökoometrie I - Peter Stalder 3 Falls die beide Variable voeiader uabhägig sid, gilt: f(x,) = f(x) f() für alle x ud. I diesem Fall sid die bedigte Dichtefuktioe gleich de margiale Dichtefuktioe: f(x ) = f(x) f( x) = f() Grafische Darstellug eier gemeisame Dichtefuktio f(x,) i Form vo "Höhekurve" eies "Dichtebergs", desse Volume über der (x,)-ebee gleich ist: x Die Normalverteilug ud verwadte Verteiluge Normalverteilug Dichtefuktio: f ( x) exp x Erwartugswert: Variaz: E( x ) E( x ) Stadardabweichug: Kurzschreibweise: x N(, ) Variabletrasformatio: z ( x ) Die Variablez ist stadard-ormalverteilt, d.h. z N( 0, ).

. Repetitio Statistik Ökoometrie I - Peter Stalder 4 Chi-Quadrat-Verteilug Gegebe seie uabhägig stadard-ormalverteilte Variable: x i IN( 0, ), i =,..., (IN steht für Idepedet Normal) Eie daraus abgeleitete Variable Z = x i i ist Chi-Quadrat-verteilt mit Freiheitsgrade: Z Studet's t-verteilug Gegebe sei: x IN( 0, ) ud (x ud uabhägig). Eie daraus abgeleitete Variable Z x ist t-verteilt mit Freiheitsgrade: Z t Für grosses kovergiert t gege eie Stadard-Normalverteilug. Für kleies ist t flacher als die Stadard-Normalverteilug. F-Verteilug Gegebe seie ud ( ud uabhägig). Eie daraus abgeleitete Variable Z ist F-verteilt mit ud Freiheitsgrade: Z F, Die F-Verteilug ist somit die Verteilug des Verhältisses vo zwei voeiader uabhägig Chi-Quadrat-verteilte ud durch die jeweilige Azahl Freiheitsgrade geteilte Variable.

. Repetitio Statistik Ökoometrie I - Peter Stalder 5 Klassische deduktive Statistik Dategeeriereder Prozess (wahres Modell), charakterisiert durch Wahrscheilichkeits-Dichtefuktio mit ubekate Parameter: z.b. i (, ) N z.b. x t t u mit u t IN ( 0, ) t Parameter:, Parameter:,, Stichprobe:,,..., x, x,..., x T (exoge vorgegebe),,..., T Schätzug: ˆ, ˆ ˆ, ˆ, ˆ Uter eiem sog. Schätzer versteht ma eie Methode (eie Schätzformel), mit der ma aus eier Stichprobe Schätzwerte für die Parameter eies dategeerierede Prozesses ableitet. Für de Mittelwert μ eier ormalverteilte Zufallsvariable lautet die Schätzformel: i i ˆ Aalog zu diesem Beispiel ist die Puktschätzug eies ubekate Parameters stets eie Fuktio der Stichprobewerte der Zufallsvariable : ˆ g(,,..., ) Dies gilt auch für die Schätzug eies Vertrauesitervalls: g (,,..., ) g (,,..., ) g g

. Repetitio Statistik Ökoometrie I - Peter Stalder 6 Stichprobeverteilug Die i sid Zufallsvariable => Die geschätzte Parameter (z.b. ˆ ud ˆ ) sid ebefalls Zufallsvariable, de sie sid Fuktioe vo i. Ihre Wahrscheilichkeitsverteilug wird Stichprobeverteilug geat. Die Eigeschafte vo Schätzer leite sich aus der Stichprobeverteilug der geschätzte Parameter ab. Wüschbare Eigeschafte sid: Uverzerrtheit Effiziez Kosistez i kleie Stichprobe relevat i grosse Stichprobe relevat Diese Eigeschafte charakterisiere die Beziehug zwische de ubekate Parameter des dategeerierede Prozesses ( ) ud de geschätzte Parameter (ˆ ). Uverzerrtheit (Erwartugstreue): E ( ˆ ) Effiziez: Uter de uverzerrte Schätzer wird derjeige mit der kleiste Variaz als effiziet bezeichet. Kosistez: Es sei ˆ der Schätzer für aus eier Stichprobe vom Umfag. Dieser Schätzer ist kosistet, falls gilt: lim ( Prob ˆ für beliebig kleies ε I Worte locker formuliert: Ei Schätzer ist da kosistet, we der Schätzwert mit wachsedem Stichprobeumfag immer äher zum ubekate wahre Parameterwert rückt.

. Repetitio Statistik Ökoometrie I - Peter Stalder 7 Stichprobeverteilug vo Parameterschätzuge im Falle der Normalverteilug Dategeeriereder Prozess: N(, ) E ( ) (bzw. Grudgesamtheit) E ( ) Stichprobe mit Beobachtugswerte: Schätzug μ : i S i Schätzug : Stichprobeverteilug vo ud S : N (, ) ist ormalverteilt ud ei uverzerrter ud kosisteter Schätzer vo. ) ( )S i i ( (Chi-Quadrat-verteilt) i N( 0, ) ==> i ( )S N( 0, ) ==> ( )S ( ) S t (t-verteilt)

. Repetitio Statistik Ökoometrie I - Peter Stalder 8 Hpothesetest. Eie statistische Hpothese ist eie Aussage über Parameterwerte eies dategeerierede Prozesses (bzw. eier Grudgesamtheit). Sie wird ahad eier Stichprobe überprüft.. Wir uterscheide zwische Pukthpothese (z.b. = 4) ud Itervallhpothese (z.b. > 0). 3. Ei Hpothesetest ist ei Verfahre, das agibt, ob die Abweichug eies geschätzte Parameters vo dem i der Hpothese postulierte Wert zufällig oder echt ist (z.b. = 5 vs. = 4). 4. Die getestete Hpothese wird Null-Hpothese geat ud mit H 0 bezeichet. Die alterative Hpothese wird mit H bezeichet. 5. Die Masszahl, welche die Abweichug der Parameterschätzug vo dem i H 0 postulierte Wert agibt, wird Teststatistik geat. Bei jedem Hpothesetest muss ma für die Teststatistik eie kritische Wert ud ei etsprechedes Sigifikaziveau festlege (häufig wird 5% gewählt). Dabei hadelt es sich um die Wahrscheilichkeit dafür, dass die berechete Teststatistik bei Gültigkeit vo H 0 de kritische Wert überschreitet ud H 0 somit fälschlicherweise abgeleht wird (was ma auch als Fehler erster Art bezeichet). 6. Das beobachtete Sigifikaziveau (auch P-Wert geat) ist die Wahrscheilichkeit dafür, dass die Teststatistik bei Gültigkeit vo H 0 de berechete oder eie extremere Wert aimmt. Gebräuliche Praxis: P-Wert kleier als 5%: Die Abweichug zwische der Parameterschätzug ud dem i H 0 postulierte Wert wird als statistisch sigifikat bezeichet, weil es uwahrscheilich erscheit, dass eie Abweichug dieses Ausmasses durch Zufälligkeite i der Stichprobe verursacht wurde. H 0 wird verworfe. P-Wert grösser als 5%: Die Abweichug zwische der Parameterschätzug ud dem i H 0 postulierte Wert wird als statistisch isigifikat bezeichet, weil es icht allzu uwahrscheilich ist, dass eie Abweichug dieses Ausmasses durch Zufälligkeite i der Stichprobe verursacht wurde. H 0 wird icht verworfe.

. Repetitio Statistik Ökoometrie I - Peter Stalder 9 Eifache Beispiele für Hpothesetests. Mittelwert eier ormalverteilte Variable Dategeeriereder Prozess: N(, ) Nullhpothese H 0 : = 0 vs. Alterativhpothese H : 0 Stichprobe = 4, i =, -, 3, 5 geschätzter Mittelwert: i = (-+3+5)/4 = geschätzte Variaz: S i = (+9++9)/3 = 0/3 = 6.67 geschätzte Stadardabweichug: S =.58 Stadardabweichug der Mittelwertschätzug: S =.9 ˆ berecheter t-wert: t ber = = /.9 =.55 S kritischer t-wert (5%-Niveau, -seitiger Test): t* = 3.8 t ber t* H 0 icht verwerfe! 0. P-Wert: Prob t.55 > 0.05 H 0 icht verwerfe!

. Repetitio Statistik Ökoometrie I - Peter Stalder 0. Müzwurf H 0 : Müze ist regulär, dh. P KOPF = P ZAHL = 0.5 H : Müze ist icht regulär Testverfahre: Die Müze wird 4 Mal geworfe. Verwerfugskriterium: Falls die Müze 4 mal auf Kopf oder 4 mal auf Zahl fällt, soll die Nullhpothese verworfe werde. Uter der Nullhpothese gilt: Prob(K,K,K,K) = 0.5 4 = 0.065 Prob(Z,Z,Z,Z) = 0.5 4 = 0.065 Mit diesem Verwerfugskriterium führt ma folglich eie Test mit eiem Sigifikaziveau vo.5% durch, d.h. es besteht eie Wahrscheilichkeit vo.5%, dass eie richtige Nullhpothese fälschlicherweise verworfe wird (Fehler erster Art). Reduziert ma das Sigifikaziveau z.b. auf 5%, so wäre auch das Ereigis (K,K,K,K,K) oder (Z,Z,Z,Z,Z) mit eiem beobachtete P-Wert vo 6.5% icht geüged uwahrscheilich, um die Nullhpothese zu verwerfe. Bei diesem Vorgehe ergibt sich eie kleiere Wahrscheilichkeit dafür, dass eie falsche Nullhpothese als falsch erkat ud verworfe wird (gerigere Macht des Tests).