2. Repetition relevanter Teilbereiche der Statistik

. Repetitio Statistik Ökoometrie I - Peter Stalder. Repetitio relevater Teilbereiche der Statistik (Maddala Kapitel ) Zufallsvariable ud Wahrscheilichkeitsverteiluge Zufallsvariable X (stochastische Variable) Realisatio vo X: x diskret: X ka ur eie edliche Azahl vo Werte aehme kotiuierlich: X ka (i eiem bestimmte Itervall) jede Wert aehme Das Verhalte vo Zufallsvariable ist durch ihre Wahrscheilichkeitsverteilug defiiert. Diese wird für kotiuierliche Zufallsvariable mit der sogeate Dichtefuktio dargestellt (probabilit desit fuctio, p.d.f.). Diskret (z.b. Müze): Prob(X = 0) = 0.5 Prob(X = ) = 0.5 Kotiuierlich: Dichtefuktio f(x) mit de Eigeschafte f ( x) 0 für alle x f( x) dx. Durch Itegratio lässt sich die Wahrscheilichkeit bestimme, dass X i ei bestimmtes Itervall [a,b] fällt: Prob( a X b ) b a f( x) dx c Kumulative Verteilugsfuktio: Fc ( ) Prob( X c) = f( x) dx somit gilt: Prob( a X b) F(b) - F(a) f(x) Prob( a X b) 0 a b x

. Repetitio Statistik Ökoometrie I - Peter Stalder Gemeisame Verteilug vo zwei (oder mehr) Zufallsvariable Im Fall vo zwei (oder mehr) Zufallsvariable ist zu uterscheide zwische der gemeisame Verteilug, der margiale Verteilug (auch Radverteilug geat) ud der bedigte Verteilug: Die gemeisame Verteilug vo X ud Y ist durch die Wahrscheilichkeite für alle mögliche Realisatioe X = x ud Y = defiiert. Die margiale Verteilug vo X zeigt die Wahrscheilichkeite für die Realisatioe X = x, egal welche Wert Y aimmt (aalog für Y). Die bedigte Verteilug vo X zeigt die Wahrscheilichkeite für die Realisatioe X = x, gegebe eie bestimmte Realisatio Y = (aalog für Y). I Maddala, Seite 8/9, fidet sich ei Zahlebeispiel für die gemeisame Verteilug vo zwei diskrete Zufallsvariable, die voeiader uabhägig bzw. abhägig sid. Im Fall vo zwei kotiuierliche Zufallsvariable X ud Y ist die Verteilug durch die gemeisame Dichtefuktio f(x,) gegebe. Die margiale Dichtefuktioe vo X bzw. Y erhält ma durch Itegratio vo f(x,) über bzw. x: f(x) = f ( x, ) d f() = f ( x, ) dx (Ituitiv bedeutet z.b. Itegratio über : Ma lässt alle Werte vo zu.) Die bedigte Verteiluge sid durch die Dichtefuktioe f(x ) (Verteilug vo X gegebe eie bestimmte Realisatio Y = ) bzw. f( x) (Verteilug vo Y gegebe eie bestimmte Realisatio X = x) defiiert. Die gemeisame Dichtefuktio ka stets als Produkt vo margialer ud bedigter Dichtefuktio geschriebe werde: f(x,) = f(x ) f() = f( x) f(x)

. Repetitio Statistik Ökoometrie I - Peter Stalder 3 Falls die beide Variable voeiader uabhägig sid, gilt: f(x,) = f(x) f() für alle x ud. I diesem Fall sid die bedigte Dichtefuktioe gleich de margiale Dichtefuktioe: f(x ) = f(x) f( x) = f() Grafische Darstellug eier gemeisame Dichtefuktio f(x,) i Form vo "Höhekurve" eies "Dichtebergs", desse Volume über der (x,)-ebee gleich ist: x Die Normalverteilug ud verwadte Verteiluge Normalverteilug Dichtefuktio: f ( x) exp x Erwartugswert: Variaz: E( x ) E( x ) Stadardabweichug: Kurzschreibweise: x N(, ) Variabletrasformatio: z ( x ) Die Variablez ist stadard-ormalverteilt, d.h. z N( 0, ).

. Repetitio Statistik Ökoometrie I - Peter Stalder 4 Chi-Quadrat-Verteilug Gegebe seie uabhägig stadard-ormalverteilte Variable: x i IN( 0, ), i =,..., (IN steht für Idepedet Normal) Eie daraus abgeleitete Variable Z = x i i ist Chi-Quadrat-verteilt mit Freiheitsgrade: Z Studet's t-verteilug Gegebe sei: x IN( 0, ) ud (x ud uabhägig). Eie daraus abgeleitete Variable Z x ist t-verteilt mit Freiheitsgrade: Z t Für grosses kovergiert t gege eie Stadard-Normalverteilug. Für kleies ist t flacher als die Stadard-Normalverteilug. F-Verteilug Gegebe seie ud ( ud uabhägig). Eie daraus abgeleitete Variable Z ist F-verteilt mit ud Freiheitsgrade: Z F, Die F-Verteilug ist somit die Verteilug des Verhältisses vo zwei voeiader uabhägig Chi-Quadrat-verteilte ud durch die jeweilige Azahl Freiheitsgrade geteilte Variable.

. Repetitio Statistik Ökoometrie I - Peter Stalder 5 Klassische deduktive Statistik Dategeeriereder Prozess (wahres Modell), charakterisiert durch Wahrscheilichkeits-Dichtefuktio mit ubekate Parameter: z.b. i (, ) N z.b. x t t u mit u t IN ( 0, ) t Parameter:, Parameter:,, Stichprobe:,,..., x, x,..., x T (exoge vorgegebe),,..., T Schätzug: ˆ, ˆ ˆ, ˆ, ˆ Uter eiem sog. Schätzer versteht ma eie Methode (eie Schätzformel), mit der ma aus eier Stichprobe Schätzwerte für die Parameter eies dategeerierede Prozesses ableitet. Für de Mittelwert μ eier ormalverteilte Zufallsvariable lautet die Schätzformel: i i ˆ Aalog zu diesem Beispiel ist die Puktschätzug eies ubekate Parameters stets eie Fuktio der Stichprobewerte der Zufallsvariable : ˆ g(,,..., ) Dies gilt auch für die Schätzug eies Vertrauesitervalls: g (,,..., ) g (,,..., ) g g

. Repetitio Statistik Ökoometrie I - Peter Stalder 6 Stichprobeverteilug Die i sid Zufallsvariable => Die geschätzte Parameter (z.b. ˆ ud ˆ ) sid ebefalls Zufallsvariable, de sie sid Fuktioe vo i. Ihre Wahrscheilichkeitsverteilug wird Stichprobeverteilug geat. Die Eigeschafte vo Schätzer leite sich aus der Stichprobeverteilug der geschätzte Parameter ab. Wüschbare Eigeschafte sid: Uverzerrtheit Effiziez Kosistez i kleie Stichprobe relevat i grosse Stichprobe relevat Diese Eigeschafte charakterisiere die Beziehug zwische de ubekate Parameter des dategeerierede Prozesses ( ) ud de geschätzte Parameter (ˆ ). Uverzerrtheit (Erwartugstreue): E ( ˆ ) Effiziez: Uter de uverzerrte Schätzer wird derjeige mit der kleiste Variaz als effiziet bezeichet. Kosistez: Es sei ˆ der Schätzer für aus eier Stichprobe vom Umfag. Dieser Schätzer ist kosistet, falls gilt: lim ( Prob ˆ für beliebig kleies ε I Worte locker formuliert: Ei Schätzer ist da kosistet, we der Schätzwert mit wachsedem Stichprobeumfag immer äher zum ubekate wahre Parameterwert rückt.

. Repetitio Statistik Ökoometrie I - Peter Stalder 7 Stichprobeverteilug vo Parameterschätzuge im Falle der Normalverteilug Dategeeriereder Prozess: N(, ) E ( ) (bzw. Grudgesamtheit) E ( ) Stichprobe mit Beobachtugswerte: Schätzug μ : i S i Schätzug : Stichprobeverteilug vo ud S : N (, ) ist ormalverteilt ud ei uverzerrter ud kosisteter Schätzer vo. ) ( )S i i ( (Chi-Quadrat-verteilt) i N( 0, ) ==> i ( )S N( 0, ) ==> ( )S ( ) S t (t-verteilt)

. Repetitio Statistik Ökoometrie I - Peter Stalder 8 Hpothesetest. Eie statistische Hpothese ist eie Aussage über Parameterwerte eies dategeerierede Prozesses (bzw. eier Grudgesamtheit). Sie wird ahad eier Stichprobe überprüft.. Wir uterscheide zwische Pukthpothese (z.b. = 4) ud Itervallhpothese (z.b. > 0). 3. Ei Hpothesetest ist ei Verfahre, das agibt, ob die Abweichug eies geschätzte Parameters vo dem i der Hpothese postulierte Wert zufällig oder echt ist (z.b. = 5 vs. = 4). 4. Die getestete Hpothese wird Null-Hpothese geat ud mit H 0 bezeichet. Die alterative Hpothese wird mit H bezeichet. 5. Die Masszahl, welche die Abweichug der Parameterschätzug vo dem i H 0 postulierte Wert agibt, wird Teststatistik geat. Bei jedem Hpothesetest muss ma für die Teststatistik eie kritische Wert ud ei etsprechedes Sigifikaziveau festlege (häufig wird 5% gewählt). Dabei hadelt es sich um die Wahrscheilichkeit dafür, dass die berechete Teststatistik bei Gültigkeit vo H 0 de kritische Wert überschreitet ud H 0 somit fälschlicherweise abgeleht wird (was ma auch als Fehler erster Art bezeichet). 6. Das beobachtete Sigifikaziveau (auch P-Wert geat) ist die Wahrscheilichkeit dafür, dass die Teststatistik bei Gültigkeit vo H 0 de berechete oder eie extremere Wert aimmt. Gebräuliche Praxis: P-Wert kleier als 5%: Die Abweichug zwische der Parameterschätzug ud dem i H 0 postulierte Wert wird als statistisch sigifikat bezeichet, weil es uwahrscheilich erscheit, dass eie Abweichug dieses Ausmasses durch Zufälligkeite i der Stichprobe verursacht wurde. H 0 wird verworfe. P-Wert grösser als 5%: Die Abweichug zwische der Parameterschätzug ud dem i H 0 postulierte Wert wird als statistisch isigifikat bezeichet, weil es icht allzu uwahrscheilich ist, dass eie Abweichug dieses Ausmasses durch Zufälligkeite i der Stichprobe verursacht wurde. H 0 wird icht verworfe.

. Repetitio Statistik Ökoometrie I - Peter Stalder 9 Eifache Beispiele für Hpothesetests. Mittelwert eier ormalverteilte Variable Dategeeriereder Prozess: N(, ) Nullhpothese H 0 : = 0 vs. Alterativhpothese H : 0 Stichprobe = 4, i =, -, 3, 5 geschätzter Mittelwert: i = (-+3+5)/4 = geschätzte Variaz: S i = (+9++9)/3 = 0/3 = 6.67 geschätzte Stadardabweichug: S =.58 Stadardabweichug der Mittelwertschätzug: S =.9 ˆ berecheter t-wert: t ber = = /.9 =.55 S kritischer t-wert (5%-Niveau, -seitiger Test): t* = 3.8 t ber t* H 0 icht verwerfe! 0. P-Wert: Prob t.55 > 0.05 H 0 icht verwerfe!

. Repetitio Statistik Ökoometrie I - Peter Stalder 0. Müzwurf H 0 : Müze ist regulär, dh. P KOPF = P ZAHL = 0.5 H : Müze ist icht regulär Testverfahre: Die Müze wird 4 Mal geworfe. Verwerfugskriterium: Falls die Müze 4 mal auf Kopf oder 4 mal auf Zahl fällt, soll die Nullhpothese verworfe werde. Uter der Nullhpothese gilt: Prob(K,K,K,K) = 0.5 4 = 0.065 Prob(Z,Z,Z,Z) = 0.5 4 = 0.065 Mit diesem Verwerfugskriterium führt ma folglich eie Test mit eiem Sigifikaziveau vo.5% durch, d.h. es besteht eie Wahrscheilichkeit vo.5%, dass eie richtige Nullhpothese fälschlicherweise verworfe wird (Fehler erster Art). Reduziert ma das Sigifikaziveau z.b. auf 5%, so wäre auch das Ereigis (K,K,K,K,K) oder (Z,Z,Z,Z,Z) mit eiem beobachtete P-Wert vo 6.5% icht geüged uwahrscheilich, um die Nullhpothese zu verwerfe. Bei diesem Vorgehe ergibt sich eie kleiere Wahrscheilichkeit dafür, dass eie falsche Nullhpothese als falsch erkat ud verworfe wird (gerigere Macht des Tests).