Einfache Hypothesentests für multiple Regressionen
|
|
- Mareke Simen
- vor 8 Jahren
- Abrufe
Transkript
1 Kapitel 6 Einfache Hypothesentests für multiple Regressionen Economists have inherited from the physical sciences the myth that scientific inference is objective, and free of personal prejudice. This is utter nonsense. All knowledge is human belief; more accurately, human opinion.[...] statistical inference is and must forever remain an opinion. (Leamer, 1983, 36) Im Folgenden werden wir einige weitere Teststatistiken vorstellen, die uns das Testen komplexerer Hypothesen ermöglichen. Die grundsätzliche Methodologie bleibt dabei völlig gleich, das heißt, die folgenden Tests können wieder nach der Methode von Fisher oder nach Neyman und Pearson durchgeführt werden. 6.1 t-test für eine Linearkombination von Parametern Wir haben bisher nur t-tests für einzelne Regressionskoeffizienten durchgeführt. Die Vorgangsweise lässt sich aber einfach für Tests einer Linearkombination von mehreren Regressionskoeffizienten verallgemeinern. Gehen wir von folgendem einfachen Modell aus y i = β 1 +β 2 x i2 +β 3 x i3 +ε i Wenn wir zum Beispiel testen möchten, ob die Summe von β 2 und β 3 den Wert Eins hat, lauten Null- und Alternativhypothese H 0 : β 2 +β 3 = 1 gegen H A : β 2 +β 3 1 Dies ist ein sehr spezieller Fall von Null- und Alternativhypothese. 1
2 Empirische Wirtschaftsforschung 2 Etwas allgemeiner können zweiseitige Null- und Alternativhypothesen für dieses einfache Modell geschrieben werden als H 0 : c 1 β 2 +c 2 β 3 = β 0 H A : c 1 β 2 +c 2 β 3 β 0 wobei c 1 und c 2 Konstante sind und β 0 ein unter der Nullhypothese vermuteter Parameter ist. Die Konstanten c 1 und c 2 gehören ebenso wie β 0 zur Nullhypothese und erlauben eine allgemeinere Formulierung linearer Nullhypothesen. Sollte z.b. getestet werden, ob die Parameter β 2 und β 3 den gleichen Wert haben, würdenwirc 1 = +1, c 2 = 1undβ 0 = 0wählen, denndarausfolgth 0 : β 2 β 3 = 0, bzw. β 2 = β 3. Wennwirtestenmöchten,obβ 3 nurhalbsogroßistwieβ 2,abereinunterschiedliches Vorzeichen hat, würden wir c 1 = 1, c 2 = 2 und β 0 = 0 setzen, denn daraus folgt H 0 : β 2 +2β 3 = 0, bzw. β 2 = 2β 3. Auf diese Weise lassen sich fast beliebige lineare Nullhypothesen testen, die zwei oder auch mehrere Parameter betreffen. Allerdings können auf diese Weise nur einzelne Hypothesen getestet werden, einen simultanen Test mehrerer Hypothesen werden wir erst im nächsten Abschnitt kennen lernen. Das Test-Prinzip für einzelne lineare Hypothesen, die auch mehrere Parameter betreffen können, ist einfach: wenn die Nullhypothese wahr ist gilt in der Grundgesamtheit z.b. c 1 β 2 +c 2 β 3 β 0 = 0 Selbst wenn dies in der Grundgesamtheit exakt gilt müssen wir in der Stichprobe damit rechnen, dass aufgrund von Zufallschwankungen dieser Zusammenhang nicht exakt erfüllt ist, also c 1 β2 +c 2 β3 β 0 = v wobei v relativ nahe bei Null liegen sollte, wenn die Nullhypothese wahr ist. Zudem ist v eine Linearkombination der Zufallsvariablen β 2 und β 3. Wenn β 2 und β 3 normalverteilt sind ist auch v normalverteilt. Außerdem ist bei Gültigkeit der Nullhypothese E(v) = 0, um eine Teststatistik zu erhalten brauchen wir also nur durch den Standardfehler von v zu dividieren. Da v eine Linearkombination der Zufallsvariablen β 2 und β 3 ist gestaltet sich dies sehr einfach, wir brauchen nur die Rechenregel für das Rechnen mit Varianzen anzuwenden 1 var(v) = var(c 1 β2 ±c 2 β3 β 0 ) = c 2 1 var( β 2 )+c 2 2 var( β 3 )±2c 1 c 2 ĉov( β 2, β 3 ) Wir haben bisher zwar nur für das bivariate Modell einen Schätzer für die Kovarianz zwischen Interzept und Steigungskoeffizient, d.h. ĉov( β 1, β 2 ), hergeleitet, aber wir werden im Kapitel zur Matrixschreibweise zeigen, dass auch die Kovarianzen zwischen Steigungskoeffizienten ähnlich einfach berechnet werden können. Die üblichen Programme geben die Varianz-Kovarianzmatrix der Koeffizienten zwar nicht 1 var(c 0 + c 1 x ± c 2 y) = E[(c 0 + c 1 x ± c 2 y) E(c 0 + c 1 x ± c 2 y)] 2 = c 2 1var(x) + c 2 2var(y) ± 2c 1 c 2 cov(x,y).
3 Empirische Wirtschaftsforschung 3 unmittelbar aus, aber man kann einfach mit den entsprechenden Befehlen darauf zugreifen. 2 Da die Varianz des Nenners aus der Stichprobe berechnet werden muss ist die Teststatistik v ŝe(v) = c 1 β2 ±c 2 β3 β 0 c 2 1 var( β 2 )+c 2 2 var( β 3 )±2c 1 c 2 ĉov( β 2, β 3 ) unter H 0 t-verteilt mit n k Freiheitsgraden. Diese Teststatistik (t) hat die Form t = Empirisches Analogon zur H 0 in impliziter Form Standardfehler vom Zähler H 0 tn k H 0 tn k Dies ist offensichtlich nur eine kleine Erweiterung der üblichen Tests für einen Koeffizienten für Fälle, in denen eine Hypothese über eine Linearkombination von zwei (oder mehreren) Koeffizienten getestet werden soll. Mit Hilfe dieser Teststatistik kann wieder der p-wert à la Fisher berechnet werden, oder eine Entscheidung nach der Methode Neyman und Pearson gefällt werden 1. Formulierung von Null- und Alternativhypothese. 2. Festlegung eines Signifikanzniveaus α. 3. Wahl der geeigneten Teststatistik ohne unbekannten Parametern und mit bekannter Verteilung c 1 β2 ±c 2 β3 β 0 c 2 1 var( β 2 )+c 2 2 var( β 3 )±2c 1 c 2 ĉov( β 2, β 3 ) 4. Ermittlung des dazugehörigen kritischen Wertes t crit α/2 mittels einer t Tabelle; Bestimmung von Annahme- und Verwerfungsbereich. H 0 tn k für n k Freiheitsgrade 5. Berechnung der Punktschätzer β 2, β 3 sowie der dazugehörigen Varianz- Kovarianzmatrix von β 2 und β 3 aus der Stichprobe. Überprüfen, ob alle zugrunde liegenden Annahmen (korrekte Spezifikation, unverzerrte Stichprobe, normalverteilte Störterme 3, etc.) erfüllt sind. Falls die Annahmen erfüllt sind, Berechnung des empirischen Werts der Teststatistik durch Einsetzen der empirischen Realisationen in die Teststatistik t emp = (c 1 β2 ±c 2 β3 ) β 0 c 2 1 var( β 2 )+c 2 2 var( β 3 )±2c 1 c 2 cov( β 2, β 3 ) 2 In EViews erhält man die geschätzte Varianz-Kovarianzmatrixder Koeffizienten mit der in Stata mit dem postestimation Befehl e(v); in R mit vcov. 3 Wenn die Störterme ε i nicht normalverteilt sind nähert sich die Verteilung unter den üblichen Annahmen mit steigendem Stichprobenumfang einer Normalverteilung an (Zentraler Grenzwertsatz).
4 Empirische Wirtschaftsforschung 4 6. Überprüfen, ob der empirische Wert t emp in den Annahme- oder Verwerfungsbereich fällt, und dementsprechende Entscheidung fällen. Beispiel: Angenommen wir erhalten folgende Schätzung einer Cobb-Douglas Produktionsfunktion und möchten testen, ob konstante Skalenerträge vorliegen. 4 Dependent Variable: LOG(Q) Included observations: 25 Variable Coefficient Std. Error t-stat. Prob. C β LOG(K) β LOG(L) β R-squared S.E. of regression Sum squared resid F-statistic Durbin-Watson Stat Prob(F-statistic) Die meisten Computerprogramme liefern auch die dazugehörige Varianz- Kovarianzmatrix der Koeffizienten 5 (Coefficient Covariance Matrix) var(ˆβ): C LOG(K) LOG(L) C LOG(K) LOG(L) Bei Cobb-Douglas Funktionen liegen konstante Skalenerträge vor, wenn β 2 +β 3 = 1. Die Nullhypothese ist also H 0 : β 2 +β 3 = 1 (diese Hypothese ist ein Spezialfall von H 0 : c 1 β 2 +c 2 β 3 = β 0 mit c 1 = c 2 = β 0 = 1) Die entsprechende t-statistik ist deshalb t-stat = = β 2 + β 3 1 var( β 2 )+ var( β 3 )+2ĉov( β 2, β 3 ) = = Der kritische t-wert für einen zweiseitigen Test mit 22 Freiheitsgraden ist t crit = , deshalb können wir die Nullhypothese konstanter Skalenerträge(sehr knapp) nicht verwerfen. 4 Eine Cobb-Douglas Funktion hat die Form Q = AK β2 L β3. Durch Logarithmieren erhält man eine in den Parametern lineare Funktion ln(q) = β 1 + β 2 ln(k) + β 3 ln(l), mit β 1 = ln(a) die einfach mit OLS geschätzt werden kann. 5 In EViews erhält man die geschätzte Varianz-Kovarianzmatrixder Koeffizienten mit der in Stata mit dem postestimation Befehl e(v); in R mit vcov.
5 Empirische Wirtschaftsforschung 5 Um den p-wert zu berechnen benötigt man den Wert der Verteilungsfunktion. Wenn wir mit Φ(x, q) den Wert der Verteilungsfunktion einer t-verteilung mit q Freiheitsgraden an der Stelle x bezeichnen errechnet sich der p-wert als p = 2(1 Φ( ,22)) = Solche Tests sind in fast allen Statistik- und Ökonometrieprogrammen fix implementiert, aber man kann sie auch einfach programmieren. Zum Beispiel öffnet der folgende EViews Code die Excel Tabelle mit den Daten und berechnet den dazugehörigen p-wert 7 (die Daten können unter heruntergeladen werden). EViews: wfopen " equation CD.ls log(q) c log(k) log(l) scalar t_stat = (c(2) + c(3) - 1)/@sqrt(CD.@coefcov(2,2) _ + CD.@coefcov(3,3) + 2*CD.@coefcov(2,3) ) scalar pval = 2*(1 Wurde der geschätzten Regressionsgleichung wie oben der Name CD gegeben geht das gleiche auch deutlich einfacher mit dem Befehl 8 CD.wald c(2) + c(3) = 1. Oder in R: rm(list=ls(all=true)) CD <- read.table(" dec = ".", sep=";", header=true) eq1 <- lm(log(cd$q) ~ log(cd$k) + log(cd$l)) tstat <- (coef(eq1)[2] + coef(eq1)[3] - 1) / sqrt(vcov(eq1)[2,2] + vcov(eq1)[3,3] + 2*vcov(eq1)[2,3]) pval <- 2*(1-(pt(abs(tstat),22))) Stata: insheet using " /// delim(";") names clear gen logq = log(q) gen logk = log(k) gen logl = log(l) regress logq logk logl matrix V = e(v) scalar tstat = (_b[logk] + _b[logl] - 1) / sqrt( V[1,1] + V[2,2] + 2*V[1,2]) dis "t-statistic: " tstat dis "p-value: " 2*ttail(22,abs(tstat)) 6 In EViews ist der Befehl dazu coef p = 2*(1-@ctdist(@abs( ),22)); in Excel erhalten Sie den p-wert mit der Funktion =TVERT(ABS( );22;2) 7 Selbstverständlich kann dieser Test in EViews weit einfacher durchgeführt werden, dieses Progrämmchen dient nur didaktischen Zwecken. 8 Dieser Test ist ein Spezialfall eines Wald Tests, der 1943 von dem Mathematiker Abraham Wald entwickelt wurde.
6 Empirische Wirtschaftsforschung 6 oder test logk + logl = 1 Übung: Wie würden Sie für das Modell y = β 1 +β 2 x 2 +β 3 x 3 +ε die Nullhypothese β 2 = β 3 testen? Zeigen Sie dies für für das Beispiel mit der Cobb-Douglas Funktion (Lösung: t emp = , p-wert = ). Eine große Einschränkung dieses Tests besteht darin, dass er nicht für den Test mehrerer Hypothesen verwendet werden kann. Zum Beispiel können wir damit nicht die Nullhypothese H 0 : β 2 = 0 und β 3 = 0 simultan testen. Im Folgenden werden wir nun einige Tests kennen lernen, mit deren Hilfe mehr als eine Hypothese simultan getestet werden kann, z.b. eine Nullhypothese H 0 : β 2 = 0 und β 3 = 0. Wir werden sehen, dass solche Tests sehr häufig auf der (nach R. Fisher benannten) F-Verteilung beruhen. Die Art der Tests, die wir nun vorstellen werden, sind ein Spezialfall einer ganzen Testfamilie, die in der Statistik als Wald-Tests bekannt sind. 9 Im nächsten Abschnitt werden wir einen Test auf die den Erklärungsgehalt aller erklärenden Variablen vorstellen, die sogenannte F-total Statistik. 6.2 ANOVA-Tafel und Test auf Signifikanz aller Steigungs-Koeffizienten Wir erinnern uns, dass wir für die Herleitung des Bestimmtheitsmaßes R 2 folgende Streuungs-Zerlegung vornahmen (yi ȳ) 2 } {{ } TSS = (ŷ i ȳ) 2 } {{ } ESS + ˆε 2 i } {{ } SSR wobei TSS für Total Sum of Squares, ESS für Explained Sum of Squares und SSR für Sum of Squared Residuals 10 steht. Dies führt zu folgender ANOVA-Tafel ( ANalysis Of VAriance Table ) Sum of Mean Squares df Square Regression ESS k 1 ESS/(k 1) Residuen SSR n k SSR/(n k) Total TSS n 1 wobei df für degrees of freedom (Freiheitsgrade) steht. Mit Hilfe der ANOVA-Tafel, die von den vielen Statistik-Programmen ausgegeben wird, kann man eine F-Statistik für die Nullhypothese H 0 : β 2 = β 3 = = β k = 0 9 Dieses Testprinzip ist nach Abraham Wald ( ) benannt, ein aus Siebenbürgen stammender deutschsprachiger Mathematiker und einer der bedeutendsten Statistiker des 20. Jahrhunderts. Neben Wald Tests spielen in der Statistik v.a. Likelihood-Ratio Tests und Lagrange-Multiplier Tests eine wichtige Rolle. 10 Manchmal wird dafür auch RSS für Residual Sum Squared geschrieben.
7 Empirische Wirtschaftsforschung 7 konstruieren; das heißt für die Nullhypothese, dass alle Koeffizienten mit Ausnahme des Interzepts β 1 simultan gleich Null sind, oder in anderen Worten, dass alle k 1 Steigungskoeffizienten simultan gleich Null sind. Eine andere Möglichkeit diese Nullhypothese zu interpretieren ist H 0 : E(y x 2,...,x k ) = E(y) wenn der bedingte Erwartungswert von y gleich dem unbedingten Erwartungswert ist leisten die erklärenden Variablen auch gemeinsam keinen Erklärungsbeitrag. In diesem Falle erklärt eine Regression auf die Regressionskonstante y = β 1 + ε die Daten gleich gut wie die lange Regression y = β 1 +β 2 x 2 + +β k x k +ε. Die Alternativhypothese ist H A : mindestens einer der Steigungskoeffizienten ist ungleich Null Wenn diese Nullhypothese wahr ist, sollten alle x Variablen auch gemeinsam keinen Erklärungsbeitrag für y leisten. Wenn die Störterme der Grundgesamtheit normalverteilt sind ist bei Zutreffen der Nullhypothese die Quadratsumme i (ŷ i ȳ) 2 /σ 2 bekanntlich χ 2 -verteilt mit k 1 Freiheitsgraden, und i ˆε2 i/σ 2 unabhängig davon χ 2 -verteilt mit n k Freiheitsgraden. Das Verhältnis zweier unabhängig χ 2 verteilten Zufallsvariablen, die beide durch die entsprechenden Freiheitsgrade dividiert wurden, ist F-verteilt (vgl. Statistischen Appendix), deshalb ist die Teststatistik F-total Statistik = i (ŷ i ȳ) 2 i ˆε2 i n k k 1 ESS/(k 1) H = 0 F(k 1,n k) SSR/(n k) F-verteilt mit k 1 Zähler- und n k Nennerfreiheitsgraden. Wenn die durch alle erklärenden x Variablen gemeinsam erklärte Streuung ESS sehr klein ist im Verhältnis zur unerklärten Streuung SSR würde man einen sehr kleinen Wert der empirischen Statistik F emp erwarten. Wenn umgekehrt ESS groß ist im Verhältnis zu SSR leisten alle x Variablen gemeinsam offensichtlich einen großen Erklärungsbeitrag. Die Nullhypothese β 2 = β 3 = = β k = 0 wird deshalb verworfen, wenn der empirische Wert dieser F-Statistik größer ist als der kritische Wert F crit der F-Statistik, vgl. Abbildung 6.1. Der zur F-total Statistik gehörende p-wert ist wieder die Fläche unter der Verteilung rechts vom berechneten F emp -Wert, und wird standardmäßig von allen statistischen Programmpaketen ausgewiesen. Das Programm STATA liefert z.b. den in Tabelle 6.1 wiedergegebenen Regressionsoutput für das Beispiel mit der Produktionsfunktion; im Kopf des Outputs wird die komplette ANOVA-Tafel wiedergegeben. Dabei ist Model SS die ESS ( Explained Sum of Squares ), die Residual SS die SSR ( Sum of Squared Residuals ) und Total SS die TSS ( Total Sum of Squares ). Für Produktionsfunktions-Beispiel folgt (siehe Tabelle 6.1) F-total Stat = /(3 1) /(25 3) = EViews und R geben die ESS und TSS nicht automatisch aus, sondern nur die F-Statistik mit dem dazugehörigen p-wert.
8 Empirische Wirtschaftsforschung 8 f(f) Akzeptiere H 0 Verwirf H 0 F c F Abbildung 6.1: F-Test Tabelle 6.1: STATA Output Source SS df MS Number of obs = F( 2, 22) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = log_q Coef. Std. Err. t P> t [95% Conf. Interval] const log_k log_l Exkurs Diese F-total Statistik kann alternativ auch mit Hilfe des Bestimmtheitsmaßes R 2 berechnet werden, denn unter Berücksichtigung von TSS = ESS + SSR und R 2 = ESS/TSS ESS/(k 1) F-total Stat = SSR/(n k) = n k ESS k 1 SSR = n k ESS k 1 TSS ESS = n k [ ] ESS/TSS k 1 1 (ESS/TSS) = n k [ ] R 2 k 1 1 R 2 Also F-total Stat = R 2 /(k 1) (1 R 2 )/(n k)
9 Empirische Wirtschaftsforschung 9 Die Alternativhypothese, dass zumindest für einen der Regressoren der wahre Wert des Regressionskoeffizienten von Null verschieden ist, wird akzeptiert, wenn die Nullhypothese H 0 : β 2 = β 3 = = β k = 0 (d.h. dass alle Koeffizienten mit Ausnahme des Interzepts β 1 gleich Null sind) verworfen wird. Man beachte, dass es sich dabei um einen simultanen Test von insgesamt k 1 Hypothesen handelt, wobei k 1 die Anzahl der Steigungskoeffizienten ist. Dies ist also ein Test, ob alle Regressoren gemeinsam einen Beitrag zur Erklärung vony leisten.wennderp-wertdieserf-statistikgrößeristalsdasapriorifestgelegte Signifikanzniveau sollte die Schätzung verworfen werden. Dieser F-total Test wird häufig auch einfach F-Test genannt, zum Beispiel im Regressionsoutput fast jeder Statistiksoftware, was aber etwas verwirrend ist, da jede F-verteilte Teststatistik zu einem F-Test führt, und davon gibt es eine Unmenge. Achtung: Man beachte, dass es nicht reicht zu überprüfen, ob alle Koeffizienten individuell signifikant von Null verschieden sind. Es ist sehr gut möglich, dass kein einziger Koeffizient signifikant von Null verschieden ist, dass aber alle Koeffizienten gemeinsam trotzdem signifikant von Null verschieden sind! Wie wir später sehen werden tritt dieser Fall bei Multikollinearität (d.h. wenn die erklärenden Variablen untereinander hoch korreliert sind) relativ häufig auf. Konkret, die mit der F-Statistik getestete gemeinsame Nullhypothese H 0 : β 2 = β 3 = = β k = 0 darf nicht durch eine Reihe individueller t-tests ersetzt werden! Der Grund dafür liegt darin, dass die F-Statistik die mögliche Korrelation zwischen den OLS-Schätzern β 2, β 3,..., β k berücksichtigt, während diese bei individuellen t- Tests in dieser Form unberücksichtigt bleibt. Dies wird in Abbildung 6.2 veranschaulicht, die zwei bivariate Normalverteilungen zeigt, links ohne und rechts mit einer Korrelation zwischen den Zufallsvariablen. Wenn die Variablen unkorreliert sind (linke Grafik) wird die gemeinsame Signifikanz durch einen Signifikanzkreis dargestellt, bei Korrelation zwischen den Variablen (rechte Grafik) durch eine Konfidenzellipse, die umso schmaler wird, je höher die Korrelation ist. Wir werden später sehen, dass viele der üblichen Teststatistiken für den simultanen Test mehrerer Hypothesen unter den Standardannahmen F-verteilt sind. Sollten z.b. im Modell y i = β 1 + β 2 x i2 + β 3 x i3 + ˆε i die beiden Koeffizienten β 2 und β 3 simultan getestet werden, so kann man die folgende Teststatistik verwenden: F = 1 [ ] S 2ˆσ 2 22 ( β 2 β 2 ) 2 +2S 23 ( β 2 β 2 )( β 3 β 3 )+S 33 ( β 3 β 3 ) 2 H0 F2,n 3 mit S 22 = i (x i2 x 2 ) 2 S 23 = i S 33 = i (x i2 x 2 )(x i3 x 3 ) (x i3 x 3 ) 2
10 Empirische Wirtschaftsforschung 10 ρ = 0: ρ = 0.7: Abbildung 6.2: Bivariate Normalverteilungen ohne und mit Korrelation zwischen den Zufallsvariablen DieseTeststatistik ist unter H 0 F-verteilt mit2zähler-undn 3 Nennerfreiheitsgraden. Diese F-Statistik kann für die Konstruktion einer Konfidenzregion verwendet werden. Wenn wir mit F crit den kritischen F-Wert mit 2 Zähler- und n 3 Nennerfreiheitsgraden bezeichnen ist diese Konfidenzregion [S 22 ( β 2 β 2 ) 2 +2S 23 ( β 2 β 2 )( β 3 β 3 )+S 33 ( β 3 β 3 ) 2 ] F crit (2ˆσ 2 ) Dies definiert eine Ellipsengleichung, das heißt, bei dem simultanen Test zweier Koeffizienten erhält man anstelle eines Konfidenzintervalls eine Konfidenzellipse. Sind die Koeffizienten β 2 und β 3 unkorreliert erhält man einen Kreis, und umso höher die Korrelation zwischen β 2 und β 3 ist, umso schmaler ist die Ellipse. Werden mehr als zwei Hypothesen gleichzeitig getestet erhält man ein höherdimensionales Ellipsoid. Beispiel: Das folgende Beispiel zeigt einen Fall, wo die F-Statistik die gemeinsame Nullhypothese β 2 = β 3 = 0 ablehnt, die individuellen t-tests einzeln aber weder die Ablehnung von β 2 = 0 noch von β 3 = 0 erlauben (auf dem 5% Niveau). Dependent Variable: Y Method: Least Squares Included observations: 50 Variable Coefficient Std. Error t-stat. Prob. const. β x 2 β x 3 β R-squared Log likelihood Adjusted R-squared S.E. of regression Sum squared resid F-statistic Durbin-Watson Stat Prob(F-statistic)
11 Empirische Wirtschaftsforschung 11 Die F-Statistik für die Nullhypothese H 0 : β 2 = 0 und β 3 = 0 ist in diesem Beispiel und kann damit mit einer Wahrscheinlichkeit kleiner als verworfen werden. In diesem Beispiel sind die Regressoren x 2 und x 3 hoch korreliert, d.h. es liegt Multikollinearität vor (der Korrelationskoeffizient zwischen x 2 und x 3 ist 0.95!), was auch zu einer Korrelation zwischen den geschätzten Koeffizienten führt. Die geschätzte Varianz-Kovarianzmatrix der Koeffizienten var(ˆβ) ist β 1 β2 β3 β β β deshalb ist die Korrelation corr( β 2, β 3 ) = / = Aufgrund dieser Korrelation ist die Konfidenzellipse in Abbildung 6.3 ziemlich schmal. Die Konfidenzintervalle für β 2 und β 3 einzeln sind in Abbildung 6.3 strichliert eingezeichnet. Zur Interpretation von Konfidenzellipsen gilt analoges wie für Konfidenzintervalle, wenn sehr viele Stichproben gezogen würden könnten wir damit rechnen, dass (1 α) 100% der resultierenden Konfidenzregionen die wahren Werte β 2 und β 3 enthalten würden. Erinnern wir uns, dass es eine enge Beziehung zwischen Konfidenzintervallen und Hypothesentests gibt. Wenn wir den unter der Nullhypothese vermuteten Wert des Parameters h mit β h bezeichnen (für h = 1,...,k), kann die Nullhypothese geschrieben werden als H 0 : β h = β h. Wenn der unter H 0 vermutete Wert β h im Konfidenzintervall liegt kann die Nullhypothese nicht verworfen werden, wenn der Wert β h hingegen außerhalb des Konfidenzintervalls liegt darf die Nullhypothese verworfen werden. Analoges gilt auch für die Konfidenzellipse. In Abbildung 6.3 ist ersichtlich, dass in diesem Beispiel weder die Nullhypothese H 0 : β 2 = 0 noch die Nullhypothese H 0 : β 3 = 0 einzeln abgelehnt werden kann, der Nullpunkt liegt innerhalb der beiden individuellen Konfidenzintervalle (als grau strichlierte Linien eingezeichnet). Hingegen kann die gemeinsame Nullhypothese, dass beide Steigungskoeffizienten simultan gleich Null sind H 0 : β 2 = 0 und β 3 = 0, abgelehnt werden, der Nullpunkt liegt außerhalb der Konfidenzellipse! Man sieht in Abbildung 6.3, dass es sehr viele Punkte wie z.b. (β 2,β 3) gibt, die ähnlich wie der Nullpunkt sowohl im Konfidenzintervall von β 2 als auch im Konfidenzintervall von β 3 liegen, aber nicht in der Konfidenzellipse für β 2 und β 3. Andererseits sind auch Fälle möglich, wie z.b. Punkt (β 2,β 3 ) in Abbildung 6.3, die außerhalb der beiden individuellen Konfidenzintervalle für β 2 und β 3 liegen, aber innerhalb der Konfidenzellipse. Das bedeutet, dass beide Koeffizienten individuell signifikant von β 2 und β 3 verschieden sind (d.h. es kann sowohl H 0 : β 2 = β 2 als auch H 0 : β 3 = β 3 individuell verworfen werden), aber dass die gemeinsame Nullhypothese H 0 : β 2 = β 2 und β 3 = β 3 nicht verworfen werden kann. Im Beispiel von Abbildung 6.3 ist der empirische t-wert für die H 0 : β 2 = 0.85 gleich t emp = 2.32 (mit p = 0.025), für H 0 : β 3 = 0.1 ist t emp = (p = 0.038),
12 Empirische Wirtschaftsforschung β Konfidenzintervall für β3 ( β 2, β 3 ) (0,0) (β 2,0,β 3,0) -0.4 Konfidenzintervall für β 2 (β 2,0,β 3,0) β 2 Abbildung 6.3: 95%-Konfidenzellipse für beide Koeffizienten und Konfidenzintervalle für die beiden einzelnen Koeffizienten für die Regression aus dem Beispiel auf Seite 10. Die t-statistiken der einzelnen Koeffizienten zeigen, dass die Koeffizienten einzeln nicht signifikant von Null verschieden sind (für α = 0.05), der Nullpunkt (0,0) liegt innerhalb der individuellen Konfidenzintervalle. Wie die F-total- Statistik hingegen zeigt sind Koeffizienten gemeinsam hochsignifikant von Null verschieden, der Nullpunkt liegt außerhalb der Konfidenzellipse! Zum Beispiel können weder die H 0 : β 2 = 0 noch die H 0 : β 3 = 0 einzeln verworfen werden, aber die simultane H 0 : β 2 = 0 und β 3 = 0 wird abgelehnt (der Punkt (0,9) liegt wie viele weitere Punkte (z.b. (β 2,0,β 3,0 )) innerhalb der einzelnen Konfidenzintervalle, aber außerhalb der Konfidenzellipse. Es ist auch möglich, dass die Nullhypothesen einzeln abgelehnt werden können, aber die simultane H 0 nicht abgelehnt werden kann, z.b. werden die H 0 : β 2 = β 2,0 und die H 0 : β 3 = β 3,0 beide einzeln verworfen, aber die simultane H 0 : β 2 = β 2,0 und β 3 = β 3,0 kann nicht verworfen werden!
13 Empirische Wirtschaftsforschung 13 beide Nullhypothesen können also auf einem Signifikanzniveau von 5% verworfen werden. Aber der empirische F-Wert der gemeinsamen Nullhypothese H 0 : β 2 = 0.85 und β 3 = 0.1 ist F emp = 2.74 mit p = 0.075, die gemeinsame Nullhypothese kann also auf einem Signifikanzniveau von 5% nicht verworfen werden! Die t-statistiken der einzelnen Koeffizienten können also signifikant sein, obwohl die F-Statistik für die gemeinsame Nullhypothese nicht signifikant ist. Solche Fälle sind allerdings selten und treten meist nur bei hoher Multikollinearität auf. Als nächstes werden wir eine allgemeinere Möglichkeiten kennen lernen eine F- Statistik zu berechnen, die den Test komplexerer Nullhypothesen erlaubt. 6.3 Simultane Tests auf (mehrere) lineare Restriktionen Zahlreiche Tests beruhen auf einem Vergleich zweier Modelle. Dabei wird in der Regel ein Modell ohne Restriktion(en) geschätzt und mit einem anderen Modell verglichen, das unter Berücksichtigung einer oder mehrerer Restriktionen geschätzt wurde (vgl. Griffiths et al., 1993, Chapter 11). In diesem Fall lässt sich das restringierte Modell immer als Speziallfall eines allgemeinen (d.h. nicht restringierten) Modells darstellen. Ein Test zwischen zwei Modellen, bei denen es möglich ist eines der beiden Modelle durch geeignete Parameterrestriktionen in das andere Modell überzuführen, wird im Englischen als nested test (geschachtelte Hypothesen) bezeichnet. In diesem Abschnitt werden wir uns ausschließlich auf solche nested tests beschränken. Ein ganz einfaches Beispiel für ein Modell ohne Restriktionen sei z.b. Unter der Restriktion β 3 = 0 gilt y i = β 1 +β 2 x i2 +β 3 x i3 +ε i da 0 x i3 = 0. y i = β 1 +β 2 x i2 +ε i Wenn das wahre β 3 tatsächlich Null ist sollte ε i = ε i sein, und die beiden Stichprobenregressionsfunktionen (SRF) y i = β 1 + β 2 x i2 + β 3 x i3 +ˆε i und y i = β 1 + β 2 x i2+ˆε i sollten sehr ähnliche Residuen liefern. Ein anderes Beispiel, wenn die Nullhypothese β 3 = 1 richtig ist kann das Modell unter dieser Restriktion geschrieben werden als und die entsprechende SRF in der Form y i = β1 +β 2 x i2 +1x i3 +ε i (y i x i3 ) = β 1 + β 2 x i2 + ˆε i schätzen, wobei wir aber einen neue abhängige Variable y = (y i x i3 ) bilden müssen.
14 Empirische Wirtschaftsforschung 14 Im Prinzip werden für geschachtelte ( nested ) Tests immer zwei Gleichungen geschätzt, eine Gleichung ohne Restriktion(en), das nicht-restringierte (bzw. unrestringierte) Modell, und eine eine Gleichung mit Restriktion(en) das restringierte Modell das man im wesentlichen durch Einsetzen der Nullhypothese in das nicht restringierte Modell erhält. Dieser Test ist sehr allgemein einsetzbar und kann auch für den Test mehrerer Restriktionen verwendet werden Beispiele Im Folgenden bezeichnet q die Anzahl der Restriktionen: PRF: β 1 +β 2 x 2 +β 3 x 3 +ε Restriktion: H 0 : β 2 = β 3 (q = 1) Modell ohne Restriktion: y = β 1 + β 2 x 2 + β 3 x 3 + ˆε Modell mit Restriktion: y = β 1 + β 2 (x 2 +x 3 )+ ˆε Wenn die Nullhypothese β 2 = β 3 wahr ist würden wir für die Schätzungen des restringierten und nicht-restringierten Modells zumindest sehr ähnliche Ergebnisse erwarten. PRF: β 1 +β 2 x 2 +β 3 x 3 +β 4 x 4 +ε Restriktion: H 0 : β 3 = 0 & β 4 = 0 (q = 2) Modell ohne Restriktion: y = β 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ˆε Modell mit Restriktion: y = β 1 + β 2 x 2 + ˆε PRF: β 1 +β 2 x 2 +β 3 x 3 +ε Restriktion: H 0 : β 2 +β 3 = 1 (q = 1) Modell ohne Restriktion: y = β 1 + β 2 x 2 + β 3 x 3 + ˆε Modell mit Restriktion: y = β 1 + β 2 x 2 +(1 β 2 )x 3 + ˆε diese Gleichung kann in der folgenden Form geschätzt werden: y x 3 = β 1 + β 2(x 2 x 3 )+ ˆε Man beachte, dass in diesem Fall zwei neue Variablen y x 3 und x 2 x 3 angelegt werden müssen. PRF: β 1 +β 2 x 2 +β 3 x 3 +β 4 x 4 +ε Restriktion: H 0 : β 2 = 0.5 β 3 & β 4 = 1 (q = 2) Modell ohne Restriktion: y = β 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ˆε Modell mit Restriktionen: y +x 4 = β 1 + β 3 [0.5x 2 +x 3 ]+ ˆε
15 Empirische Wirtschaftsforschung 15 Wenn die entsprechenden Nullhypothesen wahr sind würden wir für die Schätzungen der Stichprobenregressionsfunktionen des restringierten und nicht-restringierten Modells sehr ähnliche Ergebnisse erwarten, insbesondere sollten sich auch die Quadratsummen der Residuen des nicht-restringierten und des restringierten Modells nicht stark unterscheiden. Tatsächlich kann man zeigen, dass aus diesen Quadratsummen der Residuen eine einfache Teststatistik konstruiert werden kann, die einen Test der Nullhypothese(n) erlaubt. Wenn wir mit SSR u (Sum od Squared Residuals) die Quadratsumme der Residuen ohne Restriktionen (der Subindex u für unrestricted) und mit SSR r die Quadratsumme der Residuen des r estringierten Modells bezeichnen, so kann man zeigen, dass der Skalar F-Stat = (SSR r SSR u )/q SSR u /(n k) H 0 Fq,n k (6.1) unter H 0 F-verteilt ist mit q Zähler und (n k) Nennerfreiheitsgraden, wobei q die Anzahl der Restriktionen bezeichnet. 11 Zwiscehnfrage: Warum muss immer gelten SSR r SSR u? Dieser Test ist sehr allgemein und kann für verschiedenste Tests von Restriktionen auf Koeffizienten verwendet werden. Mit Hilfe dieser Teststatistik kann wieder der p-wert nach Fisher berechnet werden, oder man kann einen Neyman und Pearson vorgehen 1. Formuliere Null- und Alternativhypothese. 2. Lege a priori ein Signifikanzniveau α fest. 3. Verwende die Information über die Teststatistik und die Freiheitsgrade, um den kritischen Wert Fq,n k crit in eienr F-Tabelle nachzuschlagen. Verwende diesen um Annahme- und Verwerfungsbereich festzulegen. 4. Schätze das Modell ohne Restriktionen mittels OLS. Berechne aus diesem nicht restringierten Modell die Quadratsumme der Residuen SSR u (in EViews z.b. mit eqname.@ssr; in R deviance(eqname); in Stata mit dem postestimation Befehl e(rss)). 5. Schätze das Modell mit den Restriktionen der Nullhypothese (das restringierte Modell) mittels OLS. Berechne daraus die restringierte Quadratsumme der Residuen SSR r. 6. Berechne daraus den empirischen Wert der F-Statistik F emp = (SSR r SSR u )/q SSR u /(n k) wobei die Zählerfreiheitsgrade q die Anzahl der Restriktionen sind, n k die Nennerfreiheitsgrade. 11 Die Quadratsumme der Residuen ist n i=1 ˆε2 i und kann in Vektorschreibweise auch als inneres Produkt des Residuenvektors geschrieben werden ˆε ˆε.
9. Schätzen und Testen bei unbekannter Varianz
9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,
MehrGüte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über
Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion
MehrStatistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005
Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen
MehrEinfache Varianzanalyse für abhängige
Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese
MehrTutorial: Homogenitätstest
Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite
MehrLineargleichungssysteme: Additions-/ Subtraktionsverfahren
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als
MehrProfil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8
1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen
MehrAngewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen. Das folgende Modell ist ein GARCH(1,1)-Modell:
Angewandte Ökonometrie, WS 2012/13, 1. Teilprüfung am 6.12.2012 - Lösungen LV-Leiterin: Univ.Prof.Dr. Sylvia Frühwirth-Schnatter 1 Wahr oder falsch? 1. Das folgende Modell ist ein GARCH(1,1)-Modell: Y
MehrMusterlösung zu Serie 14
Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen
MehrBachelorabschlussseminar Dipl.-Kfm. Daniel Cracau
1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang
MehrEinfache Hypothesentests für multiple Regressionen
Kapitel 6 Einfache Hypothesentests für multiple Regressionen Economists have inherited from the physical sciences the myth that scientific inference is objective, and free of personal prejudice. This is
MehrMelanie Kaspar, Prof. Dr. B. Grabowski 1
7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen
MehrProfessionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
MehrMETHODENLEHRE I WS 2013/14 THOMAS SCHÄFER
METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede
MehrLineare Modelle in R: Einweg-Varianzanalyse
Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der
MehrStatistische Auswertung:
Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.
Mehr1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen
Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders
MehrMotivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen
Universität Karlsruhe (TH) Forschungsuniversität gegründet 825 Wilcoxon-Rangsummentest oder Mann-Whitney U-Test Motivation In Experimenten ist die Datenmenge oft klein Daten sind nicht normalverteilt Dann
Mehr90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft
Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte
MehrBiostatistik, WS 2015/2016 Der zwei-stichproben-t-test
1/29 Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test (t-test für ungepaarte Stichproben) Matthias Birkner http://www.staff.uni-mainz.de/birkner/biostatistik1516/ 11.12.2015 2/29 Inhalt 1 t-test
MehrInhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1
Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...
MehrEine Einführung in R: Statistische Tests
Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/
Mehr1.3 Die Beurteilung von Testleistungen
1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen
MehrX =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?
Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2
MehrWebergänzung zu Kapitel 10
Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder
MehrLösung zu Kapitel 11: Beispiel 1
Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten
Mehrx t2 y t = 160, y = 8, y y = 3400 t=1
Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =
MehrGrundlagen der Inferenzstatistik
Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,
MehrZeichen bei Zahlen entschlüsseln
Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren
MehrStatistische Thermodynamik I Lösungen zur Serie 1
Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen
Mehr50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte
50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien
MehrKlausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min
Klausur, Multivariate Verfahren, SS 2006, 6 Kreditpunkte, 90 min 1 Prof. Dr. Fred Böker 08.08.2006 Klausur zur Vorlesung Multivariate Verfahren, SS 2006 6 Kreditpunkte, 90 min Gesamtpunkte: 39 Aufgabe
MehrV 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,
Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen
MehrFortgeschrittene Statistik Logistische Regression
Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E
MehrRekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt
Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung
MehrEinfache statistische Auswertungen mit dem Programm SPSS
Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...
MehrPrimzahlen und RSA-Verschlüsselung
Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also
MehrBeispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen
4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.
MehrName (in Druckbuchstaben): Matrikelnummer: Unterschrift:
20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie
MehrUniversität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B
Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben
MehrEmpirische Wirtschaftsforschung
Empirische Wirtschaftsforschung Herbert Stocker Online-Exercise: Life expectancy Die durchschnittliche Lebenserwartung hat in den meisten Ländern über die letzten fünf Dekaden mehr oder weniger stark zugenommen.
MehrDie Optimalität von Randomisationstests
Die Optimalität von Randomisationstests Diplomarbeit Elena Regourd Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Düsseldorf im Dezember 2001 Betreuung: Prof. Dr. A. Janssen Inhaltsverzeichnis
Mehrgeben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen
geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde
MehrR ist freie Software und kann von der Website. www.r-project.org
R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird
MehrInterne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
Mehr3.1. Die komplexen Zahlen
3.1. Die komplexen Zahlen Es gibt viele Wege, um komplexe Zahlen einzuführen. Wir gehen hier den wohl einfachsten, indem wir C R als komplexe Zahlenebene und die Punkte dieser Ebene als komplexe Zahlen
MehrAnalog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.
Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit
MehrFüllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge
2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten
Mehr0, v 6 = 2 2. 1, v 4 = 1. 2. span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 )
Aufgabe 65. Ganz schön span(n)end. Gegeben sei folgende Menge M von 6 Vektoren v, v,..., v 6 R 4 aus Aufgabe P 6: M = v =, v =, v =, v 4 =, v 5 =, v 6 = Welche der folgenden Aussagen sind wahr? span(v,
MehrVarianzanalyse (ANOVA: analysis of variance)
Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.
MehrWürfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.
040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl
MehrEin möglicher Unterrichtsgang
Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige
MehrAnhand des bereits hergeleiteten Models erstellen wir nun mit der Formel
Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3
MehrBinäre abhängige Variablen
Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen
MehrDie Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.
Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,
MehrSowohl die Malstreifen als auch die Neperschen Streifen können auch in anderen Stellenwertsystemen verwendet werden.
Multiplikation Die schriftliche Multiplikation ist etwas schwieriger als die Addition. Zum einen setzt sie das kleine Einmaleins voraus, zum anderen sind die Überträge, die zu merken sind und häufig in
MehrGleichungen Lösen. Ein graphischer Blick auf Gleichungen
Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term
MehrInformationsblatt Induktionsbeweis
Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln
MehrStatistischer Rückschluss und Testen von Hypothesen
Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse
MehrStellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster
Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.
MehrOECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland
OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben
Mehrε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?
BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions
MehrStatistik II für Betriebswirte Vorlesung 2
PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander
MehrLineare Gleichungssysteme
Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der
MehrAuswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro
Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen
MehrRepetitionsaufgaben Wurzelgleichungen
Repetitionsaufgaben Wurzelgleichungen Inhaltsverzeichnis A) Vorbemerkungen B) Lernziele C) Theorie mit Aufgaben D) Aufgaben mit Musterlösungen 4 A) Vorbemerkungen Bitte beachten Sie: Bei Wurzelgleichungen
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrKorrelation (II) Korrelation und Kausalität
Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen
MehrGrundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen
Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen 1. Quadratische Gleichungen Quadratische Gleichungen lassen sich immer auf die sog. normierte Form x 2 + px + = 0 bringen, in
MehrVersuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann
Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................
MehrBinäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen
Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders
Mehr6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)
6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden
Mehr1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:
Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:
MehrDas Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":
Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur
MehrDokumentation. estat Version 2.0
Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim
MehrDas große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten
Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während
MehrWelche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?
Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 9B a) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Man kann erwarten, dass der Absatz mit steigendem Preis abnimmt, mit höherer Anzahl der Außendienstmitarbeiter sowie mit erhöhten
MehrAbituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)
Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Eine Firma stellt USB-Sticks her. Sie werden in der Fabrik ungeprüft in Packungen zu je 20 Stück verpackt und an Händler ausgeliefert. 1 Ein Händler
MehrAustausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen
Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:
MehrGibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?
Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv
MehrDas RSA-Verschlüsselungsverfahren 1 Christian Vollmer
Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer Allgemein: Das RSA-Verschlüsselungsverfahren ist ein häufig benutztes Verschlüsselungsverfahren, weil es sehr sicher ist. Es gehört zu der Klasse der
MehrProbeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden!
Probeklausur EW II Bitte schreiben Sie Ihre Antworten in die Antwortfelder bzw. markieren Sie die zutreffenden Antworten deutlich in den dafür vorgesehenen Kästchen. Wenn Sie bei einer Aufgabe eine nicht-zutreffende
MehrAccess [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten
Berichte bieten die gleichen Möglichkeit zur Berechnung von Werten wie Formulare und noch einige mehr. Im Gegensatz zu Formularen bieten Berichte die Möglichkeit, eine laufende Summe zu bilden oder Berechnungen
MehrTipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".
Mathematik- Unterrichts- Einheiten- Datei e. V. Klasse 9 12 04/2015 Diabetes-Test Infos: www.mued.de Blutspenden werden auf Diabetes untersucht, das mit 8 % in der Bevölkerung verbreitet ist. Dabei werden
Mehrinfach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock
infach Ihr Weg zum finanzellen Erfolg Geld Florian Mock FBV Die Grundlagen für finanziellen Erfolg Denn Sie müssten anschließend wieder vom Gehaltskonto Rückzahlungen in Höhe der Entnahmen vornehmen, um
Mehrq = 1 p = 0.8 0.2 k 0.8 10 k k = 0, 1,..., 10 1 1 0.8 2 + 10 0.2 0.8 + 10 9 1 2 0.22 1 = 0.8 8 [0.64 + 1.6 + 1.8] = 0.678
Lösungsvorschläge zu Blatt 8 X binomialverteilt mit p = 0. und n = 10: a PX = = 10 q = 1 p = 0.8 0. 0.8 10 = 0, 1,..., 10 PX = PX = 0 + PX = 1 + PX = 10 10 = 0. 0 0.8 10 + 0. 1 0.8 9 + 0 1 10 = 0.8 8 [
MehrAusarbeitung des Seminarvortrags zum Thema
Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung
MehrEinführung in die Algebra
Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv
MehrFAKTORIELLE VERSUCHSPLÄNE. Andreas Handl
FAKTORIELLE VERSUCHSPLÄNE Andreas Handl 1 Inhaltsverzeichnis 1 Versuchsplanung 4 2 Einfaktorielle Varianzanalyse 6 2.1 DieAnnahmen... 6 2.2 Die ANOVA-Tabelle und der F -Test... 6 2.3 Versuche mit zwei
MehrKorrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrAnwendungshinweise zur Anwendung der Soziometrie
Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren
MehrStochastische Eingangsprüfung, 17.05.2008
Stochastische Eingangsprüfung, 17.5.8 Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus. Aufgabe 1 ( Punkte) Sei X : Ω [, ) eine integrierbare Zufallsvariable mit XdP = 1. Sei Q : A R, Q(A)
Mehr1 Mathematische Grundlagen
Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.
MehrTeekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).
Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den
Mehr