Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 2 Prof. Dr. Christian Heumann WS 205/6 Aufgabe : Der Datensatz Theater (verfügbar auf der Homepage) beinhaltet Informationen über eine Studie, die das Ausgabeverhalten der Bürger der Stadt Basel untersucht hat. Er enthält u.a. folgende Variablen: y y 2 x x 2 das Theater 2008 in (SFR) Kultur im Allgemeinen in SFR Alter in Jahren Jahresgehalt in 000 SFR a) Betrachten Sie die deskriptiven Statistiken zu das Theater 2008. Wie sind die Werte zu interpretieren? Wie lautet die Spannweite? Wie groß ist der Variationskoeffizient? Statistiken das Theater 2008 Gültig Fehlend Mittelwert Median Modus Standardabweichung Varianz Minimum Maximum Perzentile 25 50 75 0 39,68 2,00 35 76,59 5855,083 23 463 86,00 2,00 7,00
b) Betrachten Sie das folgende Streudiagramm zwischen Ausgaben Theater (y ) und Jahresgehalt (x 2 ). Ist eine Struktur zu erkennen? Ist diese stark ausgeprägt? Vermuten Sie, dass ein Zusammenhang zwischen den beiden Variablen besteht? 500 das Theater 2008 400 300 200 00 0 25,0 50,0 75,0 00,0 Jahresgehalt in Tausend 25,0 c) Betrachten Sie den folgenden Regressionsoutput. Wie lauten die fehlenden Werte [], [2] und [3]? zusammenfassung Standardfehle R R-Quadrat Korrigiertes R-Quadrat r des Schätzers [3] a [2],30 7,370 a. Einflußvariablen :, Jahresgehalt in Tausend AOVA b Regression Residuen Gesamt Quadratsum me [] 3550298,543 4086848,27 df 697 698 Mittel der Quadrate 536549,675 5093,685 F 05,336 a. Einflußvariablen :, Jahresgehalt in Tausend b. Abhängige Variable: das Theater 2008 Sig. Page,000 a Jahresgehalt in Tausend Standardisierte Regressions Standard koeffizientb fehler Beta T Sig. -,408 4,967 -,762,446 2,08 a,205 a. Abhängige Variable: das Theater 2008,362 0,263,000
d) Wie lautet das Regressionsmodell? Wie kann man es interpretieren? e) Berechnen Sie die in den folgenden Outputs mit gekennzeichneten Korrelationen! Mittelwert Standardabweichung Kultur 29,86 5,802 Alter 4,27 3,957 Jahresgehalt in Tausend 7,679 3,535 das Theater 2008 39,68 76,59 Kultur Alter Jahresgehalt in Tausend Schweizer Franken das Theater 2008 Kultur Korrelation nach Pearson Quadratsummen und Kreuzprodukte 873048,406 77554,45 66474,005 65936,634 Kovarianz 2683,450 254,376 95,235 670,396 Wir gehen im Folgenden nun davon aus, dass die Kultur im Allgemeinen (y2) nur klassiert vorliegen ( keine Ausgaben, sehr wenig Ausgaben,..., hohe Ausgaben 7 Kategorien) und untersuchen einen möglichen Zusammenhang zwischen den Ausgaben und der Alterskategorie ( 0-20 Jahre, 2-30 Jahre,..., über 60 Jahre 6 Kategorien). ominal- bzgl. ominalmaß Ordinal- bzgl. Ordinalmaß Intervall- bzgl. Intervallmaß Phi Cramer-V Kontingenzkoeffizient Kendall-Tau-b Kendall-Tau-c Gamma Korrelation nach Spearman Pearson-R Anzahl der gültigen Fälle Symmetrische Maße Wert,452,202,42,300,294,364,375,369 Asymptotischer Standardfehler a,028,027,033,034,034 äherungsweises T b 0,857 0,857 0,857 0,665 0,483 a. Die ull-hyphothese wird nicht angenommen. b. Unter Annahme der ull-hyphothese wird der asymptotische Standardfehler verwendet. f) Interpretieren Sie die Ergebnisse des SPSS-Outputs! g) Der Wert von χ 2 beträgt in Aufgabenteil f) 42,83. Bestimmen Sie die Werte von Cramers V, dem Kontingenzkoeffizienten und Phi von Hand! Erhalten Sie die gleichen Ergebnisse wie SPSS? Seite Seite
Aufgabe 2: In einer Studie soll der Zusammenhang zwischen der durchschnittlichen Monatstemperatur und der Hotelauslastung an drei Orten untersucht werden. Als typischer Wintersportort wurde Davos gewählt, für den Sommerurlaub Polenca auf Mallorca und als Stadt- und Geschäftsreiseziel Basel. Es wurden in den Monaten des Jahres 2002 die Durchschnittstemperaturen (X) tagsüber sowie die Hotelauslastungen (Y ) erhoben. Davos Polenca Basel Monat X Y X Y X Y Jan -6 9 0 3 23 Feb -5 89 0 2 0 82 Mar 2 76 4 42 5 40 Apr 4 52 7 64 9 45 May 7 42 22 79 4 39 Jun 5 36 24 8 20 43 Jul 7 37 26 86 23 50 Aug 9 39 27 92 24 95 Sep 3 26 22 36 2 64 Oct 9 27 9 23 4 78 ov 4 68 4 3 9 9 Dec 0 92 2 4 4 2 a) Berechnen Sie den Korrelationskoeffizienten r(x,y ). Gibt es einen linearen Zusammenhang? (Hinweis: 36 i= x iy i = 22776, x = 2,22, ȳ = 5,28, S xx = 2770,22 und S yy = 2545,22) b) Aufgesplittet nach den drei Orten ergeben sich (über SPSS) folgende drei Korrelationen. Wie interpretieren Sie dieses Ergebnis? r D = 0,87 r P = 0,88 r B = 0,45 Wir wollen nun die kategoriale Variable Ort in Dummykodierung in einem Regressionsmodell als Einflussgröße verwenden. Die Variable Z (also der Ort ) hat k = 3 Ausprägungen, also benötigen wir k = 2 Dummys Z und Z 2. Wir wählen Basel als Referenzkategorie, Z steht für Davos, Z 2 für Polenca. c) Erläutern an Sie an diesem Beispiel kurz den Begriff der Dummycodierung!
d) Wir wählen als abhängige Variable die Temperatur. Mit SPSS erhalten wir folgendes Regressionsmodell: Davos Polenca Standardisiert e Regressionsk Standardfehle oeffizientb r Beta T Sig. 2,000 2,234 5,372,000-5,47 6,083 a. Abhängige Variable: Temperatur a 3,59 3,59 -,29,327 -,75,926,096,063 Interpretieren Sie den Output: Wie lautet das? Wie lauten die Durchschnittstemperaturen von Basel, Davos und Polenca? e) Wir wählen als abhängige Variable Hotelauslastung und erhalten folgendes Regressionsmodell mit SPSS: Davos Polenca Standardisiert e Regressionsk Standardfehle oeffizientb r Beta T Sig. 48,333 7,946 6,083,000 7,97,97 a. Abhängige Variable: Hotelauslastung a,237,237,40,06,705,082,486,935 Interpretieren Sie den Output: Wie lautet das? Wie lauten die durchschnittlichen Hotelauslastungen von Basel, Davos und Polenca? Page