Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Ähnliche Dokumente
Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012

Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Eigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Hypothesentests mit SPSS

Statistik II Übung 3: Hypothesentests

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis

Geschlecht + Anfangsgehalt. T-Test für das Anfangsgehalt Gruppenstatistiken. Der SPSS Output der aktuellen Computerübung zum Aufgabenblatt 3

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Statistik I. Zusammenfassung und wichtiges zur Prüfungsvorbereitung. Malte Wissmann. 9. Dezember Universität Basel.

Einführung in die Statistik

Teil II: Einführung in die Statistik

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Klausur Statistik I Dr. Andreas Voß Wintersemester 2005/06

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Statistik II Übung 3: Hypothesentests Aktualisiert am

Statistische Methoden in den Umweltwissenschaften

Inhaltsverzeichnis. Über die Autoren Einleitung... 21

Statistik. Jan Müller

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Teil / Ein paar statistische Grundlagen 25. Kapitel 1 Was Statistik ist und Warum sie benötigt Wird 2 7

Inhaltsverzeichnis Grundlagen aufigkeitsverteilungen Maßzahlen und Grafiken f ur eindimensionale Merkmale

Prüfung aus Statistik 2 für SoziologInnen

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Statistik II Übung 2: Multivariate lineare Regression

Grundlagen der empirischen Sozialforschung

Statistik I für Studierende der Wirtschaftswissenschaften Übungsblatt 12 Prof. Dr. Christian Heumann WS 2015/16

Statistik II Übung 1: Einfache lineare Regression

entschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.

Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen

Methoden empirischer Sozial- und Wirtschaftsforschung

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

Deskriptive Statistik

Wiederholung. Statistik I. Sommersemester 2009

Statistik K urs SS 2004

B. Regressionsanalyse [progdat.sav]

Statistik II Übung 2: Multivariate lineare Regression

Aufgaben zu Kapitel 4

Bitte am PC mit Windows anmelden!

Standardab er des. Testwert = % Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere

Kapitel 4: Merkmalszusammenhänge

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

Heinz Holling & Günther Gediga. Statistik - Deskriptive Verfahren

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

beruflicher Bildungsabschluss incl. Hochschulabschl. 4Kat.(m) Häufigkeit Prozent Gültig Lehre/Beruffachgesundh.Schule ,2 59,2 59,2

Projekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?

Lösung 1. die 1 angeben. Alternativ kann man auch. Variable berechnen wählen und dann die Summe von Q2_6 und Q2_7 wählen.

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

Klausur Statistik I. Dr. Andreas Voß Wintersemester 2005/06

2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.

Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test

Inhalt. Vorwort Univariate Verteilungen Verteilungen Die Normalverteilung... 47

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN

Angewandte Statistik 3. Semester

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Stichwortverzeichnis. Symbole

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

SPSS-Ausgabe 1: Univariate Varianzanalyse. Profildiagramm. [DatenSet1] D:\Sozialwiss2006_7\STAT2\Daten\mathsalaries.sav. Seite 1

Statistische Datenanalyse

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Rainer Diaz-Bone. Statistik für. Soziologen. 3M erweiterte Auflage. UVK Verlagsgesellschaft mbh Konstanz mit UVK/Lucius München

Statistik II: Signifikanztests /2

Lagemaße Übung. Zentrale Methodenlehre, Europa Universität - Flensburg

Statistische Messdatenauswertung

Statistik... formeln für Dummies

Zusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen

Merkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum

Online Statistik-Coaching

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Arbeitsbuch zur deskriptiven und induktiven Statistik

Lehrinhalte Statistik (Sozialwissenschaften)

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Klausurvorbereitung - Statistik

Einführung in die Statistik

'+4 Elisabeth Raab-Steiner / Michael Benesch. Der Fragebogen. Von der Forschungsidee zur SPSS-Auswertung. 4., aktualisierte und überarbeitete Auflage

Teil: lineare Regression

Über den Autor 7 Über den Fachkorrektor 7. Einführung 19

Parametrische vs. Non-Parametrische Testverfahren

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a.

Vorlesung: Multivariate Statistik für Psychologen

Statistik II Übung 1: Einfache lineare Regression

Sommersemester Marktforschung

5. Lektion: Einfache Signifikanztests

Transkript:

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen und überflüssige Ankreuzungen) erhalten Sie die angegebene Punktzahl! Viel Erfolg! 1. Für eine statistische Analyse wird eine Reihe von Merkmalen erfasst. Notieren Sie jeweils mit N, O, I bzw. R, ob es sich um eine Nominal-, Ordinal-, Intervall- oder Ratio-Skala handelt (4 Punkte). _ Das Geburtsjahr des Befragten _ Die Staatsangehörigkeit des Befragten _ Die Selbsteinschätzung auf einer Links-Rechts-Skala (von 0 bis 10) _ Die Kindersterblichkeitsrate pro 1.000 Einwohner eines Landes _ Die Schulden eines Landes in US-Dollar _ Die Beurteilung der Arbeit der Bundesregierung (sehr gut, gut, schlecht, sehr schlecht) _ Die Arbeitslosenrate eines Landes _ Das politische System eines Landes (Anarchie, Diktatur, Monarchie, Theokratie, Demokratie) 2. Wie kann man den Zusammenhang zwischen einer nominal- und einer ordinalskalierten Variablen darstellen? (3 Punkte) Es ist nicht möglich, den Zusammenhang zwischen diesen Variablen darzustellen Pearson s N Streudiagramm Chi² 3. Welche der folgenden Aussagen zu Grafiken sind richtig? (3 Punkte) Ordinalskalierte Variablen lassen sich nur in Histogrammen darstellen. Nominalskalierte Variablen eignen sich aufgrund des fehlenden Nullpunktes nicht für die Darstellung innerhalb eines Balkendiagrammes. Man benötigt wenigstens zwei metrische Variablen, um ein Scatterplot zu erstellen. Metrische und nominalskalierte Variablen lassen sich nicht innerhalb des gleichen Diagramms darstellen. 4. Ordnen Sie den Variablen eine passende Darstellungsform zu. Notieren Sie jeweils mit B, G, H oder S, ob es sich um ein Balkendiagramm, Histogramm, Gruppiertes Boxplot oder Streudiagramm handelt (3 Punkte): _ Die Schulden der Befragten (in ), geordnet nach dem Bundesland der Befragten _ Die Militärausgaben verschiedener Länder (in US-$) in Abhängigkeit von der Alphabetisierungsrate _ Anzahl der Straftaten pro 100 Einwohner in verschiedenen Ländern in Abhängigkeit von der Arbeitslosenquote der Länder _ Die Wahlabsicht der Befragten _ Anzahl der Polizisten pro 1.000 Einwohner in verschiedenen Ländern _ Bildungsniveau der Befragten Teil 2: Seite 1 von 6

5. Welche der folgenden Aussagen sind richtig? (3 Punkte) Bei einer Standardnormalverteilung befinden sich Modus, Median und arithmetisches Mittel auf dem Erwartungswert. Der Median ist weniger anfällig gegenüber Ausreißern und Extremwerten als das arithmetische Mittel. Bei einer linkssteilen Verteilung befindet sich der Median rechts vom Modus. Bei einer rechtsschiefen Verteilung befindet sich der Median rechts vom Modus. 6. Erläutern Sie folgende Grafik (3 Punkte): Es wurde ein gruppiertes Boxplot für die Verteilung des Nettoeinkommens in den alten und neuen Bundesländern, jeweils für deutsche und andere Staatsangehörige erstellt. Mehr als 75% aller Fälle liegen unter 2.000. Aufgrund der Quartilsgleichheit innerhalb der Boxen kann von einer Normalverteilung der Nettoeinkommen ausgegangen werden. Die geringste Spannweite besitzt die Verteilung des Nettoeinkommens der Befragten anderer Staatsangehörigkeit aus den neuen Bundesländern. 7. In einer Studie wurden das Geschlecht und der Besitz eines Führerscheins erfasst. Welche Aussagen sind richtig? (3 Punkte) männlich Führerschein 60 50 kein Führerschein 30 25 weiblich Insgesamt wurden 165 Personen befragt. Die Kreuztabelle spricht für vollkommene statistische Unabhängigkeit der beiden Merkmale. Männliche Teilnehmer haben mit einer höheren Wahrscheinlichkeit einen Führerschein. Nach einer Berechnung von Chi² würde dieses den Wert von 0 annehmen. Teil 2: Seite 2 von 6

8. Aus einem Länder-Datensatz ergibt sich folgende Korrelationsmatrix. Welche Aussagen sind richtig? (3 Punkte) Zwischen Alphabetisierungsrate und Bevölkerungswachstum besteht ein signifikant positiver Zusammenhang. Ein geringes BIP pro Kopf geht mit einem hohen Bevölkerungswachstum einher. Es wurden insgesamt 109 Länder untersucht. Zwischen BIP pro Kopf und Alphabetisierungsrate besteht ein positiver Zusammenhang, dieser ist jedoch nicht signifikant. 9. Welche der folgenden Aussagen zu Korrelationen sind korrekt? (3 Punkte) Die Spearman-Korrelation basiert auf einem Rangvergleich. Überschreitet Pearson s r den Wert von 0,5 muss von Kausalität ausgegangen werden. Wenn Korrelation vorliegt, liegt auch immer Kausalität vor. Spearman s r und Pearson s r können Werte von -1 bis +1 annehmen. 10. Welche der folgenden Aussagen zu Ausreißern und Extremwerten sind richtig? (3 Punkte) Ein Mindestmaß an Ausreißern und Extremwerten ist notwendig, um ein Boxplot zu erstellen. Die Spannweite ist aufgrund ihrer Berechnung nicht anfällig gegenüber Ausreißern. Das Vorhandensein von Extremwerten macht eine Stichprobe ungültig, um sie in weitere Berechnungen einfließen zu lassen. Extremwerte befinden sich 3 Kastenlängen oder mehr von der Box entfernt. Teil 2: Seite 3 von 6

11. Erläutern Sie die folgende Grafik (3 Punkte): Es handelt sich um ein Histogramm Aufgrund der Darstellung kann sicher von einer Normalverteilung des Nettoeinkommens ausgegangen werden. Die Verteilung ist rechtsschief Der Median liegt bei ungefähr 5.000 Euro 12. Erläutern Sie folgende Grafik (3 Punkte): In dem vorliegenden Histogramm wird die Verteilung des Zusammenhangs zwischen Alphabetisierungsrate und BSP pro Kopf durch Ausreißer verzerrt. Das R 2 deutet auf einen starken linearen Zusammenhang hin. R 2 deutet auf einen leichten negativen Zusammenhang von 0,182 hin. Die Regressionsgerade im Streudiagramm stellt den Zusammenhang beider Variablen sehr gut dar. Teil 2: Seite 4 von 6

13. Welche der folgenden Aussagen zur linearen Regression sind richtig? (3 Punkte) Besonders bei multiplen linearen Regressionen mit geringer Fallzahl sollte das korrigierte R 2 statt des unkorrigierten R 2 beachtet werden. Multikollinearität zwischen den unabhängigen Variablen ist zu vermeiden. Ein negatives R 2 deutet auf einen negativen Zusammenhang zwischen den Variablen hin. Die Signifikanzresistenz eines Zusammenhangs kann durch die Korrelation der Variablen erklärt werden. 14. Welche Aussagen zur Teststatistik sind zutreffend? (3 Punkte) Je größer die Stichprobe ist, desto höher ist die Wahrscheinlichkeit, dass der Mittelwert der Stichprobe dem der Grundgesamtheit entspricht. Konfidenzintervalle geben wie Somer s d und Gamma den Zusammenhang ordinalskalierter Variablen an. Der t-test testet den Unterschied zweier Mittelwerte. Aus diesem Grund sollten keine nominalskalierten Variablen verwendet werden, da das arithmetische Mittel ein Lagemaß für metrische Variablen ist. Signifikante Werte werden in Tabellen häufig mit Sternen gekennzeichnet. Anschaulicher wäre es jedoch, signifikante Werte in einer Boxplot-Grafik darzustellen. 15. Welche Aussagen über den folgenden SPSS-Ausdruck sind richtig? (3 Punkte) Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit T-Test für die Mittelwertgleichheit Sig. (2- Mittlere Standardfehler F Signifikanz T df seitig) Differenz der Differenz NETTOEINKOMMEN Varianzen sind gleich Varianzen sind nicht gleich 125,997,000 17,544 2642,000 563,516 32,120 17,669 2283,280,000 563,516 31,892 Der Levene-Test prüft, ob die Varianzen der Stichproben gleich sind oder nicht. Da die t-werte in der Tabelle sehr hoch sind, liegt Varianzgleichheit vor. Dies nennt man Homoskedastizität. Bei diesem SPSS-Ausdruck wird geprüft, ob die Einkommensunterschiede zwischen Männer und Frauen signifikant sind. Der Levene-Test hat bewiesen, dass die Varianzen der beiden Stichproben gleich sind. Diesen Schluss lässt auch die Gruppenstatistik zu. Hier wird ein t-test auf den Unterschied zweier Mittelwerte durchgeführt. Teil 2: Seite 5 von 6

16. Folgende lineare Regression soll den Zusammenhang zwischen BSP pro Kopf und der Lebenserwartung aufzeigen. Welche Aussagen sind richtig? (4 Punkte) Modell R R-Quadrat Modellzusammenfassung Korrigiertes R- Quadrat Standardfehler des Schätzers 1,598 a,357,355 8,9281 a. Einflußvariablen : (Konstante), BSP/Kopf Modell Quadratsumme df ANOVA b Mittel der Quadrate F Signifikanz 1 Regression 13693,672 1 13693,672 171,792,000 a Residuen 24630,582 309 79,711 Gesamt 38324,254 310 a. Einflußvariablen : (Konstante), BSP/Kopf b. Abhängige Variable: Lebenserwartung Modell Koeffizienten a Nicht standardisierte Koeffizienten Standardisierte Koeffizienten B Standardfehler Beta T Signifikanz 1 (Konstante) 61,911,599 103,436,000 BSP/Kopf,001,000,598 13,107,000 a. Abhängige Variable: Lebenserwartung Die Lebenserwartung soll durch das BSP pro Kopf erklärt werden. Die Ergebnisse der F-Statistik lassen auf einen linearen Zusammenhang schließen. Der Determinationskoeffizient gibt den Anteil der durch die unabhängige Variable erklärten Varianz der abhängigen Variable an. Es besteht kein signifikanter Zusammenhang zwischen dem BSP pro Kopf und der Lebenserwartung. Teil 2: Seite 6 von 6