Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse I

Größe: px
Ab Seite anzeigen:

Download "Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse I"

Transkript

1 Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse I Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata - 1 -

2 Überblick 1. Zunächst 2. Vergleich der Übungsaufgabe von letzter Woche 3. Übung: Skalenniveaus, Lage- und Streuungsmaße 4. Mittelwertvergleiche, T-Test 5. Übung: T-Test 6. Kreuztabellen 7. Übung: Kreuztabellen Statistik mit Stata - 2 -

3 1. Zunächst Befehle, die bekannt sein sollten: Update, set memory, input, use, clear, save, exit, pwd, cd, dir, describe, codebook, sort, list, help, search, tabulate oneway, numlabel, mvdecode, mvencode, label, set dp, log using, log close, log off/on, cmdlog using, cmdlog close, cmdlog off/on, do, generate, replace, recode, keep, drop, summarize, tabstat, histogram, graph pie, kdensity, graph box, set scheme, graph export Folien, die die Lösungen der heutigen Übungsaufgaben enthalten sind ab heute auf der MZS-Homepage zu finden. Vorbereitung: 1. profile.do ausführen! Ist Stata up-to-date? 2. Heute Verwendung von allbus_ueb4.dta. Wenn also im eigenen Verzeichnis noch nicht vorhanden aus dem Lehre on jeder Lehre Verzeichnis (V) in das eigene Verzeichnis kopieren. Statistik mit Stata - 3 -

4 2. Vergleich der Übungsaufgabe von letzter Woche (1) Fragestellung: Wie groß ist im ALLBUS 2006 das durchschnittliche Jahreseinkommen der befragten Personen aus Ostdeutschland, die ihre eigene Wirtschaftslage als mindestens mittel (also nicht als schlecht) bezeichnen? Stelle die Verteilung der Ansichten der ostdeutschen Befragten zu ihrer eigenen derzeitigen wirtschaftlichen Situation auch graphisch dar. Übung (2) Daten: ALLBUS 2006 Welche Daten werden für die Beantwortung der Fragestellung benötigt? Wir brauchen die Variablen: Einkommen (v381), Erhebungsgebiet (v4) und derzeitige Wirtschaftlage des Befragten (v147) (3) Überblick über die Daten verschaffen: codebook v381 v4 v147 Müssen Transformationen am Datensatz durchgeführt werden? Ja, da das Einkommen pro Monat und nicht pro Jahr vorliegt Statistik mit Stata - 4 -

5 (4) Erstellung einer Do-Datei (ueb06_11b.do), die benötigte Transformationen und u.u. bereits Befehle zur Auswertung enthält. Statistik mit Stata - 5 -

6 Fortsetzung der Do-Datei: Statistik mit Stata - 6 -

7 (5) Ausführen der Do-Datei auf dem ausgewählten Datensatz. do W:\Stata\Do-Dateien\ueb06_11b.do (6) Interpretation der Ergebnisse (Beantwortung der Fragestellung) Durchschnittliches Jahreseinkommen im ALLBUS 2006 der befragten Personen aus Ostdeutschland, die ihre eigene Wirtschaftslage als mindestens mittel (also nicht als schlecht) bezeichnen siehe Log-Datei: view "W:\Stata\sessionlg.log" Im ALLBUS 2006 beträgt das durchschnittliche Jahreseinkommen ostdeutscher Befragter, die ihre eigene wirtschaftliche Lage als nicht schlecht einschätzen 12955,40 Euro bei einer Standardabweichung von 7513,17 Euro. Grafik: W:\Stata\v147ost.png Statistik mit Stata - 7 -

8 W:\Stata\v147ost.png : Statistik mit Stata - 8 -

9 Lösung der Übungsaufgabe vgl. V:/Stata/ueb06_11 Statistik mit Stata - 9 -

10 3. Übung: Skalenniveaus, Lage- und Streuungsmaße Gemeinsame schnelle Übung: (1) Welches Skalenniveau haben folgende Variablen: v8, v151, v36, v143, Bildung (in Jahren), v27, v26, v10, v189, v20 (2) Ist bei v36 die Berechnung von Mittelwert und Standardabweichung sinnvoll? Welche Lage- und Streuungsmaße sind sinnvoll bei v143? Ist die Standardabweichung ein sinnvolles Lagemaß bei den Variablen v151 und v27? Übung Lösung Aufgabe (1): v8: nominal, da lediglich Unterscheidung möglich v151: intervall, da meist angenommen wird, dass die Abstände interpretierbar sind (bekanntestes Bsp: Schulnoten) bzw. ordinal, wenn Ausprägungen lediglich als Ränge interpretiert werden Statistik mit Stata

11 v36: nominal, da lediglich Unterscheidung möglich v143: ordinal, da Ränge interpretierbar Bildung (in Jahren): ratio, da Abstände interpretierbar & natürlicher Nullpunkt vorhanden v27: ratio, da Abstände interpretierbar & natürlicher Nullpunkt vorhanden v26: intervall, da Abstände interpretierbar, aber kein natürlicher Nullpunkt vorhanden (der Zeitpunkt Null unserer Zeitrechnung ist willkürlich gewählt) v10: nominal, da lediglich Unterscheidung möglich v189: nominal, da lediglich Unterscheidung möglich v20: ordinal, da Ränge interpretierbar Statistik mit Stata

12 Lösung Aufgabe (2): Bei v36 ist die Berechnung von Mittelwert und Standardabweichung nicht sinnvoll, da die Abstände zwischen den Ausprägungen nicht interpretierbar sind, sondern nur zwischen den Ausprägungen unterschieden werden kann (d.h. nur der Modus ist hier sinnvoll). tab v36 Für Variable v143 sind die Lagemaße Modus und Median sowie die Streuungsmaße Range, Quantile und der Quartilabstand sinnvoll, da ein mehr bzw. weniger des Merkmals interpretierbar ist. tab v143 (Modus) sowie tabstat v143, statistics(count min max r q iqr) Die Standardabweichung ist kein Lage-, sondern ein Streuungsmaß. Bei den Variablen v151 und v27 sind die Lagemaße Modus, Median und arithmetisches Mittel sowie die Streuungsmaße Range, Quantile, Quartilabstand, Varianz und Standardabweichung sinnvoll, Statistik mit Stata

13 da interpretierbar ist, um wie viel mehr bzw. weniger die Merkmale vorliegen. tabstat v151 v27, statistics(count min max r mean q /// iqr var sd) HINWEIS: Im Gegensatz zum Gelernten in der Statistik I Veranstaltung entsprechen sich in Stata das 50%-Quartil und der Median immer. Gelernt in Statistik I: Der Median ist genau dann größer als das 50%-Quartil, wenn die Fallzahl gerade und die Realisierung mit dem Rangplatz (n/2+2) einen größeren Wert aufweist, als die Realisierung mit dem Rangplatz (n/2). Statistik mit Stata

14 4. Mittelwertvergleiche, T-Test Fragestellungen der letzten Übungen: Wie lange arbeiten die im ALLBUS 2006 befragten ostdeutschen Frauen im Durchschnitt pro Monat? Wie groß ist im ALLBUS 2006 das durchschnittliche Jahreseinkommen der befragten Personen aus Ostdeutschland, die ihre eigene Wirtschaftslage als mindestens mittel (also nicht als schlecht) bezeichnen? Beide Fragen bezogen sich nur auf die Stichprobe des ALLBUS 2006, dabei wäre das eigentlich spannende, wie Merkmale in der Grundgesamtheit (z.b. der BRD) verteilt sind. Außerdem wäre die Information interessant, ob sich west- und ostdeutsche Frauen hinsichtlich ihrer durchschnittlichen Arbeitszeit unterscheiden. Bzw. ob Personen die ihre eigene Wirtschaftslage als mind. Mittel bezeichnen im Durchschnitt in West- mehr verdienen als in Ostdeutschland. Statistik mit Stata

15 Zur Beantwortung dieser Fragen: T-Test (Test zum Vergleich von Mittelwerten, d.h. nur für metrische Variablen). Generelles Vorgehen beim statistischen Testen: 1. Formulierung von Null- und Alternativhypothese 2. Auswahl der statistischen Prüfgröße (Teststatistik) 3. Festlegung von Irrtumswahrscheinlichkeit und Ablehnungsbereich 4. Berechnung der Prüfgröße und Entscheidung 5. Überprüfung der Anwendungsvoraussetzungen Beispiel: Unterscheiden sich west- und ostdeutsche Frauen hinsichtlich ihrer durchschnittlichen Arbeitszeit? 1. H1: Es gibt einen Unterschied zwischen der mittleren Arbeitszeit von west- und ostdeutschen Frauen. (µ1 µ2) H0: Es gibt keinen Unterschied zwischen der mittleren Arbeitszeit von west- und ostdeutschen Frauen. (µ1= µ2) Statistik mit Stata

16 2. Auswahl der statistischen Prüfgröße (Teststatistik) Es handelt sich um einen Test auf Mittelwertsunterschiede zwischen zwei Gruppen, die als unabhängige Stichproben aufgefasst werden (Frauen in Westdeutschland und Frauen in Ostdeutschland werden als unabhängige Stichproben aufgefasst). Es wird zudem angenommen, dass die Mittelwerte der Arbeitsstunden aller möglichen Zufallsstichproben normalverteilt sind (Anwendungsvoraussetzung). Zur Entscheidung hinsichtlich des durchzuführenden Tests fragt sich nun noch, ob sich die Varianzen der beiden Stichproben signifikant unterscheiden. Dies kann durch den Levene Test für gleiche Varianzen ermittelt werden: Stata-Befehl: robvar varname [if] [in], by(groupvar) Im Beispiel: robvar v207 if v174==2, by(v4) Arbeitsstunden West- vs. Ostdeutschland Nur Frauen Statistik mit Stata

17 Die Nullhypothese ist hier, dass es keinen Unterschied zwischen den Varianzen der beiden Stichproben gibt. Hinter W0 verbirgt sich die Levene Teststatistik, die hier einen Wert von 33,049 aufweist. Nach Angabe der Freiheitsgrade folgt als Ergebnis des Tests das empirische Signifikanzniveau von 0,000. Statistik mit Stata

18 Dies ist folgender Maßen zu interpretieren: Die Wahrscheinlichkeit, dass die Teststatistik bei gültiger Nullhypothese einen Wert von 33,049 aufweist, oder einen Wert, der noch mehr gegen die Nullhypothese spricht beträgt 0%. Die Nullhypothese, dass hier Varianzgleichheit vorliegt, kann somit verworfen werden. 3. Festlegung von Irrtumswahrscheinlichkeit und Ablehnungsbereich Die Standardeinstellung bei der Durchführung von T-Tests ist in Stata 5%, also Irrtumswahrscheinlichkeit α=5%. Drei Null- und zugehörige Alternativhypothesen möglich: a) H0: µ1 = µ2 anders formuliert: H0: µ1 -µ2 = 0; H1: µ1 -µ2 0 anders formuliert: H1: µ1 -µ2 > 0 a) H0: µ1 -µ2 0; H1: µ1 -µ2 < 0 b) H0: µ1 -µ2 0 ; H1: µ1 -µ2 > 0 Statistik mit Stata

19 Stata gibt als Ergebnis empirische Signifikanzen aus. Diese drücken die Wahrscheinlichkeit aus, dass bei gültiger Nullhypothese ein unten beschriebenes Verhältnis zwischen Wert der Teststatistik und kritischem Wert besteht: Nullhypothese a) H0: µ1 -µ2 = 0 b) H0: µ1 -µ2 0 c) H0: µ1 -µ2 0 Die Nullhypothese kann mit einer Irrtumswahrscheinlichkeit von 5% verworfen werden, wenn Pr ( T > t ) < 0,05 Pr (T < t) < 0,05 Pr (T >t) < 0,05 Wert der Teststatistik Kritischer Wert Statistik mit Stata

20 4. Berechnung d. Prüfgröße/ Entscheidung: Stata-Befehl: ttest Statistik mit Stata

21 Statistik mit Stata

22 In unserem Beispiel: Unterscheiden sich die durchschnittlichen Arbeitszeiten von Frauen aus West- und Ostdeutschland: ttest v207 if v174==2, by(v4) unequal Offensichtlich prüft Stata immer alle drei möglichen Hypothesenpaare. Statistik mit Stata

23 Im Beispiel kann die Nullhypothese, dass es keinen Unterschied hinsichtlich der mittleren Arbeitszeit zwischen Frauen aus West und Ostdeutschland gibt (H0:µ1-µ2=0) verworfen werden. Genauso kann die Nullhypothese verworfen werden, dass der Mittelwert der ersten Stichprobe (westdeutsche Frauen) größer ist als der der zweiten (ostdeutsche Frauen) (H0:µ1-µ2 0). D.h. Mit einer Irrtumswahrscheinlichkeit von 5% arbeiten Frauen in Ostdeutschland pro Woche signifikant länger als Frauen in Westdeutschland. 5. Überprüfung der Anwendungsvoraussetzungen (siehe 2.) Achtung: Im Datensatz allbus_ueb4.dta ist Gewichtung nach West/Ost [iweight=v735] notwendig, wenn repräsentative Aussagen für Gesamtdeutschland getroffen werden sollen! Statistik mit Stata

24 5. Übung: T-Test 1. Verschaffe dir einen Überblick über die Verteilung der Variablen v381, v174 und v4. Verdienen Personen die ihre eigene Wirtschaftslage als mind. mittel bezeichnen im Durchschnitt in West- signifikant mehr als in Ostdeutschland? Für die schnellen: 2. Verschaffe dir einen Überblick über die Verteilung der Variablen v145 und v212. Gibt es zwischen Personen, die in den letzten 10 Jahren arbeitslos waren und solchen die dies nicht waren einen Unterschied im Hinblick auf ihre Links- Rechts-Selbsteinstufung? Übung Statistik mit Stata

25 Lösung (A1): codebook v381 v174 v4 sum v381 [iweight=v735] (hier Verwendung von sum, da bei tabstat die Option iweights nicht erlaubt ist) tab v174 [iweight=v735] (Modus=2) tab v4 [iweight=v735] (Modus=1) 1. H0: Personen, die ihre eigene Wirtschaftslage als mind. mittel bezeichnen verdienen im Durchschnitt in Westdeutschland genauso viel oder weniger wie in Ostdeutschland. (H0: µ1 -µ2 0) 2. Anwendungsvoraussetzung vgl. Folie 16 robvar v381 if v147<=3, by(v4) zeigt, dass mit einer Irrtumswahrscheinlichkeit von 5% die Varianzen der Stichproben sich auch in der Population unterscheiden. 3. α=5%, da H0: µ1 -µ2 0 kann die Nullhypothese mit einer Irrtumswahrscheinlichkeit von 5% verworfen werden, wenn Pr (T >t) < 0,05 Statistik mit Stata

26 4. Berechnung der Prüfgröße und Entscheidung: ttest v381 if v147<=3, by(v4) unequal Die Nullhypothese, dass Personen, die ihre eigene Wirtschaftslage als mind. mittel bezeichnen im Durchschnitt in Westdeutschland genauso viel oder weniger wie in Ostdeutschland verdienen kann mit einer Irrtumswahrscheinlichkeit von 5% verworfen werden. Auf einem Signifikanzniveau von 5% verdienen Personen, die ihre eigene Wirtschaftslage als mind. mittel bezeichnen im Durchschnitt in Westdeutschland mehr als in Ostdeutschland. Statistik mit Stata

27 Lösung (A2): codebook v145 v212 sum v145 [iweight=v735] tab v212 [iweight=v735] (Modus=2) 1. H0: Es gibt zwischen Personen, die in den letzten 10 Jahren arbeitslos waren und solchen die dies nicht waren keinen Unterschied im Hinblick auf ihre Links-Rechts- Selbsteinstufung. (H0: µ1 -µ2 = 0) 2. Anwendungsvoraussetzung vgl. Folie 16 robvar v145, by(v212) zeigt, dass mit einer Irrtumswahrscheinlichkeit von 5% die Varianzen der Stichproben sich in der Population nicht unterscheiden. 3. α=5%, da H0: µ1 -µ2 = 0 kann die Nullhypothese mit einer Irrtumswahrscheinlichkeit von 5% verworfen werden, wenn Pr ( T > t ) < 0,05 Statistik mit Stata

28 4. Berechnung der Prüfgröße und Entscheidung: ttest v145, by(v212) Die Nullhypothese, dass es zwischen Personen, die in den letzten 10 Jahren arbeitslos waren und solchen die dies nicht waren keinen Unterschied im Hinblick auf ihre Links-Rechts- Selbsteinstufung gibt kann mit einer Irrtumswahrscheinlichkeit von 5% nicht verworfen werden. Auf einem Signifikanzniveau von 5% gibt es zwischen Personen, die in den letzten 10 Jahren arbeitslos waren und solchen die dies nicht waren keinen Unterschied im Hinblick auf ihre Links-Rechts-Selbsteinstufung. Statistik mit Stata

29 6. Kreuztabellen Darstellung des Zusammenhangs zweier kategorialer Variablen: Bivariate Kreuztabelle. Stata-Befehl: tab varname1 varname2 [if] [in] [weight] [,options] Beispiel: Interpretation: 39 Zeilenvariable Personen sind aus Spaltenvariable Ostdeutschland und gehören der Unterschicht an Statistik mit Stata

30 Kreuztabellen geben einen ersten Eindruck über den Zusammenhang zweier kategorialer Variablen. Dies wird bei Betrachtung der prozentualen Verteilung der Fälle deutlicher. Statistik mit Stata

31 Der Befehl tab v14 v4, cell gibt unter der Häufigkeit der Zelle ihre relative Häufigkeit bezogen auf die Gesamtfallzahl (nur gültige Fälle) an. Interpretation: 31,89% aller gültigen Fälle sind Personen aus Ostdeutschland und der Ansicht Abtreibung bei Gesundheitsg. der Frau sollte möglich sein. Statistik mit Stata

32 Der Befehl tab v14 v4, row gibt unter der Häufigkeit der Zelle ihre relative Häufigkeit bezogen auf die Gesamtfallzahl der Zeile an. Interpretation: 33,84% aller Personen, die der Ansicht sind, Abtreibung bei Gesundheitsg. der Frau sollte möglich sein sind aus Ostdeutschland Statistik mit Stata

33 Der Befehl tab v14 v4, col gibt unter der Häufigkeit der Zelle ihre relative Häufigkeit bezogen auf die Gesamtfallzahl der Spalte an. Interpretation: 95,51% aller Personen, die aus Ostdeutschland kommen sind der Ansicht, Abtreibung bei Gesundheitsg. der Frau sollte möglich sein. Statistik mit Stata

34 I.d.R. ist die Zeilenvariable die abhängige, die Spaltenvariable die unabhängige Variable, d.h. hinter dieser Darstellung steht, dass die Variable, die in den Zeilen abgetragen wird von der Variable, die in den Spalten abgetragen wird abhängt. Im Beispiel: Die Einstellung zur Abtreibung bei Gesundheitsgefährdung der Frau hängt vom Erhebungsgebiet ab und nicht: Das Erhebungsgebiet hängt von der Einstellung zur Abtreibung ab! Diese Konvention bedeutet zur Interpretation des Zusammenhangs ist die spaltenweise Prozentuierung sinnvoll. Denn es geht uns um Unterschiede in der Ausprägung der Zeilenvariable zwischen den Spaltenvariablen. Grundsätzlich kann man sich merken: Zeilenweise Prozentuierung bei spaltenweisem Vergleich und spaltenweise Prozentuierung bei zeilenweisem Vergleich. Statistik mit Stata

35 7. Übung: Kreuztabelle Stelle die Variablen Arbeitslosigkeit in den letzten 10 Jahren und Mitgliedschaft in einer Gewerkschaft in einer Kreuztabelle dar. Was vermutest du implizit durch die Wahl von Zeilen- und Spaltenvariable? Prozentuiere entsprechend deiner Vermutung und interpretiere das Ergebnis. Übung Statistik mit Stata

36 Durch die Wahl von Gewerkschaftsmitgliedschaft als Spalten- und Arbeitslosigkeit als Zeilenvariable wird vermutet, dass Arbeitslosigkeit von Gewerkschaftsmitgliedschaft abhängt. Da es also um Unterschiede zwischen den Zeilen geht ist spaltenweise prozentuiert worden: tab v212 v503, col ergibt: Statistik mit Stata

37 Waren 19,85% der Gewerkschaftsmitglieder in den letzten 10 Jahren arbeitslos waren es unter den Nicht- Gewerkschaftsmitgliedern 29,08%. In der Stichprobe des ALLBUS 2006 sind also Personen die einer Gewerkschaft angehören seltener zwischen 1996 und 2006 arbeitslos gewesen als Personen, die keiner Gewerkschaft angehören. Statistik mit Stata

38 Hausaufgaben: 1. Führe jeden Befehl, den die Präsentation enthält mindestens einmal aus. Untersuche die verwendeten Befehle dabei auch auf mögliche Unterbefehle und Optionen. 2. Ergänze deine Befehlstabelle um die heute hinzugekommenen Befehle. Statistik mit Stata

Übung Statistik I Statistik mit Stata SS Probeklausur, Wiederholungen und Übungen

Übung Statistik I Statistik mit Stata SS Probeklausur, Wiederholungen und Übungen Übung Statistik I Statistik mit Stata SS07 11.06.2007 8. Probeklausur, Wiederholungen und Übungen Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik

Mehr

Übung Statistik I Statistik mit Stata SS Wiederholung und Probeklausur

Übung Statistik I Statistik mit Stata SS Wiederholung und Probeklausur Übung Statistik I Statistik mit Stata SS07 04.06.2007 7. Wiederholung und Probeklausur Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata -

Mehr

Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse III

Übung Statistik I Statistik mit Stata SS Zusammenhangsanalyse III Übung Statistik I Statistik mit Stata SS07 02.07.2007 11. Zusammenhangsanalyse III Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata - 1 -

Mehr

Übung Statistik I Statistik mit Stata SS07-21.05.2007 6. Grafiken und Wiederholung

Übung Statistik I Statistik mit Stata SS07-21.05.2007 6. Grafiken und Wiederholung Übung Statistik I Statistik mit Stata SS07-21.05.2007 6. Grafiken und Wiederholung Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16 Uhr Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata

Mehr

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II

Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Übung Statistik I Statistik mit Stata SS07-14.05.2007 5. Dokumentation der Datenanalyse, Datentransformationen II und Univariate Statistiken II Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16

Mehr

Übung Statistik I Statistik mit Stata SS Datentransformationen II und Datenmanagement

Übung Statistik I Statistik mit Stata SS Datentransformationen II und Datenmanagement Übung Statistik I Statistik mit Stata SS07-07.05.2007 4. Datentransformationen II und Datenmanagement Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16 Uhr Andrea.Kummerer@sowi.uni-goettingen.de

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Bivariater Zusammenhang in der Vierfeldertafel PEΣO

Bivariater Zusammenhang in der Vierfeldertafel PEΣO Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei

Mehr

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005

Einführung in SPSS. Sitzung 4: Bivariate Zusammenhänge. Knut Wenzig. 27. Januar 2005 Sitzung 4: Bivariate Zusammenhänge 27. Januar 2005 Inhalt der letzten Sitzung Übung: ein Index Umgang mit missing values Berechnung eines Indexes Inhalt der letzten Sitzung Übung: ein Index Umgang mit

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 09. Mai 2009 09. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Arbeitsschritte bei der Datenanalyse Datenmanagement (Einlesen von Daten, Teilen von

Mehr

Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold

Statistik IV Übung mit Stata 10. Statistik IV. 3. Datenaufbereitung II und erste Auswertungen. Göttingen 27. Mai Dozent: Jürgen Leibold Statistik IV 3. Datenaufbereitung II und erste Auswertungen Dozent: Jürgen Leibold 1 Terminplanung Nr. Termin Inhalt 1 14.04.09 Einführung Organisatorisches und Scheinvoraussetzungen Statistik mit Softwareunterstützung?

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Methoden II Mittelwertvergleiche

Methoden II Mittelwertvergleiche Dipl. Soz. Maximilian Sonnauer Methoden II Mittelwertvergleiche Infos zur Zwischenklausur Termin: 12.6.2017, 10.00 Uhr Geschrieben wird hier im Hörsaal (HGB-A240) Klausurmodus ist single-choice (nur eine

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag

Mehr

Statistik K urs SS 2004

Statistik K urs SS 2004 Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen Überblick

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax

Mehr

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:

Ermitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit: 1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Streuungsmaße von Stichproben

Streuungsmaße von Stichproben Streuungsmaße von Stichproben S P A N N W E I T E, V A R I A N Z, S T A N D A R D A B W E I C H U N G, Q U A R T I L E, K O V A R I A N Z, K O R R E L A T I O N S K O E F F I Z I E N T Zentrale Methodenlehre,

Mehr

SozialwissenschaftlerInnen II

SozialwissenschaftlerInnen II Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen

Mehr

Statistik I im Sommersemester 2007

Statistik I im Sommersemester 2007 Themen am 18.6.2007: Statistik I im Sommersemester 2007 Zusammenhangsanalyse in der Vierfeldertabelle Von der Anteilsdifferenz zur Vierfeldertabelle Probeklausur 2 Lernziele: 1. Aufbau einer Kreuztabelle:

Mehr

Verfahren für metrische Variable

Verfahren für metrische Variable Verfahren für metrische Variable Grafische Methoden Histogramm Mittelwertsplot Boxplot Lagemaße Mittelwert, Median, Quantile Streuungsmaße Standardabweichung, Interquartilsabstand Lagemaße und Streumaße

Mehr

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse

Analyse von Querschnittsdaten. Arten von Variablen und Strategien der Datenanalyse Analyse von Querschnittsdaten Arten von Variablen und Strategien der Datenanalyse Gliederung 1. Arten von Variablen 2. Analyse einzelner Variablen (univariate Verteilungen) 3. Analyse der Zusammenhänge

Mehr

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Was sind Kontingenztabellen? Wofür werden Kontingenztabellen verwendet? Aufbau und Interpretation

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren

Hypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Institut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Sabine Düval. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Wiederholung Exkurs zur Inferenzstatistik Was sind Kontingenztabellen? Recodieren, Kategorisieren

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Wiederholung. Statistik I. Sommersemester 2009

Wiederholung. Statistik I. Sommersemester 2009 Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche

Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche Lehrveranstaltung Empirische Forschung und Politikberatung der Universität Bonn, WS 2007/2008 Häufigkeitsauszählungen, zentrale statistische Kennwerte und Mittelwertvergleiche 30. November 2007 Michael

Mehr

Übung Statistik I Statistik mit Stata SS07-30.04.2007 3. Stata-Grundlagen II und Univariate Statistiken I

Übung Statistik I Statistik mit Stata SS07-30.04.2007 3. Stata-Grundlagen II und Univariate Statistiken I Übung Statistik I Statistik mit Stata SS07-30.04.2007 3. Stata-Grundlagen II und Univariate Statistiken I Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: Di. 15-16 Uhr Andrea.Kummerer@sowi.uni-goettingen.de

Mehr

Sommersemester Marktforschung

Sommersemester Marktforschung Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:

Mehr

So berechnen Sie einen Schätzer für einen Punkt

So berechnen Sie einen Schätzer für einen Punkt htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar 2 Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung

Mehr

Statistik II (Sozialwissenschaften)

Statistik II (Sozialwissenschaften) Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden http://www.math.tu-dresden.de/sto/mueller/ Statistik II (Sozialwissenschaften) 2. Konsultationsübung,

Mehr

Bitte am PC mit Windows anmelden!

Bitte am PC mit Windows anmelden! Einführung in SPSS Plan für heute: Grundlagen/ Vorwissen für SPSS Vergleich der Übungsaufgaben Einführung in SPSS http://weknowmemes.com/generator/uploads/generated/g1374774654830726655.jpg Standardnormalverteilung

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht

Mehr

Einführung in die Statistik

Einführung in die Statistik Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,

Mehr

Statistik IV Übung mit Stata 10. Statistik IV. 1. Grundlagen und Datenaufbereitung. Göttingen 2. Mai Dozent: Jürgen Leibold

Statistik IV Übung mit Stata 10. Statistik IV. 1. Grundlagen und Datenaufbereitung. Göttingen 2. Mai Dozent: Jürgen Leibold Statistik IV 1. Grundlagen und Datenaufbereitung Dozent: Jürgen Leibold 1 Terminplanung Nr. Termin Inhalt 1 14.04.09 Einführung Organisatorisches und Scheinvoraussetzungen Statistik mit Softwareunterstützung?

Mehr

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch Frank Lammers Statistik I: deskriptive und explorative Statistik Lehr- und Übungsbuch 2004 Verlag der Gesellschaft für Unternehmensrechnung und Controlling m.b.h. Vorwort I Vorwort zur zweiten Auflage

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Statistik II: Signifikanztests /1

Statistik II: Signifikanztests /1 Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test

Mehr

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66

Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation

Mehr

Korrelation, Regression und Signifikanz

Korrelation, Regression und Signifikanz Professur Forschungsmethodik und Evaluation in der Psychologie Übung Methodenlehre I, und Daten einlesen in SPSS Datei Textdaten lesen... https://d3njjcbhbojbot.cloudfront.net/api/utilities/v1/imageproxy/https://d15cw65ipcts

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests

Modul 141 Statistik. 1. Studienjahr 11. Sitzung Signifikanztests Modul 141 Statistik 1. Studienjahr 11. Sitzung Signifikanztests Inhalt der 11. Sitzung 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau

Mehr

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08

Computergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08 Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 15 009 FernUniversität in Hagen Alle Rechte vorbehalten Fachbereich Wirtschaftswissenschaft Übersicht über die mit den Übungsaufgaben geprüften Lehrzielgruppen Lehrzielgruppe

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

4.1. Nullhypothese, Gegenhypothese und Entscheidung

4.1. Nullhypothese, Gegenhypothese und Entscheidung rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals

Mehr

Einführung in Quantitative Methoden

Einführung in Quantitative Methoden Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/57 Die Deskriptivstatistik

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2013 1. Welche Aussage zur Statistik (in den Sozialwissenschaften) sind richtig? (2 Punkte) ( ) Statistik ist die Lehre von Methoden

Mehr

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)

FH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen) FH- Management & IT Folie 1 Rückblick Häufigkeiten berechnen Mittelwerte berechnen Grafiken ausgeben Grafiken anpassen und als Vorlage abspeichern Variablenoperationen Fälle vergleichen Fälle auswählen

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

3. Lektion: Deskriptive Statistik

3. Lektion: Deskriptive Statistik Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive

Mehr

Prüfung aus Statistik 2 für SoziologInnen

Prüfung aus Statistik 2 für SoziologInnen Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.

Mehr

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2

Mehr

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE

BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE BIOMETRIE I - KLINISCHE EPIDEMIOLOGIE Wintersemester 2003/04 - Übung zur Vorlesung Biometrie I Ein Lösungsvorschlag von Christian Brockly Lösungsvorschlag zur Übung Biometrie I Bei diesem Dokument handelt

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung Datenstrukturen Datenstrukturen Querschnitt Panel Zeitreihe 2 Querschnittsdaten Stichprobe von enthält mehreren Individuen (Personen, Haushalte, Firmen, Länder, etc.) einmalig beobachtet zu einem Zeitpunkt

Mehr

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht.

Hypothesentests. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Hypothese Behauptung eines Sachverhalts, dessen Überprüfung noch aussteht. Wissenschaftliche Vorgehensweise beim Hypothesentest Forscher formuliert eine Alternativhypothese H 1 (die neue Erkenntnis, die

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden

Inhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse

Mehr

Die Familie der χ 2 (n)-verteilungen

Die Familie der χ 2 (n)-verteilungen Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert

Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

5. Seminar Statistik

5. Seminar Statistik Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation

Mehr

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest

Institut für Soziologie Werner Fröhlich. Methoden 2. Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Institut für Soziologie Methoden 2 Kontingenztabellen Chi-Quadrat-Unabhängigkeitstest Aufbau der Sitzung Was sind Kontingenztabellen? Wofür werden Kontingenztabellen verwendet? Aufbau und Interpretation

Mehr

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale)

PROC MEANS. zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) PROC MEAS zum Berechnen statistischer Maßzahlen (für quantitative Merkmale) Allgemeine Form: PROC MEAS DATA=name Optionen ; VAR variablenliste ; CLASS vergleichsvariable ; Beispiel und Beschreibung der

Mehr

THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ

THEMA: STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN TORSTEN SCHOLZ WEBINAR@LUNCHTIME THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ EINLEITENDES BEISPIEL SAT: Standardisierter Test, der von Studienplatzbewerbern an amerikanischen Unis gefordert

Mehr

Biomathematik für Mediziner

Biomathematik für Mediziner Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur SS 2002 Aufgabe 1: Franz Beckenbauer will, dass

Mehr

3 Grundlagen statistischer Tests (Kap. 8 IS)

3 Grundlagen statistischer Tests (Kap. 8 IS) 3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung

Mehr

9 Prinzipien der statistischen Hypothesenprüfung

9 Prinzipien der statistischen Hypothesenprüfung 9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn

Mehr

Statistik IV Übung mit Stata 10. Statistik IV. 4. Auswertungen und graphische Darstellung. Göttingen 26. Mai 2009. Dozent: Jürgen Leibold

Statistik IV Übung mit Stata 10. Statistik IV. 4. Auswertungen und graphische Darstellung. Göttingen 26. Mai 2009. Dozent: Jürgen Leibold Statistik IV 4. Auswertungen und graphische Darstellung Dozent: Jürgen Leibold 1 Terminplanung Nr. Termin Inhalt 1 14.04.09 Einführung Organisatorisches und Scheinvoraussetzungen Statistik mit Softwareunterstützung?

Mehr

Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung - 017 Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert z α R für welchen gilt z 1 heißt Median. P(X < z α ) α P(X z α ). Falls X stetige zufällige Variable

Mehr

Empirische Wirtschaftsforschung

Empirische Wirtschaftsforschung Empirische Wirtschaftsforschung Prof. Dr. Bernd Süßmuth Universität Leipzig Institut für Empirische Wirtschaftsforschung Volkswirtschaftslehre, insbesondere Ökonometrie 1 4. Basiskonzepte der induktiven

Mehr

Vergleich zweier Stichproben

Vergleich zweier Stichproben zurück zum Inhaltsverzeichnis Die Werte sind verbunden, abhängig oder korreliert. Beispiel: Eine Probe wird mit zwei Messgeräten bestimmt. Es gibt eine paarweise Zuordnung. Die Werte sind unabhängig also

Mehr

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz

Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis

Mehr

Varianzvergleiche bei normalverteilten Zufallsvariablen

Varianzvergleiche bei normalverteilten Zufallsvariablen 9 Mittelwert- und Varianzvergleiche Varianzvergleiche bei zwei unabhängigen Stichproben 9.3 Varianzvergleiche bei normalverteilten Zufallsvariablen Nächste Anwendung: Vergleich der Varianzen σa 2 und σ2

Mehr

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10

Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10 6 Hypothesentests Gauß-Test für den Mittelwert bei bekannter Varianz 6.3 Beispiel für Gütefunktionen Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = 0.10 G(µ) 0 α 0. 0.4 0.6 0.8 1 n = 10 n =

Mehr

Aufgaben zu Kapitel 9

Aufgaben zu Kapitel 9 Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte

Mehr

Allgemeines zu Tests. Statistische Hypothesentests

Allgemeines zu Tests. Statistische Hypothesentests Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer

Mehr

Bivariate Kreuztabellen

Bivariate Kreuztabellen Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ

Mehr

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung - wahrer Sachverhalt: Palette ist gut Palette ist schlecht Entscheidung des Tests: T K; Annehmen von H0 ("gute Palette") positive T > K; Ablehnen von H0 ("schlechte Palette") negative Wahrscheinlichkeit

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike

Mehr