ANOVA und Transformationen. Statistik II
|
|
- Ralf Kalb
- vor 6 Jahren
- Abrufe
Transkript
1 und Statistik II
2 Wiederholung Literatur Statistik II und (1/28)
3 Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28)
4 Literatur für nächste Woche Literatur Berry (1993, S , 51, 67-83) Statistik II und (3/28)
5 Literatur Inferenz für das multivariate Modell: F- und t-test Standardisierte Koeffizienten: oft keine Verbesserung Gewichtung: nicht unbedingt clever Kohortenanalyse: Extremfall von Kollinearität Statistik II und (4/28)
6 Was bedeutet? Analysis of Variance (Varianzanalyse) Eng verwandt mit drei bekannten Verfahren Berechnung von η 2 t-test F -Test Grundfrage: Unterscheidet sich die Mittelwerte einer kontinuierlichen Variablen... über verschiedene Gruppen (kategoriale Variable) hinweg? Statistik II und (5/28)
7 F-Test Struktur H0 : µ 1 = µ 2 = µ 3 H A : µ j µ j Annahmen (niemals völlig korrekt) 1. Zufallsstichprobe(n) 2. Merkmal innerhalb der Gruppen normalverteilt 3. Mit konstanter Varianz Statistik II und (6/28)
8 F-Test Struktur H0 : µ 1 = µ 2 = µ 3 H A : µ j µ j Annahmen (niemals völlig korrekt) 1. Zufallsstichprobe(n) 2. Merkmal innerhalb der Gruppen normalverteilt 3. Mit konstanter Varianz Statistik II und (6/28)
9 Was sind nochmal Freiheitsgrade? Wieviele unabhängige Informationen haben wir für die Schätzung eines statistischen Parameters? Generell: Zahl der (voneinander unabhängigen) Fälle N minus Zahl der als Zwischenschritte benötigten Parameter k (Restriktionen) Grundidee: Durch wiederholte Schätzung auf Basis derselben Daten wird Information verbraucht Schätzungen für Parameter zweiter, dritter etc. Ordnung mit größerer Unsicherheit Statistik II und (7/28)
10 Was sind nochmal Freiheitsgrade? Beispiel Schätzung Mittelwert in Grundgesamtheit Auf Basis einer Stichprobe von N = 100 N = 100 Freiheitsgrade Zufällige Verteilung der Schätzungen über viele Stichproben Beispiel Schätzung Varianz in Grundgesamtheit Basiert auf Summe der quadrierten Abweichungen vom geschätzten Mittelwert Summe der einfachen Abweichungen = 0 99 einfache Abweichungen variieren frei, letzte Abweichung liegt durch Restriktion fest Informationsgehalt der Stichprobe bzgl. Varianzschätzung (etwas) geringer Statistik II und (7/28)
11 Verbindung Freiheitsgrade/Zufallsverteilungen? Freiheitsgrade als Parameter für die Form von Zufallsverteilungen Normalverteilung Keine Freiheitsgrade als Parameter Modelliert Schätzung auf Basis sehr vieler voneinander unabhängige Informationen t-verteilung Freiheitsgrade als Parameter Je weniger Freiheitsgrade (unabhängige Informationen), desto mehr extreme Werte Modell für unsicherere Schätzungen Statistik II und (8/28)
12 Beispiel: Ideologie und Parteibindung Nicht wirklich intervallskaliert Unterscheiden sich Gruppen in ihrer zentralen Tendenz? Statistik II und (9/28)
13 Logik: Varianz innerhalb und zwischen Gruppen Viel Varianz zwischen, wenig innerhalb der Gruppen: η 2 : Gruppenmitgliedschaft wichtig F -Test: Starker Hinweis darauf, daß sich Gruppenmittelwerte in Grundgesamtheit unterscheiden Was bedeutet in / zwischen den Gruppen? Statistik II und (10/28)
14 Logik: Varianz innerhalb und zwischen Gruppen Viel Varianz zwischen, wenig innerhalb der Gruppen: η 2 : Gruppenmitgliedschaft wichtig F -Test: Starker Hinweis darauf, daß sich Gruppenmittelwerte in Grundgesamtheit unterscheiden Was bedeutet in / zwischen den Gruppen? Gesamtvarianz : Varianz aller Werte um den Gesamtmittelwert In den Gruppen : Varianzen der Meßwerte in den Gruppen (z. B. Republikaner) um die Gruppenmittelwerte Zwischen den Gruppen : Varianz der Gruppenmittelwerte um den Gesamtmittelwert Wenn H 0 gilt: Alle drei Varianzen unverzerrte Schätzungen für wahre Gesamtvarianz in Grundgesamtheit Statistik II und (10/28)
15 Logik: Varianz innerhalb und zwischen Gruppen F : Schätzung σ 2 zwischen Gruppen Schätzung σ 2 innerhalb Gruppen Statistik II und (10/28)
16 Logik: Varianz innerhalb und zwischen Gruppen F : Schätzung σ 2 zwischen Gruppen Schätzung σ 2 innerhalb Gruppen Wenn H 0 : Varianzen zwischen und innerhalb der Gruppen jeweils unverzerrte Schätzung für Gesamtvarianz in Grundgesamtheit F-Wert von 1 erwartet Abweichungen durch Stichprobenfehler möglich Statistik II und (10/28)
17 Logik: Varianz innerhalb und zwischen Gruppen F : Schätzung σ 2 zwischen Gruppen Schätzung σ 2 innerhalb Gruppen Wenn H 0 : Varianzen zwischen und innerhalb der Gruppen jeweils unverzerrte Schätzung für Gesamtvarianz in Grundgesamtheit F-Wert von 1 erwartet Abweichungen durch Stichprobenfehler möglich Wenn H A : Varianz zwischen Gruppen höher als Gesamtvarianz in Grundgesamtheit höhere F-Werte Statistik II und (10/28)
18 Varianz innerhalb der Gruppen Abweichungen vom jeweiligen Gruppenmittelwert Summe der SAQ Summe der SAQ gesamt Freiheitsgrade (Nenner)? Zahl der Fälle N minus Anzahl der Parameter, auf denen Varianzschätzung basiert (g Gruppenmittelwerte) = N g Unverzerrte (da korrigierte) Schätzung für die Gesamtvarianz σ 2 (unabhängig von H 0 ) Statistik II und (11/28)
19 Varianz zwischen den Gruppen Quadrierte Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert Gewichten mit Gruppengröße Berücksichtigt im Mittelwert enthaltene Information Erzeugt wieder SAQ Freiheitsgrade: Zahl der Fälle (Gruppenmittelwerte) g minus Anzahl der Parameter, auf denen Varianzberechnung basiert (Gesamtmittelwert, 1) = g 1 Unverzerrte (da korrigierte) Schätzung für Gesamtvarianz σ 2 (wenn H 0 gilt, sonst höher) Statistik II und (12/28)
20 Berechnung von F Beide Varianzschätzungen χ 2 -verteilt mit entsprechenden df (basieren auf Quadrierung normalverteilter zufälliger Abweichungen) Quotient beider Schätzungen 1 wenn H 0 Zufällige Abweichungen davon F -verteilt mit df für Zähler und Nenner Signifikanztest Zerlegung Gesamt-SAQ in erklärte/nicht-erklärte SAQ Statistik II und (13/28)
21 F - und t-test Für zwei Gruppen F = t 2 identisches Ergebnis für beide Tests Für große Zahl von Gruppen (z. B. 10), g (g 1) 2 = 45 paarweise Tests Für jeden Test Irrtumswahrscheinlichkeit α (z. B. 5%), H 0 zu Unrecht aufzugeben Irrtumswahrscheinlichkeit sehr viel größer als 5% Korrekturen (Bonferroni: gewünschte Irrtumswahrscheinlichkeit α durch Zahl der Vergleiche teilen) Oder F -Test Statistik II und (14/28)
22 In Stata. tabstat lrsselbstselbst,by(zweitstimme ) Summary for variables: lrsselbstselbst by categories of: zweitstimme (zweitstimme ) zweitstimme mean FDP Grüne SPD 4.65 Piraten CDU/CSU 6.8 Linke 3 Total Statistik II und (15/28)
23 In Stata. anova lrsselbstselbst zweitstimme Number of obs = 76 R-squared = Root MSE = Adj R-squared = Source Partial SS df MS F Prob > F Model zweitstimme Residual Total Freiheitsgrade Gesamtvarianz: N 1 = 75 Freiheitsgrade innerhalb: N g = 76 6 = 70 Freiheitsgrade zwischen: g 1 = 6 1 = 5 Freiheitsgrade für F : 5, 70 Statistik II und (15/28)
24 und Regression Statt auch Regression mit g 1 Dummy-Variablen möglich ( kann noch mehr, andere Forschungstraditionen) (Einfache) ein Spezialfall des linearen Regressionsmodells Regressionsmodell kann unabhängige kategoriale Variablen berücksichtigen Statistik II und (16/28)
25 In Stata. xi i.zweitstimme i.zweitstimme _Izweitstim_1-6 (naturally coded; _Izweitstim_1 omitted). reg lrsselbstselbst _I* Source SS df MS Number of obs = 76 F( 5, 70) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = lrsselbsts ~ t Coef. Std. Err. t P> t [95% Conf. Interval] _Izweitsti ~ _Izweitsti ~ _Izweitsti ~ _Izweitsti ~ _Izweitsti ~ _cons Statistik II und (17/28)
26 In Stata. anova lrsselbstselbst zweitstimme Number of obs = 76 R-squared = Root MSE = Adj R-squared = Source Partial SS df MS F Prob > F Model zweitstimme Residual Total Freiheitsgrade Gesamtvarianz: N 1 = 75 Freiheitsgrade innerhalb: N g = 76 6 = 70 Freiheitsgrade zwischen: g 1 = 6 1 = 5 Freiheitsgrade für F : 5, 70 Statistik II und (18/28)
27 Kategoriale und kontinuierliche Variablen Regressionsmodell kann sowohl kategoriale als auch kontinuierliche Variablen enthalten Beispiel im Text: Einkommen als Funktion von Bildung und Ethnizität Interaktion? Statistik II und (19/28)
28 Einkommen, Bildung und Ethnizität. tabstat inc,by(race) Summary for variables: inc by categories of: race race mean b h 31 w Total tabstat educ,by(race) Summary for variables: educ by categories of: race race mean b h w Total Statistik II und (20/28)
29 Regression: Einkommen, Bildung und Ethnizität. reg inc black hisp Source SS df MS Number of obs = 80 F( 2, 77) = 4.24 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = inc Coef. Std. Err. t P> t [95% Conf. Interval] black hisp _cons reg inc black hisp educ Source SS df MS Number of obs = 80 F( 3, 76) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = inc Coef. Std. Err. t P> t [95% Conf. Interval] black hisp educ _cons Statistik II und (21/28)
30 Regression mit Interaktion. gen beduc=black * educ. gen heduc=hisp * educ. reg inc black hisp educ beduc heduc Source SS df MS Number of obs = 80 F( 5, 74) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = inc Coef. Std. Err. t P> t [95% Conf. Interval] black hisp educ beduc heduc _cons Statistik II und (22/28)
31 Regression mit Interaktion. gen beduc=black * educ. gen heduc=hisp * educ. reg inc black hisp educ beduc heduc Source SS df MS Number of obs = 80 F( 5, 74) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = inc Coef. Std. Err. t P> t [95% Conf. Interval] black hisp educ beduc heduc _cons Erwarteter Wert für Weiße: Konstante + Educ Jahre Bildung Statistik II und (22/28)
32 Regression mit Interaktion. gen beduc=black * educ. gen heduc=hisp * educ. reg inc black hisp educ beduc heduc Source SS df MS Number of obs = 80 F( 5, 74) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = inc Coef. Std. Err. t P> t [95% Conf. Interval] black hisp educ beduc heduc _cons Erwarteter Wert für Weiße: Konstante + Educ Jahre Bildung Erwarteter Wert für Hispanics: Konstante + Educ Jahre Bildung + Hispanic + (Hispanic Educ) Jahre Bildung Statistik II und (22/28)
33 Graphisch y Bildung white hispanic black Statistik II und (23/28)
34 Nicht-lineare Effekte? In manchen (wenigen) Fällen ist die Linearitätsannahme offensichtlich unplausibel Z. B. kurvilinearer Zusammenhang zwischen Alter und Rechtsextremismus Wenn gute theoretische Begründung vorhanden, können von y und/oder x sinnvoll sein, die den Zusammenhang zwischen beiden linearisieren In diesem Fall ist OLS unproblematisch Verwendet werden normalerweise das Quadrat, die Quadratwurzel, deren Kehrwerte und der natürliche Logarithmus ( ladder of powers ) Tendenziell: Vorsicht Statistik II und (24/28)
35 Beispiel: Alter und Ideologie Linearer Effekt des Lebensalters auf Links-Rechts-Selbsteinstufung? Daten: GLES 2009, Nachwahl, Ostdeutschland Statistik II und (25/28)
36 Beispiel: Alter und Ideologie Linearer Effekt des Lebensalters auf Links-Rechts-Selbsteinstufung? Daten: GLES 2009, Nachwahl, Ostdeutschland. reg linksrechts alter Source SS df MS Number of obs = 575 F( 1, 573) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = linksrechts Coef. Std. Err. t P> t [95% Conf. Interval] alter _cons Statistik II und (25/28)
37 Beispiel: Alter und Ideologie 5.5 Ideologie Alter Statistik II und (25/28)
38 Kurvilinearer Zusammenhang? Modell paßt sehr schlecht Zusammenhang möglicherweise U-förmig? Ideologie abhängig von Konstante Alter Quadrat des Alters gen altersq= alter * alter Statistik II und (26/28)
39 Kurvilinearer Zusammenhang?. reg linksrechts alter altersq Source SS df MS Number of obs = 575 F( 2, 572) = 8.62 Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = linksrechts Coef. Std. Err. t P> t [95% Conf. Interval] alter altersq _cons Statistik II und (26/28)
40 Kurvilinearer Zusammenhang? Ideologie Alter Statistik II und (26/28)
41 Stata-Skript für heute net from net get anova Statistik II und (27/28)
42 Gewichtung oft nicht notwendig Kohortenanalyse oft problematisch /Varianzanalyse traditionelles Verfahren für Experimentaldaten Spezialfall des linearen Regressionsmodells Regressionsmodell um nominale unabhängige Variablen erweiterbar Interaktionen zwischen diesen und kontinuierlichen Variablen möglich Nächste Woche: Voraussetzungen für Anwendung Regressionsmodell noch viel mehr Erweiterungen Statistik II und (28/28)
Kategoriale abhängige Variablen:
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II
MehrMultiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse
Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple
MehrMultiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse. Statistik II
Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Wiederholung Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik
MehrMultiple Regression. Statistik II
Statistik II Übersicht Wiederholung Literatur Regression Assoziation und Kausalität Statistische Kontrolle Multivariate Beziehungen Inferenz Das Multivariate Modell Beispiel: Bildung und Verbrechen Fit
MehrKategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II
Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell
MehrMittelwerte, Zusammenhangsmaße, Hypothesentests in Stata
Mittelwerte,, Hypothesentests in Stata Statistik II Statistik II Mittelwerte,, Hypothesentests (1/30) Wiederholung: Daten & Deskriptive Statistik Zwei nominale Variablen Zwei ordinale Variablen Nominal/intervallskalierte
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrEinfache Modelle für Paneldaten. Statistik II
Einfache Modelle für daten Statistik II Wiederholung Literatur daten Policy-Analyse II: Statistik II daten (1/18) Literatur Zum Nachlesen Einfache Modelle für daten Wooldridge ch. 13.1-13.4 (im Reader)
MehrZeitreihen. Statistik II
Statistik II Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Wiederholung Literatur -Daten Trends und Saisonalität Fehlerstruktur Statistik II (1/31) Zum Nachlesen
MehrWiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)
Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrSchätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk
Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC
MehrPanelregression (und Mehrebenenanwendungen)
Panelregression (und Mehrebenenanwendungen) Henning Lohmann Universität zu Köln Lehrstuhl für Empirische Sozial- und Wirtschaftsforschung SOEP@Campus 2007, Universität Duisburg-Essen, 11. Oktober 2007
MehrRegression I. Statistik I. Sommersemester Lineare Regression Zusammenhang und Modell Ein Beispiel: Armut und Gewaltverbrechen Zusammenfassung
Sommersemester 2009 Ein Beispiel: Armut und Gewaltverbrechen Rechtswahl 15 10 5 0 5 10 Arbeitslosigkeit Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2 Was ist ein Zusammenhang? Gemeinsame
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Mittelwertvergleiche Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrANalysis Of VAriance (ANOVA) 1/2
ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?
MehrAufgaben zu Kapitel 7:
Aufgaben zu Kapitel 7: Aufgabe 1: In einer Klinik sollen zwei verschiedene Therapiemethoden miteinander verglichen werden. Zur Messung des Therapieerfolges werden die vorhandenen Symptome einmal vor Beginn
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrLiteratur: Glantz, S.A. (2002). Primer of Biostatistics. New York: McGraw-Hill.
Statistik Literatur: Glantz, S.A. (2002). Primer of Biostatistics. New York: McGraw-Hill. Maxwell, S.E. & Delaney, H.D. (2000). Designing Experiments and Analyzing Data. Mahwah, NJ: Erlbaum. Das Grundproblem
MehrHypothesentests mit SPSS. Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav
Beispiel für eine einfaktorielle Varianzanalyse Daten: museum_m_v05.sav Hypothese: Die Beschäftigung mit Kunst ist vom Bildungsgrad abhängig. 1. Annahmen Messniveau: Modell: Die Skala zur Erfassung der
Mehr1.1.1 Ergebnismengen Wahrscheinlichkeiten Formale Definition der Wahrscheinlichkeit Laplace-Experimente...
Inhaltsverzeichnis 0 Einführung 1 1 Zufallsvorgänge und Wahrscheinlichkeiten 5 1.1 Zufallsvorgänge.......................... 5 1.1.1 Ergebnismengen..................... 6 1.1.2 Ereignisse und ihre Verknüpfung............
MehrMehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh
Mehrebenenanalyse Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Inhalt } Einführung } Fragestellung } Das Programm HLM } Mögliche Modelle } Nullmodell } Random
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrÜbungsaufgaben zu Statistik II
Übungsaufgaben zu Statistik II Prof. Dr. Irene Prof. Dr. Albrecht Ungerer Die Kapitel beziehen sich auf das Buch: /Ungerer (2016): Statistik für Wirtschaftswissenschaftler Springer Gabler 4 Übungsaufgaben
MehrWillkommen zur Vorlesung Statistik
Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrMittelwertvergleiche, Teil II: Varianzanalyse
FB 1 W. Ludwig-Mayerhofer Statistik II 1 Herzlich willkommen zur Vorlesung Mittelwertvergleiche, Teil II: FB 1 W. Ludwig-Mayerhofer Statistik II 2 : Wichtigste Eigenschaften Anwendbar auch bei mehr als
MehrDie Varianzanalyse. Analysis of Variance (ANOVA) Jonathan Harrington
Die Varianzanalyse Analysis of Variance (ANOVA) Jonathan Harrington path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path, "anova1", sep="/")) Variablen, Faktoren, Ebenen Faktoren oder
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrMehr-Ebenen-Analyse I. Regressionsmodelle für Politikwissenschaftler
Mehr-Ebenen-Analyse I Regressionsmodelle für Politikwissenschaftler Was sind strukturierte Daten? Was ist Struktur? Probleme Bisher sind wir stets von einfachen Zufallsstichproben ausgegangen (Registerstichprobe)
MehrÜbung Statistik I Statistik mit Stata SS Zusammenhangsanalyse III
Übung Statistik I Statistik mit Stata SS07 02.07.2007 11. Zusammenhangsanalyse III Andrea Kummerer (M.A.) Oec R. I-53 Sprechstunde: n.v. Andrea.Kummerer@sowi.uni-goettingen.de Statistik mit Stata - 1 -
MehrLage- und Streuungsparameter
Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch
MehrPrüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil. Name, Vorname. Matrikelnr. Studiengang. E-Mail-Adresse. Unterschrift
Lehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Aufgabenteil Name, Vorname Matrikelnr. Studiengang E-Mail-Adresse Unterschrift
MehrGrenzen für x -s-regelkarten
Normalverteilte Fertigung: Stichproben aus der Fertigung: σ σ Eine normalverteilte Fertigung hat den Mittelwert µ und die Standardabweichung σ. Stichproben aus der Fertigung haben zufällig abweichende
MehrDatenanalyse mit Excel und Gretl
Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
MehrTest auf Varianzgleichheit (F-Test) (einseitiger Test!!)
T-Tests in Excel T-Tests in Excel Test auf Varianzgleichheit (F-Test) (einseitiger Test!!)! Annahmen:! Unabhängige Stichproben! Normalverteilte Grundgesamtheiten H0 : σx = σ y; H0 : σx > σ y Sx σ x F =
MehrSPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben
SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben ÜBERSICHT: Testverfahren bei abhängigen (verbundenen) Stichproben parametrisch nicht-parametrisch 2 Gruppen t-test bei verbundenen
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
MehrWeitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell
Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert
MehrKATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert
KATA LOGO Mathematik Statistik Roadmap: Von der Hypothese zum p-wert 0. Das eigentliche Forschungsziel ist: Beweis der eigenen Hypothese H 1 Dafür muss Nullhypothese H 0 falsifiziert werden können Achtung!
MehrKorrelation und Regression
FB 1 W. Ludwig-Mayerhofer und 1 und FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrDie Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden
Die Varianzanalyse ohne Messwiederholung Jonathan Harrington Bi8e noch einmal datasets.zip laden Variablen, Faktoren, Stufen Eine Varianzanalyse ist die Erweiterung von einem t- test t- test oder ANOVA
MehrInferenzstatistik Vergleich mehrerer Stichproben - Varianzanalyse
Vergleich mehrerer Stichproben - Varianzanalyse Zweifache VA mit hierarchischen Faktoren Voraussetzungen zwei unabhängige Variablen (Faktoren), die unabhängige Gruppen definiert zweite Faktor ist innerhalb
Mehre) Beim klassischen Signifikanztest muß die Verteilung der Prüfgröße unter der Nullhypothese
9 Hypothesentests 1 Kapitel 9: Hypothesentests A: Übungsaufgaben: [ 1 ] Bei Entscheidungen über das Ablehnen oder Nichtablehnen von Hypothesen kann es zu Irrtümern kommen. Mit α bezeichnet man dabei die
MehrVarianzanalyse * (1) Varianzanalyse (2)
Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz
MehrAnalytische Statistik II
Analytische Statistik II Institut für Geographie 1 Schätz- und Teststatistik 2 Das Testen von Hypothesen Während die deskriptive Statistik die Stichproben nur mit Hilfe quantitativer Angaben charakterisiert,
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
MehrAnalysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 5: Lineare Regression
Analysen politikwissenschaftlicher Datensätze mit Stata Sitzung 5: Lineare Regression 1 Vorbereitung Stata durch z:\profile.do starten Datensatz z:\daten\rpstrukt laden Achtung: Ab dieser Sitzung werden
MehrProf. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung
Systematische Stichprobe Rel. große Gruppe von Stichprobenverfahren. Allgemeines Merkmal: es existiert ein festes, systematisches Muster bei der Auswahl. Wie passt das zur allgemeinen Forderung nach Randomisierung
MehrNichtparametrische statistische Verfahren
Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle
MehrAuswertung mit dem Statistikprogramm SPSS: 30.11.05
Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit
Mehr8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.
L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:
MehrInstitut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion
Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit
MehrSTATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG
STATISTISCHE MUSTERANALYSE - DARSTELLUNGSVORSCHLAG Statistische Methoden In der vorliegenden fiktiven Musterstudie wurden X Patienten mit XY Syndrom (im folgenden: Gruppe XY) mit Y Patienten eines unauffälligem
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrDas Konfidenzintervall (Confidence Interval CI) Vertrauen schaffen, Signifikanz erkennen Autor: Beat Giger
QUALITY APPs Applikationen für das Qualitätsmanagement Testen und Anwenden Das Konfidenzintervall (Confidence Interval CI) Vertrauen schaffen, Signifikanz erkennen Autor: Beat Giger Das Konfidenzintervall
MehrPrüfgröße: Ist die durch eine Schätzfunktion zugeordnete reelle Zahl (etwa Mittelwert 7 C).
Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Aus praktischen Gründen
MehrStatistische Modellierung Merkblatt
Inhaltsverzeichnis Statistische Modellierung Merkblatt Welches Modell nimmt man wann?... 1 Logit:... 2 Probit:... 2 Poisson:...2 Loglinear:... 2 multinomiales Logit:... 2 Ordinales Logit (PROC LOGISTIC
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrSTATISTIK II. Hans-Otfried Müller Institut für Mathematische Stochastik.
STATISTIK II Hans-Otfried Müller Institut für Mathematische Stochastik http://www.math.tu-dresden.de/sto/mueller 1 Ausgewählte Verfahren der multivariaten Datenanalyse und Statistik Werden bei einer Analyse
MehrModul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.
Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrINFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße
DAS THEMA: INFERENZSTATISTIK III INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße Inferenzstatistik für Lagemaße Standardfehler
MehrLösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die
Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:
MehrIm Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.
Einfatorielle Varianzanalyse Varianzanalyse untersucht den Einfluss verschiedener Bedingungen ( = nominalsalierte(r) Variable(r)) auf eine metrische Variable. Die Bedingungen heißen auch atoren und ihre
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag
MehrWebergänzung zu Kapitel 10
Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder
Mehr4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)
4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte
MehrModul G.1 WS 07/08: Statistik 31.01.2008 1
Modul G.1 WS 07/08: Statistik 31.01.2008 1 Varianzanalyse Als Varianzanalyse bezeichnet man eine große Gruppe datenanalytischer und mustererkennender statistischer Verfahren, die zahlreiche unterschiedliche
MehrVorlesung Wirtschaftsstatistik 2 (FK ) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren. Dipl.-Ing.
Vorlesung Wirtschaftsstatistik 2 (FK 040637) Wiederholungen deskriptive Statistik und Einleitung Normalverteilungsverfahren Dipl.-Ing. Robin Ristl Wintersemester 2012/13 1 Vorlesungsinhalte Wiederholung:
Mehr1 Gemischte Lineare Modelle
1 Gemischte Lineare Modelle Wir betrachten zunächst einige allgemeine Aussagen für Gemischte Lineare Modelle, ohne zu tief in die mathematisch-statistische Theorie vorzustoßen. Danach betrachten wir zunächst
MehrAnleitung: Standardabweichung
Anleitung: Standardabweichung So kann man mit dem V200 Erwartungswert und Varianz bzw. Standardabweichung bei Binomialverteilungen für bestimmte Werte von n, aber für allgemeines p nach der allgemeinen
MehrLehrstuhl für Statistik und empirische Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im Fach Ökonometrie im WS 2011/12 Lösungsskizze
Lehrstuhl für Statistik und empirische irtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Prüfung im ach Ökonometrie im S 20/2 Lösungsskizze Aufgabe (.5 Punkte) Sie verfügen über einen Datensatz, der Informationen
MehrAnalyse von Querschnittsdaten. Regression mit Dummy-Variablen
Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05
MehrAllgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse
Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrInferenzstatistik (=schließende Statistik)
Inferenzstatistik (=schließende Statistik) Grundproblem der Inferenzstatistik: Wie kann man von einer Stichprobe einen gültigen Schluß auf di Grundgesamtheit ziehen Bzw.: Wie groß sind die Fehler, die
MehrFallbeispiel 5: Humankapital und Returns to Education. Seite 1
Fallbeispiel 5: Humankapital und Returns to Education Seite 1 Gliederung Einführung: Wirkungsanalysen in der Wirtschaftspolitik I. Theoretischer Teil 1 Humankapital 2 Returns to Education: Schooling Model
MehrKapitel 5: Einfaktorielle Varianzanalyse
Kapitel 5: Einfaktorielle Varianzanalyse Durchführung einer einfaktoriellen Varianzanalyse ohne Messwiederholung Dieser Abschnitt zeigt die Durchführung der in Kapitel 5 vorgestellten einfaktoriellen Varianzanalyse
MehrLösungen zu den Übungsaufgaben in Kapitel 10
Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert
MehrSPSS III Mittelwerte vergleichen
SPSS III Mittelwerte vergleichen A Zwei Gruppen ------------ Zwei-Stichproben t-test Beispieldatei: Seegräser Fragestellung: Unterscheidet sich die Anzahl der Seegräser in Gebieten mit und ohne Seeigelvorkommen
MehrVersuchsplanung. Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling
Versuchsplanung Teil 2 Varianzanalyse (ANOVA) Dr. Tobias Kiesling Gliederung Grundlagen der Varianzanalyse Streuungszerlegung und Modellschätzer Modellannahmen und Transformationen
MehrComputergestützte Methoden. Master of Science Prof. Dr. G. H. Franke WS 07/08
Computergestützte Methoden Master of Science Prof. Dr. G. H. Franke WS 07/08 1 Seminarübersicht 1. Einführung 2. Recherchen mit Datenbanken 3. Erstellung eines Datenfeldes 4. Skalenniveau und Skalierung
MehrAussagen hierzu sind mit einer unvermeidbaren Unsicherheit behaftet, die statistisch über eine Irrtumswahrscheinlichkeit bewertet wird.
Stichprobenumfang Für die Fragestellung auf Gleichheit von ein oder zwei Stichproben wird auf Basis von Hypothesentests der notwendige Stichprobenumfang bestimmt. Deshalb werden zunächst die Grundlagen
MehrMultivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167
Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine
MehrDipl.-Volksw. Markus Pullen Wintersemester 2012/13
Statistische Auswertungen mit R Universität Kassel, FB 07 Wirtschaftswissenschaften Dipl.-Volksw. Markus Pullen Wintersemester 2012/13 Beispiele 8. Sitzung Konfidenzintervalle, Hypothesentests > # Anwendungsbeispiel
Mehr2. Korrelation, lineare Regression und multiple Regression
multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig
MehrK8 Stetige Zufallsvariablen Theorie und Praxis
K8 Stetige Zufallsvariablen Theorie und Praxis 8.1 Theoretischer Hintergrund Wir haben (nicht abzählbare) Wahrscheinlichkeitsräume Meßbare Funktionen Zufallsvariablen Verteilungsfunktionen Dichten in R
MehrBeispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es
Beispiel für Anwendung: z-tabelle kann genutzt werden, um z.b. Poissonverteilung näherungsweise zu integrieren. Beispiel: wie wahrscheinlich ist es beim radioaktiven Zerfall, zwischen 100 und 110 Zerfälle
Mehr