1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
|
|
- Adrian Grosser
- vor 6 Jahren
- Abrufe
Transkript
1 0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression
2 Lineare Regressionsmodelle Deskriptive Statistik: Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. ( mit der Methode der kleinsten Quadrate ) Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 458 / 485
3 Statistisches Modell linearer Zusammenhang. Im Folgenden: Probabilistische Modelle in Analogie zu den deskriptiven Modellen aus Statistik I Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 459 / 485
4 Lineare Einfachregression Zunächst Modelle mit nur einer unabhängigen Variable. Statistische Sichtweise: Modell y i = β 0 + β 1 x i + ɛ i β 1 Elastizität : Wirkung der Änderung von X i um eine Einheit gestört durch zufällige Fehler ɛ i Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 460 / 485
5 Modellannahmen Man beobachtet Datenpaare, (X i, Y i ), i = 1,..., n mit Y i = β 0 + β 1 X i + ɛ i wobei sich die Annahmne auf den zufälligen Störterm beziehen: E(ɛ i ) = 0 Var(ɛ i ) = σ 2 für alle i gleich ɛ i1, ɛ i2 stochastisch unabhängig für i 1 i 2 ɛ i ND(0, σ 2 ) (zusätzlich, bei großen Stichproben nicht erforderlich) Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 461 / 485
6 Einfache lineare Regression β 0 + β 1 x 2 β 0 + β 1 x 1 x 1 x 2 Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 462 / 485
7 Schätzung der Parameter Die Schätzwerte werden üblicherweise mit ˆβ 0, ˆβ 1 und ˆσ 2 bezeichnet. In der eben beschriebenen Situation gilt: Die (Maximum Likelihood) Schätzer lauten: ˆβ 1 = (Xi X )(Y i Ȳ ) n i=1 (X i X ) 2, ˆβ 0 = Ȳ ˆβ 1 X, ˆσ 2 = 1 n n 2 mit den geschätzten Residuen i=1 ˆε 2 i ˆε i = Y i ˆβ 0 ˆβ 1 X i. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 463 / 485
8 Konstruktion von Testgröße n Mit gilt und analog mit gilt ˆσ ˆβ0 := n ˆσ i=1 X i 2 n n i=1 (X i X ) 2 ˆβ 0 β 0 t (n 2) ˆσ ˆβ0 ˆσ ˆσ ˆβ1 := n i=1 (X i X ) 2 ˆβ 1 β 1 ˆσ ˆβ1 t (n 2). Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 464 / 485
9 Konfidenzintervalle ˆβ 0 und ˆβ 1 sind die KQ-Schätzer aus Statistik I. Unter Normalverteilung fällt hier das ML- mit dem KQ-Prinzip zusammen. Man kann unmittelbar Tests und Konfidenzintervalle ermitteln (völlig analog zum Vorgehen in Kapitel 2.3 und 2.4). Konfidenzintervalle zum Sicherheitsgrad γ: für β 0 : für β 1 : [ ˆβ 0 ± ˆσ ˆβ 0 t (n 2) ] 1+ γ 2 [ ˆβ 1 ± ˆσ ˆβ1 t (n 2) 1+γ ] 2 Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 465 / 485
10 Tests für die parameter des Modells Mit der Teststatistik ergibt sich T β 1 = ˆβ 1 β 1 ˆσ ˆβ 1 Hypothesen kritische Region I. H 0 : β 1 β1 gegen β 1 > β1 T t (n 2) 1 α II. H 0 : β 1 β1 gegen β 1 < β1 T t (n 2) 1 α III. H 0 : β 1 = β1 gegen β 1 β1 T t (n 2) 1 α 2 (analog für ˆβ 0 ). Von besonderem Interesse ist der Fall β1 = 0: (Steigung gleich 0) Hiermit kann man überprüfen, ob die X 1,..., X n einen signifikanten Einfluss hat oder nicht. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 466 / 485
11 Typischer Output Koeffizienten a Standardisierte Koeffizienten β Standardfehler Beta T Signifikanz Konstante ˆβ0 ˆσ ˆβ 0 5) 1) 3) Unabhängige Variable ˆβ 1 ˆσ ˆβ1 6) 2) 4) Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 467 / 485
12 Output Erklärung 1) Wert der Teststatistik T β 0 = ˆβ 0 ˆσ ˆβ0. zum Testen von H 0 : β 0 = 0 gegen H 1 : β ) Analog: Wert von T β 1 = ˆβ 1 ˆσ ˆβ1 zum Testen von H 0 : β 1 = 0 gegen H 1 : β ) p-wert zu 1) 4) p-wert zu 2) 5), 6) hier nicht von Interesse. Die Testentscheidung ˆβ 1 signifikant von 0 verschieden entspricht dem statistischen Nachweis eines Einflusses von X. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 468 / 485
13 Das multiple Regressionsmodell Beispiel: Arbeitszeit und Einkommen y i = β 0 + β 1 x 1i + β 2 x 2i + ε i mit X 1 = { 1 männlich 0 weiblich X 2 = (vertragliche) Arbeitszeit Y = Einkommen Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 469 / 485
14 Interpretation: Die geschätzte Gerade für die Männer lautet für die Frauen hingegen erhält man ŷ i = ˆβ 0 + ˆβ ˆβ 2 x 2i ŷ i = ˆβ 0 + ˆβ ˆβ 2 x 2i = ˆβ 0 + ˆβ 2 x 2i Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 470 / 485
15 Grundidee (ANCOVA) y } ˆβ2 ˆβ 1 { ˆβ 0 { x 2 Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 471 / 485
16 Modellbildung β 0 Grundlevel β 2 durchschnittlicher Stundenlohn β 1 Zusatzeffekt des Geschlechts zum Grundlevel. Die 0-1 Variable dient als Schalter, mit dem man den Männereffekt an/abschaltet. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 472 / 485
17 Dummykodierung Nominales Merkmal mit q Kategorien, z.b. X = Parteipräferenz mit 1 CDU/CSU oder FDP X = 2 SPD oder Grüne 3 Sonstige Man darf X nicht einfach mit Werten 1 bis 3 besetzen, da es sich um ein nominales Merkmal handelt. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 473 / 485
18 Dummycodierung (2) Idee: Mache aus der einen Variable mit q (hier 3) Ausprägungen q 1 (hier 2) Variablen mit den Ausprägungen ja/nein ( ˆ=0/1). Diese Dummyvariablen dürfen dann in der Regression verwendet werden. X 1 = { 1 CDU/CSU oder FDP 0 andere X 2 = { 1 SPD, Grüne 0 andere Durch die Ausprägungen von X 1 und X 2 sind alle möglichen Ausprägungen von X vollständig beschrieben: X Text X 1 X 2 1 CDU/CSU, FDP SPD, Grüne Sonstige 0 0 Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 474 / 485
19 Multiples Regressionsmodell Y i abhängige Variable X i1 X i2. X ip unabhängige Variablen metrisch/quasistetig metrische/quasistetige oder dichotome (0/1) Variablen (kategoriale Variablen mit mehr Kategorien Dummy-Kodierung) Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 475 / 485
20 Multiple lineare Regression Analoger Modellierungsansatz, aber mit mehreren erklärenden Variablen: Y i = β 0 + β 1 X i1 + β 2 X i β p X ip + ɛ i Schätzung von β 0, β 1,..., β p und σ 2 sinnvollerweise über Matrixrechnung bzw. Software. Aus dem SPSS-Output sind ˆβ 0, ˆβ 1,..., ˆβ p sowie ˆσ ˆβ 0, ˆσ ˆβ 1,..., ˆσ ˆβ p ablesbar. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 476 / 485
21 Es gilt für jedes j = 0,..., p ˆβ j β j ˆσ ˆβj t (n p 1) und man erhält wieder Konfidenzintervalle für β j : sowie entsprechende Tests. [ ˆβ j ± ˆσ ˆβj t (n p 1) ] 1+ γ 2 Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 477 / 485
22 Von besonderem Interesse ist wieder der Test H 0 : β j = 0, H 1 : β j 0. Der zugehörige p-wert findet sich im Ausdruck (Vorsicht mit Problematik des multiplen Testens!). Man kann auch simultan testen, z.b. β 1 = β 2 =... = β p = 0. Dies führt zu einem sogenannten F-Test ( Software). Sind alle X ij 0/1-wertig, so erhält man eine sogenannte Varianzanalyse, was dem Vergleich von mehreren Mittelwerten entspricht. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 478 / 485
23 Für Befragte mit X ij = 0 für alle j gilt: E(Y ) = β 0 Ist X i1 = 1 und X ij = 0 für j 2, so gilt E(Y ) = β 0 + β 1 Ist X i1 = 1 und X i2 = 1, sowie X ij = 0 für j 3, so gilt E(Y ) = β 0 + β 1 + β 2 etc. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 479 / 485
24 Varianzanalyse (Analysis of Variance, ANOVA) Vor allem in der angewandten Literatur, etwa in der Psychologie, wird die Varianzanalyse unabhängig vom Regressionsmodell entwickelt. Ziel: Mittelwertvergleiche in mehreren Gruppen, häufig in (quasi-) experimentellen Situationen. Verallgemeinerung des t-tests. Dort nur zwei Gruppen. Hier nur einfaktorielle Varianzanalyse (Eine Gruppierungsvariable). Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 480 / 485
25 Einstellung zu Atomkraft anhand eines Scores, nachdem ein Film gezeigt wurde. 3 Gruppen ( Faktorstufen ): Pro-Atomkraft-Film Contra-Atomkraft-Film ausgewogener Film Varianzanalyse: Vergleich der Variabilität in und zwischen den Gruppen Beobachtungen: Y ij j = 1,..., J i = 1,..., n j Faktorstufen Personenindex in der j-ten Faktorstufe Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 481 / 485
26 Modellformulierung Modell (Referenzcodierung): Y ij = µ J + β j + ɛ ij j = 1,..., J, i = 1,..., n j, mit µ J Mittelwert der Referenz β j Effekt der Kategorie j im Vergleich zur Referenz J ɛ ij zufällige Störgröße ɛ ij N(0, σ 2 ), ɛ 11, ɛ 12,..., ɛ JnJ unabhängig. Testproblem: H 0 : β 1 = β 2 =... β j 1 = 0 gegen H 1 : β j 0 für mindestens ein j Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 482 / 485
27 Streuungszerlegung Mittelwerte: Ȳ Ȳ j Gesamtmittelwert in der Stichprobe Mittelwert in der j-ten Faktorstufe Es gilt (vgl. Statistik I) die Streuungszerlegung: n J j n J J (Y ij Ȳ ) 2 = n j (Ȳ j Ȳ ) 2 }{{} + j (Y ij Ȳ j) 2 j=1 j=1 i=1 }{{} = SQE Variabilität der Gruppen = SQR Variabilität in den Gruppen j=1 j=1 Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 483 / 485
28 F-Test Die Testgröße F = SQE/(J 1) SQR/(n J) ist geeignet zum Testen der Hypothesen gegen H 0 : β 1 = β 2 =... β j 1 = 0 H 1 : β j 0 für mindestens ein j Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 484 / 485
29 Testprozedur Die kritische Region besteht aus den großen Werten von F Also H 0 ablehnen falls T > F 1 α (J 1, n J), mit dem entsprechenden (1 α)-quantil der F -Verteilung mit (J 1) und (n J) Freiheitsgraden. (Je größer die Variabilität zwischen den Gruppen im Vergleich zu der Variabilität in den Gruppen, desto unplausibler ist die Nullhypothese, dass alle Gruppenmittelwerte gleich sind.) Bei Ablehnung des globalen Tests ist dann oft von Interesse, welche Gruppen sich unterscheiden. Testen spezifischer Hypothesen über die Effekte β j. Dabei tritt allerdings die Problematik des multiplen Testens auf. Statistik II SoSe 2012 Helmut Küchenhoff (Institut für Statistik, LMU) 485 / 485
Vorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.
Reparametrisierung des Modells Gegeben sei das Modell (2.1) mit (2.5) unter der linearen Restriktion Aβ = c mit A R a p, rg(a) = a, c R a. Wir betrachten die lineare Restriktion als Gleichungssystem. Die
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:
MehrVorlesung: Lineare Modelle
Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrFragen. Einführung in die induktive Statistik. Übersicht. Lineare Einfachregression
Fragen Welche Unsicherheitsfaktoren beeinflussen die Schätzung einer Regressionsgeraden? Einführung in die induktive Statistik Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrDie Regressionsanalyse
Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Varianzanalyse Statistik
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
MehrFormelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade
Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de
MehrANOVA und Transformationen. Statistik II
und Statistik II Wiederholung Literatur Statistik II und (1/28) Literatur Zum Nachlesen Agresti ch. 12 (nur bis Seite 381) Agresti ch. 13 (nur bis Seite 428) Statistik II und (2/28) Literatur für nächste
MehrTeil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller
Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrStatistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536
fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung
MehrEine Einführung in R: Varianzanalyse
Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 13. Januar 2009 Bernd Klaus, Verena Zuber Das
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrEine Einführung in R: Varianzanalyse
Eine Einführung in R: Varianzanalyse Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2011 Bernd Klaus, Verena Zuber Das
MehrÜbungsklausur Lineare Modelle. Prof. Dr. H. Toutenburg
Übungsklausur Lineare le Prof. Dr. H. Toutenburg Aufgabe Ein lineares Regressionsmodell mit der abhängigen Variablen Körpergröße und der unabhängigen Variablen Geschlecht wurde einmal mit der dummykodierten
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
MehrEinleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse
Einleitung Statistik Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Der Begriff Varianzanalyse (analysis of variance, ANOVA) taucht an vielen Stellen in der Statistik mit unterschiedlichen
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrGrundidee. χ 2 Tests. Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen. Grundidee. Annahme: Einfache Zufallsstichprobe (X 1,..., X n ).
Grundidee χ 2 -Anpassungstest χ 2 -Unabhängigkeitstest χ 2 -Homogenitätstest χ 2 Tests Grundidee Ausgangspunkt: Klasseneinteilung der Beobachtungen in k Klassen Annahme: Einfache Zufallsstichprobe (X 1,,
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
MehrAufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:
Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen
Mehr1 Einführung Ökonometrie... 1
Inhalt 1 Einführung... 1 1.1 Ökonometrie... 1 2 Vorüberlegungen und Grundbegriffe... 7 2.1 Statistik als Grundlage der Empirischen Ökonomie... 7 2.2 Abgrenzung und Parallelen zu den Naturwissenschaften...
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung
0 Einführung 1 Wahrscheinlichkeitsrechnung Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung Motivation und Hinführung Der wahre Anteil der rot-grün Wähler 009 war genau
MehrDWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr
2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X
MehrKapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrTests einzelner linearer Hypothesen I
4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
MehrPrüfungsliteratur: Rudolf & Müller S
1 Beispiele zur univariaten Varianzanalyse Einfaktorielle Varianzanalyse (Wiederholung!) 3 Allgemeines lineares Modell 4 Zweifaktorielle Varianzanalyse 5 Multivariate Varianzanalyse 6 Varianzanalyse mit
MehrX =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?
Aufgabe 1 (25 Punkte) Zur Schätzung der Produktionsfunktion des Unternehmens WV wird ein lineares Regressionsmodell der Form angenommen. Dabei ist y t = β 1 + x t2 β 2 + e t, t = 1,..., T (1) y t : x t2
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrInhaltsverzeichnis Einführung und deskriptive Statistik Grundlagen der Inferenzstatistik 1: Zufallsvariablen
Inhaltsverzeichnis 1 Einführung und deskriptive Statistik... 1 1.1 Wichtige mathematische Schreibweisen... 1 1.1.1 Das Summenzeichen... 1 1.1.2 Mengentheoretische Schreibweisen... 3 1.1.3 Variablentransformationen...
Mehr30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette
Ruhr-Universität Bochum 30. März 2011 1 / 46 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30 10.00
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrVorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.
Vorlesung: Lineare Modelle Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München SoSe 205 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen.
Mehr3. Das einfache lineare Regressionsmodell
3. Das einfache lineare Regressionsmodell Ökonometrie: (I) Anwendung statistischer Methoden in der empirischen Forschung in den Wirtschaftswissenschaften Konfrontation ökonomischer Theorien mit Fakten
MehrInterpretation von Testergebnissen I
2 Wiederholung statistischer Grundlagen Schließende Statistik 2.3 Interpretation von Testergebnissen I Durch die Asymmetrie in den Fehlerwahrscheinlichkeiten 1. und 2. Art ist Vorsicht bei der Interpretation
MehrLineare Modelle in R: Klassische lineare Regression
Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
Mehr6.1 Grundbegriffe und historischer Hintergrund
Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften
MehrKapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten
Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten 5.1. Einführung Einfaktorielle Varianzanalyse Überprüft die Auswirkung einer gestuften (s), unabhängigen Variable X, auch Faktor
MehrMultivariate Verfahren
Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe
Mehry t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.
Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf
MehrZusammenfassung: Einfache lineare Regression I
4 Multiple lineare Regression Multiples lineares Modell 41 Zusammenfassung: Einfache lineare Regression I Bisher: Annahme der Gültigkeit eines einfachen linearen Modells y i = β 0 + β 1 x i + u i, i {1,,
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrStatistik II. Weitere Statistische Tests. Statistik II
Statistik II Weitere Statistische Tests Statistik II - 19.5.2006 1 Überblick Bisher wurden die Test immer anhand einer Stichprobe durchgeführt Jetzt wollen wir die statistischen Eigenschaften von zwei
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrÜbung Methodenlehre II, SS 2010
nlehre II nlehre II, Anwendungsbeispiel 1 Ruhr-Universität Bochum 15. Juni 2010 1 / 21 Quelle nlehre II Mobbing und Persönlichkeit: Unterschiede in grundlegenden Persönlichkeitsdimensionen zwischen Betroffenen
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrDemokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik
Demokurs Modul 3741 Vertiefung der Wirtschaftsmathematik und Statistik Kurs 41 Vertiefung der Statistik 15. Juli 010 Seite: 14 KAPITEL 4. ZUSAMMENHANGSANALYSE gegeben, wobei die Stichproben(ko)varianzen
MehrKapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten
Kapitel 5 - Einfaktorielle Experimente mit festen und zufälligen Effekten 5.1. Einführung Einfaktorielle Varianzanalyse Überprüft die Auswirkung einer gestuften (s), unabhängigen Variable X, auch Faktor
MehrMehrdimensionale Zufallsvariablen
Mehrdimensionale Zufallsvariablen Im Folgenden Beschränkung auf den diskreten Fall und zweidimensionale Zufallsvariablen. Vorstellung: Auswerten eines mehrdimensionalen Merkmals ( ) X Ỹ also z.b. ω Ω,
MehrSoftware oder Tabellen (nicht Thema dieser Veranstaltung).
p-wert p-wert Der p-wert ist die Wahrscheinlichkeit, dass die Testgröße den beobachteten Wert oder einen noch extremeren Wert (,,weiter weg von H 0 ) annimmt unter der Bedingung, dass H 0 wahr ist. Bemerkungen
MehrWelche(s) Paar(e) ist(sind) denn nun signifikant verschieden?
Welche(s) Paar(e) ist(sind) denn nun signifikant verschieden? Der F-Test der Varianzanalyse erlaubt lediglich eine Existenzaussage über ein Paar (i,j) mit µ i µ j zum einem Niveau α. In der Praxis interessiert
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
MehrKurs Empirische Wirtschaftsforschung
Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
MehrName Vorname Matrikelnummer Unterschrift
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe
MehrEinführung in die Induktive Statistik: Varianzanalyse
Einführung in die Induktive Statistik: Varianzanalyse Jörg Drechsler LMU München Wintersemester 2011/2012 Varianzanalyse bisher: Vergleich der Erwartungswerte für zwei normalverteilte Variablen durch t-test
MehrStatistikpraktikum. Carsten Rezny. Sommersemester Institut für angewandte Mathematik Universität Bonn
Statistikpraktikum Carsten Rezny Institut für angewandte Mathematik Universität Bonn Sommersemester 2014 Mehrdimensionale Datensätze: Multivariate Statistik Multivariate Statistik Mehrdimensionale Datensätze:
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2011/12. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2011/12 Aufgabe 1 Übungsleiter
MehrJohn Komlos Bernd Süssmuth. Empirische Ökonomie. Eine Einführung in Methoden und Anwendungen. 4y Springer
John Komlos Bernd Süssmuth Empirische Ökonomie Eine Einführung in Methoden und Anwendungen 4y Springer 1 Einführung 1 1.1 Ökonometrie 1 2 Vorüberlegungen und Grundbegriffe 7 2.1 Statistik als Grundlage
Mehr6.2 Lineare Regression
6.2 Lineare Regression Einfache lineare Regression (vgl. Kap. 4.7) Y i = θ 0 + θ 1 X i + ǫ i ǫ i (0, σ 2 ) ˆθ 1 ˆθ 0 = S XY S 2 X = 1 ( Yi n ˆθ ) 1 Xi als Lösung der Minimumaufgabe n (Y i θ 1 X 1 θ 0 )
Mehr2.3 Intervallschätzung
2.3.1 Motivation und Hinführung Bsp. 2.15. [Wahlumfrage] Der wahre Anteil der rot-grün Wähler unter allen Wählern war 2009 auf eine Nachkommastelle gerundet genau 33.7%. Wie groß ist die Wahrscheinlichkeit,
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
MehrKapitel 3 Schließende Statistik
Beispiel 3.4: (Fortsetzung Bsp. 3.) bekannt: 65 i=1 X i = 6, also ˆp = X = 6 65 = 0, 4 Überprüfen der Voraussetzungen: (1) n = 65 30 () n ˆp = 6 10 (3) n (1 ˆp) = 39 10 Dr. Karsten Webel 194 Beispiel 3.4:
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrStatistik-Klausur A WS 2009/10
Statistik-Klausur A WS 2009/10 Name: Vorname: Immatrikulationsnummer: Studiengang: Hiermit erkläre ich meine Prüfungsfähigkeit vor Beginn der Prüfung. Unterschrift: Dauer der Klausur: Erlaubte Hilfsmittel:
MehrStatistische Datenanalyse
Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
Mehra) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen
2) Bei einer Stichprobe unter n=800 Wahlberechtigten gaben 440 an, dass Sie gegen die Einführung eines generellen Tempolimits von 100km/h auf Österreichs Autobahnen sind. a) Man bestimme ein 95%-Konfidenzintervall
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften t-test Varianzanalyse (ANOVA) Übersicht Vergleich von Mittelwerten 2 Gruppen: t-test einfaktorielle ANOVA > 2 Gruppen: einfaktorielle ANOVA Seeigel und
MehrStatistik für Ökonomen
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS tfü. Springer Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R 3 1.1 Installieren und Starten von R 3 1.2 R-Befehle
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Mittelwertvergleiche Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
Mehr1. Lösungen zu Kapitel 7
1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei
MehrKlassen diskreter Variablen
Modelle diskreter Variablen Klassen diskreter Variablen binär multinomial Weitere Klassifizierung multinomialer diskreter Variablen: kategorial y = 1, falls Einkommen < 3000 e. y = 2, falls Einkommen zw.
MehrAllgemein zu Hypothesentests: Teststatistik. OLS-Inferenz (Small Sample) Allgemein zu Hypothesentests
OLS-Inferenz (Small Sample) K.H. Schild 3. Mai 017 Allgemein zu Hypothesentests: Teststatistik Konstruktion eines Hypothesentests erfolgt meistens über eine Teststatistik Eine Teststatistik T ist eine
MehrStatistik II Übung 3: Hypothesentests Aktualisiert am
Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 017 4 Spezielle Zufallsgrößen Einführung 1 Wahrscheinlichkeit: Definition
Mehr