Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
|
|
- Maria Brodbeck
- vor 7 Jahren
- Abrufe
Transkript
1 Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001
2 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung der Regressionsgeraden: Linearitätsannahme Hypothese, dass das lineare Regressionsmodell in der Population für alle Ausprägungen der unabhängigen Variablen X gilt. Unkorreliertheit der unabhängigen Variablen und der Residualvariablen Varianzgleichheit (Homoskedastizität) und Unkorreliertheit der Residuen Gauß-Markov-Theorem = Unter genannten Bedingungen sind die Kleinstquadrateschätzer in der Klasse der linearen erwartungstreuen Schätzer effizient (=BLU- Eigenschaft). 1
3 Standardfehler der Regressionskoeffizienten Berechnung des Standardfehlers (der Kennwerteverteilung) der Regressionskonstante a nach: (x i x) 2 σ2 U = σ U σ a = 1n x 2 i σ U n 1 + x2 s 2 x 1 n + x2 SS X = σ a = Standardfehler der Regressionskonstante a σ U = Standardabweichung der Populationsresiduen U Berechnung des Standardfehlers des Regressionsgeichts b nach: σ b = σ U n 1 s X 1 ni=1 (x i x) 2 σ2 U = σ U 1 SS = X 2
4 σ b = Standardfehler des Regressionsgewichts b Formel der durch die Varianz der Stichprobenresiduen geschätzte Varianz der Residualvariablen U: u i = y i (α + β x i ) geschätzt durch e i = y i (a + b x i ) = y i ŷ i Formel des geschätzten Standardfehlers der Regressionskonstante a: ni=1 ˆσ U 2 = (y i ŷ i ) 2 e n 2 = 2 i n 2 = SS E n 2 = n n 2 s2 E ˆσ U 2 = aus den Stichprobendaten geschätzte Varianz der Residualvariablen U in der Population n 2 = Anzahl der Freiheitsgrade im bivariaten Regressionsmodell
5 Formel des geschätzten Standardfehler für das Regressionsgewicht b: ˆσ a = = ˆσ U n 1 n x 2 i x 2 n i ( i=1 x i ) SS x2 = S E X n 2 n n e 2 i n x2 s 2 x s E = Standardabweichung der Stichprobenresiduen e i Überprüfen: ˆσ b = = 1 x 2 n i ( i=1 x i ) 2 1 SS X n n ˆσ U n = 1 s 2 X e 2 i n 2 s E n 2 ˆσ b = geschätzter Standardfehler des Regressionsgewichts b Je geringer der Standardfehler für den Regressionskoeffizienten b ist, desto genauer ist die Schätzung der Steigung der
6 Regressionsgeraden. Aus der letzten Gleichung ist ersichtlich, dass der Standardfehler für b geringer wird, wenn die Variation bzw. Varianz der X-Werte zunimmt; der Stichprobenumfang zunimmt; die Residualvarianz in der Stichprobe kleiner wird.
7 Konfidenzintervalle für die Regressionskoeffizienten α und β Für das Regressionsgewicht β in der Population werden die Grenzen des (1 - α)- Konfidenzintervalls mit der Irrtumswahrscheinlichkeit α ermittelt nach: c.i.(β) = b + ˆσ b t n 2;1 α/2 t n 2;1 α/2 = Quantilwert der T-Verteilung mit df = n - 2 für das 1 - α/2-quantil Analog werden die Grenzen des (1 - α)- Konfidenzintervalls für die Regressionskonstante α in der Population berechnet nach: c.i.(α) = a + ˆσ a t n 2;1 α/2 3
8 Prüfung von Hypothesen über die Regressionskoeffizienten α und β Zur Prüfung einer Hypothese über das Regressionsgewicht β wird ein Hypothesenpaar aus Null- und Alternativhypothese formuliert. Folgende Hypothesenpaare können geprüft werden: (1)H 0 : β = β 0 H 1 : βungleichβ 0 (1) (2)H 0 : β < β 0 H 1 : β > β 0 (2) (3)H 0 : β > β 0 H 1 : β < β 0 (3) β = Erwartungswert des Regressionsgewichts b in der Population β 0 = in der Nullhypothese postulierter (Maximalbzw. Minimal-)Wert von β Die Teststatistik T wird berechnet als: T = b β 0 ˆσ b 4
9 Prüfung einer Hypothese über die Regressionskonstante α: (1)H 0 : α = α 0 H 1 : αungleichα 0 (4) (2)H 0 : α < α 0 H 1 : α > α 0 (5) (3)H 0 : α > α 0 H 1 : α < α 0 (6) α = Erwartungswert der Regressionskonstante a in der Population α 0 = in der Nullhypothese vermuteter (Maximalbzw. Minimal-)Wert von α Die Teststatistik T wird wie folgt berechnet: T = a α 0 ˆσ a
10 Standardfehler und Konfidenzintervall für den Vorhersagewert von Y Standardfehler und Konfidenzintervall für die Vorhersage des bedingten Populationsmittelwerts µ Y X beider Ausprägung X = x 0 σ(ˆµ Y X=x0 ) = σa 2 + x 0 2 σb x 0 σ ab σ(ˆµ Y X=x0 ) = Standardfehler des geschätzten bedingten Populationsmittelwertes ˆµ Y X bei X = x 0 σa 2, σ2 b = Varianz der Kennwerteverteilung der Regressionskoeffizienten a und b x 0 = Ausprägung der unabhängigen Variablen X σ ab = Kovarianz der Regressionskoeffizienten a und b Die geschätzte Kovarianz von a und b ist gleich: ˆσ ab = x x 2 n i ( i=1 x i ) 2 n e 2 i n 2 ˆσ ab = geschätzte Kovarianz der Regressionskoeffizienten a und b 5
11 Der geschätzte Standardfehler des Vorhersagewerts (ˆµ Y X beix = x 0 : ˆσ(ˆµ Y X=x0 ) = h 0 ˆσ U 2 ( 1 n + (x 0 ˆx) 2 (x i x) 2) ˆσ2 U = h 0 = Hebelwert, der die Bedeutung (Hebelkraft; engl.: leverage) des Werts X = x 0 für die Lage der Regressionsgeraden im Streudiagramm erfasst. Der geschätzte Standardfehler ˆσ(ˆµ Y X=x0 ist umso größer, je weiter die Ausprägung x 0 vom Mittelwert x entfernt ist. Das liegt daran, dass der Abstand (x 0 x) ein Multiplikator des geschätzten Regressionskoeffitzienten b ist. Deutlich wird dies, wenn für den Vorhersagewert ŷ 0 die Regressionskonstante a betrachtet wird: ŷ 0 = a + b x 0 = (ȳ b x) + b x 0 = ȳ + b (x 0 x)
12 Prüfung von Hypothesen über Kovarianzen, Korrelationen und Determinationskoeffizienten Der unstandardisierte Regressionskoeffizient b ist ein erwartungstreuer Schätzer des Regressionsgewichts β in der Population. Ein erwartungstreuer Schätzer für die Populationsvarianz σ XY ergibt sich dagegen nur dann, wenn die Summe der Kreuzprodukte statt durch den Stichprobenumfang durch n-1 dividiert wird: ˆσ XY = (x i x) (y i ȳ) n 1 = SP XY n 1 = n n 1 s XY ˆσ XY = erwartungstreuer Schätzer der Populationskovarianz von X und Y Prüfung der Signifikanz von Kovarianz und Korrelation über die Hypothese β = 0 H 0 : β = 0 versus H 1 : β ungleich 0 6
13 Hypothesenpaare: H 0 : σ XY = 0versusH 1 : σ XY ungleich0 (7) H 0 : ρ XY = 0versus H 1 : ρ XY ungleich0 (8) H 0 : ρ 2 Y X = 0versus H 1 : ρ 2 Y X > 0 (9) Dies gilt jedoch nur für die bivariate Regression.
14 Kontrolle der Modellannahmen des linearen Regressionsmodells Wenn die Modellannahmen erfüllt sind, sollten die Werte der Residualvariablen U bei unterschiedlichen Ausprägungen der unabhängigen Variablen X unabhängig voneinander sein, die gleiche Varianz aufweisen, möglichst normalverteilt sein. Darüber hinaus soll der bedingte Populationsmittelwert von U bei jeder Ausprägung von X gleich null sein. 7
15 Prüfung der Normalverteilungsannahme Die Normalverteilung der Residuen kann graphisch mit einem so genannten Q-Q-Plot untersucht werden. Dabei werden die standardisierten Residuen gegen die z-werte abgetragen, die aus der kumulierten Häufigkeitsverteilung der standardisierten Residuen ermittelt werden können. Ausreißerwerte und einflussreiche Fälle Die Ergebnisse einer Regressionsanalyse können dadurch verzerrt werden, dass die Stichprobe Fälle enthält, die (Aufgrund von Besonderheiten) von den übrigen Fällen abweichen. Gelegentlich lassen sich solche Fälle durch eine Analyse von Ausreißern identifiezieren und überprüfen. In allen Streudiagrammen aus der Abbildung fällt ein Fall unter den n= 185 Fällen besonders auf, der ein sehr hohes standardisiertes Residuum aufweist. Es handelt 8
16 sich hierbei um ein Paar, bei dem das Alter für den männlichen Partner mit 17 Jahren und das für die Partnerin mit 46 Jahren angegeben ist. Der Einfluss eines einzelnen Falls auf die Lage und Richtung der Regressionsgeraden ist eine Funktion der Hebelkraft einer Ausprägung von X und den Residuen. Ein Maß, das die dieses Einflusses ausdrückt, ist die vom Statistiker Cook vorgeschlagene Distanz, die als CooksDistanzD i bezeichnet wird. In die Berechnung geht die Hebelkraft eines Falls und sein standardisiertes Stichprobenresiduum ein: D i = (e i )2 2 h i 1 h i D i = Distanzmaß für den Einfluss, den ein Punkt auf die Regressionsgerade hat
17 T-Test von Mittelwertdifferenzen in unabhängigen Stichproben Um den Mittelwertvergelich mit Hilfe des linearen Regressionsmodells durchführen zu können, wird die unabhängige Variable Gruppenzugehörigkeit (alte versus neue Bundesländer) als eine dichotome Indikatorvariable X mit den beiden Ausprägungen null (bei Befragten aus den alten Bundesländern) und eins (bei Befragten aus den neuen Bundesländern) codiert. Bei der linearen Regression der Links- Rechts-Selbsteinstufung auf die Indikatorvariable gibt es dann zwei mögliche Vorhersagewerte: ŷ 0 für die Befragten aus den alten Bundesländern und ŷ 1 für die Befragten aus den neuen Bundesländern: ŷ 0 = a + b 0 = a und ŷ 1 = a + b 1 = a + b alte Bundesländer neue Bundesländer Der Vorhersagewert ist bei der Gruppe mit 9
18 der Ausprägung null bei der INidiaktorvariable gleich dem Wert der Regressionskonstante a. Bei X = 0 ist der Mittelwert ȳ der abhängigen Variablen gleich dem Wert der Regressionskonstante a. Wenn X = 1 ist, dann ist der Mittelwert ȳ gleich der Summe aus den beiden Regressionskoeffizienten a und b. Die durchschnittliche Link-Rechts- Selbsteinstufung in den alten und den neuen Bundesländern ist dann gleich: ȳ 0 = a und ȳ 1 = a + b alte Bundesländer neue Bundesländer Die Differenz der Mittelwerte in den beiden Gruppen ist dann gleich dem Regressionsgewicht b: ȳ 1 ȳ 0 = (a + b) a = b Wenn die Populationsmittelwerte beider Gruppen gleich groß sind, hat das Regressionsgewicht β in der Population den Wert null.
19 Die Prüfung der Nullhypothese, dass das Regressionsgewicht β der Indikatorvariablen X in der Population gleich null ist, entspricht somit der Prüfung der Hypothese über die Gleichheit zweier Mittelwerte in unabhängigen Stichproben.
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrBivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation
Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell
MehrLineare Regression I
Statistische Zusammenhangsanalyse Lineare Regression I Um zu untersuchen, ob eine erklärende Variable X Einfluss auf eine abhängige Variable Y hat, wird die gemeinsame Verteilung der beiden Variablen untersucht.
MehrSTATISTIK FÜR DIE SOZIALWISSENSCHAFTEN
Steffen-M. Kühnel Dagmar Krebs 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. STATISTIK FÜR DIE SOZIALWISSENSCHAFTEN
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrÜbungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2
Martin-Luther-Universität Halle-Wittenberg Institut für Soziologie Dr. Wolfgang Langer 1 Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse Lösungsblatt zu Nr. 2 1. a) Je
Mehr9 Prinzipien der statistischen Hypothesenprüfung
9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrRegression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
Mehr9 Prinzipien der statistischen Hypothesenprüfung
9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 12.11.2002 He uses statistics as a drunken man use lampposts - for support rather than for illumination. Andrew Lang Dr. Wolfgang Langer
Mehrsimple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall
Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrProbeklausur für die Abschlussklausur Statistik II
Georg-August-Universität Göttingen Methodenzentrum Sozialwissenschaften Probeklausur für die Abschlussklausur Statistik II Nachname: Vorname: Matrikelnummer: Studiengang bitte ankreuzen BA: Diplom: Magister:
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrB. Regressionsanalyse [progdat.sav]
SPSS-PC-ÜBUNG Seite 9 B. Regressionsanalyse [progdat.sav] Ein Unternehmen möchte den zukünftigen Absatz in Abhängigkeit von den Werbeausgaben und der Anzahl der Filialen prognostizieren. Dazu wurden über
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
Mehr2.5 Lineare Regressionsmodelle
2.5.1 Wiederholung aus Statistik I Gegeben Datenpunkte (Y i, X i ) schätze die beste Gerade Y i = β 0 + β 1 X i, i = 1,..., n. 2 Induktive Statistik 409 Bsp. 2.30. [Kaffeeverkauf auf drei Flohmärkten]
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 29.10.2002 To err is human, to forgive is devine - but to include errors in your design is statistical Leslie Kish Dr. Wolfgang Langer
MehrKurs Empirische Wirtschaftsforschung
Kurs Empirische Wirtschaftsforschung 5. Bivariates Regressionsmodell 1 Martin Halla Institut für Volkswirtschaftslehre Johannes Kepler Universität Linz 1 Lehrbuch: Bauer/Fertig/Schmidt (2009), Empirische
MehrStatistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536
fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung
Mehr1 Beispiel zur Methode der kleinsten Quadrate
1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25
MehrDiagnostik von Regressionsmodellen (1)
Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer
MehrWS 2014/15. (d) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X. (e) Bestimmen Sie nun den Erwartungswert und die Varianz von X.
Fragenkatalog zur Übung Methoden der empirischen Sozialforschung WS 2014/15 Hier finden Sie die denkbaren Fragen zum ersten Teil der Übung. Das bedeutet, dass Sie zu diesem Teil keine anderen Fragen im
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
MehrT-Test für unabhängige Stichproben
T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa
MehrThema der Stunde. I. Die Form der Stichprobenkennwerteverteilung. II. Schlüsse von der Stichprobe auf die Population
Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung II. Schlüsse von der Stichprobe auf die Population III. t-test für unabhängige und abhängige Stichproben Stichprobenkennwerte Population
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrFormelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade
Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrÜbung V Lineares Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung
MehrStatistik II. Regressionsanalyse. Statistik II
Statistik II Regressionsanalyse Statistik II - 23.06.2006 1 Einfachregression Annahmen an die Störterme : 1. sind unabhängige Realisationen der Zufallsvariable, d.h. i.i.d. (unabh.-identisch verteilt)
MehrSchätzung im multiplen linearen Modell VI
Schätzung im multiplen linearen Modell VI Wie im einfachen linearen Regressionsmodell definiert man zu den KQ/OLS-geschätzten Parametern β = ( β 0, β 1,..., β K ) mit ŷ i := β 0 + β 1 x 1i +... β K x Ki,
MehrZusammenfassung 11. Sara dos Reis.
Zusammenfassung 11 Sara dos Reis sdosreis@student.ethz.ch Diese Zusammenfassungen wollen nicht ein Ersatz des Skriptes oder der Slides sein, sie sind nur eine Sammlung von Hinweise zur Theorie, die benötigt
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
MehrStatistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Statistik 2 1. Klausur Sommersemester 2013 Hamburg, 26.07.2013 A BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname:............................................................................ Vorname:.............................................................................
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrStochastik Praktikum Lineare Modelle
Stochastik Praktikum Lineare Modelle Thorsten Dickhaus Humboldt-Universität zu Berlin 06.10.2010 Übersicht 1 Einfache lineare Regression 2 Multiple lineare Regression 3 Varianzanalyse 4 Verallgemeinerte
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Datum Vorlesung 18.10.2006 Einführung 18.10.2006 Beispiele 25.10.2006 Daten 08.11.2006 Variablen Kontinuierliche
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrÜbungsblatt 10: Lineare Regression (Sitzung 11)
1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
MehrEinführung in die Induktive Statistik: Regressionsanalyse
Einführung in die Induktive Statistik: Regressionsanalyse Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Regressionsanalyse Ziel: Analyse
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrLösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001
Lösungen zur Biomathe-Klausur Gruppe A Montag, den 16. Juli 2001 1. Sensitivität und Spezifität In einer medizinischen Ambulanz haben 30 % der Patienten eine akute Appendizitis. 80 % dieser Patienten haben
MehrEvaluation & Forschungsstrategien. B.Sc.-Seminar. Sitzung IV: Konfidenzintervalle // Normalverteilungstests
Evaluation & Forschungsstrategien B.Sc.-Seminar Sitzung V: Konfidenzintervalle // Normalverteilungstests Seminarinhalte Sitzung V: 16.05.2018 Konfidenzintervalle bei bekannter Varianz Konfidenzintervalle
Mehra) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen
2) Bei einer Stichprobe unter n=800 Wahlberechtigten gaben 440 an, dass Sie gegen die Einführung eines generellen Tempolimits von 100km/h auf Österreichs Autobahnen sind. a) Man bestimme ein 95%-Konfidenzintervall
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Karin Waldherr & Pantelis Christodoulides 11. Juni 2014 Waldherr / Christodoulides Einführung in Quantitative Methoden 1/46 Anpassungstests allgemein Gegeben: Häufigkeitsverteilung
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrLösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001
Lösungen zur Biomathe-Klausur Gruppe C Montag, den 16. Juli 2001 1. Normalverteilung Der diastolische Blutdruck bei einer Gruppe von jungen Männern ist normalverteilt mit einem Erwartungswert von 65 mmhg
MehrProbeklausur - Statistik II, SoSe 2017
Probeklausur - Statistik II, SoSe 2017 Aufgabe 1: Mehrdimensionale Zufallsvariablen (15 Punkte) Gegeben sei ein zweidimensionaler stetiger Zufallsvektor X = (X 1, X 2 ) T mit der gemeinsamen Dichtefunktion
Mehrx t2 y t = 160, y = 8, y y = 3400 t=1
Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =
MehrWiederholung Hypothesentests Zusammenfassung. Hypothesentests. Statistik I. Sommersemester Statistik I Hypothesentests I (1/36)
Statistik I Sommersemester 2009 Statistik I I (1/36) Wiederholung Grenzwertsatz Konfidenzintervalle Logik des 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Statistik I I (2/36) Zum Nachlesen Agresti/Finlay: Kapitel 6+7
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Punkt- und Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr.
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrAufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:
Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
MehrSozialwissenschaftlerInnen II
Statistik für SozialwissenschaftlerInnen II Henning Best best@wiso.uni-koeln.de Universität zu Köln Forschungsinstitut für Soziologie Statistik für SozialwissenschaftlerInnen II p.1 Testen von Hypothesen
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrAnwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben
Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich
MehrBiometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern
Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem
MehrVorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.
Vorlesung: Lineare Modelle Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München SoSe 205 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen.
MehrMultivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167
Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrTeil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller
Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
Mehr4 Statistik normalverteilter Daten
4 Statistik normalverteilter Daten 4.1 Eine Stichprobe a Die drei Grundfragen. Die schliessende Statistik bildet die Brücke zwischen den Wahrscheinlichkeitsmodellen, die unser Denken strukturieren, und
MehrLösung Übungsblatt 5
Lösung Übungsblatt 5 5. Januar 05 Aufgabe. Die sogenannte Halb-Normalverteilung spielt eine wichtige Rolle bei der statistischen Analyse von Ineffizienzen von Produktionseinheiten. In Abhängigkeit von
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrStatistik K urs SS 2004
Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrInstrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.
Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression
MehrStatistik I im Sommersemester 2007
Themen am 18.6.2007: Statistik I im Sommersemester 2007 Zusammenhangsanalyse in der Vierfeldertabelle Von der Anteilsdifferenz zur Vierfeldertabelle Probeklausur 2 Lernziele: 1. Aufbau einer Kreuztabelle:
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 5. Vorlesung: 4.04.003 Agenda. Multiple Regression i. Grundlagen Grundidee, Ziele der multiplen Regression Beispiele ii. iii. Statistisches Modell Modell
Mehr