Übungen zur Vorlesung. Statistik 2
|
|
- Dorothea Diefenbach
- vor 6 Jahren
- Abrufe
Transkript
1 Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Blatt 11 Dipl.-Math. oec. D. Engel Übungen zur Vorlesung Statistik 2 Aufgabe 40 (R-Aufgabe, keine Abgabe) In dieser Aufgabe soll die Bedeutung der Bandbreitenwahl bei der Kerndichteschätzung anhand einer kleinen Simulation im Fall einer Mischung von Normalverteilungen veranschaulicht werden. a) Schreiben Sie hierzu zunächst eine Funktion rmix in R, welche n=100 simulierte Werte einer Mischung von zwei Normalverteilungen, bei der ein Punkt mit Wahrscheinlichkeit 0.2 von einer N(0, 0.01) Verteilung und mit Wahrscheinlichkeit 0.8 von einer N(2, 1) Verteilung generiert wird, erzeugt. b) Erzeugen Sie nun 200-mal jeweils 100 Realisierungen der in Teilaufgabe a) beschriebenen Mischungsverteilung und schätzen Sie deren Dichte an 61 äquidistanten Stellen von -1 bis 5 mit Hilfe des Kern-Dichte Schätzers mit Normalkern für die Bandbreiten h = 0.02, 0.1, 0.3, 0.6, 1, 1.5 sowie der solve-the-equation Schätzung der optimalen Bandbreite. R-Hinweis: Sie erhalten den Kern-Dichte Schätzer mit Normalkern und Bandbreite h der Punkte data mit Hilfe des Befehls ke <- density(data,bw=h,kernel= gaussian,n=61,from=-1,to=5) Schauen Sie sich die R-Hilfe zum Befehl density() an, um die Syntax in obigem Befehl zu verstehen. Den Dichteschätzer für die geschätzte solve-the-equation Bandbreite erhalten Sie mit bw= SJ-ste oder kurz mit bw= sj. c) Berechnen Sie nun in jedem der 200 Durchläufen für die verschiedenen Bandbreiten die mittlere quadratische Abweichung zwischen den Werten, die Ihnen die Kerndichteschätzung in Teilaufgabe b) geliefert hat, und den wahren Werten der Dichte dmix an den Stellen 0.2, 0, 0.2, 0.5, 1, 1.5, 2, 2.5, 3, 4, um die Güte des Kern-Dichte Schätzers in Abhängigkeit der Bandbreite zu beurteilen. R-Hinweis: Den wahren Wert der Dichte an einer Stelle x erhalten Sie mit 0.2*dnorm(x,0,sqrt(0.01))+0.8*dnorm(x,2,1). d) Bestimmen Sie für die einzelnen Bandbreiten den Mittelwert der jeweils 200 in Teilaufgabe c) berechneten quadratischen Abweichungen. Vergleichen Sie die durchschnittliche Qualität des Kern-Dichte Schätzers mit Normalkern für die verschiedenen Bandbreiten. Wie schneidet die solve-the-equation Schätzung der Bandbreite bei diesem Vergleich ab? e) Wiederholen Sie die Teilaufgaben b) bis d) für den Epanechnikov-Kern und vergleichen Sie die Ergebnisse mit jenen für den Normalkern. R-Hinweis: Sie erhalten den Kern-Dichte Schätzer mit dem Epanechnikov-Kern, wenn sie im density()-befehl aus Teilaufgabe b) gaussian durch epanechnikov ersetzen.
2 Aufgabe 41 (R-Aufgabe, keine Abgabe) Der Datensatz faithful in R, welcher bereits in Aufgabe 10 betrachtet wurde, enthält Daten zu den Ausbrüchen des Old Faithful Geysir im Yellowstone Nationalpark in den USA. a) Verschaffen Sie sich zunächst einen Überblick über den Datensatz. Schauen Sie sich die R-Hilfe zu diesem Datensatz an, wenn Sie nicht mehr wissen, welche Bedeutung die einzelnen Variablen haben. b) Erstellen Sie ein Streudiagramm von eruptions gegen waiting. c) Zeichnen Sie ein Histogramm für die Werte der Variable eruptions (i) mit den Default-Werten der Argumente des hist()-befehls; (ii) mit einer Balkenbreite von 0.2, welche Sie mit dem Befehl hist(eruptions,seq(0,5.7,0.2)) erhalten. d) Was bewirkt das zusätzliche Argument prob=true im hist()-befehl? e) Plotten Sie die geschätzte Dichte der Variable eruptions, welche Ihnen der Kern-Dichte Schätzer mit Normalkern und dem Default-Wert für die Bandbreite liefert. R-Hinweis: Der genaue Befehl für den Kern-Dichte Schätzer mit Normalkern und dem Default-Wert für die Bandbreite ist density(eruptions). f) Zeichnen Sie in das Schaubild aus Teilaufgabe e) nun noch die Dichten, welche Ihnen der Schätzer aus Teilaufgabe e) für die direct plug-in beziehungsweise solve-the-equation Schätzung der optimalen Bandbreite sowie die Bandbreiten h = 0.1, 1, 0.01 liefert, ein. R-Hinweis: Den Dichteschätzer für die geschätzte direct plug-in beziehungsweise solve-theequation Bandbreite erhalten Sie, wenn Sie im density()-befehl das Argument bw= SJ-dpi beziehungsweise bw= SJ-ste ergänzen. g) Untersuchen Sie nun den Einfluss der Kernwahl auf die Kern-Dichte Schätzung. Zeichnen Sie hierzu in das Histogramm mit einer Balkenbreite von 0.2 und prob=true die Kern-Dichte Schätzungen für die Variable eruptions mit den folgenden Kernen ein: (i) Normalkern (ii) Epanechnikov-Kern (iii) Rechteckern (iv) Dreieckkern (v) Biweight-Kern Wählen Sie als Bandbreite jeweils die solve-the-equation Schätzung für den Normalkern. R-Hinweis: Sie können der R-Hilfe zum density()-befehl entnehmen, wie Sie diese Kerne jeweils erhalten. h) Vergleichen Sie für den Epanechnikov-Kern die verschiedenen automatischen Bandbreitenwahlverfahren in R. Zeichnen Sie dafür die geschätzte Dichte für eruptions, welche Ihnen der Kern-Dichte Schätzer mit dem Epanechnikov-Kern und den folgenden Werten für das Argument bw im density()-befehl liefert, wieder in ein Histogramm für eruptions mit einer Balkenbreite von 0.2 und prob=true ein:
3 (i) Default-Wert für bw (ii) bw= SJ-dpi (direct plug-in) (iii) bw= SJ-ste (solve-the-equation) (iv) bw= ucv (unbiased cross-validation) (v) bw= bcv (biased cross-validation) i) Überprüfen Sie, ob die in Teilaufgabe h) für den Epanechnikov-Kern bestimmten Bandbreiten mit denen im Fall des Normalkerns übereinstimmen. j) Wiederholen Sie die Teilaufgabe h) für den Normalkern und vergleichen Sie die Ergebnisse. Aufgabe 42 (R-Aufgabe, keine Abgabe) Der Datensatz Prestige im Paket car (muss erst installiert werden) enthält Daten zu 102 verschiedenen Berufen, wie zum Beispiel das Ansehen (Pineo-Porter Prestige Score) des entsprechenden Berufes (prestige), das durchschnittliche Einkommen in Dollar im Jahr 1971 (income) sowie das durchschnittliche Bildungsniveau der in diesem Beruf Beschäftigten im Jahr 1971 (education) in Kanada. Im Folgenden soll der Einfluss des durchschnittlichen Einkommens und des durchschnittlichen Bildungsniveaus der Beschäftigten auf das Ansehen des Berufes untersucht werden. a) Laden Sie das Paket car mit Hilfe des Befehls library() und anschließend den darin enthaltenen Datensatz Prestige mit data(). Verschaffen Sie sich einen Überblick über die Daten. b) Erstellen Sie ein Streudiagramm von prestige gegen income, um einen ersten Eindruck bezüglich des Zusammenhanges zwischen dem Ansehen eines Berufes und dem durchschnittlichen Verdienst in diesem Beruf zu bekommen. c) Passen Sie mit Hilfe des lowess()-befehl (steht für locally weighted scatterplot smoother) eine lokal lineare Regressionskurve an die Daten an und zeichnen Sie diese in das Streudiagramm aus Teilaufgabe b) ein. R-Hinweis: Der genaue Befehl dazu lautet: lowess(income,prestige,f=0.5,iter=0),lwd=2) d) Passen Sie nun für die Zielvariable prestige ein nichtparametrisches lokal lineares Regressionsmodell, welches sowohl income als auch education als erklärende Variablen enthält, an die Daten an. R-Hinweis: Sie erhalten die gewünschte Regression mit Hilfe des folgenden Befehls: loess(prestige income+education,span=.5,degreee=1) Das Argument degree=1 besagt hierbei, dass es sich um eine lokal lineare Regression handelt. e) Stellen Sie für den in der Untersuchung beobachteten Bereich der Variablen income und education den mit dem Modell aus Teilaufgabe d) angepassten Wert für das Ansehen in Abhängigkeit des durchschnittlichen Einkommens und des durchschnittlichen Bildungsniveau graphisch dar. Verwenden Sie dafür die folgende Befehlsfolge in R, falls mod das Modell aus Teilaufgabe d) bezeichnet. inc <- seq(min(income),max(income),len=25) ed <- seq(min(education),max(education),len=25) newdata <- expand.grid(income=inc,education=ed) fit.prestige <- matrix(predict(mod,newdata),25,25) persp(inc,ed,fit.prestige,theta=45,phi=30,ticktype= detailed,expand=2/3,shade=0.5)
4 f) Führen Sie einen approximativen F Test für die Änderung der Residuenquadratsumme beim Weglassen einer der beiden erklärenden Variablen durch, um einen ersten Anhaltspunkt für die statistische Signifikanz der beiden Kovariablen income und education zu erhalten. Passen Sie hierzu zunächst analog zu Teilaufgabe d) jeweils ein Modell, welches nur eine der beiden Kovariablen enthält, an die Daten an. Verwenden Sie hierbei span=0.7 im loess()-befehl. Der anova()-befehl liefert Ihnen dann, ähnlich wie im Fall der linearen Regression, den gewünschten F Test. Aufgabe 43 (R-Aufgabe, keine Abgabe) In dieser Aufgabe sollen der Nadaraya-Watson Schätzer und der lokale Polynom-Schätzer mit Hilfe einer Simulationsstudie miteinander verglichen werden. a) Erzeugen Sie zunächst 101 äquidistante Stellen x i zwischen -1 und 1 und simulieren Sie an diesen Stellen jeweils einen Punkt Y i gemäß dem Modell Y i = m(x i ) + ε i, i = 1,..., 101, ε 1,..., ε 101 N(0, 1) iid mit m(x) = x + 4 cos(7x). b) Passen Sie an die simulierten Punkte aus Teilaufgabe a) eine nichtparametrische Regressionskurve mit Hilfe des Nadaraya-Watson Schätzers an und geben Sie die angepassten Werte an den Stellen x i an. R-Hinweis: Sie erhalten die mit Hilfe des Nadaraya-Watson Schätzers angepassten Werte an den Stellen x i mit dem Befehl ksmooth(x,y,kernel= normal,bandwidth=0.2,x.points=x)$y, wobei x den Vektor der betrachteten Stellen x i bezeichnet und y der Vektor der simulierten Werte Y i ist. c) Wiederholen Sie die Teilaufgabe b) für den lokalen Polynom-Schätzer anstatt des Nadaraya- Watson Schätzers. Verwenden Sie span= im loess()-befehl um (approximativ) die gleiche Zahl an Freiheitsgrade wie bei der Nadaraya-Watson Schätzung zu erhalten. R-Hinweis: Sie erhalten die mit Hilfe des lokalen Polynom-Schätzers angepassten Werte an den Stellen x i mit dem Befehl predict(loess(y x,span= ),newdata=x), wobei x und y wieder wie im R-Hinweis zu Teilaufgabe b) definiert sind. d) Zeichnen Sie nun die der Simulation zugrunde liegende Kurve m sowie die in den Teilaufgaben b) und c) angepassten Kurven zusammen mit den simulierten Punkten Y i aus Teilaufgabe a) in ein gemeinsames Schaubild ein. e) Wiederholen Sie nun die Teilaufgaben a) bis c) nrep = 1000 Mal und speichern Sie die angepassten Werte von Y i für die beiden Schätzer jeweils in einer Matrix ab. f) Stellen Sie den Mittelwert für die in den 1000 Wiederholungen geschätzten Werte von m(x i ) für die beiden Schätzer zusammen mit den tatsächlichen Werten in Abhängigkeit von x i graphisch in einem gemeinsamen Schaubild dar. R-Hinweis: Verwenden Sie den Befehl apply() um die gesuchten Mitellwerte zu bestimmen. Schauen Sie sich die R-Hilfe zu diesem Befehl an, um die genaue Syntax zu erfahren. g) Zeichnen Sie jeweils den empirischen Bias (Mittelwert aus allen Simulationen minus wahrer Wert), den quadrierten empirischen Bias sowie die Varianz der 1000 angepassten Werte in Abhängigkeit von x i für die beiden Schätzer in ein gemeinsames Schaubild ein.
5 h) Wiederholen Sie die Teilaufgaben a) bis g), falls die x i nicht äquidistant auf [ 1, 1] verteilt sind, sondern mit Hilfe des Befehls sort(c(0.5,-1+rbeta(50,2,2),rbeta(50,2,2))) erzeugt werden. Verwenden Sie im loess()-befehl diesmal span= um bei beiden Schätzern wieder in etwa die gleiche Anzahl an Freiheitsgraden zu erhalten. R-Hinweis: Sie können mit Hilfe des Befehls rug(x) in den Schaubildern der Teilaufgaben f) und g) die Verteilung der x i anzeigen lassen. Keine Abgabe! Diese Aufgaben werden in der Übung am behandelt.
Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrAnleitung: Standardabweichung
Anleitung: Standardabweichung So kann man mit dem V200 Erwartungswert und Varianz bzw. Standardabweichung bei Binomialverteilungen für bestimmte Werte von n, aber für allgemeines p nach der allgemeinen
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrGrundlagen der Bioinformatik Übung 5 Einführung in R. Ulf Leser, Yvonne Mayer
Grundlagen der Bioinformatik Übung 5 Einführung in R Ulf Leser, Yvonne Mayer Introduction to R Ulf Leser: Grundlagen der Bioinformatik, Sommer Semester 2016 2 Einführung in R Voraussetzung: funktionsfähige
MehrTeil VII. Deskriptive Statistik. Woche 5: Deskriptive Statistik. Arbeitsschritte der Datenanalyse. Lernziele
Woche 5: Deskriptive Statistik Teil VII Patric Müller Deskriptive Statistik ETHZ WBL 17/19, 22.05.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
Mehr11. Übungsblatt zur Vorlesung Ökonometrie SS 2014
Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer
MehrZusammenfassung 11. Sara dos Reis.
Zusammenfassung 11 Sara dos Reis sdosreis@student.ethz.ch Diese Zusammenfassungen wollen nicht ein Ersatz des Skriptes oder der Slides sein, sie sind nur eine Sammlung von Hinweise zur Theorie, die benötigt
MehrFerienkurse Mathematik Sommersemester 2009
Ferienkurse Mathematik Sommersemester 2009 Statistik: Grundlagen 1.Aufgabenblatt mit praktischen R-Aufgaben Aufgabe 1 Lesen Sie den Datensatz kid.weights aus dem Paket UsingR ein und lassen sie die Hilfeseite
MehrLineare Modelle in R: Klassische lineare Regression
Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)
MehrFortgeschrittene Ökonometrie: Maximum Likelihood
Universität Regensburg, Lehrstuhl für Ökonometrie Sommersemester 202 Fortgeschrittene Ökonometrie: Maximum Likelihood Poissonverteilung Man betrachte die poisson-verteilten Zufallsvariablen y t, t =, 2,...,
MehrHochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann. 8. Übungsblatt zur Vorlesung Ökonometrie
Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann 8. Übungsblatt zur Vorlesung Ökonometrie Aufgabe 1: In der Vorlesung haben wir das lineare Regressionsproblem als statistisches Problem formuliert:
Mehrx t2 y t = 160, y = 8, y y = 3400 t=1
Aufgabe 1 (25 Punkte) 1. Eine Online Druckerei möchte die Abhängigkeit des Absatzes gedruckter Fotos vom Preis untersuchen. Dazu verwendet die Firma das folgende lineare Regressionsmodell: wobei y t =
MehrTheorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte
Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann Probe-Klausur zur Vorlesung Ökonometrie Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte (die eigentliche Klausur wird
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrGrundlagen der Bioinformatik Assignment 4: Introduction to R. Yvonne Lichtblau SS 2017
Grundlagen der Bioinformatik Assignment 4: Introduction to R Yvonne Lichtblau SS 2017 Presentations Assignment 3 Yvonne Lichtblau: Grundlagen der Bioinformatik, Sommer Semester 2017 2 Overview Assignment
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS 2018
Aufgabe 3 (15 + 1 + 7 + 7 + 7 + 5 = 42 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe der Statistiksoftware R soll der Datensatz HousePrices aus dem Paket
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrD-CHAB Frühlingssemester 2017 T =
D-CHAB Frühlingssemester 17 Grundlagen der Mathematik II Dr Marcel Dettling Lösung 13 1) Die relevanten Parameter sind n = 3, x = 1867, σ x = und µ = 18 (a) Die Teststatistik T = X µ Σ x / n ist nach Annahme
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2017/18. ( = 58 Punkte)
Aufgabe 3 (14 + 2 + 7 + 7 + 3 + 5 + 9 + 11 = 58 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe der Statistiksoftware R soll der Datensatz HousePrices aus
MehrAnalysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 6: Übung zur logistischen Regression
n politikwissenschaftlicher Datensätze mit Stata Sitzung 6: Übung zur logistischen Regression 1 Vorbereitung Laden Sie den Datensatz z:\logitdemo Der Datensatz enthält 2000 Fälle, von denen 69 die Republikaner
MehrAuswertung und Lösung
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrTeilklausur des Moduls Kurs 42221: Vertiefung der Statistik
Name, Vorname Matrikelnummer Teilklausur des Moduls 32741 Kurs 42221: Vertiefung der Statistik Datum Termin: 21. März 2014, 14.00-16.00 Uhr Prüfer: Univ.-Prof. Dr. H. Singer Vertiefung der Statistik 21.3.2014
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrBivariate explorative Datenanalyse in R
Bivariate explorative Datenanalyse in R Achim Zeileis, Regina Tüchler 2006-10-09 In der LV Statistik 1 haben wir auch den Zusammenhang von 2 Variablen untersucht. Hier werden die dazugehörenden R-Befehle
MehrBootstrap: Punktschätzung
Resampling Methoden Dortmund, 2005 (Jenő Reiczigel) 1 Bootstrap: Punktschätzung 1. Die Grundidee 2. Plug-in Schätzer 3. Schätzung des Standardfehlers 4. Schätzung und Korrektur der Verzerrung 5. Konsistenz
MehrLean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
MehrMultiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
MehrFakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.
Statistik II Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen Statistik II 2. Parameterschätzung: 2.1 Grundbegriffe; 2.2 Maximum-Likelihood-Methode;
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Diese Selbstkontrollarbeit bezieht sich auf die Kapitel 1 bis 4 der Kurseinheit 1 (Multivariate Statistik) des Kurses Multivariate Verfahren (883). Hinweise:
MehrVorlesung 3: Schätzverfahren
Vorlesung 3: Schätzverfahren 1. Beispiel: General Social Survey 1978 2. Auswahl einer Zufallsstichprobe und Illustration des Stichprobenfehlers 3. Stichprobenverteilung eines Regressionskoeffizienten 4.
MehrDeskriptive Statistik
Deskriptive Statistik Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst aufräumen 1 Modell vs. Daten Bis jetzt
MehrBerechnung des LOG-RANK-Tests bei Überlebenskurven
Statistik 1 Berechnung des LOG-RANK-Tests bei Überlebenskurven Hans-Dieter Spies inventiv Health Germany GmbH Brandenburger Weg 3 60437 Frankfurt hd.spies@t-online.de Zusammenfassung Mit Hilfe von Überlebenskurven
MehrLineare Regression in R, Teil 1
Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus
MehrStochastik Praktikum Nichtparametrische Dichteschätzung
Stochastik Praktikum Nichtparametrische Dichteschätzung Humboldt-Universität zu Berlin 12.10.2010 Einleitung Zunächst: X 1,..., X n reellwertige i. i. d. Zufallsvariablen, deren Verteilung die Dichte f
MehrProf. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft
Prof. Dr. Marc Gürtler WS 015/016 Prof. Dr. Marc Gürtler Klausur zur 10/1 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft Lösungsskizze Prof. Dr. Marc Gürtler WS 015/016 Aufgabe 1: (11+5+1+8=56
MehrStatistik II SoSe 2006 immer von 8:00-9:30 Uhr
Statistik II SoSe 2006 immer von 8:00-9:30 Uhr Was machen wir in der Vorlesung? Testen und Lineares Modell Was machen wir zu Beginn: Wir wiederholen und vertiefen einige Teile aus der Statistik I: Konvergenzarten
MehrMusterlösung der Klausur vom 29. Juli 2003
Statistik für Bioinformatiker SoSe 2003 Rainer Spang Musterlösung der Klausur vom 29. Juli 2003 Aufgabe 1. 10 Definieren Sie die folgenden statistischen Begriffe in einem Satz oder in einer Formel: 1.
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrBasis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Statistische Tests
Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Statistische Tests Testentscheidung: Deskriptive Statistik Basis-Kurs Statistik und SPSS für Mediziner 2 Mit Datensatz Daten_SPSS_Kurs_I.sav
MehrTeil IV Deskriptive Statistik
Woche 5: Deskriptive Statistik Teil IV Deskriptive Statistik WBL 15/17, 18.05.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner Fachhochschule Haute école spécialisée
MehrDeskriptive Statistik. (basierend auf Slides von Lukas Meier)
Deskriptive Statistik (basierend auf Slides von Lukas Meier) Deskriptive Statistik: Ziele Daten zusammenfassen durch numerische Kennzahlen. Grafische Darstellung der Daten. Quelle: Ursus Wehrli, Kunst
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrStochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL)
Prof. Dr. M. Schweizer ETH Zürich Sommer 2018 Stochastik (BSc D-MAVT / BSc D-MATH / BSc D-MATL) Bitte... Lege deine Legi auf den Tisch. Trage deine Daten in dieses Deckblatt ein, und schreibe auf jedes
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
MehrDie Stochastischen Eigenschaften von OLS
Die Stochastischen Eigenschaften von OLS Das Bivariate Modell Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Wiederholung
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrVon Daten zu Funktionen
Funktionale Datenanalyse (Wintersemester 2014/2015) 27. Oktober 2014 Inhaltsverzeichnis 1 Einleitung 2 Basisvektoren Auswahl des Vektors c Lineare Glättung der Daten Freiheitsgrade 3 Kompromiss zwischen
MehrTeil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller
Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit
MehrKlausur Statistik Lösungshinweise
Klausur Statistik Lösungshinweise Prüfungsdatum: 21. Januar 2016 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Punkte: 15, 15, 12, 14, 16, 18 ; Summe der Punkte: 90 Aufgabe 1 15 Punkte Bei
MehrÜbungsblatt vom Kontinent: Kontinent dem das Land zugehört. Europa: 1=europäisches Land; 0=auÿereuropäisches Land
Übungsblatt vom 17.11.2015 Aufgabenkomplex 1 Der Datensatz OECD enthält Variablen (Stand 2009), die das Wohlergehen von Kindern in den Mitgliedsstaaten messen sollen. Abgefragt wurde: Kontinent: Kontinent
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
Mehrunendlich-dimensionalen lästigen Parameter auffassen.
Näherungen mit Bootstrap Werner Stahel, Seminar für Statistik, ETH Zürich, 8. 4. 2009 Dieser Text kann dazu dienen, die Ideen des Bootstrap zusammenzufassen. Es fehlen hier Beispiele. 1 Fragestellung a
MehrInstrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.
Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
MehrStatistik I für Betriebswirte Vorlesung 13
Statistik I für Betriebswirte Vorlesung 13 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 6. Juli 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 13 Version: 7. Juli
MehrSchweizer Statistiktage, Aarau, 18. Nov. 2004
Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
Mehr6. Tutoriumsserie Statistik II
6. Tutoriumsserie Statistik II 1. Aufgabe: Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktmenge y und Gesamtkosten
MehrVorlesung: Lineare Modelle
Vorlesung: Lineare Modelle Prof Dr Helmut Küchenhoff Institut für Statistik, LMU München SoSe 2014 5 Metrische Einflußgrößen: Polynomiale Regression, Trigonometrische Polynome, Regressionssplines, Transformationen
MehrHypothesenbewertungen: Übersicht
Hypothesenbewertungen: Übersicht Wie kann man Fehler einer Hypothese abschätzen? Wie kann man einschätzen, ob ein Algorithmus besser ist als ein anderer? Trainingsfehler, wirklicher Fehler Kreuzvalidierung
MehrEinführung Teil I: Erste Schritte bei der statistischen Analyse mit R... 25
O:/Wiley/Reihe_Dummies/71398_Schmuller/3d/ftoc.3d from 26.06.2017 16:16:30 Auf einen Blick Über den Autor.... 9 Einführung... 21 Teil I: Erste Schritte bei der statistischen Analyse mit R.... 25 Kapitel
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
MehrStatistik II für Betriebswirte Vorlesung 11
Statistik II für Betriebswirte Vorlesung 11 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 07. Januar 2019 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 11 Version:
MehrProbeklausur Statistik Lösungshinweise
Probeklausur Statistik Lösungshinweise Prüfungsdatum: Juni 015 Prüfer: Studiengang: IM und BW Aufgabe 1 18 Punkte 0 Studenten werden gefragt, wie viele Stunden sie durchschnittlich pro Tag ihr Smartphone
MehrLineare Regressionen mit R (Ökonometrie SS 2014 an der UdS)
Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Es soll untersucht werden, ob und wie sich Rauchen während der Schwangerschaft auf den Gesundheitszustand des Neugeborenen auswirkt. Hierzu werden
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 11. Vorlesung Jochen Köhler 10.05.011 1 Inhalt der heutigen Vorlesung Zusammenfassung Parameterschätzung Übersicht über Schätzung und Modellbildung Modellevaluation
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrDr. W. Kuhlisch Dresden, Institut für Mathematische Stochastik
Dr. W. Kuhlisch Dresden, 12. 08. 2014 Institut für Mathematische Stochastik Klausur Statistik für Studierende der Fachrichtungen Hydrologie und Altlasten/Abwasser zugelassene Hilfsmittel: Taschenrechner
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrDr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen Hochschule Esslingen Übungsblatt 2. Statistik
Dr. I. Fahrner WiSe 2016/17 Fakultät Grundlagen 6.10.2016 Hochschule Esslingen Übungsblatt 2 Statistik Stichworte: arithmetischer Mittelwert, empirische Varianz, empirische Standardabweichung, empirischer
MehrI.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03
I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03 Vorlesung: 17.12.2002 Life is the art of drawing sufficient conclusions from insufficient premises. Samuel Butler Dr. Wolfgang Langer Institut für
MehrWiederholungsübungen zu den Kapiteln 7 bis 11
Mittelwert-Tests Übung Wiederholungsübungen zu den Kapiteln 7 bis 11 In dieser Übung wird der Datensatz 4 verwendet. In dem (fiktiven) Datensatz sind für 50 Personen vier Variablen erfasst: das Geschlecht,
MehrStatistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II
Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen
MehrForschungsstatistik I, WS2008/2009
Forschungsstatistik I, WS2008/2009 Abschlussklausur - Deskriptive Statistik, Korrelation & Regression 1. Termin Forschungsstatistik I WS2008/2009 Abschlussklausur - Deskriptive Statistik Name: Matrikel-Nr.:
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrWolf falsch eingeschätzt und deshalb falsche Werbemaßnahmen ergriffen.
Aufgabenstellung Klausur Methoden der Marktforschung 0.08.004 Der Automobilhersteller People Car verkauft eine neue Variante seines Erfolgsmodells Wolf zunächst nur auf einem Testmarkt. Dabei muss das
MehrStatistik II. Regressionsanalyse. Statistik II
Statistik II Regressionsanalyse Statistik II - 23.06.2006 1 Einfachregression Annahmen an die Störterme : 1. sind unabhängige Realisationen der Zufallsvariable, d.h. i.i.d. (unabh.-identisch verteilt)
MehrStatistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536
fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung
MehrAuswahl von Schätzfunktionen
Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung
MehrStatistische Methoden der Datenanalyse. Übung XI
Albert-Ludwigs-Universität Freiburg Wintersemester 203/204 Statistische Methoden der Datenanalyse Markus Schumacher, Stan Lai, Florian Kiss Übung XI 2..204, 22..204 Anwesenheitsaufgaben Aufgabe 53 Vergleich
Mehr2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.
Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter
Mehr10. Die Normalverteilungsannahme
10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man
MehrTeekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).
Aufgabe 1 (5 Punkte) Gegeben sei ein lineares Regressionsmodell in der Form. Dabei ist y t = x t1 β 1 + x t β + e t, t = 1,..., 10 (1) y t : x t1 : x t : Teekonsum in den USA (in 1000 Tonnen), Nimmt den
MehrEine Einführung in R: Dichten und Verteilungsfunktionen
Eine Einführung in R: Dichten und Verteilungsfunktionen Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 25. November 2009 Bernd
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)
Aufgabe 3 (9 + 5 + 7 + 7 + 3 + 9 + 7 + 10 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Zu Beginn der Studienjahre 2011 und 2012 wurden Studienanfänger an
MehrTeil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation
Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle Patric Müller ETHZ Teil VIII Zentraler Grenzwertsatz und Vertrauensintervalle WBL 17/19, 29.05.2017 Wahrscheinlichkeit
MehrUE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe
UE Statistische Mustererkennung WS 2018 Angaben zur 2ten Aufgabengruppe 1 Aufgabe UE-II.1 Generieren Sie je 1000 Stichproben (samples) mit Umfang 5/30/100/500 für die Normalverteilung N(µ, σ 2 ) = N(4,
Mehr