6 Korrelation und Regression
|
|
- Vincent Schräder
- vor 7 Jahren
- Abrufe
Transkript
1 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 1 6 Korrelation und Regression Aufgabe 6.1 (Beispiel 6.1, Produktmomentkorrelation): In einer Studie wurden u.a. die Serumkonzentrationen X und Y der Na- bzw. Cl-Ionen (in mmol/l) in einer Stichprobe von n =15 zufällig ausgewählten Probanden bestimmt. Unter der Annahme, dass X und Y zweidimensional-normalverteilt sind, soll (i) der Verteilungsparameter ρ XY durch die Produktmomentkorrelation r XY geschätzt, (ii) ein 95%- Konfidenzintervall für ρ XY berechnet und (iii) gezeigt werden, dass X und Y voneinander abhängig sind (α = 5%). lfd. Nr. X Y 1 135,0 99, ,0 106, ,5 105, ,0 94, ,0 98, ,0 92, ,0 97, ,0 106, ,0 102, ,5 98, ,5 105, ,0 103, ,0 101, ,0 107, ,0 104,0 # Beispiel 6.1 (Produktmomentkorrelation) # Dateneingabe, univariate Statistiken na <- c(135.0, 147.0, 148.5, 130.0, 139.0, , 142.0, 146.0, 131.0, 143.5, , 145.0, 143.0, 153.0, 149.0) cl <- c(99.0, 106.5, 105.5, 94.0, 98.0, , 97.0, 106.0, 102.5, 98.5, , 103.0, 101.0, 107.0, 104.0) n_na <- length(na) n_cl <- length(cl) mw_na <- mean(na) mw_cl <- mean(cl) std_na <- sd(na) std_cl <- sd(cl) print(cbind(n_na, mw_na, std_na)) n_na mw_na std_na [1,] print(cbind(n_cl, mw_cl, std_cl)) n_cl mw_cl std_cl [1,] # bivariate Statistiken s_nacl <- cov(na, cl) # Kovarianz r_nacl <- cor(na, cl, method="pearson") # Produktmoment(=Pearson)korrelation print(cbind(s_nacl, r_nacl)) s_nacl r_nacl [1,] # Konfidenzintervall, Abhängigkeitsprüfung
2 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 2 cor.test(na, cl, method="pearson", alternative="two.sided", conf.level=0.95) Pearson's product-moment correlation data: na and cl t = , df = 13, p-value = alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: sample estimates: cor Aufgabe 6.2 (Beispiel 6.3, Rangkorrelation nach Spearman) Es soll mit den Daten von Beispiel 6.1 der Zusammenhang der Variablen X und Y mit dem Spearman schen Rangkorrelationskoeffizienten geschätzt werden. Was ergibt die Abhängigkeitsprüfung auf 5%igem Testniveau? Man zeige, dass der Korrelationskoeffizient nach Spearman gleich der mit den rangskalierten Stichproben berechneten Produktkorrealtion ist! # Beispiel 6.3 (Rangkorrelation nach Spearman) # Dateneingabe na <- c(135.0, 147.0, 148.5, 130.0, 139.0, 129.0, 142.0, 146.0, 131.0, 143.5, , 145.0, 143.0, 153.0, 149.0) cl <- c(99.0, 106.5, 105.5, 94.0, 98.0, 92.0, 97.0, 106.0, 102.5, 98.5, , 103.0, 101.0, 107.0, 104.0) # Parameterschätzung, Abhängigkeitsprüfung cor.test(na, cl, method="spearman", alternative="two.sided") Spearman's rank correlation rho data: na and cl S = 128, p-value = alternative hypothesis: true rho is not equal to 0 sample estimates: rho # Rangskalierung rang_na <- rank(na) rang_cl <- rank(cl) print(cbind(na, rang_na, cl, rang_cl)) na rang_na cl rang_cl [1,] [2,] [3,] [4,] [5,] [6,] [7,] [8,] [9,] [10,] [11,] [12,] [13,]
3 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 3 [14,] [15,] cor(rang_na, rang_cl) [1] Aufgabe 6.3 (Beispiel 6.3, Chiquadrat-Test auf Abhängigkeiten) Die Häufigkeitsdaten in der folgenden Tabelle beschreiben die gemeinsame Variation der Merkmale X="Augenfarbe" und Y="Haarfarbe" in einer Stichprobe von 200 Personen. a) Wie groß sind die bei einer angenommenen Unabhängigkeit zu erwartenden Häufigkeiten? b) Ist die Korrelation signifikant von null verschieden? (α=5%) Haarfarbe Augenfarbe hell mittel dunkel Σ (Zeilen) blau hell mittel dunkel Σ (Spalten) # Beispiel 6.4 (Erwartete Häufigkeiten, Chiquadrat-Test auf Abhängigkeit) obfreq <- matrix(c(16, 11, 5, + x <- chisq.test(obfreq, correct=true))) obfreq <- matrix(c(16, 11, 5, 18, 19, 10, 16, 42, 20, 6, 20, 17), + nrow=4, byrow=true, + dimnames=list(augenfarbe=c("blau", "hell", "mittel", "dunkel"), + =c("hell", "mittel", "dunkel"))) obfreq blau hell mittel dunkel testergebnis <- chisq.test(obfreq, correct=true) testergebnis Pearson's Chi-squared test data: obfreq = , df = 6, p-value = # p-value= < 5% H1 (Augenfarbe und Haarfarbe # variieren voneinader abhängig) summary(testergebnis) Length Class Mode statistic 1 -none- numeric parameter 1 -none- numeric p.value 1 -none- numeric method 1 -none- character data.name 1 -none- character observed 12 -none- numeric expected 12 -none- numeric residuals 12 -none- numeric
4 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 4 for (i in 1:8){print(testergebnis[i])} $statistic $parameter df 6 $p.value [1] $method [1] "Pearson's Chi-squared test" $data.name [1] "obfreq" $observed blau hell mittel dunkel $expected blau hell mittel dunkel $residuals blau hell mittel dunkel Aufgabe 6.4 (Beispiel 6.5, Odds Ratio, Phi-Koeffizient) In einer Studie wurde untersucht, ob zwischen der Mortalität in der Perinatalperiode (Merkmal Y, Werte ja/nein) und dem Rauchen während der Schwangerschaft (Merkmal X, Werte ja/nein) ein Zusammenhang besteht. Zu diesem Zweck wurden Daten in einer Geburtenstation erhoben. Man berechne den Phi-Koeffizienten und das Odds-Ratio. Ist der Phi-Koeffizient auf 5%igen Testniveau von null verschieden? Raucher X Mortalität Y ja nein Σ (Zeilen) ja nein Σ (Spalten)
5 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 5 # Beispiel 6.5 (Odds Ratio, Phi-Koeffizient) mort <- matrix(c(246, 8160, 264, 10710), nrow=2, ncol=2, + dimnames=list(mortalität=c("ja", "nein"), Raucher=c("ja", "nein"))) mort Raucher Mortalität ja nein ja nein testergebnis <- chisq.test(mort, correct=true) testergebnis Pearson's Chi-squared test with Yates' continuity correction data: mort = , df = 1, p-value = testergebnis[1] $statistic chi2sum <- testergebnis[[1]] # Auswahl des numerischen Elementes der Liste chi2sum phi <- sqrt(chi2sum/sum(mort)) phi OR <- (mort[1,1]/mort[2,1])/(mort[1,2]/mort[2,2]) OR [1] Aufgabe 6.5 (Beispiel 6.6, Einfache lineare Regression) Mit den Messdaten (Na- und Cl-Ionenkonz. X bzw. Y) von Aufgabe 6.1 sind - nach Überprüfung der Abhängigkeit (α = 5%) - zu bestimmen: - die lineare Regressionsfunktion (von Y auf X), - die erwarteten Zielvariablenwerte zu vorgebenen Werten der Einflussgröße, - die mittleren Zielvariablenwerte (einschl. 95%-Konfidenzintervalle), - das 95%-Konfidenzintervall für den Geradenanstieg und den Achsenabschnitt. # Beispiel 6.6 (Einfache lineare Regression) # Dateneingabe: na <- c(135.0, 147.0, 148.5, 130.0, 139.0, 129.0, 142.0, 146.0, 131.0, 143.5, , 145.0, 143.0, 153.0, 149.0) cl <- c(99.0, 106.5, 105.5, 94.0, 98.0, 92.0, 97.0, 106.0, 102.5, 98.5, , 103.0, 101.0, 107.0, 104.0) # Graphische Überprüfung der Adäquatheit des linearen Modells: plot(na, cl) abline(lm(cl~na))
6 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R 6 # Abhängigkeitsprüfung und Schätzung der Geradenparameter: daten <- data.frame(na, cl) daten na cl modell <- lm(formula=cl~na, data=daten) summary(modell) Call: lm(formula = cl ~ na, data = daten) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr( t ) (Intercept) na ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: 3.22 on 13 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 13 DF, p-value: # Erwartete Zielvariablenwerte zu vorgegebenen Werten der Einflussgröße: predict(modell, data.frame(na=c(130, 135, 140, 145))) # Erwartete Zielvariablenwerte und 95%-Konfidenzintervalle cl_expected <- predict(modell, data.frame(na=sort(na)), + level=0.95, interval="confidence") print(cl_expected) fit lwr upr
7 W. Timischl: Angewandte Statistik Lösung von Beispielen mit R plot(na, cl) abline(modell) lines(sort(na), cl_expected[,2]) lines(sort(na), cl_expected[,3]) # 95%ige Konfidenzintervalle für den # Anstieg und den Achsenabschnitt estimates <- coefficients(summary(modell)) estimates Estimate Std. Error t value Pr( t ) (Intercept) na se_slope <- estimates[2,2] se_intercept <- estimates[1,2] print(cbind(se_slope, se_intercept)) se_slope se_intercept [1,] df <- length(na)-2 quantil_95 <- qt(0.975, df) quantil_95 [1] UG_slope <- estimates[2,1]-quantil_95*se_slope OG_slope <- estimates[2,1]+quantil_95*se_slope print(cbind(ug_slope, OG_slope)) UG_slope OG_slope [1,] UG_intercept <- estimates[1,2]-quantil_95*se_intercept OG_intercept <- estimates[1,2]+quantil_95*se_intercept print(cbind(ug_intercept, OG_intercept)) UG_intercept OG_intercept [1,]
E 71,00 74,00 67,50 62,5 52,75 53,00 H 6,00 5,00 5,00 3,00 2,75 4,25
GRUNDAUFGABEN ZUR KORRELATION UND REGRESSION 1. An bestimmten von sechs verschiedenen Grasarten stammenden Chromosomen wurden die Teillängen E und H des C-Band Euchromatins bzw. Heterochromatins gemessen
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrBiostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
MehrAufgabe 35 mit R (Ökonometrie SS 2014 an der UdS)
Vorbereitungen Aufgabe 35 mit R (Ökonometrie SS 2014 an der UdS) Falls das R - Paket car noch nicht installiert wurde, kann dies mit der Funktion install.packages() erledigt werden. install.packages("car")
MehrPrüfungstermin aus Angewandter Statistik (WS 2012/13) Name:
1. In einem als Paarvergleich geplanten Experiment wurden an 7 Probanden zeitlich hintereinander eine Testformulierung (A) und (nach einer ausreichend langen Wash-out-Periode) eine Kontrolle (K) verabreicht.
MehrW-Rechnung und Statistik für Ingenieure Übung 13
W-Rechnung und Statistik für Ingenieure Übung 13 Nächste Woche: Probeklausur Bringen Sie sich ein leeres Exemplar der Probeklausur mit, um sich eine Musterlösung zu erstellen. Aufgabe 1 : Testproblem Testproblem:
MehrLean Body Mass [kg] Estimate Std. Error t value Pr(> t ) (Intercept) ??? lbm <2e-16 ***
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
Mehr1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:
Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60
MehrPrognoseintervalle für y 0 gegeben x 0
10 Lineare Regression Punkt- und Intervallprognosen 10.5 Prognoseintervalle für y 0 gegeben x 0 Intervallprognosen für y 0 zur Vertrauenswahrscheinlichkeit 1 α erhält man also analog zu den Intervallprognosen
MehrBiostatistik 101 Korrelation - Regressionsanalysen
Good Data don't need statistics Biostatistik 101 Korrelation - Regressionsanalysen Carl Herrmann IPMB Uni Heidelberg & DKFZ B080 carl.herrmann@uni-heidelberg.de Korrelation Sind Alter und Blutdruck miteinander
MehrAuswertung und Lösung
Körperkraft [Nm] 0 50 100 150 200 250 0 20 40 60 80 Lean Body Mass [kg] Dieses Quiz soll Ihnen helfen, den R Output einer einfachen linearen Regression besser zu verstehen (s. Kapitel 5.4.1) Es wurden
MehrKovarianzanalyse. Truthahngewicht. Truthahngewicht. Methoden empirischer Sozialforschung. 1 metrische und mehrere metrische und kategoriale Variablen
Kovarianzanalyse 1 metrische und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Lineare Modelle (2. Teil) Wie läßt sich die Abhängigkeit einer metrischen Variablen von
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2014/15. ( = 57 Punkte)
Aufgabe 3 (6 + 4 + 8 + 4 + 10 + 4 + 9 + 4 + 8 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe eines multiplen linearen Regressionsmodells soll auf
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrStatistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services
Statistische Datenanalyse mit R, Korrelation und Regression Dr. Andrea Denecke Leibniz Universität IT-Services Korrelationsanalyse Eine Korrelationsanalyse soll herausfinden Ob ein linearer Zusammenhang
MehrStatistik für Ingenieure Vorlesung 13
Statistik für Ingenieure Vorlesung 13 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 6. Februar 2018 5.1.4. Weitere ausgewählte statistische Tests a) Binomialtest Der Binomialtest
MehrLösungen zur Prüfung Angewandte Statistische Methoden in den Nutzierwissenschaften FS 2016
ETH Zürich D-USYS Institut für Agrarwissenschaften Lösungen zur Prüfung Angewandte Statistische Methoden in den Nutzierwissenschaften FS 2016 Peter von Rohr Datum 30. Mai 2016 Beginn 08:00 Uhr Ende 08:45
MehrMehrere metrische Merkmale
Kapitel 5 Mehrere metrische Merkmale 5.1 Wie kann man zwei metrische Merkmale grafisch beschreiben? Ein Streudiagram von zwei metrischen Merkmalen erzeugt man mit der Funktion plot mit den Beobachtungen
MehrDeskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS Lösung Aufgabe 27. f X Y (a i b j ) = f i j = f ij f j
1 Deskriptive Statistik Lösungen zu Blatt 5 Christian Heumann, Susanne Konrath SS 2011 Lösung Aufgabe 27 (a) Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a 2 }, S Y {ja, nein} {b
MehrANGEWANDTE STATISTIK II Prüfungstermin Name:
Die Beantwortung der Rechenaufgaben hat zusätzlich zu den numerischen Ergebnissen zu beinhalten: - Feststellung des Problemtyps, Angabe der Lösungsmethode; - bei den Testverfahren: Hypothesen, P-Wert,
MehrTeil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.
Woche 11: Multiple lineare Regression Patric Müller Teil XIII Multiple lineare Regression ETHZ WBL 17/19, 10.07.017 Wahrscheinlichkeit und Statistik Patric Müller WBL
MehrEmpirische Wirtschaftsforschung in R
Empirische Wirtschaftsforschung in R Schätzung der keynesianischen Geldnachfragefunktion auf Basis von Daten der dänischen Volkswirtschaft Jonas Richter-Dumke Universität Rostock, Institut für Volkswirtschaftslehre
Mehr11. Übungsblatt zur Vorlesung Ökonometrie SS 2014
Universität des Saarlandes Lehrstab Statistik Dr. Martin Becker Dipl.-Kfm. Andreas Recktenwald 11. Übungsblatt zur Vorlesung Ökonometrie SS 2014 Aufgabe 45 Die in Aufgabe 43 getroffene Annahme heteroskedastischer
MehrLineare Regressionen mit R (Ökonometrie SS 2014 an der UdS)
Lineare Regressionen mit R (Ökonometrie SS 2014 an der UdS) Es soll untersucht werden, ob und wie sich Rauchen während der Schwangerschaft auf den Gesundheitszustand des Neugeborenen auswirkt. Hierzu werden
Mehr> read.table("d:\\reifen.txt",header=t) > Reifen
1. Aufgabe: Auf einer Reifenrollentestanlage werden Versuche durchgeführt um die Langlaufeigenschaften zu untersuchen. Insbesondere wird die Untersuchung des Abriebs über simulierte Anfahr- Brems- und
MehrTutorial: Regression Output von R
Tutorial: Regression Output von R Eine Firma erzeugt Autositze. Ihr Chef ist besorgt über die Anzahl und die Kosten von Maschinenausfällen. Das Problem ist, dass die Maschinen schon alt sind und deswegen
MehrMetrische und kategoriale Merkmale
Kapitel 6 Metrische und kategoriale Merkmale 6.1 Wie kann man metrische und kategoriale Merkmale numerisch beschreiben? Typischerweise will man geeignete Maßzahlen (beispielsweise Lage- oder Streuungsmaße)
MehrVerallgemeinerte lineare Modelle. Promotion. Promotion. Methoden empirischer Sozialforschung. 1 binäre und mehrere metrische und kategoriale Variablen
Verallgemeinerte lineare Modelle 1 binäre und mehrere metrische und kategoriale Variablen Methoden empirischer Sozialforschung Verallgemeinerte lineare Modelle () Wie läßt sich die Abhängigkeit der Erfolgswahrscheinlichkeit
Mehr6. Tutoriumsserie Statistik II
6. Tutoriumsserie Statistik II 1. Aufgabe: Eine Unternehmensabteilung ist ausschließlich mit der Herstellung eines einzigen Produktes beschäftigt. Für 10 Perioden wurden folgende Produktmenge y und Gesamtkosten
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 36 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula =
MehrEinfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen)
3 Einfache lineare Regression Einfache lineare Modelle mit R 3.6 Einfache lineare Modelle mit Statistik-Software R Beispiel (Ausgaben in Abhängigkeit vom Einkommen) > summary(lm(y~x)) Call: lm(formula
Mehr11. weitere Übungsaufgaben Statistik II WiSe 2017/2018
11. weitere Übungsaufgaben Statistik II WiSe 2017/2018 1. Aufgabe: Bei 100 Fahrzeugen des gleichen Typs sind neben dem Preis (PREIS) auch die gefahrene Strecke (MEILEN) und die Anzahl der Werkstattbesuche
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrWiederholung und ein mehrfaktorielles Verfahren. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09
Wiederholung und ein mehrfaktorielles Verfahren Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Einstieg und Wiederholung Daten unterscheiden sich in ihrem mathematischen Informationsgehalt!
MehrZüchtungslehre - Lösung 3
Züchtungslehre - Lösung 3 Peter von Rohr October 20, 2015 Aufgabe 1 (8) Der in dieser Aufgabe verwendete Datensatz unter http://charlotte-ngs.github.io/livestockbreedingandgenomics/w5/simgenphen.csv umfasst
MehrKonfidenz-, Prognoseintervalle und Hypothesentests IV im multiplen linearen Regressionsmodell mit heteroskedastischen Störgrößen
4 Multiple lineare Regression Heteroskedastische Störgrößen 4.10 Konfidenz-, Prognoseintervalle und Hypothesentests IV im multiplen linearen Regressionsmodell mit heteroskedastischen Störgrößen Ein approximatives
Mehr13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017
13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 1. Aufgabe: Für 25 der größten Flughäfen wurde die Anzahl der abgefertigten Passagiere in den Jahren 2009 und 2012 erfasst. Aus den Daten (Anzahl
MehrCIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife
CIM2004 Übung 7: Permutationstest, Bootstrap & Jackknife Michael Höhle hoehle@stat.uni-muenchen.de Lösung 24. Juni 2004 1 Permutationstest Bilirubin ist ein Zerlegungsprodukt von Haemoglobin. Falls die
MehrMusterlösung zu Serie 1
Prof. Dr. W. Stahel Regression HS 2015 Musterlösung zu Serie 1 1. a) > d.bv plot(blei ~ verkehr, data = d.bv, main
MehrVersuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann
Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am 24.04.2015 Autor: Ludwig Bothmann Contents Aufgabe 1 1 b) Schätzer................................................. 3 c) Residuenquadratsummen........................................
MehrMultiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
MehrIch bestätige, dass ich obige Hinweise zur Kenntnis genommen habe und sie befolgen werde.
60-minütige Klausur zur Vorlesung Statistik II für Studierende der Wirtschaftswissenschaften aus dem Sommersemester 2017 Prof. Dr. Helmut Küchenhoff Ludwig-Maximilians-Universität München, Institut für
MehrWichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser
Wichtige Befehle in R zur Datenanalyse Ergänzende Unterlagen zur Vorlesung Prof. Dr. Oliver Gansser Inhaltsverzeichnis Datenmanagement........................................... 2 Grafische Verfahren..........................................
Mehr1 Kodierung kategorialer Einflussgrößen
Übung zur Vorlesung Generalisierte Regressionsmodelle Blatt 1 Christiane Fuchs, Moritz Berger, Micha Schneider WiSe 16/17 1 Kodierung kategorialer Einflussgrößen Lösung zu Aufgabe 3 Einlesen der Daten:
MehrStatistik mit R, Sitzung am
Statistik mit R, Sitzung am 19.06.07 Mike Kühne 1 R-Kurs INHALTSVERZEICHNIS Inhaltsverzeichnis 1 Bivariate Statistik 3 1.1 Tabellen.............................. 3 1.2 Zusammenhangsmaße für nominal skalierte
Mehr9. Übung (Analyse von qualitativen Daten)
9. Übung (Analyse von qualitativen Daten) (Prüfung von Unabhängigkeit, Homogenität und Anpassung) Man unterscheidet vor allem die folgenden Tests: Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale
MehrHemmzone/Antibiotikum A Hemmzone/Antibiotikum B Hemmzone/Antibiotikum C
GRUPPE B Die Beantwortung der Rechenaufgaben hat zusätzlich zu den numerischen Ergebnissen zu beinhalten: - Feststellung des Problemtyps, Angabe der Lösungsmethode; - bei den Testverfahren: Hypothesen,
MehrSyntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.
Syntax *Ü2. *. corr it25 with alter li_re kontakt. *2. regression var=it25 alter li_re kontakt/statistics /dependent=it25 /enter. regression var=it25 li_re kontakt/statistics /dependent=it25 /enter. *3.
MehrEinleitung. Statistik. Bsp: Ertrag Weizen. 6.1 Einfache Varianzanalyse
Einleitung Statistik Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Der Begriff Varianzanalyse (analysis of variance, ANOVA) taucht an vielen Stellen in der Statistik mit unterschiedlichen
Mehr> r.lm < lm(log10(ersch) log10(dist), > summary(r.lm) > r.lms < summary(r.lm) R-Funktionen zur linearen Regression. data = d.
3.4 S-Funktionen 75 R-Funktionen zur linearen Regression a Im package stat (immer vorhanden): lm > r.lm < lm(log10(ersch) log10(dist), data = d.spreng) b Funktion summary produziert Resultate, die man
MehrVorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik. Regression. Einfache lineare Regression
Vorlesung: Statistik I für Studierende der Statistik, Mathematik & Informatik Regression Dozent: Fabian Scheipl Material: H. Küchenhoff LMU München 39 Einfache lineare Regression Bestimmung der Regressionsgerade
MehrTechnische Universität München Zentrum Mathematik Sommersemester Juli 2005 Arbeitszeit 60 Minuten
Name: Frau Herr (nichtzutreffendes bitte streichen) Fachrichtung geb. am (Tag/Mon/Jahr) Semestralklausur aus Praktikum BWL-Statistik Technische Universität München Zentrum Mathematik Sommersemester 2005
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS 2018
Aufgabe 3 (15 + 1 + 7 + 7 + 7 + 5 = 42 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe der Statistiksoftware R soll der Datensatz HousePrices aus dem Paket
MehrLineare Regression in R, Teil 1
Lineare Regression in R, Teil 1 Christian Kleiber Abt. Quantitative Methoden, WWZ, Universität Basel October 6, 2009 1 Vorbereitungen Zur Illustration betrachten wir wieder den Datensatz CASchools aus
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie WS 2017/18. ( = 58 Punkte)
Aufgabe 3 (14 + 2 + 7 + 7 + 3 + 5 + 9 + 11 = 58 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Mit Hilfe der Statistiksoftware R soll der Datensatz HousePrices aus
MehrLineare Modelle in R: Zweiweg-Varianzanalyse und Kovarianzanalyse
Lineare Modelle in R: Zweiweg-Varianzanalyse und Kovarianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon im Tutorium LiMo2.pdf laden wir den GSA Datensatz R> load("gsa.rda") und wählen
MehrMusterlösung zu Serie 8
Prof. Dr. W. Stahel, Dr. J. Ernest Regression HS 2017 Musterlösung zu Serie 8 1. Im Data Frame http://stat.ethz.ch/teaching/datasets/wbl/umwelt.dat sind die Ergebnisse einer Umfrage zum Umweltschutz gegeben.
MehrEinführung in die formale Demographie Übung
Einführung in die formale Demographie Übung Roland Rau mailto:roland.rau@uni-rostock.de 27. Oktober 2014 Inhaltsverzeichnis 1 Eigene Funktionen schreiben 2 2 Regression in R 3 3 Aufgaben 8 3.1 Schreiben
Mehr14.3 Das Einstichprobenproblem in R
14.3. DAS EINSTICHPROBENPROBLEM IN R 343 0.553 0.570 0.576 0.601 0.606 0.606 0.609 0.611 0.615 0.628 0.654 0.662 0.668 0.670 0.672 0.690 0.693 0.749 0.844 0.933 die absoluten Häufikeiten n i der Klassen.
MehrLösung zu Kapitel 11: Beispiel 1
Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten
MehrSchweizer Statistiktage, Aarau, 18. Nov. 2004
Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der
MehrEinführung in die formale Demographie Übung
Einführung in die formale Demographie Übung Roland Rau mailto:roland.rau@uni-rostock.de 03. November 2014 Inhaltsverzeichnis 1 Aufgaben vom 27. Oktober 2014 2 1.1 Schreiben von Funktionen............................
MehrBachelorprüfung: Statistik (1 Stunde)
Prof. H.R. Künsch D-BIOL, D-CHAB Winter 2010 Bachelorprüfung: Statistik (1 Stunde) Bemerkungen: Es sind alle mitgebrachten schriftlichen Hilfsmittel und der Taschenrechner erlaubt. Natels sind auszuschalten!
MehrBreusch-Pagan-Test I auf Heteroskedastie in den Störgrößen
Breusch-Pagan-Test I Ein weiterer Test ist der Breusch-Pagan-Test. Im Gegensatz zum Goldfeld-Quandt-Test ist es nicht erforderlich, eine (einzelne) Quelle der Heteroskedastizität anzugeben bzw. zu vermuten.
MehrStatistik II für Betriebswirte Vorlesung 8
Statistik II für Betriebswirte Vorlesung 8 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 3. Dezember 2018 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 8 Version:
Mehrepg = read.table(file.path(pfadu, "epg.txt")) amp = read.table(file.path(pfadu, "dbdauer.txt"))
Kovarianz, Korrela-on, (lineare) Regression Jonathan Harrington & Ulrich Reubold library(laece) epg = read.table(file.path(pfadu, "epg.txt")) amp = read.table(file.path(pfadu, "dbdauer.txt")) Kovarianz,
MehrFragen. Einführung in die induktive Statistik. Übersicht. Lineare Einfachregression
Fragen Welche Unsicherheitsfaktoren beeinflussen die Schätzung einer Regressionsgeraden? Einführung in die induktive Statistik Friedrich Leisch Institut für Statistik Ludwig-Maximilians-Universität München
MehrDr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter Musterlösung
Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter 2014 Musterlösung 1. (11 Punkte) a) Für welchen Parameter ist X ein geeigneter Schätzer? X ist ein geeigneter Schätzer für den Erwartungswert µ
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
Mehr4 Multiple lineare Regression Multikollinearität 4.9
Multikollinearität Erinnerung: Unter der (gemäß Modellannahmen ausgeschlossenen) perfekten Multikollinearität versteht man eine perfekte lineare Abhängigkeit unter den Regressoren (einschließlich des Absolutglieds
Mehr4 Multiple lineare Regression Multikollinearität 4.9
Multikollinearität Erinnerung: Unter der (gemäß Modellannahmen ausgeschlossenen) perfekten Multikollinearität versteht man eine perfekte lineare Abhängigkeit unter den Regressoren (einschließlich des Absolutglieds
Mehr4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017
4. Lösung weitere Übungsaufgaben Statistik II WiSe 016/017 1. Aufgabe: Eine sächsische Molkerei füllt Milch in Tetrapacks ab. Es wird vermutet, dass die Füllmenge normalverteilt ist mit einem Erwartungswert
MehrTutorial: Rangkorrelation
Tutorial: Rangkorrelation In vielen Sportarten gibt es mehr oder weniger ausgefeilte Methoden, nicht nur die momentanen Leistungen (der jetzige Wettkampf, das jetzige Rennen, das jetzige Spiel,..) der
MehrAufgabensammlung (Nicht-MC-Aufgaben) Klausur Ökonometrie SS ( = 57 Punkte)
Aufgabe 3 (9 + 5 + 7 + 7 + 3 + 9 + 7 + 10 = 57 Punkte) Hinweis: Beachten Sie die Tabellen mit Quantilen am Ende der Aufgabenstellung! Zu Beginn der Studienjahre 2011 und 2012 wurden Studienanfänger an
MehrTeil VIII Hypothesentests für zwei Stichproben
Woche 9: Hypothesentests für zwei Stichproben Teil VIII Hypothesentests für zwei Stichproben WBL 15/17, 22.06.2015 Alain Hauser Berner Fachhochschule, Technik und Informatik Berner
MehrKonfidenz-, Prognoseintervalle und Hypothesentests II bei heteroskedastischen Störgrößen
Konfidenz-, Prognoseintervalle und Hypothesentests II bei heteroskedastischen Störgrößen Achtung! Bei der Verwendung von heteroskedastie-konsistenten Schätzern für V( β) muss unbedingt darauf geachtet
MehrUnterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13
Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression Robin Ristl Wintersemester 2012/13 1 Exakter Test nach Fisher Alternative zum Chi-Quadrat Unabhängigkeitstest
MehrAngewandte Statistik 2 Projektarbeit 2010
FH Campus Wien - Studiengang Molekulare Biotechnologie Angewandte Statistik 2 Projektarbeit 2010 Eingereicht von Ehrhardt Christine Steinbauer Andrea Begutachtet von Univ.-Prof. Dipl.-Ing. Dr. Timischl
Mehr10. Übung (Korrelation und lineare Regressionsanalyse)
10. Übung (Korrelation und lineare Regressionsanalyse) Es wird untersucht, ob ein linearer Zusammenhang zwischen zwei Variablen besteht. Mit anderen Worten: ob ein solcher Zusammenhang gibt, wenn der beobachteter
MehrSchriftliche Prüfung (90 Minuten)
Dr. M. Kalisch. Statistik (für Biol./Pharm. Wiss.) Winter 2014 Schriftliche Prüfung (90 Minuten) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten!
MehrSchriftliche Prüfung (90 Minuten)
Dr. M. Kalisch Prüfung Statistik I Winter 2016 Schriftliche Prüfung (90 Minuten) Bemerkungen: Erlaubte Hilfsmittel: 10 hand- oder maschinengeschriebene A4 Seiten (=5 Blätter). Taschenrechner ohne Kommunikationsmöglichkeit.
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrWirtschaftswissenschaftliches Prüfungsamt
Wirtschaftswissenschaftliches Prüfungsamt Master of Economics, Finance and Philosophy Diplomprüfung Econometric Methods and Applications Wintersemester 2011/12 22. Februar 2012 Prof. Dr. Ralph Friedmann
Mehrentschieden hat, obwohl die Merkmalsausprägungen in der Grundgesamtheit voneinander abhängig sind.
Bsp 1) Die Wahrscheinlichkeit dafür, dass eine Glühbirne länger als 200 Stunden brennt, beträgt 0,2. Wie wahrscheinlich ist es, dass von 10 Glühbirnen mindestens eine länger als 200 Stunden brennt? (Berechnen
MehrSchriftliche Prüfung (1 Stunde)
Prüfung Statistik Herbstsemester 2011 Schriftliche Prüfung (1 Stunde) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten! Lesen Sie zuerst
MehrTeil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie
Woche 9: Hypothesentests für zwei Stichproben Patric Müller Teil XI Hypothesentests für zwei Stichproben ETHZ WBL 17/19, 26.06.2017 Wahrscheinlichkeit und Statistik Patric
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
Mehr1 Analyse von Kontigenztafeln: Das loglineare Modell
Übung zur Vorlesung Kategoriale Daten Blatt 3 Gerhard Tutz, Moritz Berger WiSe 15/16 1 Analyse von Kontigenztafeln: Das loglineare Modell Aufgabe 12 Analyse des Datensatzes EyeColor (a) Visualisierung
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrFUNKTIONEN UND FORMELN IN
FUNKTIONEN UND FORMELN IN Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg 01.06.2016 Gliederung Arithmetische Operatoren
MehrFORMELN IN. Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg
FORMELN IN Referent: Daniel Laskow Betreuer: Eugen Betke Programmierung in R Arbeitsbereich Wissenschaftliches Rechnen Universität Hamburg 01.06.2016 Gliederung Arithmetische Operatoren Funktionen aus
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger Hochschule Augsburg. für Betriebswirtschaft und internationales Management
für Betriebswirtschaft und internationales Management Sommersemester 2015 Prof. Dr. Stefan Etschberger Hochschule Augsburg Testverteilungen Chi-Quadrat-Verteilung Sind X 1,..., X n iid N(0; 1)-verteilte
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrFragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)
Hypothesen Tests Fragestellungen stab.glu 82 97 92 93 90 94 92 75 87 89 hdl 56 24 37 12 28 69 41 44 49 40 ratio 3.60 6.90 6.20 6.50 8.90 3.60 4.80 5.20 3.60 6.60 glyhb 4.31 4.44 4.64 4.63 7.72 4.81 4.84
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2
MehrMehrfache und polynomiale Regression
Mehrfache und polynomiale Regression Kriteria für die Durchführung einer Regression Jonathan Harrington Bitte datasets.zip (unter 5.5, Tabellarische Daten) neu herunterladen und in pfad auspacken Einfache
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrMusterlösung. Kind Blume (beredet) Blume (nicht beredet)
Prüfung Statistik Sommer 2012 Musterlösung 1. (9 Punkte) F. Lauer möchte das Gerücht überprüfen, dass Blumen schneller wachsen, wenn man mit ihnen redet. Daher kauft sie acht identische Blumenzwiebeln,
Mehr