4.1 Problemstellung. E E i = 0 : Linearität, Additivität. 4 Residuen-Analyse 4.1. PROBLEMSTELLUNG 96. (a) (b) gleiche Varianz var E i = σ 2,
|
|
- Josef Hummel
- vor 6 Jahren
- Abrufe
Transkript
1 4.1. PROBLEMSTELLUNG 96 4 Residuen-Analyse 4.1 Problemstellung a Modellannahmen: E i N 0, σ 2 (a) E E i = 0 : Linearität, Additivität. (b) gleiche Varianz var E i = σ 2, (c) normalverteilt. b c (d) E i unabhängig, Voraussetzungen überprüfen! nicht Rechtfertigung, sondern Chance: besseres Modell, explorative Datenanalyse. (Auch für Varianzanalyse und andere Regressionsmodelle.)
2 4.1. PROBLEMSTELLUNG d Verbesserungen: Variable transformieren, zusätzliche Terme, beispielsweise Wechselwirkungen, ins Modell aufnehmen, Beobachtungen gewichten, allgemeinere Modelle und Methoden verwenden. e Grafische Darstellungen (ev.tests) = Diagnose-Untersuchung Abweichungen = Symptome versch. Abweichungen Syndrom Diagnose Therapie
3 4.2. RESIDUEN UND ANGEPASSTE WERTE 98 a 4.2 Residuen und angepasste Werte Einfache Regression Streudiagramm betrachten! Multiple Regression mehrere X (j) angepasste Werte 1.0 log10(erschütterung) angepasste Werte
4 4.2 b 4.2. RESIDUEN UND ANGEPASSTE WERTE 99 Welche Abweichungen von Voraussetzungen könnte man hier sehen? (a) Regressionsfunktion: Verlauf der Punkte. Typische Abweichung: Krümmung des mittleren Verlaufs. c (b) Gleiche Varianzen: Streubreite der Punkte um die Gerade. Typische Abweichung: Punkte laufen gegen rechts auseinander. d (c) Verteilung der Fehler: Streuen Punkte symmetrisch um die Gerade? Ausreisser? e Wie beurteilen? Abweichung im Bereich des Zufalls? Abweichung gefährlich? Antwort abhängig vom Zweck der Studie!
5 4.2 f 4.2. RESIDUEN UND ANGEPASSTE WERTE 100 Variante des Diagramms Y gegen ŷ zeigt Abweichungen genauer: Tukey-Anscombe-Diagramm: Residuen gegen angepasste Werte Residuen angepasste Werte
6 RESIDUEN UND ANGEPASSTE WERTE 101 g (a) Regressionsfunktion: E E i = 0. Mittelwert der R i über Fenster" der ŷ i gleitendes Mittel Glättung lowess", robust Nichtparametrische Regression. h Abweichung zufällig? Simulation 19 zusätzliche Kurven. Idt die beobachtete die extremste"? grafischer Test" R i Residuen y^i angepasste Werte
7 RESIDUEN UND ANGEPASSTE WERTE 102 i (b) Gleiche Varianzen: Gleitende Varianz? besser lowess für Ri gegen ŷ i. R i Wurzel abs. Residuen y^i angepasste Werte
8 4.3. VERTEILUNG DER FEHLER 103 a 4.3 Verteilung der Fehler (c) Normalverteilung? Histogramm der E i resp. Residuen R i! Die Zielgrösse Y muss nicht normalverteilt sein!
9 4.3 b 4.3. VERTEILUNG DER FEHLER 104 Raffinierter: Quantil-Quantil-Diagramm (QQ-Plot, normal plot) Geordnete Residuen Quantile der Standardnormalverteilung
10 4.3 c d 4.3. VERTEILUNG DER FEHLER 105 Abweichungen zufällig? Anpassungstest (goodness of fit test) Oder simulieren! sim.residuen sim.residuen sim.residuen sim.residuen sim.residuen sim.residuen
11 4.3. VERTEILUNG DER FEHLER Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal
12 4.3. VERTEILUNG DER FEHLER e Verteilung der Zufallsfehler!? Zufallsfehler E i Residuen R i R i = Y i ŷ i beides zufällig. ŷ i hängt von Y i, also von E i ab. f R i N 0, σ 2 (1 H ii ). H ii leverage, Hebelarm Y i Y i + y i ŷ i ŷ i + H ii y i Hebelwirkung H ii misst den Abstand" zwischen x i und x i. einfache R.: H ii = (1/n) + (x i x) 2 /SSQ (X). multiple R.: H ii = (1/n) + d x i, x 2. d: Mahalanobis-Distanz. 0 H ii 1, avei H ii = p/n.
13 4.3. VERTEILUNG DER FEHLER g Residuen standardisieren, damit sie alle die gleiche Verteilung haben: R i = R i /( σ 1 H ii ) Verwende stand. Residuen zur Überprüfung der Verteilung! Meistens ist der Unterschied der Varianzen var R i klein, deshalb genügen unstandardisierte Residuen auch.
14 4.3. VERTEILUNG DER FEHLER 109 Theoretische Verteilung der Residuen β = (X T X ) 1 X T Y ŷ = X β = X (X T X ) 1 X T Y =: HY R = Y ŷ = Y X β E R = E Y X E β = X β X β = 0 R = Y ŷ = Y HY = (I H)Y R i = (1 H ii )Y i k i H iky k var R i = σ ((1 2 H ii ) 2 + Man muss zeigen, dass k H2 ik = H ii k i H2 ik ist. Dann ist ) = σ 2 ( 1 2H ii + k H2 ik )
15 4.3. VERTEILUNG DER FEHLER 110 var R i = σ 2 (1 H ii ) bewiesen. Es ist k H2 ik = (H H T ) ii und HH T = (X (X T X ) 1 X T )(X (X T X ) 1 X T ) Das ii-element ist also H ii = X (X T X ) 1 X T = H
16 4.4. ZIELGRÖSSE TRANSFORMIEREN? Zielgrösse transformieren? a Symptome Syndrom Diagnose Therapie. Umgekehrt: Krankheit Syndrom Falsche / fehlende Transformation der Zielgrösse??? Bsp. Sprengungen: Fehlende log-transformation???
17 4.4. ZIELGRÖSSE TRANSFORMIEREN? 112
18 4.4. ZIELGRÖSSE TRANSFORMIEREN? b Syndrom: nach oben gekrümmte Glättung, nach rechts trichterförmig zunehmende Streuung, schiefe Verteilung der Residuen bis auf 1 Ausreisser nach unten. c = Transformations-Syndrom"
19 4.4 e f 4.4. ZIELGRÖSSE TRANSFORMIEREN? 114 First aid transformations Logarithmus-Transformation für Konzentrationen und Beträge, Logarithums- oder Wurzel-Transformation für Zähldaten, Arcus-Sinus-Transformation ỹ = arcsin y für Anteile (Prozentzahlen/100). sollten für solche Daten immer angewendet werden (wenn es keine Gegengründe gibt), auch für erklärende Variable! Log-Transformation macht ein multiplikatives Modell zu einem linearen: Ỹ = log 10 Y und X(j) = log10 X (j). log 10 Y i = β 0 + β 1 log 10 x (1) i + β 2 log 10 x (2) i + E i Y i = 10 β 0 x β 1 i x β 2 i 10 E i Potenzgesetz, Terme wirken multiplikativ, Fehler multiplikativ.
20 4.4. ZIELGRÖSSE TRANSFORMIEREN? g Schwierigkeit: log 0 =. Abhilfe: Ỹ = log Y + c. Wahl von c? Bitte nicht c = 1! Vorschlag: c = med Y k /s 2.9 mit s = med Y k /q 0.25 Y k h Box-Cox-Transformationen. g λ (x) = x λ 1 für λ 0, λ ln x für λ = 0. i Transformation ändert die Regressionsfunktion! Erlaubt? Hängt von der Anwendung ab! k Kann (monotone) Transformation der Zielgrösse helfen? Referenzlinie im TA-Diagramm betrachten!
21 4.5. AUSREISSER UND LANGSCHWÄNZIGE VERTEILUNG Ausreisser und langschwänzige Verteilung a Ausreisser. Beobachtungen, die schlecht zum Modell passen. b Grober Fehler? korrigieren. Wenn nichts Spezielles war, darf man Ausreisser weglassen? Ja: Voraussetzung nicht erfüllt c Langschwänzige Verteilung. Kleinste Quadrate nicht optimal. Max.lik. für langschw. Vert. weniger Gewicht für extreme Beob. Block robuste Regression.
22 4.6. RESIDUEN UND EINGANGS-VARIABLE 117 a 4.6 Residuen und Eingangs-Variable Residuen gegen X (j) auftragen! log10(ersch) ~ Stelle + log10(dist) + log10(ladung) Residuals Residuals dist ladung Oct 1,01/2:19 b Transformation von X (j)? Beachte Referenzlinie!
23 4.6. RESIDUEN UND EINGANGS-VARIABLE 118 log10(ersch) ~ Stelle + dist + ladung Residuals Residuals dist ladung Oct 1,01/2:20 c Wenn Transformation nicht hilft: quadratischer Term, oder glatte Funkt. statt linearer Glättung, Nichtparametrische Regr.
24 4.6 d 4.6. RESIDUEN UND EINGANGS-VARIABLE 119 Sind Effekte von 2 Variablen additiv? Residuen gegen 2 erkl. Var. auftragen! log(ladung) Wechselwirkung (oder besser = (x (j) i x (m+1) i log(distanz) = x (j) i x (k) i x (j) )(x (k) i x (k) )) für kontinuierl. X (j), X (k)
25 4.6. RESIDUEN UND EINGANGS-VARIABLE 120 Wechselwirkung zw. kont. Var. X (j) und Faktor X (k)? = verschiedene Steigungen β j für versch. Niveaus des Faktors. e Bessere Figur : log10(ersch) ~ stelle + log10(dist) + log10(ladung) Residuals Oct 1,01/8: dist f Varianz var E i abhängig von X (j)? gewichtete Regr.
26 4.7. GEWICHTETE LINEARE REGRESSION Gewichtete lineare Regression a Varianzen verschieden, var E i =: σ 2 i. σ i bekannt. Dann: Kleines σ i grosses Gewicht. Formal: Maximum likelihood Gewichtete Kl.Quadrate = minimiere i w ir 2 i, w i = 1/σ 2 i b σ i unbekannt, aber var E i = σ 2 v i Gewichte w i = 1/v i. σ i Funktion von x (j) i, σ 2 v x (j) i w i = 1/v x (j). i Achtung: σ i Funktion von Y i : Man darf nicht w i = 1/v Y i ) nehmen (evtl. w i = 1/v ŷ i. Nicht iterieren!)
27 4.7. GEWICHTETE LINEARE REGRESSION c β = ( X T W X ) 1 X T W Y, E βj = β j, var βj = σ 2 ( X T W X ) 1 jj. d Überprüfung der Wahl der Gewichte: Ri gegen Gewichte.
28 4.8. GESAMTHAFTE ÜBERPRÜFUNG Gesamthafte Überprüfung a Geschätzte Streuung der Fehler vergleichen mit Schätzung aus einer anderen Quelle. z.b. bekannte Mess-Ungenauigkeit σ 2. Falls Form der Regressionsfunktion falsch, d.h. z.b. wahre Regressionsfunktion ist nichtlinear, dann ist σ 2 > σ 2.
29 4.8. GESAMTHAFTE ÜBERPRÜFUNG c Falls zu jedem x i mehrere Beobachtungen Y i1, Y i2,...y ini gemacht werden = Replikate Schätzung der Streuung des Fehlers: σ 2 = 1 n g g n i i=1 h=1 SSQ (rep) : Quadratsumme der Replikate" (Y ih Y i. ) 2 = 1 n g SSQ(rep) Test mit Testgrösse T = (SSQ(E) SSQ (rep) )/(g p) SSQ (rep) /(n g) F
30 4.8. GESAMTHAFTE ÜBERPRÜFUNG 125 e Statt identischen x i benachbarte" Beobachtungen Distanz d x h, x i. Trage (R i R h ) 2 gegen d x h, x i auf. Daniel & Wood (1971/1980): d x (1) i,..., x (m) i ; x (1) h,..., x(m) h = j ( βj (x (j) i x (j) h )) 2 / σ 2
31 4.9. UNABHÄNGIGKEIT Unabhängigkeit a R i auftragen gegen Zeit, Ort, Gruppierungs-Variable. Residuen Reihenfolge
32 4.9 d 4.9. UNABHÄNGIGKEIT 127 Räumliche Abhängigkeit, Bsp. basische Böden
33 4.9. UNABHÄNGIGKEIT e* Durbin-Watson-Test. Entscheidung: Unabhängigkeit T = n i=2 (R i R i 1 ) 2 / n i=1 R2 i Verwerfung, falls T < c, Beibehaltung, falls T > c, gar nichts (unentscheidbar), falls T dazwischen liegt. f Wenn Korrelationen vorliegen, dann sind die P-Werte der üblichen Tests häufig grob falsch. Verallgemeinerte Kleinste Quadrate, Regression von Zeitreihen
34 4.10. EINFLUSSREICHE BEOBACHTUNGEN Einflussreiche Beobachtungen a Ausreisser: Haben sie wesentlichen Einfluss auf die Analyse? Sensitivitäts-Analyse" b Analyse ohne ite Beobachtung (influence) diagnostics": Veränderung von Schätzwerten, Test-Statistiken,... 2 weglassen : nicht unbedingt additive Effekte. masking", swamping".
35 4.10 c EINFLUSSREICHE BEOBACHTUNGEN 130 R i gegen H ii auftragen. Influence diagnostics nehmen zu mit R i und H ii. gefährliche" Zonen e Distanz von Cook d i = R 2 i H ii p σ 2 (1 H ii ) 2 = (1/p) R2 i H ii /(1 H ii )
36 4.10 f EINFLUSSREICHE BEOBACHTUNGEN 131 added variable plot oder partial regression leverage plot (Y j) R gegen i R (X(j) j) auftragen i Res.(log10(ersch)~log10(ladung)+Stelle) Res.(log10(dist)~log10(ladung)+Stelle)
37 4.10. EINFLUSSREICHE BEOBACHTUNGEN 132 Merkpunkte Residuen-Analyse 1. Im Tukey-Anscombe-Diagramm sieht man Abweichungen von der angenommenen Regressionsfunktion, der Gleichheit der Varianzen (Scale Plot) der Form der Verteilung der Fehler (genauer: QQ-Plot) Transformation der Zielgrösse hilft oft. 2. Residuen gegen Eingangs-Variable Transformation der E.-V. Wechselwirkungen 3. Einflussreiche Beobachtungen 4. Residuenanalyse dient der Verbesserung eines Regressionsmodells. Regression ohne Residuenanalyse ist unzulässig"!
3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m)
3.1. MODELL UND STATISTIK 32 3 Multiple lineare Regression a 3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m) Y i = β 0 + β 1 x (1)
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrDiagnostik von Regressionsmodellen (1)
Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer
MehrErgänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
Mehr3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 3.1 3.1 Punktschätzer für Mittelwert µ und Varianz σ 2 Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden
Mehr- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.
Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Regression: 4 eindimensionale Beispiele Berühmte
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrStatistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage
Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung
MehrAnnahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
MehrEine Einführung in R: Das Lineare Modell
Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management
Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Ausgangsdaten Bundesliga 2008/2009 Gegeben: Daten zu den 18 Vereinen der ersten Bundesliga
MehrFerienkurse Mathematik Sommersemester 2009
Ferienkurse Mathematik Sommersemester 2009 Statistik: Grundlagen 1.Aufgabenblatt mit praktischen R-Aufgaben Aufgabe 1 Lesen Sie den Datensatz kid.weights aus dem Paket UsingR ein und lassen sie die Hilfeseite
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrWiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung
Regression II Statistik I Sommersemester 2009 Statistik I Regression II (1/33) R 2 Root Mean Squared Error Statistik I Regression II (2/33) Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2
MehrEinführung in die Varianzanalyse mit SPSS
Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen
MehrLineare Regression 1 Seminar für Statistik
Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
Mehr30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette
Ruhr-Universität Bochum 30. März 2011 1 / 46 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30 10.00
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrMathematik III - Statistik für MT(Master)
3. Regressionsanalyse Fachbereich Grundlagenwissenschaften Prof. Dr. Viola Weiß Wintersemester 0/03 Mathematik III - Statistik für MTMaster 3. Empirische Regressionsgerade Optimalitätskriterium: Die Summe
MehrSchriftliche Prüfung (90 Minuten)
Dr. M. Kalisch Probeprüfung Statistik 1 Sommer 2014 Schriftliche Prüfung (90 Minuten) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten!
MehrANalysis Of VAriance (ANOVA) 2/2
ANalysis Of VAriance (ANOVA) 2/2 Markus Kalisch 22.10.2014 1 Wdh: ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor X). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich
MehrGlossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale
Glossar Statistik 2 Bivariate Verfahren: zwei nummerische Merkmale Streudiagramm - Datenpaare (X, Y) als Punkte auf einem zweidimensionale Diagramm (Ordinate: Y, Abszisse: X) Lineare Regression - Optimierungsproblem
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung
MehrBeispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben
Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben Es wurden die Körpergrößen von 3 Versuchspersonen, sowie Alter und Geschlecht erhoben. (Jeweils Größen pro Faktorstufenkombination). (a)
MehrStatistik Vorlesung 7 (Lineare Regression)
Statistik Vorlesung 7 (Lineare Regression) K.Gerald van den Boogaart http://www.stat.boogaart.de/ Statistik p.1/77 Gerade als Vereinfachung Wachstum bei Kindern height 76 78 80 82 18 20 22 24 26 28 age
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrFormelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade
Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de
MehrProblem aller bisheriger Methoden: Ergebnis ist nur so gut wie das Modell selbst.
2.7 Validierung durch Backtesting Problem aller bisheriger Methoden: Ergebnis ist nur so gut wie das Modell selbst. Modell besteht im Wesentlichen aus zwei Faktoren: 1. Einflussgrößen 2. Modellierungsalgorithmus
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrAngewandte Statistik für Naturwissenschaftler
Pareys Studientexte 74 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Jose L. Lozän Hartmut Kausch Angewandte Statistik
MehrNumerische Methoden und Algorithmen in der Physik
Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate
MehrWahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen
Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung
MehrBonus-Lektion: Prüfung der Voraussetzungen und Transformationen
Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrStatistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II
Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen
MehrStatistik, Geostatistik
Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.
MehrRegression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
Mehr1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:
Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60
MehrLehrinhalte Statistik (Sozialwissenschaften)
Lehrinhalte Technische Universität Dresden Institut für Mathematische Stochastik Dresden, 13. November 2007 Seit 2004 Vorlesungen durch Klaus Th. Hess und Hans Otfried Müller. Statistik I: Beschreibende
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
MehrInhaltsverzeichnis. Vorwort 13. Teil I Beschreibende Statistik 17. Kapitel 1 Statistische Merkmale und Variablen 19
Inhaltsverzeichnis Vorwort 13 Teil I Beschreibende Statistik 17 Kapitel 1 Statistische Merkmale und Variablen 19 1.1 Statistische Einheiten und Grundgesamtheiten 19 1.2 Merkmale und Merkmalsausprägungen
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrKorrelation - Regression. Berghold, IMI
Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrEinführung in die computergestützte Datenanalyse
Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL
MehrStatistische Methoden der VWL und BWL Theorie und Praxis ST?
Statistische Methoden der VWL und BWL Theorie und Praxis ST? Vorwort 13 Teil I Beschreibende Statistik 17 Kapitel 1 Statistische Merkmale und Variablen 19 1.1 Statistische Einheiten und Grundgesamtheiten
Mehr» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller
» SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela
MehrDemokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik
Demokurs Modul 3741 Vertiefung der Wirtschaftsmathematik und Statistik Kurs 41 Vertiefung der Statistik 15. Juli 010 Seite: 14 KAPITEL 4. ZUSAMMENHANGSANALYSE gegeben, wobei die Stichproben(ko)varianzen
MehrStatistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik
MehrMedizinische Biometrie (L5)
Medizinische Biometrie (L5) Vorlesung III Wichtige Verteilungen Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de
Mehr1.8 Kolmogorov-Smirnov-Test auf Normalverteilung
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen
MehrKorrelation Regression. Wenn Daten nicht ohne einander können Korrelation
DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrStatistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27
Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrUE Angewandte Statistik Termin 4 Gruppenvergleichstests
UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation
MehrGrundlagen der Statistik I
NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis
MehrSchließende Statistik
Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS
Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für
MehrWeitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression
Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Mehr2.3 Nichtlineare Regressionsfunktion
Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrMultiple Regressionsanalyse - Kurzabriss
Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen
MehrMultiple Regression Mais-NP Zweidimensionale lineare Regression Data Display Dreidimensionale lineare Regression Multiple Regression
Multiple Regression! Zweidimensionale lineare Regression Modell Bestimmung der Regressionsebene Multiples Bestimmtheitsmaß Test des Bestimmtheitsmaßes Vertrauensintervalle für die Koeffizienten Test des
MehrDatenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München
Datenanalyse eine Einführung Klaus Diepold Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse: Für wen?! für die Wissenschaftlerin Auffinden von Zusammenhängen und Strukturen in
MehrInhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5
Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung
MehrInformationen zur KLAUSUR am
Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,
MehrStatistik I. Übungklausur. Prof. Dr. H. Toutenburg
Statistik I Übungklausur Prof. Dr. H. Toutenburg Hinweis: Die Zeitangaben sollen Ihnen aufzeigen wieviel Zeit Ihnen für eine Aufgabe von gewissem Umfang eingeräumt wird. Die Punktzahlen für die einzelnen
MehrMultiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)
Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang
MehrBeschreibende Statistik Zweidimensionale (bivariate) Daten
Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 26. April 2013 Prolog Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Artensterben
MehrVergleich von Gruppen I
Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik
Mehr1. Datei Informationen
1. Datei Informationen Datei vorbereiten (Daten, Variablen, Bezeichnungen und Skalentypen) > Datei Dateiinformation anzeigen Arbeitsdatei 2. Häufigkeiten Analysieren Deskriptive Statistik Häufigkeiten
MehrInstitut für Biometrie und klinische Forschung. WiSe 2012/2013
Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate
MehrKapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests
Kapitel 10 Mittelwert-Tests 10.1 Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests 10.1 Einstichproben- Mittelwert-Tests 10.1.1 Einstichproben- Gauß-Test Dichtefunktion der Standard-Normalverteilung
MehrSchätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk
Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
Mehry t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.
Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
Mehro o o o o o o o o o o o
Klumpen-Stichproben = Cluster Sampling Obs.: Bei einer uneingeschränkten Zufallsauswahl wird pro Randomisierungs- Schritt genau eine Beobachtung gemacht. Ein ganz wesentlicher Punkt : Jedes zufällig ausgewählte
MehrTests einzelner linearer Hypothesen I
4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen
MehrStatistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von
Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN
MehrStatistik für Ökonomen
Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS 2., überarbeitete Auflage 4ü Springer Gabler Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R '! 3 1.1 Installieren
MehrSignalverarbeitung 2. Volker Stahl - 1 -
- 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend
Mehr