4.1 Problemstellung. E E i = 0 : Linearität, Additivität. 4 Residuen-Analyse 4.1. PROBLEMSTELLUNG 96. (a) (b) gleiche Varianz var E i = σ 2,

Größe: px
Ab Seite anzeigen:

Download "4.1 Problemstellung. E E i = 0 : Linearität, Additivität. 4 Residuen-Analyse 4.1. PROBLEMSTELLUNG 96. (a) (b) gleiche Varianz var E i = σ 2,"

Transkript

1 4.1. PROBLEMSTELLUNG 96 4 Residuen-Analyse 4.1 Problemstellung a Modellannahmen: E i N 0, σ 2 (a) E E i = 0 : Linearität, Additivität. (b) gleiche Varianz var E i = σ 2, (c) normalverteilt. b c (d) E i unabhängig, Voraussetzungen überprüfen! nicht Rechtfertigung, sondern Chance: besseres Modell, explorative Datenanalyse. (Auch für Varianzanalyse und andere Regressionsmodelle.)

2 4.1. PROBLEMSTELLUNG d Verbesserungen: Variable transformieren, zusätzliche Terme, beispielsweise Wechselwirkungen, ins Modell aufnehmen, Beobachtungen gewichten, allgemeinere Modelle und Methoden verwenden. e Grafische Darstellungen (ev.tests) = Diagnose-Untersuchung Abweichungen = Symptome versch. Abweichungen Syndrom Diagnose Therapie

3 4.2. RESIDUEN UND ANGEPASSTE WERTE 98 a 4.2 Residuen und angepasste Werte Einfache Regression Streudiagramm betrachten! Multiple Regression mehrere X (j) angepasste Werte 1.0 log10(erschütterung) angepasste Werte

4 4.2 b 4.2. RESIDUEN UND ANGEPASSTE WERTE 99 Welche Abweichungen von Voraussetzungen könnte man hier sehen? (a) Regressionsfunktion: Verlauf der Punkte. Typische Abweichung: Krümmung des mittleren Verlaufs. c (b) Gleiche Varianzen: Streubreite der Punkte um die Gerade. Typische Abweichung: Punkte laufen gegen rechts auseinander. d (c) Verteilung der Fehler: Streuen Punkte symmetrisch um die Gerade? Ausreisser? e Wie beurteilen? Abweichung im Bereich des Zufalls? Abweichung gefährlich? Antwort abhängig vom Zweck der Studie!

5 4.2 f 4.2. RESIDUEN UND ANGEPASSTE WERTE 100 Variante des Diagramms Y gegen ŷ zeigt Abweichungen genauer: Tukey-Anscombe-Diagramm: Residuen gegen angepasste Werte Residuen angepasste Werte

6 RESIDUEN UND ANGEPASSTE WERTE 101 g (a) Regressionsfunktion: E E i = 0. Mittelwert der R i über Fenster" der ŷ i gleitendes Mittel Glättung lowess", robust Nichtparametrische Regression. h Abweichung zufällig? Simulation 19 zusätzliche Kurven. Idt die beobachtete die extremste"? grafischer Test" R i Residuen y^i angepasste Werte

7 RESIDUEN UND ANGEPASSTE WERTE 102 i (b) Gleiche Varianzen: Gleitende Varianz? besser lowess für Ri gegen ŷ i. R i Wurzel abs. Residuen y^i angepasste Werte

8 4.3. VERTEILUNG DER FEHLER 103 a 4.3 Verteilung der Fehler (c) Normalverteilung? Histogramm der E i resp. Residuen R i! Die Zielgrösse Y muss nicht normalverteilt sein!

9 4.3 b 4.3. VERTEILUNG DER FEHLER 104 Raffinierter: Quantil-Quantil-Diagramm (QQ-Plot, normal plot) Geordnete Residuen Quantile der Standardnormalverteilung

10 4.3 c d 4.3. VERTEILUNG DER FEHLER 105 Abweichungen zufällig? Anpassungstest (goodness of fit test) Oder simulieren! sim.residuen sim.residuen sim.residuen sim.residuen sim.residuen sim.residuen

11 4.3. VERTEILUNG DER FEHLER Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal Quantiles of Standard Normal

12 4.3. VERTEILUNG DER FEHLER e Verteilung der Zufallsfehler!? Zufallsfehler E i Residuen R i R i = Y i ŷ i beides zufällig. ŷ i hängt von Y i, also von E i ab. f R i N 0, σ 2 (1 H ii ). H ii leverage, Hebelarm Y i Y i + y i ŷ i ŷ i + H ii y i Hebelwirkung H ii misst den Abstand" zwischen x i und x i. einfache R.: H ii = (1/n) + (x i x) 2 /SSQ (X). multiple R.: H ii = (1/n) + d x i, x 2. d: Mahalanobis-Distanz. 0 H ii 1, avei H ii = p/n.

13 4.3. VERTEILUNG DER FEHLER g Residuen standardisieren, damit sie alle die gleiche Verteilung haben: R i = R i /( σ 1 H ii ) Verwende stand. Residuen zur Überprüfung der Verteilung! Meistens ist der Unterschied der Varianzen var R i klein, deshalb genügen unstandardisierte Residuen auch.

14 4.3. VERTEILUNG DER FEHLER 109 Theoretische Verteilung der Residuen β = (X T X ) 1 X T Y ŷ = X β = X (X T X ) 1 X T Y =: HY R = Y ŷ = Y X β E R = E Y X E β = X β X β = 0 R = Y ŷ = Y HY = (I H)Y R i = (1 H ii )Y i k i H iky k var R i = σ ((1 2 H ii ) 2 + Man muss zeigen, dass k H2 ik = H ii k i H2 ik ist. Dann ist ) = σ 2 ( 1 2H ii + k H2 ik )

15 4.3. VERTEILUNG DER FEHLER 110 var R i = σ 2 (1 H ii ) bewiesen. Es ist k H2 ik = (H H T ) ii und HH T = (X (X T X ) 1 X T )(X (X T X ) 1 X T ) Das ii-element ist also H ii = X (X T X ) 1 X T = H

16 4.4. ZIELGRÖSSE TRANSFORMIEREN? Zielgrösse transformieren? a Symptome Syndrom Diagnose Therapie. Umgekehrt: Krankheit Syndrom Falsche / fehlende Transformation der Zielgrösse??? Bsp. Sprengungen: Fehlende log-transformation???

17 4.4. ZIELGRÖSSE TRANSFORMIEREN? 112

18 4.4. ZIELGRÖSSE TRANSFORMIEREN? b Syndrom: nach oben gekrümmte Glättung, nach rechts trichterförmig zunehmende Streuung, schiefe Verteilung der Residuen bis auf 1 Ausreisser nach unten. c = Transformations-Syndrom"

19 4.4 e f 4.4. ZIELGRÖSSE TRANSFORMIEREN? 114 First aid transformations Logarithmus-Transformation für Konzentrationen und Beträge, Logarithums- oder Wurzel-Transformation für Zähldaten, Arcus-Sinus-Transformation ỹ = arcsin y für Anteile (Prozentzahlen/100). sollten für solche Daten immer angewendet werden (wenn es keine Gegengründe gibt), auch für erklärende Variable! Log-Transformation macht ein multiplikatives Modell zu einem linearen: Ỹ = log 10 Y und X(j) = log10 X (j). log 10 Y i = β 0 + β 1 log 10 x (1) i + β 2 log 10 x (2) i + E i Y i = 10 β 0 x β 1 i x β 2 i 10 E i Potenzgesetz, Terme wirken multiplikativ, Fehler multiplikativ.

20 4.4. ZIELGRÖSSE TRANSFORMIEREN? g Schwierigkeit: log 0 =. Abhilfe: Ỹ = log Y + c. Wahl von c? Bitte nicht c = 1! Vorschlag: c = med Y k /s 2.9 mit s = med Y k /q 0.25 Y k h Box-Cox-Transformationen. g λ (x) = x λ 1 für λ 0, λ ln x für λ = 0. i Transformation ändert die Regressionsfunktion! Erlaubt? Hängt von der Anwendung ab! k Kann (monotone) Transformation der Zielgrösse helfen? Referenzlinie im TA-Diagramm betrachten!

21 4.5. AUSREISSER UND LANGSCHWÄNZIGE VERTEILUNG Ausreisser und langschwänzige Verteilung a Ausreisser. Beobachtungen, die schlecht zum Modell passen. b Grober Fehler? korrigieren. Wenn nichts Spezielles war, darf man Ausreisser weglassen? Ja: Voraussetzung nicht erfüllt c Langschwänzige Verteilung. Kleinste Quadrate nicht optimal. Max.lik. für langschw. Vert. weniger Gewicht für extreme Beob. Block robuste Regression.

22 4.6. RESIDUEN UND EINGANGS-VARIABLE 117 a 4.6 Residuen und Eingangs-Variable Residuen gegen X (j) auftragen! log10(ersch) ~ Stelle + log10(dist) + log10(ladung) Residuals Residuals dist ladung Oct 1,01/2:19 b Transformation von X (j)? Beachte Referenzlinie!

23 4.6. RESIDUEN UND EINGANGS-VARIABLE 118 log10(ersch) ~ Stelle + dist + ladung Residuals Residuals dist ladung Oct 1,01/2:20 c Wenn Transformation nicht hilft: quadratischer Term, oder glatte Funkt. statt linearer Glättung, Nichtparametrische Regr.

24 4.6 d 4.6. RESIDUEN UND EINGANGS-VARIABLE 119 Sind Effekte von 2 Variablen additiv? Residuen gegen 2 erkl. Var. auftragen! log(ladung) Wechselwirkung (oder besser = (x (j) i x (m+1) i log(distanz) = x (j) i x (k) i x (j) )(x (k) i x (k) )) für kontinuierl. X (j), X (k)

25 4.6. RESIDUEN UND EINGANGS-VARIABLE 120 Wechselwirkung zw. kont. Var. X (j) und Faktor X (k)? = verschiedene Steigungen β j für versch. Niveaus des Faktors. e Bessere Figur : log10(ersch) ~ stelle + log10(dist) + log10(ladung) Residuals Oct 1,01/8: dist f Varianz var E i abhängig von X (j)? gewichtete Regr.

26 4.7. GEWICHTETE LINEARE REGRESSION Gewichtete lineare Regression a Varianzen verschieden, var E i =: σ 2 i. σ i bekannt. Dann: Kleines σ i grosses Gewicht. Formal: Maximum likelihood Gewichtete Kl.Quadrate = minimiere i w ir 2 i, w i = 1/σ 2 i b σ i unbekannt, aber var E i = σ 2 v i Gewichte w i = 1/v i. σ i Funktion von x (j) i, σ 2 v x (j) i w i = 1/v x (j). i Achtung: σ i Funktion von Y i : Man darf nicht w i = 1/v Y i ) nehmen (evtl. w i = 1/v ŷ i. Nicht iterieren!)

27 4.7. GEWICHTETE LINEARE REGRESSION c β = ( X T W X ) 1 X T W Y, E βj = β j, var βj = σ 2 ( X T W X ) 1 jj. d Überprüfung der Wahl der Gewichte: Ri gegen Gewichte.

28 4.8. GESAMTHAFTE ÜBERPRÜFUNG Gesamthafte Überprüfung a Geschätzte Streuung der Fehler vergleichen mit Schätzung aus einer anderen Quelle. z.b. bekannte Mess-Ungenauigkeit σ 2. Falls Form der Regressionsfunktion falsch, d.h. z.b. wahre Regressionsfunktion ist nichtlinear, dann ist σ 2 > σ 2.

29 4.8. GESAMTHAFTE ÜBERPRÜFUNG c Falls zu jedem x i mehrere Beobachtungen Y i1, Y i2,...y ini gemacht werden = Replikate Schätzung der Streuung des Fehlers: σ 2 = 1 n g g n i i=1 h=1 SSQ (rep) : Quadratsumme der Replikate" (Y ih Y i. ) 2 = 1 n g SSQ(rep) Test mit Testgrösse T = (SSQ(E) SSQ (rep) )/(g p) SSQ (rep) /(n g) F

30 4.8. GESAMTHAFTE ÜBERPRÜFUNG 125 e Statt identischen x i benachbarte" Beobachtungen Distanz d x h, x i. Trage (R i R h ) 2 gegen d x h, x i auf. Daniel & Wood (1971/1980): d x (1) i,..., x (m) i ; x (1) h,..., x(m) h = j ( βj (x (j) i x (j) h )) 2 / σ 2

31 4.9. UNABHÄNGIGKEIT Unabhängigkeit a R i auftragen gegen Zeit, Ort, Gruppierungs-Variable. Residuen Reihenfolge

32 4.9 d 4.9. UNABHÄNGIGKEIT 127 Räumliche Abhängigkeit, Bsp. basische Böden

33 4.9. UNABHÄNGIGKEIT e* Durbin-Watson-Test. Entscheidung: Unabhängigkeit T = n i=2 (R i R i 1 ) 2 / n i=1 R2 i Verwerfung, falls T < c, Beibehaltung, falls T > c, gar nichts (unentscheidbar), falls T dazwischen liegt. f Wenn Korrelationen vorliegen, dann sind die P-Werte der üblichen Tests häufig grob falsch. Verallgemeinerte Kleinste Quadrate, Regression von Zeitreihen

34 4.10. EINFLUSSREICHE BEOBACHTUNGEN Einflussreiche Beobachtungen a Ausreisser: Haben sie wesentlichen Einfluss auf die Analyse? Sensitivitäts-Analyse" b Analyse ohne ite Beobachtung (influence) diagnostics": Veränderung von Schätzwerten, Test-Statistiken,... 2 weglassen : nicht unbedingt additive Effekte. masking", swamping".

35 4.10 c EINFLUSSREICHE BEOBACHTUNGEN 130 R i gegen H ii auftragen. Influence diagnostics nehmen zu mit R i und H ii. gefährliche" Zonen e Distanz von Cook d i = R 2 i H ii p σ 2 (1 H ii ) 2 = (1/p) R2 i H ii /(1 H ii )

36 4.10 f EINFLUSSREICHE BEOBACHTUNGEN 131 added variable plot oder partial regression leverage plot (Y j) R gegen i R (X(j) j) auftragen i Res.(log10(ersch)~log10(ladung)+Stelle) Res.(log10(dist)~log10(ladung)+Stelle)

37 4.10. EINFLUSSREICHE BEOBACHTUNGEN 132 Merkpunkte Residuen-Analyse 1. Im Tukey-Anscombe-Diagramm sieht man Abweichungen von der angenommenen Regressionsfunktion, der Gleichheit der Varianzen (Scale Plot) der Form der Verteilung der Fehler (genauer: QQ-Plot) Transformation der Zielgrösse hilft oft. 2. Residuen gegen Eingangs-Variable Transformation der E.-V. Wechselwirkungen 3. Einflussreiche Beobachtungen 4. Residuenanalyse dient der Verbesserung eines Regressionsmodells. Regression ohne Residuenanalyse ist unzulässig"!

3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m)

3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m) 3.1. MODELL UND STATISTIK 32 3 Multiple lineare Regression a 3.1 Modell und Statistik Zusammenhang zwischen einer Zielgrösse Y und mehreren Eingangsgrössen X (1), X (2),..., X (m) Y i = β 0 + β 1 x (1)

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Diagnostik von Regressionsmodellen (1)

Diagnostik von Regressionsmodellen (1) Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer

Mehr

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Ergänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen

Mehr

Einführung in die Statistik

Einführung in die Statistik Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt

Mehr

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell

Das (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell 1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind

3.1 Punktschätzer für Mittelwert µ und Varianz σ 2. Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden sind Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 3.1 3.1 Punktschätzer für Mittelwert µ und Varianz σ 2 Messungen x 1,..., x N, die unabhängig voneinander auf gleiche Weise gewonnen worden

Mehr

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden.

- Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. Normalverteilung und Standardnormalverteilung als Beispiel einer theoretischen Verteilung - Normalverteilung (Gaußverteilung) kann auf sehr viele Zufallsprozesse angewendet werden. - Stetige (kontinuierliche),

Mehr

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management

Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Regression: 4 eindimensionale Beispiele Berühmte

Mehr

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften

Mehr

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung

Mehr

Annahmen des linearen Modells

Annahmen des linearen Modells Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert

Mehr

Eine Einführung in R: Das Lineare Modell

Eine Einführung in R: Das Lineare Modell Eine Einführung in R: Das Lineare Modell Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig 6. Januar 2009 Bernd Klaus, Verena Zuber

Mehr

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management

Statistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Ausgangsdaten Bundesliga 2008/2009 Gegeben: Daten zu den 18 Vereinen der ersten Bundesliga

Mehr

Ferienkurse Mathematik Sommersemester 2009

Ferienkurse Mathematik Sommersemester 2009 Ferienkurse Mathematik Sommersemester 2009 Statistik: Grundlagen 1.Aufgabenblatt mit praktischen R-Aufgaben Aufgabe 1 Lesen Sie den Datensatz kid.weights aus dem Paket UsingR ein und lassen sie die Hilfeseite

Mehr

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften

Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Wiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung

Wiederholung Qualitätssicherung Drittvariablen. Regression II. Statistik I. Sommersemester Statistik I Regression II (1/33) Wiederholung Regression II Statistik I Sommersemester 2009 Statistik I Regression II (1/33) R 2 Root Mean Squared Error Statistik I Regression II (2/33) Zum Nachlesen Agresti: 9.1-9.4 Gehring/Weins: 8 Schumann: 8.1-8.2

Mehr

Einführung in die Varianzanalyse mit SPSS

Einführung in die Varianzanalyse mit SPSS Einführung in die Varianzanalyse mit SPSS SPSS-Benutzertreffen am URZ Carina Ortseifen 6. Mai 00 Inhalt. Varianzanalyse. Prozedur ONEWAY. Vergleich von k Gruppen 4. Multiple Vergleiche 5. Modellvoraussetzungen

Mehr

Lineare Regression 1 Seminar für Statistik

Lineare Regression 1 Seminar für Statistik Lineare Regression 1 Seminar für Statistik Markus Kalisch 17.09.2014 1 Statistik 2: Ziele Konzepte von einer breiten Auswahl von Methoden verstehen Umsetzung mit R: Daten einlesen, Daten analysieren, Grafiken

Mehr

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO

Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette

30. März Ruhr-Universität Bochum. Methodenlehre II, SS Prof. Dr. Holger Dette Ruhr-Universität Bochum 30. März 2011 1 / 46 Methodenlehre II NA 3/73 Telefon: 0234 322 8284 Email: holger.dette@rub.de Internet: www.ruhr-uni-bochum.de/mathematik3/index.html Vorlesung: Montag, 8.30 10.00

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Mathematik III - Statistik für MT(Master)

Mathematik III - Statistik für MT(Master) 3. Regressionsanalyse Fachbereich Grundlagenwissenschaften Prof. Dr. Viola Weiß Wintersemester 0/03 Mathematik III - Statistik für MTMaster 3. Empirische Regressionsgerade Optimalitätskriterium: Die Summe

Mehr

Schriftliche Prüfung (90 Minuten)

Schriftliche Prüfung (90 Minuten) Dr. M. Kalisch Probeprüfung Statistik 1 Sommer 2014 Schriftliche Prüfung (90 Minuten) Bemerkungen: Alle schriftlichen Hilfsmittel und ein Taschenrechner sind erlaubt. Mobiltelefone sind auszuschalten!

Mehr

ANalysis Of VAriance (ANOVA) 2/2

ANalysis Of VAriance (ANOVA) 2/2 ANalysis Of VAriance (ANOVA) 2/2 Markus Kalisch 22.10.2014 1 Wdh: ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor X). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich

Mehr

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale

Glossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale Glossar Statistik 2 Bivariate Verfahren: zwei nummerische Merkmale Streudiagramm - Datenpaare (X, Y) als Punkte auf einem zweidimensionale Diagramm (Ordinate: Y, Abszisse: X) Lineare Regression - Optimierungsproblem

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Spezielle Verteilungen Noémie Becker & Dirk Metzler http://evol.bio.lmu.de/_statgen 7. Juni 2013 1 Binomialverteilung 2 Normalverteilung 3 T-Verteilung

Mehr

Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben

Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben Beispiel 1: Zweifache Varianzanalyse für unabhängige Stichproben Es wurden die Körpergrößen von 3 Versuchspersonen, sowie Alter und Geschlecht erhoben. (Jeweils Größen pro Faktorstufenkombination). (a)

Mehr

Statistik Vorlesung 7 (Lineare Regression)

Statistik Vorlesung 7 (Lineare Regression) Statistik Vorlesung 7 (Lineare Regression) K.Gerald van den Boogaart http://www.stat.boogaart.de/ Statistik p.1/77 Gerade als Vereinfachung Wachstum bei Kindern height 76 78 80 82 18 20 22 24 26 28 age

Mehr

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011

Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen

Mehr

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003

Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003 Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2003. Eine seltene Krankheit trete mit Wahrscheinlichkeit : 0000 auf. Die bedingte Wahrscheinlichkeit, dass ein bei einem Erkrankten durchgeführter

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade Version 2015 Formelsammlung für das Modul Statistik 2 Bachelor Sven Garbade Prof. Dr. phil. Dipl.-Psych. Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Problem aller bisheriger Methoden: Ergebnis ist nur so gut wie das Modell selbst.

Problem aller bisheriger Methoden: Ergebnis ist nur so gut wie das Modell selbst. 2.7 Validierung durch Backtesting Problem aller bisheriger Methoden: Ergebnis ist nur so gut wie das Modell selbst. Modell besteht im Wesentlichen aus zwei Faktoren: 1. Einflussgrößen 2. Modellierungsalgorithmus

Mehr

Empirische Analysen mit dem SOEP

Empirische Analysen mit dem SOEP Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael

Mehr

Angewandte Statistik für Naturwissenschaftler

Angewandte Statistik für Naturwissenschaftler Pareys Studientexte 74 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Jose L. Lozän Hartmut Kausch Angewandte Statistik

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate

Mehr

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen

Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Wahrscheinlichkeitsrechnung und Statistik für Biologen Wiederholung: Verteilungen Noémie Becker & Dirk Metzler 31. Mai 2016 Inhaltsverzeichnis 1 Binomialverteilung 1 2 Normalverteilung 2 3 T-Verteilung

Mehr

Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen

Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Statistik, Geostatistik

Statistik, Geostatistik Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.

Mehr

Regression und Korrelation

Regression und Korrelation Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen

Mehr

Statistik II Übung 2: Multivariate lineare Regression

Statistik II Übung 2: Multivariate lineare Regression Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden

Mehr

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:

1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60

Mehr

Lehrinhalte Statistik (Sozialwissenschaften)

Lehrinhalte Statistik (Sozialwissenschaften) Lehrinhalte Technische Universität Dresden Institut für Mathematische Stochastik Dresden, 13. November 2007 Seit 2004 Vorlesungen durch Klaus Th. Hess und Hans Otfried Müller. Statistik I: Beschreibende

Mehr

Lineare Regression II

Lineare Regression II Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen

Mehr

Inhaltsverzeichnis. Vorwort 13. Teil I Beschreibende Statistik 17. Kapitel 1 Statistische Merkmale und Variablen 19

Inhaltsverzeichnis. Vorwort 13. Teil I Beschreibende Statistik 17. Kapitel 1 Statistische Merkmale und Variablen 19 Inhaltsverzeichnis Vorwort 13 Teil I Beschreibende Statistik 17 Kapitel 1 Statistische Merkmale und Variablen 19 1.1 Statistische Einheiten und Grundgesamtheiten 19 1.2 Merkmale und Merkmalsausprägungen

Mehr

Statistische Tests für unbekannte Parameter

Statistische Tests für unbekannte Parameter Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent

Mehr

Einführung in die computergestützte Datenanalyse

Einführung in die computergestützte Datenanalyse Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL

Mehr

Statistische Methoden der VWL und BWL Theorie und Praxis ST?

Statistische Methoden der VWL und BWL Theorie und Praxis ST? Statistische Methoden der VWL und BWL Theorie und Praxis ST? Vorwort 13 Teil I Beschreibende Statistik 17 Kapitel 1 Statistische Merkmale und Variablen 19 1.1 Statistische Einheiten und Grundgesamtheiten

Mehr

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller

» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller » SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela

Mehr

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik Demokurs Modul 3741 Vertiefung der Wirtschaftsmathematik und Statistik Kurs 41 Vertiefung der Statistik 15. Juli 010 Seite: 14 KAPITEL 4. ZUSAMMENHANGSANALYSE gegeben, wobei die Stichproben(ko)varianzen

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage

Statistik. Datenanalyse mit EXCEL und SPSS. R.01denbourg Verlag München Wien. Von Prof. Dr. Karlheinz Zwerenz. 3., überarbeitete Auflage Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz 3., überarbeitete Auflage R.01denbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte : Schätzung Statistik

Mehr

Medizinische Biometrie (L5)

Medizinische Biometrie (L5) Medizinische Biometrie (L5) Vorlesung III Wichtige Verteilungen Prof. Dr. Ulrich Mansmann Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie mansmann@ibe.med.uni-muenchen.de

Mehr

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung

1.8 Kolmogorov-Smirnov-Test auf Normalverteilung 1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen

Mehr

Korrelation Regression. Wenn Daten nicht ohne einander können Korrelation

Korrelation Regression. Wenn Daten nicht ohne einander können Korrelation DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 27 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 27 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.

Aufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97. Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )

Mehr

UE Angewandte Statistik Termin 4 Gruppenvergleichstests

UE Angewandte Statistik Termin 4 Gruppenvergleichstests UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Grundlagen der Statistik I

Grundlagen der Statistik I NWB-Studienbücher Wirtschaftswissenschaften Grundlagen der Statistik I Beschreibende Verfahren Von Professor Dr. Jochen Schwarze 10. Auflage Verlag Neue Wirtschafts-Briefe Herne/Berlin Inhaltsverzeichnis

Mehr

Schließende Statistik

Schließende Statistik Schließende Statistik Die schließende Statistik befasst sich mit dem Rückschluss von einer Stichprobe auf die Grundgesamtheit (Population). Die Stichprobe muss repräsentativ für die Grundgesamtheit sein.

Mehr

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS

Sozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester Statistik mit SPSS Sommersemester 2009 Statistik mit SPSS 15. Mai 2009 15. Mai 2009 Statistik Dozentin: mit Esther SPSSOchoa Fernández 1 Überblick 1. Korrelation vs. Regression 2. Ziele der Regressionsanalyse 3. Syntax für

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

2.3 Nichtlineare Regressionsfunktion

2.3 Nichtlineare Regressionsfunktion Nichtlineare Regressionsfunktion Bisher: lineares Regressionsmodell o Steigung d. Regressionsgerade ist konstant o Effekt einer Änderung von X auf Y hängt nicht vom Niveau von X oder von anderen Regressoren

Mehr

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II

Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Multiple Regression Mais-NP Zweidimensionale lineare Regression Data Display Dreidimensionale lineare Regression Multiple Regression

Multiple Regression Mais-NP Zweidimensionale lineare Regression Data Display Dreidimensionale lineare Regression Multiple Regression Multiple Regression! Zweidimensionale lineare Regression Modell Bestimmung der Regressionsebene Multiples Bestimmtheitsmaß Test des Bestimmtheitsmaßes Vertrauensintervalle für die Koeffizienten Test des

Mehr

Datenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München

Datenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse eine Einführung Klaus Diepold Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse: Für wen?! für die Wissenschaftlerin Auffinden von Zusammenhängen und Strukturen in

Mehr

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5

Inhaltsverzeichnis. Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite. 1.0 Erste Begriffsbildungen Merkmale und Skalen 5 Inhaltsverzeichnis Inhalt Teil I: Beschreibende (Deskriptive) Statistik Seite 1.0 Erste Begriffsbildungen 1 1.1 Merkmale und Skalen 5 1.2 Von der Urliste zu Häufigkeitsverteilungen 9 1.2.0 Erste Ordnung

Mehr

Informationen zur KLAUSUR am

Informationen zur KLAUSUR am Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,

Mehr

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg

Statistik I. Übungklausur. Prof. Dr. H. Toutenburg Statistik I Übungklausur Prof. Dr. H. Toutenburg Hinweis: Die Zeitangaben sollen Ihnen aufzeigen wieviel Zeit Ihnen für eine Aufgabe von gewissem Umfang eingeräumt wird. Die Punktzahlen für die einzelnen

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 26. April 2013 Prolog Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Artensterben

Mehr

Vergleich von Gruppen I

Vergleich von Gruppen I Vergleich von Gruppen I t-test und einfache Varianzanalyse (One Way ANOVA) Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Der unverbundene t-test mit homogener Varianz Beispiel Modell Teststatistik

Mehr

1. Datei Informationen

1. Datei Informationen 1. Datei Informationen Datei vorbereiten (Daten, Variablen, Bezeichnungen und Skalentypen) > Datei Dateiinformation anzeigen Arbeitsdatei 2. Häufigkeiten Analysieren Deskriptive Statistik Häufigkeiten

Mehr

Institut für Biometrie und klinische Forschung. WiSe 2012/2013

Institut für Biometrie und klinische Forschung. WiSe 2012/2013 Klinische Forschung WWU Münster Pflichtvorlesung zum Querschnittsfach Epidemiologie, Biometrie und Med. Informatik Praktikum der Medizinischen Biometrie () WiSe /3 Univariate und bivariate Verfahren Univariate

Mehr

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests

Kapitel 10 Mittelwert-Tests Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests Kapitel 10 Mittelwert-Tests 10.1 Einstichproben-Mittelwert-Tests 10.2 Zweistichproben Mittelwert-Tests 10.1 Einstichproben- Mittelwert-Tests 10.1.1 Einstichproben- Gauß-Test Dichtefunktion der Standard-Normalverteilung

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

Statistik II Übung 1: Einfache lineare Regression

Statistik II Übung 1: Einfache lineare Regression Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der

Mehr

Ein- und Zweistichprobentests

Ein- und Zweistichprobentests (c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen

Mehr

Analyse von Querschnittsdaten. Signifikanztests I Basics

Analyse von Querschnittsdaten. Signifikanztests I Basics Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004

Mehr

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.

y t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen. Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf

Mehr

Seminar zur Energiewirtschaft:

Seminar zur Energiewirtschaft: Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable

Mehr

o o o o o o o o o o o o

o o o o o o o o o o o o Klumpen-Stichproben = Cluster Sampling Obs.: Bei einer uneingeschränkten Zufallsauswahl wird pro Randomisierungs- Schritt genau eine Beobachtung gemacht. Ein ganz wesentlicher Punkt : Jedes zufällig ausgewählte

Mehr

Tests einzelner linearer Hypothesen I

Tests einzelner linearer Hypothesen I 4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen

Mehr

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von

Statistik. Datenanalyse mit EXCEL und SPSS. Prof. Dr. Karlheinz Zwerenz. R.Oldenbourg Verlag München Wien. Von Statistik Datenanalyse mit EXCEL und SPSS Von Prof. Dr. Karlheinz Zwerenz R.Oldenbourg Verlag München Wien Inhalt Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL I GRUNDLAGEN

Mehr

Statistik für Ökonomen

Statistik für Ökonomen Wolfgang Kohn Riza Öztürk Statistik für Ökonomen Datenanalyse mit R und SPSS 2., überarbeitete Auflage 4ü Springer Gabler Inhaltsverzeichnis Teil I Einführung 1 Kleine Einführung in R '! 3 1.1 Installieren

Mehr

Signalverarbeitung 2. Volker Stahl - 1 -

Signalverarbeitung 2. Volker Stahl - 1 - - 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend

Mehr