Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Ähnliche Dokumente
Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

Beschreibende Statistik Mittelwert

Analyse von Querschnittsdaten. Bivariate Regression

Grundgedanke der Regressionsanalyse

Empirische Wirtschaftsforschung

Prof. Dr. Roland Füss Statistik II SS 2008

5. ZWEI ODER MEHRERE METRISCHE MERKMALE

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

P[bk t c se(b k) k bk t c se(b k)] 1 (5.1.3)

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Statistik und Wahrscheinlichkeitsrechnung

Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D.

Statistische Methoden für Bauingenieure WS 13/14

Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D.

Ökometrie I 10 Korrelation - Regression

1.1 Beispiele zur linearen Regression

Lineare Regression - Mathematische Grundlagen

-2 Das einfache Regressionsmodell 2.1 Ein ökonomisches Modell

Ökonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte

Vorlesung: Multivariate Statistik für Psychologen

2 Zufallsvariable und Verteilungen

Lineare Regression (1) - Einführung I -

Hydrologie und Flussgebietsmanagement

Lehrstuhl für Statistik und emp. Wirtschaftsforschung, Prof. R. T. Riphahn, Ph.D. Bachelorprüfung, Praxis der empirischen Wirtschaftsforschung

Streuungs-, Schiefe und Wölbungsmaße

Erwartungswert, Varianz, Standardabweichung

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

WS 2016/17 Prof. Dr. Horst Peters , Seite 1 von 9

-70- Anhang: -Lineare Regression-

Kapitel V. Parameter der Verteilungen

6. Modelle mit binären abhängigen Variablen

Sind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)

Kapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104

Definition des linearen Korrelationskoeffizienten

Standardnormalverteilung / z-transformation

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

ANOVA (Analysis of Variance) Varianzanalyse. Statistik Methoden. Ausgangssituation ANOVA. Ao.Prof.DI.Dr Josef Haas

5 Gemischte Verallgemeinerte Lineare Modelle

Lineare Regression Teil des Weiterbildungskurses in angewandter Statistik

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Mathematische und statistische Methoden II

Rückblick Regression II: Anpassung an Polynome

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik

U Test (Rangsummentest) Parameterfreie Tests. U -Test. U -Test. χ ²- Unabhängigkeitstest Test auf Unabhängigkeit von zwei Zufallsgrößen

Lösungen zum 3. Aufgabenblock

2.1 Einfache lineare Regression 31

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

(2) i = 0) in Abhängigkeit des Zeitunterschieds x ZeitBus ZeitAuto für seinen Arbeitsweg.) i = 1) oder Bus ( y

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Übung zur Vorlesung - Theorien Psychometrischer Tests II

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)

FORMELSAMMLUNG STATISTIK (I)

Masterprüfung SS 2017

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Gauss sche Fehlerrrechnung

3 Multiple lineare Regression

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Informatik II. Minimalpolynome und Implikanten. Minimalpolynome. Minimalpolynome. Rainer Schrader. 27. Oktober Was bisher geschah: Definition

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

ISBN (Print); (PDF)

Musterklausur Wirtschaftsmathematik und Statistik. Zusatzstudium für Wirtschaftsingenieur

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr

3. Lineare Algebra (Teil 2)

Empirische Softwaretechnik Grundlagen der Statistik

Teil E: Qualitative abhängige Variable in Regressionsmodellen

ME II, Prof. Dr. T. Wollmershäuser. Kapitel 2 Das IS-LM-Modell

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayessches Lernen

20 Ordinale Regression

Aspekte zur Approximation von Quadratwurzeln

Mi , Dr. Ackermann Übungsaufgaben Gewöhnliche Differentialgleichungen Serie 13

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Übung/Tutorate Statistik II: Schließende Statistik SS 2007

Seminar über Numerische Mathematik

12 LK Ph / Gr Elektrische Leistung im Wechselstromkreis 1/ ω Additionstheorem: 2 sin 2 2

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

CHEMISCHES RECHNEN II

Regression und Korrelation

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

Stochastische Prozesse

Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler, Eidgenössische Technische Hochschule, ETH Zürich. 1. Teilprüfung FS 2008.

Statistik. M. Kriener. 15. September 2017

An dem Ergebnis eines Zufallsexperiments interessiert oft nur eine spezielle Größe, meistens ein Messwert.

Anhang 9. Bias in ökologischen Studien bei nichtlinearen Risikomodellen

Erläuterungen zur Analyse des Zinssatzswaps Referenz N//83734/5 zwischen der A/B Duegården und der Nykredit Bank A/S

Verteilungen, sondern nur, wenn ein. Eignet sich nicht bei flachen. Bei starker Streuung wenig. Wert eindeutig dominiert.

1. Teilprüfung FS 2008

Protokoll zum Grundversuch Mechanik

Multivariate Analysemethoden

Computerunterstützte Gesichtserkennung = Eigenface - Methode = Thomas Weise Betreuer: PD Dr. Oliver Ernst

Nomenklatur - Übersicht

Transkript:

Beschrebung des Zusammenhangs zweer metrscher Merkmale Streudagramme Korrelatonskoeffzenten Regresson

Alter und Gewcht be Kndern bs 36 Monaten Knd Monate Gewcht 9 9 5 8 3 4 7.5 4 3 6 5 3 6 4 3.5 7 35 5 8 8 9 3 3 0 36 3 34 4. 0. 3.5 3 30 4.5 4 5 5 4 6 9 4

Alter und Gewcht be Kndern bs 36 Monaten 6 4 0 kg 8 6 4 0 0 5 0 5 0 5 30 35 40 Monate

Korrelatonskoeffzenten Das Ausmaß des Zusammenhanges kann mt Korrelatonskoeffzenten quantfzert werden. Der Korrelatonskoeffzent legt zwschen und. Legt der Korrelatonskoeffzent nahe be... starke postve Korrelaton. 0... kene Korrelaton -... starke negatve Korrelaton.

Bespele für Korrelatonskoeffzent nach Pearson 3 3-3 - - 3-3 - - 3 - - - - -3 r = -0.86-3 r = 0.6 3 3-3 - - - 3-3 - - - 3 - - -3 r = - -3 r =

Korrelatonskoeffzent nach Pearson 3-3 - - 3 - - -3 r = 0.03

Berechnung des Korrelatonskoeffzenten nach Pearson Gegeben snd de Merkmale X und Y für n Beobachtungsenheten: X Y 3 3 4 4...... n n

Berechnung des Korrelatonskoeffzenten nach Pearson Der Korrelatonskoeffzent nach Pearson wrd mttels folgender Formel berechnet: s s r = = b s s s s s s de Standardabwechung des Merkmals X, de Standardabwechung des Merkmals Y, de Kovaranz der Merkmale X und Y s beschrebt de gemensame Streuung der - und der -Werte. s = n n ( )( ) =

Berechnung der Kovaranz 0 0 XY Y X n n ) ( ) ( ) ( ) ( ) ( ) ( n n = n ) )( ( = = n n s ) )( ( = = n n n ) (

Bsp 7-: Sparlestung n Abhänggket vom Enkommen 40 30 0 0 Sparen 0 0 0 30 40 50 60 70 80 90 Enkommen

Berechnung des Korrelatonskoeffzenten nach Pearson Fortsetzung Bespel 7.: Mttelwert und Standardabwechung für das Enkommen: µ = 39.800, s = 9.87 Mttelwert und Standardabwechung für das Sparvolumens µ =.300, s = 8.5, De Stchprobenkovaranz beträgt s = /9[(-39.8)(-.3)+ + (3-39.8)(7-.3)] = 5.78 Somt berechnet sch der Korrelatonskoeffzenten nach Pearson: 5,78 r = = 0.943 9.87 8,5

Streudagramm mt SPSS Zunächst Graphken->Streudagramm lefert Wähle Enfach und dann Defneren

Korrelaton mt SPSS Analseren->Korrelaton->Bvarat lefert

SPSS Output Korrelaton Enkommen Sparen **. Korrelatonen Korrelaton nach Pearson Sgnfkanz (-setg) N Korrelaton nach Pearson Sgnfkanz (-setg) N Enkommen Sparen,000,943** De Korrelaton st auf dem Nveau von 0,0 (-setg) sgnfkant.,,000 0 0,943**,000,000, 0 0

Korrelatonskoeffzent nach Pearson Abhänggket von Ausreßern Y 0 Y 0 - - 0 - - 0 - - - - X X r=0.00 r=0.59

Korrelatonskoeffzenten 0 8 0 8 6 6 4 4-0 -8-6 -4 - - 4 6 8 0-0 -8-6 -4 - - 4 6 8 0-4 -4-6 -8-0 r = Der Korrelatonskoeffzent gbt kene drekte Auskunft über de Stegung der Geraden (dafür haben wr Regresson). Folglch st en m statstschen Snn starker Zusammenhang ncht unbedngt en praktsch relevanter Zusammenhang. -6-8 -0 r =

Korrelatonskoeffzenten Ene statstsche Korrelaton bedeutet ncht notwendgerwese enen relevanten Zusammenhang bedeutet ncht notwendgerwese enen kausalen Zusammenhang: Es kann enen drtten Faktor geben, der de beden anderen bestmmt: Be Kndern st etwa Gewcht und de Schnellgket bem Laufen postv korrelert. kann auch auf ener Schenkorrelaton beruhen

Schenkorrelaton Quelle: http://www.phl.un-sb.de/~jakobs/semnar/vpl/epost/kausal.htm r=0.6

Mandbularbrete postoperatv - Mandbularbrete präoperatv (mm) Bvarate deskrptve Verfahren Regresson 0 5 0 5 0-5 -0-5 -0 90 00 0 0 30 40 50 Mastodbrete präoperatv (mm)

ŷ Mandbularbrete postoperatv - Mandbularbrete präoperatv (mm) Bvarate deskrptve Verfahren Regresson 0 5 0 5 0-5 -0-5 -0 90 00 0 0 30 40 50 Mastodbrete präoperatv (mm) e

Bvarate deskrptve Verfahren Regresson Geradenglechung allgemen: = k + d Regressonsgerade: ˆ = b0 + b wobe de Stegung b und der Achsenabschntt b 0 folgendermaßen berechnet werden (Andere Formel als m Buch Sete 86): b s s = r s = b 0 = b s

Regresson: Resduen Man wählt jene Gerade als Regressonsgerade für de glt, dass de Quadratsumme der Resduen am klensten st. = = = = n n e SQR ) ˆ ( st zu mnmeren! d.h. b b e = = 0 ˆ Lefert de Formeln für b 0 und b am (vgl. Buch S. 86)

Egenschaften der Resduen n = e = 0 n = e = 0 n = e (ˆ ) = 0 Man prüft de Qualtät des Modells mttels sogenannter Resduenplots

Bestmmthetsmaß Zunächst gegeben als r (legt somt zwschen 0 und ) Berechnung mttels Resduen: r = n = n = ( e ) r = Durch Regresson erklärte Varanz von Y Gesamtvaranz von Y Spelt be Mehrfachregresson ene große Rolle

Testen der Regressonsgerade bzw. des Korrelatonskoeffzenten Annahme: De Störterme e snd unabhängg und normalvertelt: N(0, b Teststatstk: T = (Sehe Buch S. 9) s b σ e Folgt ener T-Vertelung ) Alternatve: T = r n r

Testentschedung (Wederholung) Sgnfkanznveau α H 0 : b = 0, H : b 0 Entschedung für H falls T ( t) > Q n α ( ) Des entsprcht, dass p-wert < α (vgl. SPSS) Buch S. 9: Konfdenzntervalle für b

Regresson mt SPSS Analseren->Regresson->Lnear lefert Unabhängge Varable (): Enkommen Abhängge Varable (): Sparen

Regresson mt SPSS, Statstken

Regresson mt SPSS: Output Bestmmthetsmaß: Modellzusammenfassung Modell Standardf Korrgertes ehler des R R-Quadrat R-Quadrat Schätzers,943 a,889,875,8775 a. Enflußvarablen : (Konstante), Enkommen Das Ausgabefenster ANOVA st erst für Mehrfachregresson von Bedeutung, wchtg snd jetzt de Koeffzenten Modell (Konstante) Enkommen a. Abhängge Varable: Sparen Ncht standardserte Koeffzenten Koeffzenten a Standard serte Koeffzen ten 95%-Konfdenzntervall für B Standardf B ehler Beta T Sgnfkanz Untergrenze Obergrenze -3,039,6 -,430,9-7,94,863,385,048,943 7,984,000,74,497

Interpretaton des SPSS - Output De Spalte B gbt Auskunft über de Glechung der Regressonsgerade: ˆ = 3,039 + 0, 385 De Spalte T gbt de Teststatstk für b 0 (m Buch ncht durchgenommen) und b (T=7.984). Rechts davon n der Spalte Sgnfkanz befnden sch de entsprechenden p-werte. Schleßlch haben wr n den letzten beden Spalten de Konfdenzntervalle für de beden Koeffzenten. Für b erhalten wr, dass aufgrund der Daten mt 95% Wahrschenlchket de Gerade ene Stegung zwschen 0,74 und 0,497 hat.

Vorhersagen Mttels Regresson Prognose für den Mttelwert: Welchen Wert nmmt an ener Stelle m Mttel an? Indvduelle Prognose: Welchen Wert nmmt ene neue ndvduelle Beobachtung von an ener Stelle an? Zur Berechnung des Schätzers Ensetzen n Geradenglechung! Untersched legt ncht m Schätzer, sondern n der Genaugket des Schätzers Konfdenzntervalle Buch S.94 Konfdenzntervalle für den Mttelwert snd enger als für de ndvduelle Prognose