Lineare Regression (1) - Einführung I -

Lneare Regresson (1) - Enführung I - Mttels Regressonsanalysen und kompleeren, auf Regressonsanalysen aserenden Verfahren können schenar verschedene, jedoch nenander üerführare Fragen untersucht werden: We eng st und welche Rchtung hat der Zusammenhang zwschen zwe Varalen? Unterscheden sch de Mttelwerte ener Varalen n verschedenen (Tel-) Gruppen? We gut lassen sch de Werte ener Varalen durch ene oder mehrere andere Varalen vorhersagen (d.h. auf de Werte ener oder mehrerer anderer Varalen zurückführen)? Mt welchen Modellen können Zusammenhänge zwschen mehreren Varalen am esten eschreen werden? We gut passt en theoretsches Modell des Zusammenhangs zweer oder mehrerer Varalen zu den Daten? Lneare Regresson () - Enführung II - De grundlegenden Prnzpen der Regressonsanalyse lassen sch anhand der m Folgenden etrachteten enfachen lnearen Regresson darstellen. Be der enfachen lnearen Regresson kennt man den Ausprägungsgrad ener Varalen (z.b. ) und möchte den Ausprägungsgrad ener anderen Varale (z.b. ) vorhersagen. De Varale, de vorhergesagt werden soll, wrd als ahängge Varale (AV) oder als Krterum ezechnet (ülcherwese ). z.b. Gewaltenstellungen, Erfolg von Interventonsmaßnahmen, eruflcher Erfolg De Varale, de zur Vorhersage dent, wrd als unahängge Varale (UV) oder als Prädktor ezechnet (ülcherwese ). z.b. Gewalterfahrung m Elternhaus, Enndung n Peergroups, Aretsmotvaton Es soll dejenge lneare Funkton gefunden werden, de den Zusammenhang zwschen und optmal eschret. 1

Lneare Regresson (3) - Enführung III - Das konzeptuelle Modell zur Vorhersage ener ahänggen Varalen durch ene unahängge Varale st: De enfachste mathematsche Funkton zur Vorhersage st ene lneare Glechung, n der de -Werte zur Schätzung der -Werte lnear transformert werden: geschätzter Wert der Varalen a y y Wert der Varalen für den der -Wert geschätzt wrd Geschätzter Wert der Varalen wenn = 0 st ( = addtve Konstante oder ntercept ) Regressonskoeffzent = Stegung (slope) der Lne zur Vorhersage von De Rehenfolge der Indzes y an den Koeffzenten a und gt an, dass se der Vorhersage der -Werte anhand der -Werte denen: Es handelt sch her um ene Regresson von auf. Lneare Regresson (4) - Enführung IV - Der Wert y edeutet nhaltlch de durchschnttlche Veränderungsrate der - Werte pro Zunahme ener Enhet von -Werten, während der Wert a y denjengen -Wert angt, an dem de Regressonslne de y-achse schnedet: 1 a 0 Regressonsgerade mt Stegung und addtver Konstanter a

Lneare Regresson (5) - Enführung V - Vorhersage enes -Wertes anhand der Regressonsgeraden: Für enen gegeenen Wert wrd parallel zur -Achse ene Lne zur Regressonsgeraden und von dort parallel zur -Achse s zur -Achse gezogen, der Schnttpunkt gt den geschätzten -Wert : = a y + y y (,y ) e Owohl de Regressonsgerade dem Trend der Punkte m Streudagramm am esten entsprcht (nach enem estmmten Krterum, s.u.), werden.d.r. ncht alle Punkte genau auf der Geraden legen: Der Schätzfehler e der Vorhersage enes estmmten -Wertes st als Dfferenz zwschen dem tatsächlchen und dem vorhergesagten -Wert defnert: e = y. Lneare Regresson (6) - Enführung VI - Da alle anhand der Regressonsglechung vorhergesagten Werte auf der Regressonsgeraden legen, st en Gesamtmaß für den Schätzfehler der Regressonsglechung nach dem Krterum der klensten Quadrate (least squares) de Summe der quadrerten Awechungen der vorhergesagten Werte von den tatsächlchen (gegeenen) Werten. De Koeffzenten y und a y der Regressonsgeraden werden so gewählt, dass dese Summe mnmal st: ( y ) mn Dese Art der lnearen Regresson wrd wegen des Krterums der klensten Quadrate m Englschen auch als ordnary least squares regresson oder OLSregresson ezechnet. 3

Lneare Regresson (7) - Enführung VII - De Glechungen, mt denen de Koeffzenten y und a y nach dem Krterum der klensten Quadrate estmmt werden können (mathematsch mt Mtteln der Dfferentalrechnung aletar), snd: Stegung (slope) y n 1 ( ) ( y n 1 ( ) y) cov s y r s y y s Konstante (ntercept) a y y y D.h., zuerst wrd y und dann a y estmmt. De erste Varante der Glechung für y wrd enutzt, wenn Rohdaten vorlegen, de zwete und drtte Varante können enutzt werden, wenn de Kennzffern der Kovaranz und de Varanz von oder der Korrelaton und der Standardawechungen von und verfügar snd. Lneare Regresson (8) - Bespel I - kg cm Aw() Aw(y) AP(,y) AQ() AQ(y) cm ykg Nr y y ( ) ( y y) ( ) ( y y) y -_ y-y_ (-_).(y-y_) (-_)² (y-y_)² 1 187 7 8 16 64 4 170 60-9 - 90 81 0 3 180 73 1 3 3 1 9 4 184 74 5 4 0 5 16 5 178 7-1 - 1 4 6 180 70 1 0 0 1 0 7 17 6-7 -8 56 49 64 8 176 70-3 0 0 9 0 9 186 80 7 70 49 0 177 67 - -3 6 4 9 Summe: 1790 700 0 0 59 84 306 n 1790 700 179.0 y 70. 0 s 84 8.4 s y 306 30.6 s 8.4 5.39 30.6 5. 53 5.53 y 0.879 0.91 a y 70.0 0.91179.0 93. 43 5.39 s y s y r y 59 5.9 5.9 0.879 5.395.53 93.43 0. 91 4

Lneare Regresson (9) - Bespel II - 90 80 9 Gewcht (kg) y 70 8 5 3 6 4 1 60 7 93.4 0. 91 50 160 170 180 Körpergröße (cm) 190 00 Lneare Regresson () - Merkmale der lnearen Regresson I - Gt es kene Informaton, auf der de Vorhersage aseren kann, wrd der gleche Schätzwert das arthmetsche Mttel der ahänggen Varalen für jeden vorherzusagenden Fall enutzt. D.h., wenn de Korrelaton zwschen der unahänggen Varalen und der ahänggen Varalen Null st, wrd aus den Formeln für y und a y: a y y sy 0 0 s y 0 y Selstverständlch würde nemand ene Regressonsglechung zur Vorhersage enutzen, wenn Prädktor (UV) und Krterum (AV) unkorrelert wären. 5

Lneare Regresson (11) - Merkmale der lnearen Regresson II - Werden alle Werte als z-werte ausgedrückt, st der z-wert der durch de Glechung vorhergesagten Varalen glech dem z-wert der Prädktorvaralen multplzert mt der Produkt-Moment-Korrelaton von und. Da de Standardawechungen der z-werte Ens snd und de Mttelwerte Null, folgt algerasch, dass z r z y Hermt ergt sch ene wchtge Egenschaft der Regresson: Da z mt enem Wert multplzert wrd (der Korrelaton), der n realen Daten numersch mmer klener dem Betrag von Ens st, wrd der z-wert der vorhergesagten Varalen mmer näher am arthmetschen Mttel legen als der z- Wert der Varalen, auf dem de Vorhersage asert. Des st de Bass des sogenannten Regressonseffekts (Regresson zur Mtte von ). Unter anderem demonstrert de Glechung des Weteren, dass de Regressonsgerade durch den Punkt (, y) verläuft: Ist z = 0 (d.h. glech dem Mttelwert), dann st der z-wert der vorhergesagten Varalen eenfalls = 0. Lneare Regresson (1) - Merkmale der lnearen Regresson III - Je näher de Korrelaton zwschen und an Null legt, desto größer st der Vorhersagefehler. Auch wenn de Regressonsglechung den Vorhersagefehler mnmert, kann er doch zu groß sen. Ist de Korrelaton zwschen Prädktor (UV) und Krterum (AV) numersch klen (z.b. +0.07), würde de Regresson enen eträchtlchen Vorhersagefehler produzeren, wel de Korrelaton eder Varalen so gerng st. Das edeutet, dass ene Korrelaton nahe Null für praktsche Vorhersagezwecke nutzlos st, auch wenn de Korrelaton statstsch sgnfkant sen sollte (was mt jeder genügend großen Stchproe der Fall sen kann). Das Vorzechen des Korrelatonskoeffzenten hat jedoch nchts mt dem Vorhersagefehler zu tun: Korrelatonen von z.b. +0.55 und 0.55 snd glech gut für Vorhersagen, wel de Stärke des Zusammenhangs n eden Fällen glech st. 6

Lneare Regresson (13) - Merkmale der lnearen Regresson IV - De Korrelaton zwschen und jeder lnearen Transformaton von st numersch glech dem Betrag von r y. Da eenfalls nchts anderes als ene lneare Trans-formaton von darstellt, st auch de der Betrag der Korrelaton zwschen und glech dem Betrag der Korrelaton zwschen und. Wenn also der lneare Zusammenhang zwschen und schwach st (r y legt nahe Null), werden de vorhergesagten -Werte größtentels ungenau und zemlch verscheden von den tatsächlchen -Werten sen (r y wrd genauso nahe e Null legen). Ist dagegen der Zusammenhang zwschen und stark (r y st numersch groß), werden de vorhergesagten -Werte präzse und konsstent mt den tatsächlchen -Werten sen (r y wrd numersch genauso groß sen). 7