Korrelatoskoeffzet Der Korrelatoskoeffzet st e Maß für de leare Zusammehag zwsche zwe Varable X ud Y. Er st durch folgede Formel charaktersert: r xy corr XY x x y y x x y y x x y x x y y y Statstk für SozologIe Regresso
Kozept der Kovaraz ( y y) ( x x) Statstk für SozologIe Regresso
Test auf Sgfkaz Wll ma Hypothese der Form H 0 : corr=0 versus H a : corr0 (zwesetg) bzw. H 0 : corr<0 versus H a : corr>0 (esetg) teste, so ka des uter der Aahme eer - dmesoale Normalvertelug mt folgeder Statstk erfolge: r t mt Frehetsgrade r Dese Teststatstk st uter der Nullhypothese t vertelt mt - Frehetsgrade Statstk für SozologIe 3 Regresso
Bvarate Normalvertelug Statstk für SozologIe 4 Regresso
Smulato aus eer -dmesoale Normalvertelug 6 Couts 0 3 4 5 6 5 4 3 0 0 3 4 5 6 5 4 3 0 9 8 7 6 5 4 3 0 3 4 5 6 Statstk für SozologIe 5 Regresso
Bespel X Y X² XY Y² 65 68 45 440 464 63 66 3969 458 4356 3 67 68 4489 4556 464 4 64 65 4096 460 45 5 68 69 464 469 476 6 6 66 3844 409 4356 7 70 68 4900 4760 464 8 66 65 4356 490 45 9 68 7 464 488 504 0 67 67 4489 4489 4489 69 68 476 469 464 7 70 504 4970 4900 Summe 800 8 5348 5407 54849 Wr wolle de Nullhypothese teste, dass de Merkmale X ud Y ukorrelert sd. Kovaraz Sxy 484 Varaz X Sxx 06 Varaz Y Syy 467 Korrelato Rxy 0,70 Teststatstk Zähler, Neer 0,7 t 3, Tabellewert t -;0,975,3 ==> Ho ablehe Statstk für SozologIe 6 Regresso
Aderes Bespel mt SPSS Statstk für SozologIe 7 Regresso
CO Emssoe Statstk für SozologIe 8 Regresso
Nchtparametrsche Korrelato Nutzug der Ragformato! Praktsch kee Korrelato! Statstk für SozologIe 9 Regresso
Korrelato ach Spearma Statstk für SozologIe 0 Regresso
Bespel zum Effekt vo Ausreßer Statstk für SozologIe Regresso
Aalyse des Datesatzes mt Bravas Pearso Deutlch sgfkates Ergebs! Statstk für SozologIe Regresso
Elmato des Ausreßers Ke sgfkates Ergebs! Statstk für SozologIe 3 Regresso
Redukto des Skaleveaus Ke sgfkates Ergebs! Statstk für SozologIe 4 Regresso
Bespel zur Regresso Bespel Lestug kw ud Kraftstoff-Verbrauch l pro 00 km vo sebe verschedee VW-Golf Bezmotore [] kw l/00km 55 6,4 74 7,6 77 6,8 85 7,9 0 9,3 50 0,8 [] Quelle: http://www.vw-ole.de/golf/dex_.htm Statstk für SozologIe 5 Regresso
Streudagramm Streudagramm: Lestug - Verbrauch Kraftstoffverbrauch l/00km 0 8 6 4 0 0 50 00 50 00 Lestug kw Statstk für SozologIe 6 Regresso
Grudmodell Zelgröße (abhägge Varable; Regressad) Y Eflussgröße (uabhägge Varable; Regressor) X Im Bespel: Y... Kraftstoffverbrauch X... Lestug Aahme: Es besteht e fuktoaler Zusammehag zwsche de bede Merkmale: Y = f(x) Statstk für SozologIe 7 Regresso
De Regressosaalyse st e Istrumet zur Utersuchug ees fuktoale Zusammehags zwsche zwe Merkmale. Im Utersched zur Korrelatosaalyse hadelt es sch also um e gerchtetes Modell Mt der Regressosaalyse ka e fuktoaler Zusammehag erkat werde ma ee solche Bezehug statstsch achwese Art ud Größe ees Zusammehags geschätzt werde fehlede oder zuküftge Werte progostzert werde Statstk für SozologIe 8 Regresso
Dabe hadelt es sch cht um ee exakte Fukto m streg mathematsche Se Aufgrud vo Messfehler ud Zufallseflüsse werde de ezele Messuge cht dealtypsch auf dem Fuktosgraphe lege, soder zufällg abweche Wr erweter user Modell daher um ee Fehlerterm (zufällge Kompoete) e, we folgt: Y = f(x) + e Statstk für SozologIe 9 Regresso
Stochastscher Fuktoszusammehag 35 30 5 0 5 0 5 0 0 4 6 8 0 Statstk für SozologIe 0 Regresso
Leare Regresso De efachste Form ees fuktoale Zusammehages stellt ee leare Fukto dar Modellvorstellug: der Zusammehag zwsche X ud Y ka (zumdest stückwese) durch ee Grade beschrebe werde: Y = b 0 + b X + e b 0... Abstad der Gerade vom Ursprug auf der Ordate b... Stegug der Gerade Statstk für SozologIe Regresso
Learer stochastscher Fuktoszusammehag 50 40 Asteg: b 30 0 0 0 b 0 0 4 6 8 0 Statstk für SozologIe Regresso
Notato De Ausgagspukt blde Beobachtugspaare (x,y ), de wr als Datepukte eem Streudagramm vsualsere köe. X Y x y x y...... x y...... x y Statstk für SozologIe 3 Regresso
Learer stochastscher Fuktoszusammehag 50 40 30 e y yˆ y Asteg: b 0 0 0 b 0 x b0 b x 0 4 6 8 0 yˆ Statstk für SozologIe 4 Regresso
Bestmmug der Regressosgerade. Idee: Gerade so wähle, dass de SUMME aller Abwechuge mmal wrd. Nachtel: kee edeutge Lösug, da postve ud egatve Abwechuge eader aufhebe köe. y - + y b b x m! 0 x Statstk für SozologIe 5 Regresso
Bestmmug der Regressosgerade. Idee: Gerade so lege, dass de Summe des BETRAGES aller Abwechuge mmal wrd Nachtele: Mathematsch aufwädg (Betragsfukto cht zwemal dfferezerbar) hat der Praxs relatv gergere Bedeutug y b b x m! 0 Statstk für SozologIe 6 Regresso
Bestmmug der Regressosgerade 3.Idee: Gerade so lege, dass de Summe der QUADRATE aller Abwechuge mmal wrd. Klest-Quadrate-Przp De optmale Regressosgerade ergbt sch da durch Lösug folgeder Optmerug: S e y b b x m! 0 Statstk für SozologIe 7 Regresso
Statstk für SozologIe 8 Regresso Mathematsche Herletug 0 0 0 x b b y b S 0 0 x x b b y b S () y b b x 0 () xy b x b x 0 Aus b y b x 0 ach Substtuto: ˆ x x y x y x b
Iterpretato der Formel für Koeffzete Stegug der Regressosgerade: Kovaraz vo X ud Y dvdert durch de Varaz vo X bˆ x y x y x x cov( X, Y) var( X ) Abstad auf der Ordate: Leare Regressosgerade verläuft durch de Schwerpukt der Pukte bˆ 0 y bx Statstk für SozologIe 9 Regresso
Tabellarsches Recheschema Nr. X Y X X*Y Y 55 6,4 305 35 40,96 74 7,6 5476 56,4 57,76 3 77 6,8 599 53,6 46,4 4 85 7,9 75 67,5 6,4 5 0 9,3 00 03 86,49 6 50 0,8 500 60 6,64 Summe 55 48,8 5655 475,5 40,5 Mttelwert vo X: 9,83 Mttelwert vo Y: 8,3 Berechug vo b : Neer 3399,00 b = 0,05 Zähler 66,0 b 0 = 3,73 bˆ x x y x b y b x 0 x y Statstk für SozologIe 30 Regresso
Graphsche Darstellug Streudagramm: Lestug - Verbrauch Kraftstoffverbrauch l/00km 0 8 y = 0,05x + 3,73 6 4 0 40,00 60,00 80,00 00,00 0,00 40,00 60,00 80,00 Lestug kw Statstk für SozologIe 3 Regresso
Automatserte Berechug mt EXCEL Statstk für SozologIe 3 Regresso
Ergebs mt SPSS Statstk für SozologIe 33 Regresso
Regressosgerade als Istrumet zur Vorhersage Basered auf de geschätzte Parameter köe wr für ee x Wert de zugehörge y Wert schätze Progose-Szeare Wert vo x Schätzwert für y 40 5,65 Statstk für SozologIe 34 Regresso
Gefahre ud Greze der Progostk Wewet ka e learer Tred svoll fortgeschrebe werde? 5 0 5 Erkee vo Wedepukte 0 5 50 00 0 4 6 8 0 50 40 00 0 00 50 80 0 0 4 6 8 0 60 40 0 Problem vo Strukturbrüche Statstk für SozologIe 35 0 0 4 6 8 0 Regresso
Wchtge Egeschafte der Regressosgerade Fehlerausglechede Gerade e De Summe der Abwechuge vo der ach dem Kl. Quadrate Przp optmale Gerade st glech Null. 0 Regressosgerade läuft durch Schwerpukt y b0 b x Statstk für SozologIe 36 Regresso
K.Q. - Gerade geht durch de Schwerpukt 40 30 y 0 0 0 x 0 4 6 8 0 Statstk für SozologIe 37 Regresso
Varabltät der Regresso y y y ŷ P( x, y ) ŷ b0 b x ŷ y ŷ y y y y ŷ ŷ y SQT SQR y y y yˆ x e x Totale Quadratsumme der Abwechuge vom arthmetsche Mttel cht erklärte (resduale) Abwechugsquadratsumme SQE yˆ y erklärte Abwechugsquadratsumme Statstk für SozologIe 38 Regresso
Statstk für SozologIe 39 Regresso
Zerlegug der Quadratsumme SQT SQR SQE y y e yˆ y r SQE SQT y y yˆ y r = Bestmmthetsmaß Atel der erklärte Varaz a der gesamte Varaz Statstk für SozologIe 40 Regresso
Iterpretato vo r² Im Leare Modell y=a+bx st r² geau das Quadrat des Korrelatoskoeffzete r² ka Werte zwsche Null (ke Zusammehag zwsche Y ud X) ud Es (alle Pukte lege exakt auf eer Gerade) aehme Je äher r² be es legt, desto besser wrd Y durch X mttels eer leare Regresso erklärt r² st der Atel der Varato vo Y, der durch X erklärt werde ka Statstk für SozologIe 4 Regresso
Bestmmug vo r² m Bespel Nr. X Y X X*Y Y e e ŷ ( y y) ˆ y ˆ y 55 6,4 305 35 40,96 6,37 0,03 0,00 3,00 -,77 3, 74 7,6 5476 56,4 57,76 7,8 0,3 0,0 0,8-0,85 0,73 3 77 6,8 599 53,6 46,4 7,4-0,6 0,39,78-0,7 0,5 4 85 7,9 75 67,5 6,4 7,8 0,09 0,0 0,05-0,33 0, 5 0 9,3 00 03 86,49 9,00 0,30 0,09,36 0,87 0,76 6 50 0,8 500 60 6,64 0,9-0, 0,0 7,,79 7,77 Summe 55 48,8 5655 475,5 40,5 48,80 0,00 0,60 3,59 0,00,99 y y Mttelwert vo X: 9,83 Mttelwert vo Y: 8,3 Berechug vo b: Neer 3399,00 b = 0,05 Zähler 66,0 b 0 = 3,73 SQT 3,59 00,0% SQR 0,60 4,4% SQE,99 95,6% Statstk für SozologIe 4 Regresso
Iferezstatstk Es wrd ageomme, daß de Werte der uabhägge Varable feste (chtzufällge) Größe sd. Es wrd ageomme, daß sch de Beobachtuge der abhägge Varable durch ee X leare Term plus eer zufällge Störkompoete ergebe. Über de Störkompoete werde folgede Aahme getroffe Kee systematsche Störug, d.h. Erwartugswert st ull E(e ) = 0 Kostate Streuug der Störkompoete Var(e ) = cost. De Störuge sd uabhägg voeader Cov(e, e j ) = 0 De Störkompoete se ormalvertelt mt Erwartugswert 0 ud der Varaz ² Statstk für SozologIe 43 Regresso
Modellaahme De bedgte Dchte vo Y für gegebee Wert vo X uterschede sch ur hrem Erwartugswert Statstk für SozologIe 44 Regresso
Sgfkaz der Regressosbezehug Frage st der Atel der erklärte Varaz sgfkat? Atwort: F-Test Erklärte durch chterklärte mttlere Quadratsumme (das st de Quadratsumme durch de Zahl der Frehetsgrade dvdert) Dese Prüfgröße st F-vertelt mt ud - Frehetsgrade F SQE / SQR /( ) r / ( r ) /( ) Statstk für SozologIe 45 Regresso
Durchführug des Tests ANOVA (Aalyss of Varace) Frehetsgrade (df) Quadratsumme (SS bzw. SQ) Mttlere Quadratsumme Prüfgröße (F) P-Wert Regresso,990,990 86,95 0,0007 Resdue 4 0,603 0,5 Gesamt 5 3,593 r²= 0,956 (-r²)= 0,044 (-r²)/4= 0,0 Statstk für SozologIe 46 Regresso
Schätzug vo ² De Schätzug der ubekate Varaz der Störkompoete st de Voraussetzug für Iferez über de Parameter bzw. für Kofdeztervalle für Progosewerte. Naheleged st de achstehede Formel (E(e)=0!) ˆ e De postve Quadratwurzel führt zum Stadardfehler der Resdue (Resdual Stadard Error) Statstk für SozologIe 47 Regresso
Kofdeztervalle ud Tests für Regressoskoeffzete Schätzug der Varaz der Regressoskoeffzete ˆ ˆ x ˆ b 0 ( x x) b ˆ ( x x) Iterpretato: Be große Werte vo x st de Varabltät der Kostate ceters parbus größer. Je stärker de x-werte streue, desto gerger st ceters parbus de Streuug beder Koeffzete Statstk für SozologIe 48 Regresso
Test für de Regressoskoeffzete Nullhypothese: b =0 Koeffzet Stadardfehler t-statstk P-Wert b 0 3,73 0,500 7,465 0,007 b 0,048 0,005 9,84 0,0007 ˆ 0,60 / 4 0,5 Iterpretato: ( x x) x x 56.55 6 9,83 5.654,8 ˆ b 0, 005 0,5 5.654,8 b 0 =0... Geht de Regresso durch de Ursprug? b=0... Ist de Stegug sgfkat vo Null verschede? Das etsprcht m Fall der Efachregresso der zuvor dskuterte Fragestellug: Ist der Atel der erklärte Varaz sgfkat? Hwes: Vergleche de p-value für de Stegug mt dem F-Test Statstk für SozologIe 49 Regresso
Kofdeztervall für de durchschttlche Progosewert T Ŷ E(Y S Ŷ ) t-vertelt mt - Frehetsgrade P(Ŷ ts E(Y ) Ŷ ts ) Ŷ Ŷ Für ee kokrete Stchprobe ergbt sch damt das folgede Kofdeztervall für de durchschttlche Progosewert (Vertrauestervall) ŷ ts Ŷ E(Y ) ŷ Ŷ ts mt ŷ b 0 b x ud s Yˆ ˆ ( x x) j ( x x) j Statstk für SozologIe 50 Regresso
Progosetervall für dvduelle Progosewert Y T Ŷ Y S F t-vertelt mt - Frehetsgrade P(Ŷ ts Y Ŷ ts ) F F Aus eer kokrete Stchprobe ergbt sch somt das folgede Kofdeztervall für de Progose ees bestmmte Ezelwertes a der Stelle x : ŷ ts F Y ŷ ts F mt ŷ b 0 b x ud s F ˆ ( x x) j ( x x) j Statstk für SozologIe 5 Regresso
Awedug m Bespel Progosetervall für Ezelwerte (dvduelle Progosewerte) x S F Progose UG OG se 0,388 50 0,477 6,88 4,887 7,437843 t:,78 55 0,4604 6,36793 5,089596 7,64664 60 0,4504 6,60758 5,35737 7,85808 65 0,446 6,8473 5,69 8,07333 70 0,434 7,08687 5,8836 8,949 75 0,48 7,365 6,3756 8,55479 80 0,437 7,5667 6,389658 8,74677 85 0,408 7,8058 6,637483 8,97447 90 0,494 8,04546 6,880947 9,09979 95 0,496 8,85 7,0006 9,4504 00 0,44 8,5476 7,354668 9,694847 05 0,448 8,7644 7,584988 9,9438 0 0,497 9,00405 7,8069 0,9704 5 0,4360 9,437 8,03305 0,45435 0 0,4438 9,48335 8,53 0,7558 Statstk für SozologIe 5 Regresso
Vertraues- ud Progosetervall Kraftstoffverbrauch l/00km 0 5 0 5 0 Vertrauestervall Progosetervall 50 00 50 00 Lestug kw Statstk für SozologIe 53 Regresso