Regression und Korrelation

Ähnliche Dokumente
Beschreibende Statistik Mittelwert

Grundgedanke der Regressionsanalyse

Lineare Regression - Mathematische Grundlagen

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Sind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)

Lineare Regression (1) - Einführung I -

Aufgabenkomplex 2: Umrechung von Einheiten, Ungleichungen, Komplexe Zahlen

e dt (Gaußsches Fehlerintegral)

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Versuch Nr. 6. Chemische Kinetik Aktivierungsenergie (Inversion von Saccharose)

Lösungen der Aufgaben zu Kapitel 2

2 Zufallsvariable und Verteilungen

Aspekte zur Approximation von Quadratwurzeln

-70- Anhang: -Lineare Regression-

1.Schularbeit 22.Okt A. A) Berechne ohne TI-92: Beachte: Für die Beispiele 1 und 2 sind alle notwendigen Rechenschritte anzugeben.

Computerunterstützte Gesichtserkennung = Eigenface - Methode = Thomas Weise Betreuer: PD Dr. Oliver Ernst

Definition des linearen Korrelationskoeffizienten

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

Sei T( x ) die Tangente an den Graphen der Funktion f(x) im Punkt ( x 0, f(x 0 ) ) : T( x ) = f(x 0 ) + f (x 0 ) ( x - x 0 ).

5. Gruppenübung zur Vorlesung. Höhere Mathematik 1. Wintersemester 2012/2013

NSt. Der Wert für: x= +1 liegt, erkennbar an dem zugehörigen Funktionswert, der gesuchten Nullstelle näher.

Auswertung univariater Datenmengen - deskriptiv

1.11 Beispielaufgaben

Lösungen zum 3. Aufgabenblock

Manhattan-Metrik anhand des Beispiels

Kryoskopie. Gruppe 15: Markus Krause, Tobias Nigst Ziel

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

Klasse : Name1 : Name 2 : Datum : Nachweis des Hookeschen Gesetzes und Bestimmung der Federkonstanten

Auswertung univariater Datenmengen - deskriptiv

Protokoll zu Versuch C1-Mischungsvolumina

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

c) schwierige freiwillige Zusatzaufgabe (ohne Bonuspunkte): Leiten Sie die allgemeinen iterativen Formeln für S, D, D R und V her.

Standardnormalverteilung / z-transformation

WS 2016/17 Prof. Dr. Horst Peters , Seite 1 von 9

Konzept der Chartanalyse bei Chart-Trend.de

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

Das zum dualen Problem (10.2) gehörige Barriere-Problem lautet analog

Konkave und Konvexe Funktionen

Rückblick Regression II: Anpassung an Polynome

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik

3. Lineare Algebra (Teil 2)

2.1 Einfache lineare Regression 31

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Resultate / "states of nature" / mögliche Zustände / möglicheentwicklungen

18. Vorlesung Sommersemester

Physikalisches Praktikum

Komplexe Zahlen. Teil 2. Darstellung der komplexen Zahlen. als Vektoren mit Polarkoordinaten trigonometrisch oder exponentiell. Eulersche Funktion E

Streuungs-, Schiefe und Wölbungsmaße

Erwartungswert, Varianz, Standardabweichung

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Prof. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

Empirische Wirtschaftsforschung

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

Komplexe Zahlen. Teil 1. Grundrechenarten. Darstellung in der Gaußschen Zahlenebene. Datei Nr Friedrich Buckel. Stand 23.

1 Definition und Grundbegriffe

In der beschreibenden Statistik werden Daten erhoben, aufbereitet und analysiert. Beispiel einer Datenerhebung mit Begriffserklärungen (Vokabel)

Portfoliothorie (Markowitz) Separationstheorem (Tobin) Kapitamarkttheorie (Sharpe

Hauptprüfung Abiturprüfung 2014 (ohne CAS) Baden-Württemberg

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Formeln und Aufgaben zur Rentenrechnung

Formeln und Aufgaben Zins- und Rentenrechnung

Lösungen aller Aufgaben und Lernkontrollen

Analyse von Querschnittsdaten. Bivariate Regression

Erläuterungen zur Analyse des Zinssatzswaps Referenz N//83734/5 zwischen der A/B Duegården und der Nykredit Bank A/S

Übungen zur Vorlesung Physikalische Chemie 1 (B. Sc.) Lösungsvorschlag zu Blatt 2

ME II, Prof. Dr. T. Wollmershäuser. Kapitel 2 Das IS-LM-Modell

(Essentiell) τ-äquivalente Tests:

Bedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)

Diskrete Mathematik 1 WS 2008/09

1 Mehrdimensionale Analysis

Experimentalphysik II (Kip SS 2007)

3.3 Lineare Abbildungen und Matrizen

6. Übung zur Linearen Algebra II

SIMULATION VON HYBRIDFAHRZEUGANTRIEBEN MIT

Multivariate Analysemethoden

FORMELSAMMLUNG STATISTIK (I)

Grundlagen der Mathematik I Lösungsvorschlag zum 12. Tutoriumsblatt

Theoretische Physik 2 (Theoretische Mechanik)

Statistik und Wahrscheinlichkeitsrechnung

Theoretische Physik II Elektrodynamik Blatt 2

Auswertung von Umfragen und Experimenten. Umgang mit Statistiken in Maturaarbeiten Realisierung der Auswertung mit Excel 07

Schätzfehler in der linearen Regression (1) Einführung

Bestimmung der Elementarladung nach Millikan. 1. Theorie zum Versuchs. F R = 6 $ $ $ r $ v. $ g. F s = 4 3 $ $ r 3 $ Öl.

Mi , Dr. Ackermann Übungsaufgaben Gewöhnliche Differentialgleichungen Serie 13

Kapitel 5 Systeme von Massenpunkten, Stöße

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

4. Musterlösung. Problem 1: Kreuzende Schnitte **

Informatik II. Minimalpolynome und Implikanten. Minimalpolynome. Minimalpolynome. Rainer Schrader. 27. Oktober Was bisher geschah: Definition

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

Mathematik für das Ingenieurstudium

Verteilungen, sondern nur, wenn ein. Eignet sich nicht bei flachen. Bei starker Streuung wenig. Wert eindeutig dominiert.

Physikalisches Anfängerpraktikum Teil 2 Versuch PII 33: Spezifische Wärmekapazität fester Körper Auswertung

( ) γ. (t 1 ) (t 2 ) = Arg γ 2(t 2 )

Transkript:

Regresson und Korrelaton von Ac Enstegsaufgabe lneare Regresson: Durch de 3 Punkte P/, P4/5, P39/6 st ene Mn-Punktwolke gegeben. Gesucht st dejenge Gerade g, welche n der Nähe der Punkte verläuft und de durch de Punkte vorgegebene Tendenz öglchst gut wedergbt. Erster Schrtt: Der Schwerpunkt der Punkte st S5/4. Begründung? Es acht Snn, de gesuchte optale Gerade g durch desen Schwerpunkt laufen zu lassen. Sot st nur noch de Stegung von g unbekannt. Aufgabe: Zechne de 3 Punkte en und zusätzlch ene Gerade durch den Punkt S5/4 t 0,5. We wet legen de Daten von der Gerade g entfernt?? Überlege dabe: We könnte an ene Sue der Entfernung der Punkte von g berechnen? Erweterungen: Löse de obge Aufgabe auch t den Geradenstegungen und 0,3. Welches Modell st bsher a besten? Begründe, dass für jede Gerade g durch den Punkt S glt: -5 + 4 Ausblck: We könnte an zu ener optalen Geraden koen? Welche Stegung könnte dese haben? We löst der Grafkrechner TI83 dese Aufgabe? ------------------------------------------------ Das Bespel Punktwolke aus 3 Punkten stat von http://www.helholtz-b.de/..., wurde jedoch von r koplett neu bearbetet.

Lösungshnwese: 0,5: : 0,5+,5 De vertkalen Entfernungen der Punkte von g egnen sch u.a. als Grundlage für de gesuchte Abstandssue : Sue,5- + 5-3,5 + 0 3 Zusatzaufgabe : Alternatve : : - Alternatve 0,3: 0,3+,5 Sue 0 + 5-3 + 8-6 4 Sue 3,- + 5-3,7 + 6-5, 4, Das Modell t 0,5 st bsher a besten! Zur Zusatzaufgabe : -5 + 4 ergbt sch aus der Punktstegungsfor be gegebene Punkt S5/4. Dese For lautet 4 bekanntlch, Setzt an nun 5 und 4, so ergbt sch, also -5-4 und 5 sot de obge Geradenglechung! Zu Ausblck : Ene optale Gerade ergbt sch daraus, dass an das Mnu der Sue der Abstände sucht, also en Proble der Analss. Ob der oben berechnete Wert von 3 wrklch das Mnu st lässt sch ncht voraussagen. Man üsste erst alle Geraden t -5 + 4 ausproberen oder wesentlch besser en relatves Mnu der Suenfunkton der Abstände besten sehe unten! Der TI83 bestzt bekanntlch en Regressonsenü über STAT CALC zu errechen: Verwendet an LnReg a+b, so erhält an 0,6538 + 0,93 Offenschtlch geht dese Gerade auch durch S5/4, jedoch st de Stegung ene ganz andere als be den obgen 3 Bespelen.

Zusatznforaton: Waru verwendet an ncht de Abstände Lote der Punkte von der Geraden zur Bestung ener Regressonsgeraden? Man üsste dann das Mnu der Sue deser Abstände für alle öglchen Kobnatonen von und b suchen. Des st rechnersch zelch aufwändg, wel an den jewelgen Lotfußpunkt benötgt! Durchführung der Berechnung der Lote: Wenn de erttelte Gerade de For +b bestzt, so hat de Lotgerade durch P ; de Glechung - +. Schnedet an bede Geraden, so erhält an +b - - + und sot + + + - b + - b s + + -b + Mt s s +b erhält an den jewelgen Abstand nach Pthagoras: d s + s Für obges Bespel t 0,5+,5 ; also 0,5 und b,5 : 0,8 + 0,4 + P;: s,6-0,,4 s 0,7+,5, d,4 +,, 8,34 P4;5: s 3,+,4 4,6 s,3+,5 3,8 d 4 4,6 + 5 3,8, 8,34 P39;6: s 7,+,8 9,0 s 4,5+,5 6,0 d 9 9 + 6 6 0 Als Sue der Abstände erhalten wr : Σ,68 Des st deutlch wenger als be der Sue der vertkalen Entfernungen 3! Info: Ene Merungsrechnung st llusorsch, wel der Analss-Aufwand unvertretbar wäre!

Erläuterung der TI83-Regressonsethode a Bespel der Daten P/, P4/5, P39/6 : Der TI83 berechnet ncht das Mnu der Sue der Entfernungen der Datenpunkte von der Geraden, sondern das Mnu der Sue der Quadrate der Entfernungen der Datenpunkte von der Geraden. Der Grund legt darn, dass an Quadrate besser ableten kann als Beträge solche würden entstehen be der Bldung der bloßen Entfernung, wel de Entfernung stets postv sen uss!. De Vorgehenswese st de folgende: Berechnen der Mttelwerte und Koordnaten des Schwerpunktes S der Daten, : + 4 + 9 + 5 + 6 Für obge Daten glt 5 sowe 4 3 3 De Geradenglechung st dann -5 + 4. Quadrate der vertkalen Entfernungen der Datenpunkte bezüglch g berechnen: Für bestzt g den -Wert -5 + 4, also -3+4. P hat den -Wert. Dfferenz -3+4- -3+3. Quadrert an desen Wert, so ergbt sch 9-8+9. Ebenso erhält an für P de quadrerte Entfernung -+4-5 ++ und für P3: 4+4-6 6-6+4. 3 Suert an alle Entfernungsquadrate, so ergbt sch de Sue SEQ 6-3+4. SEQ bedeutet: Sue der Entfernungsquadrate Man erkennt ene quadratsche Funkton Parabel für de Varable. 3 8 Das Mnu deser quadratschen Funkton legt be 0, 6538 5 3 Mt dese optalen lautet dann de Geradenglechung 3 8-5 + 4 bzw. ugefort 8 +. Des entsprcht de Ergebns des TI83! 3 3 Das vertkale Entfernungsnu SEQ st übrgens dann SEQ 6-3+4 54 3 4,5

Betrachtung des horzontalen Entfernungsnus: Das Enführungsbespel se weder zu Grunde gelegt De Geradenglechung t Schwerpunkt S st dann weder -5 + 4. Gesucht st. Benötgt wrd de Ukehrfunkton g I 4 + 5, wel gegeben und von g gesucht st. Nun werden de Quadrate der horzontalen Entfernungen der Datenpunkte bezüglch g berechnet : 4 3 P/: g + 5, also + 5. Des st der -Wert auf der Geraden bzgl. P. 3 3 Da P den -Wert bestzt, berechnet sch de Dfferenz der -Werte zu + 5- + 3. 9 8 Quadrert an desen Wert, so ergbt sch + 9 horz. Abwechungsquadrat für P P4/5: g 5 4 + 5, also 5 +. Das horz. Abwechungsquadrat für P berechnet sch zu + 5-4 + + + P39/6: Horz. Abwechungsquadrat + 5-9 4 4 6 + 6 4 3 Suert an alle Entfernungsquadrate, so ergbt sch de Sue SEQ + 6. SEQ bedeutet: Sue der Entfernungsquadrate Das Mnu deser gebr. rat. Funkton legt be 8 7 0, 875 sehe Grafk rechts 3 8 Mt dese optalen horzontal lautet dann de Geradenglechung 8 7-5 + 4 bzw. ugefort 7 3 horz. Regr.gerade 8 8 nach aufgelöst: 7 8 + 7 3 Das horzontale Entfernungsnu st dann 4 3 7 + SEQ 7 7 8 8 8 6 54 7 7,7 horz. Grafk für de horzontale Regressonsgerade :

De beden optalen Geraden Verglech :

Allgeene Foreln zur Berechnung der beden Regressonsgeraden Gegeben seen n Datenpaare und :.Fall: Gesucht snd Regressonsgeraden der For +b Dann gelten: n und n. Schwerpunktes S der Punktwolke : S / Regressonsgerade bezüglch : Betrachtung vertkaler Entfernungen der Noralfall b Geradenglechung: + b + vertkale Geradenglechung Regressonsgerade bezüglch : Betrachtung horzontaler Entfernungen b Geradenglechung: + b b Verenfachung: + horzontale Geradenglechung Alternatv könnte an auch de und vertauschen und dann nach der Methode bezüglch de Geradenglechung der Ukehrfunkton + b besten und dese nach auflösen. Korrelatonskoeffzent r : r bzw. r Anerkung: Der Ter n heßt Kovaranz! De Kovaranz st en Maß für den Zusaenhang zwschen den Merkalen und..fall: Der Spezalfall b 0 : Der Schwerpunkt st dann der Ursprung 0/0, wel sch dort de beden Geraden treffen! Mt 0 und 0 folgt dann aus den obgen Foreln: Vertkal: Horzontal: Korrelatonskoeffzent: r

Tabellarsche Rechnung anuell für das Enführungsbespel: Erst vertkal - - - - - -3-3 9 9 4 5 - - 3 9 6 4 8 6 Sue 5 6 6 5 5 3 4 3 6 8 8 8 b 4-5 Ergebns: + 6 3 3 3 3 3 Dann horzontal : - - - - - -3-3 9 9 4 5 - - 3 9 6 4 8 4 Sue 5 6 4 5 5 3 4 3 6 8 4 7 8 3 b 5-4 7 7 8 3 Zwschenergebns: + 7 7 Ugefort nach : Endergebns: 7 3-8 8

Aufgabe zu Thea Regressonsgerade Arbetsblatt: De Körpergröße und das Körpergewcht von 0 Schülern wurde bestt : Größe n c Gewcht n kg 55 47 57 47 59 50 63 55 64 5 67 54 68 58 70 53 7 6 76 65 Wr nehen enen lnearen Zusaenhang zwschen Größe und Körpergewcht an: Das Koordnatensste uss.quadranten zunächst skalert werden: -Achse: Achsenkreuz 40c und dann 5c je Skalenzenteter. also 40 bs 90 -Achse: Achsenkreuz 40kg und dann 5kg je Skalenzenteter. also 40 bs 70 a Trage de entsprechenden Punkte n das Koordnatensste en und beste den Schwerpunkt S der Punktwolke. b Zechne dejenge Gerade en, welche durch S und durch P60/50 verläuft und beste hre Glechung. c Beste - das zur Körpergröße 55c gehörende Körpergewcht, - de zu Körpergewcht 60kg gehörende Körpergröße. d Beste t de TI83 ene Regressonsgerade für obge Daten und beantworte nun nochals c. e Beste ene Regressonsgerade bzgl. der horzontalen Mna TI83. Zechne dese und de n d bestte Regressonsgerade n das Koordnatensste en. Welche Interpretaton lassen dese beden Geraden zu? Lösungen:

Lösungen: Grafk zu a und e TI83-Entragungen: STAT CALC -Var Stats ENTER lefert a Schwerpunkt S65, / 54,; sehe, rechts. b Gerade durch S und P60/50: 54, 50-50 -60 0,8359-8,76 65, 60 c Zu 55c gehört 45,9 kg und zu 60kg gehört 7, c [ über Tabelle! ] STAT CALC 4 ENTER lefert d vertkal: 0,795 76,475 sehe LnReg Zu 55c gehört 46, kg und zu 60kg gehört 7,4 c [ über Tabelle / Solver! ] e horzontal: zunächst,06937+07,4 sehe LnReg Dann auflösen: 0,935 00,89 STAT CALC 4 L,L ENTER lefert Grafk sehe oben Interpretaton: Sowohl de ene we auch de andere Gerade könnte optal sen.

Der Korrelatonskoeffzent r De Mnerung der Abwechungsquadrate n vertkaler bzw. horzontaler Rchtung führt Allgeenen zu verschedenen Ausglechsgeraden. Dese können nur dann überensten, wenn alle Punkte der Punktwolke berets auf ener der Geraden legen. In dese Fall besteht zwschen den Merkalen und en vollständger lnearer Zusaenhang. Je stärker de Punkte ener Punktwolke ausenanderdrften, desto größer wrd der Wnkel zwschen den beden Regressonsgeraden sen; Etrefall 90! Korrelaton st en Maß dafür, we stark de Merkalswerte Daten von de gewählten Regressonsodell z.b. Regressonsgerade abwechen. Man defnert den Betrag der Korrelaton r als Verhältns Antel der Standardabwechung, de durch das Regressonsodell festgelegt st zur Standardabwechung, de durch de Daten gegeben st, kurz r s s Modell Daten Her gelten: s Daten 8 + Regressonsgerade 3 3 4 3 s Modell 8 3 3 De Grafk erläutert bespelhaft für 3 Punkte P/, P4/5, P39/6, was unter s Modell und s Daten zu verstehen st. Dabe werden zunächst de Quadrate der vertkalen Abwechungen der Daten vo Schwerpunkt S betrachtet rot und hre Flächennhalte aufsuert. Telt an dese Sue durch se Anzahl der Daten her 3 und zeht dann de Wurzel, so ergbt sch de ene der beden Standardabwechungen s Daten! Entsprechend geht an vor be der Bestung von s Modell. Dort werden de Quadrate der vertkalen Abwechungen des Modells Gerade vo Schwerpunkt S betrachtet blau. Begründung der beden Ergebnsse: Für de roten Quadrate kann an de Sue der Flächennhalte a Grafkraster ablesen 4 Enheten. Für de blauen Quadrate rechnet an so: 8 8 8 Sue der Flächennhalte + 4 + 4 + 4 + 9 + 4 8 9,85 3 3 3 3 3 3 3 Telt an jetzt s Modell durch s Daten, so erhält an r 64 9 0,8386

Allgeene Forulerungen zur Berechnung des Korrelatonskoeffzenten: De Abwechung des Modells her: Gerade vo Schwerpunkt S st : De Abwechung der Daten P vo Schwerpunkt S st : a + b - - Berechnet an de Sue der Quadrate deser Abwechungen für alle Daten, so erhält an: Quadratsue Modellabwechugen a + b Quadratsue Datenabwechugen Für de Standardabwechungen s erhält an dann: s Modellabwechugen a + b s Datenabwechugen n n Da r als Quotent der beden Größen defnert st ergbt sch verenfacht: r a + b Anerkung: Für fallende Geraden als Modell wrd r als negatv defnert, sonst postv!! Be lnearer Regresson legt r Berech [- ; ] s. oben: r kann auch negatv sen. Je näher der Betrag von r de Wert kot, u so besser st das Modell. Bezug zu den beden öglchen Regressonsgeraden: Hat an de beden Stegungen v und h bzgl. der vertkalen und der horzontalen Entfernungsaa bestt, so lässt sch r auch auf andere Wese ganz enfach ertteln. r st dann glech de geoetrschen Mttel der beden Zahlen v und h, also r. Achtung: h st der Stegungswert der Ukehrfunkton t + b!! 8 Für das Enführungsbespel galt: v 3 8 h 7. 8 8 64 Dann st r 0, 8386 3 7 9 Be lnearer Regresson glt dann: r Für das Enführungsbespel t ; 4; 3 9 ; 5; 3 6 st r [ 5 5 + 4 5 9 + 8 [9 + + 6] [9 + + 4 + 4 + 9 4] 55 4 + 5 ] [ 4 6 6 4 9 56 + 5 4 6 364 4 + 6 4 ] 0,8386 vgl. Ergebns oben

Bewertung des Zusaenhangs der Korrelaton zwschen Größen: - r<-0,8 oder 0,8<r starke Korrelaton -0,8 r<-0,3 oder 0,3<r 0,8 schwache Korrelaton -0,3 r 0 oder 0 r 0,3 kene Korrelaton De Grafken snd ledglch wllkürlch gewählte Bespele! Anerkung: In der Lteratur fndet an auch noch andere Klassfzerungen der Korrelaton! Der Korrelatonskoeffzent be TI83: r st be TI83 ncht ohne weteres schtbar, kann aber nachgerüstet werden. Erst CATALOG nd 0 wählen, dann dort zu DagnostcOn und ENTER ENTER drücken. Von jetzt ab wrd r er zusaen t der Regressonsfunkton angezegt.