Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

Ähnliche Dokumente
Beschreibende Statistik Mittelwert

Grundgedanke der Regressionsanalyse

Lineare Regression. Stefan Keppeler. 16. Januar Mathematik I für Biologen, Geowissenschaftler und Geoökologen

Fachbereich Mathematik Prof. K. Grosse-Brauckmann D. Frisch WS 2007/08 10./ Gruppenübung

3. Lineare Algebra (Teil 2)

Lösungen zum 3. Aufgabenblock

Lineare Regression (1) - Einführung I -

2 Zufallsvariable und Verteilungen

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

1 Definition und Grundbegriffe

-70- Anhang: -Lineare Regression-

5. Gruppenübung zur Vorlesung. Höhere Mathematik 1. Wintersemester 2012/2013

3.3 Lineare Abbildungen und Matrizen

Die Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

6. Modelle mit binären abhängigen Variablen

NSt. Der Wert für: x= +1 liegt, erkennbar an dem zugehörigen Funktionswert, der gesuchten Nullstelle näher.

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Aspekte zur Approximation von Quadratwurzeln

Konkave und Konvexe Funktionen

Multilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel

Vorlesung 3 Differentialgeometrie in der Physik 13

Lineare Regression - Mathematische Grundlagen

Analysis I. Vorlesung 17. Logarithmen. R R, x exp x,

6.5. Rückgewinnung des Zeitvorgangs: Rolle der Pole und Nullstellen

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

Auswertung von Umfragen und Experimenten. Umgang mit Statistiken in Maturaarbeiten Realisierung der Auswertung mit Excel 07

Erwartungswert, Varianz, Standardabweichung

9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.

1 Differentialrechnung in mehreren Variablen

e dt (Gaußsches Fehlerintegral)

Die Jordansche Normalform

Grundlagen der Mathematik I Lösungsvorschlag zum 12. Tutoriumsblatt

Klasse : Name1 : Name 2 : Datum : Nachweis des Hookeschen Gesetzes und Bestimmung der Federkonstanten

1 Mehrdimensionale Analysis

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Für jeden reinen, ideal kristallisierten Stoff ist die Entropie am absoluten Nullpunkt gleich

18. Dynamisches Programmieren

6. Übung zur Linearen Algebra II

Elemente der Mathematik - Sommer 2016

Aufgabe 8 (Gewinnmaximierung bei vollständiger Konkurrenz):

6. Hilbertraum und lineare Operatoren (mathematische Grundlagen QM)

Stochastische Prozesse

Die hierzu formulierte Nullhypothese H lautet: X wird durch die Verteilungsdichtefunktion h(x)

Spiele und Codes. Rafael Mechtel

2.1 Einfache lineare Regression 31

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Theoretische Physik II Elektrodynamik Blatt 2

Werkstoffmechanik SS11 Baither/Schmitz. 5. Vorlesung

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

Streuungs-, Schiefe und Wölbungsmaße

Gruppe. Lineare Block-Codes

SS 2017 Torsten Schreiber

WS 2016/17 Prof. Dr. Horst Peters , Seite 1 von 9

Diskrete Mathematik 1 WS 2008/09

Konzept der Chartanalyse bei Chart-Trend.de

Netzwerkstrukturen. Entfernung in Kilometer:

Abbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).

5.3.3 Relaxationsverfahren: das SOR-Verfahren

Kapitel 8: Kernel-Methoden. Maschinelles Lernen und Neural Computation

4.5 Lemma Das folgende Problem Par{ 1, 0, 1}max p ist NP-vollständig:

Hydrosystemanalyse: Finite-Elemente-Methode (FEM)

Wissenschaftliche Nachrichten: Vol. 136/2009, 19-21

3 Elastizitätstheorie

Verteilungen, sondern nur, wenn ein. Eignet sich nicht bei flachen. Bei starker Streuung wenig. Wert eindeutig dominiert.

Methoden der innerbetrieblichen Leistungsverrechnung

Fallstudie 1 Diskrete Verteilungen Abgabe: Aufgabentext und Lösungen schriftlich bis zum

z.b. Münzwurf: Kopf = 1 Zahl = 2 oder z.b. 2 Würfel: Merkmal = Summe der Augenzahlen, also hier: Bilde die Summe der Augenzahlen der beiden Würfel!

Einführung in die Finanzmathematik

Auswertung P1-81 Elektrische Messverfahren

Übersicht der Vorlesung

Nullstellen Suchen und Optimierung

Lineare Optimierung Dualität

Weitere NP-vollständige Probleme

Leistungsanpassung am einfachen und gekoppelten Stromkreislauf

Empirische Wirtschaftsforschung

Arbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2

4. Musterlösung. Problem 1: Kreuzende Schnitte **

Stochastische Prozesse

Anhang 9. Bias in ökologischen Studien bei nichtlinearen Risikomodellen

Franzis Verlag, Poing ISBN Autor des Buches: Leonhard Stiny

Standortplanung. Positionierung von einem Notfallhubschrauber in Südtirol. Feuerwehrhaus Zentrallagerpositionierung

2πσ. e ax2 dx = x exp. 2πσ. 2σ 2. Die Varianz ergibt sich mit Hilfe eines weiteren bestimmten Integrals: x 2 e ax2 dx = 1 π.

Neuronale Netze. M. Gruber (1) ausgeloste Reiz ist x (1) = (1) (s (1) ) mit (1) (s) = 1 sgn(s 1 ) sgn(s 2 ) T. .

14 Exakte Statistik nichtwechselwirkender Teilchen

Regression und Korrelation

MOD-01 LAGRANGE FORMALISMUS -- TEIL 1

( ) γ. (t 1 ) (t 2 ) = Arg γ 2(t 2 )

Auswertung univariater Datenmengen - deskriptiv

Eine kurze Einführung in die Dichtefunktionaltheorie (DFT)

Seminar Analysis und Geometrie Professor Dr. Martin Schmidt - Markus Knopf - Jörg Zentgraf. - Fixpunktsatz von Schauder -

Übung zur Vorlesung - Theorien Psychometrischer Tests II

In der beschreibenden Statistik werden Daten erhoben, aufbereitet und analysiert. Beispiel einer Datenerhebung mit Begriffserklärungen (Vokabel)

ω 0 = Protokoll zu Versuch E6: Elektrische Resonanz

18. Vorlesung Sommersemester

Standardnormalverteilung / z-transformation

4 Die geometrische Darstellung der komplexen

3.2 Die Kennzeichnung von Partikeln Partikelmerkmale

Transkript:

Regressonsgerade x x x x 3... x n y y y y 3... y n Bem Auswerten von Messrehen wrd häufg ene durch theoretsche Überlegungen nahegelegte lneare Bezehung zwschen den x- und y- Werten gesucht, d.h. ene Gerade y = mx +b (Regressonsgerade), de de Datenpunkte möglchst gut approxmert. 3 y r = 0,84 3 4 5 x Als Abwechungsmaß kann (nach Gauss) de Summe der Quadrate der Dfferenzen Q = (mx +b y ) + (mx +b y ) +... + (mx n +b y n ) genommen werden. Herbe werden m und b so gewählt, dass Q enen klensten Wert annmmt. Q kann als Funkton der Varablen m und b betrachtet werden. Im Mnmum müssen dann de Abletungen nach b und m Null ergeben. Q(b) = (mx +b y ) De Summe erstreckt sch stets von bs n. Q (b) = (mx +b y ) = m x +nb y = 0 = y = mx+b Mttelwerte x = x, y = y n n P(x y) legt auf der Ausglechsgeraden. m st noch zu bestmmen. Um de Rechnung enfach zu halten, wählen wr den Schwerpunkt als Ursprung: d = x x e = y y b st dann Null, de Stegung hat sch ncht verändert. Q(m) = (md e ) Q (m) = (md e ) d 0 = m e d = m mn = d e m = (x x)(y y) (x x) De Glechung der Regressonsgeraden lautet daher: y = m(x x)+y regred lat. zurückschreten

Korrelatonskoeffzent Wr benötgen en Maß dafür, we stark de Datenpunkte um de Regressonsgerade streuen. Dazu rechnen wr de quadratsche Abwechung aus. Q = (e md ) m = e d = (e e md +(md ) ) = e m e +m = e ( e d ) = e ( e d ) + ( e d ) ( ) kürzen durch Je klener der Term ( e d ) st, desto größer st de Quadratsumme. Dese st Null, falls ( e d ) = e st. Da Q 0 st, folgt 0 ( e d ) e = 0 ( e d ) e Der mttlere Term heßt Bestmmthetsmaß. Gebräuchlcher st der Korrelatonskoeffzent r = e d d = e (x x)(y y) (x x) (y y) r st de Wurzel aus dem Bestmmthetsmaß und hat m Gegensatz zu desem stets dasselbe Vorzechen we de Stegung m (lecht zu sehen). Es st: r. Für r = 0 st de Stegung m auch Null. Es legt ken lnearer Zusammenhang vor, für r = und r = legen de Datenpunkte auf der Regressonsgeraden. Zu beachten st, dass en hoher Korrelatonskoeffzent ncht ene kausale Abhänggket bedeuten muss. In Excel können Ausglechsgeraden ohne Aufwand ausgegeben werden: Auf enen Datenpunkt klcken, mt rechter Maustaste Trendlne hnzufügen, Trendlne formateren, Optonen, Glechung und Bestmmthetsmaß m Dagramm darstellen.

Regressonsgerade, vektorelle Lösung Als mathematsch fruchtbar wrd es sch erwesen, das Ausglechsproblem vektorell zu lösen. Herzu betrachten wr de Quadratsumme als Skalarprodukt, dass wr kühn auf n Dmensonen verallgemenern. Wenn auch de Anschauung aufgegeben werden muss, so bleben doch de Rechenregeln (Lneartät, usw.) erhalten. Q(m,b) = mx +b y mx +b y. mx n +b y n = m x x.. x n +b. y y.. y n = [m x+b e y] OX = m x+b e kann als Ebene durch den Ursprung m n-dmensonalen Raum gedeutet werden und Q(m,b) als Quadrat des Abstandes des zum Vektor y gehörenden Punktes P zu enem Punkt der Ebene. Deser Abstand wrd mnmal (zumndest snd wr m Fall n = 3 davon überzeugt), falls der Dfferenzvektor m x + b e y orthogonal ( d. h. das Skalarprodukt st Null) zu den Rchtungsvektoren der Ebene st. (m x+b e y) x = 0 (m x+b e y) e = 0 m x +b e x y x = 0 m x e+b e y e = 0 m x +b x x y = 0 m x +bn y = 0 m x +nbx x y = 0 mx+b y = 0 y P m x+b e y Dese letzten beden Glechungen ergaben sch auch schon be der Lösung mt der Dfferentalrechnung, so dass das wetere Vorgehen dentsch st. Wr wollen noch der Frage nachgehen, we nnerhalb der Vektorrechnung gezegt werden kann, dass dese Orthogonaltäts-Schlusswese für allgemenes n zum Mnmum der Quadratsumme führt. De Tragwete deser Überlegungen wrd auf der nächsten Sete schtbar. Der Nachwes gelngt, wenn wr uns de betrachtete Ebene von zwe zuenander orthogonalen Enhetsvektoren aufgespannt denken: OX = λ a +µ b, a b, a = b = Das noch Fehlende soll m Hnblck auf Späteres etwas allgemener formulert werden. 3

Weg n de Abstrakton Se a, =...m, en Orthonormalsystem, d.h. de Vektoren haben de Länge und snd paarwese orthogonal. Wr rechnen das Quadrat des Abstands enes Punkts P zu ener Lnearkombnaton der a aus. λ a = ) = OP OP = OP = OP = = ( m λ a + λ a = λ OP a + m OP a = = ) + m = λ ) ( λ OP ) a Offenschtlch wrd das Mnmum für de Wahl von λ = OP a angenommen. Nun kann abschleßend noch der Nachwes der Orthogonaltät erbracht werden. Der Vektor, der den Fußpunkt mt dem Punkt P verbndet, = OP a ) a st orthogonal zu jedem a k und damt auch zu jeder Lnearkombnaton der a k, m Fall n = 3 also zu allen Vektoren der Ebene: = ) OP a ) a a k = Damt wurde unser Vorgehen nachträglch gerechtfertgt. OP a k OP a k = 0 Be der vektorellen Bearbetung des Ausglechsproblems haben wr uns letztendlch von der Anschauung getrennt und uns nur noch auf de rechnerschen Umformungen verlassen. Zum Verständns weterer Methoden zur Lösung von Approxmatonsproblemen, z.b. der Approxmaton ener Funkton durch ene Lnearkombnaton trgonometrscher Funktonen (Foureranalyse) st en zusätzlcher Abstraktonsschrtt erforderlch. Blcken wr noch enmal zurück und versuchen, das Wesentlche herauszustellen. Wr bewegten uns n ener Menge von Elementen (Vektoren), auf denen Rechenoperatonen und en Skalarprodukt, d.h. ene Zuordnung mt gewssen Egenschaften, defnert snd. Das Skalarprodukt legt für de Elemente des Vektorraums ene Länge (Norm), enen Abstand und ene Orthogonaltätsbezehung fest. In desem mathematschen Kontext kann zu enem Element de hm nächstlegende Lnearkombnaton enes Orthonormalsystems gefunden werden. Statt der Vektoren betrachten wr nun Funktonen auf enem Intervall [a,b]. Funktonen können addert, mt ener Zahl multplzert und auf hnen kann en Skalarprodukt defnert werden, und zwar durch: <f g> = b a f g dx, <f g> st ene von mehreren gebräuchlchen Schrebwesen. 4

Weg n de Abstrakton Das Skalarprodukt hat ene Norm f = <f g> und ene Abstandsdefnton d(f, g) = f g zur Folge. Übertrage a) f = b) f g c) f g 00 n Aussagen über Flächennhalte. Das für Approxmatonen am häufgsten verwendete Orthonormalsystem besteht aus bestmmten trgonometrschen Funktonen; es snd jedoch auch andere Systeme bestmmter Polynome bekannt. y f(x) = 4 π (snx+ 3 sn3x+ 5 sn5x) 3 4 5 6 x - y f(x) = 3 4 + 3 π (snx+ sn4x+ 3 sn6x) 3 4 5 6 x - 5