Lineare Regression (1) - Einführung I -



Ähnliche Dokumente
4. Musterlösung. Problem 1: Kreuzende Schnitte **

FORMELSAMMLUNG STATISTIK (I)

12 LK Ph / Gr Elektrische Leistung im Wechselstromkreis 1/ ω Additionstheorem: 2 sin 2 2

Funktionsgleichungen folgende Funktionsgleichungen aus der Vorlesung erhält. = e

Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):

Polygonalisierung einer Kugel. Verfahren für die Polygonalisierung einer Kugel. Eldar Sultanow, Universität Potsdam,

nonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen

Grundgedanke der Regressionsanalyse

6. Modelle mit binären abhängigen Variablen

Einführung in die Finanzmathematik

1 Definition und Grundbegriffe

Produkt-Moment-Korrelation (1) - Einführung I -

Methoden der innerbetrieblichen Leistungsverrechnung

d da B A Die gesamte Erscheinung der magnetischen Feldlinien bezeichnet man als magnetischen Fluss. = 1 V s = 1 Wb

Statistik und Wahrscheinlichkeit

Ich habe ein Beispiel ähnlich dem der Ansys-Issue [ansys_advantage_vol2_issue3.pdf] durchgeführt. Es stammt aus dem Dokument Rfatigue.pdf.

wird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:

Nernstscher Verteilungssatz

Netzwerkstrukturen. Entfernung in Kilometer:

Beschreibende Statistik Mittelwert

5. ZWEI ODER MEHRERE METRISCHE MERKMALE

18. Dynamisches Programmieren

1 - Prüfungsvorbereitungsseminar

Praktikum Physikalische Chemie I (C-2) Versuch Nr. 6

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

2. Nullstellensuche. Eines der ältesten numerischen Probleme stellt die Bestimmung der Nullstellen einer Funktion f(x) = 0 dar.

Ionenselektive Elektroden (Potentiometrie)

Daten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.

Franzis Verlag, Poing ISBN Autor des Buches: Leonhard Stiny

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen

Gruppe. Lineare Block-Codes

Free Riding in Joint Audits A Game-Theoretic Analysis

Nomenklatur - Übersicht

I, U : Momentanwerte für Strom und Spannung I 0, U 0 : Scheitelwerte für Strom und Spannung

Lösungen zum 3. Aufgabenblock

1 BWL 4 Tutorium V vom

Für jeden reinen, ideal kristallisierten Stoff ist die Entropie am absoluten Nullpunkt gleich

Maße der zentralen Tendenz (10)

Netzsicherheit I, WS 2008/2009 Übung 3. Prof. Dr. Jörg Schwenk

Multiple Regression (1) - Einführung I -

Grundlagen der makroökonomischen Analyse kleiner offener Volkswirtschaften

4. Ratenmonotones Scheduling Rate-Monotonic Scheduling (LIU/LAYLAND 1973)

3.2 Die Kennzeichnung von Partikeln Partikelmerkmale

Die Ausgangssituation Das Beispiel-Szenario... 14

ERP Cloud Tutorial. E-Commerce ECM ERP SFA EDI. Backup. Preise erfassen.

Beschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression

Wechselstrom. Dr. F. Raemy Wechselspannung und Wechselstrom können stets wie folgt dargestellt werden : U t. cos (! t + " I ) = 0 $ " I

Auswertung univariater Datenmengen - deskriptiv

Für wen ist dieses Buch? Was ist dieses Buch? Besonderheiten. Neu in dieser Auflage

Flußnetzwerke - Strukturbildung in der natürlichen Umwelt -

Regressionsgerade. x x 1 x 2 x 3... x n y y 1 y 2 y 3... y n

3.1 Gleichstrom und Gleichspannung. 3 Messung elektrischer Größen. Gleichstrom. 3.1 Gleichstrom und Gleichspannung

IT- und Fachwissen: Was zusammengehört, muss wieder zusammenwachsen.

Backup- und Restore-Systeme implementieren. Technische Berufsschule Zürich IT Seite 1

VERGLEICH VON TESTVERFAHREN FÜR DIE DEFORMATIONSANALYSE

Konkave und Konvexe Funktionen

Auswertung univariater Datenmengen - deskriptiv

Kreditpunkte-Klausur zur Lehrveranstaltung Projektmanagement (inkl. Netzplantechnik)

Schätzfehler in der linearen Regression (1) Einführung

13.Selbstinduktion; Induktivität

14 Überlagerung einfacher Belastungsfälle

Streuungs-, Schiefe und Wölbungsmaße

Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i

Spule, Induktivität und Gegeninduktivität

1.1 Grundbegriffe und Grundgesetze 29

Unter der Drehgruppe verstehen wir diegruppe der homogenen linearen Transformationen

Zinseszinsformel (Abschnitt 1.2) Begriffe und Symbole der Zinsrechnung. Die vier Fragestellungen der Zinseszinsrechnung 4. Investition & Finanzierung

1.1 Das Prinzip von No Arbitrage

Einführung in Origin 8 Pro

Standardnormalverteilung / z-transformation

MULTIVAC Kundenportal Ihr Zugang zur MULTIVAC Welt

"Zukunft der Arbeit" Arbeiten bis 70 - Utopie - oder bald Realität? Die Arbeitnehmer der Zukunft

Lineare Regression - Mathematische Grundlagen

Prof. Dr. Johann Graf Lambsdorff Universität Passau. Pflichtlektüre: WS 2007/08

Spiele und Codes. Rafael Mechtel

Leistungsmessung im Drehstromnetz

Einbau-/Betriebsanleitung Stahl-PE-Übergang Typ PESS / Typ PESVS Originalbetriebsanleitung Für künftige Verwendung aufbewahren!

SteigLeitern Systemteile

8 Logistische Regressionsanalyse

-70- Anhang: -Lineare Regression-

Mehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren

binäre Suchbäume Informatik I 6. Kapitel binäre Suchbäume binäre Suchbäume Rainer Schrader 4. Juni 2008 O(n) im worst-case Wir haben bisher behandelt:

SS 2017 Torsten Schreiber

W i r m a c h e n d a s F e n s t e r

Wie eröffne ich als Bestandskunde ein Festgeld-Konto bei NIBC Direct?

Wie eröffne ich als Bestandskunde ein Festgeld-Konto bei NIBC Direct?

Definition des linearen Korrelationskoeffizienten

Erwartungswert, Varianz, Standardabweichung

phil omondo phil omondo Skalierung von Organisationen und Innovationen gestalten Sie möchten mehr Preise und Leistungen Workshops und Seminare

Transkript:

Lneare Regresson (1) - Enführung I - Mttels Regressonsanalysen und kompleeren, auf Regressonsanalysen aserenden Verfahren können schenar verschedene, jedoch nenander üerführare Fragen untersucht werden: We eng st und welche Rchtung hat der Zusammenhang zwschen zwe Varalen? Unterscheden sch de Mttelwerte ener Varalen n verschedenen (Tel-) Gruppen? We gut lassen sch de Werte ener Varalen durch ene oder mehrere andere Varalen vorhersagen (d.h. auf de Werte ener oder mehrerer anderer Varalen zurückführen)? Mt welchen Modellen können Zusammenhänge zwschen mehreren Varalen am esten eschreen werden? We gut passt en theoretsches Modell des Zusammenhangs zweer oder mehrerer Varalen zu den Daten? Lneare Regresson () - Enführung II - De grundlegenden Prnzpen der Regressonsanalyse lassen sch anhand der m Folgenden etrachteten enfachen lnearen Regresson darstellen. Be der enfachen lnearen Regresson kennt man den Ausprägungsgrad ener Varalen (z.b. ) und möchte den Ausprägungsgrad ener anderen Varale (z.b. ) vorhersagen. De Varale, de vorhergesagt werden soll, wrd als ahängge Varale (AV) oder als Krterum ezechnet (ülcherwese ). z.b. Gewaltenstellungen, Erfolg von Interventonsmaßnahmen, eruflcher Erfolg De Varale, de zur Vorhersage dent, wrd als unahängge Varale (UV) oder als Prädktor ezechnet (ülcherwese ). z.b. Gewalterfahrung m Elternhaus, Enndung n Peergroups, Aretsmotvaton Es soll dejenge lneare Funkton gefunden werden, de den Zusammenhang zwschen und optmal eschret. 1

Lneare Regresson (3) - Enführung III - Das konzeptuelle Modell zur Vorhersage ener ahänggen Varalen durch ene unahängge Varale st: De enfachste mathematsche Funkton zur Vorhersage st ene lneare Glechung, n der de -Werte zur Schätzung der -Werte lnear transformert werden: geschätzter Wert der Varalen a y y Wert der Varalen für den der -Wert geschätzt wrd Geschätzter Wert der Varalen wenn = 0 st ( = addtve Konstante oder ntercept ) Regressonskoeffzent = Stegung (slope) der Lne zur Vorhersage von De Rehenfolge der Indzes y an den Koeffzenten a und gt an, dass se der Vorhersage der -Werte anhand der -Werte denen: Es handelt sch her um ene Regresson von auf. Lneare Regresson (4) - Enführung IV - Der Wert y edeutet nhaltlch de durchschnttlche Veränderungsrate der - Werte pro Zunahme ener Enhet von -Werten, während der Wert a y denjengen -Wert angt, an dem de Regressonslne de y-achse schnedet: 1 a 0 Regressonsgerade mt Stegung und addtver Konstanter a

Lneare Regresson (5) - Enführung V - Vorhersage enes -Wertes anhand der Regressonsgeraden: Für enen gegeenen Wert wrd parallel zur -Achse ene Lne zur Regressonsgeraden und von dort parallel zur -Achse s zur -Achse gezogen, der Schnttpunkt gt den geschätzten -Wert : = a y + y y (,y ) e Owohl de Regressonsgerade dem Trend der Punkte m Streudagramm am esten entsprcht (nach enem estmmten Krterum, s.u.), werden.d.r. ncht alle Punkte genau auf der Geraden legen: Der Schätzfehler e der Vorhersage enes estmmten -Wertes st als Dfferenz zwschen dem tatsächlchen und dem vorhergesagten -Wert defnert: e = y. Lneare Regresson (6) - Enführung VI - Da alle anhand der Regressonsglechung vorhergesagten Werte auf der Regressonsgeraden legen, st en Gesamtmaß für den Schätzfehler der Regressonsglechung nach dem Krterum der klensten Quadrate (least squares) de Summe der quadrerten Awechungen der vorhergesagten Werte von den tatsächlchen (gegeenen) Werten. De Koeffzenten y und a y der Regressonsgeraden werden so gewählt, dass dese Summe mnmal st: ( y ) mn Dese Art der lnearen Regresson wrd wegen des Krterums der klensten Quadrate m Englschen auch als ordnary least squares regresson oder OLSregresson ezechnet. 3

Lneare Regresson (7) - Enführung VII - De Glechungen, mt denen de Koeffzenten y und a y nach dem Krterum der klensten Quadrate estmmt werden können (mathematsch mt Mtteln der Dfferentalrechnung aletar), snd: Stegung (slope) y n 1 ( ) ( y n 1 ( ) y) cov s y r s y y s Konstante (ntercept) a y y y D.h., zuerst wrd y und dann a y estmmt. De erste Varante der Glechung für y wrd enutzt, wenn Rohdaten vorlegen, de zwete und drtte Varante können enutzt werden, wenn de Kennzffern der Kovaranz und de Varanz von oder der Korrelaton und der Standardawechungen von und verfügar snd. Lneare Regresson (8) - Bespel I - kg cm Aw() Aw(y) AP(,y) AQ() AQ(y) cm ykg Nr y y ( ) ( y y) ( ) ( y y) y -_ y-y_ (-_).(y-y_) (-_)² (y-y_)² 1 187 7 8 16 64 4 170 60-9 - 90 81 0 3 180 73 1 3 3 1 9 4 184 74 5 4 0 5 16 5 178 7-1 - 1 4 6 180 70 1 0 0 1 0 7 17 6-7 -8 56 49 64 8 176 70-3 0 0 9 0 9 186 80 7 70 49 0 177 67 - -3 6 4 9 Summe: 1790 700 0 0 59 84 306 n 1790 700 179.0 y 70. 0 s 84 8.4 s y 306 30.6 s 8.4 5.39 30.6 5. 53 5.53 y 0.879 0.91 a y 70.0 0.91179.0 93. 43 5.39 s y s y r y 59 5.9 5.9 0.879 5.395.53 93.43 0. 91 4

Lneare Regresson (9) - Bespel II - 90 80 9 Gewcht (kg) y 70 8 5 3 6 4 1 60 7 93.4 0. 91 50 160 170 180 Körpergröße (cm) 190 00 Lneare Regresson () - Merkmale der lnearen Regresson I - Gt es kene Informaton, auf der de Vorhersage aseren kann, wrd der gleche Schätzwert das arthmetsche Mttel der ahänggen Varalen für jeden vorherzusagenden Fall enutzt. D.h., wenn de Korrelaton zwschen der unahänggen Varalen und der ahänggen Varalen Null st, wrd aus den Formeln für y und a y: a y y sy 0 0 s y 0 y Selstverständlch würde nemand ene Regressonsglechung zur Vorhersage enutzen, wenn Prädktor (UV) und Krterum (AV) unkorrelert wären. 5

Lneare Regresson (11) - Merkmale der lnearen Regresson II - Werden alle Werte als z-werte ausgedrückt, st der z-wert der durch de Glechung vorhergesagten Varalen glech dem z-wert der Prädktorvaralen multplzert mt der Produkt-Moment-Korrelaton von und. Da de Standardawechungen der z-werte Ens snd und de Mttelwerte Null, folgt algerasch, dass z r z y Hermt ergt sch ene wchtge Egenschaft der Regresson: Da z mt enem Wert multplzert wrd (der Korrelaton), der n realen Daten numersch mmer klener dem Betrag von Ens st, wrd der z-wert der vorhergesagten Varalen mmer näher am arthmetschen Mttel legen als der z- Wert der Varalen, auf dem de Vorhersage asert. Des st de Bass des sogenannten Regressonseffekts (Regresson zur Mtte von ). Unter anderem demonstrert de Glechung des Weteren, dass de Regressonsgerade durch den Punkt (, y) verläuft: Ist z = 0 (d.h. glech dem Mttelwert), dann st der z-wert der vorhergesagten Varalen eenfalls = 0. Lneare Regresson (1) - Merkmale der lnearen Regresson III - Je näher de Korrelaton zwschen und an Null legt, desto größer st der Vorhersagefehler. Auch wenn de Regressonsglechung den Vorhersagefehler mnmert, kann er doch zu groß sen. Ist de Korrelaton zwschen Prädktor (UV) und Krterum (AV) numersch klen (z.b. +0.07), würde de Regresson enen eträchtlchen Vorhersagefehler produzeren, wel de Korrelaton eder Varalen so gerng st. Das edeutet, dass ene Korrelaton nahe Null für praktsche Vorhersagezwecke nutzlos st, auch wenn de Korrelaton statstsch sgnfkant sen sollte (was mt jeder genügend großen Stchproe der Fall sen kann). Das Vorzechen des Korrelatonskoeffzenten hat jedoch nchts mt dem Vorhersagefehler zu tun: Korrelatonen von z.b. +0.55 und 0.55 snd glech gut für Vorhersagen, wel de Stärke des Zusammenhangs n eden Fällen glech st. 6

Lneare Regresson (13) - Merkmale der lnearen Regresson IV - De Korrelaton zwschen und jeder lnearen Transformaton von st numersch glech dem Betrag von r y. Da eenfalls nchts anderes als ene lneare Trans-formaton von darstellt, st auch de der Betrag der Korrelaton zwschen und glech dem Betrag der Korrelaton zwschen und. Wenn also der lneare Zusammenhang zwschen und schwach st (r y legt nahe Null), werden de vorhergesagten -Werte größtentels ungenau und zemlch verscheden von den tatsächlchen -Werten sen (r y wrd genauso nahe e Null legen). Ist dagegen der Zusammenhang zwschen und stark (r y st numersch groß), werden de vorhergesagten -Werte präzse und konsstent mt den tatsächlchen -Werten sen (r y wrd numersch genauso groß sen). 7