Mathematische und statistische Methoden I

Ähnliche Dokumente
Mathematische und statistische Methoden I

Forschungsstatistik I

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

s xy x i x y i y s xy = 1 n i=1 y 2 i=1 x 2 s 1 n x n i Streudiagramme empirische Kovarianz x=5,5 y=7,5

Forschungsstatistik I

Herleitung der Parameter-Gleichungen für die einfache lineare Regression

So lösen Sie die Gleichung für den Korrelationskoeffizienten

Mathematische und statistische Methoden I

Methode der kleinsten Quadrate

n 2(a + bx i y i ) = 0 und i=1 n 2(a + bx i y i )x i = 0 i=1 gilt. Aus diesen beiden Gleichungen erhalten wir nach wenigen einfachen Umformungen

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Wiederholung: Linearer Ausgleich 1. Linearer Ausgleich. Vorlesung April. Aufgabe Gegeben Naturgesetz

Statistik und Wahrscheinlichkeitsrechnung

6 Vergleich mehrerer unverbundener Stichproben

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Diesen Grenzwert nennt man partielle Ableitung von f nach x i und

Statistik und Wahrscheinlichkeitsrechnung

Repräsentativität und Unabhängigkeit

Wirksamkeit, Effizienz

Lineare Transformationen

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Tutorium Mathematik ITB1(B), WI1(B)

Kapitel XI - Korrelationsrechnung

Evaluation & Forschungsstrategien

Aufgaben zur Übung und Vertiefung

Statistik I Februar 2005

DEFINITION Unter einer mxn-matrix versteht man ein rechteckiges Zahlenschema aus m Zeilen und n Spalten k k k Μ Μ Μ Μ Μ Μ Ο Μ

Mathematische und statistische Methoden I

Schätzung der Kovarianzmatrix

Übungen zur Linearen Algebra 1

Lineare Regression. Roland Heynkes. 18. April 2006, Aachen

. Mit dem Unit Hydrograph (U) und gegebenen Niederschlägen (P) kann der Direktabfluss für jeden Zeitpunkt n berechnet werden. Dies erfolgt nach:

Kapitel 2. Terme. oder (x + 1)(x 1) = x 2 1

Fit in Mathe. April Klassenstufe 10 Wurzelfunktionen

x = a + b α + β. b) Wir erweitern den Bruch geeignet (Standardtrick: z z ist reell, daher ergibt 1/z = 1/z z/ z = z/(z z) einen reellen Nenner):

und wird als n-dimensionaler (reeller) Vektorraum bezeichnet. heißt der von v 1,..., v k aufgespannte Unterraum des R n.

Wir wiederholen zunächst das Majorantenkriterium aus Satz des Vorlesungsskripts Analysis von W. Kimmerle und M. Stroppel.

Aufgaben zur Übung und Vertiefung

Gleichungen und Ungleichungen. Mathematische Grundlagen. Beispiel. Beispiel. Lösung einer quadratischen Gleichung:

Ganzrationale Funktionen

Zusammenhangsmaß Korrelation (Pearsons Produkt-Moment-Korrelation r)

= a n: Wurzelexponent x: Radikand oder Wurzelbasis a: Wurzelwert Bei der ersten Wurzel wird einfach das Wurzelzeichen weggelassen.

Anwendungen der Wahrscheinlichkeit II. Markovketten

Fehlerrechnung. 3. Genauigkeit von Meßergebnissen am Beispiel der Längenmessung

Kurvenanpassung durch Regression (3) Ac nichtlineare Regression/Linearisierung -

Höhere Mathematik I für die Fachrichtungen Elektroingenieurwesen, Physik und Geodäsie Lösungsvorschläge zum 12. Übungsblatt

2 Vollständige Induktion

3. Grundbegrie der Schätztheorie

Streuungsmaße. Prof. Dr. Paul Reuber. Institut für Geographie. Seminar Methoden der empirischen Humangeographie

Übungsaufgaben mit Lösungen. Mathematik I

Probeklausur. (b) Was geschieht, wenn man ein Quantenbit in einem solchen Zustand misst?

Kapitel 5: Schließende Statistik

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

Zusammenfassung: Gleichungen und Ungleichungen

Für eine n n-matrix A müssen wir die Gleichung. lösen. Falls (A λi) invertierbar ist, dann ist. Dann ist aber λ kein Eigenwert.

Testen statistischer Hypothesen

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Arithmetische und geometrische Folgen. Die wichtigsten Theorieteile. und ganz ausführliches Training. Datei Nr

Vorbereitung auf 6. Übungsblatt (Präsenzübungen) - Lösungen

= 1 für alle n 1. = f hinzu, erhält man das Gleichungssystem

Positiv denken! Lösungen

Zusammenfassung: Gleichungen und Ungleichungen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Multiple-Choice-Tests Mathematik (Klasse 7/8)

Mathematik 2 für Naturwissenschaften

LGÖ Ks VMa 12 Schuljahr 2017/2018

8. Regressionsanalyse

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

HA-Lösung TA-Lösung Diskrete Strukturen Tutoraufgabenblatt 13. Besprechung in KW05/2018

Wirksamkeit, Effizienz

Variationstheoreme und ihre Anwendungen

8. Gewöhnliche Differentialgleichungen (ODE)

... a ik) i=1...m, k=1...n A = = ( a mn

Eigenschaften von Texten

6.2 Das Newtonverfahren zur Nullstellenbestimmung. x für k

3. Tilgungsrechnung Tilgungsarten

Letzte Änderung: Seite 3-1

Übungen zur Analysis 1 für Informatiker und Statistiker. Lösung zu Blatt 8

1. Folgen ( Zahlenfolgen )

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Dr. K. Jechlitschka AUFGABENSAMMLUNG. zur. Vorlesung Mathematik

Page-Rank: Markov-Ketten als Grundlage für Suchmaschinen im Internet

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

2 Asymptotische Schranken

Binomialkoeffizienten und Binomischer Satz 1 Der binomische Lehrsatz

425 Polarisationszustand des Lichtes

Hallo, kurze Anmerkung: Diese Scripte stammen von Ich kann leider dazu. keine Fragen mehr beantworten! : ( Euch trotzdem viel Erfolg!

Kovarianz und Korrelation

2. Repetition relevanter Teilbereiche der Statistik

Numerische Lineare Algebra - Theorie-Blatt 2

Harmonisches Mittel. Streuungsmaße. Die mittlere Abweichung. Die Standardabweichung. Die Varianz. Statistik 3. Vorlesung, März 11, ,...

6. Übung - Differenzengleichungen

Proseminar Lineare Algebra WS 2016/17

Die vollständige Induktion - Lösungen 1. Aufgabe: Sind die folgenden Aussageformen in N allgemeingültig?

Aufgabe G 1.1. [Vollständige Induktion, Teleskopsumme] n k 3 = n N : k(k + 1) = 1 1

Kapitel 17 : Lineare Regression Darstellung von zweidimensionalen Daten : (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n )

Kapitel 3: Bedingte Wahrscheinlichkeiten und Unabhängigkeit

Kreuztabellenanalyse und Assoziationsmaße

Transkript:

Prof. Dr. G. Meihardt 6. Stoc, Wallstr. 3 (Raum 06-206) Sprechstude jederzeit ach Vereibarug ud ach der Vorlesug. Mathematische ud statistische Methode I Dr. Malte Persie persie@ui-maiz.de http://psymet03.sowi.ui-maiz.de/ WS 200/20 Fachbereich Sozialwisseschafte Psychologisches Istitut Johaes Guteberg Uiversität Maiz

Grudlage Gleichug Miimierug Normalgleichuge Grudlage Oft werde i psychologische Utersuchuge icht ur ei soder mehrere UV betrachtet, die eie AV beeiflusse. Beispiele: Abhägigeit der Lebeszufriedeheit vo sozialem, öoomischem ud Gesudheitsstatus; Beeiflussug sportlicher Leistug durch Traiigszustad ud Aweseheit vo Zuschauer. Solche Fragestelluge werde auch als multifatoriell bezeichet Problem: Die vieler paarweiser Korrelatioe im multifatorielle Fall verachlässigt mögliche Zusammehäge zwische de Präditore

Grudlage Gleichug Miimierug Normalgleichuge Grudgleichug Die vorherzusagede Variable (AV, y-wert) wird als Kriterium bezeichet, die vorhersagede Variable (UV, -Werte) als Präditore. Die Vorhersagegleichug der multiple Regressio mit Präditore wird geschriebe als ˆ = 0 + + 2 2 + + y b b b b Bei stadardisierte Date verwedet ma das Symbol β für die Regressiosparameter (bzw. -gewichte ) ˆ = β + β2 2 + + β y z z z

Grudlage Gleichug Miimierug Normalgleichuge Regressio Methode der leiste Quadrate (KQ-Kriterium) Zur Miimierug des Vorhersagefehlers wird oft das Kleiste-Quadrate Kriterium verwedet (KQ; oder Ordiary Least Squares, OLS) Parameter der multiple Regressiosgleichug werde so gewählt, dass das Quadrat der Abweichuge vo gemesseem ud geschätztem Wert miimiert wird Für eie Versuchsperso i aus alle gelte: y = yˆ + e e = y yˆ i i i i i i beobachteter Kriteriumswert = vorhergesagter Wert + Messfehler Da soll für alle Datewerte erreicht werde, dass ( y yˆ ) 2 e2 = i i i i= i= mi Miimierug der Quadratsumme des Vorhersagefehlers

Grudlage Gleichug Miimierug Regressio Methode der leiste Quadrate (KQ-Kriterium) Mithilfe der Allgemeie Gleichug der eifache lieare Regressio lässt sich für die Streuug des Vorhersagefehlers QS e also schreibe: 2 2 ( ˆ e i i) ( i 0 i 2 i2 i) i= i= QS = y y = y b b b b mi Normalgleichuge bzw. i der stadardisierte Form ( ˆ ) ( β β2 β ) 2 2 QS = z z = z z z z e y y y i= i= i i i i i2 i mi Die Miimierug der Regressiosparameter erfolgt über partielle Differezierug ach jedem eizele der b- bzw. β-gewichte

Grudlage Gleichug Miimierug Normalgleichuge Regressio Normalgleichuge der multiple Regressio Die partielle Differezierug der ichtstadardisierte Gleichug mit Präditore führt immer auf ei System vo + Normalgleichuge, das wie folgt aufgebaut ist: y = b + b + b + + b 0 2 2 i= i= i= i= i= 2 y = b0 + b + b2 2 + + b i= i= i= i= i= y 2 2 = b0 2 + b 2 + b2 2 + + b 2 i= i= i= i= i= y = b + b + b + + b 0 2 2 i= i= i= i= i= 2

Grudlage Gleichug Miimierug Normalgleichuge Regressio Normalgleichuge der multiple Regressio I der stadardisierte Form ergibt sich ei System vo Normalgleichuge: 2 z z y = β z + β 2 z z + + β 2 z z i= i= i= i= 2 z z 2 y = β z z + β 2 2 z + + β 2 z z 2 i= i= i= i= 2 z zy = β z z + β2 z z + + β z i= i= i= i= 2

Grudlage Gleichug Miimierug Normalgleichuge Regressio - Die partielle Differezierug eier multiple Regressiosgleichug mit Präditore führt immer auf ei System vo + (bzw. ) Normalgleichuge Prizip: Die summierte Ausgagsgleichug wird acheiader mit Präditor 0 (bzw. z z ) multipliziert Die Normalgleichuge liefer da für + (bzw. ) ubeate Regressiosparameter geau so viele Gleichuge. Dieses Gleichugssystem a u durch Substitutio oder Diagoalisierug für die Parameter gelöst werde

der multiple Regressio Wir habe gesehe, dass die Normalgleichuge der multiple Regressio für stadardisierte Date lautete: 2 z z y = β z + β 2 z z + + β 2 z z i= i= i= i= 2 z z 2 y = β z z + β 2 2 z + + β 2 z z 2 i= i= i= i= 2 z zy = β z z + β2 z z + + β z i= i= i= i= 2 Weiterhi ist die Korrelatio zweier Variable p ud q : r = z z i, i, i = p q p q

der multiple Regressio Damit reduziert sich das Normalgleichugssystem zu: r = β + β r + β r + + β r y 2 3 2 3 r = β r + β + β r + + β r y 2 3 2 2 2 3 2 r = β r + β r + β + + β r y 2 3 3 3 2 3 3 r = β r + β r + β r + + β y 2 3 2 3 I Matriotatio ist dies: R β = r mit T y R = Z Z

der multiple Regressio I Matriotatio ist dies: wobei: R β = R = r y mit R T = Z Z Matri der Präditoriterorrelatioe

Eurs: Die Korrelatiosmatri R Aufbau ud Bedeutug Die Korrelatiosmatri R stellt die Korrelatioe zwische Variable i Matrischreibweise dar. Sie ist quadratisch ud ethält Korrelatioe 2 2 r r r r r r2 2 2 2 Die Hauptdiagoale ethält die Korrelatioe der Variable mit sich selbst (r = ) Die utere ud obere Dreiecsmatri sid symmetrisch

der multiple Regressio I Matriotatio ist dies: wobei: R β = r y mit R T = Z Z R = Matri der Präditoriterorrelatioe ry = Vetor der Kriteriumsorrelatioe β = Vetor der Regressiosgewichte Z = Vetor der z-stadardisierte Date Lösug: Iverse Iterorrelatiosmatri vormultipliziere R R β = R r y β = R r y

Rücrechug der ustadardisierte Parameter Wurde die β-parameter für die z-stadardisierte Date matrialgebraisch bestimmt, a die der ustadardisierte b-parameter vorgeomme werde über SDy bi = βi mit i =,2,..., SD i Die Kostate b 0 wird da berechet als b0 = y b b22... b

der Lösug b- ud β-gewichte Die Größe eies b-gewichtes gibt a, um wieviele Eiheite sich der Wert des ustadardisierte Kriteriums verädert, we der Betrag des ustadardisierte Präditors um steigt. Die Größe des β-gewichtes gibt dasselbe für die stadardisierte Variable a Das b-gewicht beatwortet die Frage: Ich möchte eie der Präditore um erhöhe. Welche sollte ich wähle, damit das Kriterium maimal steigt? Das β-gewicht beatwortet die Frage: Mit welchem Präditor erhöhe ich das Kriterium am effizieteste? Das b-gewicht liefert also eie absolute, das β-gewicht eie relative Iformatio.

Regressio Vereifachug bei ur eiem Präditor Bei ur eiem Präditor vereifacht sich die der Regressiosgewichte erheblich. b s = ry s. Steigug: oder y b ŷ = b0 + b = cov( y, ) s 2. y-achseabschitt: b0 = y b

Regressio Oft ist i der Psychologie die Vorhersage des Wertes eier bestimmte Variable uter Ketis der Ausprägug aderer Variable gefordert. Die beate Variable wird dabei als Präditore, Uabhägige Variable (UV) oder Erlärede Variable bezeichet Die vorherzusagede Variable wird als Kriterium, Abhägige Variable (AV) oder Respose bezeichet

Regressio Drei Hauptfragestelluge der Regressiosrechug:. Gibt es eie statistische Beziehug zwische zwei Variable, die die Vorhersage der AV aus der UV erlaubt? 2. Ka eie möglichst eifache mathematische Regel formuliert werde, die diese Zusammehag beschreibt? ˆ = 0 + + 2 2 + + y b b b b 3. Wie gut ist diese Regel im Hiblic auf die Vorhersage?

Regressio Grüde für die Aahme eier lieare Gleichug: Lieare Zusammehäge sid eifach zu verstehe Lieare Zusammehäge sid mathematisch ud statistisch eifach zu behadel Lieare Gleichuge habe sich vielfach als gute Approimatioe für omplee Beziehuge erwiese Achtug: Auch we die Beziehug zwische zwei ZV liear aussieht, muss es sich icht zwagsläufig um eie lieare Zusammehag hadel.

Regressio Vorsicht bei der der Regressiosgleichug Bei der Korrelatiosrechug bedeutet ei Zusammehag iemals Kausalität, lediglich Assoziatio Bei der Regressiosrechug gilt zuächst dasselbe Die Kausalitätsvermutug wird (we überhaupt) scho bei der Aufstellug der Regressiosgleichug getroffe, icht erst bei der der Ergebisse. Um tatsächlich Kausalität festzustelle, müsse weitere Radbediguge vorliege (z.b. zeitliche Atezedez vo Ursache vor Wirug).

Relevate Ecel Futioe MMULT() MTRANS() MINV()