Forschungsstatistik I

Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/ WS 2008/2009 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz

Die Korrelation charakterisiert den Zusammenhang zwischen zwei Zufallsvariablen numerisch. Oft ist in der aber die Vorhersage des Wertes einer bestimmten ZV unter Kenntnis der Ausprägung einer anderen ZV gefordert. Die bekannte Variable wird dabei oft auch als Prädiktor, Unabhängige Variable (UV) oder Erklärende Variable bezeichnet Die vorherzusagende Variable wird als Kriterium, Abhängige Variable (AV) oder Response bezeichnet

Drei Hauptfragestellungen der srechnung: 1. Gibt es eine statistische Beziehung zwischen zwei Variablen, die die Vorhersage der AV aus der UV erlaubt? 2. Kann eine möglichst einfache mathematische Regel formuliert werden, die diesen Zusammenhang beschreibt? 3. Wie gut ist diese Regel im Hinblick auf die Vorhersage?

Einfache lineare Allgemeine Gleichung der einfachen linearen : ŷ = a x+ b Abzissenabschnitt Vorhergesagter Wert (geschätzte AV) Steigungsparameter Gemessene Werte der UV Der geschätzte Wert des Kriteriums wird nur selten mit dem tatsächlich gemessenen Wert übereinstimmen. Prinzipiell wird also angenommen, dass ein Messwert so entsteht: y = yˆ + e= a x+ b+ e Messfehler

Einfache lineare Über den Messfehler werden in der srechnung häufig drei zentrale Annahmen gemacht: 1. Messfehler sind normalverteilt 2. Der Mittelwert der Messfehler ist Null 3. Die Messfehler sind unkorreliert (der Messfehler einer bestimmten Messung hängt weder von den Messfehlern anderer Messungen noch von der Höhe der UV ab).

Einfache lineare Gründe für die Annahme einer linearen Gleichung: Lineare Zusammenhänge sind einfach zu verstehen Lineare Zusammenhänge sind mathematisch und statistisch einfach zu behandeln Lineare Gleichungen haben sich vielfach als gute Approximationen für komplexe Beziehungen erwiesen Achtung: Auch wenn die Beziehung zwischen zwei ZVn linear aussieht, muss es sich nicht zwangsläufig um einen linearen Zusammenhang handeln.

Methode der kleinsten Quadrate () Zur Minimierung des Vorhersagefehlers wird in der Statistik häufig das Kleinste-Quadrate Kriterium verwendet (KQ; oder Ordinary Least Squares, OLS) Die Parameter der sgleichung werden so gewählt, dass das Quadrat der Abweichungen von gemessenem und geschätztem Wert minimiert wird Für eine Versuchsperson i gelte: y = yˆ + e e = y yˆ i i i i i i Dann soll für alle n Datenpunkte erreicht werden, dass n ( y yˆ ) 2 e2 = i i i i= 1 i= 1 n min Minimierung der Varianz des Vorhersagefehlers

Methode der kleinsten Quadrate () Mithilfe der Allgemeinen Gleichung der einfachen linearen lässt sich für die Streuung des Vorhersagefehlers SS e also schreiben: n n 2 2 ( ˆ e i i) ( i i ) i= 1 i= 1 = = SS y y y a x b Bei gemessenen Daten x 1 i und y 1 i entscheiden also nur die sparameter a und b über die Höhe des Vorhersagefehlers Damit kann SS e als mathematische Funktion von a und b aufgefasst werden Die konkreten Werte von werden nun über partielle Ableitungen nach a und b gewonnen min