Das multiple lineare Regressionsmodell
|
|
- Pamela Bruhn
- vor 6 Jahren
- Abrufe
Transkript
1 Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul? Bisher haben wir nur das lineare Regressionsmodell mit einer erklärenden Variablen untersucht. Manchmal ist es aber sinnvoll, zur Erklärung der Y-Werte nicht nur einen einzigen Regressor zu nutzen. Wir können das einfache lineare Regressionsmodell erweitern, indem wir mehrere erklärende Variablen nutzen, um eine zu erklärende Variable zu beschreiben. So entsteht das multiple lineare Regressionsmodell. Analog zum einfachen Regressionsmodell können wir auch in diesem Modell die Regressionskoeffizienten schätzen und testen. Das Modell Die "Open University Research Group" führte über 10 Wochen ein Experiment durch, bei dem der Bedarf an elektrischer Energie zur Heizung von Häusern untersucht wurde (vgl. Hand, D. J., Daly, F., Lunn, A. D., McConway, K. J. und Ostrowski, E. (1994). A Handbook of Small Data Sets. Chapman & Hall, London. S. 76f.). Zusätzlich zur elektrischen Energie verwenden die betrachteten Häuser aber auch Solarenergie zum Heizen. Diese Solarenergie wird über am Haus angebrachte Solarzellen gewonnen. Der Bedarf an elektrischer Energie sollte in Abhängigkeit von der zusätzlich gewonnenen Solarenergie untersucht werden. Zu diesem Zweck wurde in England ein Test-Haus ausgewählt und mit einer Solaranlage ausgestattet. Die Innentemperatur des Hauses wurde auf konstant 21 C gehalten. Hier liegt zunächst einmal ein einfacher linearer Regressionsansatz mit der Solarenergie als erklärender Variable und der elektrischen Energie als zu erklärende Variable nahe. Aber es ist offensichtlich auch nötig, die aktuelle Temperatur als weitere erklärende Variable zu berücksichtigen, denn bei kalten Außentemperaturen muss augenscheinlich mehr geheizt werden als bei warmen Außentemperaturen. Damit hätten wir nun zwei erklärende Variablen zu betrachten. Die bei dem Experiment gemessenen Variablen sind: = Elektrische Energie (kwh) für die Heizung = Elektrische Solarenergie (kwh pro qm pro Tag), die über am Haus angebrachte Solarzellen zusätzlich gewonnen wurde = Differenz zwischen Innen- und Außentemperatur in C. Wenn zwei erklärende Variablen berücksichtigt werden sollen, übersteigt das den Rahmen der einfachen linearen Regression. Wir müssen also das lineare Regressionsmodell um eine weitere erklärende Variable erweitern. Vom Ansatz her lässt sich das leicht nachvollziehen: Wir berücksichtigen dazu in der Gleichung zusätzlich die Variable - und zwar in der gleichen Weise wie die Solarenergie: Page 1
2 Damit haben wir nun ein lineares Regressionsmodell mit zwei erklärenden Variablen. Allgemein erhalten wir bei erklärenden Variablen oder Regressoren das multiple lineare Regressionsmodell. Das multiple lineare Regressionsmodell mit Regressoren lautet: Wie wir gesehen haben, kann die lineare Beziehung bei einer erklärenden Variablen als Gerade in einem Streudiagramm dargestellt werden. Auch bei zwei erklärenden Variablen lässt sich die Ausgleichsfunktion noch bildlich darstellen. Jedes Wertepaar von und bestimmt einen Punkt auf der -Ebene. Über diesen Punkt wird der Wert von angebracht. Die Ausgleichsfunktion ist eine Ebene. Aufgrund der durch die Fehler verursachten Abweichungen liegen einige Punkte über, andere unter der Ebene. Schauen Sie sich in dem Applet Multiples Regressionsmodell (a61.jar) einmal selbst eine solche Ebene an! Schätzen der Koeffizienten Für die Anwendung des Modells mit mehreren Regressoren geht es zuerst darum, die Koeffizienten zu schätzen. Die Bestimmung der Schätzungen der Regressionskoeffizienten geschieht wie bei der einfachen linearen Regression mit dem Ansatz der kleinsten Quadrate. Es ist also die Summe der quadrierten Abstände möglichst klein zu halten: Die Lösung erfolgt wie bei der einfachen linearen Regression; die so bestimmten Koeffizienten lassen sich jedoch für nicht mehr mit einer einfachen Formel angeben. Die Berechnung erfolgt generell mit Computerprogrammen. Für Interessierte steht eine Ableitung der Ergebnisse ( : a81.pdf ) für bereit. Erinnern wir uns an unser Beispiel zum Bedarf an elektrischer Energie: Bei der Untersuchung erhalten wir mit den aus Hand (Hand, D. J., Daly, F., Lunn, A. D., McConway, K. J. und Ostrowski, E. (1994). A Handbook of Small Data Sets. Chapman & Hall, London. S. 76f.) entnommenen Daten ( a89.spf ) die folgenden Koeffizientenschätzungen: Variable Konstante Die in der Tabelle angegebenen Werte können wir im Labor folgendermaßen berechnen: Labordatei öffnen ( ac0.spf ) Genauso wie bei der einfachen linearen Regression gilt: Page 2
3 Die KQ-Schätzer sind auch ohne die Annahme einer Normalverteilung erwartungstreu und konsistent. Damit ist gesichert, dass die Schätzungen keinen systematischen Fehler aufweisen und umso besser um die wahren Werte konzentriert sind, je mehr Beobachtungen vorliegen. Eine unverzerrte Schätzung der Varianz der Fehler ist gegeben durch: Einkommen und der benötigten Ausbildung. Stellen Sie ein multiples Regressionsmodell auf, bei dem das Ansehen verschiedener Berufe durch das Einkommen und die Ausbildung erklärt wird (vgl. Duncan, O. D. (1961). A Status. The Free Press, New York. S ). Ermitteln Sie die Regressionskoeffizienten und Standardfehler! Labordatei öffnen ( adc.zmpf ) Interpretation der Koeffizienten Bei der multiplen Regression ist die Interpretation der Parameter von besonderem Interesse. Sofern das Modell passt, vgl., ist die Interpretation zunächst in Bezug auf das Vorzeichen unproblematisch. Das Vorzeichen eines Koeffizienten gibt an, ob sich die erklärende Variable in positiver oder negativer Art und Weise auf die zu erklärende Variable auswirkt. Weiter gibt der Wert jedes Koeffizienten an, wie sich die Zielgröße ändert, wenn bei Festhalten aller anderen Größen die zugehörige Variable um eine Einheit wächst. Im Energiebeispiel zeigt das negative Vorzeichen des Koeffizienten der Variablen, dass mit größeren Werten von weniger (sonstiger) Strom gebraucht wurde. Bei gleichbleibender Außentemperatur (was auch eine gleichbleibende Temperaturdifferenz bewirkt) sinkt der Energiebedarf um kwh mit jeder kwh pro qm pro Tag. Dass der Koeffizient der Temperaturdifferenz positiv ist, zeigt natürlich, dass bei niedrigerer Temperatur (= größere Differenz) mehr Energie benötigt wird. Der Achsenabschnitt sollte nicht interpretiert werden, da der Untersuchungsbereich den Punkt (0,0) nicht einschließt. In einer vorläufigen, groben Analyse geben die geschätzten Koeffizienten bereits Anhaltspunkte für die unterschiedliche Stärke des Einflusses des Regressors auf den Regressanden. Je größer der absolute Betrag des Regressionskoeffizienten ist, desto stärker ist der vermutete Einfluss. Allerdings sind die numerischen Werte verschiedener Koeffizienten nicht ohne weiteres vergleichbar. Die zugehörigen Regressanden können ja in unterschiedlichen Skalen gemessen worden sein. Eine geeignete Umformung der Regressionskoeffizienten mit dem Ziel, eine direkte Vergleichbarkeit der numerischen Werte herzustellen, sind die standardisierten Regressionskoeffizienten. Anhand dieser Werte kann die relative Bedeutsamkeit der Regressoren für die Erklärung des Regressanden miteinander verglichen werden. Durch die Standardisierung werden nämlich die unterschiedlichen Messdimensionen der Variablen beseitigt und somit können diese direkt verglichen werden. Bei Durchführung einer Regressionsanalyse mit standardisierten Variablen würden Regressionskoeffizienten und -Werte übereinstimmen. Page 3
4 Formal erhält man die standardisierten Regressionskoeffizienten einfach durch Multiplikation der normalen geschätzten Koeffizienten mit den Standardabweichungen der zugehörigen erklärenden Variablen. In unserem Beispiel zum Bedarf an elektrischer Energie sind die Standardabweichungen der beiden erklärenden Variablen: Dementsprechend erhalten wir: Variable nicht standardisiert standardisiert Die in der Tabelle angegebenen Werte können wir im Labor wie folgt berechnen. Labordatei öffnen ( b5f.spf ) Beim Vergleich der Koeffizienten kommen wir zu einer unterschiedlichen Einschätzung, je nachdem, welche der beiden Arten von Koeffizienten wir verwenden. Bei den nicht-standardisierten Koeffizienten erscheint die Variable, die Solarenergie, bedeutsamer als, die Temperaturdifferenz. Diese (Fehl-) Einschätzung resultiert nur aus dem unterschiedlichen Wertebereich der Regressoren. Standardisierung führt zu der Einschätzung, dass beide in etwa gleich bedeutsam sind. (Mit unterschiedlichen Wirkungsrichtungen.) Einkommen und der benötigten Ausbildung (vgl. Duncan, O. D. (1961). A Status. The Free Press, New York. S ). Stellen Sie ein multiples Regressionsmodell auf, berechnen Sie die standardisierten e der Regressionskoeffizienten und interpretieren Sie diese! Labordatei öffnen ( b71.zmpf ) Testen der Koeffizienten Bei einem multiplen Regressionsmodell wollen wir wissen, ob alle in Betracht gezogenen Regressoren auch tatsächlich zur Erklärung benötigt werden. Unter Umständen sind ja einige überflüssig und tragen nichts zur Erklärung bei. Tests zur Überprüfung, ob einzelne Koeffizienten der Regressionsbeziehung null sind, haben inhaltlich die Bedeutung der Überprüfung, ob sie überhaupt im Modell berücksichtigt werden sollten. Die Prüfgrößen für die die einzelnen Koeffizienten betreffenden Hypothesen sind Bei Normalverteilung der Fehler haben die Prüfgrößen t-verteilungen mit Freiheitsgraden, wenn die Hypothese korrekt ist. Page 4
5 Mit dem t-test wird überprüft, ob eine Variable aus dem Modell weggelassen werden kann, wobei hier als zur Gesamtheit der erklärenden Variablen gehörig angesehen wird. Wie viel zusätzlich zu den anderen Regressoren erklärt, wird damit nicht gesagt. Computerprogramme präsentieren i.d.r. Ergebnisse von Regressionsrechnungen in der Form, dass für alle Koeffizienten die entsprechenden Tests angegeben werden. Hier ist zu beachten, dass die Niveaus der Tests bzw. die P-Werte eigentlich nur für die Beurteilung einer einzelnen Hypothese korrekt sind. Im Labor können wir die Tests der Regressionskoeffizienten folgendermaßen durchführen: Labordatei öffnen ( b9f.spf ) Für den Energie-Datensatz erhalten wir zum Beispiel im Labor den folgenden Ausdruck: Die Nullhypothesen werden abgelehnt, wenn der p-wert, der in obiger Tabelle unter "Pr(> t )" zu finden ist, kleiner als ist. In unserem Energie-Beispiel zeigt sich also, dass sowohl als auch einen signifikanten Einfluss auf den Energieverbrauch haben. Der Achsenabschnitt ist dagegen mit einem so großen Standardfehler behaftet, dass er keine Bedeutung hat. Einkommen und der benötigten Ausbildung (vgl. Duncan, O. D. (1961). A Status. The Free Press, New York. S ). Stellen Sie ein multiples Regressionsmodell auf und testen Sie die Regressionskoeffizenten! Zum Bearbeiten mit Regress: Labordatei öffnen ( bbc.zmpf ) Zum Bearbeiten mit lm: Labordatei öffnen ( bc0.zmpf ) - Wie unterscheidet sich das multiple lineare Regressionsmodell vom einfachen linearen Regressionsmodell? Lösung ( : bc9.pdf ) - Wozu testet man die Regressionskoeffizienten im multiplen Regressionsmodell? Lösung ( : bcc.pdf ) - Nennen Sie die Annahmen des multiplen linearen Regressionsmodells! Lösung ( : bcf.pdf ) Wollen Sie Ihren Lernerfolg überprüfen? Dann lösen Sie folgende Aufgabe: Labordatei öffnen ( bd7.zmpf ) Angestellte eines großen Finanzinstituts wurden bezüglich der Zufriedenheit mit ihren Vorgesetzten befragt (vgl. Chatterjee, S. und Price, B. (1995). Praxis der Regressionsanalyse (2. Aufl.). Oldenbourg-Verlag, München. S ). Untersuchen Sie die Bewertung der Vorgesetzten mit Hilfe einer multiplen Regressionsanalyse! (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: Page 5
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrKapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell
Kapitel 8 Einfache Regression Josef Leydold c 2006 Mathematische Methoden VIII Einfache Regression 1 / 21 Lernziele Lineares Regressionsmodell Anpassen des linearen Regressionsmodells, OLS Eigenschaften
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
MehrGemeinsame Wahrscheinlichkeitsverteilungen
Gemeinsame Wahrscheinlichkeitsverteilungen Worum geht es in diesem Modul? Gemeinsame Wahrscheinlichkeits-Funktion zweier Zufallsvariablen Randverteilungen Bedingte Verteilungen Unabhängigkeit von Zufallsvariablen
MehrLineare Modelle in R: Klassische lineare Regression
Lineare Modelle in R: Klassische lineare Regression Achim Zeileis 2009-02-20 1 Das Modell Das klassische lineare Regressionsmodell versucht den Zusammenhang zwischen einer abhängigen Variablen (oder Responsevariablen)
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
Mehr1. Lösungen zu Kapitel 7
1. Lösungen zu Kapitel 7 Übungsaufgabe 7.1 Um zu testen ob die Störterme ε i eine konstante Varianz haben, sprich die Homogenitätsannahme erfüllt ist, sind der Breusch-Pagan-Test und der White- Test zwei
MehrZiel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.
Lineare Regression Einfache Regression Beispieldatensatz: trinkgeld.sav Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X. H0: Y lässt sich nicht durch X erklären, das heißt
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrBrückenkurs Statistik für Wirtschaftswissenschaften
Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München
MehrTests einzelner linearer Hypothesen I
4 Multiple lineare Regression Tests einzelner linearer Hypothesen 4.5 Tests einzelner linearer Hypothesen I Neben Tests für einzelne Regressionsparameter sind auch Tests (und Konfidenzintervalle) für Linearkombinationen
MehrDas (multiple) Bestimmtheitsmaß R 2. Beispiel: Ausgaben in Abhängigkeit vom Einkommen (I) Parameterschätzer im einfachen linearen Regressionsmodell
1 Lineare Regression Parameterschätzung 13 Im einfachen linearen Regressionsmodell sind also neben σ ) insbesondere β 1 und β Parameter, deren Schätzung für die Quantifizierung des linearen Zusammenhangs
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
Mehrb) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!
Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies
MehrGrundlegende Eigenschaften von Punktschätzern
Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrDatenanalyse mit Excel und Gretl
Dozent: Christoph Hindermann christoph.hindermann@uni-erfurt.de Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 1 Teil 2: Gretl Datenanalyse mit Excel und Gretl Teil Titel 2: Gretl 2 Modellannahmen
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrBeurteilung des multiplen Regressionsmodells
Beurteilung des multiplen Regressionsmodells Worum geht es in diesem Lernmodul? Univariate Maßzahlen Testen des Modells Überprüfung der Modellannahmen Multikollinearität Worum geht es in diesem Lernmodul?
MehrStatistik II für Betriebswirte Vorlesung 12
Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 12 11. Januar 2013 7.3. Multiple parameterlineare Regression Im Folgenden soll die
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrDie Empirische Regression
Die Empirische Regression Worum geht es in diesem Lernmodul? Beschreibung der Abhängigkeit einer Variablen von einer anderen Bestimmung der Regressionsgeraden Das Bestimmtheitsmaß Worum geht es in diesem
MehrAuswahl von Schätzfunktionen
Auswahl von Schätzfunktionen Worum geht es in diesem Modul? Überblick zur Punktschätzung Vorüberlegung zur Effizienz Vergleich unserer Schätzer für My unter Normalverteilung Relative Effizienz Einführung
Mehr9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T
9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
Mehry t = 30, 2. Benutzen Sie die Beobachtungen bis einschließlich 2002, um den Koeffizientenvektor β mit der KQ-Methode zu schätzen.
Aufgabe 1 (25 Punkte Zur Schätzung des Werbe-Effekts in einem Getränke-Unternehmen wird das folgende lineare Modell aufgestellt: Dabei ist y t = β 1 + x t2 β 2 + e t. y t : x t2 : Umsatz aus Getränkeverkauf
MehrZeitreihenanalyse Das Holt-Winters-Verfahren
Zeitreihenanalyse Das Holt-Winters-Verfahren Worum geht es in diesem Lernmodul? Einleitung Modellannahmen Die Prognoseformel des Holt-Winters-Verfahren Die Glättungskoeffizienten Die Startwerte Weiterführende
MehrMultiple Regressionsanalyse - Kurzabriss
Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen
MehrBeurteilung der Regression
Beurteilung der Regression Worum geht es in diesem Lernmodul? Univariate Maßzahlen zur Beurteilung der geschätzten Regressionsbeziehung Residuenanalyse Nichtlinearität Nichtkonstante Varianz Nicht-normalverteilte
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrRegression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
MehrKlausur zu Statistik II
GOETHE-UNIVERSITÄT FRANKFURT FB Wirtschaftswissenschaften Statistik und Methoden der Ökonometrie Prof. Dr. Uwe Hassler Wintersemester 03/04 Klausur zu Statistik II Matrikelnummer: Hinweise Hilfsmittel
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrStatistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II
Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen
MehrDabei bezeichnet x die Einflussgrösse (Regressor), y die Zielvariable (die eine Folge der Ursache x ist) und die Störung. Die n = 3 Beobachtungen
Lineare Regression und Matrizen. Einführendes Beispiel Der im Kapitel Skalarprodukt gewählte Lösungsweg für das Problem der linearen Regression kann auch mit Matrizen formuliert werden. Die Idee wird zunächst
MehrTeilklausur des Moduls Kurs 42221: Vertiefung der Statistik
Name, Vorname Matrikelnummer Teilklausur des Moduls 32741 Kurs 42221: Vertiefung der Statistik Datum Termin: 21. März 2014, 14.00-16.00 Uhr Prüfer: Univ.-Prof. Dr. H. Singer Vertiefung der Statistik 21.3.2014
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrModul G.1 WS 07/08: Statistik
Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen
MehrAblaufschema beim Testen
Ablaufschema beim Testen Schritt 1 Schritt 2 Schritt 3 Schritt 4 Schritt 5 Schritt 6 Schritt 7 Schritt 8 Schritt 9 Starten Sie die : Flashanimation ' Animation Ablaufschema Testen ' siehe Online-Version
MehrLineare Regression mit einem Regressor: Einführung
Lineare Regression mit einem Regressor: Einführung Quantifizierung des linearen Zusammenhangs von zwei Variablen Beispiel Zusammenhang Klassengröße und Testergebnis o Wie verändern sich Testergebnisse,
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrLösung Aufgabe 1 (Regression) Es wurden in einer Befragung zwei metrische Merkmale X und Y erhoben. Betrachten Sie dazu die
Statistik für Kommunikationswissenschaftler Wintersemester 2010/2011 Vorlesung Prof. Dr. Nicole Krämer Übung Nicole Krämer, Cornelia Oberhauser, Monia Mahling Lösung Thema 9 Homepage zur Veranstaltung:
MehrMacht des statistischen Tests (power)
Macht des statistischen Tests (power) Realer Treatment ja Ergebnis der Studie H 0 verworfen statistisch signifikant O.K. Macht H 0 beibehalten statistisch nicht signifikant -Fehler Effekt nein -Fehler
MehrMann-Whitney-U-Test für zwei unabhängige Stichproben
Mann-Whitney-U-Test für zwei unabhängige Stichproben Wir haben bis jetzt einen einzigen Test für unabhängige Stichproben kennen gelernt, nämlich den T-Test. Wie wir bereits wissen, sind an die Berechnung
MehrTestentscheidungen. Worum geht es in diesem Modul? Kritische Werte p-wert
Testentscheidungen Worum geht es in diesem Modul? Kritische Werte p-wert Worum geht es in diesem Modul? Testentscheidungen: Annahme- und Ablehnbereich Bei der Durchführung eines statistischen Tests kommen
MehrEinfache Varianzanalyse für unabhängige Stichproben
Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,
MehrMathematische und statistische Methoden II
Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrZiel der linearen Regression
Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrStatistischer Rückschluss und Testen von Hypothesen
Statistischer Rückschluss und Testen von Hypothesen Statistischer Rückschluss Lerne von der Stichprobe über Verhältnisse in der Grundgesamtheit Grundgesamtheit Statistischer Rückschluss lerne aus Analyse
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrÜbungen (HS-2010): Urteilsfehler. Autor: Siegfried Macho
Übungen (HS-2010): Urteilsfehler Autor: Siegfried Macho Inhaltsverzeichnis i Inhaltsverzeichnis 1. Übungen zu Kapitel 2 1 Übungen zu Kontingenz- und Kausalurteile 1 Übung 1-1: 1. Übungen zu Kapitel 2 Gegeben:
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
MehrElementare Regressionsrechnung
Elementare Regressionsrechnung Motivation: Streudiagramm zweier metrisch skalierter Merkmale X und Y Y X Dr. Karsten Webel 107 Ziel: Erfassung des Zusammenhangs zwischen X und Y durch eine Gerade der Form
MehrMultivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.167
Multivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.167 Multivariate Regression Verfahren zur Prüfung des gemeinsamen linearen Einflusses mehrerer unabhängiger Variablen auf eine
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Mehr» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller
» SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela
Mehr1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt:
Beispiele zum Üben und Wiederholen zu Wirtschaftsstatistik 2 (Kurs 3) 1 Einfachregression 1.1In 10 Haushalten wurden Einkommen und Ausgaben für Luxusgüter erfragt: Haushaltseinkommen 12 24 30 40 80 60
MehrAuswertung und Lösung
Dieses Quiz soll Ihnen helfen, Kapitel 4.7 und 4.8 besser zu verstehen. Auswertung und Lösung Abgaben: 71 / 265 Maximal erreichte Punktzahl: 8 Minimal erreichte Punktzahl: 0 Durchschnitt: 5.65 Frage 1
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrInformationen zur KLAUSUR am
Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management
Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Ausgangsdaten Bundesliga 2008/2009 Gegeben: Daten zu den 18 Vereinen der ersten Bundesliga
MehrAnpassungstests VORGEHENSWEISE
Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel
MehrSchätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief. Statistik II
Schätzverfahren, Annahmen und ihre Verletzungen, Standardfehler. Oder: was schiefgehen kann, geht schief Statistik II Wiederholung Literatur Kategoriale Unabhängige, Interaktion, nicht-lineare Effekte
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrAufgabenblock 4. Da Körpergröße normalverteilt ist, erhalten wir aus der Tabelle der t-verteilung bei df = 19 und α = 0.05 den Wert t 19,97.
Aufgabenblock 4 Aufgabe ) Da s = 8. cm nur eine Schätzung für die Streuung der Population ist, müssen wir den geschätzten Standardfehler verwenden. Dieser berechnet sich als n s s 8. ˆ = = =.88. ( n )
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrErgänzungsmaterial zur Vorlesung. Statistik 2. Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Dipl.-Math. oec. D. Engel Ergänzungsmaterial zur Vorlesung Statistik 2 Modelldiagnostik, Ausreißer, einflussreiche Beobachtungen
MehrJost Reinecke. 7. Juni 2005
Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung
MehrGauß-Test für den Zweistichprobenfall
Gauß-Test für den Zweistichprobenfall Zweiseitiger Gauß-Test Allgemeine Formulierung der Hypothesen Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit bekannten Varianzen durch Vergleich
MehrStatistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe
Kapitel 4 Statistische Tests 4.1 Grundbegriffe Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe X 1,..., X n. Wir wollen nun die Beobachtung der X 1,...,
MehrGegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen. 0 sonst.
Aufgabe 1 (2 + 4 + 2 + 1 Punkte) Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen X und Y : { 2x + 2y für 0.5 x 0.5, 1 y 2 f(x, y) = 3 0 sonst. a) Berechnen
Mehr1.8 Kolmogorov-Smirnov-Test auf Normalverteilung
1.8 Kolmogorov-Smirnov-Test auf Normalverteilung Der Kolmogorov-Smirnov-Test ist einer der klassischen Tests zum Überprüfen von Verteilungsvoraussetzungen. Der Test vergleicht die Abweichungen der empirischen
MehrProf. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand
MehrProbleme bei kleinen Stichprobenumfängen und t-verteilung
Probleme bei kleinen Stichprobenumfängen und t-verteilung Fassen wir zusammen: Wir sind bisher von der Frage ausgegangen, mit welcher Wahrscheinlichkeit der Mittelwert einer empirischen Stichprobe vom
MehrEinführung. Ablesen von einander zugeordneten Werten
Einführung Zusammenhänge zwischen Größen wie Temperatur, Geschwindigkeit, Lautstärke, Fahrstrecke, Preis, Einkommen, Steuer etc. werden mit beschrieben. Eine Zuordnung f, die jedem x A genau ein y B zuweist,
MehrProjekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?
AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei
MehrLösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 2013)
Lösungsvorschläge zur Klausur Beschreibende Statistik und Wirtschaftsstatistik (Sommersemester 203) Aufgabe (9 Punkte) Ein metrisches Merkmal X sei in einer Grundgesamtheit vom Umfang n = 200 diskret klassiert.
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrEine zweidimensionale Stichprobe
Eine zweidimensionale Stichprobe liegt vor, wenn zwei qualitative Merkmale gleichzeitig betrachtet werden. Eine Urliste besteht dann aus Wertepaaren (x i, y i ) R 2 und hat die Form (x 1, y 1 ), (x 2,
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrTEIL 13: DIE EINFACHE LINEARE REGRESSION
TEIL 13: DIE EINFACHE LINEARE REGRESSION Die einfache lineare Regression Grundlagen Die einfache lineare Regression ist ebenfalls den bivariaten Verfahren für metrische Daten zuzuordnen 1 Sie hat einen
MehrEinführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25
Inhaltsverzeichnis Einführung 17 Über dieses Buch 17 Törichte Annahmen über den Leser 19 Wie dieses Buch aufgebaut ist 19 Teil I: Kopfüber eintauchen indie Statistik 19 Teil II: Von Wahrscheinlichkeiten,
MehrWolf falsch eingeschätzt und deshalb falsche Werbemaßnahmen ergriffen.
Aufgabenstellung Klausur Methoden der Marktforschung 0.08.004 Der Automobilhersteller People Car verkauft eine neue Variante seines Erfolgsmodells Wolf zunächst nur auf einem Testmarkt. Dabei muss das
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
Mehr