Übungen (HS-2010): Urteilsfehler. Autor: Siegfried Macho
|
|
- Stephan Hauer
- vor 7 Jahren
- Abrufe
Transkript
1 Übungen (HS-2010): Urteilsfehler Autor: Siegfried Macho
2 Inhaltsverzeichnis i Inhaltsverzeichnis 1. Übungen zu Kapitel 2 1
3 Übungen zu Kontingenz- und Kausalurteile 1 Übung 1-1: 1. Übungen zu Kapitel 2 Gegeben: Ein akademischer Leistungstest, der moderat mit der GPA (Grade Point Average) korreliert ist: = 0.1. Tab. 1-1 zeigt die Perzentilwerte für die beiden Tests. Die Einträge sind wie folgt zu lesen: Die besten 10% aller Personen, welche den Leistungstest absolvieren erreichen einen Wert von >750. Die besten 10% aller Personen, für welche der GPA vorliegt, haben einen Wert von > 3.7. Studenten Leistungstest GPA Obersten 10% >750 >3.7 Obersten 20% >700 >3.5 Obersten 30% >650 >3.2 Obersten 40% >600 >2.9 Obersten 50% >500 >2.5 Tab. 1-1: Perzentile der Scores für Leistungstest und GPA. 1. Angenommen eine ausgewählte Person hat beim Leistungstest einen Wert von 725 erreicht. Welchen Wert würden Sie für diese Person beim GPA vorhersagen. Begründen Sie Ihr Urteil. 2. Versuchen Sie mittels linearer Regressionsgleichung die Werte des GPA für den beobachteten Wert des Leistungstests vorherzusagen, für die Korrelationskoeffizienten: 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9. Nehmen Sie hierzu an, dass die Werte normal verteilt sind. Hinweise: (i) Aus den Daten müssen die Standardabweichungen für den Leistungstest sowie für den GPA ermittelt werden. (ii) Die Regressionsgleichung zur Vorhersage von y aufgrund von x lautet: y b x y x Hierbei gilt: y ist der Mittelwert von y. x ist der Mittelwert von x. b ist der (unstandardisierte) Regressionskoeffizient.
4 Übungen zu Kontingenz- und Kausalurteile 2 Lösung 1. Begründung: Da der Zusammenhang zwischen den beiden Tests relativ gering ist, ist der Mittelwert plus ein kleine Inkrement der korrekte Wert (z.b. GPA = 2.6). Bemerkung: Die meisten geben eine Wert von ungefähr 3.6 an. Dies entspricht ungefähr der Vorhersage, wenn keine Regression zum Mittel vorliegt, was nur der Fall ist, wenn die beiden Tests perfekt korreliert sind. 2. Berechnung mittels Regression: Zur Ermittlung der Standardabweichungen betrachte man Abb. 1-1: Die blaue Kurve repräsentiert den rechten Teil der Dichtefunktion der Normalverteilung. Die grauen vertikalen Linien zeigen die Positionen der einzelnen Prozentwerte an (vgl. die grauen Prozentwerte unterhalb der Graphik). Hieraus ergeben sich die Bereiche für die einzelnen Werte der beiden Tests % % % % % % Abb. 1-1: Lage der Werte bei Annahme normal verteilter Werte. Die rote senkrechte Linie zeigt die Position der Werte bei einer Standardabweichung. Hieraus ergeben sich die geschätzten Standardabweichungen: s 218 und 1.1. x s y Der Wert von b ergibt sich durch: sx b (für 0. 1 ergibt sich: b = ) s y Die Regressionsgleichung lautet:
5 Übungen zu Kontingenz- und Kausalurteile 3 y 2.5 b Für 0. 1 ergibt sich: y Tab. 1-2 zeigt die Ergebnisse für die verschiedenen Korrelationskoeffizienten. Korrelation Vorhergesagter GPA Tab. 1-2: Vorhergesagter Wert des GPA aufgrund des Wertes 725 für den Leistungstest (aufgrund der Daten von Tab. 1-1) Übung 1-2: Im Jahre 1976 wurde der Polizeichef von Denver mit folgender Begründung entlassen: Seit dem Amtsantritt des Polizeichefs im Jahre 1971 sei die Verbrechensrate um 14% gestiegen. Was ist an dieser Argumentation problematisch? Lösung Aufgrund der angestiegenen Kriminalität kann nicht geschlossen werden, dass die Polizei für den Anstieg verantwortlich ist. Die Argumentation berücksichtigt nämlich nicht, wie stark der Anstieg der Verbrechensrate in vergleichbaren Städten (Kansas City, Philadelphia, etc.) für den genannten Zeitraum ist. Dies bedeutet: Es fehlt ein Vergleichstandard! Veranschaulicht man dies mittels einer Kreuztabelle, so sieht man, dass relevanten Daten fehlen Denver vorhanden vorhanden Andere Städte fehlt fehlt
6 Übungen zu Kontingenz- und Kausalurteile 4 Allerdings kann der Vergleich mit anderen Städten nur einen Hinweis für die kausale Relevanz der Polizei bezüglich der Kriminalität in Denver liefern. Die erhöhte Kriminalität in Denver könnte nämlich durch eine für diese Stadt spezifische Charakteristik mit verursacht sein (Dies bedeutet, dass die Städte nicht wirklich vergleichbar sind). Derartige stadtspezifische Situationen können jedoch nur entdeckt werden, wenn man den Vergleich mit anderen Städten durchführt. Aktuelles Gewicht Übung 1-3: Geben Sie jeweils ein Beispiel zu: (a) Scheineffekten (b) Konfundierung Übung 1-4: Gegeben: Untersuchung des Zusammenhangs zwischen Blutdruck und Geburtsgewicht (Tu, Gunnell & Gilthorpe, 2008): Blutdruck Geburtsgewicht normal hoch % normal Yules Q 90 kg gering % hoch % > 90 kg gering % hoch % Tab. 1-3: Kreuztabellierung der drei Faktoren Blutdruck (normal vs. hoch), Geburtsgewicht (gering, vs. hoch) und aktuellem Gewicht( 90 kg vs. > 90kg). Gemäss Tab. 1-3 gibt es einen leicht negativen Zusammenhang zwischen Geburtsgewicht und Blutdruck: Personen mit geringem Geburtsgewicht haben einen leicht erhöhten Blutdruck (wobei der Zusammenhang allerdings nur gering ausgeprägt ist). Dies gilt sowohl für die Personen mit aktuellem Gewicht 90 kg als auch für solche mit Gewicht > 90 kg. Für die zusammengefassten Daten, summiert über das aktuelle Gewicht, ergibt sich:
7 Übungen zu Kontingenz- und Kausalurteile 5 Blutdruck Geburtsgewicht normal hoch % normal Yules Q gering % hoch % Tab. 1-4: Kreuztabellierung der drei Faktoren Blutdruck (normal vs. hoch) und Geburtsgewicht (gering, vs. hoch). Die Werte ergeben sich durch aus den Daten von Tab. 1-3 durch Summation über den Faktor aktuelles Gewicht. Für die zusammengefassten Daten, summiert über das aktuelle Gewicht, ergibt sich nun ein positiver Zusammenhang zwischen geringem Blutdruck und Geburtsgewicht: Personen mit geringerem Geburtsgewicht haben eher einen normalen Blutdruck (73% vs. 64%). Erklären Sie möglichst genau die Gründe für die beobachtete Diskrepanz in der Beziehung zwischen Geburtsgewicht und Blutdruck zwischen Tab. 1-3 und Tab Lösung 1. In Tab. 1-3 gibt es keinen Zusammenhang zwischen Geburtsgewicht und Blutdruck: Der kleine negative Zusammenhang ist von geringer Bedeutung. 2. Der positive Zusammenhang zwischen geringem Geburtsgewicht und normalem Blutdruck intab kommt wie folgt zustande: (i) Die Personen mit aktuellem Gewicht 90 kg haben eher einen normalen Blutdruck und auch ein geringeres Geburtsgewicht. (ii) Es gibt viel mehr Personen mit Gewicht 90 kg in der Kategorie niedriges Geburtsgewicht (N = 428) als solche mit Gewicht > 90 kg (N = 58) [Vgl. die relative Grösse der Kreise auf der linken Seite von Abb. 1-2]. In der Kategorie hohes Geburtsgewicht sind beide Kategorien des aktuellen Gewichts ungefähr gleich häufig (N = 276 vs. N = 238) [Vgl. die relative Grösse der Kreise auf der rechten Seite von Abb. 1-2]. (iii) Fasst man nun die Daten über das aktuelle Gewicht zusammen, so wird die die Kategorie mit geringem Geburtsgewicht durch die Anzahl Personen mit aktuellem Gewicht 90 kg, für die ja durchwegs ein normaler Blutdruck vorliegt, bestimmt (Vergleiche die relative Grösse der linken Kreise in Abb. 1-2). Daher ist der prozentuale Anteil an Personen mit normalem Blutdruck
8 Übungen zu Kontingenz- und Kausalurteile 6 eher hoch. (Der linke Endpunkt der roten Linie in Abb. 1-2 liegt viel näher zum Mittelpunkt des oberen Kreises). Hingegen ist die Kategorie mit hohem Geburtsgewicht eine Mischung aus den beiden fast gleich grossen Mengen von Personen mit aktuellem Gewicht 90 kg und >90 kg (Vergleiche die relative Grösse der rechten Kreise in Abb. 1-2). Da letztere eher einen hohen Blutdruck aufweisen, ist daher in dieser Gruppe das Verhältnis der Anzahl Personen mit hohem zu jenen mit normalem Blutdruck eher ausgeglichen (Der rechte Endpunkt der roten Linie in Abb. 1-2 liegt daher ungefähr in der Mitte zwischen den Mittelpunkten der beiden rechten Kreise). Insgesamt ist daher in der Gruppe mit geringem Geburtsgewicht das Verhältnis von normalem zu hohem Blutdruck höher als in der Gruppe mit hohem Geburtsgewicht. Dies führt zu einem positiven Zusammenhang zwischen geringem Geburtsgewicht und normalen Blutdruck (vgl. die rote Linie in Abb. 1-2). Dieser Zusammenhang ist jedoch ein Artefakt, der sich durch die Ignorierung des aktuellen Gewichts ergibt. Prozentsatz normaler Blutdruck gering Gewicht 90 kg Gewicht >90 kg Geburtsgewicht Abb. 1-2: Diagramm von Paik zur Veranschaulichung des Effekts der Summation über die Variable aktuelles Gewicht: Der leicht negative Zusammenhang zwischen geringem Geburtsgewicht und normalen Blutdruck (repräsentiert durch die gestrichelten blauen Linien) verwandelt sich in einen positiven Zusammenhang (rote Linie). hoch
9 Übungen zu Kontingenz- und Kausalurteile 7 Übung 1-5: Gegeben: Die Daten zu Bsp.2-23 (Abb. 2-8). Berechne: a) Die falsche Regression, welche die Clusterstruktur ignoriert. b) Die korrekte Regression, welche die Clusterstruktur berücksichtigt. Berichte: (1) Das Ergebnis des Signifikanztests für den Regressionsparameter für (a). (2) Die drei Regressionsgleichungen für (b). (3) Das Ergebnis des Signifikanztests für den Regressionsparameter für (b). Lösung (1) Ergebnisse der Regression, welche die Clusterstruktur unberücksichtigt lässt. Koeffizient Schätzung Standardfehler t-wert p a b (2) Ergebnisse der Regression, welche die Clusterstruktur mit einbezieht: Koeffizient Schätzung Standardfehler t-wert p a b G G (3) Die Regressionsgeraden für die 3 Klassen lauten: Klasse 1: Aggression Intelligenz Klasse 2: Aggression Intelligenz Klasse 3: Aggression Intelligenz Übung 1-6: Lords Paradoxon (Lord, 1967): Gegeben: Die Daten zweier Gruppen (vgl. Abb. 1-3)
10 Übungen zu Kontingenz- und Kausalurteile 8 Test (nachher) Sekundarstufe (N = 250) Gymnasium (N = 250) Test (vorher) Abb. 1-3: Ergebnisse eines Test für Sekundarschüler und Gymnasiasten vor Eintritt ins Gymnasium und ein Jahr danach (Simulierte Daten). Die Ellipsen repräsentieren die 95%- Konfidenzbereiche der bivariaten Normalverteilungen für die beiden Populationen, aus denen die beiden Stichproben gezogen wurden. Die kleinen offenen Kreise repräsentieren die einzelnen Datenpunkte. Eingezeichnet sind auch die beiden Regressionsgeraden, welche sich aufgrund der gezogenen Stichproben ergeben. Demonstrieren Sie aufgrund der Daten Lords Paradoxon: (a) Führen Sie eine Kovarianzanalyse durch mit Test (nachher) als abhängige und Schule als unabhängige Variable, sowie mit Test (vorher) als Kovariate. Diese Analyse sollte einen signifikanten Effekt des Faktors Schule ergeben. (b) Nun führen Sie einen t-test für unabhängige Stichproben (die beiden Schultypen) auf die Differenz nachher vorher durch. Der t-test sollte keinen signifikanten Unterschied zwischen den beiden Gruppen ergeben. Bemerkung: Anstelle der Kovarianzanalyse kann auch eine Regressionsanalyse durchgeführt werden.
Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse. Lösungsblatt zu Nr. 2
Martin-Luther-Universität Halle-Wittenberg Institut für Soziologie Dr. Wolfgang Langer 1 Übungsblätter zu Methoden der Empirischen Sozialforschung IV: Regressionsanalyse Lösungsblatt zu Nr. 2 1. a) Je
MehrDrittvariablenkontrolle in der linearen Regression: Trivariate Regression
Drittvariablenkontrolle in der linearen Regression: Trivariate Regression 14. Januar 2002 In der Tabellenanalyse wird bei der Drittvariablenkontrolle für jede Ausprägung der Kontrollvariablen eine Partialtabelle
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
MehrBei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:
18 3 Ergebnisse In diesem Kapitel werden nun zunächst die Ergebnisse der Korrelationen dargelegt und anschließend die Bedingungen der Gruppenbildung sowie die Ergebnisse der weiteren Analysen. 3.1 Ergebnisse
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrBasis-Kurs Statistik und SPSS für Mediziner Lösungen. SPSS-Übung Korrelation, Regression und diagnostische Tests
Basis-Kurs Statistik und SPSS für Mediziner Lösungen SPSS-Übung Korrelation, Regression und diagnostische Tests Mit Datensatz Daten_SPSS_Kurs_I.sav Berechnung der Blutdruckreduktion vom Studienbeginn zum
MehrStatistik II: Signifikanztests /2
Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrAnwendungsaufgaben. a. Anhand des Streudiagramms (. Abb. 1) lässt sich ein linearer Zusammenhang vermuten. Aufgabe 1. Anhang 1: Lösungen der Aufgaben
Anhang 1: Lösungen der Aufgaben 15 +1). Korrelationskoeffizienten unterschiedlicher Stichproben oder verschiedener Variablen können so miteinander verglichen werden, was mit der Kovarianz nicht möglich
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrÜbung 3 im Fach "Biometrie / Q1"
Universität Ulm, Institut für Epidemiologie und Medizinische Biometrie, D-89070 Ulm Institut für Epidemiologie und Medizinische Biometrie Leiter: Prof. Dr. D. Rothenbacher Schwabstr. 13, 89075 Ulm Tel.
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrSkript zum Kurz-Referat:
Prof. Dr. Klaus-Jürgen Tillmann/ Michael Lenz WS 2001/02 Fakultät für Pädagogik (AG 4) der Universität Bielefeld Seminar: Anlage und : Der pädagogische Streit seit den 50er-Jahren 7. Sitzung: Die Erblichkeit
MehrKorrelation Regression. Wenn Daten nicht ohne einander können Korrelation
DAS THEMA: KORRELATION UND REGRESSION Korrelation Regression Wenn Daten nicht ohne einander können Korrelation Korrelation Kovarianz Pearson-Korrelation Voraussetzungen für die Berechnung die Höhe der
Mehr2. Generieren Sie deskriptive Statistiken (Mittelwert, Standardabweichung) für earny3 und kidsunder6yr3 und kommentieren Sie diese kurz.
Statistik II Übung : Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (6-24 Jahre alt) und der Anzahl der unter
MehrBivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation
Bivariater Zusammenhang bei metrischen Variablen: Regression und Korrelation PEΣO 12. November 2001 Von der Tabellenanalyse zur Regression Die bivariate Verteilung zweier metrischer Variablen kann konzeptionell
MehrAusführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm
y Aufgabe 3 Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6 a) Zur Erstellung des Streudiagramms zeichnet man jeweils einen Punkt für jedes Datenpaar (x i, y i ) aus der zweidimensionalen
MehrRegression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate
Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
Mehr19 Punkte. Aufgabe 1. Einkommen niedrig mittel hoch Männer Frauen Geschlecht. a) Bestimmen Sie die fehlenden Werte!
Aufgabe 1 19 Punkte Sie haben die Einkommensdaten von 369 Personen gegeben. Diese wurden in die Gehaltsgruppen niedrige, mittlere und hohe Einkommensklassen kategorisiert - jeweils nach Frauen und Männer
MehrEinführung 17. Teil I Kopfüber eintauchen in die Statistik 23. Kapitel 1 Kategoriale Daten zusammenfassen: Häufigkeiten und Prozente 25
Inhaltsverzeichnis Einführung 17 Über dieses Buch 17 Törichte Annahmen über den Leser 19 Wie dieses Buch aufgebaut ist 19 Teil I: Kopfüber eintauchen indie Statistik 19 Teil II: Von Wahrscheinlichkeiten,
MehrStatistik II Übung 1: Einfache lineare Regression
Statistik II Übung 1: Einfache lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen dem Lohneinkommen von sozial benachteiligten Individuen (16-24 Jahre alt) und der Anzahl der
MehrZiel der linearen Regression
Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine
MehrKlausurvorbereitung - Statistik
Aufgabe 1 Klausurvorbereitung - Statistik Studenten der Politikwissenschaft der Johannes Gutenberg-Universität wurden befragt, seit wie vielen Semestern sie eingeschrieben sind. Berechnen Sie für die folgenden
MehrBiometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern
Biometrieübung 10 (lineare Regression) - Aufgabe Biometrieübung 10 Lineare Regression Aufgabe 1. Düngungsversuch In einem Düngeversuch mit k=9 Düngungsstufen x i erhielt man Erträge y i. Im (X, Y)- Koordinatensystem
MehrInhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
Mehr» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller
» SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela
MehrKonfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert
Konfidenzintervalle Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Anteilswert Differenzen von Erwartungswert Anteilswert Beispiel für Konfidenzintervall Im Prinzip haben wir
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrDr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp
Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:
MehrWie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung
Wie kann ich überprüfen, welche Verteilung meinen Daten zu Grunde liegt? Chi-Quadrat-Test auf Normalverteilung T. Kießling: Fortgeschrittene Fehlerrechnung - Korrelation 5.04.018 Vorlesung 03-1 Chi-Quadrat-Test:
Mehr9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T
9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrStatistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS
Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21
MehrMethodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 10 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie als Wissenschaft
Mehrlimhatewerzeoelhiniii
limhatewerzeoelhiniii Vorwort 13 Kapitel 1 Einleitung 15 1.1 Wozu brauchen wir Statistik? 16 1.2 Medizinische Statistik 16 1.3 Beschreibende und schließende Statistik 17 1.4 Das Buch in Kürze 17 Kapitel
MehrÜbungsbuch Statistik für Dummies
beborah Rumseif Übungsbuch Statistik für Dummies WILEY- VCH WILEY-VCH Verlag GmbH & Co. KGaA Inhaltsverzeichnis Über die Autorin 8 Über den Übersetzer 8 Einführung 15 Über dieses Buch 15 Törichte Annahmen
MehrInformationen zur KLAUSUR am
Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,
MehrEinführung in die Statistik
Elmar Klemm Einführung in die Statistik Für die Sozialwissenschaften Westdeutscher Verlag INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten 11 1.1 Grundgesamtheit, Stichprobe 12 1.2 Untersuchungseinheit,
MehrInhaltsverzeichnis Einführung und deskriptive Statistik Grundlagen der Inferenzstatistik 1: Zufallsvariablen
Inhaltsverzeichnis 1 Einführung und deskriptive Statistik... 1 1.1 Wichtige mathematische Schreibweisen... 1 1.1.1 Das Summenzeichen... 1 1.1.2 Mengentheoretische Schreibweisen... 3 1.1.3 Variablentransformationen...
MehrAnalysen politikwissenschaftlicher Datensätze mit Stata. Sitzung 6: Übung zur logistischen Regression
n politikwissenschaftlicher Datensätze mit Stata Sitzung 6: Übung zur logistischen Regression 1 Vorbereitung Laden Sie den Datensatz z:\logitdemo Der Datensatz enthält 2000 Fälle, von denen 69 die Republikaner
MehrAnwendung von Multi-Level Moderation in Worst Performance Analysen
Anwendung von Multi-Level Moderation in Worst Performance Analysen Präsentation auf der FGME 2015 - Jena Gidon T. Frischkorn, Anna-Lena Schubert, Andreas B. Neubauer & Dirk Hagemann 16. September 2015
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrPraxis der Regressionsanalyse
Praxis der Regressionsanalyse Von Samprit Chatterjee New York University und Bertram Price Price Associates, Inc., Washington, D. C. Aus dem Amerikanischen übertragen von Prof. Dr. Gunter Lorenzen Universität
MehrPrüfung aus Statistik 2 für SoziologInnen
Prüfung aus Statistik 2 für SoziologInnen 11. Oktober 2013 Gesamtpunktezahl =80 Name in Blockbuchstaben: Matrikelnummer: Wissenstest (maximal 16 Punkte) Kreuzen ( ) Sie die jeweils richtige Antwort an.
MehrKapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.
Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte
MehrBiomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
MehrTest von Hypothesen: Signifikanz des Zusammenhangs (F-Test)
Test von Hyothesen: Signifikanz des Zusammenhangs (F-Test) Die Schätzung der Regressionsfunktion basiert auf Daten einer Stichrobe Inwiefern können die Ergebnisse dieser Schätzung auf die Grundgesamtheit
MehrAnalyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen
Analyse von Querschnittsdaten Spezifikation der unabhängigen Variablen Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Annahmen gegeben? kategoriale Variablen Datum 3.0.004 0.0.004
MehrInferenz im multiplen Regressionsmodell
1 / 29 Inferenz im multiplen Regressionsmodell Kapitel 4, Teil 1 Ökonometrie I Michael Hauser 2 / 29 Inhalt Annahme normalverteilter Fehler Stichprobenverteilung des OLS Schätzers t-test und Konfidenzintervall
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrElliptische Regression von Datenpunkten
Elliptische Regression von Datenpunkten Dipl.- Ing. Björnstjerne Zindler, M.Sc. Erstellt: 17. Oktober 2013 Letzte Revision: 30. April 2014 Inhaltsverzeichnis 1 Die Elliptische Regression im Allgemeinen
Mehrx erhielt die Rücklauf/Responsequote. Im Vergleich auch zu anderen Kennzahlen ist bei der Responsequote die Standardabweichung am geringsten (1,95).
höchsten Zustimmungswert ( = 5,7) x erhielt die Rücklauf/Responsequote. Im Vergleich auch zu anderen Kennzahlen ist bei der Responsequote die Standardabweichung am geringsten (1,95). 3. Kennzahl entscheidet
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
MehrAnnahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
MehrDeskriptive Beschreibung linearer Zusammenhänge
9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 Beispiel: p-wert bei Varianzanalyse (Grafik) Bedienungszeiten-Beispiel, realisierte Teststatistik F = 3.89,
MehrEinkommensverteilung 5 Die Verteilung der Einkommen in der Welt
Einkommensverteilung 5 Die Verteilung der Einkommen in der Welt Fragestellung Wird die Welt insgesamt gleicher oder ungleicher? (i) Sinkt oder steigt die Ungleichheit der Durchschnittseinkommen zwischen
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 12. Januar 2011 1 Vergleich zweier Erwartungswerte Was heißt verbunden bzw. unverbunden? t-test für verbundene Stichproben
MehrVerfahren zur Überprüfung von Zusammenhangshypothesen
Verfahren zur Überprüfung von Zusammenhangshypothesen 0. Allgemeines Wir haben uns bisher mit Unterschiedshypothesen beschäftigt (Unterschiede von Stichproben in Bezug auf abhängige Variablen). Im Folgenden
MehrMultiple Regressionsanalyse - Kurzabriss
Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen
MehrStatistik K urs SS 2004
Statistik K urs SS 2004 3.Tag Grundlegende statistische Maße Mittelwert (mean) Durchschnitt aller Werte Varianz (variance) s 2 Durchschnittliche quadrierte Abweichung aller Werte vom Mittelwert >> Die
Mehr5. Übung Zusammenhänge zweier Merkmale
Querschnittsbereich 1: Epidemiologie, Medizinische Biometrie und Medizinische Informatik - Übungsmaterial - Erstellt von Mitarbeitern des IMISE und des ZKS Leipzig. Übung Zusammenhänge zweier Merkmale
MehrPrüfungsliteratur: Rudolf & Müller S
1 Beispiele zur univariaten Varianzanalyse Einfaktorielle Varianzanalyse (Wiederholung!) 3 Allgemeines lineares Modell 4 Zweifaktorielle Varianzanalyse 5 Multivariate Varianzanalyse 6 Varianzanalyse mit
MehrPolynomiale Regression lässt sich mittels einer Transformation der Merkmale auf multiple lineare Regression zurückführen
Rückblick Polynomiale Regression lässt sich mittels einer Transformation der Merkmale auf multiple lineare Regression zurückführen Ridge Regression vermeidet Überanpassung, indem einfachere Modelle mit
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrKapitel 10. Multikollinearität. Exakte Multikollinearität Beinahe Multikollinearität
Kapitel 0 Multikollinearität Exakte Multikollinearität Beinahe Multikollinearität Exakte Multikollinearität Unser Modell lautet y = Xb + u, Dimension von X: n x k Annahme : rg(x) = k Wenn sich eine oder
MehrStichwortverzeichnis. E Extrapolation, außerhalb des Datenbereichs 230
335 Stichwortverzeichnis A Abweichung 12 mittlere 13 Additivität 141 Anova siehe Varianzanalyse Anpassungsgüte 252, 279 χ 2 -Test zur 270 279 mehr als zwei Klassen 272 274 Anpassungstest (χ 2 ) 270 278
MehrDiagnostik von Regressionsmodellen (1)
Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer
Mehrsimple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall
Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch
MehrMethodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrT-Test für unabhängige Stichproben
T-Test für unabhängige Stichproben Wir gehen von folgendem Beispiel aus: Wir erheben zwei Zufallstichproben, wobei nur die Probanden der einen Stichprobe einer speziellen experimentellen Behandlung (etwa
MehrMethoden empirischer Sozial- und Wirtschaftsforschung
Dr. sc. Siassi HTW Berlin Januar 2017 Klausur Methoden empirischer Sozial- und Wirtschaftsforschung Aufgabe 1 40 Punkte Fallzusammenfassung Fälle Gültig Fehlend Gesamt N Prozent N Prozent N Prozent $Verkehrsmittel
MehrÜbungsblatt 10: Lineare Regression (Sitzung 11)
1 Übungsblatt 10: Lineare Regression (Sitzung 11) Aufgabe 1 a) Nach welchem Kriterium wird die Regressionsgerade zur Vorhersage von Y-Werten festgelegt? b) Was sind die Gemeinsamkeiten und Unterschiede
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
Mehr1.1. Zusammenhänge und Vorhersagen
1.1. Zusammenhänge und Vorhersagen In diesem Kapitel dreht sich alles um Zusammenhänge und Vorhersagen. Anstatt uns zu fragen Was ist größer / mehr / ausgeprägter?, versuchen wir Aussagen zu treffen wie
Mehr7.1 Korrelationsanalyse. Statistik. Kovarianz. Pearson-Korrelation. Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien
Statistik 7.1 Korrelationsanalyse Institut für angewandte Statistik & EDV Universität für Bodenkultur Wien Sommersemester 2012 7 Regressions- und Korrelationsanalyse Kovarianz Pearson-Korrelation Der (lineare)
MehrBeispiel: Multiples Modell/Omitted Variable Bias I
4 Multiple lineare Regression Konfidenzintervalle und Tests 4.3 Beispiel: Multiples Modell/Omitted Variable Bias I Beispieldatensatz mit Daten zur Lohnhöhe (y i ), zu den Ausbildungsjahren über den Hauptschulabschluss
MehrInferenzstatistik verstehen
Markus Janczyk Roland Pfister Inferenzstatistik verstehen Von A wie Signifikanztest bis Z wie Konfidenzintervall ^ Springer Spektrum vii 1 Einführung und deskriptive Statistik 1 1.1 Wichtige mathematische
MehrDie Regressionsanalyse
Die Regressionsanalyse Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen eine unabhängige Variable Einfachregression mehr als eine unabhängige
MehrB. Regressionsanalyse [progdat.sav]
SPSS-PC-ÜBUNG Seite 9 B. Regressionsanalyse [progdat.sav] Ein Unternehmen möchte den zukünftigen Absatz in Abhängigkeit von den Werbeausgaben und der Anzahl der Filialen prognostizieren. Dazu wurden über
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrKreuzvalidierung. 1. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS:
Kreuzvalidierung. Schritt: Aufteilung der Stichprobe in ungefähr gleiche Hälften nach dem Zufall. SPSS: SPSS erzeugt eine neue Variable Filter_$. Die herausgefilterten Fälle werden im Datenfenster angezeigt
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrStatistik für Psychologen
Peter Zöfel Statistik für Psychologen Im Klartext Higher Education München Harlow Amsterdam Madrid Boston San Francisco Don Mills Mexico City Sydney a part of Pearson plc worldwide Statistik für Psychologen
MehrStatistik II Übung 3: Hypothesentests Aktualisiert am
Statistik II Übung 3: Hypothesentests Aktualisiert am 12.04.2017 Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier
MehrBiomathematik für Mediziner, Klausur SS 2000 Seite 1
Biomathematik für Mediziner, Klausur SS 2000 Seite 1 Aufgabe 1: Bei der Diagnose einer bestimmten Krankheit mit einem speziellen Diagnoseverfahren werden Patienten, die tatsächlich an der Krankheit leiden,
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrÜbungen mit dem Applet Vergleich von zwei Mittelwerten
Vergleich von zwei Mittelwerten 1 Übungen mit dem Applet Vergleich von zwei Mittelwerten 1 Statistischer Hintergrund... 2 1.1 Typische Fragestellungen...2 1.2 Fehler 1. und 2. Art...2 1.3 Kurzbeschreibung
MehrDemokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik
Demokurs Modul 3741 Vertiefung der Wirtschaftsmathematik und Statistik Kurs 41 Vertiefung der Statistik 15. Juli 010 Seite: 14 KAPITEL 4. ZUSAMMENHANGSANALYSE gegeben, wobei die Stichproben(ko)varianzen
Mehr