Fortgeschrittene Statistik Logistische Regression

Größe: px
Ab Seite anzeigen:

Download "Fortgeschrittene Statistik Logistische Regression"

Transkript

1 Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E R E G R E S S I O N M I T D U M M Y - V A R I A B L E N Zentrale Methodenlehre, Europa Universität - Flensburg

2 Anwendung 2 In welchen Situationen ist die (Binär) logistische Regression anwendbar? Wenn man eine abhängige Variable vorhersagen möchte, die Werte zwischen 0 und 1 liegen oder die Variable dichotom ist, ist die logistische Regression geeignet. Eine dichotome Variable ist eine Variable mit zwei Ausprägungen: Krank oder gesund Bestanden oder durchgefallen Vertrauenswürdig oder unzuverlässig Raucher oder Nichtraucher Erfolg oder Misserfolg Angestellt oder Arbeitslos Ausgezeichnet oder nicht ausgezeichnet OLS Regression ist in diesen Fall nicht geeignet, weil die Interpretation der OLS- Koeffizienten die Dichotomie der abhängigen Variable nicht im Betracht zieht.

3 Beispiel: Ausgezeichnet 3 Nehmen wir an, man möchte einen Modell bauen, das vorhersagen muss, ob ein Student am Ende eines Semesters ausgezeichnet wird. Um das Modell zu bauen, hat man folgende Informationen: die Mathe-Note von früheren Studierenden (Mathe), Geschlecht (Frau) (1, wenn sie Frauen sind), und die Information, ob die Studierenden ausgezeichnet wurden (Ausgezeichnet) (0: der Studierende wurde nicht ausgezeichnet; 1: der Studierende wurde ausgezeichnet): Wenn man z.b. das OLS-Modell Ausgezeichnet = β 0 + β 1 Mathe berechnen würde, bekommt man das folgende Ergebnis: Die Interpretation der Koeffizient für Mathe sagt uns, dass jeder zusätzliche Punkt Mathe das Merkmal Ausgezeichnet um Einheiten erhöht. Diese Interpretation macht aber kein Sinn, weil Ausgezeichnet nur 0 oder 1 sein kann. Interessanter könnte es sein, wenn wir eine Einschätzung der Wahrscheinlichkeit, Ausgezeichnet zu werden, vorhersagen könnten, wenn man eine Mathenote hat. Das kann man mit einer Logistische Regression berechnen.

4 Grundbegriffe: Odds 4 Grundbegriffe (1): In der Stichprobe in unserem Beispiel gibt es 6 Studierende, die ausgezeichnet wurden. Folgende Begriffe bzw. Definitionen müssen verstanden werden: Die relative Häufigkeit, ausgezeichnet zu sein, lautet f Ausgezeichnet = 6 20 = 0.3 bzw. 30%. Wenn wir eine Population hätten, würden wir über die Wahrscheinlichkeit ausgezeichnet zu werden sprechen: P(Ausgezeichnet) = p. Die relative Häufigkeit, nicht ausgezeichnet zu werden, ist dann f Ausgezeichnet = 0.7 ; In Wahrscheinlichkeitstermen wäre das: P(Ausgezeichnet) = 0.7 = 1-p. Die Odds (Chancen) dafür, ausgezeichnet zu werden, sind wie folgt definiert: Odds dafür (Ausgezeichnet = 1) = p (1 p) = = ; Mögliche Interpretationen wären: von jede 10 Studierenden werden 3 ausgezeichnet oder die Chancen, ausgezeichnet zu werden, betragen ungefähr 0.43.

5 Grundbegriffe (2): Grundbegriffe: Odds-Ratio 5 In der Stichprobe in unserem Beispiel sieht die Kreuztabelle der Variablen Frau und Ausgezeichnet wie folgt aus: Folgende Informationen kann man aus der Kreuztabelle ableiten: Prozent der Männer, die ausgezeichnet werden, beträgt 2/10 Prozent der Frauen, die ausgezeichnet werden, beträgt 4/10 Die Odds (dafür), dass einen Mann ausgezeichnet wird, betragen 2/8 (Von 10 Männer werden 2 ausgezeichnet). Die Odds (dafür), dass eine Frau ausgezeichnet wird, betragen 4/6. Die Odds-Ratio (OR), dass eine Frau ausgezeichnet wird (im Vergleich mit Männern), ist OR = (4/6) / (2/8) = 8/3. Das bedeutet, dass die Chancen einer Frau ausgezeichnet zu werden 166% höher sind als die Chancen von einem Mann.

6 Logit-Transformation 6 Die Logit-Transformation wird definiert als der natürliche Logarithmus der Odds, einen Erfolg zu haben. Gegeben die Wahrscheinlichkeit eines Erfolgs p, ist die Logit-Transformation : Z = Logit p = LN Odds Erfolg = LN p 1 p Mit der Logit-Transformation kann man gültige Werte für p generieren, durch die sogenannte Logistische Funktion: p = e Z

7 Logistische Regression - Modell 7 Wenn man Werte einer dichotomen Variable Y mit Ausprägungen 0 (Misserfolg) und 1 (Erfolg), durch eine oder mehrere Prädiktoren (erklärende Variablen) x 1, x 2,, x n vorhersagen möchte, wird angenommen, dass es eine lineare Beziehung zwischen den Prädiktoren und dem Logarithmus der Odds (logit Transformation) gibt, dass Y den Wert 1 annimmt. Das heißt: Wobei p = P(Y=1). Z = logit(p) = LN p 1 p = β 0 + β 1 x β n x n + u Lass uns eine logistische Regression einsetzen, um vorherzusagen, ob ein Studierender ausgezeichnet wird, wenn man als Prädiktor die Mathe-Note der Studierenden benutzt. Das Modell lautet dann LN p 1 p = β 0 + β 1 Mathe + ε; wobei p = P(Ausgezeichnet = 1) Um das Modell zu berechnen, benutzen wir die Datei klein_beispiel.sav.

8 Logistische Regression mit SPSS (1) Um das Modell LN p 1 p folgen wir der folgenden Prozedur: Prozedur: 8 = β 0 + β 1 Mathe + u mit SPSS zu berechnen, Datei Klein_Beispiel.sav mit SPSS öffnen. Um eine logistische Regression durchzuführen: Analysieren Regression Binär Logistisch anklicken. Ausgezeichnet als abhängige Variable auswählen. Mathe als Kovariate auswählen. Wenn man eine besondere Methode möchte, dies in der Option Methoden auswählen. Wir lassen den Default Methode Einschluss. OK anklicken. SPSS-Output interpretieren.

9 Logistische Regression mit SPSS (2) Logistische Regressionsanalyse durchführen: 9 2 1

10 Logistische Regression mit SPSS (3) 10 Die Logistische Regressionsanalyse erzeugt folgenden Output im Ausgabe-Fenster: Ergebnis der logistischen Regression ohne Prädiktoren Ergebnis des Unabhängigkeitstests: Wenn der P-Wert < α, dann gibt es einen Zusammenhang zwischen die abhängige (Ausgezeichnet) und unabhängigen Variablen (Mathe). Diese Werte messen die Stärke der Beziehung zwischen Ausgezeichnet und Mathe. Diese Tabelle vergleicht observed (beobachtete) Ausgezeichnet-Werte mit der durch das Modell vorhergesagte Werte für jeden Fall im Datensatz. Hier kann man sehen, in wie viel % der Fälle richtig klassifiziert wurde. Diese Tabelle zeigt die berechnete Koeffizienten des Modells an. In diesem Fall: β 0 und β 1. 4 Ergebnis der logistischen Regression mit Mathe -Prädiktor

11 Logistische Regression mit SPSS (4) 11 Logistische Regressionsanalyse: Output Anfangsblock Modell ohne Prädiktoren: Das Modell zu berechnen lautet: LN p 1 p = β 0 + u Anzahl der Fälle, die richtig klassifiziert wurden. In diesen Beispiel wurden alle Ausgezeichnet -Studierende falsch klassifiziert. 70% der Fälle wurden richtig klassifiziert. Das Modell berechnet für jeden Fall die Wahrscheinlichkeit p=p(ausgezeichnet = 1) (*). Wenn p < 0.5, wird der Fall als nicht ausgezeichnet klassifiziert. β 0 Das berechnete Modell ist dann logit(p) = 0, 847. (*): Zum Beispiel: Für einen Studierenden mit Mathe=50, ist p = ist p immer 0.3 < 0.5, und deswegen sind alle Fälle als nicht ausgezeichnet klassifiziert. 1+e =0.3; die Mathe-Information wird hier nicht benutzt; also

12 Logistische Regression mit SPSS (5) 12 Logistische Regressionsanalyse: Output Anfangsblock Interpretation des Koeffizienten β 0 : β 0 P-Wert e β 0 Die Koeffizienten β i einer logistischen Regression werden nicht direkt interpretiert. Die Interpretation der Koeffizienten wird in Funktion von Odds oder Odds-Ratios vorgenommen. In diesem Fall, in einem Modell ohne Prädiktoren, wird durch die Interpretation von β 0 folgende Frage beantwortet: Was sind die Chancen (Odds), ausgezeichnet zu werden? LN p 1 p = β 0 p 1 p = eβ 0 Odds Ausgezeichnet = 1 = e β 0 = Das heißt, die Chancen ausgezeichnet zu werden, sind bzw. ca. 3/7 (von 10 Studenten werden 3 ausgezeichnet). Dieser Koeffizient ist auf dem 10%-Niveau signifikant (P-Wert=0,082).

13 Logistische Regression mit SPSS (6) 13 Logistische Regressionsanalyse: Output Block 1: Güte des Gesamtsmodells, Stärke des Zusammenhangs und Klassifikationstabelle: P-Wert Ergebnis des Tests der Güte des Gesamtsmodells. Die Null-Hypothese (H 0 ) ist in diesen Fall, dass das Modell logit p = β 0 + β 1 Mathe + u kein gültiges Modell ist, um Odds in der Grundgesamtheit dazu, ausgezeichnet zu werden, vorhersagen zu können. Die P-Werte sind alle kleiner als 0.05; das heißt, H 0 kann verworfen werden. Das Modell ist auf dem 5%- Signifikanz Niveau gültig. Die Cox & Snell R-Quadrat und Nagelkerkes R-Quadrat Werte messen die Stärke der Beziehung zwischen Ausgezeichnet und Mathe. Beide Werte sind zwischen 0 und 1, aber können nicht wie die R 2 der OLS Regressionsanalyse interpretiert werden. Es gilt aber: je größer, desto besser, sie nehmen den Wert 1 an, wenn das Modell perfekte Vorhersagen macht. In diesem Beispiel sind beide Werte mittelgroß (nicht so schlecht). Mit der Hinzunahme des Prädiktors Mathe, klassifiziert das Modell jetzt 75% der Fälle richtig (Im Anfangsblock klassifiziert das Modell [ohne Prädiktoren] nur 70% der Fälle richtig). Das Modell mit Mathe klassifiziert jetzt 2 (33.3%) der ausgezeichneten Fälle richtig, ebenso wie alle nicht ausgezeichnete Fälle.

14 Logistische Regression mit SPSS (7) 14 Logistische Regressionsanalyse: Output Block 1: Interpretation der Koeffizienten: Beide Koeffizienten sind signifikant, aber nicht auf dem 5%-Niveau (P-Wert Mathe = 0.08; P-Wert Konstante =0.07) e β 0=0 bedeutet, dass einen Studierender mit 0 Punkten in Mathe keine Chancen hat, ausgezeichnet zu werden. Um den Koeffizienten β 1 zu interpretieren, fragt man sich, wie die Chancen, ausgezeichnet zu werden, durch jeden zusätzlichen Punkt in der Mathenote beeinflusst wird; zum Beispiel von Mathe=52 zu Mathe=53 Dem Output zufolge haben wir: Für Mathe = 52 logit(p) Mathe=52 = *52 Für Mathe = 53 logit(p) Mathe=53 = *53 logit(p) Mathe=53 - logit(p) Mathe=52 = 0.21 LN( Odds(Ausgezeichnet = 1) Mathe=53 Odds(Ausgezeichnet = 1) Mathe=52 ) = 0.21 Odds-Ratio(Ausgezeichnet = 1) = e β 1=e 0.21 = Das heißt, jeder zusätzliche Punkt in Mathe die Chancen, ausgezeichnet zu werden, um 22.7% erhöht.

15 Logistische Regression mit SPSS (8) 15 Logistische Regressionsanalyse - Interpretation der e β i Termen für Prädiktor-Variablen: Die Terme e β i - (Odds-Ratios) können folgende Werte aufweisen: < 1 Es gibt einen negativen Zusammenhang zwischen der abhängigen und der unabhängigen Variablen; jede zusätzliche Einheit der unabhängigen Variable senkt die Chancen von Erfolg um 100*(1 - e β i)%; z.b. im Modell LN p 1 p = β 0 + β 1 Mathe + u; wenn e β 1 = 0.92 wäre, würde das bedeuten, dass jeder zusätzliche Punkt in Mathe die Chancen, ausgezeichnet zu werden, um 100*(1-0.92)% = 8% senkt. e β i = 1 Es gibt keinen Zusammenhang zwischen der abhängigen und der unabhängigen Variablen; jede zusätzliche Einheit der unabhängigen Variable beeinflusst die Chancen von Erfolg nicht. > 1 Es gibt einen positiven Zusammenhang zwischen der abhängigen und der unabhängigen Variablen; jede zusätzliche Einheit der unabhängigen Variable erhöht die Chancen von Erfolg im 100(e β i -1)%; Das ist der Fall bei logit(p) = *Mathe; wobei e 0.21 = 1.227

16 Logistische Regression mit Dummy-Variablen 16 Wie ändert sich das Ergebnis, wenn man das Geschlecht der Studierenden zum Modell addiert: LN p 1 p Frau eine Dummy-Variable ist ; In SPSS: Prozedur: = β 0 + β 1 Mathe + β 2 Frau + u ; wobei Datei Klein_Beispiel.sav mit SPSS öffnen. Um eine logistische Regression durchzuführen: Analysieren Regression Binär Logistisch anklicken. Ausgezeichnet als abhängige Variable auswählen. Mathe und Frau als Kovariaten auswählen. Wenn man eine besondere Methoden möchte, dies in der Option Methoden auswählen. Wir lassen die Default Methode Einschluss. OK anklicken. SPSS-Output interpretieren.

17 Logistische Regression mit Dummy-Variablen (2) 17 Die Logistische Regressionsanalyse erzeugt folgenden Output im Ausgabe-Fenster: Der Anfangsblock wird hier nicht angezeigt. Es gibt keinen Unterschied mit dem, was im Folie 10 gezeigt wurde: Das Ergebnis eines Modells ohne Prädiktoren Das Ergebnis des Omnibus-Tests (Güte des Gesamtsmodells) zeigt, dass das Modell mit Frau und Mathe gültig für die Population ist auf einem 6% Signifikanzniveau (P-Wert = 0.06). Im Vergleich mit dem Modell LN einen Pseudo-R 2 p 1 p = β 0 + β 1 Mathe + u, das von 0.33 hatte, hat das neue Modell LN β 0 + β 1 Mathe + β 2 Frau + u einen Pseudo-R 2 von 0.354, also eine Verbesserung. Die Klassifikationstabelle zeigt, dass das Modell mit der Dummy- Variablen Frau 80% der Fälle richtig klassifiziert. Das Modell ohne die Dummy-Variable hatte nur 75% der Fälle richtig klassifiziert. p 1 p = Im Bezug auf die Signifikanz der Koeffizienten, zeigt der Output, dass trotz Verbesserungen des Modells die Dummy-Variable Frau nicht signifikant ist (P-Wert > 0.1), während Mathe nur auf dem 10%-Nivaeu signifikant ist (P-Wert = 0.09), und die Konstante auf dem 7%-Niveau (P-Wert = 0.07). Die mangelnde Signifikanz könnte mit dem geringen Umfang der Stichprobe zusammenhängen: n = Die Referenzkategorie ist in diesem Fall männliche Studenten mit 0 Punkten im Mathe. Das heißt, e β 0= 0 bedeutet, dass männliche Studierende mit Note 0 in Mathe keine Chancen haben, ausgezeichnet zu werden.

18 Logistische Regression mit Dummy-Variablen (3) 18 Logistische Regressionsanalyse: Output Block 1: Interpretation der Koeffizienten: Ähnlich wie im ersten Modell können wir e β 1 interpretieren: ceteris paribus, die Odds (Chancen) ausgezeichnet zu werden erhöhen sich mit jeden zusätzlichen Punkt in Mathe um 22.7%. Auch wenn der Koeffizient für die Dummy-Variablen β 2 nicht signifikant ist, kann man e β 2 als einen Odds-Ratio interpretieren: Die Odds (Chancen), dass eine weibliche Studentin ausgezeichnet wird, im Vergleich mit einen männlichen Studenten: Für Frau = 0 logit(p) Mann = *Mathe Für Frau = 1 logit(p) Frau = *Mathe *1 logit(p) Frau - logit(p) Mann 0.75 LN( Odds(Ausgezeichnet = 1) Frau Odds(Ausgezeichnet = 1) Mann ) = Odds-Ratio(Ausgezeichnet = 1) = e β 2=e = Das heißt, ceteris paribus, dass die Chancen einer weiblichen Studentin, ausgezeichnet zu werden, ca. 113% höher sind als die von männlichen Studenten.

19 Übung 1 19 Übung 1: Mit der Datei ausgezeichnet.sav: 1. Wie hoch sind die Odds, ausgezeichnet zu werden, wenn man ein logistisches Modell ohne erklärende Variablen hat? Wie viel % der Fälle werden mit diesem Modell richtig vorhergesagt? 2. Berechnen Sie folgende Odds, ohne eine logistische Regression durchzuführen: 1. Odds, dass ein Mann ausgezeichnet wird. 2. Odds, dass eine Frau ausgezeichnet wird. 3. Odds-ratio, dass eine Frau ausgezeichnet wird, verglichen mit männlichen Studenten. 3. Führen Sie eine logistische Regression mit der Variablen Frau als erklärender Variable durch. Interpretieren Sie die Koeffizienten der logistischen Regression und vergleichen Sie sie mit den Ergebnissen zu Frage 2. Wie viel % der Fälle werden mit diesem Modell richtig vorhergesagt? 4. Führen Sie eine logistische Regression mit der Variablen Mathe als erklärende Variable durch. Interpretieren Sie die Koeffizienten der logistischen Regression. Wie viel % der Fälle werden mit diesem Modell richtig vorhergesagt? 5. Führen Sie eine logistische Regression mit allen Variablen durch und interpretieren Sie die Koeffizienten.

20 Übung 2 20 Übung 2: Mit der Datei Margarine_Problem.sav: Berücksichtigen wir folgende Variablen, um den Kauf eine bestimmter Margarinemarke vorherzusagen (Quelle: Backhaus, Multivariate Analysemethoden) käufer: Käufer von Margarine. Käufer = 0: Kunde hat die Margarine nicht gekauft. Käufer = 1: Kunde hat die Margarine gekauft. streichf: Margarinestreichfähigkeit und ihre Bedeutung als Grund für den Margarinekauf. Streichf = 1: Geringe Kaufbedeutung bis Streichf = 7: Hohe Kaufbedeutung haltbark: Margarineshaltbarkeit und ihre Bedeutung als Grund für den Margarinekauf. haltbark= 1: Geringe Kaufbedeutung bis haltbark = 7: Hohe Kaufbedeutung Führen Sie eine logistische Regression durch, um den Effekt der Variablen Streichf und haltbark auf die Kaufentscheidung bei der Margarine zu untersuchen.

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Fortgeschrittene Statistik SPSS Einführung

Fortgeschrittene Statistik SPSS Einführung Fortgeschrittene Statistik SPSS Einführung Q U A N T I T A T I V E M E R K M A L E, Q U A L I T A T I V E M E R K M A L E, A U S P R Ä G U N G E N, C O D I E R U N G E N, S K A L E N N I V E A U, D A T

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Kapitel 9: Verfahren für Nominaldaten

Kapitel 9: Verfahren für Nominaldaten Kapitel 9: Verfahren für Nominaldaten Eindimensionaler Chi²-Test Der eindimensionale χ²-test wird dann herangezogen, wenn die Versuchspersonen einer Population anhand eines Merkmals mit zwei oder mehr

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Übungen zur Veranstaltung Statistik 2 mit SPSS

Übungen zur Veranstaltung Statistik 2 mit SPSS Raum 22, Tel. 39 4 Aufgabe 5. Wird der neue Film MatchPoint von Woody Allen von weiblichen und männlichen Zuschauern gleich bewertet? Eine Umfrage unter 00 Kinobesuchern ergab folgende Daten: Altersgruppe

Mehr

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at Koeffizienten der Logitanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at 1 Kurt Holm Koeffizienten der Logitanalyse Eine häufig gestellte Frage lautet:

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung

Mehr

Multivariate Analyseverfahren

Multivariate Analyseverfahren Multivariate Analyseverfahren Logistische Regression Prof. Dr. Stein 14.01.2014 & 20.01.2014 1 / 62 Inhaltsverzeichnis 1 Grundidee 2 3 4 5 2 / 62 Der Erklärungsgegenstand Soziale Forschungsgegenstände

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent?

PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Anwendungen PROC LOGISTIC: Warum sind die Koeffizienten nicht mit den Odds Ratios konsistent? Ulrike Braisch, Rainer Muche Institut für Epidemiologie und Medizinische Biometrie Universität Ulm Schwabstraße

Mehr

Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung

Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Die binäre Logistische Regression ein vielseitiges und robustes Analyseinstrument sozialwissenschaftlicher Forschung Eine Einführung für Anwender - Marcel Erlinghagen - Gelsenkirchen, Oktober 2003 Gliederung

Mehr

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression

Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Weitere Fragestellungen im Zusammenhang mit einer linearen Einfachregression Speziell im Zusammenhang mit der Ablehnung der Globalhypothese werden bei einer linearen Einfachregression weitere Fragestellungen

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Master of Science in Pflege

Master of Science in Pflege Master of Science in Pflege Modul: Statistik Einfache und multiple Regressionsanalyse / Logistische Regressionsanalyse November 2012 Prof. Dr. Jürg Schwarz Folie 2 Programm 28. November 2012: Vormittag

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

2.Tutorium Generalisierte Regression

2.Tutorium Generalisierte Regression 2.Tutorium Generalisierte Regression - Binäre Regression - Moritz Berger: 04.11.2013 und 11.11.2013 Shuai Shao: 06.11.2013 und 13.11.2013 Institut für Statistik, LMU München 1 / 16 Gliederung 1 Erweiterte

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Logistische Regression

Logistische Regression Grundideen Logistische Regression Exkurs Logistische Regression Auch nachzulesen bei: http://www.psychologie.uniwuerzburg.de/methoden/lehre/skripten/hs_meth_evaluation/hs_evaluation_logistisch eregression.pdf

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

1 Statistische Grundlagen

1 Statistische Grundlagen Konzepte in Empirische Ökonomie 1 (Winter) Hier findest Du ein paar Tipps zu den Konzepten in Empirische 1. Wenn Du aber noch etwas Unterstützung kurz vor der Klausur brauchst, schreib uns eine kurze Email.

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav Beispiel für eine multivariate Varianzanalyse () Daten: POKIV_Terror_V12.sav Es soll überprüft werden, inwieweit das ATB-Syndrom (Angst vor mit den drei Subskalen affektive Angst von, Terrorpersistenz,

Mehr

IBM SPSS Regression 22

IBM SPSS Regression 22 IBM SPSS Regression 22 Hinweis Vor Verwendung dieser Informationen und des darin beschriebenen Produkts sollten die Informationen unter Bemerkungen auf Seite 33 gelesen werden. Produktinformation Diese

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25

Einleitung 19. Teil I Datenanalyse und Modellbildung Grundlagen 25 Inhaltsverzeichnis Einleitung 19 Zu diesem Buch 19 Konventionen in diesem Buch 20 Was Sie nicht lesen müssen 21 Falsche Voraussetzungen 21 Wie dieses Buch aufgebaut ist 21 Teil I: Datenanalyse und Grundlagen

Mehr

Logistische Regression

Logistische Regression TU Chemnitz SoSe 2012 Seminar: Multivariate Analysemethoden 26.06.2012 Dozent: Dr. Thomas Schäfer Logistische Regression Ein Verfahren zum Schätzen von Wahrscheinlichkeiten Referentinnen: B. Sc. Psych.

Mehr

Nichtparametrische statistische Verfahren

Nichtparametrische statistische Verfahren Nichtparametrische statistische Verfahren (im Wesentlichen Analyse von Abhängigkeiten) Kategorien von nichtparametrischen Methoden Beispiel für Rangsummentests: Wilcoxon-Test / U-Test Varianzanalysen 1-faktorielle

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Abschlussklausur (60 Minuten), 15. Juli 2014

Abschlussklausur (60 Minuten), 15. Juli 2014 Prof. Dr. Amelie Wuppermann Volkswirtschaftliche Fakultät Universität München Sommersemester 2014 Empirische Ökonomie 1 Abschlussklausur (60 Minuten), 15. Juli 2014 Bearbeitungshinweise Die Bearbeitungszeit

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Anmerkung: Die Lösungen enthalten nur einige ausgewählte Antworten; weitere Lösungen sind möglich.

Anmerkung: Die Lösungen enthalten nur einige ausgewählte Antworten; weitere Lösungen sind möglich. Übungsaufgaben zur Weiterbildung Anmerkung: Die Lösungen enthalten nur einige ausgewählte Antworten; weitere Lösungen sind möglich. 1. Was ist unter formeller und informeller Weiterbildung zu verstehen?

Mehr

Einführung in SPSS. 1. Die Datei Seegräser

Einführung in SPSS. 1. Die Datei Seegräser Einführung in SPSS 1. Die Datei Seegräser An 25 verschiedenen Probestellen wurde jeweils die Anzahl der Seegräser pro m 2 gezählt und das Vorhandensein von Seeigeln vermerkt. 2. Programmaufbau Die wichtigsten

Mehr

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende

Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende Probeklausur zur Vorlesung Statistik II für Studierende der Soziologie und Nebenfachstudierende im Sommersemester 2012 Prof. Dr. H. Küchenhoff, J. Brandt, G. Schollmeyer, G. Walter Aufgabe 1 Betrachten

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Kategoriale abhängige Variablen:

Kategoriale abhängige Variablen: Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell Statistik II

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Neuerungen in Minitab 16

Neuerungen in Minitab 16 Neuerungen in Minitab 16 minitab@additive-net.de - Telefon: 06172 / 5905-30 Willkommen zu Minitab 16! Die neueste Version der Minitab Statistical Software umfasst mehr als siebzig neue Funktionen und Verbesserungen,

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Stochastik Abitur 2009 Stochastik

Stochastik Abitur 2009 Stochastik Abitur 2009 Stochastik Beilage ea (erhöhtes Anforderungsniveau) ga (grundlegendes Anforderungsniveau) ISBN 978-3-8120-0108-3 und ISBN 978-3-8120-0223-3 1 Aufgabe 2 (ea) Rauchen ist das größte vermeidbare

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation

Einführung in die Logistische Regression. Fortbildung zur 19.Informationstagung Tumordokumentation Einführung in die Logistische Regression Fortbildung zur 9.Informationstagung Tumordokumentation Bernd Schicke, Tumorzentrum Berlin FB Bayreuth, 29.März 20 Gliederung Einleitung Schätzen von Maßzahlen

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt?

Übungen zur Vorlesung. Statistik 2. a) Welche Grundannahmen der linearen Regression sind in Modell (1) verletzt? Institut für Stochastik WS 2007/2008 Universität Karlsruhe JProf. Dr. H. Holzmann Blatt 7 Dipl.-Math. oec. D. Engel Übungen zur Vorlesung Statistik 2 Aufgabe 25 (keine Abgabe) Angenommen die Zielvariable

Mehr

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen

1 Interaktion von zwei Dummyvariablen. 2 Interaktion einer Dummyvariablen mit einer kardinalskalierten Variablen Modelle mit Interationsvariablen I Modelle mit Interationsvariablen II In der beim White-Test verwendeten Regressionsfuntion y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 2 1 + β 4 x 2 2 + β 5 x 1 x 2, ist anders

Mehr

Diversitätsinklusion in der universitären Fernlehre: Studienziele und Studienerfolg. Katharina Stößel & Stefan Stürmer FernUniversität in Hagen

Diversitätsinklusion in der universitären Fernlehre: Studienziele und Studienerfolg. Katharina Stößel & Stefan Stürmer FernUniversität in Hagen Diversitätsinklusion in der universitären Fernlehre: Studienziele und Studienerfolg Katharina Stößel & Stefan Stürmer FernUniversität in Hagen Institut für Psychologie Lehrgebiet Diversität im (Fern)Studium

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Gesundheitliche Risiken bei dänischen und türkischen Studierenden und ihr Interesse an universitärer Gesundheitsförderung

Gesundheitliche Risiken bei dänischen und türkischen Studierenden und ihr Interesse an universitärer Gesundheitsförderung Gesundheitliche Risiken bei dänischen und türkischen Studierenden und ihr Interesse an universitärer Gesundheitsförderung Christiane Stock, Annette Salje, Nazmi Bilir* University of Southern Denmark, Esbjerg,

Mehr

SPSS Regression Models 12.0

SPSS Regression Models 12.0 SPSS Regression Models 12.0 Weitere Informationen zu SPSS -Software-Produkten finden Sie auf unserer Website unter der Adresse http://www.spss.com, oder wenden Sie sich an SPSS GmbH Software Rosenheimer

Mehr

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang.

Bachelorprüfung. Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname. Matrikelnr. E-Mail. Studiengang. Lehrstuhl für Statistik und empirische Wirtschaftsforschung Fach: Prüfer: Bachelorprüfung Praxis der empirischen Wirtschaftsforschung Prof. Regina T. Riphahn, Ph.D. Name, Vorname Matrikelnr. E-Mail Studiengang

Mehr

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17)

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) R.Niketta Multiple Regressionsanalyse Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) Daten: Selbstdarstellung und Kontaktsuche in studi.vz (POK VIII, AG 3) Fragestellung:

Mehr

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav.

Kapitel 5 FRAGESTELLUNG 1. Öffne die Datei alctobac.sav. Kapitel 5 FRAGESTELLUNG 1 Öffne die Datei alctobac.sav. Zuerst werden wir ein Streudiagramm erstellen, um einen grafischen Überblick von diesem Datensatz zu erhalten. Gehe dazu auf Grafiken / Streudiagramm

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr