Dr. Matthias Rudolf: M3 Multivariate Statistik Vorlesung LogRA. Folie Nr. 1
|
|
- Viktor Tiedeman
- vor 6 Jahren
- Abrufe
Transkript
1 2.1 Beispiele 2.2 Odds Ratio 2.3 Modell der logistischen Regression Modellgleichung Voraussetzungen 2.4 Schätzungen, Tests und Modellgüte Schätzung der logistischen Regressionskoeffizienten Kodierung von nominal skalierten Variablen Bestimmung des Odds Ratio Statistische Tests Beurteilung der Modellgüte Basisliteratur: Rudolf & Müller S Folie Nr. 1
2 Beispiel 1: Alkoholmissbrauch bei Jugendlichen (Rudolf & Müller, S. 184ff) Variablen Label Bemerkungen Kriterium: nominalskaliert Y Alkohol Alkoholmissbrauch: 0 = kein Missbrauch, 1 = Missbrauch Prädiktoren: nominalskaliert X 1 Erbe erbliche Vorbelastung: 0 = nicht vorbelastet, 1 = vorbelastet X 2 Umfeld Bedeutung des Alkoholkonsums im sozialen Umfeld: 0 = gering, 1 = mittel, 2 = groß Prädiktoren: intervallskaliert X 3 Alter X 4 Reizhunger Fragebogen zu Sensation Seeking Folie Nr. 2
3 Datenausschnitt zum Anwendungsbeispiel Alkoholmissbrauch (komplette Daten siehe Rudolf & Müller, S. 185) Pb Alkohol Erbe Umfeld Alter Reizhunger Folie Nr. 3
4 Datenausschnitt zum Anwendungsbeispiel Alkoholmissbrauch (komplette Daten siehe Rudolf & Müller, S. 185) Folie Nr. 4
5 Beispiel 2: Psychische Störungen (Wittchen et al., 1999, vgl. auch Jacobi, 2003) 4181 Datensätze und ausführliche Auswertungshinweise siehe Rudolf & Müller, 2012 (Web-Seite, Datei Depression.pdf) Kriterium Depressive Störung 0 = keine Depression, 1 = Depression Prädiktoren Panikattacke 0 = keine Panikattacke, 1 = Panikattacke irgendeine Angsstörung 0 = keine Angststörung, 1 = Angststörung Alkoholproblem 0 = keine Alkoholstörung, 1 = Alkoholstörung Alter Geschlecht 1 = männlich, 2 = weiblich Soziale Schicht 1 = Unter-, 2 = Mittel-, 3 = Oberschicht (Winkler 1998) Herkunft 0 = West, 1 = Ost Gewichtungsvariablen Gewichtung Auffälligkeitsstatus im Screening 1 = nicht auffällig, 2 = auffällig Folie Nr. 5
6 Häufigkeiten (Kreuztabelle Erbe x Alkohol) kein Alkoholmissbrauch (K=0) Alkoholmissbrauch (K=1) nicht vorbelastet (E=0) vorbelastet (E=1) Spalten- und Zeilensummen: 30 Folie Nr. 6
7 Bedingte Wahrscheinlichkeiten (allgemein; Exposition x Gesundheit) nicht exponiert (E=0) exponiert (E=1) gesund (K=0) p 00 = P(K=0 E=0) p 01 = P(K=0 E=1) krank (K=1) p 10 = P(K=1 E=0) p 11 = P(K=1 E=1) Bedingte Wahrscheinlichkeiten (im Beispiel) kein Alkoholmissbrauch (K=0) Alkoholmissbrauch (K=1) nicht vorbelastet (E=0) p 00 = P(K=0 E=0) = 20/30 = 2/3 p 10 = P(K=1 E=0) = 10/30 = 1/3 vorbelastet (E=1) p 01 = P(K=0 E=1) = 10/30 = 1/3 p 11 = P(K=1 E=1) = 20/30 = 2/3 Folie Nr. 7
8 p: Wahrscheinlichkeit des Auftretens eines Ereignisses Odds (p): Chance für das Eintreten des Ereignisses Odds im Beispiel: Odds (p) = p / (1 p). kein Alkoholmissbrauch (K=0) nicht vorbelastet (E=0) Odds(p 00 ) = Odds (2/3) = 2 = 2:1 vorbelastet (E=1) Odds(p 01 ) = Odds (1/3) =.5 = 1:2 Alkoholmissbrauch (K=1) Odds(p 10 ) = Odds (1/3) =.5 = 1:2 Odds(p 11 ) = Odds (2/3) = 2 = 2:1 Folie Nr. 8
9 Odds Ratio: Zentrale Kenngröße in der Epidemiologie Odds Ratio beschreibt ein Chancenverhältnis. Es ergibt sich als die Chance, zu erkranken, wenn man exponiert ist, im Verhältnis zur Chance zu erkranken, wenn man nicht exponiert ist. Odds Ratio ist der Faktor, um den die Chance zu erkranken steigt, wenn man exponiert ist. Odds Ratio kann interpretiert werden als der Faktor, um den die Chance, exponiert gewesen zu sein, steigt, wenn man voraussetzt, dass eine Erkrankung bereits vorliegt. Folie Nr. 9
10 OR = Odds (P (K=1 / E=1)) / Odds (P (K=1 / E=0)) Odds Ratio im Beispiel: OR = Odds (P (Alkohol = 1 Erbe = 1)) / Odds (P (Alkohol = 1 Erbe = 0)) = (2/3 / 1/3) / (1/3 / 2/3) = 4 Praktisches Problem in der Epidemiologie: mehrere Einflussgrößen sind gleichzeitig zu berücksichtigen logistische Regression! Folie Nr. 10
11 P( Y 1) b b i ln i i P Y ( i 1) b x x... b k x ki (i=1,,n) y i : Wert der dichotomen Kriteriumsvariablen Y des i-ten Probanden x 1i, x 2i,..., x ki : Werte der Variablen X 1, X 2,..., X k des i-ten Probanden b 0, b 1,..., b k : Koeffizienten der logistischen Regression n: Anzahl der Probanden Folie Nr. 11
12 Umstellen nach P(Y i =1): P(Y i 1) 1 exp ( (b b x 1 b x... b x 0 1 1i 2 2i k ki ) ) logistische Funktion: vgl. Rudolf & Müller, S. 190 Folie Nr. 12
13 Folie Nr. 13
14 Statistische Unabhängigkeit der Y i Binomialverteilung der Y i Fehlen leerer Zellen zwischen Kriterium und kategorialen Prädiktoren Gültigkeit des logistischen Modells Stichprobenumfang in jeder Gruppe mindestens 25 (unterste Grenze, Empfehlung zitiert nach Backhaus et al., 2004); benötigter Stichprobenumfang steigt mit der Zahl der Prädiktoren In praktischen Untersuchungen (z.b. Epidemiologie) in der Regel drastisch höhere Stichprobenumfänge notwendig Folie Nr. 14
15 Maximum-Likelihood-Methode: Maximieren der Likelihoodfunktion L L y i 1 P ( Y i 1) y i 0 (1 P ( Y i 1)) Folie Nr. 15
16 Für die Schätzungen: Maximieren der LogLikelihoodfunktion: LL mit ln( L) P(Y i y i 1 ln( P( Y 1) 1 i 1)) exp ( Eigenschaften der LogLikelihoodfunktion: LL 0 L = 1 LL = 0 L = 0 LL = y i 0 (b ln(1 P( Y b x i 1)) 1 b x b, b,..., b 0 1 k... b Maximum x 0 1 1i 2 2i k ki )) Folie Nr. 16
17 Kodierung von nominalskalierten Variablen mit k > 2 Kategorien vor der logistischen Regressionsanalyse in k 1 Kontrastvariablen Beispiel: Indikator-Kodierung der Variablen Bedeutung des Alkoholkonsums Bedeutung des Alkoholkonsums im sozialen Umfeld gering mittel hoch Kontrast k 1 Kontrast k Weitere wichtige Kontrasttypen (vgl. Rudolf & Müller, S.123, Tabelle 3.9): Abweichung Einfach Differenz Helmert Wiederholt Folie Nr. 17
18 Grundgedanke am Beispiel der einfachen Vierfeldertafel: P ( Y 1) ln b P Y 1 ( 1) b x Odds( P( Y 1 X ln( OR) ln Odds( P( Y 1 X 0 1 1)) 0)) ln ( Odds ( P ( Y 1 X 1)) ln ( Odds ( P ( Y 1 X 0)) P( Y 1 X 1) ln 1 P( Y 1 X 1) P( Y 1 X 0) ln 1 P( Y 1 X 0) ( b 0 b1 1) (b0 b1 0) b1 Folie Nr. 18
19 Ergebnisse im Beispiel: Kategorialer Prädiktor Erbe Folie Nr. 19
20 Folie Nr. 20
21 Ergebnisse im Beispiel: Kategorialer Prädiktor Erbe Folie Nr. 21
22 Folie Nr. 22
23 Kodierung von nominalskalierten Variablen mit k > 2 Kategorien vor der logistischen Regressionsanalyse in k 1 Kontrastvariablen Beispiel: Indikator-Kodierung der Variablen Bedeutung des Alkoholkonsums Bedeutung des Alkoholkonsums im sozialen Umfeld gering mittel hoch Kontrast k 1 Kontrast k Weitere wichtige Kontrasttypen (vgl. Rudolf & Müller, S.123, Tabelle 3.9): Abweichung Einfach Differenz Helmert Wiederholt Folie Nr. 23
24 Grundgedanke am Beispiel hoher vs. geringer Alkoholkonsum (X=2 vs. X=0): P ( Y 1) ln 1 P ( Y 1) b 0 b 1 k 1 b 2 k 2 ln( OR) Odds( P( Y ln Odds( P( Y 1 1 X X 2)) 0)) Odds( P( Y ln Odds( P( Y 1 K 1 K & K 0 & K 2 2 1)) 0)) ln ( Odds ( P ( Y 1 X 2)) ln ( Odds ( P ( Y 1 X 0)) P( Y 1 X 2) ln 1 P( Y 1 X 2) P( Y 1 X 0) ln 1 P( Y 1 X 0) ( b b 0 b1 0 b21) ( b0 b1 0 b20) 2 Folie Nr. 24
25 Ergebnisse im Beispiel: Kategorialer Prädiktor Umfeld Folie Nr. 25
26 Ergebnisse im Beispiel: Metrischer Prädiktor Alter Alter in Jahren Alter in Monaten Folie Nr. 26
27 Ergebnisse im Beispiel: Metrischer Prädiktor Alter Folie Nr. 27
28 Ergebnisse im Beispiel: Metrischer Prädiktor Alter Folie Nr. 28
29 Ergebnisse im Beispiel: Alle Prädiktoren Folie Nr. 29
30 Ergebnisse im Beispiel: Alle Prädiktoren Folie Nr. 30
31 Ergebnisse im Beispiel: Alle Prädiktoren Folie Nr. 31
32 Ergebnisse im Beispiel: Alle Prädiktoren Schritt X1(1) Erbe 1 a Umfeld X2 gering vs. X2(1) mittel gering vs. X2(2) hoch Alter X3 Reizhunger X4 konstant Konstante 95,0% Konfidenzintervall für Regressions EXP(B) koeffizient B Sig. Exp(B) Unterer Wert Oberer Wert 1,633,025 5,122 1,227 21,371,056,144,862 1,155,226 5,902 2,096,024 8,132 1,323 50,003,417,055 1,517,991 2,322,231,005 1,260 1,073 1,479-13,987.,001,000 Schritt 1-2 Cox & Snell Nagelkerkes Log-Likelihood R-Quadrat R-Quadrat 50,354 a,421,562 Erläuterungen später unter Beurteilung der Modellgüte Folie Nr. 32
33 Ergebnisse im Beispiel: Alle Prädiktoren Folie Nr. 33
34 Ergebnisse im Beispiel: Alle Prädiktoren Folie Nr. 34
35 Ergebnisse im Beispiel: Alle Prädiktoren Ausreißerdiagnostik: Fall 8 39 Ausgewählter Status a Beobachtet Alkohol Vorhergesagt Temporäre Variable Vorhergesagte Gruppe Resid ZResid S k**,835 M -,835-2,246 S M**,089 k,911 3,193 Folie Nr. 35
36 Ergebnisse im Beispiel: Alle Prädiktoren Vorhergesagt Schritt 1 Beobachtet Alkohol Gesamtprozentsatz kein Missbrauch Missbrauch Alkohol kein Prozentsatz Missbrauch Missbrauch der Richtigen , ,0 80,0 Klassifikationsfehlerrate: 20% Fehlerrate wird bei diesem Vorgehen unterschätzt! Kreuzvalidierung notwendig, zum Beispiel Leave-one-out -Methode! Folie Nr. 36
37 A) Likelihood-Ratio-Test: LR 2 (LL v1 LL v ) LR-Teststatistik asymptotisch χ2-verteilt mit einem FG B) Wald-Statistik: W b s b 2 Wald-Teststatistik asymptotisch χ2-verteilt mit einem FG Folie Nr. 37
38 LR-Statistik LR 2 (LL 0 LL v ) LR-Teststatistik asymptotisch χ2-verteilt mit k (Anzahl der Prädiktoren) FG Cox & Snell - R 2 2 L0 n Cox & SnellR 1 L v Nagelkerkes - R 2 (Werte zwischen 0 und 1, im Beispiel R 2 =.56) Nagelkerkes - R 2 Cox & Snell R 1 2 L 0 n Hosmer-Lemeshow-Test prüft mit einer χ 2 -Größe die H 0, dass alle Differenzen zwischen geschätzten und beobachteten Y-Werten gleich 0 sind. Grundlage: 10 gleich große Gruppen, die auf Grund der geschätzten Wahrscheinlichkeiten gebildet werden (siehe z.b. Eid et al. (2010), S. 794 ff) 2 2 Folie Nr. 38
Multivariate Verfahren
Logistische Regression 1 Matthias Rudolf & Johannes Müller Multivariate Verfahren Eine praxisorientierte Einführung mit Anwendungsbeispielen in SPSS Praxisbeispiel zur Logistischen Regression: Depression
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrLogistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios
Logistische Regression I. Odds, Logits, Odds Ratios, Log Odds Ratios PD Dr.Gabriele Doblhammer, Fortgescrittene Methoden, SS2004 Logistische Regression Tabelle 2 Alter und Symptome von Herz-/Kreislauferkrankung(CD)
MehrLogistische Regression
Logistische Regression Teil 2: Beispiel Dirk Enzmann Fortgeschrittene quantitative Methoden der Kriminologie 29.04.206 Universität Hamburg Dirk Enzmann (Hamburg) Logistische Regression UHH, 29.04.206 /
MehrTHEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ
W THEMA: ZUSAMMENHANGSANALYSEN FÜR KATEGORIALE VARIABLEN " TORSTEN SCHOLZ HERZLICH WILLKOMMEN BEI W Moderation Anne K. Bogner-Hamleh SAS Institute GmbH Education Consultant Training Dr. Torsten Scholz
MehrAlternative Darstellung des 2-Stcihprobentests für Anteile
Alternative Darstellung des -Stcihprobentests für Anteile DCF CF Total n 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrAnalyse von Kontingenztafeln
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abhängigkeit bzw. die Inhomogenität der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden.
MehrKommentierter SPSS-Ausdruck zur logistischen Regression
Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Inferenzstatistik in Regressionsmodellen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
MehrFortgeschrittene Statistik Logistische Regression
Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E
Mehrdes Gemeinsamen Bundesausschusses über die Veröffentlichung des Modells zur Risikoadjustierung gemäß 7 Absatz 2 Satz 3 Anlage 4 QFR-RL
Beschluss des Gemeinsamen Bundesausschusses über die Veröffentlichung des Modells zur Risikoadjustierung gemäß 7 Absatz 2 Satz 3 Anlage 4 QFR-RL Vom 21. Januar 2016 Der Gemeinsame Bundesausschuss hat in
MehrGibt es einen Zusammenhang zwischen Merkmalen? Korrelationen
Arbeitsblatt SPSS Kapitel 8 Seite Gibt es einen Zusammenhang zwischen Merkmalen? Korrelationen Wie in allen Kapiteln gehen wir im Folgenden davon aus, dass Sie die Datei elporiginal.sav geöffnet haben.
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrPrüfungsliteratur: Rudolf & Müller S
1 Beispiele zur univariaten Varianzanalyse Einfaktorielle Varianzanalyse (Wiederholung!) 3 Allgemeines lineares Modell 4 Zweifaktorielle Varianzanalyse 5 Multivariate Varianzanalyse 6 Varianzanalyse mit
MehrÜberlebenszeitanalyse. Tempus neminem manet
Überlebenszeitanalyse Tempus neminem manet Remissionsdauer bei Leukämie Die Wirksamkeit des Medikaments 6-Mercaptopurin (6-MP) wurde in einer placebokontrollierten Studie an 42 Kindern mit akuter Leukämie
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrLogistische Regression
Logistische Regression Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Logistische Regression Beispiel 1: Herzerkrankungsdaten aus Framingham Log Odds Modell Beispiel 1: Einfluss von Blutdruck Maximum
MehrEinführung in die sozialwissenschaftliche Statistik
Einführung in die sozialwissenschaftliche Statistik Sitzung 4 Bivariate Deskription Heinz Leitgöb in Vertretung von Katrin Auspurg Sommersemester 2015 04.05.2015 Überblick 1. Kontingenztabellen 2. Assoziationsmaße
MehrErgebnisse VitA und VitVM
Ergebnisse VitA und VitVM 1 Basisparameter... 2 1.1 n... 2 1.2 Alter... 2 1.3 Geschlecht... 5 1.4 Beobachtungszeitraum (von 1. Datum bis letzte in situ)... 9 2 Extraktion... 11 3 Extraktionsgründe... 15
MehrBivariate Analyseverfahren
Bivariate Analyseverfahren Bivariate Verfahren beschäftigen sich mit dem Zusammenhang zwischen zwei Variablen Beispiel: Konservatismus/Alter Zusammenhangsmaße beschreiben die Stärke eines Zusammenhangs
MehrEpidemiologie / Biometrie
Wintersemester 2004 / 2005 Epidemiologie / Biometrie Robert Hochstrat 14. März 2005 Zusammenschrift der Übung zur Vorlesung aus dem WS 04/05 Rückfragen, Ergänzungen und Korrekturen an robert hochstrat@web.de
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrDie Analyse von unvollständigen Kontingenztabellen im MZ-Panel: Statistische Methodik
Die Analyse von unvollständigen Kontingenztabellen im MZ-Panel: Statistische Methodik Edin Basic Freie Universität Berlin 12.Oktober 2005 Überblick Überblick Y = Untersuchungsvariable - Missing, falls
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay: Kapitel 8.1-8.4 Gehring/Weins: Kapitel 7.1 Schumann:
MehrBivariate Verteilungen
Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin
MehrGrundkurs Statistik für Politologen und Soziologen
Grundkurs Statistik für Politologen und Soziologen Bearbeitet von Uwe W Gehring, Cornelia Weins 5., überarbeitete Auflage 2010. Buch. 345 S. Softcover ISBN 978 3 531 16269 0 Format (B x L): 14,8 x 21 cm
MehrKapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit
Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen ob die in diesem Datensatz untersuchte
MehrLogistische Regression (in SPSS)
Fakultät für Humanwissenschaften Sozialwissenschaftliche Methodenlehre Prof. Dr. Daniel Lois Logistische Regression (in SPSS) Stand: April 2015 (V2.0) Inhaltsverzeichnis 1. Grundlagen 3 2. Logit-Funktion
MehrUnterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression. Robin Ristl. Wintersemester 2012/13
Unterlagen zu Fisher s Exact Test, Vergleich von Anteilswerten und logistischer Regression Robin Ristl Wintersemester 2012/13 1 Exakter Test nach Fisher Alternative zum Chi-Quadrat Unabhängigkeitstest
MehrLogistische Regression
Logistische Regression 13.11.2017 Motivation Regressionsrechnung: Untersuchung des Zusammenhangs zwischen einer (oder mehreren) Zielvariablen und einer oder mehreren erklärenden Variablen. Bisher gesehen:
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrGrundlagen der empirischen Sozialforschung
Grundlagen der empirischen Sozialforschung Sitzung 11 - Datenanalyseverfahren Jan Finsel Lehrstuhl für empirische Sozialforschung Prof. Dr. Petra Stein 5. Januar 2009 1 / 22 Online-Materialien Die Materialien
MehrStatistik I. Sommersemester 2009
I Sommersemester 2009 I Wiederholung/Einführung χ 2 =?!? I Wiederholung/Einführung χ 2 =?!? Nächste Woche: Maße für ordinale, nominal/intervallskalierte und intervallskalierte Daten I Zum Nachlesen Agresti/Finlay:
Mehr11. Zusammenhangsmaße für nominale Variablen
Statistik I Übung 11. Zusammenhangsmaße für nominale Variablen Dozent: Jürgen Leibold 1 Evaluation Nominale Zusammenhangsmaße Übersicht Chi-Quadrat Phi Cramers V Nominale Zusammenhangsmaße 3 Randverteilung
MehrStatistik für Ingenieure und Naturwissenschaftler
Sheldon M. Ross Statistik für Ingenieure und Naturwissenschaftler 3. Auflage Aus dem Amerikanischen übersetzt von Carsten Heinisch ELSEVIER SPEKTRUM AKADEMISCHER VERLAG Spektrum Inhalt Vorwort zur dritten
MehrSchüler in der Klinik
Schüler in der Klinik Ein wirksames Berliner Tabakpräventionsprojekt Stamm-Balderjahn, S., Jagota, A., Barz, G., Kaufmann, H., Schönfeld, N. 51. Kongress der Deutschen Gesellschaft für Pneumologie und
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrVO Biostatistik im WS 2006/2007
VO Biostatistik im WS 2006/2007 1 Beispiel 1: Herzerkrankungsdaten aus Framingham für skoeffizienten : Leukemie-Daten 2 Beispiel 1: Herzerkrankungsdaten aus Framingham Stichprobe: 1329 männliche Bewohner
MehrLogistische Regression
Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation
Mehr1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.
0 Einführung 1 Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Intervallschätzung 5 Hypothesentests 6 Regression Lineare Regressionsmodelle Deskriptive Statistik:
MehrMikrokerne pro Zelle 0,0205 0,0194
4.Ergebnisse 4.1. Mittelwerte der Mikrokernraten pro Zelle Mikrokerne pro Zelle 0,03 0,0205 0,0194 Mikrokerne pro Zelle 0,025 0,02 0,015 0,01 0,005 0 0,009 Tumorpatienten Leukoplakiepatienten Kontrollgruppe
MehrInstitut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II
Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2 Programm Wiederholung der
MehrStatistische Methoden in der Geographie
Statistische Methoden in der Geographie Band 2.; Multivariate Statistik Von Dr. rer. nat. Gerhard Bahrenberg Professor an der Universität Bremen Dr. rer. nat. Ernst Giese Professor an der Universität Gießen
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
MehrKontingentabellenanalyse
Kontingentabellenanalyse 1. Elementares Ausgangsbasis ist zunächst eine 2-dimensionale Kontingenztabelle mit den Häufigkeiten b 1 b j b l Summe a 1 n 11 n1j... n 1l n1* a i n i1 n ij n il n i* a k n k1
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrHypothesentests mit SPSS
Beispiel für einen chi²-test Daten: afrikamie.sav Im Rahmen der Evaluation des Afrikamie-Festivals wurden persönliche Interviews durchgeführt. Hypothese: Es gibt einen Zusammenhang zwischen dem Geschlecht
MehrMusterlösung zur Klausur im Fach Fortgeschrittene Statistik am Gesamtpunktzahl: 60
WESTFÄLISCHE WILHELMS - UNIVERSITÄT MÜNSTER Wirtschaftswissenschaftliche Faktultät Prof. Dr. Bernd Wilfling Professur für VWL, insbesondere Empirische Wirtschaftsforschung Musterlösung zur Klausur im Fach
Mehr2-Stichprobentest für Anteilswerte
-Stichprobentest für Anteilswerte Wir betrachten den Anteilswert (Prozentsatz) für ein interessierendes Ereignis in zwei verschiedenen Grundgesamtheiten (π 1, π ) Ziel: Auf der Basis von Stichprobenerhebungen
MehrLogistische Regression und
Logistische Regression und Diskriminanzanalyse Seminar: multivariate Verfahren Seminarleiter: Dr. Thomas Schäfer Referenten: Nicole Jungbauer, Stephan Klewe, Daniela Kämpfer Gliederung 1) Logistische Regression
MehrAssoziationsstudien. Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation
Assoziationsstudien Prof. DI Dr. Andrea Berghold Institut für Med. Informatik, Statistik und Dokumentation Inhalt Ziele von Assoziationsstudien Design von Assoziationsstudien Statistische Analysemethoden
Mehr6. Multivariate Verfahren Übersicht
6. Multivariate Verfahren 6. Multivariate Verfahren Übersicht 6.1 Korrelation und Unabhängigkeit 6.2 Lineare Regression 6.3 Nichtlineare Regression 6.4 Nichtparametrische Regression 6.5 Logistische Regression
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrDeskriptive Statistik
Markus Wirtz, Christof Nachtigall Deskriptive Statistik 2008 AGI-Information Management Consultants May be used for personal purporses only or by libraries associated to dandelon.com network. Statistische
MehrKategorielle Daten. Seminar für Statistik Markus Kalisch
Kategorielle Daten Markus Kalisch 1 Phase 3 Studie: Wirksamer als Placebo? Medikament Placebo Total Geheilt 15 9 24 Nicht geheilt 10 11 21 Total 25 20 45 Grundfrage: Sind Heilung und Medikamentengabe unabhängig?
Mehr3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten)
3. ZWEI KATEGORIALE MERKMALE (bivariate kategoriale Daten) Beispiel: Gründe für Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährigen Schulkinder in Michigan, USA warum ist man bei seinen Klassenkameraden
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrMultinomiale logistische Regression
Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrFall-Kontroll Studien und Selection Bias. 1.4 Fall-Kontroll Studien: Vorbemerkungen
1.4 Fall-Kontroll Studien: Vorbemerkungen Fall-Kontroll Studien und Selection Bias Fall-Kontroll Studien versuchen in gewisser Weise, eine Kohortenstudie zu imitieren, aber auf das oft zeit- und kostenaufwendige
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrLogistische Regression
TU Chemnitz SoSe 2012 Seminar: Multivariate Analysemethoden 26.06.2012 Dozent: Dr. Thomas Schäfer Logistische Regression Ein Verfahren zum Schätzen von Wahrscheinlichkeiten Referentinnen: B. Sc. Psych.
Mehr3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
MehrKlausurvorbereitung - Statistik
Aufgabe 1 Klausurvorbereitung - Statistik Studenten der Politikwissenschaft der Johannes Gutenberg-Universität wurden befragt, seit wie vielen Semestern sie eingeschrieben sind. Berechnen Sie für die folgenden
MehrAlternative Darstellung des 2-Stichprobentests für Anteile
Alternative Darstellung des -Stichprobentests für Anteile DCF CF Total n= 111 11 3 Response 43 6 69 Resp. Rate 0,387 0,3 0,309 Bei Gültigkeit der Nullhypothese Beobachtete Response No Response Total absolut
MehrChristian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG
Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau
MehrZusammenhangsanalyse mit SPSS. Messung der Intensität und/oder der Richtung des Zusammenhangs zwischen 2 oder mehr Variablen
- nominal, ordinal, metrisch In SPSS: - Einfache -> Mittelwerte vergleichen -> Einfaktorielle - Mehrfaktorielle -> Allgemeines lineares Modell -> Univariat In SPSS: -> Nichtparametrische Tests -> K unabhängige
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
Mehr5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest
Empirische Wirtschaftsforschung Prof. Dr. Ralf Runde 5. Kolmogorov-Smirnov-Test und χ 2 -Anpassungstest Ein wesentliches Merkmal nichtparametrischer Testverfahren ist, dass diese im Allgemeinen weniger
MehrStatistik für. von. Prof. Dr. Josef Bleymüller. und. Prof. Dr. Rafael Weißbach. sowie. Dr. Günther Gehlert. und. Prof. Dr.
Statistik für Wirtschaftswissenschaftler von Prof. Dr. Josef Bleymüller und Prof. Dr. Rafael Weißbach sowie Dr. Günther Gehlert und Prof. Dr. Herbert Gülicher bei früheren Auflagen 17., überarbeitete Auflage
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
MehrProjekt Kaffeemaschine Welche Faktoren beeinflussen das Geschmacksurteil?
AKULTÄT ANGEWANDTE SOZIALWISSENSCHATEN PRO. DR. SONJA HAUG Projekt Kaffeemaschine Welche aktoren beeinflussen das Geschmacksurteil? Ausgehend von der Verkostung an der Hochschule Regensburg und der dabei
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1
LÖSUNG 4B a.) Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit "Deskriptive Statistiken", "Kreuztabellen " wird die Dialogbox "Kreuztabellen" geöffnet. POL wird in das Eingabefeld von
Mehr1. Grundbegri e der Stochastik
Wiederholung von Grundwissen der Stochastik. Grundbegri e der Stochastik Menge der Ereignisse. Die Elemente! der Menge heißen Elementarereignisse und sind unzerlegbare Ereignisse. Das Ereignis A tritt
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrKategorielle Zielgrössen
Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrQuerschnittsbereich Nr. 1: Epidemiologie, Med. Biometrie und Med. Informatik
Epidemiologische Maßzahlen Die Vierfeldertafel erlaubt Einblick in die Verteilung von Exposition (E) und Erkrankung (D). Bei der Kohorten-Studie sind die Zahl der exponierten und die Zahl der nichtexponierten
MehrMultiple Regressionsanalyse - Kurzabriss
Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen
MehrStatistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt 6 Gerhard Tutz, Jan Ulbricht WS 05/06.
Statistik I für Statistiker, Mathematiker und Informatiker Lösungen zu Blatt Gerhard Tutz, Jan Ulbricht WS 05/0 Lösung Aufgabe 4 Notation: X: Rauchen, Y : chronische Bronchitis S X {ja, nein} {a 1, a },
MehrVorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
MehrWiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
MehrDiagnose und Prognose: Kurzfassung 4
Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Verbindung zwischen inhaltlicher Statistisches Konzept / Problemstellung Problemstellung und statistischem statistische Methode Konzept/Methode
MehrÜbungen (HS-2010): Urteilsfehler. Autor: Siegfried Macho
Übungen (HS-2010): Urteilsfehler Autor: Siegfried Macho Inhaltsverzeichnis i Inhaltsverzeichnis 1. Übungen zu Kapitel 2 1 Übungen zu Kontingenz- und Kausalurteile 1 Übung 1-1: 1. Übungen zu Kapitel 2 Gegeben:
MehrProzessoptimierung mit statistischen Verfahren
Prozessoptimierung mit statistischen Verfahren Eine anwendungsorientierte Einführung mit destra und Minitab Bearbeitet von Lorenz Braun, Claus Morgenstern, Michael Radeck 1. Auflage 010. Buch. IX, 354
Mehr