Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I

Größe: px
Ab Seite anzeigen:

Download "Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression I"

Transkript

1 Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression I

2 Programm Ergänzung zu letzter Sitzung: Interpretation nichtlinearer Effekte Anwendungsbereich der logistischen Regression Entwicklung des Modells Maximum-Likelihood-Schätzung Interpretation der Koeffizienten Modellgüte Beispiel mit SPSS Literatur Übungsaufgabe # 2

3 Ergänzung zu letzter Sitzung: Interpretation nichtlineare Effekte B Sig. Konstante 30,716 0,000 Index ungesunde Ernährung zentriert 0,441 0,094 Frau -0,566 0,210 Psychische Gesundheit: Mittelmäßig -1,780 0,023 Gut/Sehr gut -2,487 0,001 Pro-Kopf-Einkommen in 100 zentriert -0,095 0,004 Sport: 2- bis 4mal pro Monat -1,020 0,054 mehrmals pro Woche -2,347 0,000 Alter zentriert 0,114 0,000 zentriertes Alter quadriert -,004,001 Der Alterseffekt ist umgekehrt u-förmig Um herauszufinden, bei welchem Alter der BMI am größten ist, muss die erste Ableitung nach dem Alter gleich Null gesetzt werden: β 0 + β 1 x 1 + β 2 x 2 +β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + β 7 x 7 + β 8 x 8 + β 9 x 82 Erste Ableitung nach Alter (x 8 ): β 8 + 2β 9 x 8 = 0 2 β 9 x 8 = β 8 x 8 = β 8 2 β 9 = 0,114 2 ( 0, ) = 14,034 Personen, die 14,0 Jahre älter als der Durschnitt (40,8 Jahre) sind haben das höchste Einkommen. # 3

4 Anwendungsbereich Bisher: Betrachtung der linearen Regression zur Untersuchung des Zusammenhangs metrischer abhängiger und metrischer oder dichotomer unabhängiger Variablen. Häufig ist die abhängige Variable in der Soziologie aber nicht metrisch, sondern dichotom. Beispiele für dichotome abhängige Variablen: Raucher ja/nein Begehen eines Gewaltdelikts ja/nein arbeitslos / nicht arbeitslos verheiratet / unverheiratet Wahlbeteiligung ja/nein # 4

5 Anwendungsbereich In diesem Fall ist die OLS-Regression nicht angemessen. Die logistische Regression stellt ein Verfahren dar, welches die adäquate Analyse dichotomer abhängiger Variablen erlaubt. Die unabhängigen Variablen müssen auch hier metrisch oder dichotom sein. # 5

6 Entwicklung des Modells Verschiedene Gründe sprechen gegen die Verwendung der OLS-Regression bei der Analyse dichotomer abhängiger Variablen, obwohl sie auf den ersten Blick geeignet erscheinen mag. Das lineare Regressionsmodell ist prinzipiell für den Wertebereich [- ;+ ] definiert, eine Wahrscheinlichkeit kann aber nur Werte zwischen 0 und 1 annehmen. Der Fehlerterm ist nicht homoskedastisch. Dies lässt sich grafisch leicht verdeutlichen: Y 1 u i ui u i 0 X # 6

7 Entwicklung des Modells Weitere Probleme des linearen Modells: Die Residuen sind nicht normalverteilt. Außerdem ist aus inhaltlichen Gründen die Annahme eines linearen Zusammenhangs oft nicht plausibel. Vielmehr ist davon auszugehen, dass es einen zentralen Bereich von X gibt, in dem sich Veränderungen besonders stark auswirken (in dem die Frage nach dem Wert von Y i quasi entschieden wird), während sich Änderungen an den Polen weniger stark auswirken. # 7

8 Entwicklung des Modells Folgender Kurvenverlauf erscheint daher sinnvoller: P 1 0 X # 8

9 Entwicklung des Modells Gegeben sei eine dichotome Zufallsvariable Y i, die das Eintreten eines bestimmten Ereignisses bzw. das Vorliegen einer bestimmten Eigenschaft mit dem Wert 1 und das Nicht- Eintreten bzw. das Nicht-Vorliegen der Eigenschaft mit dem Wert 0 erfasst. Yi 1Ereignistritt ein 0 Ereignistritt nicht ein # 9

10 Entwicklung des Modells Die Wahrscheinlichkeitsverteilung einer solchen Variable ist gegeben als P(Y i = 1) für Ausprägung 1 und 1- P(Y i = 1) für Ausprägung 0. Der Erwartungswert lässt sich dann per Definition berechnen als E ( Yi) P( Yi 1) ) 1 P( Yi 1) 0 [1 P( Yi 1)] E( Yi) P( Yi 1 Diesen Erwartungswert könnte man als lineare Funktion unabhängiger Variablen modellieren, also das bekannte lineare Regressionsmodel verwenden (so genanntes lineares Wahrscheinlichkeitsmodell, LPM). Dies hat aber oben angeführte Nachteile. # 10

11 Entwicklung des Modells Eine Lösung bietet die logistische Verteilungsfunktion. Diese ist definiert als: Y Y 1 1 e 1 1 e x x x e 1 e x P 1 0 X Überträgt man dies auf die Schätzung des Erwartungswertes ergibt sich das Modell: E ( Yi X i1,..., X im ) P i 1 e 1 ( 0 1Xi1... mxim ) 1 1 e zi # 11

12 Entwicklung des Modells Die Gleichung ist nicht linear, was die Schätzung schwierig macht. Sie lässt sich aber linearisieren: 1 P i = 1 + e Z i Umformen ergibt: 1 P i = e Z = 1 i 1 + e Z i e Z i = P i 1 P i Odds, also Wahrscheinlichkeit, dass Y=1 dividiert durch Gegenwahrscheinlichkeit (Y 1) bzw. P i 1 P i = e Z i= e β 0+β 1 X i1 + +β m Xβ im Logarithmieren führt zu: ln P i 1 P i = β 0 + β 1 X i1 + + β m X im = Z i Den Ausdruck P i /(1-P i ) bezeichnet man als Odds, den Ausdruck ln(p i /(1-P i )) als Log-Odds oder Logit, kurz L. # 12

13 Entwicklung des Modells Dieses Modell lässt sich mit der OLS-Methode nicht korrekt schätzen. Die OLS-Schätzung funktioniert nur zuverlässig, wenn eine metrische AV vorliegt. Gemessen werden aber nur die Werte 0 und 1. Somit ist das OLS-Verfahren nicht sinnvoll anwendbar. (siehe oben) # 13

14 Maximum-Likelihood-Schätzung Folglich kommt ein alternatives Schätzverfahren zum Einsatz: Die Maximum-Likelihood-(ML)-Methode. Das ML-Prinzip der Parameterschätzung ist wesentlich allgemeiner anwendbar als das OLS-Prinzip. Es stellt wohl das am weitesten verbreitete Schätzverfahren dar. Grundprinzip der ML-Methode: Bestimme die unbekannten Schätzparameter so, dass die Wahrscheinlichkeit der Beobachtung der gegebenen Werte der abhängigen Variablen so hoch wie möglich ist. # 14

15 Maximum-Likelihood-Schätzung Schritte bei der ML-Schätzung: Spezifiziere die Beziehung zwischen der abhängigen und den unabhängigen Variablen. Bestimme die so genannte Likelihood -Funktion. Diese ergibt sich bei Unabhängigkeit der abhängigen Variable als Produkt der Dichtefunktionen. L( ) n i 1 f ( yi ; xi) Aufgrund der einfacheren Ausdrücke (Summen statt Produkten) wird die Likelihood logarithmiert und die resultierende Log-Likelihood durch die Wahl der Schätzer maximiert. n l( ) ln f ( ; i 1 yi xi ) Die Maxima der Log-Likelihood-Funktionen sind analytisch nicht zu bestimmen, vielmehr finden Iterationsverfahren zur Approximation Anwendung. # 15

16 Maximum-Likelihood-Schätzung Maximum-Likelihood-Schätzer haben im Falle der logistische Regression folgende Eigenschaften: asymptotisch unverzerrt (Erwartungwert=wahrer Wert), asymptotisch konsistent (je größer die Stichprobe desto näher am wahren Wert) und asymptotisch effizient (Schätzer mit der kleinstmöglichen Varianz) Asymptotisch bedeutet, dass die Eigenschaften nur bei großer Fallzahl zutreffen. Leider gibt es in der Literatur keinen eindeutigen Hinweis, was groß bedeutet. Einige Autoren empfehlen, ML-Schätzer nur mit mehr als 50 Fällen zu berechnen, andere empfehlen mehr als 100 Fälle, wieder andere gehen von Fällen pro unabhängiger Variable aus. # 16

17 Interpretation der Koeffizienten Die Interpretation der Koeffizienten ist leider nicht so einfach wie bei der OLS-Regression. Übliche Herangehensweisen: Richtung des Effekts: Ein positives Vorzeichen des Koeffizienten bedeutet einen positiven Einfluss auf die Log-Odds und damit auf die Wahrscheinlichkeit des Eintretens des Ereignisses. Chancenverhältnise (Odds-Ratios): Exponiert man die Koeffizienten, erhält man die so genannten Odds-Ratios, die sehr häufig berichtet werden. Das Chancenverhältnis besagt, um welchen Faktor sich die Chance (nicht die Wahrscheinlichkeit!) ändert, wenn sich die unabhängige Variable um eine Einheit ändert. # 17

18 Interpretation der Koeffizienten Chance (Odds) ist definiert als Quotient aus der Wahrscheinlichkeit dafür, dass ein bestimmtes Ereigniss eintritt und der Gegenwahrscheinlichkeit. Überleben des Untergangs der Titanic Gesamt nein Anzahl 1490 Überleben % 67,7% ja Anzahl 711 % 32,3% Gesamt Anzahl 2201 % 100,0% Die Chance (Odds) den Untergang der Titanic zu überleben beträgt also 0,323 / 0,677 = 0,48 Die Chance kann ebenso aus den absoluten Häufigkeiten 711 / 1490 = 0,48 berechnet werden. Die Wahrscheinlichkeit beträgt hier aber 32,3%! Chance Wahrscheinlichkeit! Eine Wahrscheinlichkeit nahe 1 entspricht einer Chance (Odds) von 1 / 0 Eine Wahrscheinlichkeit von 0 entspricht einer Chance (Odds) von 0 / 1 = 0 Bei sehr kleinen Wahrscheinlichkeiten sind Chancen (Odds) und Wahrscheinlichkeiten also näherungsweise identisch. # 18

19 Interpretation der Koeffizienten Chancen (Odds) sind also keine Wahrscheinlichkeiten! Das Chancenverhältnis (Odds-Ratio) ist definiert als Quotient aus der Chance, dass ein bestimmtes Ereignis in einer Gruppe eintritt und der Chance, dass dieses Ereignis in einer anderen Gruppe eintritt. Die Wahrscheinlichkeitsverhältnisse (Odds-Ratios) lassen sich in einfachen Fällen auch von Hand berechnen. Im folgenden Fall wird ein Einfluss des Geschlechts auf die Wahrscheinlichkeit den Untergang der Titanic zu überleben vermutet: # 19

20 Interpretation der Koeffizienten Überlebe nde Überleben * Geschlecht Geschlecht Frau Mann Gesamt nein Anzahl % innerhalb von Geschlecht 26,8% 78,8% 67,7% ja Anzahl % innerhalb von Geschlecht 73,2% 21,2% 32,3% Gesamt Anzahl % innerhalb von Geschlecht 100,0% 100,0% 100,0% Die Chance zu überleben beträgt für Frauen 344/126 = 2,7302. Die Chance zu überleben beträgt für Männer 367/1364 = 0,2691. Folglich ergibt sich das Chancenverhältnis als 2,7302 / 0,2691 = 10,1457. Frauen haben also eine 10 Mal so große Chance zu überleben. Die Wahrscheinlichkeit zu überleben ist für Frauen dagegen nur 3,5 Mal so groß! # 20

21 Interpretation der Koeffizienten Das Chancenverhältnis lässt keinen Schluss auf die konkrete Höhe der Wahrscheinlichkeit zu. Da es über den gesamten Wertebereich konstant ist, wird es oft berichtet und interpretiert. Chancen und Chancenverhältnisse (Odds-Ratios) werden leicht missverstanden. Achten sie bei der Interpretation also auf exakte Begriffe und eindeutige Formulierungen. Alternative: Interpretation der Richtung des Koeffizienten Graphische Darstellungen Berechnen von Wahrscheinlichkeiten für beispielhafte Fälle ( nächste Sitzung) # 21

22 Modellgüte Es existiert kein Maß, das dem R² der OLS-Regression exakt entspricht. Allerdings gibt es Maße, deren Definition am Bestimmtheitsmaß orientiert sind. In SPSS werden das Cox-Snell-R² und Nagelkerkes R² ausgegeben. Cox und Snell s R²: R 2 CS L0 1 L1 2 n Mit L 0 : Likelihood des sog. Nullmodells, d.h. ohne Kovariaten und L 1 : Likelihood des betrachteten Modells # 22

23 Modellgüte R² nach Cox und Snell nimmt Werte zwischen 0 und 1-(L 0 ) 2/n an. Nagelkerkes R² korrigiert den Wertebereich auf [0,1] R 2 N R 2 CS 1 ( L ) 0 2 n Außerdem existiert ein Chi²-Test, welcher prüft, ob ein Modell mit den Kovariaten besser ist als das Nullmodell: Die zweifache Differenz der Log-Likelihood des Nullmodells und des vollen Modells folgt einer Chi²-Verteilung. In SPSS wird dieser Test als Omnibus-Test der Modellkoeffizienten bezeichnet. In der Literatur ist die Bezeichnung Likelihood-Ratio-Test üblich. # 23

24 Beispiel Modellschätzung mit SPSS Untersucht werden soll, von welchen Faktoren es abhängt, ob eine Person raucht. Als unabhängige Variablen werden betrachtet: Alter Stunden pro Monat Sport treiben # 24

25 Beispiel Modellschätzung mit SPSS Vorbereiten der abhängigen Variable: recode v24 (1 2 = 1) (3 = 0) into rauch. val lab rauch 0 'Nein' 1 'Ja'. var lab rauch 'Raucher?'. Vorbereiten der unabhängigen Variablen: Alter in Jahrzehnten bilden compute alter10 = (2015 v56)/10. var lab alter10 'Alter in Jahrzehnten'. Sport pro Monat bilden if v19>-77 spomo=v19*4. if v20>-77 spomo=v20. if v17=1 and v18=1 spomo=0. variable level spomo (scale). var lab spomo "Sport pro Monat in Stunden". # 25

26 Beispiel Modellschätzung mit SPSS Vorbereiten der unabhängigen Variablen: Mittelwert für Zentrierung ermitteln Beschränken auf die Fälle, die auch in die Regression eingehen. Dann Mittelwert für Alter ausgeben lassen. temp. select if alter10 < 10 & rauch < 2 & spomo < 220. mean alter10. Bericht Alter in Jahrzehnten Mittelwert N Standardab weichung 4, ,19990 Alter in Jahrzehnten zentrieren compute alter10_z = alter # 26

27 Beispiel Modellschätzung mit SPSS Durchführen der Regression: logistic regression rauch /method=enter alter10_z spomo / save pred. Auch bei der logistischen Regression liefert SPSS mehrere Tabellen zur Darstellung der Regressionsergebnisse, die auf den folgenden Folien besprochen werden: 1. Zusammenfassung der Fallverarbeitung : Enthält Angaben über Fallzahlen 2. Codierung abhängiger Variablen : Liegt die AV nicht bereits 0/1- kodiert vor, nimmt SPSS eine Umkodierung vor, über die hier informiert wird 3. Klassifizierungstabelle: Enthält Angaben über die Häufigkeit des interessierenden Merkmals in den Daten. # 27

28 Beispiel Modellschätzung mit SPSS Nach diesen Informationen folgen Angaben über das Nullmodell, zu interpretieren sind die Ergebnisse des endgültigen Modells ( Block 1 ) 4. Omnibustest der Modellkoeffizienten : Enthält das Ergebnis des Likelihood-Ratio-Tests des Gesamtmodells 5. Modellzusammenfassung : Pseudo-R² 6. Klassifizierungstabelle : Informiert darüber, welcher Anteil von Fällen durch die Regression richtig vorhergesagt würde (zusätzliche Info zur Modellgüte) 7. Variablen in der Gleichung : Enthält Koeffizienten und Odds Ratios # 28

29 Beispiel Modellschätzung mit SPSS 1 Zusammenfassung der Fallverarbeitung Ungewichtete Fälle a H Prozent Ausgewählte Einbezogen in ,2 Fälle Analyse Fehlende Fälle ,8 Gesamtsumme ,0 Nicht ausgewählte Fälle 0 0,0 Gesamtsumme ,0 Informationen über die in die Regression eingegangenen Fälle 2 Codierung abhängiger Variablen Ursprünglicher Wert Interner Wert,00 Nein 0 1,00 Ja 1 Informationen über die Kodierung der abhängigen Variable. Im Beispiel ist die abhängige Variable bereits 0/1- kodiert # 29

30 Beispiel Modellschätzung mit SPSS 3 Klassifizierungsstabelle a,b Vorhergesagt Raucher? Prozentsatz Beobachtet,00 Nein 1,00 Ja richtig Schritt 0 Raucher?,00 Nein ,0 1,00 Ja ,0 Gesamtprozentsatz 65,7 a. Die Konstante ist in das Modell einbezogen. b. Der Trennwert lautet,500 Angabe über die Häufigkeit des interessierenden Merkmals in den Daten. Aus der Tabelle lässt sich schließen, dass 65,7 % der Menschen Nichtraucher sind. Wenn ohne jede weitere Information für eine Vorhersage einfach der häufigste Wert (Nichtraucher) verwendet wird, liegt man in 65,7 % der Fälle richtig. # 30

31 Beispiel Modellschätzung mit SPSS 4 5 Omnibus-Tests der Modellkoeffizienten Chi- Quadrat df Sig. Schritt 1 Schritt Schritt 21,006 2,000 Block 21,006 2,000 Modell 21,006 2,000 Modellzusammenfassung -2 Log-Likelihood Cox & Snell R-Quadrat Nagelkerkes R- Quadrat 1 856,989,030,042 a. Die Schätzung beendet bei Iteration Nummer 4, weil die Parameterschätzungen sich um weniger als,001 änderten. LR-Chi²-Test: Unabhängige Variablen tragen zur Erklärung der abhängigen Variable bei. Das Modell mit Einflussvariablen ist höchstsignifikant besser als das Nullmodell. Die beiden alternativen R²- Werte deuten auf sehr geringe Modellgüte hin. # 31

32 Beispiel Modellschätzung mit SPSS 6 Klassifizierungstabelle a Vorhergesagt Raucher? Prozentsatz Beobachtet,00 Nein 1,00 Ja richtig,00 Nein ,1 Raucher? 1,00 Ja ,4 Schritt 1 Gesamtprozentsatz 67,1 a. Der Trennwert lautet,500 9,4 % derjenigen die rauchen, werden korrekt vorhergesagt, sowie 97,1 % derer, die nicht rauchen. Insgesamt werden 67,1 % korrekt vorhergesagt. Es werden also fast alle als Nichtraucher klassifiziert, was nicht dafür spricht, dass das Modell gut zwischen Rauchern und Nichtrauchern unterscheiden kann (vgl. Tabelle 3 auf Folie 29). # 32

33 Beispiel Modellschätzung mit SPSS 7 Variablen in der Gleichung B Standar dfehler Wald df Sig. Exp(B) alter10_z,094,068 3,000 1,169 1,098 spomo,030,007 17,951 1,000 1,031 Schritt 1 a Konstante -,967,111 76,025 1,000,380 a. In Schritt 1 eingegebene Variable(n): alter10_zspomo. Vorzeicheninterpretation (Spalte B ): Ältere Personen sind mit höherer Wahrscheinlichkeit Raucher als jüngere Personen. Dieser Effekt ist nicht signifikant. Je mehr Sport getrieben wird, umso größer ist die Wahrscheinlichkeit Raucher zu sein. Dieser Effekt ist höchst signifikant. # 33

34 Beispiel Modellschätzung mit SPSS 7 Variablen in der Gleichung B Standar dfehler Wald df Sig. Exp(B) alter10_z,094,068 3,000 1,169 1,098 spomo,030,007 17,951 1,000 1,031 Schritt 1 a Konstante -,967,111 76,025 1,000,380 a. In Schritt 1 eingegebene Variable(n): alter10_zspomo. Interpretation der Odds-Ratios (Spalte Exp(B) ): Für eine Person, die 10 Jahre älter ist als eine andere, ist die Chance Raucher zu sein 1,098 mal so groß. Wird um eine Stunde mehr Sport getrieben, ist die Chance zu Rauchen 1,031 mal so groß. # 34

35 Graphische Darstellung Im ersten Versuch werden die vorhergesagten Wahrscheinlichkeiten in einem Scatterplot gegen die psychische Belastung abgetragen. TEMPORARY. select if spomo<60. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=spomo PRE_1 MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE. BEGIN GPL SOURCE: s=usersource(id("graphdataset")) DATA: spomo=col(source(s), name("spomo")) DATA: PRE_1=col(source(s), name("pre_1")) GUIDE: axis(dim(1), label("sport pro Monat in Stunden")) GUIDE: axis(dim(2), label("vorhergesagte Wahrscheinlichkeit Raucher zu sein")) ELEMENT: point(position(spomo*pre_1)) END GPL. # 35

36 Graphische Darstellung Im ersten Versuch werden die vorhergesagten Wahrscheinlichkeiten in einem Scatterplot gegen die psychische Belastung abgetragen. # 36

37 Graphische Darstellung Um die Graphik übersichtlicher zu gestalten, sollen die vorhergesagten Wahrscheinlichkeiten nur für bestimmte Altersgruppen geplottet werden. Hierfür wird eine Hilfsvariable gebildet, die für bestimmte Altersgruppen das Alter enthält: compute altera=2015-v56. if altera ne 25 & altera ne 35 & altera ne 45 & altera ne 55 & altera ne 66 altera=-66. missing value altera (-66). variable level altera (ordinal). # 37

38 Graphische Darstellung TEMPORARY. select if spomo<60. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=spomo PRE_1 altera MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE. BEGIN GPL SOURCE: s=usersource(id("graphdataset")) DATA: spomo=col(source(s), name("spomo")) DATA: PRE_1=col(source(s), name("pre_1")) DATA: altera=col(source(s), name("altera"), unit.category()) GUIDE: axis(dim(1), label("sport pro Monat in Stunden")) GUIDE: axis(dim(2), label("vorhergesagte Wahrscheinlichkeit Raucher zu sein")) GUIDE: legend(aesthetic(aesthetic.color.exterior), label("")) ELEMENT: point(position(spomo*pre_1), color.exterior(altera)) END GPL. # 38

39 Graphische Darstellung Im ersten Versuch werden die vorhergesagten Wahrscheinlichkeiten in einem Scatterplot gegen die psychische Belastung abgetragen. # 39

40 Zusammenfassung wichtiger Aspekte Was sollte ich mir mindestens merken? Zweck: Prüfung des Einflusses mehrerer metrischer oder dichotomer unabhängiger Variablen auf dichotome abhängige Variable ( Drittvariablenkontrolle). Vorgehensweise: Logarithmiertes Verhältnis von Wahrscheinlichkeit, auf abhängiger Variable den Wert 1 zu haben zur Gegenwahrscheinlichkeit wird als linear abhängig von unabhängigen Variablen betrachtet, Modellschätzung mittels Maximum Likelihood. Interpretation: Pseudo-R² und LR-Test zur Beurteilung der Modellgüte. Koeffizienten: Vorzeichen gibt Auskunft über Einflussrichtung. Odds Ratios: Geben Veränderung des Verhältnisses der Odds bei Veränderung der unabhängigen Variable um eine Einheit an. Graphische Darstellung der vorhergesagten Wahrscheinlichkeiten # 40

41 Literatur Best, Henning; Wolf, Christof (2010): Logistische Regression. Handbuch der sozialwissenschaftlichen Datenanalyse. In: Christof Wolf und Henning Best (Hg.): VS Verlag für Sozialwissenschaften, S Kohler, Ulrich; Frauke Kreuter (2001): Datenanalyse mit Stata, München, S Backhaus, Klaus u.a. (2005): Multivariate Analysemethoden, 11. Aufl. Berlin u.a.: Springer, Kapitel 7. Bühl, Achim (2006): SPSS 14. Einührung in die moderne Datenanalyse, 10. Aufl. München: Pearson, S. 372ff. Greene, William (1993): Ecomometric Analysis. 2nd ed., New York, Kap. 21. Long, Scott und Jeremy Freese (2006): Regression Models for Categorial Dependent Variables, College Station, Texas: Stata Press, Kapitel 4. # 41

42 Übungsaufgabe Haben ältere, verheiratete und höher gebildete Personen eher Kinder? Untersuchen Sie mit Hilfe der logistischen Regression, welchen Einfluss hohe Bildung (v65), Familienstand = verheiratet (v57) und das Alter (v56) auf die Wahrscheinlichkeit, dass Kinder im Haushalt leben haben (v35). Interpretieren Sie die Modellgüte und die Richtung der Effekte. Um die Effekte besser beurteilen zu können, stellen Sie diese graphisch dar. Bilden Sie hierzu eine Hilfsvariable, die jeweils eine Ausprägung für jede Merkmalskombinationen der beiden kategorialen Variablen enthält. Fügen Sie in die Grafik kubische Anpassungslinien ein. # 42

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Logistische Regression II Institut für Soziologie Dipl.-Soz. Methoden 2 Logistische Regression II Bringen Sie zur nächsten Übung und in die Klausur einen (nicht programmierbaren) Taschenrechner mit! # 2 Programm Wiederholung der

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion

Institut für Soziologie Benjamin Gedon. Methoden 2. Regressionsanalyse IV: Transformation und Interaktion Institut für Soziologie Methoden 2 Regressionsanalyse IV: Transformation und Interaktion Inhalt 1. Zusammenfassung letzte Sitzung 2. Weitere Annahmen und Diagnostik 3. Transformationen zur besseren Interpretierbarkeit

Mehr

Binäre abhängige Variablen

Binäre abhängige Variablen Binäre abhängige Variablen Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Einführung Oft wollen wir qualitative Variablen

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!. 040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester 2005 26. Juli 2005 Aufgabe 1: Grundzüge der Wahrscheinlichkeitsrechnung 19 P. Als Manager eines großen

Mehr

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung. Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,

Mehr

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen

Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen Grundlagen der höheren Mathematik Einige Hinweise zum Lösen von Gleichungen 1. Quadratische Gleichungen Quadratische Gleichungen lassen sich immer auf die sog. normierte Form x 2 + px + = 0 bringen, in

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

Theoretische Grundlagen der Informatik WS 09/10

Theoretische Grundlagen der Informatik WS 09/10 Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3

Mehr

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen

Beispiel 48. 4.3.2 Zusammengesetzte Zufallsvariablen 4.3.2 Zusammengesetzte Zufallsvariablen Beispiel 48 Ein Würfel werde zweimal geworfen. X bzw. Y bezeichne die Augenzahl im ersten bzw. zweiten Wurf. Sei Z := X + Y die Summe der gewürfelten Augenzahlen.

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort:

Tangentengleichung. Wie lautet die Geradengleichung für die Tangente, y T =? Antwort: Tangentengleichung Wie Sie wissen, gibt die erste Ableitung einer Funktion deren Steigung an. Betrachtet man eine fest vorgegebene Stelle, gibt f ( ) also die Steigung der Kurve und somit auch die Steigung

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de

Mehr

Varianzanalyse (ANOVA: analysis of variance)

Varianzanalyse (ANOVA: analysis of variance) Varianzanalyse (AOVA: analysis of variance) Einfaktorielle VA Auf der Basis von zwei Stichproben wird bezüglich der Gleichheit der Mittelwerte getestet. Variablen müssen Variablen nur nominalskaliert sein.

Mehr

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x + 400 y = 520 300x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775, Aufgabenpool für angewandte Mathematik / 1. Jahrgang V B, C, D Drinks Ein gastronomischer Betrieb kauft 300 Dosen Energydrinks (0,3 l) und 400 Liter Flaschen Mineralwasser und zahlt dafür 50, Euro. Einen

Mehr

1.3 Die Beurteilung von Testleistungen

1.3 Die Beurteilung von Testleistungen 1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten bedingten Wahrscheinlichkeit. Mathematik- Unterrichts- Einheiten- Datei e. V. Klasse 9 12 04/2015 Diabetes-Test Infos: www.mued.de Blutspenden werden auf Diabetes untersucht, das mit 8 % in der Bevölkerung verbreitet ist. Dabei werden

Mehr

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3

Lineare Funktionen. 1 Proportionale Funktionen 3 1.1 Definition... 3 1.2 Eigenschaften... 3. 2 Steigungsdreieck 3 Lineare Funktionen Inhaltsverzeichnis 1 Proportionale Funktionen 3 1.1 Definition............................... 3 1.2 Eigenschaften............................. 3 2 Steigungsdreieck 3 3 Lineare Funktionen

Mehr

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt

Rekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung

Mehr

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen

Analyse von Querschnittsdaten. Regression mit Dummy-Variablen Analyse von Querschnittsdaten Regression mit Dummy-Variablen Warum geht es in den folgenden Sitzungen? Datum Vorlesung 9.0.05 Einführung 26.0.05 Beispiele 02..05 Forschungsdesigns & Datenstrukturen 09..05

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter

Leseprobe. Wilhelm Kleppmann. Versuchsplanung. Produkte und Prozesse optimieren ISBN: 978-3-446-42033-5. Weitere Informationen oder Bestellungen unter Leseprobe Wilhelm Kleppmann Versuchsplanung Produkte und Prozesse optimieren ISBN: -3-44-4033-5 Weitere Informationen oder Bestellungen unter http://www.hanser.de/-3-44-4033-5 sowie im Buchhandel. Carl

Mehr

Statistische Thermodynamik I Lösungen zur Serie 1

Statistische Thermodynamik I Lösungen zur Serie 1 Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen

Mehr

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte 50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien

Mehr

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Eine Firma stellt USB-Sticks her. Sie werden in der Fabrik ungeprüft in Packungen zu je 20 Stück verpackt und an Händler ausgeliefert. 1 Ein Händler

Mehr

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip Sommersemester 2010 KLAUSUR Statistik B Hinweise zur Bearbeitung: Bei allen Teilaufgaben

Mehr

Berechnung der Erhöhung der Durchschnittsprämien

Berechnung der Erhöhung der Durchschnittsprämien Wolfram Fischer Berechnung der Erhöhung der Durchschnittsprämien Oktober 2004 1 Zusammenfassung Zur Berechnung der Durchschnittsprämien wird das gesamte gemeldete Prämienvolumen Zusammenfassung durch die

Mehr

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Behandelte Fragestellungen Was besagt eine Fehlerquote? Welche Bezugsgröße ist geeignet? Welche Fehlerquote ist gerade noch zulässig? Wie stellt

Mehr

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1 Korrelation Die Korrelationsanalyse zeigt Zusammenhänge auf und macht Vorhersagen möglich Was ist Korrelation? Was sagt die Korrelationszahl aus? Wie geht man vor? Korrelation ist eine eindeutige Beziehung

Mehr

Repetitionsaufgaben Wurzelgleichungen

Repetitionsaufgaben Wurzelgleichungen Repetitionsaufgaben Wurzelgleichungen Inhaltsverzeichnis A) Vorbemerkungen B) Lernziele C) Theorie mit Aufgaben D) Aufgaben mit Musterlösungen 4 A) Vorbemerkungen Bitte beachten Sie: Bei Wurzelgleichungen

Mehr

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift: 20-minütige Klausur zur Vorlesung Lineare Modelle im Sommersemester 20 PD Dr. Christian Heumann Ludwig-Maximilians-Universität München, Institut für Statistik 2. Oktober 20, 4:5 6:5 Uhr Überprüfen Sie

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 2 21. Oktober 2014 Verbundene Stichproben Liegen zwei Stichproben vor, deren Werte einander

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?

Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen? Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen können zwei Ebenen (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen? Wie heiÿt

Mehr

Simplex-Umformung für Dummies

Simplex-Umformung für Dummies Simplex-Umformung für Dummies Enthält die Zielfunktion einen negativen Koeffizienten? NEIN Optimale Lösung bereits gefunden JA Finde die Optimale Lösung mit dem Simplex-Verfahren! Wähle die Spalte mit

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar

Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung: Test nach McNemar Inhaltsverzeichnis Univariates Chi-Quadrat-Verfahren für ein dichotomes Merkmal und eine Messwiederholung:

Mehr

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst. 40-Tage-Wunder- Kurs Umarme, was Du nicht ändern kannst. Das sagt Wikipedia: Als Wunder (griechisch thauma) gilt umgangssprachlich ein Ereignis, dessen Zustandekommen man sich nicht erklären kann, so dass

Mehr

Data Mining: Einige Grundlagen aus der Stochastik

Data Mining: Einige Grundlagen aus der Stochastik Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener

Mehr

Quantitative Methoden der Bildungsforschung

Quantitative Methoden der Bildungsforschung Glieung Wieholung Korrelationen Grundlagen lineare Regression Lineare Regression in SPSS Übung Wieholung Korrelationen Standardisiertes Zusammenhangsmaß (unstandardisiert: Kovarianz) linearer Zusammenhang

Mehr

Kreativ visualisieren

Kreativ visualisieren Kreativ visualisieren Haben Sie schon einmal etwas von sogenannten»sich selbst erfüllenden Prophezeiungen«gehört? Damit ist gemeint, dass ein Ereignis mit hoher Wahrscheinlichkeit eintritt, wenn wir uns

Mehr

Statistik für Studenten der Sportwissenschaften SS 2008

Statistik für Studenten der Sportwissenschaften SS 2008 Statistik für Studenten der Sportwissenschaften SS 008 Aufgabe 1 Man weiß von Rehabilitanden, die sich einer bestimmten Gymnastik unterziehen, dass sie im Mittel µ=54 Jahre (σ=3 Jahre) alt sind. a) Welcher

Mehr

4. Erstellen von Klassen

4. Erstellen von Klassen Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen Gleichungen Lösen Was bedeutet es, eine Gleichung zu lösen? Was ist überhaupt eine Gleichung? Eine Gleichung ist, grundsätzlich eine Aussage über zwei mathematische Terme, dass sie gleich sind. Ein Term

Mehr

8. Berechnung der kalkulatorischen Zinsen

8. Berechnung der kalkulatorischen Zinsen 8. Berechnung der kalkulatorischen Zinsen 8.1. Allgemeines In der laufenden Rechnung werden im Konto 322.00 Zinsen nur die ermittelten Fremdkapitalzinsen erfasst. Sobald aber eine Betriebsabrechnung erstellt

Mehr

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses. XI. Binomialverteilung ================================================================== 11.1 Definitionen -----------------------------------------------------------------------------------------------------------------

Mehr

Quantilsschätzung als Werkzeug zur VaR-Berechnung

Quantilsschätzung als Werkzeug zur VaR-Berechnung Quantilsschätzung als Werkzeug zur VaR-Berechnung Ralf Lister, Aktuar, lister@actuarial-files.com Zusammenfassung: Zwei Fälle werden betrachtet und die jeweiligen VaR-Werte errechnet. Im ersten Fall wird

Mehr

Lineare Gleichungssysteme I (Matrixgleichungen)

Lineare Gleichungssysteme I (Matrixgleichungen) Lineare Gleichungssysteme I (Matrigleichungen) Eine lineare Gleichung mit einer Variable hat bei Zahlen a, b, die Form a b. Falls hierbei der Kehrwert von a gebildet werden darf (a 0), kann eindeutig aufgelöst

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen

Mehr

Darstellungsformen einer Funktion

Darstellungsformen einer Funktion http://www.flickr.com/photos/sigfrid/348144517/ Darstellungsformen einer Funktion 9 Analytische Darstellung: Eplizite Darstellung Funktionen werden nach Möglichkeit eplizit dargestellt, das heißt, die

Mehr

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik Abitur 8 II. Insektenpopulation LA/AG In den Tropen legen die Weibchen einer in Deutschland unbekannten Insektenpopulation jedes Jahr kurz vor Beginn der Regenzeit jeweils 9 Eier und sterben bald darauf.

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen .3 Komplexe Potenzreihen und weitere komplexe Funktionen Definition.) komplexe Folgen: z n = x n + j. y n mit zwei reellen Folgen x n und y n.) Konvergenz: Eine komplexe Folge z n = x n + j. y n heißt

Mehr

Korrelation (II) Korrelation und Kausalität

Korrelation (II) Korrelation und Kausalität Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen

Mehr

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero? Manche sagen: Ja, manche sagen: Nein Wie soll man das objektiv feststellen? Kann man Geschmack objektiv messen? - Geschmack ist subjektiv

Mehr

Einfache Varianzanalyse für abhängige

Einfache Varianzanalyse für abhängige Einfache Varianzanalyse für abhängige Stichproben Wie beim t-test gibt es auch bei der VA eine Alternative für abhängige Stichproben. Anmerkung: Was man unter abhängigen Stichproben versteht und wie diese

Mehr

5 Zusammenhangsmaße, Korrelation und Regression

5 Zusammenhangsmaße, Korrelation und Regression 5 Zusammenhangsmaße, Korrelation und Regression 5.1 Zusammenhangsmaße und Korrelation Aufgabe 5.1 In einem Hauptstudiumsseminar des Lehrstuhls für Wirtschafts- und Sozialstatistik machten die Teilnehmer

Mehr

QM: Prüfen -1- KN16.08.2010

QM: Prüfen -1- KN16.08.2010 QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,

Mehr

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders

Mehr

Interne und externe Modellvalidität

Interne und externe Modellvalidität Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer

Mehr

Simulation (vormals Feldversuch) Cico im Gelenkbus

Simulation (vormals Feldversuch) Cico im Gelenkbus Simulation (vormals Feldversuch) Cico im Gelenkbus Projekt Cico im VRR / Smart Via 3.0 Auswertung 1 Inhalt 1.1 Inhaltsverzeichnis Kapitel Seite 1 Inhalt... 2 1.1 Inhaltsverzeichnis... 2 2 Vorbemerkungen...

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Umgekehrte Kurvendiskussion

Umgekehrte Kurvendiskussion Umgekehrte Kurvendiskussion Bei einer Kurvendiskussion haben wir eine Funktionsgleichung vorgegeben und versuchen ihre 'Besonderheiten' herauszufinden: Nullstellen, Extremwerte, Wendepunkte, Polstellen

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

R ist freie Software und kann von der Website. www.r-project.org

R ist freie Software und kann von der Website. www.r-project.org R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Der Leverage-Effekt wirkt sich unter verschiedenen Umständen auf die Eigenkapitalrendite aus.

Der Leverage-Effekt wirkt sich unter verschiedenen Umständen auf die Eigenkapitalrendite aus. Anhang Leverage-Effekt Leverage-Effekt Bezeichnungs- Herkunft Das englische Wort Leverage heisst Hebelwirkung oder Hebelkraft. Zweck Der Leverage-Effekt wirkt sich unter verschiedenen Umständen auf die

Mehr

einfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110

einfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Übungsbeispiele 1/6 1) Vervollständigen Sie folgende Tabelle: Nr. Aktie A Aktie B Schlusskurs in Schlusskurs in 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Arithmetisches Mittel Standardabweichung

Mehr

Prozentrechnung. Klaus : = Karin : =

Prozentrechnung. Klaus : = Karin : = Prozentrechnung Klaus erzählt, dass bei der letzten Mathe-Arbeit 6 seiner Mitschüler die Note gut erhalten hätten. Seine Schwester Karin hat auch eine Arbeit zurück bekommen. In ihrer Klasse haben sogar

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand

Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand Entladen und Aufladen eines Kondensators über einen ohmschen Widerstand Vorüberlegung In einem seriellen Stromkreis addieren sich die Teilspannungen zur Gesamtspannung Bei einer Gesamtspannung U ges, der

Mehr

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe 2011. Institut für Statistik Ludwig-Maximilians-Universität München Gemischte Modelle Fabian Scheipl, Sonja Greven Institut für Statistik Ludwig-Maximilians-Universität München SoSe 2011 Inhalt Amsterdam-Daten: LMM Amsterdam-Daten: GLMM Blutdruck-Daten Amsterdam-Daten:

Mehr

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN CHRISTIAN HARTFELDT. Zweiter Mittelwertsatz Der Mittelwertsatz Satz VI.3.4) lässt sich verallgemeinern zu Satz.. Seien f, g : [a, b] R auf [a,

Mehr

XONTRO Newsletter. Makler. Nr. 16

XONTRO Newsletter. Makler. Nr. 16 XONTRO Newsletter Makler Nr. 16 Seite 1 In XONTRO werden zum 24. Januar 2005 folgende Änderungen eingeführt: Inflationsindexierte Anleihen Stückzinsberechnung für französische und italienische Staatsanleihen

Mehr