Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden: 1 =Kunde nicht kreditwürdig, 0 = Kunde kreditwürdig Datenbeispiel: Kreditscoring 1
Datensatzbeschreibung (2) Variable Beschreibung boni Bonität des Kunden: 1 = Kunde nicht kreditwürdig, d.h. Kredit wurde nicht zurückbezahlt 0 = Kunde kreditwürdig laufz Laufzeit des Kredits in Monaten moral Frühere Zahlungsmoral des Kunden: 1 = gute Moral 0 = schlechte Moral zweck Verwendungszweck : 1 = privat 0 = geschäftlich hoehe Kredithöhe geschl Geschlecht : 1 = männlich 0 = weiblich famst Familienstand: 1 = verheiratet 0 = ledig konto laufendes Konto 1 = gutes Konto 2 = schlechtes Konto 3 = kein Konto Datenbeispiel: Kreditscoring 2 Deskriptive Auswertung (1) Histogramm: Kredithöhe Histogramm: Kredithöhe 0.1.2.3.4 0.1.2.3.25 2.25 4.25 6.25 8.25 10.25 12.25 14.25 16.25 18.25 Kredithöhe.25 2.25 4.25 6.25 8.25 10.25 12.25 14.25 16.25 18.25 Kredithöhe Abbildung 1: Histogramm und Kerndichteschätzer Kredithöhe. Datenbeispiel: Kreditscoring 3
Deskriptive Auswertung (2) 0.02.04.06.08 Histogramm: Laufzeit des Kredits 0.01.02.03.04.05 Histogramm: Laufzeit des Kredits 5 10 15 20 25 30 35 40 45 50 55 60 65 70 Laufzeit 5 10 15 20 25 30 35 40 45 50 55 60 65 70 Laufzeit Abbildung 2: Histogramm und Kerndichteschätzer Laufzeit. Datenbeispiel: Kreditscoring 4 Logitmodell (1) boni i B(1, π i ) π i = exp(η i) 1 + exp(η i ) η i = β 0 + β 1 laufz i Geschätztes Modell LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufz.0375377.0057027 6.58 0.000.0263607.0487147 _cons -1.666351.1466156-11.37 0.000-1.953713-1.37899 Datenbeispiel: Kreditscoring 5
Logitmodell (2) Geschätztes Modell (Odds ratios) LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Odds Ratio Std. Err. z P> z [95% Conf. Interval] laufz 1.038251.0059208 6.58 0.000 1.026711 1.049921 Verwende alternativ die zentrierte Laufzeit, d.h. laufzc = laufz laufz = laufz 20.9 und erhalte boni i B(1, π i ) π i = exp(η i) 1 + exp(η i ) η i = β 0 + β 1 laufzc i Datenbeispiel: Kreditscoring 6 Logitmodell (3) Geschätztes Modell LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufzc.0375377.0057027 6.58 0.000.0263607.0487147 _cons -.8817011.0712715-12.37 0.000-1.021391 -.7420115 Geschätztes Modell (Odds ratios) LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Odds Ratio Std. Err. z P> z [95% Conf. Interval] laufzc 1.038251.0059208 6.58 0.000 1.026711 1.049921 Datenbeispiel: Kreditscoring 7
Logitmodell (4) η i = β 0 + β 1 laufzc i + β 2 hoehec i hoehec = hoehe hoehe = hoehe 3.27 Geschätztes Modell LR chi2(2) = 45.18 Log likelihood = -588.2761 Pseudo R2 = 0.0370 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufzc.0341153.007282 4.68 0.000.0198428.0483878 hoehec.0229986.0305851 0.75 0.452 -.0369472.0829444 _cons -.8817235.0712835-12.37 0.000-1.021437 -.7420103 Datenbeispiel: Kreditscoring 8 Logitmodell (5) Geschätztes Modell (Odds Ratios) LR chi2(2) = 45.18 Log likelihood = -588.2761 Pseudo R2 = 0.0370 boni Odds Ratio Std. Err. z P> z [95% Conf. Interval] laufzc 1.034704.0075347 4.68 0.000 1.020041 1.049578 hoehec 1.023265.0312967 0.75 0.452.9637271 1.086481 Modelliere den Einfluss der Kredithöhe durch ein Polynom, d.h. η i = β 0 + β 1 laufzc i + β 2 hoehec i + β 3 hoehe2c i + β 3 hoehe3c i Datenbeispiel: Kreditscoring 9
Logitmodell (6) Geschätztes Modell LR chi2(4) = 57.66 Log likelihood = -582.03443 Pseudo R2 = 0.0472 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufzc.0421869.0077688 5.43 0.000.0269603.0574134 hoehec -.4278017.1714569-2.50 0.013 -.763851 -.0917524 hoehe2c.0552197.0278757 1.98 0.048.0005843.109855 hoehe3c -.0016566.0012683-1.31 0.191 -.0041423.0008292 _cons -.8842934.0717621-12.32 0.000-1.024944 -.7436423 Datenbeispiel: Kreditscoring 10 Logitmodell (7) Effekt der Kredithöhe.5 0.5 1 1.5 Effekt der Kredithöhe exp(effekt der Kredithöhe).5 1 1.5 2 2.5 3 exp(effekt der Kredithöhe) Abbildung 3: Logitmodell Kreditscoring: Effekt der Kredithöhe (links) und exp(effekt der Kredithöhe) (rechts). Abbildung ohne zusätzliche Stützstellen ab Kredithöhe 15.8. Datenbeispiel: Kreditscoring 11
Logitmodell (8) Effekt der Kredithöhe.5 0.5 1 1.5 Effekt der Kredithöhe exp(effekt der Kredithöhe) 0 1 2 3 exp(effekt der Kredithöhe) Abbildung 4: Logitmodell Kreditscoring: Effekt der Kredithöhe (links) und exp(effekt der Kredithöhe) (rechts). Abbildung mit zusätzlichen Stützstellen ab Kredithöhe 15.8. Datenbeispiel: Kreditscoring 12 Logitmodell (9) Weitere Visualisierungsvariante: Geschätzte Wahrscheinlichkeiten in Abhängigkeit der Kredithöhe, wenn die übrigen Kovariablen bei ihrem Mittelwert festgehalten werden. Hier bei laufzc = 0 bzw. laufz = 20.9. π = exp(β 0 + β 2 hoehec i + β 3 hoehe2c i + β 3 hoehe3c i ) 1 + exp(β 0 + β 2 hoehec i + β 3 hoehe2c i + β 3 hoehe3c i ) Datenbeispiel: Kreditscoring 13
Logitmodell (10) geschätzte Ausfallw.keiten versus Kredithöhe (laufz=20.9) geschätzte Ausfallw.keiten versus Kredithöhe (laufz=20.9) gesch. Wahrscheinlichkeiten.2.3.4.5.6 gesch. Wahrscheinlichkeiten.2.3.4.5.6 Abbildung 5: Logitmodell Kreditscoring: geschätzte Ausfallwahrscheinlichkeit in Abhängigkeit der Kredithöhe, wenn die Laufzeit 20.9 Monate beträgt. Rechte Grafik ohne zusätzliche Stützstellen, linke Grafik mit zusätzlichen Stützstellen. Datenbeispiel: Kreditscoring 14