Fallbeispiel: Kreditscoring



Ähnliche Dokumente
Fallstudie: Schadenshäufigkeiten bei Kfz-Versicherungen

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

8. Februar Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

Kapitel 4: Binäre Regression

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Kreditscoring zur Klassifikation von Kreditnehmern. Variablenübersicht des Datensatzes "Kreditscoring zur Klassifikation von Kreditnehmern"

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Datei Kredit.sav, Variablenbeschreibung und Umkodierungen. Variablenübersicht des Datensatzes "Kreditscoring zur Klassifikation von Kreditnehmern"

Kategoriale abhängige Variablen:

Logistische Regression

Generalisierte lineare Modelle. Statistik 3 im Nebenfach. Binäre Regressionsmodelle. 4.1 Binäre Regression

Entscheidungsbaumverfahren

2.Tutorium Generalisierte Regression

Kreditstudie. Kreditsumme, -zins und -laufzeit betrachtet nach Wohnort und Geschlecht des/r Kreditnehmer/s

Prüfung im Fach Mikroökonometrie im Wintersemester 2012/13 Aufgaben

Statistiken über die Bewerber/innen für die Masterstudiengänge am Institut für Statistik, LMU

5 Zusammenhangsmaße, Korrelation und Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression

Arbeit zu ungewöhnlichen Zeiten Arbeit mit erhöhtem Risiko für Sicherheit und Gesundheit?

Väter in Familienunternehmen Die Ursachenstiftung Oktober 2012

Präsentation auf der regionalen Nutzerkonferenz des Forschungsdatenzentrums der Länder am 21./ in Berlin

Varianzanalyse (ANOVA: analysis of variance)

Florian Frötscher und Demet Özçetin

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Tutorial: Homogenitätstest

Fortgeschrittene Statistik Logistische Regression

Fachhochschule Bochum Fachhochschule Münster Fachhochschule Südwestfalen

Statistische Auswertung:

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

Zinsen, Zinseszins, Rentenrechnung und Tilgung

Übungsaufgaben Tilgungsrechnung

LineQuest-Leitfaden LineQuest Dialog-Portal. Generieren der LineQuest-Auswertungsdatei

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Verbriefung von Versicherungsrisiken

Prof. Dr. Uwe Schmidt. 21. August Aufgaben zur Klausur Objektorientierte Programmierung im SS 2007 (IA 252)

Auswertung und Darstellung wissenschaftlicher Daten (1)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Auswertung des Einflusses einer Hypoglykämie

Vorlesung. Informationsökonomik und die Theorie der Firma

A n a l y s i s Finanzmathematik

1. Erreichen Sie, dass im Feld KdNr (Kunden-Nummer) nur 4-stellige Zahlen eingetragen

Anamnesebogen Seite 1

Codebook Beispieldatensatz Umfragedaten

Koeffizienten der Logitanalyse. Kurt Holm. Almo Statistik-System

Laufende Beratungsfälle

ZINSSÄTZE FÜR UNSERE BANKPRODUKTE AB 01. MÄRZ 2015

Masterprüfung. Fach: Mikroökonometrie Prüfer: Prof. Regina T. Riphahn, Ph.D. Vorbemerkungen: Anzahl der Aufgaben: Bewertung:

Unterhalts-Schnell-Check

System Dynamics. Simulation von Systemen in Powersim. Systemische Prozess und Organisationsberatung Individuelles Coaching für Führungskräfte

q Bitte Kopie des Schülerausweises beifügen q Bitte Immatrikulationsbescheinigung beifügen

Leverage-Effekt = Hebelwirkung des Verschuldungsgrads bei der Eigenkapitalrendite, wenn die Gesamtkapitalrentabilität über dem Fremdkapitalzins liegt

Eventmanagement. Erfasste Fragebögen = 9. Auswertungsteil der geschlossenen Fragen. Relative Häufigkeiten der Antworten Std.-Abw.

Onlinemarketing und Web-Usability SoSe Erfasste Fragebögen = 7. Auswertungsteil der geschlossenen Fragen

Quantitative Methoden der Bildungsforschung

Grundlagen der Inferenzstatistik

Multinomiale logistische Regression

UWP-Fonds kompakt

Bildungsverordnung 2012 Kauffrau / Kaufmann EFZ

Aufgaben zum Datenmanagement

Suchen Sie eine Möglichkeit, Ihre Umsatzdaten einfach und schnell auszuwerten?

BEWERBUNG ALS AU-PAIR

Statistische Auswertung

Religionsmonitor Online-Befragung Hintergrundinformationen

Einrichtung Ihres 3 Konto unter MAC OS

Auf Briefbögen mit vorgedruckter Firmenanschrift muss der Absender nicht extra angegeben werden.

Xing- Gruppentreffen Einführung von SPC. Einführung von SPC

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

Ergebnisse der Befragung der Haushalte in Oestrich-Winkel

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

CAFÉ BEISPIELLOS BERATUNG. Gordon Schmid. Beratung für Glücksspielsüchtige und deren Angehörige. Dipl. Sozialarbeiter

Entstehung eines Subprime-Marktes in Deutschland Hypothekendarlehenvergabe an Verbraucherinnen und Verbraucher ohne Eigenkapital

Kleines Handbuch zur Fotogalerie der Pixel AG

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

W-Rechnung und Statistik für Ingenieure Übung 11

Lösungshinweise zur Einsendearbeit 2 SS 2011

Institut für Soziologie Dipl.-Soz. Benjamin Gedon. Methoden 2. Ausblick; Darstellung von Ergebnissen; Wiederholung

INSA-Meinungstrend Befragte Befragungszeitraum: INSA-CONSULERE GmbH

In 6 einfachen Schritten zum durchdachten Finanzierungskonzept! 1. Vor der eigentlichen Finanzierungsbeantragung

Mitarbeiterbefragung als PE- und OE-Instrument

Online PR Social Media, Mobile PR und mehr SoSe Erfasste Fragebögen = 3. Auswertungsteil der geschlossenen Fragen

Auswertungsbericht Lehrveranstaltungsevaluation an die Lehrenden

Herzinfarkt, Geschlecht und Diabetes mellitus

Mädchen Jungen Smartphone Computer Fernsehgerät feste Spielkonsole 37 62

Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik. 7. Februar 2008

CITIES AGAINST RACISM RESPONSIBILITIES OF CITIES IN COUNTERACTING RACISM SUSTAINABILITY. Evaluation der Plakatkampagne der Stadt Graz gegen Rassismus

Bitte bringen Sie zu Ihrem ersten Termin zusätzlich ärztliche Befunde und Untersuchungsergebnisse mit.

App-Zertifizierung fuer den Windows-Store Teil 2 Leseprobe Inhaltsverzeichnis

Onlinemarketing und Web-Usability WiSe 2012/ 13. Erfasste Fragebögen = 4. Auswertungsteil der geschlossenen Fragen

FULFILLMENT VON ALLYOUNEED

Wärmebildkamera. Arbeitszeit: 15 Minuten

Energieeffizient Bauen - Kredit

Heilverfahren, Arbeitsunfähigkeit, MdE und Kosten bei distaler Radiusfraktur: Beschreibung und Prädiktion

UWP-Fonds kompakt

Leitfaden zur Anlage einer Nachforderung. Nachforderung Seite 1 von 11 RWE IT GmbH

Eventmanagement WiSe 2011/ 12. Erfasste Fragebögen = 7. Auswertungsteil der geschlossenen Fragen

Transkript:

Fallbeispiel: Kreditscoring Stefan Lang 14. Juni 2005 SS 2005 Datensatzbeschreibung (1) Ziel Untersuchung der Bonität eines Kunden in Abhängigkeit von erklärenden Variablen Zielvariable Bonität des Kunden: 1 =Kunde nicht kreditwürdig, 0 = Kunde kreditwürdig Datenbeispiel: Kreditscoring 1

Datensatzbeschreibung (2) Variable Beschreibung boni Bonität des Kunden: 1 = Kunde nicht kreditwürdig, d.h. Kredit wurde nicht zurückbezahlt 0 = Kunde kreditwürdig laufz Laufzeit des Kredits in Monaten moral Frühere Zahlungsmoral des Kunden: 1 = gute Moral 0 = schlechte Moral zweck Verwendungszweck : 1 = privat 0 = geschäftlich hoehe Kredithöhe geschl Geschlecht : 1 = männlich 0 = weiblich famst Familienstand: 1 = verheiratet 0 = ledig konto laufendes Konto 1 = gutes Konto 2 = schlechtes Konto 3 = kein Konto Datenbeispiel: Kreditscoring 2 Deskriptive Auswertung (1) Histogramm: Kredithöhe Histogramm: Kredithöhe 0.1.2.3.4 0.1.2.3.25 2.25 4.25 6.25 8.25 10.25 12.25 14.25 16.25 18.25 Kredithöhe.25 2.25 4.25 6.25 8.25 10.25 12.25 14.25 16.25 18.25 Kredithöhe Abbildung 1: Histogramm und Kerndichteschätzer Kredithöhe. Datenbeispiel: Kreditscoring 3

Deskriptive Auswertung (2) 0.02.04.06.08 Histogramm: Laufzeit des Kredits 0.01.02.03.04.05 Histogramm: Laufzeit des Kredits 5 10 15 20 25 30 35 40 45 50 55 60 65 70 Laufzeit 5 10 15 20 25 30 35 40 45 50 55 60 65 70 Laufzeit Abbildung 2: Histogramm und Kerndichteschätzer Laufzeit. Datenbeispiel: Kreditscoring 4 Logitmodell (1) boni i B(1, π i ) π i = exp(η i) 1 + exp(η i ) η i = β 0 + β 1 laufz i Geschätztes Modell LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufz.0375377.0057027 6.58 0.000.0263607.0487147 _cons -1.666351.1466156-11.37 0.000-1.953713-1.37899 Datenbeispiel: Kreditscoring 5

Logitmodell (2) Geschätztes Modell (Odds ratios) LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Odds Ratio Std. Err. z P> z [95% Conf. Interval] laufz 1.038251.0059208 6.58 0.000 1.026711 1.049921 Verwende alternativ die zentrierte Laufzeit, d.h. laufzc = laufz laufz = laufz 20.9 und erhalte boni i B(1, π i ) π i = exp(η i) 1 + exp(η i ) η i = β 0 + β 1 laufzc i Datenbeispiel: Kreditscoring 6 Logitmodell (3) Geschätztes Modell LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufzc.0375377.0057027 6.58 0.000.0263607.0487147 _cons -.8817011.0712715-12.37 0.000-1.021391 -.7420115 Geschätztes Modell (Odds ratios) LR chi2(1) = 44.61 Log likelihood = -588.55691 Pseudo R2 = 0.0365 boni Odds Ratio Std. Err. z P> z [95% Conf. Interval] laufzc 1.038251.0059208 6.58 0.000 1.026711 1.049921 Datenbeispiel: Kreditscoring 7

Logitmodell (4) η i = β 0 + β 1 laufzc i + β 2 hoehec i hoehec = hoehe hoehe = hoehe 3.27 Geschätztes Modell LR chi2(2) = 45.18 Log likelihood = -588.2761 Pseudo R2 = 0.0370 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufzc.0341153.007282 4.68 0.000.0198428.0483878 hoehec.0229986.0305851 0.75 0.452 -.0369472.0829444 _cons -.8817235.0712835-12.37 0.000-1.021437 -.7420103 Datenbeispiel: Kreditscoring 8 Logitmodell (5) Geschätztes Modell (Odds Ratios) LR chi2(2) = 45.18 Log likelihood = -588.2761 Pseudo R2 = 0.0370 boni Odds Ratio Std. Err. z P> z [95% Conf. Interval] laufzc 1.034704.0075347 4.68 0.000 1.020041 1.049578 hoehec 1.023265.0312967 0.75 0.452.9637271 1.086481 Modelliere den Einfluss der Kredithöhe durch ein Polynom, d.h. η i = β 0 + β 1 laufzc i + β 2 hoehec i + β 3 hoehe2c i + β 3 hoehe3c i Datenbeispiel: Kreditscoring 9

Logitmodell (6) Geschätztes Modell LR chi2(4) = 57.66 Log likelihood = -582.03443 Pseudo R2 = 0.0472 boni Coef. Std. Err. z P> z [95% Conf. Interval] laufzc.0421869.0077688 5.43 0.000.0269603.0574134 hoehec -.4278017.1714569-2.50 0.013 -.763851 -.0917524 hoehe2c.0552197.0278757 1.98 0.048.0005843.109855 hoehe3c -.0016566.0012683-1.31 0.191 -.0041423.0008292 _cons -.8842934.0717621-12.32 0.000-1.024944 -.7436423 Datenbeispiel: Kreditscoring 10 Logitmodell (7) Effekt der Kredithöhe.5 0.5 1 1.5 Effekt der Kredithöhe exp(effekt der Kredithöhe).5 1 1.5 2 2.5 3 exp(effekt der Kredithöhe) Abbildung 3: Logitmodell Kreditscoring: Effekt der Kredithöhe (links) und exp(effekt der Kredithöhe) (rechts). Abbildung ohne zusätzliche Stützstellen ab Kredithöhe 15.8. Datenbeispiel: Kreditscoring 11

Logitmodell (8) Effekt der Kredithöhe.5 0.5 1 1.5 Effekt der Kredithöhe exp(effekt der Kredithöhe) 0 1 2 3 exp(effekt der Kredithöhe) Abbildung 4: Logitmodell Kreditscoring: Effekt der Kredithöhe (links) und exp(effekt der Kredithöhe) (rechts). Abbildung mit zusätzlichen Stützstellen ab Kredithöhe 15.8. Datenbeispiel: Kreditscoring 12 Logitmodell (9) Weitere Visualisierungsvariante: Geschätzte Wahrscheinlichkeiten in Abhängigkeit der Kredithöhe, wenn die übrigen Kovariablen bei ihrem Mittelwert festgehalten werden. Hier bei laufzc = 0 bzw. laufz = 20.9. π = exp(β 0 + β 2 hoehec i + β 3 hoehe2c i + β 3 hoehe3c i ) 1 + exp(β 0 + β 2 hoehec i + β 3 hoehe2c i + β 3 hoehe3c i ) Datenbeispiel: Kreditscoring 13

Logitmodell (10) geschätzte Ausfallw.keiten versus Kredithöhe (laufz=20.9) geschätzte Ausfallw.keiten versus Kredithöhe (laufz=20.9) gesch. Wahrscheinlichkeiten.2.3.4.5.6 gesch. Wahrscheinlichkeiten.2.3.4.5.6 Abbildung 5: Logitmodell Kreditscoring: geschätzte Ausfallwahrscheinlichkeit in Abhängigkeit der Kredithöhe, wenn die Laufzeit 20.9 Monate beträgt. Rechte Grafik ohne zusätzliche Stützstellen, linke Grafik mit zusätzlichen Stützstellen. Datenbeispiel: Kreditscoring 14