Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite hohe Kosten und mitunter auch Verluste. In einer Untersuchung soll festgestellt werden, ob Unterschiede in der Rate der Problemkredite zwischen Kreditnehmern mit einem guten (kaum Überziehungen,... ) Konto bei der Bank, Kreditnehmern mit einem weniger guten (immer wieder Überziehungen,... ) Konto bei der Bank und Kreditnehmern mit keinem Konto bei der Bank bestehen. Dazu wurden Kredite bei 300 Kreditnehmern untersucht. Die Verteilung auf die jeweiligen Gruppen ist in der folgenden Kontingenztabelle gegeben:
Konto Kredit Kein Gut Weniger gut Problematisch 42 26 39 Unproblematisch 39 105 49
Ist die Verteilung von problematischen und unproblematischen Krediten bei allen Kategorien der Variablen Konto gleich? Dazu wurde ein Homogenitätstest gerechnet, der folgendes Ergebnis geliefert hat: Pearsons Chi-squared test data: kredit X-squared = 26.4, df = 2, p-value = 1.846e-06
1. Die Nullhypothese lautet: Die Verteilung der Variablen Kredit ist in den Kategorien der Variablen Konto unterschiedlich. Da der p-wert sehr klein ist, muss diese Hypothese verworfen werden. 2. Die Verteilung auf problematische und unproblematische Kredite ist nicht bei jeder Kategorie der Variablen Konto gleich. 3. Das Testergebnis besagt: Kreditnehmer mit einem guten Konto bei der Bank haben am wenigsten problematische Kredite.
1. Die Nullhypothese lautet: Die Verteilung der Variablen Kredit ist in den Kategorien der Variablen Konto unterschiedlich. Da der p-wert sehr klein ist, muss diese Hypothese verworfen werden. Falsch. Die Nullhypothese ist falsch formuliert. Richtig müßte es heißen, dass die Verteilung zwischen den drei Kontogruppen gleich ist. 2. Die Verteilung auf problematische und unproblematische Kredite ist nicht bei jeder Kategorie der Variablen Konto gleich. Richtig. Es ist zwar kein Signifikanzniveau angegeben, bei einem derart niedrigen p-wert wird die Nullhypothese aber immer verworfen. Das bedeutet aber gerade, dass Unterschiede in der Verteilung zwischen den drei Kontogruppen bestehen.
3. Das Testergebnis besagt: Kreditnehmer mit einem guten Konto bei der Bank haben am wenigsten problematische Kredite. Falsch. Zwar ist die aufgrund des kleinen p-wertes anzunehmen, dass Unterschiede in der Verteilung bestehen. Daraus aber schon abzuleiten, wo die Unterschiede liegen, ist statistisch nicht sauber.
Es liegen kategoriale Daten vor. Bei 300 Kreditnehmern (Beobachtungseinheiten) wurden jeweils zwei kategoriale Variable beobachtet. Die eine (Konto) gibt an, ob der Kreditnehmer ein gutes, weniger gutes oder gar kein Konto bei der Bank unterhält. Die andere Variable gibt an, ob der Kredit des Kreditnehmers ein unproblematischer Kredit ist oder nicht. Die einfache Auszählung dieser Daten führt zu einer Kontingenztabelle, zu Beginn des Beispiels wurde sie schon präsentiert. Es soll überprüft werden, ob sich die Gruppen nach der Variablen Konto bezüglich der Verteilung der Variablen Kredit unterscheidet. Dazu kann der χ 2 -Homogenitätstest eingesetzt werden. Die Nullhypothese lautet: Die Verteilung der Variablen Kredit ist gleich in den drei Gruppen (gutes Konto, weniger gutes Konto, kein Konto). Die Alternativhypothese ist deren Verneinung. Der χ 2 -Test basiert auf dem Vergleich der beobachteten Häufigkeiten (das sind die Werte aus der Kontingenztabelle, o ij ) mit erwarteten Häufigkeiten (e ij ), wenn die Nullhypothese gilt. Auf die Berechnung der erwarteten Häufigkeiten soll hier nicht explizit eingegangen werden, es seien noch einmal die beobachteten Häufigkeiten
Konto Kredit Kein Gut Weniger gut Problematisch 42 26 39 Unproblematisch 39 105 49 und die erwarteten Häufigkeiten Konto Kredit Kein Gut Weniger gut Problematisch 28.9 46.7 31.4 Unproblematisch 52.1 84.3 56.6 präsentiert. Die Teststatistik des Homogenitätstests vergleicht zugehörige Eintragungen der beiden Matrizen nach dem Schema (o ij e ij ) 2 e ij
und summiert alle diese Werte auf. Für dieses konkrete Beispiel bedeutet das: X 2 (42 28.9)2 (49 56.6)2 = + + = 26.4 28.9 56.6 Kleine Werte (nahe 0) sprechen eher für, große Werte gegen die Nullhypothese. Der Wert der Teststatistik (X-squared) findet sich im Output wieder. Die Verteilung der Teststatistik ist zumindest asymptotisch bekannt, es ist eine χ 2 -Verteilung. Die Freiheitsgrade bestimmt man, indem man von jedem Faktor die Anzahl der Kategorien um 1 vermindert und mit einander multipliziert; hier also df = (2 1) (3 1) = 2 (im Output df=2). Man kann daher (zumindest asymptotisch) berechnen, wie wahrscheinlich Werte im Intervall [26.4, ) sind; das ist gerade der p-wert (p-value) für diesen Test, er ist im ebenfalls im Output zu finden und beträgt 1.846 10 6 = 0.000001846 Ist der p-wert kleiner als das gewählte Signifikanzniveau, wird die Nullhypothese verworfen, ansonsten beibehalten.