Tutorial: Homogenitätstest



Ähnliche Dokumente
Tutorial: Vergleich von Anteilen

Tutorial:Unabhängigkeitstest

Erfahrungen mit Hartz IV- Empfängern

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Name (in Druckbuchstaben): Matrikelnummer: Unterschrift:

Professionelle Seminare im Bereich MS-Office

Südbaden-Cup. Ausstieg Champions

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Sollsaldo und Habensaldo

Einfache Varianzanalyse für abhängige

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Anleitung über den Umgang mit Schildern

W-Rechnung und Statistik für Ingenieure Übung 11

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Was meinen die Leute eigentlich mit: Grexit?

9. Schätzen und Testen bei unbekannter Varianz

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Statistische Auswertung:

A Lösungen zu Einführungsaufgaben zu QueueTraffic

Prozentrechnung. Wir können nun eine Formel für die Berechnung des Prozentwertes aufstellen:

Primzahlen und RSA-Verschlüsselung

Was ist Sozial-Raum-Orientierung?

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Wir arbeiten mit Zufallszahlen

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

HIER GEHT ES UM IHR GUTES GELD ZINSRECHNUNG IM UNTERNEHMEN

15.3 Bedingte Wahrscheinlichkeit und Unabhängigkeit

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

FDAX mit Zertifikaten gehandelt

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

Dr. Guido Schwarz Forschung, Schulung, Beratung; A Wien, Edelhofgasse 31/8; Tel: Mobil:

Statistik II für Betriebswirte Vorlesung 2

Gleichungen und Ungleichungen

Bewertung des Blattes

100 Mikrokredite und Abschluss der Pilotphase. Ruedi Winkler, Präsident Verein GO! Ziel selbstständig

Der HIV-Antikörper-Schnelltest aus Sicht des Labormediziners. Dr. Thomas Berg, Berlin

Installation OMNIKEY 3121 USB

Hautkrebsscreening. 49 Prozent meinen, Hautkrebs sei kein Thema, das sie besorgt. Thema Hautkrebs. Ist Hautkrebs für Sie ein Thema, das Sie besorgt?

Abschlussprüfung Realschule Bayern II / III: 2009 Haupttermin B 1.0 B 1.1

Die Optimalität von Randomisationstests

Testen von Hypothesen bei gesuchtem Annahmebereich - Übungen

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

PCD Europe, Krefeld, Jan Auswertung von Haemoccult

1.3 Die Beurteilung von Testleistungen

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Wichtiges Thema: Ihre private Rente und der viel zu wenig beachtete - Rentenfaktor

Doing Business : China Do s und Don ts

Kulturelle Evolution 12

Informationsblatt Induktionsbeweis

Geld Verdienen im Internet leicht gemacht

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Wachstum 2. Michael Dröttboom 1 LernWerkstatt-Selm.de

Lehrer: Einschreibemethoden

Wie oft soll ich essen?

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Repetitionsaufgaben Wurzelgleichungen

Zeichen bei Zahlen entschlüsseln

Manager. von Peter Pfeifer, Waltraud Pfeifer, Burkhard Münchhagen. Spielanleitung

Simulation LIF5000. Abbildung 1

VibonoCoaching Brief -No. 18

Der Provider möchte möglichst vermeiden, dass die Werbekampagne auf Grund des Testergebnisses irrtümlich unterlassen wird.

Willkommen zur Vorlesung Statistik (Master)

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Aufgabenblatt 3: Rechenbeispiel zu Stiglitz/Weiss (AER 1981)

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

Windows Server 2012 RC2 konfigurieren

Anlegen eines DLRG Accounts

Bevor Sie mit dem Wechsel Ihres Sicherheitsmediums beginnen können, sollten Sie die folgenden Punkte beachten oder überprüfen:

Microsoft PowerPoint 2013 Folien gemeinsam nutzen

Infoblatt Lehrer Organisation der Finanzierung und der Buchführung

Klassenarbeit zu linearen Gleichungssystemen

Aber zuerst: Was versteht man unter Stromverbrauch im Standby-Modus (Leerlaufverlust)?

Schritte 4. Lesetexte 13. Kosten für ein Girokonto vergleichen. 1. Was passt? Ordnen Sie zu.

Auswertung des Jahresabschlusses Bilanzanalyse 2

Anbindung des eibport an das Internet

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Formelsammlung zur Kreisgleichung

GEVITAS Farben-Reaktionstest

Qualität und Verlässlichkeit Das verstehen die Deutschen unter Geschäftsmoral!

Erst Lesen dann Kaufen

MdtTax Programm. Programm Dokumentation. Datenbank Schnittstelle. Das Hauptmenü. Die Bedienung des Programms geht über das Hauptmenü.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

How to do? Projekte - Zeiterfassung

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

50 Fragen, um Dir das Rauchen abzugewöhnen 1/6

Warum Sie dieses Buch lesen sollten

Einfache statistische Auswertungen mit dem Programm SPSS

Lehrstuhl für Betriebswirtschaftslehre mit Schwerpunkt Finanzierung. Klausur "Finanzmanagement" 14. März 2002

ist die Vergütung für die leihweise Überlassung von Kapital ist die leihweise überlassenen Geldsumme

Ein Vorwort, das Sie lesen müssen!

Transkript:

Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite hohe Kosten und mitunter auch Verluste. In einer Untersuchung soll festgestellt werden, ob Unterschiede in der Rate der Problemkredite zwischen Kreditnehmern mit einem guten (kaum Überziehungen,... ) Konto bei der Bank, Kreditnehmern mit einem weniger guten (immer wieder Überziehungen,... ) Konto bei der Bank und Kreditnehmern mit keinem Konto bei der Bank bestehen. Dazu wurden Kredite bei 300 Kreditnehmern untersucht. Die Verteilung auf die jeweiligen Gruppen ist in der folgenden Kontingenztabelle gegeben:

Konto Kredit Kein Gut Weniger gut Problematisch 42 26 39 Unproblematisch 39 105 49

Ist die Verteilung von problematischen und unproblematischen Krediten bei allen Kategorien der Variablen Konto gleich? Dazu wurde ein Homogenitätstest gerechnet, der folgendes Ergebnis geliefert hat: Pearsons Chi-squared test data: kredit X-squared = 26.4, df = 2, p-value = 1.846e-06

1. Die Nullhypothese lautet: Die Verteilung der Variablen Kredit ist in den Kategorien der Variablen Konto unterschiedlich. Da der p-wert sehr klein ist, muss diese Hypothese verworfen werden. 2. Die Verteilung auf problematische und unproblematische Kredite ist nicht bei jeder Kategorie der Variablen Konto gleich. 3. Das Testergebnis besagt: Kreditnehmer mit einem guten Konto bei der Bank haben am wenigsten problematische Kredite.

1. Die Nullhypothese lautet: Die Verteilung der Variablen Kredit ist in den Kategorien der Variablen Konto unterschiedlich. Da der p-wert sehr klein ist, muss diese Hypothese verworfen werden. Falsch. Die Nullhypothese ist falsch formuliert. Richtig müßte es heißen, dass die Verteilung zwischen den drei Kontogruppen gleich ist. 2. Die Verteilung auf problematische und unproblematische Kredite ist nicht bei jeder Kategorie der Variablen Konto gleich. Richtig. Es ist zwar kein Signifikanzniveau angegeben, bei einem derart niedrigen p-wert wird die Nullhypothese aber immer verworfen. Das bedeutet aber gerade, dass Unterschiede in der Verteilung zwischen den drei Kontogruppen bestehen.

3. Das Testergebnis besagt: Kreditnehmer mit einem guten Konto bei der Bank haben am wenigsten problematische Kredite. Falsch. Zwar ist die aufgrund des kleinen p-wertes anzunehmen, dass Unterschiede in der Verteilung bestehen. Daraus aber schon abzuleiten, wo die Unterschiede liegen, ist statistisch nicht sauber.

Es liegen kategoriale Daten vor. Bei 300 Kreditnehmern (Beobachtungseinheiten) wurden jeweils zwei kategoriale Variable beobachtet. Die eine (Konto) gibt an, ob der Kreditnehmer ein gutes, weniger gutes oder gar kein Konto bei der Bank unterhält. Die andere Variable gibt an, ob der Kredit des Kreditnehmers ein unproblematischer Kredit ist oder nicht. Die einfache Auszählung dieser Daten führt zu einer Kontingenztabelle, zu Beginn des Beispiels wurde sie schon präsentiert. Es soll überprüft werden, ob sich die Gruppen nach der Variablen Konto bezüglich der Verteilung der Variablen Kredit unterscheidet. Dazu kann der χ 2 -Homogenitätstest eingesetzt werden. Die Nullhypothese lautet: Die Verteilung der Variablen Kredit ist gleich in den drei Gruppen (gutes Konto, weniger gutes Konto, kein Konto). Die Alternativhypothese ist deren Verneinung. Der χ 2 -Test basiert auf dem Vergleich der beobachteten Häufigkeiten (das sind die Werte aus der Kontingenztabelle, o ij ) mit erwarteten Häufigkeiten (e ij ), wenn die Nullhypothese gilt. Auf die Berechnung der erwarteten Häufigkeiten soll hier nicht explizit eingegangen werden, es seien noch einmal die beobachteten Häufigkeiten

Konto Kredit Kein Gut Weniger gut Problematisch 42 26 39 Unproblematisch 39 105 49 und die erwarteten Häufigkeiten Konto Kredit Kein Gut Weniger gut Problematisch 28.9 46.7 31.4 Unproblematisch 52.1 84.3 56.6 präsentiert. Die Teststatistik des Homogenitätstests vergleicht zugehörige Eintragungen der beiden Matrizen nach dem Schema (o ij e ij ) 2 e ij

und summiert alle diese Werte auf. Für dieses konkrete Beispiel bedeutet das: X 2 (42 28.9)2 (49 56.6)2 = + + = 26.4 28.9 56.6 Kleine Werte (nahe 0) sprechen eher für, große Werte gegen die Nullhypothese. Der Wert der Teststatistik (X-squared) findet sich im Output wieder. Die Verteilung der Teststatistik ist zumindest asymptotisch bekannt, es ist eine χ 2 -Verteilung. Die Freiheitsgrade bestimmt man, indem man von jedem Faktor die Anzahl der Kategorien um 1 vermindert und mit einander multipliziert; hier also df = (2 1) (3 1) = 2 (im Output df=2). Man kann daher (zumindest asymptotisch) berechnen, wie wahrscheinlich Werte im Intervall [26.4, ) sind; das ist gerade der p-wert (p-value) für diesen Test, er ist im ebenfalls im Output zu finden und beträgt 1.846 10 6 = 0.000001846 Ist der p-wert kleiner als das gewählte Signifikanzniveau, wird die Nullhypothese verworfen, ansonsten beibehalten.