Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und β-fehler? Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 1 / 34
Agenda Forschungsprozess Statistische Hypothesen α und β-fehler Bedeutung des α und β am Beispiel Kreditvergabe Abschließende Bemerkungen & Zusammenfassung S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 2 / 34
Forschungsprozess Outline Forschungsprozess Forschungsprozess: Eine einfache Darstellung Ableitung von Fragestellungen am Beispiel Arbeitsmotivation S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 3 / 34
Forschungsprozess Forschungsprozess: Eine einfache Darstellung Forschungsprozess: Eine einfache Darstellung Fragestellungen Statistik Kennwerte Design Datenerhebung Interpretation S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 4 / 34
Forschungsprozess Ableitung von Fragestellungen am Beispiel Arbeitsmotivation Ableitung von Fragestellungen am Beispiel Arbeitsmotivation von http://de.statista.com, 17.10.2011 S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 5 / 34
Forschungsprozess Ableitung von Fragestellungen am Beispiel Arbeitsmotivation Welche Forschungsfragen könnten sich ergeben? Was bedeutet das Schaubild? Welche Forschungsfragen finden Sie interessant, die sich aus dem Schaubild nicht ableiten lassen? Welche Methode der Datenerhebung könnte sich für Ihre Fragestellung eignen? S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 6 / 34
Statistische Hypothesen Outline Statistische Hypothesen Definition Hypothese Statistische Hypothesen Null- und Alternativhypothese Population und Stichprobe Inferenzstatistik Zusammenführung Motivationsbeispiel Gerichtete und ungerichtete statistische Hypothesen S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 7 / 34
Statistische Hypothesen Definition Hypothese Definition Hypothese Hypothese Eine Hypothese (altgriechisch hypóthesis = Unterstellung, Voraussetzung, Grundlage) ist eine Aussage, der Gültigkeit unterstellt wird, die aber nicht bewiesen oder verifiziert ist. Formal gleichen sie aus Fragen abgeleiteten Aussagen. aus Skript Budischewski (2008) & Wikipedia: http://de.wikipedia.org/wiki/hypothese, gesehen am 8.2.2011 S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 8 / 34
Statistische Hypothesen Definition Hypothese Beispiele für Hypothesen Gibt es Unterschiede bezüglich der Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern? Teamleiter sind höher motiviert als Abteilungsleiter. Abteilungsleiter sind höher motiviert als Teamleiter. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 9 / 34
Statistische Hypothesen Statistische Hypothesen Statistische Hypothesen Statistische Hypothesen sind zwei gegensätzliche Aussagen: Eine Aussage über Gleichheit. Eine zu prüfende Aussage / postulierter Unterschied bzw. Zusammenhang. MIt Hilfe eines statistischen Tests wird entschieden, ob man die Hypothese über Gleichheit beibehält, oder die über den postulierten Unterschied bzw. Zusammenhang akzeptiert. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 10 / 34
Statistische Hypothesen Statistische Hypothesen Statistische Hypothesen am Beispiel Arbeitsmotivation Hypothese: Gibt es Unterschiede bezüglich der Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern? Statistische Hypothesen: Gleichheit: Die Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern unterscheidet sich nicht. zu prüfende Aussage / postulierter Unterschied: Die Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern unterscheidet sich. Es werden damit zwei Aussagen gegenübergestellt. Zu klären: Theoretische Einbettung. Was ist Arbeitsmotivation? Konstrukt Wie kann man Arbeitsmotivation messen? Operationalisierung bzw. Messbarmachung S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 11 / 34
Statistische Hypothesen Null- und Alternativhypothese Null- und Alternativhypothese Diejenige Aussage, welche Gleichheit beschreibt, d.h. keinen Unterschied postuliert, nennt man Nullhypothese oder H 0. Die Aussage, welche einen Unterschied beschreibt, nennt man Alternativhypothese oder H 1. In der Regel wird der Unterschied / Zusammenhang in der H 1 postuliert. Ziel einer Untersuchung / eines Experiments ist es nun herauszufinden, welche dieser beiden Aussagen mit einer höheren Wahrscheinlichkeit zutrifft und damit, welche statistische Hypothese vorläufig angenommen oder verworfen wird. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 12 / 34
Statistische Hypothesen Population und Stichprobe Population und Stichprobe Typischerweise können in einer Studie / Experiment nicht alle interessierenden Untersuchingseinheiten erfaßt werden. Gründe z. B.: Es sind zu viele Personen. Teilnahme wird verweigert. Datenerhebung ist zu aufwendig. Population / Grundgesamtheit: Alle untersuchbaren Objekte, die ein gemeinsames Merkmal aufweisen. Beispiel: Bewohner einer Stadt, Frauen, dreisilbige Substantive (Bortz & Schuster, 2010, S. 748). Stichprobe: In der Regel zufällig gezogene untersuchbare Einheiten einer Population. Auf Basis der Ergebnisse der Stichprobe werden Rückschlüsse auf die Population gezogen: Wenn es Unterschiede in der Stichprobe gibt, können diese auf die Population übertragen werden? S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 13 / 34
Statistische Hypothesen Inferenzstatistik Inferenzstatistik Inferenzstatistik = schließende Statistik. Die Inferenzstatistik beschäftigt sich damit, inwieweit die gefundenen Ergebnisse in der Stichprobe auf die Population übertragen werden können. Hierbei ist wichtig, dass man die tatsächlichen Verhältnisse in der Population nicht kennt, sondern man schließt auf Basis des Stichprobenergebnisses auf die Relationen in der Population. Praktisch geschieht diese Überprüfung dadurch, dass ermittelt wird, mit welcher Wahrscheinlichkeit das Stichprobenergebnis per Zufall aufgetreten sein könnte. Ist die Wahrscheinlichkeit, ein bestimmtes Stichprobenergebnis zu finden, klein, ist dies ein Indiz dafür, dass es nur schwerlich zufällig aufgetreten sein kann. In diesem Fall spricht man von einem statistisch bedeutsamen, signifikanten Ergebnis. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 14 / 34
Statistische Hypothesen Zusammenführung Motivationsbeispiel Zusammenführung Motivationsbeispiel I Hypothese: Gibt es Unterschiede bezüglich der Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern? Statistische Hypothesen: H 0 : Die Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern unterscheidet sich nicht. H 1 : Die Arbeitsmotivation zwischen Abteilungsleitern und Teamleitern unterscheidet sich. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 15 / 34
Statistische Hypothesen Zusammenführung Motivationsbeispiel Zusammenführung Motivationsbeispiel II Population? Stichprobe? Population: Alle Abteilungsleiter und Teamleiter einer Firma bzw. vieler Firmen. Stichprobe: Teilnehmer der Studie, die durch ein Auswahlverfahren ausgewählt wurden. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 16 / 34
Statistische Hypothesen Zusammenführung Motivationsbeispiel Zusammenführung Motivationsbeispiel III Inferenzstatistik? Mit Hilfe der Inferenzstatistik wird geprüft, ob die Ergebnisse in der Stichprobe (Teilnehmer aus den Betrieben) Aussagen auf Populationsebene erlauben: Gleiche Arbeitsmotivation: Teamleiter und Abteilungsleiter gehören der gleichen Population an. Ungleiche Arbeitsmotivation: Teamleiter und Abteilungsleiter entstammen verschiedenen Populationen, sind damit hinsichtlich des untersuchten Merkmals verschieden. Signifikanz bedeutet nicht zwangsläufig, dass ein Ergebnis auch Relevanz besitzt! S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 17 / 34
Statistische Hypothesen Zusammenführung Motivationsbeispiel Mathematische Formulierung der Hypothesen Statistische Hypothesen können auch mathematisch formuliert werden. Hierzu werden griechische Buchstaben verwendet. Soll beispielsweise untersucht werden, ob sich die Mittelwerte der Arbeitsmotivation zwischen Abteilungs- und Teamleitern unterscheiden, schreibt man: H 0 : µ Teamleiter = µ Abteilungsleiter. H 1 : µ Teamleiter µ Abteilungsleiter. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 18 / 34
Statistische Hypothesen Gerichtete und ungerichtete statistische Hypothesen Gerichtete und ungerichtete statistische Hypothesen Ungerichtete Hypothese: Der postulierte Unterschied bzw. Zusammenhang ist ungerichtet, die Prüfung bezieht sich nur auf Ungleichheit: H 0 : µ Teamleiter = µ Abteilungsleiter. H 1 : µ Teamleiter µ Abteilungsleiter. Gerichtete Hypothese: Es wird postuliert, dass es einen Unterschied bzw. Zusammenhang in eine bestimmte Richtung gibt. Erwarteter Unterschied lautet Abteilungsleiter haben größere Arbeitsmotivation als Teamleiter H 0 : µ Teamleiter µ Abteilungsleiter. H 1 : µ Teamleiter < µ Abteilungsleiter. Erwarteter Unterschied lautet Abteilungsleiter haben eine geringere Arbeitsmotivation als Teamleiter: H 0 : µ Teamleiter µ Abteilungsleiter H 1 : µ Teamleiter > µ Abteilungsleiter. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 19 / 34
Statistische Hypothesen Gerichtete und ungerichtete statistische Hypothesen Gerichtete oder ungerichtete Hypothesen? Die Entscheidung, ob eine un bzw. gerichtete statistische Hypothese geprüft werden soll, ist vor allem von theoretischen Gründen abhängig. Gerichtete Hypothesen haben eine höhere Teststärke. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 20 / 34
α und β-fehler Outline α und β-fehler Die Situation Entscheidungsmatrix S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 21 / 34
α und β-fehler Die Situation Die Situation Hypothesen der Arbeitsmotivationsstudie: Nullhypothese / H 0 : Die Arbeitsmotivation von Teamleitern und Abteilungsleitern ist gleich. Alternativhypothese / H 1 : Die Arbeitsmotivation von Teamleitern und Abteilungsleitern ist nicht gleich. Man weiß nicht, ob in der Population die H 0 oder die H 1 gilt. Auf Basis der Ergebnisse in der Stichprobe entscheidet man sich für die H 0 oder der H 1, man verallgemeinert also das Ergebnis aus der Stichprobe auf die Population. Hierbei können natürlich Fehler gemacht werden, je nachdem, was in der Population gilt, und für welche Hypothese man sich auf Basis des Stichprobenergebnisses entscheidet. Wir wissen nicht, welchen Fehler wir gemacht haben, wir berechnen nur Wahrscheinlichkeiten für die jeweiligen Fehler! S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 22 / 34
α und β-fehler Entscheidungsmatrix Entscheidungsmatrix Entscheidung aufgrund der Stichprobe zugunsten H 0 H 1 In der Population gilt die H 0 H 1 richtige Entscheidung β-fehler α-fehler richtige Entscheidung α-fehler / Fehler 1. Art: Fehler, die H 0 fälschlicherweise zu verwerfen. β-fehler / Fehler 2. Art: Fehler, die H 0 fälschlicherweise beizubehalten. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 23 / 34
Bedeutung des α und β am Beispiel Kreditvergabe Outline Bedeutung des α und β am Beispiel Kreditvergabe Beziehung Kunde - Bank Aufgaben Interpretation aus Sicht der Bank bzw. Kunde S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 24 / 34
Bedeutung des α und β am Beispiel Kreditvergabe Beziehung Kunde - Bank Beziehung Kunde - Bank Geschäftsmodell einer Bank: Eine Bank leiht einem Kunden Geld (Kredit). Der Kunde zahlt der Bank mehr Geld zurück, als er von der Bank erhalten hat (Zinsen). Ein Risiko für die Bank besteht darin, Geld an jemanden zu verleihen, der es nicht mehr zurückzahlen kann. Kunde: Ein Kunde, z. B. ein Unternehmen, benötigt Geld, um notwendige Investitionen zu tätigen. Daher wendet er sich an eine Bank, um sich das Geld hierfür zu leihen (Kredit). Der Kredit wird mit Zinsen über Raten zurück gezahlt. Für einen Unternehmer besteht ein Risiko darin, in den Augen einer Bank fälschlicherweise als nicht kreditwürdig angesehen zu werden, und keinen Kredit zu bekommen. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 25 / 34
Bedeutung des α und β am Beispiel Kreditvergabe Aufgaben Aufgaben Analyst: Als Analyst sollen Sie für eine Bank die Kreditwürdigkeit eines Kunden (hier Firma) überprüfen. Unternehmer: Als Unternehmer benötigen Sie einen Kredit von einer Bank. Aufgaben: Wie lautet sinnvollerweise die H 0 und die H 1? Erarbeiten Sie für dieses Beispiel die Bedeutung des α und β-fehlers jeweils für die Bank und dem Unternehmer. Hinweis: Für die Aufstellung der Hypothesen nehmen Sie die Position des Analysten ein und bewerten den resultierenden α und β-fehler jeweils vor dem Hintergrund der Bank bzw. des Unternehmers. α-fehler: Fehler, die H 0 fälschlicherweise zu verwerfen. β-fehler: Fehler, die H 0 fälschlicherweise beizubehalten. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 26 / 34
Bedeutung des α und β am Beispiel Kreditvergabe Interpretation aus Sicht der Bank bzw. Kunde Hypothesen aus Sicht der Bank Hypothesen aus Sicht des Analysten: H 0 : Der Kunde ist nicht kreditwürdig. H 1 : Der Kunde ist kreditwürdig. in der Regel möchte man die H 1 geprüft haben. Entscheidung des Analysten Der Kunde ist wirklich H 0 : nicht kreditwürdig H 1 : kreditwürdig H 0 richtige Entscheidung β-fehler H 1 α-fehler richtige Entscheidung S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 27 / 34
Bedeutung des α und β am Beispiel Kreditvergabe Interpretation aus Sicht der Bank bzw. Kunde Interpretation α und β aus Sicht der Bank bzw. des Kunden Der α-fehler bezieht sich hier auf das Nichterkennungsrisiko kranker Unternehmen, was für eine Bank das wichtigere Kriterium ist Kunde bekommt Kredit, obwohl er nicht-kreditwürdig ist. Der β-fehler beschreibt die irrtümliche Ablehnung eines berechtigten Kreditwunsches eines Unternehmens. Dies ist für den Kunden das wichtigere Kriterium. ist die Wahrscheinlichkeit für die Bank, einen sicheren Gewinn auszuschlagen. Beispiel angelehnt an Kley (2003, S.137). S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 28 / 34
Abschließende Bemerkungen & Zusammenfassung Outline Abschließende Bemerkungen & Zusammenfassung S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 29 / 34
Abschließende Bemerkungen & Zusammenfassung Abschließende Bemerkungen Die Größe des α und β-fehlers wurden willkürlich festgelegt. In der Regel wird der α-fehler auf 5% festgesetzt, gelegentlich auch auf 10% oder 1%. Nach Cohen (1988) soll der β Fehler das vierfache des α Fehlers betragen, also z. B. α = 5% und β = 20%. Der β-fehler kann nur unter bestimmten Voraussetzungen berechnet werden. Hintergrund für die Regelung α < β ist, dass sich Wissenschaft primär konservativ gibt. Für die Statistik heißt das: in der zu untersuchenden Population gibt es zunächst keinen Unterschied bzw. keinen Zusammenhang in der postulierten Art und Weise. Es gibt aber auch Fälle, da sollte genau das Gegenteil der Fall sein, also α > β. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 30 / 34
Abschließende Bemerkungen & Zusammenfassung Zusammenfassung Forschung ist ein Prozess: 1 Entwicklung der Fragestellung und Überführung in eine Forschungshypothese. 2 Überlegungen zu Durchführung und Messbarmachung. 3 Datenerhebung 4 Formulierung von statistischen Hypothesen und Auswertung. 5 Rückschlüsse auf die Fragestellung. Hypothesen sind Aussagen, der Gültigkeit unterstellt wird, die aber nicht bewiesen oder verifiziert sind. In der Statistik werden immer zwei Hypothesen gegeneinander geprüft: Diejenige Aussage, welche Gleichheit beschreibt, d.h. keinen Unterschied postuliert, nennt man Nullhypothese oder H 0. Die Aussage, welche einen Unterschied beschreibt, nennt man Alternativhypothese oder H 1. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 31 / 34
Abschließende Bemerkungen & Zusammenfassung Zusammenfassung (Forts. 2) Da man i. d. R. nicht die gesamte Population (Grundgesamtheit der Personen / Beobachtungseinheiten, über die man eine Aussage machen möchte), untersuchen kann, wird nur eine Auswahl, die Stichprobe untersucht. Inferenzstatistik zieht Rückschlüsse aus der untersuchten Stichprobe auf die Population: Was bedeuten die Ergebnisse aus der Untersuchung für die Population? Bei der Prüfung statistischer Hypothesen können zwei Fehler gemacht werden: α-fehler / Fehler 1. Art: Fehler, die H 0 fälschlicherweise zu verwerfen. β-fehler / Fehler 2. Art: Fehler, die H 0 fälschlicherweise beizubehalten. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 32 / 34
Abschließende Bemerkungen & Zusammenfassung Zusammenfassung (Forts. 3) Statistikprogramme berechnen den α-fehler bei der Hypothesenprüfung, ist dieser Fehler kleiner als das festgesetzte Signifikanzniveau (z. B. 5%), spricht man von einem signifikanten Ergebnis. Man kann auch sagen: Der Einfluss des Zufalls ist kleiner als α (z. B. 5%), daher ist das Ergebnis nicht zufallsbedingt, sondern wurde durch einen systematischen Effekt verursacht. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 33 / 34
Abschließende Bemerkungen & Zusammenfassung Literaturverzeichnis Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage). Berlin: Springer. Budischewski, K. (2008). Zwei mal Drei macht Vier... Praktische Statistik. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Routledge. Kley, C. R. (2003). Mittelstands-Rating: Externe Credit Ratings und die Finanzierung mittelständischer Unternehmen. DUV. S. Garbade (SRH Heidelberg) α und β Fehler Statistik 1 34 / 34