Statistik II für Betriebswirte Vorlesung 1

Statistik II für Betriebswirte Vorlesung 1 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 16. Oktober 2017 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 1

Organisatorisches Vorlesung: Mo., 14:00-15:30, FOR-0270. Übungen: Di., 9:15-10:45, LAM-2090, Dipl.-Math. Dietz, Di., 14:00-15:30, WER-1045, Dr. Wünsche, Mi., 14:00-15:30, MET-2065, Dipl.-Math. Dietz. Selbststudium (Laut Modulbeschreibung zusammen für beide Semester 120 h Präsenzzeit und 150 h Selbststudium.) Information: http://www.mathe.tu-freiberg.de/wiwistat Prüfung: Klausur 120 Minuten, zugelassen sind Taschenrechner, Bücher, Mitschriften; nicht zugelassen sind Laptops, Handys. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 2

Themenkomplexe und geplanter Ablauf in diesem Semester Statistische Tests (ca. drei Vorlesungen) Varianzanalyse (ca. zwei Vorlesungen) Korrelationsanalyse (ca. zwei Vorlesungen) Regressionsanalyse (ca. zwei Vorlesungen) Weihnachtsvorlesung (18.12.17) Regressionsanalyse (ca. drei Vorlesungen) Statistische Qualitätskontrolle (ca. zwei Vorlesungen) Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 3

Klausurergebnisse Statistik 1 für Betriebswirte Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 4

4. Grundlagen des statistischen Schließens II (Tests) 4.1 Einführung in statistische Tests am Beispiel des t-tests Beispiel 4.1: Intelligenzquotient Fragestellung (1): Haben (14-jährige) Kinder aus Dresden einen höheren Intelligenzquotienten als 100? Fragestellung (2): Haben (14-jährige) Kinder aus Dresden einen niedrigeren Intelligenzquotienten als 100? Fragestellung (3): Ist der Intelligenzquotient von (14-jährigen) Kindern aus Dresden von 100 verschieden? Ist µ der (unbekannte) Erwartungswert des IQ der Gesamtpopulation der (14-jährigen) Kinder aus Dresden, dann lassen sich die Fragestellungen (1) bis (3) wie folgt als Forschungshypothesen formulieren: (1): µ > 100 (erwartete IQ ist höher 100) (2): µ < 100 (erwartete IQ ist niedriger 100) (3): µ 100 (erwartete IQ ist ungleich 100) Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 5

Grundlegende Schwierigkeit Auf Basis einer repräsentativen Stichprobe soll auf die Grundgesamtheit geschlossen werden. Fehler, Unsicherheiten sind möglich! Beispiel: Es werden zufällig 10 hochbegabte Kinder (IQ 130) für die Stichprobe ausgewählt. Vermutlich wird dadurch µ überschätzt! Ziel der schließenden Statistik: Quantifizierung der Unsicherheit, z.b. mit welcher Wahrscheinlichkeit macht ein statistischer Test einen Fehler. Notwendig für die Quantifizierung: Mathematische Modellannahmen Im Beispiel 4.1 gehen wir von der Modellannahme aus, dass der IQ der (14-jährigen) Kinder in Dresden normalverteilt ist. Diese Modellannahme sollte man stets rechtfertigen (wie man das machen kann, sehen wir später). Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 6

Fortsetzung Beispiel 4.1: Intelligenztest Der Intelligenzquotient X der 14-jährigen Kinder in Dresden wird als normalverteilt angenommen. (math.) Sichprobe: X i iid. mit X i N(µ, σ 2 ), i = 1,..., n. Aus allen (14-jährigen) Kindern in Dresden wurden zufällig und unabhängig voneinander 10 Kinder ausgewählt. Diese machten einen IQ-Test mit folgenden Ergebnis (Daten): i 1 2 3 4 5 x i 112 108 97 100 107 i 6 7 8 9 10 x i 110 99 106 98 104 Die Punktschätzung für den unbekannten Erwartungswert µ ist gleich: ˆµ = x = 104.1 und damit größer als 100. Das bedeutet aber nicht, dass der Erwartungswert µ mit Sicherheit größer als 100 ist. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 7

Nullhypothese Die Nullhypothese im Beispiel 4.1 lautet: H 0 : µ = 100(= µ 0 ). µ 0 = 100 ist also der hypothetische Wert. Aus der Annahme, dass der IQ normalverteilt ist ergibt sich, dass die Teststatistik T = X µ 0 n S t-verteilt ist mit (n 1)-Freiheitsgraden. Damit lässt sich die Wahrscheinlichkeit dafür kontrollieren, die Nullhypothese fälschlicherweise abzulehnen. Die Forschungshypothesen (1) bis (3) sind hier die möglichen Alternativhypothesen H A. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 8

Aufstellen der Null- und der Alternativhypothese Man formuliert 2 sich ausschließende (oft sogar komplementäre) Hypothesen, die Nullhypothese H 0 und die Alternativhypothese H A (oft auch mit H 1 bezeichnet) z.b. H 0 : µ = µ 0 und H A : µ > µ 0 oder H 0 : µ = µ 0 und H A : µ < µ 0 oder H 0 : µ = µ 0 und H A : µ µ 0. Die Nullhypothese ist diejenige Hypothese, welche auf ihren Wahrheitsgehalt hin überprüft werden soll. Die Nullhypothese wird als Ausgangspunkt einer statistischen Untersuchung gesehen, den es zu widerlegen gilt. Die Alternativhypothese ist die eigentliche Forschungshypothese und drückt aus, was mittels der statistischen Untersuchung gezeigt werden soll. Die Hypothese, die statistisch abgesichert werden soll, sollte also als Alternativhypothese formuliert werden! Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 9

Testentscheidung, Fehler erster und zweiter Art 2 mögliche Entscheidungen beim Testen: 1. H 0 wird verworfen, also abgelehnt und H A angenommen: Es gibt in der erhobenen Stichprobe starke Hinweise darauf, dass H 0 nicht gelten kann, also H A gelten muss. Diese Hinweise sind so stark, dass man nicht von einem zufälligen Zustandekommen ausgehen kann. 2. H 0 wird nicht verworfen, also angenommen: Man hat keine Hinweise gefunden, die gegen H 0 sprechen. Alle aufgetretenen Effekte könnten genauso gut zufallsbedingt sein. in der Grundgesamtheit gilt H 0 H A Entscheidung auf- richtige Fehler 2. Art grund der Stich- H 0 Entscheidung (β-fehler) probe zugunsten Fehler 1. Art richtige von: H A (α-fehler) Entscheidung Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 10

Fehlerwahrscheinlichkeiten Formal lässt sich die Wahrscheinlichkeit für den Fehler 1. Art (α-fehler) als bedingte Wahrscheinlichkeit schreiben: P(Fehler 1. Art) = P(H 0 ablehnen H 0 ist wahr) = α Die Wahrscheinlichkeit für den Fehler 2. Art (β-fehler) kann auch als bedingte Wahrscheinlichkeit geschrieben werden: P(Fehler 2. Art) = P(H 0 nicht ablehnen H A ist wahr) = β Die Wahrscheinlichkeiten für die Fehler erster und zweiter Art verändern sich gegenläufig. Bei festem Stichprobenumfang wird nur der Fehler erster Art kontrolliert. Bei fester Wahrscheinlichkeit für den Fehler 1. Art kann die Wahrscheinlichkeit für den Fehler 2. Art durch Vergrößerung des Stichprobenumfanges verkleinert werden. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 11

Einfache und zusammengesetzte Hypothesen Wählt man mit der Null- oder Alternativhypothese nur einen Wert aus allen möglichen Werten aus, dann nennt man eine solche Hypothese einfach. Wird dagegen eine Menge von Werten zugelassen, spricht man von einer zusammengesetzten Hypothese. So ist z.b. bei H 0 : µ = µ 0 gegen H A : µ > µ 0 H 0 eine einfache und H A eine zusammengesetzte Hypothese. Hingegen sind bei H 0 : µ µ 0 gegen H A : µ > µ 0 beide Hypothesen H 0 und H A zusammengesetzte Hypothesen. Für eine einfache Nullhypothese ist die Bestimmung für die Wahrscheinlichkeit für den Fehler 1. Art eindeutig. Für zusammengesetzte Nullhypothesen hingegen hängt die Fehlerwahrscheinlichkeit noch vom konkreten Wert der Nullhypothese, welcher in der Grundgesamtheit angenommen wird, ab. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 12

Niveau α Ein Test heißt Test zum Niveau α (Signifikanzniveau α), falls die Wahrscheinlichkeit für den Fehler 1. Art höchstens α ist. Übliche Werte für das Signifikanzniveau α sind 0.05 oder 0.01. Für einfache Hypohesen kann man Tests oft so bestimmen, dass die Wahrscheinlichkeit für den Fehler 1. Art genau α ist. Bei zusammengesetzten Hypothesen sind Tests oft so konstruiert, dass die Wahrscheinlichkeit für den Fehler 1. Art genau α für den Wert der Nullhypothese ist, welcher am nächsten zu den Werten der Alternativhypothese liegt. Für alle anderen Werte der Nullhypothese ist dann die Wahrscheinlichkeit für den Fehler 1. Art kleiner als α. Im letzten Kapitel von Statistik II betrachten wir die Wahrscheinlichkeiten für den Fehler 1. Art und 2. Art noch ausführlicher im Rahmen der statistischen Qualitätskontrolle. Die Gütefunktion des Testes wird dabei eine wichtige Rolle spielen. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 13

Kritischer Bereich Der kritische Bereich ist der Ablehnungbereich der Nullhypothese. Liegt die Realisierung t der Teststatistik T im kritischen Bereich, dann wird die Nullhypothese H 0 zugunsten der Alternativhypothese H A abgelehnt. Einstichproben t-test Voraussetzung: X i iid. mit X i N(µ, σ 2 ), i = 1,..., n. Ist H 0 : µ = µ 0 wahr, dann gilt für die Testgröße T : T = X µ 0 n tn 1. S Kritische Bereiche (je nach Alternative) beim Signifikanzniveau α: (1) H A : µ > µ 0 K = { } t t > t n 1,1 α (2) H A : µ < µ 0 K = { } t t < t n 1,1 α } (3) H A : µ µ 0 K = {t t > t n 1,1 α2 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 14

Einstichproben t-test für rechtsseitige Hypothesen H 0 : µ = µ 0 gegen H A : µ > µ 0 (oder oft auch so: H 0 : µ µ 0 gegen H A : µ > µ 0 ). Im Beispiel 4.1 ist n = 10, x = 104.1 und s 2 = 28.3222, damit ergibt sich 104.1 100 t = 10 = 2.44 28.3222 Das Signifikanzniveau wählen wir mit α = 0.05 und der Stichprobenumfang ist n = 10 und damit gilt t n 1,1 α = t 9,0.95 = 1.83. K = { t t > t n 1,1 α } = {t t > 1.83} Testentscheidung: t = 2.44 > 1.83 = t K = H 0 wird abgelehnt (H A wird angenommen). Testergebnis: Der erwartete IQ der 14-jährigen Kinder in Dresden ist signifikant größer als 100, beim Signifikanzniveau von 5%. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 15

Dichtefunktion der t 9 Verteilung 0.0 0.1 0.2 0.3 0.4 α=5% t 9,0.95 =1.83 t=2.44 4 2 0 2 4 Dr. Andreas Wünsche Statistik II für BetriebswirtexVorlesung 1 Version: 5. Oktober 2017 16

Einstichproben t-test für linksseitige Hypothesen H 0 : µ = µ 0 gegen H A : µ < µ 0 (oder oft auch so: H 0 : µ µ 0 gegen H A : µ < µ 0 ). Im Beispiel 4.1 ist t = 2.44. Als Signifikanzniveau wählen wir wieder α = 0.05 und damit wird auch hier t n 1,1 α = t 9,0.95 = 1.83 für den kritischen Bereich benötigt. K = { t t < t n 1,1 α } = {t t < 1.83} Testentscheidung: t = 2.44 1.83 = t K = H 0 wird angenommen. Testergebnis: Der erwartete IQ der 14-jährigen Kinder in Dresden ist nicht signifikant kleiner als 100. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 17

Dichtefunktion der t 9 Verteilung 0.0 0.1 0.2 0.3 0.4 α=5% t 9,0.95 = 1.83 t=2.44 4 2 0 2 4 Dr. Andreas Wünsche Statistik II für BetriebswirtexVorlesung 1 Version: 5. Oktober 2017 18

Einstichproben t-test für zweiseitige Hypothesen H 0 : µ = µ 0 gegen H A : µ µ 0 Im Beispiel 4.1 ist t = 2.44. Als Signifikanzniveau wählen wir wieder α = 0.05 = α 2 = 0.025 = 1 α 2 = 0.975 und damit ist hier das für den kritischen Bereich benötigte t-quantil t n 1,1 α = t 9,0.975 = 2.26. 2 } K = {t t > t n 1,1 α2 = {t t > 2.26} Testentscheidung: t = 2.44 > 2.26 = t K = H 0 wird abgelehnt (H A wird angenommen). Testergebnis: Der erwartete IQ der 14-jährigen Kinder in Dresden ist signifikant von 100 verschieden. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 19

Dichtefunktion der t 9 Verteilung 0.0 0.1 0.2 0.3 0.4 2.5%=α 2 t 9,0.975 = 2.26 α 2 =2.5% t 9,0.975 =2.26 t=2.44 4 2 0 2 4 Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 20 x

Statistik Software, p-value (p-wert), Statgraphics Die Statistik-Software berechnet den p-wert (p-value ). Testentscheidung mit dem p-wert: p α = H 0 wird abgelehnt. p > α = H 0 wird angenommen. Im Beispiel 4.1: H 0 : µ = µ 0 gegen H A : µ > µ 0 Statgraphics p = 0.018798 < 0.05 = α = H 0 wird abgelehnt. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 21

Dichtefunktion der t 9 Verteilung 0.0 0.1 0.2 0.3 0.4 α=0.05 t 9,0.95 =1.83 t=2.44 p=0.019 4 2 0 2 4 x Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 22

Statgraphics, Alternative: kleiner Im Beispiel 4.1: H 0 : µ = µ 0 gegen H A : µ < µ 0 Statgraphics p = 0.981202 > 0.05 = α = H 0 wird angenommen. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 23

Dichtefunktion der t 9 Verteilung 0.0 0.1 0.2 0.3 0.4 α=0.05 t 9,0.95 = 1.83 p=0.981 t=2.44 4 2 0 2 4 x Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 24

Statgraphics, Alternative: ungleich Im Beispiel 4.1: H 0 : µ = µ 0 gegen H A : µ µ 0 Statgraphics p = 0.0375961 < 0.05 = α = H 0 wird abgelehnt. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 25

Zusammenfassung Beim Testen wird (erst einmal) nur die Wahrscheinlichkeit für den Fehler 1. Art kontrolliert, d.h. P(H 0 ablehnen H 0 wahr) α. Wenn also H 0 tatsächlich gilt, wird man sich nur (im Mittel) in α 100% der Fälle für H A entscheiden. Die Entscheidung für H A ist in diesem Sinn statistisch abgesichert. Bei einer Entscheidung gegen H 0 und damit für H A spricht man von einem signifikanten Ergebnis. Die Wahrscheinlichkeit für den Fehler 2. Art wird erst einmal nicht kontrolliert. Eine Entscheidung H 0 beizubehalten ist nicht statistisch abgesichert. Kann man H 0 nicht verwerfen, bedeutet das daher nicht, dass man sich aktiv für H 0 entscheidet; es spricht nur nichts gegen H 0. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 26

4.2. Tests für eine Stichprobe Eine Stichprobe: X 1,..., X n iid.. Test für die Lage bzw. zentrale Tendenz Stichprobe ist normalverteilt Varianz σ 2 ist bekannt: Einstichproben z-test (Gauß-Test) Varianz σ 2 ist unbekannt: Einstichproben t-test Bei der Stichprobe liegt eine stetige Verteilung vor: Vorzeichentest Test für die Streuung (Varianz) Stichprobe ist normalverteilt: χ 2 -Test Test für eine (unbekannte) Wahrscheinlichkeit p Binomialtest Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 27

Einstichproben z-test (Gauß-Test) Annahme: X i N(µ, σ 2 ), iid., i = 1,..., n, σ 2 bekannt. Zweiseitiger Test Hypothesen: H0 : µ = µ 0, H A : µ µ 0. ( ) Unter H0 gilt: X N µ 0, σ2 n. Testgröße: T = X µ 0 H n 0 N(0, 1). σ Kritischer Bereich: Kα = {t R : t > z 1 α/2 }. Einseitige Tests Im Fall von H0 : µ µ 0, H A : µ < µ 0 gilt K α = {t R : t < z α = z 1 α }. Im Fall von H0 : µ µ 0, H A : µ > µ 0 gilt K α = {t R : t > z 1 α }. Die Tests sind für große Werte n (n 30) auch ohne Normalverteilungsvoraussetzung anwendbar. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 28

Einstichproben t Test Annahme: X i N(µ, σ 2 ), iid., i = 1,..., n, σ 2 unbekannt. Zweiseitiger Test Hypothesen: H0 : µ = µ 0, H A : µ µ 0. Testgröße: T = X µ 0 H n 0 tn 1 (t Verteilung mit n 1 S Freiheitsgraden). Kritischer Bereich: K α = {t R : t > t n 1;1 α/2 }. Einseitige Tests Im Fall von H0 : µ µ 0, H A : µ < µ 0 gilt K α = {t R : t < t n 1;α = t n 1;1 α }. Im Fall von H0 : µ µ 0, H A : µ > µ 0 gilt K α = {t R : t > t n 1;1 α }. Die Tests sind für große Werte n (n 30) auch ohne Normalverteilungsvoraussetzung anwendbar. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 29

χ 2 -Test Streuungstest Annahme: X i N(µ, σ 2 ),iid., i = 1,..., n, µ unbekannt. Zweiseitiger Test Hypothesen: H 0 : σ = σ 0, H A : σ σ 0. 2 (n 1)S Testgröße: T = Freiheitsgraden). σ 2 0 H 0 χ 2 n 1 (χ 2 -Verteilung mit n 1 Kritischer Bereich: K α = {t R : t < χ 2 n 1;α/2 } {t R : t > χ2 n 1;1 α/2 } Einseitige Tests Im Fall von H0 : σ σ 0, H A : σ < σ 0 gilt K α = {t R : t < χ 2 n 1;α}. Im Fall von H0 : σ σ 0, H A : σ > σ 0 gilt K α = {t R : t > χ 2 n 1;1 α}. Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 1 Version: 5. Oktober 2017 30