Statistik II für Betriebswirte Vorlesung 3

Ähnliche Dokumente

Statistik II für Betriebswirte Vorlesung 2

Statistik II für Betriebswirte Vorlesung 3

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Statistik I für Betriebswirte Vorlesung 5

Ein möglicher Unterrichtsgang

Überblick über die Verfahren für Ordinaldaten

9. Schätzen und Testen bei unbekannter Varianz

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Willkommen zur Vorlesung Statistik (Master)

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Überblick über die Tests

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Willkommen zur Vorlesung Statistik

Statistik I für Betriebswirte Vorlesung 11

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Statistik II für Betriebswirte Vorlesung 3

i x k k=1 i u i x i v i 1 0, ,08 2 0, ,18 3 0, ,36 4 0, ,60 5 1, ,00 2,22 G = n 2 n i=1

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Die Optimalität von Randomisationstests

Statistik II für Betriebswirte Vorlesung 2

Stochastische Eingangsprüfung,

Eine Einführung in R: Statistische Tests

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

Prüfung eines Datenbestandes

Beispiel Zusammengesetzte Zufallsvariablen

Stichprobenauslegung. für stetige und binäre Datentypen

Grundlagen der Inferenzstatistik

Business Value Launch 2006

Data Mining: Einige Grundlagen aus der Stochastik

Forschungsstatistik I

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Statistik II. Statistik II, SS 2001, Seite 1 von 5

4. Erstellen von Klassen

Statistische Auswertung:

Statistik I für Betriebswirte Vorlesung 2

Statistische Thermodynamik I Lösungen zur Serie 1

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

y P (Y = y) 1/6 1/6 1/6 1/6 1/6 1/6

Mathematische und statistische Methoden II

Zeichen bei Zahlen entschlüsseln

Tutorial: Homogenitätstest

R ist freie Software und kann von der Website.

Primzahlen und RSA-Verschlüsselung

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Varianzanalyse (ANOVA: analysis of variance)

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

my.ohm Content Services Autorenansicht Rechte

5. Schließende Statistik Einführung

Fachhochschule Düsseldorf Wintersemester 2008/09

Varianzanalyse ANOVA

Auswertung zur. Hauptklausur Unternehmensbesteuerung. vom und Ergebnisse der Kundenbefragung

Orderarten im Wertpapierhandel

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Statistik für Studenten der Sportwissenschaften SS 2008

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

Gemischte Modelle. Fabian Scheipl, Sonja Greven. SoSe Institut für Statistik Ludwig-Maximilians-Universität München

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Lösungshinweise zur Einsendearbeit 2 SS 2011

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Studieren- Erklärungen und Tipps

Binäre abhängige Variablen

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

Physik & Musik. Stimmgabeln. 1 Auftrag

Einfache statistische Testverfahren

Professionelle Seminare im Bereich MS-Office

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Lineare Gleichungssysteme

Kapitel 3: Etwas Informationstheorie

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Grundlagen der Theoretischen Informatik, SoSe 2008

Häufig wiederkehrende Fragen zur mündlichen Ergänzungsprüfung im Einzelnen:

Task: Nmap Skripte ausführen

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

1.3 Die Beurteilung von Testleistungen

Markovketten. Bsp. Page Ranking für Suchmaschinen. Wahlfach Entscheidung unter Risiko und stat. Datenanalyse

Die Pareto Verteilung wird benutzt, um Einkommensverteilungen zu modellieren. Die Verteilungsfunktion ist

WINDOWS 10 Upgrade. Beispiel: Desktop-Ausschnitt von vorhandenem WIN 8.1 (rechte Ecke der Taskleiste)

Wie Sie beliebig viele PINs, die nur aus Ziffern bestehen dürfen, mit einem beliebigen Kennwort verschlüsseln: Schritt 1

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Klausur zur Vorlesung Multivariate Verfahren, SS Kreditpunkte, 90 min

Algorithmen und Datenstrukturen

Test 2: Universitäts- oder Fachhochschulstudium? 24 Auswertung: Universitäts- oder Fachhochschulstudium? 27

Bei vielen Zufallsexperimenten interessiert man sich lediglich für das Eintreten bzw. das Nichteintreten eines bestimmten Ereignisses.

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Basis und Dimension. Als nächstes wollen wir die wichtigen Begriffe Erzeugendensystem und Basis eines Vektorraums definieren.

Eine Logikschaltung zur Addition zweier Zahlen

Einfache Varianzanalyse für abhängige

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

W-Rechnung und Statistik für Ingenieure Übung 11

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Transkript:

PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013

Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst möchte testen, ob nach einem Aktiensplit (2-für-1) die Erträge steigen. Er verfügt über eine Stichprobe von 10 Aktien, bei denen eine solche Aufteilung vorgenommen wurde. Dabei kennt er die prozentualen Returns der Aktien jeweils im Monat vor (x i ) und im Monat nach (y i ) dem Aktiensplit. Daten: x i 0.5-0.2 0.9 1.1-0.7 1.5 2.0 1.3 1.6 2.1 y i 1.1 0.3 1.2 1.9-0.2 1.4 1.8 1.8 2.4 2.2 y i x i 0.6 0.5 0.3 0.8 0.5-0.1-0.2 0.5 0.8 0.1 R i + 8 6 4 9.5 6 1.5 3 6 9.5 1.5 Wert der Testgröße des Wilcoxon-Vorzeichen-Rangtests: t = w 10 + = 8 + 6 + 4 + 9.5 + 6 + 0 + 0 + 6 + 9.5 + 1.5 = 50.5 Kritischer Bereich (α = 0.05): w 10;0.05 + = 10, w 10;0.95 + = 10 11 2 w 10;0.05 + = 55 10 = 45, K = {t R : 45 t 55} Testergebnis: t K, H 0 wird abgelehnt, Erträge steigen signifikant PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 1

Wilcoxon-Rangsummentest Wilcoxon-Rangsummentest dient zum Vergleich zweier unabhängiger Stichproben hinsichtlich ihrer zentralen Tendenz (ihrer Lage) kann im Fall von Grundgesamtheiten an Stelle des doppelten t-tests verwendet werden Wilcoxon-Rangsummentest wird unter anderem auch als Rangtest nach Wilcoxon bezeichnet, er ist äquivalent zum U-Test von Mann-Whitney gegeben: 2 unabhängige Stichproben X 1,..., X n1 mit stetiger Verteilungsfunktion F X und Y 1,..., Y n2 mit stetiger Verteilungsfunktion F Y, wobei F Y (t) = F X (t + a) mit einer reellen Zahl a vorausgesetzt wird (dann gilt auch µ X = EX = EY + a = µ Y + a falls Erwartungswerte existieren). kann als zweiseitiger oder als einseitiger Test ausgeführt werden PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 2

Wilcoxon-Rangsummentest Fortsetzung H 0 : a = 0, H A : a 0 (bzw. H 0 : µ X = µ Y, H A : µ X µ Y ). In der gemeinsamen Stichprobe (beide Stichproben zusammen) werden die Ränge bestimmt. Bildet man die Summe der Ränge in der ersten Stichprobe, erhält man die Testgröße T = R 1. Kritischer Bereich (kleine n 1, n 2 ): K = {t : t w n1,n 2 ;α/2} {t : t w n1,n 2 ;1 α/2}; die Quantile w n1,n 2 ;α/2 und w n1,n 2 ;1 α/2 kann man in Tabellen finden, dabei gilt w n1,n 2 ;1 α = n 1 (n 1 + n 2 1) w n1,n 2 ;α. Für (Faustregel: n 1 4, n 2 4, n 1 + n 2 20) ist T = R 1 1 2 n 1(n 1 + n 2 + 1) 1 12 n 1n 2 (n 1 + n 2 + 1) näherungsweise standardnormalverteilt, so dass man zur Bestimmung des kritischen Bereichs die entsprechenden Quantile der Standardnormalverteilung nutzen kann. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 3

Beispiel: Abiturnoten und Studienrichtungen Mit Hilfe einer Untersuchung sollte geprüft werden, ob sich Studenten verschiedener Studienrichtungen (Psychologie X und Medizin Y ) hinsichtlich ihrer Leistungsvoraussetzungen für ein Studium, erhoben mit der Durchschnittsnote ihres Abiturs, unterscheiden. Hypothesen: H 0 : a = 0, (d.h. F X = F Y ), H A : a 0. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 4

Daten und Rangplätze im Beispiel Abiturnoten und Studienrichtungen Daten und Rangplätze Psychologiestudenten: n 1 = 21 x i 2.12 2.17 2.00 1.62 1.59 1.93 1.90 r i 26 28 22 4 1 19 18 x i 2.05 2.01 1.97 2.60 2.34 1.60 1.66 r i 25 23 21 42 37 2 8 x i 1.95 2.25 1.81 1.83 2.29 1.65 2.46 r i 20 32 12 13 35 7 39 Daten und Rangplätze Medizinstudenten: n 2 = 21 y i 1.86 2.24 1.84 2.27 1.61 1.74 2.13 r i 16 31 14 34 3 10 27 y i 2.18 1.63 1.87 2.26 1.75 2.43 2.49 r i 29 5 17 33 11 38 40 y i 1.69 1.64 2.19 2.04 2.57 2.33 1.85 r i 9 6 30 24 41 36 15 PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 5

Test im Beispiel Abiturnoten und Studienrichtungen Summe Rangzahlen Psychologiestudenten: R 1 = 434. Summe Rangzahlen Medizinstudenten: R 2 = 469. Test für große Stichproben: Wert der Testgröße: t = 434 0.5 21 43 21 2 43 12 Kritischer Bereich (α = 0.01, zweiseitiger Test) K = {t R : t > z 0.995 = 2.567}. = 0.440. Testergebnis: t K, H 0 wird nicht abgelehnt, Leistungsvoraussetzungen unterscheiden sich nicht signifikant. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 6

Bindungen Bei Vorzeichen- oder auf Rängen basierten Tests kann es trotz der Stetigkeitsannahme der entsprechenden Verteilungen vorkommen, dass in der Stichprobe Werte vorkommen. Man spricht dann von auftretenden Bindungen (engl. ties ). Der Testaufbau sieht Bindungen eigentlich nicht vor (die Wahrscheinlichkeit dafür ist ), deshalb muss man die Tests geeignet modifizieren. Bei rangbasierten Tests mittelt man beim Auftreten von Bindungen einfach die Rangzahlen. Besonders kritisch sind Bindungen bei Vorzeichentests, wenn im Einstichprobenproblem einige Werte gleich dem Median sind bzw. im Zweistichprobenproblem einige Differenzen gleich Null sind. Bei bestimmten Tests, wie z.b. dem Wilcoxon-Rangsummentest oder dem Kruskal-Wallis-Test (er wird später behandelt) muss die Testgröße beim Vorliegen von Bindungen in der Stichprobe entsprechend angepasst werden (siehe Literatur). PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 7

Mögliche Vorgehensweisen beim Auftreten von Bindungen bei Vorzeichentests oft kann man Bindungen Messgenauigkeit erhöht, indem man die Beobachtungen mit Bindung werden nicht berücksichtigt ( geringerer Stichprobenumfang) Beobachtungen mit Bindung werden zu gleichen Teilen beiden Gruppen (+ bzw., etc.) zugeordnet, bei ungerader Anzahl der Bindungen wird eine Beobachtung nicht berücksichtigt die Beobachtungen mit Bindung werden zufällig mit einer Wahrscheinlichkeit von einer der beiden Gruppen zugeordnet Nulldifferenzen erhalten das Vorzeichen PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 8

Verteilungstests eine weitere Klasse von Tests beschäftigt sich mit der Prüfung, ob die Werte der Stichprobe aus einer Grundgesamtheit mit einer speziellen hypothetischen Verteilungsfunktion stammen ausführlicher wird hier der χ 2 -Anpassungstest behandelt kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auch Kolmogorow-Anpassungstest) und der Shapiro-Wilk-Test weitere Tests, die zum Teil für bestimmte Typen von Verteilungsfunktionen entwickelt wurden, kann man in der Literatur finden PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 9

Der χ 2 -Anpassungstest Test, ob vorliegende Stichprobe aus einer Grundgesamtheit mit einer hypothetischen Verteilungsfunktion F 0 entstammt. Prinzipielles Vorgehen: der Stichprobe mit der hypothetischen Verteilung falls die Abweichungen zu groß sind, dann erfolgt eine Nullhypothese der Der Test ist ein asymptotischer Test, d.h. man rechnet mit der asymptotischen Verteilung (für n ) der Testgröße unter H 0. Hypothesen: H 0 : F (x) = F 0 (x), x R, F 0 ist eine Verteilungsfunktion, ( ) x µ z.b. F 0 (x) = Φ falls X N (µ, σ 2 ); σ H A : F (x) F 0 (x) für mindestens ein x R. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 10

Definition der Testgröße T Einteilung der gesamten Merkmalsachse in k Klassen A 1 = (, a 1 ), A 2 = [a 1, a 2 ),..., A k = [a k 1, ). Bestimmung der absoluten Klassenhäufigkeiten H 1, H 2,..., H k (Anzahl der Stichprobenwerte in der jeweiligen Klasse). Bestimmung der theoretischen Wahrscheinlichkeiten für die Klassenzugehörigkeiten unter der Annahme der Gültigkeit von H 0, p 1 = P H0 (A 1 ) = P H0 (X < a 1 ) = F 0 (a 1 ), p 2 = P H0 (A 2 ) = P H0 (a 1 X < a 2 ) = F 0 (a 2 ) F 0 (a 1 ),... p k = P H0 (A k ) = P H0 (a k 1 X) = 1 F 0 (a k 1 ) Testgröße: T = k (H j np j ) 2 j=1 diese Größe ist unter H 0 np j ( χ 2 Abstandsfunktion ), asymptotisch χ 2 k 1 -verteilt PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 11

Kritischer Bereich und Bemerkungen Kritischer Bereich: K = {t R : t > χ 2 k 1;1 α }. Bemerkungen: Der Stichprobenumfang n sollte nicht zu klein sein. Die Anzahl und die Größe der Klassen A j sollte so sein, dass np j = np H0 (X A j ) > 1 für alle j = 1,..., k gilt (und zusätzlich np j 5 für mindestens 80% der Klassen; ggf. Klassen zusammenfassen oder gesamte Klasseneinteilung ändern). Bei diskreten Verteilungen und nicht zu kleinen Einzelwahrscheinlichkeiten sollte pro Merkmalswert gewählt werden. Klasse Modifikation: Unbekannte Parameter in der Verteilungsfunktion F 0 können durch (Maximum-Likelihood-)Schätzungen ersetzt werden. Sind m Parameter zu schätzen, so ist anstelle χ 2 k 1 die -Verteilung zu benutzen. χ 2 k m 1 PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 12

Beispiel: Test auf gerechten Würfel Anhand einer Stichprobe von n = 90 Würfelergebnissen soll mit α = 0.05 getestet werden, ob der Würfel gerecht ist, d.h. ob für die Augenzahl X gilt: H 0 : p i = P (X = i) = 1 6, i = 1,..., 6. Daten: Augenzahl 1 2 3 4 5 6 H j 19 13 14 12 17 15 np j 15 15 15 15 15 15 Wert der Testgröße: t = 16 15 + 4 15 + 1 15 + 9 15 + 4 15 + 0 15 = 34 15 = 2.26. Kritischer Bereich: K = (χ 2 5;0.95, ) = (11.07, ). Testergebnis: t K, H 0 wird nicht abgelehnt, die Abweichungen der beobachteten Häufigkeiten von den theoretischen sind nicht signifikant. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 13

Beispiel: technisches Nennmaß X... Abweichung vom Nennmaß; X N (µ, σ 2 ) wird getestet. ( ) x µ H 0 : F (x) = Φ, x R; σ ( ) x µ H A : F (x) Φ für mindestens ein x R σ α = 0.05 n = 150 Messungen, ˆµ = x = 40.48, ˆσ = s = 5.71, m = 2 Schätzparameter, sei k = 8 (Anzahl der Klassen); z j = a j x, j = 1,..., k s PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 14

Daten und Test im Beispiel technisches Nennmaß a j H j z j Φ(z j ) p j np j... 30.5 5-1.75 0.04006 0.04006 6.009 30.5... 33.5 13-1.22 0.11123 0.07117 10.676 33.5... 36.5 23-0.70 0.24196 0.13073 19.610 36.5... 39.5 22-0.17 0.43250 0.19054 28.581 39.5... 42.5 29 0.35 0.63683 0.20433 30.650 42.5... 45.5 29 0.88 0.81085 0.17402 26.103 45.5... 48.5 16 1.40 0.91924 0.10839 16.259 48.5... 13 0.08076 12.114 150 1.0000 k (H j np j ) 2 t = = 3.25, K = (χ 2 8 2 1;0.95 = 11.1, ), np j=1 j t K, H 0 wird nicht abgelehnt. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 15

Der Kolmogorow-Smirnow-Test Der Kolmogorow-Smirnow-Test (Kolmogorow-Anpassungstest) basiert auf der empirischen Verteilungsfunktion ˆF n zur Stichprobe (vom Umfang n): Anzahl Stichprobenwerte < x ˆF n (x) :=, x R. n Voraussetzung: Die hypothetische Verteilungsfunktion F 0 ist stetig und enthält unbekannten Parameter. Hypothesen: H 0 : F (x) = F 0 (x), x R; H A : F (x) F 0 (x) für mindestens ein x R. Testgröße: T = sup ˆF n (x) F 0 (x). x R Der Test wird günstigerweise mit einem Computerprogramm durchgeführt. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 16

Bemerkungen zum Kolmogorow-Smirnow-Test Der Kolmogorow-Smirnow-Test (kurz auch K-S-Test ) ist im Gegensatz zum χ 2 -Anpassungstest auch für kleine Stichproben anwendbar und das Testergebnis hängt nicht von einer Klasseneinteilung ab. Man kann Tests mit dem K-S-Test durchführen. Es gibt Verallgemeinerungen des K-S-Tests, bei denen statt festgelegter Parameterwerte der hypothetischen Verteilung F 0 geeignete Schätzwerte eingesetzt werden (z.b. der Lilliefors-Test im Fall von Normalverteilungen). Man kann mit einer Version des K-S-Testes auch prüfen, ob zwei Stichproben aus einer Grundgesamtheit stammen, also übereinstimmende Verteilungen zugrundeliegen. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 17

Der Shapiro-Wilk-Test zur Normalverteilungsprüfung Der Shapiro-Wilk-Test prüft ausschließlich, ob bei einer Stichprobe eine Normalverteilung vorliegt. Dieser Test besitzt eine kleinen Stichprobenumfängen., insbesondere auch im Fall von Grundlage des Tests sind bestimmte Eigenschaften der Ordnungsstatistiken einer Stichprobe aus einer normalverteilten Grundgesamtheit. Der Test ist sehr rechenintensiv und sollte mit Statistik-Software durchgeführt werden. PD Dr. Frank Heyde (TUBAF) Statistik II für Betriebswirte Vorlesung 3 18