Business Value Launch 2006



Ähnliche Dokumente
Willkommen zur Vorlesung Statistik

3. Der t-test. Der t-test

Grundlagen der Inferenzstatistik

Überblick über die Verfahren für Ordinaldaten

QM: Prüfen -1- KN

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

Auswertung mit dem Statistikprogramm SPSS:

Messung von Veränderungen. Dr. Julia Kneer Universität des Saarlandes

Statistik II für Betriebswirte Vorlesung 2

3. Der t-test. Der t-test

Statistische Auswertung:

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Willkommen zur Vorlesung Statistik (Master)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Universität Bonn 28. Juli 2010 Fachbereich Rechts- und Wirtschaftswissenschaften Statistische Abteilung Prof. Dr. A. Kneip. KLAUSUR Statistik B

Primzahlen und RSA-Verschlüsselung

Zeichen bei Zahlen entschlüsseln

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Webergänzung zu Kapitel 10

9. Schätzen und Testen bei unbekannter Varianz

Ein möglicher Unterrichtsgang

Statistik II. Statistik II, SS 2001, Seite 1 von 5

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50, ,5 51,7 48,8

Tutorial: Homogenitätstest

Mathematische und statistische Methoden II

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Die Optimalität von Randomisationstests

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Statistik II für Betriebswirte Vorlesung 3

Einfache statistische Auswertungen mit dem Programm SPSS

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

1.3 Die Beurteilung von Testleistungen

Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall

Einführung in statistische Analysen

Forschungsstatistik I

Varianzanalyse ANOVA

2.1 Die Normalverteilung

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Eine Einführung in R: Statistische Tests

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE

Einfache Varianzanalyse für abhängige

R ist freie Software und kann von der Website.

Stichprobenauslegung. für stetige und binäre Datentypen

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

Statistik für Studenten der Sportwissenschaften SS 2008

Data Mining: Einige Grundlagen aus der Stochastik

Hauptprüfung Abiturprüfung 2015 (ohne CAS) Baden-Württemberg

Grundlagen der Inferenzstatistik: Was Ihnen nicht erspart bleibt!

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Statistik mit Excel. für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE. Markt+Technik

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Statistik im Versicherungs- und Finanzwesen

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester Juli 2005

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = ,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung

Berechnung der Erhöhung der Durchschnittsprämien

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x y = x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

Gewinnvergleichsrechnung

Physik & Musik. Stimmgabeln. 1 Auftrag

Die drei Kernpunkte der modernen Portfoliotheorie

Einfache statistische Testverfahren

Klausur Nr. 1. Wahrscheinlichkeitsrechnung. Keine Hilfsmittel gestattet, bitte alle Lösungen auf dieses Blatt.

Grundlagen der Datenanalyse am Beispiel von SPSS

Abiturprüfung Mathematik 2008 (Baden-Württemberg) Berufliche Gymnasien ohne TG Analysis, Aufgabe 1

q = 1 p = k k k = 0, 1,..., = [ ] = 0.678

Ergänzungen zum Fundamentum

Statistik I für Betriebswirte Vorlesung 5

SS 2014 Torsten Schreiber

Statistische Thermodynamik I Lösungen zur Serie 1

Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)

Änderung des IFRS 2 Anteilsbasierte Vergütung

Übersicht: Modul 2. Methoden der empirischen Sozialforschung, Statistik und computergestützte Datenanalyse. Dr. H.-G. Sonnenberg

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Das Mathematik-Abitur im Saarland

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

Korrelation (II) Korrelation und Kausalität

Zählstatistik. Peter Appel. 31. Januar 2005

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Korrelation. Übungsbeispiel 1. Übungsbeispiel 4. Übungsbeispiel 2. Übungsbeispiel 3. Korrel.dtp Seite 1

Aufgabe 1: Nehmen Sie Stellung zu den folgenden Behauptungen (richtig/falsch mit stichwortartiger Begründung).

Aufgabenblatt 3: Rechenbeispiel zu Stiglitz/Weiss (AER 1981)

y P (Y = y) 1/6 1/6 1/6 1/6 1/6 1/6

Transkript:

Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung Inferenzstatistik bedeutet übersetzt schließende Statistik. Damit ist der Schluss von den erhobenen Daten einer Stichprobe auf Werte in der Population gemeint. Die Normalverteilung Einführung In der Natur sind sehr viele Merkmale normalverteilt. Dies gilt beispielsweise für die Körpergröße, Intelligenz oder das Sehvermögen. Die Normalverteilung galt sogar zeitweise als eine Art Naturgesetz. Auch wenn diese Vorstellung mittlerweile abgelehnt wird, so zeigt sie doch die herausragende Bedeutung der Normalverteilung in der Mathematik und in den empirischen Sozialwissenschaften. Sehr viele statistische Verfahren, die für wissenschaftliches Arbeiten erforderlich sind, setzen voraus, dass die relevanten Merkmale normalverteilt sind. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 1

Die Normalverteilung Darstellung der Funktion Zu sehen ist eine unimodale und eingipflige Verteilung mit glockenförmigem Verlauf. Sie ist symmetrisch und nähert sich der x-achse asymptotisch an. Dadurch sind die Werte für Median, Modus und arithmetisches Mittel identisch. Eine solche Verteilung heißt Normalverteilung. Die Normalverteilung Wahrscheinlichkeiten unter der Normalverteilung Aus der Symmetrie der Normalverteilung folgt, dass die Wahrscheinlichkeit, einen größeren Wert als den Mittelwert zu messen, bei p : 0,5 liegt. Da eine Kurve aus unendlich vielen Punkten besteht, ist die Wahrscheinlichkeit für einen einzelnen Wert unendlich klein. Deshalb sind Wahrscheinlichkeitsberechnungen nur für Flächen, also Intervalle unter der Kurve möglich, niemals für einzelne Werte. Für Normalverteilungen gilt, dass die Fläche, die von +/- einer Standardabweichung vom Mittelwert begrenzt wird, mehr als 2/3 aller (68,26%) beinhaltet. 95,44% liegen im Bereich von +/- zwei Standardabweichungen. Die Normalverteilung Wahrscheinlichkeiten unter der Normalverteilung MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 2

Mittelwertsvergleiche (Verfahren für intervallskalierte Daten) untersucht, ob sich zwei empirisch gefundene Mittelwerte systematisch voneinander unterscheiden. Mit Hilfe dieses Testverfahrens ist es möglich festzustellen, ob zwei betrachtete Gruppen in einem untersuchten Merkmal wirklich einen Unterschied aufweisen oder ob ein gefundener Mittelwertsunterschied rein zufällig entstanden ist. Voraussetzungen für die Anwendung eines t-tests Voraussetzungen für die Anwendung eines t-tests Für den t-test gibt es drei mathematische Voraussetzungen: 1. Das untersuchte Merkmal ist intervallskaliert. 2. Das untersuchte Merkmal ist in der Population normalverteilt. 3. Die Populationsvarianzen, aus denen die beiden Stichproben stammen, sind gleich (Varianzhomogenität). Mittelwertsvergleiche Wegen dieser Voraussetzungen gehört der t-test zur Gruppe der parametrischen Verfahren. Parametrische Verfahren schätzen Populationsparameter mittels statistischer Kennwerte wie dem arithmetischen Mittel oder der Varianz, für deren Berechnung die Intervallskaliertheit der Daten Voraussetzung ist. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 3

Die Fragestellung des t-tests Die zentrale Frage des t-tests lautet: Wie wahrscheinlich ist die empirisch gefundene oder eine größere Mittelwertsdifferenz unter allen möglichen rein theoretisch denkbaren Differenzen? Der wichtigste Wert für die Durchführung eines t-tests ist die Differenz der Gruppenmittelwerte. Diese Differenz bildet den Stichprobenkennwert des t-tests: Die Fragestellung des t-tests Die Fragestellung des t-tests kann jeweils nur zwei Gruppen im Mittelwertsvergleich betrachten. Inhaltliche Hypothesen müssen in statistische Hypothesen umformuliert werden. Die Bildung der Differenz wird entscheidend durch die Formulierung der statistischen Hypothese mitbestimmt: Sie legt fest, welcher Wert vom anderen abgezogen wird. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 4

Die Nullhypothese Für die Erklärung der Mittelwertsdifferenz gibt es neben der Annahme eines systematischen Unterschieds zwischen den beiden Gruppen eine weitere Möglichkeit: Die Differenz zwischen den Mittelwerten ist zufällig zustande gekommen und es gibt keinen echten Unterschied zwischen den beiden untersuchten Gruppen. Die beiden Gruppen stammen im Grunde aus zwei Populationen mit demselben Mittelwert. Die Differenz zwischen den Gruppen sollte demzufolge Null betragen. Diese Annahme heißt deshalb Nullhypothese oder H0. Stichprobenkennwerteverteilung unter der Nullhypothese Wird aus zwei Populationen mit identischem Populationsmittelwert jeweils eine Stichprobe gezogen, so kann die Differenz der beiden Stichprobenmittelwerte theoretisch jeden beliebigen Wert annehmen. Die zu erwartende Differenz aber ist gleich Null, denn die Stichprobenmittelwerte sind normalverteilt um ihren jeweiligen Erwartungswert, den Populationsmittelwert. findet in den meisten Fällen als Nullhypothesensignifikanztest Anwendung. Die Bewertung des t-werts MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 5

Die Bewertung des t-werts Unter der Annahme der Nullhypothese errechnet der t-test eine Wahrscheinlichkeit für das Auftreten der gefundenen oder einer größeren Differenz, die z.b. p = 0,03 beträgt. Der errechnete Wert von 3% (p = 0,03) bedeutet, dass die Wahrscheinlichkeit für das Finden einer solchen oder einer größeren Differenz beim Ziehen von Stichproben aus einer identischen Population sehr gering ist. Natürlich ist diese Differenz möglich, sie ist aber sehr unwahrscheinlich. Wenn die Differenz unter Annahme der Nullhypothese sehr unwahrscheinlich ist, so trifft möglicherweise die Annahme selbst gar nicht zu. Die Bewertung des t-werts Die Entwicklung eines Entscheidungskriteriums Das Signifikanzniveau muss vor der Durchführung einer Untersuchung festgelegt und begründet werden, um das Ergebnis beurteilen zu können. Per Konvention liegt es meist bei α = 0,05, einige Untersuchungen verwenden 1% oder 10%. Ein auf dem 5%- Niveau signifikantes Ergebnis wird in der Literatur und in SPSS in der Regel mit einem Sternchen ( * ) gekennzeichnet, ein auf dem 1%- Niveau signifikantes Ergebnis mit zwei Sternchen ( ** ). MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 6

Mittelwertsvergleiche Durch eine Zuordnung von Rangplätzen wird eine künstliche Äquidistanz zwischen den Werten erzeugt, die viele mathematische Operationen wie z.b. die Mittelwertsbildung erst ermöglicht. Die nichtparametrischen arbeiten nicht mit Populationsparametern und verteilungen, sondern legen ihre eigene Verteilung (die der Rangplätze) zu Grunde. Der U-Test für unabhängige Stichproben oder auch Mann-Whitney U- Test ist ein Verfahren zur Auswertung eines Zwei-Gruppen- Experiments, dessen Bedingungen sich in einer unabhängigen Variable unterscheiden. Ähnlich wie der t-test für unabhängige Stichproben prüft der U-Test, ob die Unterschiede in den zwei Gruppen bezüglich einer abhängigen Variable zufälligen oder systematischen Einflüssen unterliegen. Anders als der t-test aber analysiert der U-Test die Messwerte nicht direkt, sondern die ihnen zugeordneten Rangplätze. Der U-Test stellt primär ein Instrument für ordinalskalierte Daten dar. Er ist aufgrund seiner größeren Vorraussetzungsfreiheit in folgenden Fällen dem t-test für unabhängige Stichproben vorzuziehen: Die Intervallskalenqualität der abhängigen Variable ist zweifelhaft. Das Merkmal folgt in der Population keiner Normalverteilung. Die Annahme der Varianzhomogenität ist verletzt, so dass der t-test für unabhängige Stichproben keine zuverlässigen Ergebnisse mehr liefert. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 7

Zuordnung der Rangplätze Für die Berechnung des U-Werts ist es zuerst notwendig, alle Messwerte in eine gemeinsame Rangreihe zu bringen. Danach wird für jede Gruppe die Summe der Rangplätze sowie der durchschnittliche Rangplatz der Gruppe berechnet. Rangplatzüber- und Rangplatzunterschreitungen Der statistische Kennwert U wird gebildet, indem für jeden Rangplatz einer Person der einen Gruppe die Anzahl an Personen aus der anderen Gruppe gezählt wird, die diesen Rangplatz überschreitet. Der statistische Kennwert U` wird gebildet, indem für jeden Rangplatz einer Person der einen Gruppe die Anzahl an Personen aus der anderen Gruppe gezählt wird, die diesen Rangplatz unterschreitet. Rangplatzüber- und Rangplatzunterschreitungen Ein größerer Unterschied zwischen den Gruppen führt in jedem Fall zu einem größeren Unterschied zwischen U und U. Besteht kein Unterschied zwischen den beiden Gruppen, gibt es genauso viele Rangunter- wie Rangüberschreitungen. Die Nullhypothese des U-Tests lautet deshalb: U = U MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 8

SPSS SPSS SPSS MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 9

Der Wilcoxon-Test Der Wilcoxon-Test oder W-Test ist das nichtparametrische Pendant zum t-test für abhängige Stichproben. Er ist immer in solchen Fällen das nichtparametrische Verfahren der Wahl, wenn die Messwerte zweier Stichproben in irgendeiner Weise voneinander abhängig sind. Der W-Test für abhängige Stichproben arbeitet ebenfalls mit der Analyse einer Rangreihe. Der Wilcoxon-Test Der Wilcoxon-Test MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 10

Der Kruskal-Wallis H-Test Der Kruskal-Wallis H-Test ist ein Verfahren für die statistische Auswertung ordinalskalierter Daten von mehr als zwei unabhängigen Gruppen. Er bietet eine Alternative für die einfaktorielle Varianzanalyse ohne Messwiederholung, wenn deren mathematische Vorraussetzungen nicht erfüllt sind. Deshalb heißt er auch Rangvarianzanalyse. Der Kruskal-Wallis H-Test Der Kruskal-Wallis H-Test MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 11

Der Kruskal-Wallis H-Test MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. 12