III. Induktive Statistik

Ähnliche Dokumente
Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Kapitel 5: Schließende Statistik

10. Testen von Hypothesen Seite 1 von 6

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Tests statistischer Hypothesen

2. Repetition relevanter Teilbereiche der Statistik

Kapitel 6 : Punkt und Intervallschätzer

Schätzen von Populationswerten

Wirksamkeit, Effizienz

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

TESTEN VON HYPOTHESEN

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Schätzen von Populationswerten

Statistik. 2. Semester. Begleitendes Skriptum zur Vorlesung. im FH-Masterstudiengang. Technisches Management. von. Günther Karigl

Testen statistischer Hypothesen

4 Schwankungsintervalle Schwankungsintervalle 4.2

3. Grundbegrie der Schätztheorie

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Wirksamkeit, Effizienz

3 Vergleich zweier unverbundener Stichproben

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

6 Vergleich mehrerer unverbundener Stichproben

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Statistische Tests zu ausgewählten Problemen

Tests für beliebige Zufallsvariable

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Statistik und Wahrscheinlichkeitsrechnung

Empirische Verteilungsfunktion

Statistik und Wahrscheinlichkeitsrechnung

2 Einführung in die mathematische Statistik

X X Schätzen von Vertrauensintervallen Schwankungsintervall

2.3 Kontingenztafeln und Chi-Quadrat-Test

Parameterschätzung. Kapitel Schätzfunktionen

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert

Formelsammlung Statistik 29. Januar 2019

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Diskrete Wahrscheinlichkeitstheorie Wiederholungsklausur

Statistik, Abschnitt (1) Gegeben sei der Stichprobenvektor (X 1,..., X n ). Die Stichprobenfunktion. ˆµ k := 1 n. Xi k (1) i=1.

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

Einstichprobentests für das arithmetische Mittel

Inhaltsverzeichnis. Wirtschaftswissenschaftliches Zentrum 11 Universität Basel. Mathematik 2

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Evaluation & Forschungsstrategien

Anwendung für Mittelwerte

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

1 Vorbemerkungen 1. 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2. 3 Wahrscheinlichkeitsaxiome 4. 4 Laplace-Experimente 6

3.2 Wilcoxon Rangsummentest

Wahrscheinlichkeitstheorie und Statistik vom

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Auszüge der nichtparametrischen Statisik

Kapitel 9: Schätzungen

5.4.2 Die empirische Verteilungsfunktion als Ausgangspunkt

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Induktive Schlussweise. Schätzfunktionen und Schätzverfahren. Bibliografie

Parametrische Einstichprobentests

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2015/2016. Aufgabe 1

X in einer Grundgesamtheit vollständig beschreiben.

Analysis ZAHLENFOLGEN Teil 4 : Monotonie

Mathematik 2 für Naturwissenschaften

Statistik und Wahrscheinlichkeitsrechnung

Kontingenztabellen. Chi-Quadrat-Test. Korrelationsanalyse zwischen kategorischen Merkmalen. 1. Unabhängigkeitstest

Analysis I Lösungsvorschläge zum 3. Übungsblatt Abgabe: Bis Donnerstag, den , um 11:30 Uhr

Einführung in die induktive Statistik. Inferenzstatistik. Konfidenzintervalle. Friedrich Leisch

2 Induktive Statistik

11 Likelihoodquotiententests

Diplomvorprüfung Stochastik

Übungen zu QM III Mindeststichprobenumfang

Eingangsprüfung Stochastik,

Übungen mit dem Applet erwartungstreu

Aufgabe 1. d) Berechnen Sie die Wahrscheinlichkeit dafür, dass Axel 1,5 Stunden warten muss.

Testverfahren zur Prüfung von Hypothesen über Parameter oder Verteilungen

Kapitel VI. Einige spezielle diskrete Verteilungen

(4) = 37,7 % mit 37,7 % Wahrscheinlichkeit sind es höchstens 4 Fahrräder, das ist recht hoch; man kann also die Behauptung nicht wirklich ablehnen.

Statistische Experimente, statistische Modelle

Mathematik 2 für Naturwissenschaften

D-ITET Wahrscheinlichkeitstheorie und Statistik FS 2017 Prof. P. Nolin. Musterlösung 11 = Φ( 6/5) = 1 Φ(6/5) = = 0.

Korrelationsanalyse zwischen kategorischen Merkmalen. Kontingenztabellen. Chi-Quadrat-Test

a) Histogramm der Verteilung: Zunächst werden die gegebenen Messwerte in aufsteigender Reihenfolge sortiert:

6. Übung - Differenzengleichungen

1 Randomisierte Bestimmung des Medians

Prof. Dr. Roland Füss Statistik II SS 2008

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

7. Stichproben und Punktschätzung

Forschungsstatistik I

Wahrscheinlichkeitsrechnung & Statistik - Ergänzung zum Skript

Diskrete Zufallsvariablen

Wörterbuchmethoden und Lempel-Ziv-Codierung

Transkript:

35 III. Iduktive Statistik I diesem Teil der Vorlesug geht es darum, aus gewisse Eigeschafte eier Stichprobe auf etsprechede Eigeschafte der Grudgesamtheit rückzuschließe. Im Uterschied zu de im. Kapitel betrachtete kokrete Stichprobe ( x, x,.., x ) betrachte wir hier (mathematische) Stichprobe ( X,X,..,X ), wobei die X, X,.., X uabhägige ud idetisch wie X verteilte Zufallsvariable sid gemäß der Verteilug, welche X i der Grudgesamtheit besitzt.. Allgemeies zu statistische Testverfahre Zu de grudlegede Aufgabe der mathematische Statistik zählt das Teste vo Hypothese, d.h. gewisser Aahme über Grudgesamtheite. Hypothese köe sich z.b. auf frühere Erfahrugswerte stütze, sie köe eie Sollwert darstelle oder das Ergebis eier zu verifizierede Theorie sei. Mit eiem statistische Test prüft ma also eie vorgefasste Vermutug über eie oder auch mehrere Grudgesamtheite ahad vo Zufallsstichprobe. I diesem Kapitel werde ausschließlich Tests über Parameter vo Verteiluge beschriebe, dere Typ (zumeist die Normalverteilug) bekat ist. Ma spricht i diesem Zusammehag vo parametrische oder auch verteilugsabhägige Testverfahre. Das erste Beispiel eies statistische Testverfahres, mit dem wir us i diesem Abschitt beschäftige, beihaltet die Überprüfug eier Hypothese über de Mittelwert eier ormalverteilte Grudgesamtheit mit bekater Variaz σ. Beispiel.: Wir betrachte hier die Massezüchtug vo Tsetsefliege zu mediziische Zwecke ud ehme dazu a, dass die Produktivität eier Tsetsefliegekoloie durch eie ormalverteilte Zufallsvariable X beschriebe wird, wobei die Variaz σ = 5.85 aus frühere Utersuchuge bekat ist. Im Normalfall, d.h. bei Abweseheit vo Störursache, ka mit eier durchschittliche Azahl vo µ 0 = 57 Nachkomme pro Kohorte gerechet werde. Eie kokrete Stichprobe vo vier Kohorte liefert u die Werte x = 5, x = 54, x 3 = 49 ud x 4 = 55. Ka aufgrud dieser Stichprobe die Aahme beibehalte werde, dass sich die Produktivität och ormal verhält, d.h., dass der Erwartugswert µ vo X dem Sollwert µ 0 etspricht? Zur Beatwortug dieser Frage formuliere wir zuächst die sogeate Nullhypothese H 0 : µ = µ 0. Die Negatio vo H 0 wird als Alterative (oder Alterativhypothese) H bezeichet ud lautet µ µ 0. Usere Aufgabe besteht u dari, festzustelle, ob die Nullhypothese ahad der gegebee Stichprobe beibehalte werde ka oder aber abzulehe (ud damit die Alterativhypothese azuehme) ist. Diese Etscheidugsprozeß ka ma folgedermaße führe: Ma bestimmt aus de Stichprobewerte x l, x,..., x (i obigem Beispiel ist = 4) de Mittelwert x ud verwedet diese als Schätzwert für de ubekate Erwartugswert µ vo X. Der Mittelwert x ist da Realisierug eier Zufallsvariable X, welche ach II, 4. ebefalls ormalverteilt ist ud zwar mit dem Erwartugswert E (X) µ = µ ud der Variaz V(X) = σ = σ /. = X Dies bedeutet, wiederum ach II, 4., dass bei Bestehe der Nullhypothese H 0 : µ = µ 0 die aus X durch Stadardisiere hervorgehede Zufallsvariable Z, also X

36 X µ (*) Z X X µ 0 = = σ σ X stadardormalverteilt ist. Ma ka die Nullhypothese daher icht bereits da ablehe, we x < µ 0 oder x > µ 0 ist, de die Wahrscheilichkeit dafür ist jeweils /. Verüftig erscheit es aber, die Nullhypothese abzulehe, we x de Sollwert µ 0 wesetlich uteroder überschreitet, d.h., we der mit Hilfe vo x aus (*) errechete Wert z vo Z gewisse kritische Greze c bzw. +c uter- bzw. überschreitet, die so gewählt sid, dass eie Uterschreitug (ud ebeso auch eie Überschreitug) ur mit eier vorgegebee kleie Wahrscheilichkeit α/ zu erwarte ist. Für de kritische Wert c erhält ma aus der Forderug P(Z < c) = P(Z > c) = α/ die Bestimmugsgleichug Φ(c) = α/, d.h. c = Φ ( α / ) wobei die Berechug vo c durch Nachschlage i eier Tabelle der Werte vo Φ (x) oder explizite Aufruf der Fuktio Φ (x) i eiem Statistikprogramm (i Excel wäre dies z.b. STANDNORMINV(x)) geschehe ka. Obige Größe Z wird als Teststatistik oder Prüfgröße für usere Test bezeichet. Fällt die aus de Stichprobewerte x l, x,..., x berechete Realisierug z vo Z i de sogeate Aahmebereich, ist also c z c, so wird die Nullhypothese beibehalte, fällt sie higege i de kritische Bereich (Ablehugsbereich), d.h. gilt z < c oder z > c, so wird die Nullhypothese verworfe. Dabei ist c durch die vorzugebede Wahrscheilichkeit α (meist 5%, % oder 0.%) bestimmt; aus der Tafel für die Verteilugsfuktio der Stadardormalverteilug etehme wir beispielsweise für α = 0.05 de Wert c =.96. Die Zahl α heißt Sigifikaziveau oder auch Irrtumswahrscheilichkeit, de sie gibt die Wahrscheilichkeit dafür a, dass die Nullhypothese abgeleht wird, obwohl sie richtig ist (vgl. utestehede Abbildug). Wir komme u auf obiges Beispiel zurück ud teste die Hypothese, dass die Produktivität de gestellte Aforderuge etspricht, ud zwar auf dem Sigifikaziveau α = 0.0. Der zugehörede kritische Wert beträgt c =.58 (=STANDNORMINV(-0,0/) i Excel). Wir bereche u aus de Stichprobewerte 5, 54, 49 ud 55 de Mittelwert x = 5.5. Er uterschreitet de Sollwert µ 0 = 57 beträchtlich, ud es erhebt sich die Frage, ob ma diese Abweichug och als zufallsbedigt asehe ka oder ob sich x ud µ 0 sigifikat voeiader uterscheide. Wie sich zeigt, ist eie zufallsbedigte Abweichug auf dem %- Sigifikaziveau icht mehr gerechtfertigt: Der Wert

37 5.5 57 z = 5.85 4 = 3.7 der Teststatistik Z ist deutlich kleier als c, d.h., die Prüfgröße fällt i de Ablehugsbereich (siehe Abbildug), ud es ist azuehme, dass sich die Produktivität aufgrud irgedwelcher Störursache vom Sollwert etfert hat. I der obige Testsituatio wird die Nullhypothese da verworfe, we der Abstad x µ 0 eie bestimmte kritische Schrake überschreitet, d.h., we x sigifikat uter oder über dem feste Wert µ 0 liegt. Ma spricht daher vo eiem zweiseitige Test. Abweichuge köe aber auch ur i eier Richtug bedeutugsvoll oder möglich sei. Ma deke z.b. a die Überprüfug eier Maximalkozetratio im Gesudheits- oder Umweltbereich. I diesem Fall lautet die Nullhypothese H 0 : µ µ 0, die Alterative H l : µ > µ 0. Ma wird also die Nullhypothese ur da verwerfe, we eie sigifikate Abweichug des Stichprobemittels ach obe auftritt, eie Abweichug ach ute spielt keie Rolle. Der kritische Wert c wird da ählich wie obe aus der Gleichug Φ(c) = α bestimmt, wobei Φ(x) wieder die Verteilugsfuktio der Stadardormalverteilug bezeichet. Gilt für de Wert z der Teststatistik z > c, so wird die Hypothese H 0 verworfe, i jedem adere Fall wird sie beibehalte. Wir ee de so modifizierte Test eie eiseitige Test auf Überschreitug. Aalog ist ei eiseitiger Test auf Uterschreitug möglich. Aahmebereiche ud kritische Bereiche beim ei- ud zweiseitige Test sid i folgeder Abbildug dargestellt. Allgemei läuft jeder Sigifikaztest ach dem folgede Schema ab: Formuliere der Nullhypothese H 0 ud der Alterative H (je ach eiseitiger oder zweiseitiger Fragestellug!) Bereitstellug eier geeigete Prüfgröße (Teststatistik) Wahl des Sigifikaziveaus α ud Bestimmug des kritische Bereichs für die vorgegebee Prüfgröße

38 Berechug eies Wertes z der Teststatistik aufgrud der erhobee Zufallsstichprobe Ablehug der Nullhypothese, falls z i de kritische Bereich fällt (Dabei ist die Wahrscheilichkeit, dass H 0 irrtümlich verworfe wird, gleich α.) Fällt der Wert der Teststatistik i de Aahmebereich, d.h., erweist sich ei besteheder Uterschied zwische x ud µ 0 als icht sigifikat, so ka diese Tatsache och icht als eie Bestätigug der Nullhypothese gewertet werde. Ei Wert im Aahmebereich besagt lediglich, dass die Hypothese zu de Date der Stichprobe icht im Widerspruch steht. Da also das Verwerfe eier Hypothese mehr Aussagekraft besitzt als dere Beibehaltug, ist es güstig, ach Möglichkeit die Nullhypothese als Gegeteil vo dem zu formuliere, was ma beweise möchte, ud zu versuche, sie zu widerlege. Ob allerdigs ei besteheder Uterschied als sigifikat erkat wird oder icht, hägt zumeist auch gaz wesetlich vom Stichprobeumfag ab. Im Zusammehag mit diese Überleguge muss betot werde, dass das Sigifikaziveau prizipiell vor der Durchführug des Testverfahres (ja sogar vor der Dateerhebug) festgesetzt werde sollte, de ur so bleibt die für die Irrtumswahrscheilichkeit α gegebee Iterpretatio richtig. Trotzdem hat es sich i der Praxis isbesodere beim Arbeite mit eischlägige Computerprogramme eigebürgert, oft erst ach dem Test das erreichte Sigifikaziveau P zu bestimme ud i der Form P > 0.05 (oder.s., d.h. icht sigifikat), P 0.05, P 0.0 bzw. P 0.00 azugebe. Dieser sogeate P-Wert etspricht der Wahrscheilichkeit für eie Abweichug der Testgröße vom Sollwert im beobachtete oder och größere Ausmaß (im Sie der Alterativhypothese). Es bleibt da dem Aweder überlasse, das Testergebis gemäß dem vo ihm bevorzugte oder für dieses Problem als geeiget erachtete Sigifikaziveau zu bewerte. Zum Abschluss der eiführede Bemerkuge zur Testtheorie wolle wir us och mit de mögliche Fehletscheiduge befasse, die beim Teste vo Hypothese auftrete köe. Wie wir gesehe habe, wird durch die Sigifikazzahl α der kritische Bereich festgelegt, also die Mege jeer Werte der Teststatistik, die zu eiem Verwerfe der Nullhypothese führe. Nu ka es atürlich passiere, dass die Stichprobe eie so uwahrscheiliche Wert liefert, dass die Nullhypothese abgeleht wird, obwohl sie richtig ist. Dabei begeht ma eie Irrtum; dieser wird Fehler erster Art oder α -Fehler geat, da er mit der ageommee Wahrscheilichkeit α auftritt. Das Sigifikaziveau α gibt also die Wahrscheilichkeit a, die Nullhypothese zu urecht abzulehe. Eie Fehler begeht ma aber auch da, we ma die Nullhypothese icht verwirft, obwohl sie i Wirklichkeit falsch ist. Diese Fehletscheidug wird Fehler zweiter Art oder β -Fehler geat, wobei β gerade die Wahrscheilichkeit für das Auftrete dieses Fehlers bezeichet. Mögliche Etscheiduge beim Hypothesetest: Die Nullhypothese wird ageomme wird verworfe ist richtig richtige Etscheidug Fehler. Art (mit Wsch. α ) ist falsch Fehler. Art (mit Wsch. β ) richtige Etscheidug Geau geomme hägt die Wahrscheilichkeit, dass H 0 abgeleht wird, vo de aktuelle (we auch ubekate) Parameter der Verteilug der Grudgesamtheit ab, also etwa vom Mittelwert µ. Diese Wahrscheilichkeit, die jedem Parameterwert µ egal ob er i der Nullhypothese oder i der Alterative ethalte ist zugeordet werde ka, bezeichet ma als Güte(fuktio) oder Treschärfe g(µ) des Tests. Die Wahrscheilichkeit β für eie Fehler zweiter Art lässt sich daher darstelle als β = g(µ). Im allgemeie wird ma

39 atürlich bestrebt sei, beide Fehlerwahrscheilichkeite α ud β so gerig wie möglich zu halte, wobei allerdigs zu beachte ist, dass z.b. eie Verrigerug vo α meist eie Zuahme vo β zur Folge hat ud umgekehrt. Ma wird also bei der Wahl des Sigifikaziveaus im Auge behalte müsse, welche Kosequeze mit eiem Fehler erster bzw. zweiter Art verbude sid. Es gilt die folgede Faustregel: Sid die Kosequeze schwerwieged, we die Nullhypothese falsch ist, aber irrtümlich icht verworfe wird, da wird ma die Irrtumswahrscheilichkeit α eher groß wähle. Überwiege dagege die Nachteile, we H 0 richtig ist, jedoch die Alterative irrtümlich ageomme wird, so ist eie kleie Irrtumswahrscheilichkeit α vorzuziehe.. Vergleich vo Mittelwerte bzw. Variaze I diesem Abschitt werde Testverfahre für ei ud zwei Stichprobe behadelt. Der Test eier Hypothese µ = µ 0 über de Mittelwert µ eier ormalverteilte Grudgesamtheit mit bekater Variaz wurde bereits im letzte Abschitt ausführlich behadelt. I der Regel wird aber die Variaz σ ubekat sei ud muss durch die Stichprobevariaz s geschätzt werde. I diesem Fall kommt ei modifiziertes Testverfahre, der sogeate Eistichprobe-t-Test zur Awedug. Die Rolle der Teststatistik überimmt dabei die aus de Stichprobevariable X ud S gebildete Stichprobefuktio X µ (**) T = 0. S Sie besitzt uter Aahme der Hypothese µ = µ 0 eie t-verteilug mit Freiheitsgrade, wobei de Umfag der Stichprobe bezeichet. Die sog. t-verteilug spielt ebeso wie die Normalverteilug eie außerordetlich wichtige Rolle bei statistische Schätz- ud Prüfverfahre. Die Dichtekurve f(x) der t-verteilug ist ählich wie die der Normalverteilug symmetrisch ud glockeförmig. Das Aussehe vo f(x) wird ur vo eiem Parameter FG bestimmt, der Azahl der Freiheitsgrade heißt. Mit wachseder Zahl FG strebt f(x) gege die Dichtefuktio Φ(x) der Stadardormalverteilug ud fällt für FG 30 praktisch mit Φ(x) zusamme. Nachstehede Abbildug zeigt die Dichtekurve der t-verteilug für verschiedee Freiheitsgrade.

40 Das Etscheidugsverfahre bei Eistichprobe-t-Test, das wiederum als zweiseitiger wie als eiseitiger Test durchgeführt werde ka, läuft ach dem gewohte Schema ab: Die Nullhypothese lautet H 0 : µ = µ 0 (bzw. µ µ 0 oder µ µ 0 ), die Alterative H : µ µ 0 (bzw. µ < µ 0 oder µ > µ 0 ). Zur Sigifikazzahl α bestimmt ma u de kritische Wert c aus der Gleichug F(c) = α/ (bzw. F(c) = α) für die Verteilugsfuktio F der t-verteilug mit FG =. Da berechet ma ahad der gegebee Stichprobe die Werte x, s ud schließlich de etsprechede Wert t der Prüfgröße T gemäß (). Fällt t i de kritische Bereich, d.h. gilt t > c (bzw. t < c oder t > c), so wird die Nullhypothese verworfe. Beispiel.: Die Gewichtsverteilug vo Neugeboree werde durch eie Normalverteilug mit de Parameter µ ud σ beschriebe. I eier Stichprobe vo 47 Neugeboree wurde ei Mittelwert vo 38 g ud eie Stadardabweichug vo 705 g festgestellt. Ka aufgrud dieser Date geschlosse werde, dass das mittlere Geburtsgewicht µ mehr als 300 g beträgt? Wir wolle ei mittleres Geburtsgewicht µ über µ 0 = 300 g da als gesichert aehme, we die Hypothese µ µ 0 aufgrud der Ergebisse der betrachtete Stichprobe verworfe werde ka. Wir formuliere also die eiseitige Nullhypothese H 0 : µ µ 0 ud die Alterative H : µ > µ 0. Als Sigifikaziveau wähle wir α = 0.05 ud bestimme aus F(c) = = α = 0.95 für die t-verteilug mit FG = 46 de kritische Wert c =.68. (I Excel allerdigs durch Berechug vo TINV( α ; FG), d.h. es wird mit Sigifikaziveaus als Eigabe gerechet ud mit α statt α, da ei zweiseitiger Test vorliegt.) Als Realisierug der Testgröße gemäß (**) erhalte wir da 38 300 t = 47 = 0.79. 705 Wege t c köe wir die Nullhypothese icht ablehe. (Diese Etscheidug würde auf eiem gerigere Sigifikaziveau atürlich erst recht bestätigt werde.) Die vorliegede Date spreche also icht für ei durchschittliches Geburtsgewicht über 300 g, vielmehr ist auch ei Durchschittswert i der Höhe dieser Marke oder daruter möglich. Wir habe bisher de Mittelwert eier Normalverteilug mit eier gegebee Zahl vergliche ud wolle u die Mittelwerte zweier Grudgesamtheite zueiader i Beziehug setze. Vo jeder der beide Grudgesamtheite X bzw. X liege eie Stichprobe x, x,..., x bzw. x, x,..., x vor. Diese Stichprobe köe etweder abhägig oder uabhägig sei. Abhägige (oder verbudee) Stichprobe zeiche sich dadurch aus, dass sämtliche Stichprobewerte i Paare vorliege (z.b. weil sie a der selbe Utersuchugseiheit, etwa a derselbe Perso gemesse wurde). Folglich stimme da auch die beide Stichprobeumfäge ud vo vorherei überei. Verbudee Stichprobe erhält ma etwa da, we ma die Wirksamkeit zweier Behadlugsmethode a deselbe Persoe hitereiader oder a paarige Orgae gleichzeitig überprüft. Zwei Stichprobe heiße higege uabhägig, we ihre Beobachtugswerte icht umittelbar i eie paarweise Zusammehag gebracht werde köe. Auf uabhägige Stichprobe führt z.b. die Überprüfug der Wirksamkeit zweier Behadlugsmethode a zwei verschiedee Persoegruppe. Zum Test der Hypothese µ = µ für die Mittelwerte zweier Normalverteiluge uter Beützug verbudeer Stichprobe (Differeze-t-Test) geht ma wie folgt vor: Ma

4 bildet zuächst die Differeze etsprecheder Stichprobewerte. Für die aus diese Differeze gebildete Stichprobe prüft ma da mit dem Eistichprobe-t-Test wie obe ausgeführt, ob sie aus eier Verteilug mit dem Mittelwert µ = 0 stammt. Zwei ormalverteilte Grudgesamtheite bilde auch das statistische Modell für de Vergleich der Mittelwerte µ ud µ zweier Normalverteiluge uter Beützug uabhägiger Stichprobe (Zweistichprobe-t-Test). Die zugehörede Variaze brauche icht bekat zu sei, sie werde aber als gleich vorausgesetzt. Bezeiche, X bzw. S Stichprobeumfag, Mittelwert bzw. Variaz der erste Stichprobe ud, X bzw. S die etsprechede Größe der zweite Stichprobe, so bilde wir die Zufallsvariable (***) T X X + ) =. ( )S + ( )S + Diese besitzt im Fall µ = µ wieder eie t-verteilug, ud zwar mit + Freiheitsgrade. Damit ist auch der Testablauf bereits vorgezeichet: Im Fall eies zweiseitige Tests mit der Nullhypothese H 0 : µ = µ bestimmt ma zur Sigifikazzahl α de kritische Wert c aus F(c) = α/ für die t-verteilug mit FG = +. Da berechet ma für beide Stichprobe Mittelwerte ud Variaze ud setzt diese schließlich i der Teststatistik T gemäß (***) ei. Gilt für de so erhaltee Wert t der Teststatistik t > c, so wird die Nullhypothese verworfe; ist t c, so wird sie beibehalte. Beim eiseitige Test ist etspreched vorzugehe. Beispiel.: Das Gewicht vo Neugeboree sei ormalverteilt mit de Parameter µ l ud σ für Kabe bzw. µ ud σ für Mädche. Ma teste die Hypothese µ = µ auf dem %- Sigifikaziveau ahad eier Stichprobe vo = 9 mäliche sowie eier Stichprobe vo = 8 weibliche Neugeboree, wobei die empirische Werte x = 370 g, s = 637 g, x = 3460 g ud s = 789 g ermittelt wurde. Wir führe diesmal eie zweiseitige Test für die Nullhypothese H 0 : µ = µ mit der Alterative H : µ µ uter Beützug vo zwei uabhägige Stichprobe durch. Zur Sigifikazzahl α = 0.0 bestimme wir zuächst aus F(c) = α/ = 0.995 für die t- Verteilug mit FG = 45 de kritische Wert c =.70. (I Excel geschieht dies durch Berechug vo TINV( α ; FG), d.h. es wird diesmal ur das eifache Sigifikaziveau eigegebe, da ei eiseitiger Test vorliegt.) Obige Prüfgröße T immt für die gegebee Stichprobe de Wert t = 370 3460 8 637 + 7 789 ( 9 8 45 47 =.38 a, d.h., sie liegt deutlich im Aahmebereich. Somit ka aufgrud der vorliegede Date kei sigifikater Uterschied zwische de Gewichte eugeboreer Kabe bzw. Mädche festgestellt werde. Abschließed wolle wir auch och kurz auf de sog. F-Test eigehe, mit desse Hilfe zwei uverbudee Stichprobe mit de Umfäge bzw. ud de empirische Variaze s bzw. s daraufhi überprüft werde köe, ob sie Grudgesamtheite mit der gleiche Variaz etstamme, was ja eie der Voraussetzuge war, um obige T-Test überhaupt awede zu köe. Ma spricht i diesem Zusamehag auch vo eiem Test auf Variazhomogeität. Als Testgröße TG immt dazu

4 S TG= S welche uter obige Aahme da Fisher-verteilt (oder kurz F-verteilt) mit (, ) Freiheitsgrade ist. Auch hier ka ma geauso wie bei de Mittelwerte wieder ei- ud zweiseitige Tests durchführe: Die Nullhypothese lautet H 0 : σ = σ (bzw. σ σ oder σ σ ), die Alterative H : σ σ (bzw. σ > σ oder σ < σ ). Zum Sigifikaziveau α bestimmt ma u de kritische Wert c aus der Gleichug F(c) = α/ (bzw. F(c) = α) für die Verteilugsfuktio F der Fisher-Verteilug mit (, ) Freiheitsgrade. (I Excel steht dafür die Fuktio FINV( ) zur Verfügug, wobei ählich wie bei TINV( ) Sigifikaziveaus ud Freiheitsgrade eigegebe werde müsse.) Da berechet ma ahad der beide Stichprobevariaze de tatsächliche Wert s / s der Testgröße. Fällt sie i de jeweilige kritische Bereich, so wird die Nullhypothese verworfe. 3. Tests basiered auf der Chi-Quadrat-Verteilug Die bisher behadelte Tests ermögliche eie Vergleich vo Lageparameter mit vorgegebee Werte oder auch utereiader. I diesem Abschitt wird u ei Verfahre beschriebe, mit desse Hilfe eie Verteilug i ihrem Gesamtverlauf beurteilt werde ka. Der älteste ud wohl auch bekateste Test zum Vergleich vo empirische ud theoretische Verteiluge ist der vo K. Pearso eigeführte χ - Test. Die Grudlage dieses Tests bildet die sogeate Chi-Quadrat-Verteilug (χ -Verteilug), die wie auch die t-verteilug vo eiem Parameter FG, der Azahl der Freiheitsgrade, abhägig ist. So wie die Normaloder die t-verteilug ist auch die χ -Verteilug stetig, sie ist jedoch ur für icht-egative Werte defiiert. Der Verlauf der Dichtefuktio wird, wie die folgede Abbildug zeigt, sehr vom Parameter FG beeiflusst; isbesodere weise die Dichtefuktioe für kleie Azahle vo Freiheitsgrade eie ausgeprägte Usymmetrie auf. Wir betrachte u eie diskrete Verteilug, bei der geau k Auspräguge a, a,..., a k mit positiver Wahrscheilichkeit auftrete köe. Aus dieser Verteilug sei eie Stichprobe vom

43 Umfag gegebe, wobei jeweils i Stichprobeelemete vo der Ausprägug a i sid (i =,,..., k). Die Stichprobe ist somit i k Klasse eigeteilt, die absolute Klassehäufigkeite betrage,,..., k ud es gilt + +... + k =. Getestet wird u eie Hypothese über die zugrudeliegede Wahrscheilichkeitsverteilug, z.b. H 0 : Die Wahrscheilichkeite der Auspräguge a, a,..., a k sid p, p,..., p k (mit p + p +... + p k = l). Um zu eiem Urteil über die Richtigkeit dieser Hypothese zu gelage, müsse die tatsächlich beobachtete Werte,..., k mit de etsprechede uter H 0 erwartete Häufigkeite * = p,..., k * = p k vergliche werde. Dabei ist es im Gegesatz zu de bisher behadelte Verfahre völlig belaglos, ob die Stichprobewerte qualitatives oder quatitatives Messiveau besitze, wie das folgede Beispiel zeigt. Beispiel 3.: Gregor Medel erhielt i eiem seier klassische Kreuzugsversuche a Erbsepflaze 35 rude gelbe, 08 rude grüe, 0 katige gelbe ud 3 katige grüe Erbse. Spricht dieses Ergebis für oder gege die Medelsche Theorie, ach der sich diese vier Häufigkeite wie 9:3:3: verhalte sollte? Die Form der Erbse stellt offesichtlich ei qualitatives Merkmal mit vier Merkmalsauspräguge dar, die wir der Reihe ach mit,, 3 ud 4 bezeiche wolle. Die etsprechede Wahrscheilichkeite laute da p l = 9/6, p = p 3 = 3/6 ud p 4 = /6. Demach sid uter de isgesamt = 556 Erbsepflaze * = p = 3.75, * = 04.5, 3 * = 04.5 ud 4 * = 34.75 Pflaze i de vier Klasse zu erwarte. Der Vergleich zwische de tatsächlich beobachtete ud de erwartete Häufigkeite verläuft ach folgedem Schema: Zum Test der Hypothese, die gegebee Stichprobe etstamme eier durch die Wahrscheilichkeite p i charakterisierte Verteilug, bildet ma die Testgröße k ( i i*) V =, i= i * wobei i die i der Stichprobe beobachtete, i * = p i die uter der Nullhypothese erwartete Häufigkeite darstelle. Die Verteilug der Teststatistik V ka für große Stichprobe aäherd durch eie χ -Verteilug mit k Freiheitsgrade beschriebe werde, wobei große Werte für V sigifikat sid. Die Testetscheidug wird daher ach dem folgede übliche Verfahre getroffe: Ma wählt eie Sigifikazzahl α ud bestimmt eie etsprechede kritische Wert c für die χ -Verteilug mit FG = k gemäß F(c) = α. Der kritische Bereich ist da durch V > c festgelegt; gilt also V > c, so wird die Nullhypothese verworfe, ist V c, wird sie beibehalte. I obigem Beispiel wähle wir u α = 0.05 ud bestimme de kritische Wert c = 7.8 aus der Gleichug F(c) = 0.95 ud FG = 3. (I Excel muss jedoch, wie scho bei der t-verteilug, α selbst ud icht α verwedet werde ud ma erhält kritische Werte durch Berechug vo CHIINV(α ; FG). ) Der Wert der obiger Testgröße V ergibt sich zu (35 3.75) v = 3.75 (08 04.5) + 04.5 (0 04.5) + 04.5 (3 34.75) + 34.75 = 0.47. Aus v c schließe wir, dass die vo Medel beobachtete Werte keieswegs im Widerspruch zu seier Theorie stehe. (Der Statistiker R. A. Fisher vermutete etwa 50 Jahre später sogar, dass Medel diese Date maipuliert habe, um eie so gute Übereistimmug zu erziele.) Wie bereits erwäht, stellt der χ -Test lediglich ei Näherugsverfahre dar. Wie gut die Verteilug vo V mit der χ -Verteilug übereistimmt, hägt vor allem vo de erwartete Häufigkeite i de schwach besetze Klasse ab. Als Faustregel gilt i * 5 für midestes

44 80% aller Klasse ud zugleich i * für alle Klasse. Ist diese Voraussetzug icht erfüllt, müsse eizele Klasse zusammegelegt ud die Azahl der Freiheitsgrade etspreched reduziert werde. Obwohl die Fragestellug bei diesem Testverfahre eie zweiseitige Problemstellug darstellt, ist der Aahmebereich eiseitig: Die Nullhypothese wird ur da verworfe, we die Teststatistik V de kritische Wert c übersteigt. Wie aus der Form der Testgröße V sofort ersehe werde ka, führe Abweichuge zwische de beobachtete ud de erwartete Häufigkeite i jeder Richtug stets zu eier Vergrößerug. Es sei auch och besoders darauf higewiese, dass zur Berechug der Prüfgröße die absolute (ud icht die relative) Häufigkeite heragezoge werde müsse, d.h. eie Beutzug vo relative Häufigkeite ist i diesem Zusammehag uzulässig! Wir habe obe mit Hilfe der Chi-Quadrat-Verteilug eie sogeate Apassugstest durchgeführt, d.h. überprüft, wie gut sich vorgegebee Date eier theoretisch vermutete Verteilug apasse. I ur leicht modifizierter Form lasse sich damit auch sog. Uabhägigkeitstests durchführe, worauf wir i Kapitel I im Zusammehag mit Kotigeztafel scho higewiese habe. Beispiel 3.: Wir betrachte dazu ochmals Bsp.. i Kap. I mit der Vierfeldertafel. Raucher Nichtraucher gesamt mälich =9 =0. =39 weiblich =0 =0. =30.=9. =40 = 69 Wäre die Merkmale Geschlecht ud Raucherstatus uabhägig, so müsste die Zahle,,, folgedermasse aussehe: * =. * (. / ) = 39 * (9/69) = 6.39 * = * ( / ) = 39 * (40 / 69).6.. = * =. * (. / ) = 30 * (9 / 69) = * =. * (. / ) = 30 * (40 / 69) =.6 7.39 Ählich wie obe bereche wir wieder die Testgröße V = ( + + + =.647 * * * * * * * * ) / ( ) / ( ) / ( ) / ud der zugehörige P-Wert, ämlich P(V.65) =CHIVERT(.657,)=0.0 mit FG = (Zeileazahl-)*(Spalteazahl-)= (beachte, dass die Radsumme ja vorgegebe sid, d.h. ach Weglasse eier beliebige Zeile ud Spalte i obiger Tafel ka ma diese aus de übrige Werte immer och rekostruiere, womit sich obige Wert für die Azahl der Freiheitsgrade ergibt!) zeigt überraschederweise, dass wir die Nullhypothese, obige zwei Merkmale wäre uabhägig, erst auf dem sehr hohe Sigifikaziveau vo α = 0. ablehe köte. Trotzdem ist ei gewisses Maß a Abhägigkeit erkebar, das wir u auch quatifiziere köe.

45 4. Schätze vo Parameter Wir habe im. Kapitel eie Reihe vo Wahrscheilichkeitsverteiluge keegelert ud isbesodere auch gesehe, dass diese gewöhliche vo eiem oder mehrere Parameter abhäge (z.b. p für die Beroulliverteilug bzw. allgemeier für die Biomialverteilug, λ für die Possoverteilug, µ ud σ für die Gauß sche Normalverteilug usw.). Eie weitere Stadardaufgabe der Iduktive Statistik, auf die wir abschließed och kurz eigehe wolle, ist es u, de Wert eies gesuchte Parameters θ abzuschätze,. Ma uterscheidet dabei grudsätzlich zwische Puktschätzuge, welche ur aus der Agabe eies Schätzwertes θˆ für de gesuchte Parameter bestehe, ud Kofidezschätzuge (oder Itervallschätzuge), wobei ei sogeates Kofidezitervall (auch Vertrauesbereich) agegebe wird, i dem der gesuchte Parameter θ mit eier vorgegebe Wahrscheilichkeit α (mit z.b. α = 0. 05 oder α = 0. 0) liegt. α heißt dabei auch Kofideziveau ud α die Irrtumswahrscheilichkeit. Puktschätzuge ergebe sich dabei i der Regel als die Werte vo sogeate Schätzfuktioe (auch kurz Schätzer) ˆθ (X, X,.., X ), idem ma hieri aktuelle Werte x, x,..., x der Stichprobe eisetzt. Folgede Kriterie sid für die Güte dieser Schätzer vo Bedeutug: Erwartugstreue, d.h. E( θˆ )= θ. Mit adere Worte sollte θˆ, auch we es de Wert vo θ im Eizelfall icht geau trifft, ih doch icht systematisch über oder uterschätze, d.h. weigstes im Mittel mit ihm übereistimme. Kosistez, d.h. die Variaz V( θˆ ) sollte mit wachsedem Stichprobeumfag gege 0 gehe. Effiziez, d.h. es sollte V( θˆ ) V( ~ θ) für jede adere Puktschätzug ~ θ gelte. Suffiziez, d.h. es sollte wirklich alle i der Stichprobe ethaltee Iformatioe im Vergleich zu alle adere Schätzuge vo θ optimal ausgeutzt worde sei. Ei wichtiges Prizip, um Puktschätzuge mit solche gute Eigeschafte zu erhalte ist die sog. Maximum Likelihood-Methode (auch oft kurz ML-Methode geat). Ma bestimmt dazu θˆ als jee Wert vo θ, für de die Wahrscheilichkeit, das die Zufallsvariable X geau die i der Stichprobe beobachtete Realisatioe x, x,..., x aimmt, ei Maximum wird Beispiel 4.: Der Mittelwert X + X +.. + X X = ist wege E (X) = µ ud V(X) = σ / (s. II,.5) ei sowohl erwartugstreuer, als auch kosisteter Schätzer für de Mittelwert µ der Grudgesamtheit. Gleiches gilt für die empirische Variaz S = k= (X k X) i Bezug auf die Variaz σ, wie ma ach leichter Rechug bestätigt. (Würde ma hier jedoch de Faktor / statt /(-) verwede, so hätte dies eie systematische Uterschätzug vo σ um de Faktor (-)/ zur Folge!)

46 Als erwartugstreue ud kosistete Schätzer für de Parameter p eier Beroulliverteilug ka ma die relative Häufigkeit h (A) des Ereigisses A i de Realisatioe der Stichprobe ehme. Dies ist im wesetliche wieder die Aussage des Gesetzes der große Zahle (s. II,.7) Was Kofidezschätzuge ageht, so begüge wir us hier mit eiige wichtige Beispiele, aus dee das allgemeie Prizip klar hervorgehe sollte. Isbesodere werde wir im folgede ur zweiseitige Kofidezitervalle betrachte, welche de zweiseitige Tests etspreche. (Für eiseitige Kofidezitervalle, die also ach jeer Seite hi, wo Abweichuge der betrachtete Größe irrelevat sid, ubeschräkt sid, hätte ma achstehede Überleguge etspreched zu modifiziere.) Wir begie dazu mit der Kofidezschätzug für de Erwartugswert eier ormalverteilte Grudgesamtheit mit bekater Variaz. Ist die Zufallsvariable X i der Grudgesamtheit ormalverteilt mit Mittel µ ud Variaz σ, so wisse wie bereits, dass da X ebefalls ormalverteilt mit Mittel µ ud Variaz σ / ist. Berechet ma u geauso, wie im allererste Beispiel zu de Testverfahre de kritische Wert c zum Sigifikaziveau α, so heißt das, dass gilt X µ P ( c < < c) = α ( σ / ) wobei hier c= Φ ( α / ) ist, wofür wir im folgede z α / schreibe. Ist x das Mittel eier kokrete Stichprobe, so gilt daher mit Wahrscheilichkeit α die Ugleichug σ σ x z α / < µ < x + z α / Dieser Bereich bildet also da das Kofidezitervall für µ, i dem es mit Wahrscheilichkeit α bzw. eier Irrtumswahrscheilichkeit vo α auch tatsächlich liegt. Fast die gleiche Herleitug gilt auch für die Kofidezschätzug für de Erwartugswert eier ormalverteilte Grudgesamtheit mit ubekater Variaz. Hier ehme wir da als Schätzwert für die ubekate Variaz σ der Grudgesamtheit die emprische Variaz s der Stichprobe, müsse aber zum Ausgleich die Normalverteilug durch die t-verteilug mit - Freiheitsgrade austausche, wo de Stichprobeumfag bezeichet. Das Kofidezitervall für µ, i dem es mit Wahrscheilichkeit α liegt, läßt sich da beschreibe als σ σ x t α / < µ < x + t α / wobei t α / das der Wahrscheilichkeit α / etsprechede Quartil darstellt. Als letztes wolle wir auch och ei Kofidezitervall für die Variaz eier ormalverteilte Grudgesamtheit agebe. Wir beutze dazu die Tatsache aus der Theorie, dass die Zufallsvariable ( )S σ eier χ -Verteilug mit - Freiheitsgrade gehorcht. Damit ergibt sich Kofidezitervall auf dem Sigifikaziveau α ach leichter Rechug zu

47 ( )s χ ; α / < σ ( )s < χ ; α / wobei hier wieder die etsprechede Quatile der χ -Verteilug mit - Freiheitsgrade eizusetze sid.