ZZ Lösung zu Aufgabe : Ch²-Test Häufg wrd be der Bearbetung statstscher Daten ene bestmmte Vertelung vorausgesetzt. Um zu überprüfen ob de Daten tatsächlch der Vertelung entsprechen, wrd en durchgeführt. Dabe se -Test ene Zufallsgröße mt unbekannter Vertelungsdchtefunkton. Aufgrund von Messdaten oder Vorabnformatonen wrd vermutet, dass X durch ene Vertelungsdchtefunkton h(x) X beschreben wrd. De herzu formulerte Nullhypothese H lautet: X wrd durch de Vertelungsdchtefunkton h(x) beschreben! Etwag beobachtete Abwechungen von der angenommenen Vertelung wären n desem Fall ren zufällger Natur. Weterhn wrd ene Stchprobe mt n Messwerten x,..., x n aufgenommen. Aus deser Messrehe wrd enersets en emprsches Hstogramm erstellt und aus der Vertelungsdchtefunkton h(x) wrd en theoretsches Hstogramm berechnet. Als Testgröße wrd ene normerte Dfferenz zwschen beden Hstogrammen berechnet. Wenn de Hypothese zutrfft, müsste dese Testgröße hnrechend klen sen. Anhand nachfolgender Abbldungen soll de grundsätzlche Vorgehenswese zunächst nochmals anschaulch dargestellt werden, bevor m zweten Tel deses Dokuments de rechnersche Durchführung des -Tests erfolgt.,8 emprsches Hstogramm,4 relatve Häufgketsdchte h,,,8,4,,, 3,3 4,4 5,5 6 7,7 8,8 9,9,, Abbldung : Emprsches Hstogramm der Messdaten Im vorlegenden Fall der Übungsaufgabe wurden de aufgenommenen Messwerte berets zu enem Hstogramm zusammen gefasst. De entsprechenden Klassengrenzen sowe de absoluten Häufgketen n den enzelnen Klassen können der Tabelle n der Aufgabenstellung entnommen werden. Abbldung zegt deses emprsche Hstogramm, wobe her we auch n den nachfolgenden Abbldungen jewels de Fläche der Hstogrammbalken der relatven
AAA Häufgket proportonal st. (Das heßt, de absoluten Häufgketen lassen sch aus der Balkenhöhe durch Multplkaton mt dem Stchprobenumfang von n 5 sowe mt der Klassenbrete von, mm errechnen.) Das n Abbldung dargestellt Hstogramm west zunächst noch Klassen enhetlcher Brete auf. Da für dünn besetzte Klassen de oben erwähnte Berechnung der normerten Dfferenzen von emprschem und theoretschem Hstogramm zu unsnng großen Zahlenwerten führen kann, sollten de Hstogrammklassen so gewählt werden, dass n jede Klasse mndestens 5 Messwerte entfallen. Be desem Zahlenwert handelt es sch allerdngs nur um enen Rchtwert, man fndet mtunter auch de Empfehlung, dass jede Klasse mt mndestens Messwerten besetzt sen sollte. Am enfachsten lässt sch dese Bedngung dadurch enhalten, dass n dem berets vorlegenden Hstogramm solche dünn besetzten Klassen mt benachbarten Klassen zusammen gelegt werden, bs ene entsprechende Mndestbesetzung errecht st. Im vorlegenden Fall werden daher de ersten ver Klassen zu ener dann von, mm bs,4 mm rechenden Klasse zusammen gefasst, sowe de beden letzten Klassen zu ener dann von,9 mm bs, mm rechenden. De grafsche Darstellung deses emprschen Hstogramms mt zusammen gefassten Klassen fndet sch n Abbldung.,8 emprsches Hstogramm,4 relatve Häufgketsdchte h,,,8,4, 3 4,4 5,5 6 7,7 8,8 9,9, Abbldung : Emprsches Hstogramm der Messdaten mt zusammen gefassten Klassen Durch de Aufgabenstellung st vorgegeben, dass als Testhypothese von ener Gaußschen Normalvertelung ausgegangen werden soll. De Parameter μ und σ der am besten zu den vorlegenden Messdaten passende Normalvertelung werden durch den Mttelwert x und de Streuung S der Messdaten abgeschätzt. In Abbldung 3 st zur Veranschaulchung de Vertelungsdchtefunkton der so ermttelten Normalvertelung dem emprschen Hstogramm der Messdaten überlagert.
BBB emprsches Hstogramm Normalvertelung,8,4 relatve Häufgketsdchte h,,,8,4, 3 4,4 5,5 6 7,7 8,8 9,9, Abbldung 3: Emprsches Hstogramm mt daraus abgeleteter Normalvertelung Im nächsten Schrtt wrd nun unter Zugrundelegung der zuvor abgeschätzten Normalvertelung en theoretsches Hstogramm ermttelt. Das heßt, es wrd berechnet, we vele Messwerte theoretsch n de zuvor gebldeten Hstogrammklassen entfallen würden, wenn man davon ausgeht, dass der Vertelung tatsächlch de ermttelte Normalvertelung zugrunde legt. In Abbldung 4 st das resulterende theoretsche Hstogramm gemensam mt der zugrunde legenden Normalvertelung dargestellt. theoretsches Hstogramm Normalvertelung,8,4 relatve Häufgketsdchte h,,,8,4, 3 4,4 5,5 6 7,7 8,8 9,9, Abbldung 4: Theoretsches Hstogramm mt zugrunde legender Normalvertelung Verglech man nun das emprsche Hstogramm aus Abbldung mt dem theoretschen Hstogramm aus Abbldung 4, stellt man fest, dass sch zwschen tatsächlcher Besetzungszahl der Klassen und theoretsch erwarteter Besetzungszahl Unterschede ergeben. Ene grafsche Darstellung deser Gegenüberstellung von emprschem und theoretschem Hstogramm zegt Abbldung 5.
CCC emprsches Hstogramm theoretsches Hstogramm,8,4 relatve Häufgketsdchte h,,,8,4, 3 4,4 5,5 6 7,7 8,8 9,9, Abbldung 5: Verglech von emprschem und theoretschem Hstogramm De zu klärende Frage st nun, ob de beobachteten Unterschede so gerng snd, dass man mt hnrechender statstscher Scherhet davon ausgehen kann, dass se ledglch zufällger Natur snd, oder ob de Unterschede so groß snd, dass de Hypothese von der Normalvertelung der erhobenen Messdaten verworfen werden muss. Herzu wrd aus den Dfferenzen der beden Hstogramme ene normerte Gesamtdfferenz berechnet und dese mt enem krtschen Wert verglchen. Ist de errechnete Dfferenz klener als der krtsche Wert, wrd de Nullhypothese, de Messdaten seen normalvertelt, angenommen, andernfalls wrd se verworfen. Zur rechnerschen Bestmmung des -Wertes dent untenstehende Tabelle. In der ersten Spalte deser Tabelle snd de Obergrenzen der n der Aufgabenstellung gegebenen Hstogrammklassen engetragen, n der zweten Spalte fnden sch de absoluten Häufgketen n nnerhalb deser Klassen. Zunächst werden nun we oben beschreben dünn besetzte Klassen mt benachbarten Klassen zusammen gefasst. We zu erkennen, snd de ersten dre Klassen nur mt Häufgketen von bzw. besetzt. Da auch nach Zusammenfassung deser dre benachbarten Klassen noch ncht de Mndestanzahl von 5 errecht st, müssen wr de ersten ver Klassen zusammen fassen. Ebenso muss de letzte Klasse (Besetzungszahl 3) mt der vorletzten Klasse zusammen gefasst werden. De emprsch ermttelten absoluten Häufgketen Klassen snd n der drtten Spalte der Tabelle engetragen. x B nnerhalb der verblebenden
DDD 3 4 5 6 7 8 x n B ( x μ) / σ Φ ( μ) / σ x p E np ( B E ) E,,,3,4 9 3,3835,3835,9794,3,5 5 5,7,3885,357 6,877,88,6,43644,97589 4,6986,949,7 3 3,38,6487,586 6,4483,477,8 7 7,93,8384,75787,9734,499,9 9 9,48,93563,6749 3,3436,439, 6 3 9,,69437 8,6796,8 3,5563 De Berechnung des theoretschen Hstogramms erfolgt m vorlegenden Fall unter Zuhlfenahme der berets aus vorangegangenen Aufgaben bekannten Tabelle der Summenfunkton der standardserten Normalvertelung. Dazu berechnen wr zunächst aus den x -Werten der Klassenobergrenzen de korresponderenden, auf de standardserte Normalvertelung bezogenen z-koordnaten. Herfür benötgen wr jedoch zunächst den Erwartungswert μ und de Standardabwechung σ der anzunehmenden Normalvertelung. De besten Schätzwerte für dese beden Parameter stellen der Mttelwert x und de Streuung S der vorlegenden Messdaten dar. Bede Werte snd berets n der Aufgabenstellung angegeben und lauten: x 3 mm s,83 mm Für de erste Klasse mt der Obergrenzen von Wertes daher: x,4 mm lautet de Berechnung des z- x μ,4 mm 3 mm σ,83 mm z Deser Zahlenwert, sowe de analog herzu berechneten Werte für de folgenden Klassen fnden sch n der verten Spalte der Tabelle. Für de letzte Klasse, deren Obergrenze her mt gewählt wurde, ergbt sch ohne Berechnung auch für den z-wert. De zu den berechneten z-werten gehörgen Werte der Summenfunkton der standardserten Normalvertelung können nun nach bekanntem Schema aus der entsprechenden Tabelle Φ( z )
EEE abgelesen werden. Herdurch erhält man de n der fünften Spalte engetragenen Zahlenwerte. Der Wert n der letzten Zele, für z, kann zwar ncht aus der Tabelle abgelesen werden, ergbt sch jedoch logscher Wese zu, da zwschen und + stets % aller Messwerte legen. De bslang ermttelten, n Spalte 5 engetragenen Werte geben nun an, mt welcher Wahrschenlchket en Wert zwschen und der jewelgen Klassenobergrenze legt. Da wr jedoch an der Wahrschenlchket nteressert snd, mt welcher en Wert nnerhalb der Klassengrenzen legt, müssen wr de entsprechenden Dfferenzen blden. Für de erste Klasse können wr den Wert von unverändert übernehmen. Für de zwete Klasse Φ( z ), 3835 erhalten wr das Ergebns, ndem wr Φ Φ ( z ) von ( z ) ( ) Φ( z ),3885,3835, 357 z Φ subtraheren. Wr erhalten also: De nach desem Schema errechneten und n Spalte 6 der Tabelle engetragenen Werte geben nun an, mt welcher Wahrschenlchket p unter Annahme der geschätzten Normalvertelung en Messwert nnerhalb ener bestmmten Klasse legt. Da unser emprsches Hstogramm de absoluten Häufgketen B nnerhalb der Klassen angbt, müssen wr für den Verglech von emprschem und theoretschem Hstogramm de Wahrschenlchketen p aus Spalte 6 n absolute Häufgketen E umrechnen. Herzu multplzeren wr de Wahrschenlchketen mt dem Umfang der Stchprobe, welche den emprschen Daten zugrunde legt. Deser Stchprobenumfang beträgt n 5. So errechnen wr bespelswese de absolute Häufgket nnerhalb der ersten Klasse des theoretschen Hstogramms we folgt: n p 5,3835,9794 E Bevor wr nun mt Hlfe der 3. und 7. Spalte der Tabelle de normerte Dfferenz von emprschem und theoretschem Hstogramm berechnen, überprüfen wr, ob auch für das theoretsche Hstogramm de Bedngung erfüllt st, dass de absolute Häufgket n kener der Klassen den Wert 5 unterschretet. Sollte des für enzelne Klassen der Fall sen, fassen wr we berets anhand des emprschen Hstogramms erläutert benachbarte Klassen zusammen. Im vorlegenden Fall st jedoch kene wetere Zusammenlegung von Klassen erforderlch. De normerte Dfferenz errechnet sch nun aus den emprschen Häufgketen B und den theoretschen Häufgketen E gemäß folgender Glechung: * r ( B E ) E Wr errechnen her zunächst de normerten Dfferenzen jewels für enzelne Klassen und erhalten damt de n Spalte 8 der Tabelle engetragenen Zahlenwerte. Für de erste Klasse lautet de Berechnung bespelswese: ( B E ) ( 3,9794) 5 3,7 E,9794
FFF Blden wr nun über dese klassenwesen normerten Dfferenzen de Summe, erhalten wr den gesuchten 3,5563 -Wert für den damt glt: De m Weteren auszuwertende Testbedngung lautet: > * r s ; α Wr müssen demnach zunächst den krtschen Wert ermtteln. Herfür benötgen wr neben dem gewählten Sgnfkanznveau α de beden Parameter r * und s. r * steht herbe für de Anzahl der auswertbaren Klassen des Hstogramms. Auswertbar ment herbe, de Zahl der Klassen nach ener etwagen Zusammenlegung benachbarter Klassen. Im vorlegenden Fall erhalten wr durch Auszählen: r * 7 r * s ; α Der Parameter s steht für de Anzahl der aus der untersuchten Stchprobe abgeschätzten Parameter der Vertelungsdchtefunkton, de dem jewelgen Test zugrunde gelegt wrd. Im vorlegenden Fall war des de Vertelungsdchtefunkton der Gaußschen Normalvertelung. Dese lautet: h(x) πσ x μ e σ De Vertelungsdchtefunkton der Gaußschen Normalvertelung hängt also von den zwe Parametern μ und σ ab. Bede Werte wurden n Form des Mttelwerts x bzw. der Streuung S aus den Daten der untersuchten Stchprobe abgeschätzt. De gesuchte Anzahl s beträgt daher: s Das Sgnfkanznveau α beträgt laut Aufgabenstellung α, 5. Für den krtschen Wert r * s ; α glt daher m vorlegenden Fall: r * s ; α 7 ;,5 4;,95 Der zugehörge Zahlenwert kann nun aus der Tabelle der p-quantle der -Vertelung mt s Frehetsgraden abgelesen werden. Wr erhalten somt: 4 ;,95 9,49 De auszuwertende Testbedngung lautet mt den errechneten Zahlenwerten folglch: 3,5563 > 9,49 s;p
GGG We zu erkennen, st dese Testbedngung ncht erfüllt. Da für denn Fall, dass de Testbedngung erfüllt st, de Nullhypothese abgelehnt wrd, schleßen wr aus der Nchterfüllung der Testbedngung: De Nullhypothese wrd ncht abgelehnt! Da unsere Nullhypothese lautet, dass de vorlegenden Messdaten ener Gaußschen Normalvertelung genügen, schleßen wr aus dem Testergebns weterhn: De Messdaten snd mt ener statstschen Scherhet von P 95% normalvertelt!