Hallo, kurze Anmerkung: Diese Scripte stammen von Ich kann leider dazu. keine Fragen mehr beantworten! : ( Euch trotzdem viel Erfolg!

Ähnliche Dokumente
6 Vergleich mehrerer unverbundener Stichproben

10. Testen von Hypothesen Seite 1 von 6

Kapitel 5: Schließende Statistik

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

3 Vergleich zweier unverbundener Stichproben

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

,,, xn. 3. Intervallschätzungen Zufallsstichproben und Stichprobenfunktionen Zufallsstichproben. Zufallsvariablen mit

Beispiel: p-wert bei Chi-Quadrat-Anpassungstest (Grafik) Auftragseingangsbeispiel, realisierte Teststatistik χ 2 = , p-wert: 0.

3 Kritischer Bereich zum Niveau α = 0.10: K = (χ 2 k 1;1 α, + ) = (χ2 5;0.90, + ) = (9.236, + ) 4 Berechnung der realisierten Teststatistik:

Die notwendigen Verteilungstabellen finden Sie z.b. hier:

Auszüge der nichtparametrischen Statisik

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

Umrechnung einer tatsächlichen Häufigkeitsverteilung in eine prozentuale Häufigkeitsverteilung

2. Repetition relevanter Teilbereiche der Statistik

Tests statistischer Hypothesen

Vl Statistische Prozess und Qualitätskontrolle und Versuchsplanung Übung 3

Vl Statistische Prozess- und Qualitätskontrolle und Versuchsplanung Übung 5

14 Statistische Beziehungen zwischen nomi nalen Merkmalen

Tests für beliebige Zufallsvariable

Forschungsstatistik I

3.2 Wilcoxon Rangsummentest

Differenz X-Y normalverteilt Lagetest für zwei verbundene. Differenz X-Y symmetrisch Wilcoxon-Test Stichproben

Übungen Abgabetermin: Freitag, , 10 Uhr THEMEN: Testtheorie

Empirische Verteilungsfunktion

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren

2. Schätzverfahren 2.1 Punktschätzung wirtschaftlicher Kennzahlen. Allgemein: Punktschätzung eines Parameters:

Kontingenztabellen. Chi-Quadrat-Test. Korrelationsanalyse zwischen kategorischen Merkmalen. 1. Unabhängigkeitstest

4 Schwankungsintervalle Schwankungsintervalle 4.2

Wirksamkeit, Effizienz

Korrelationsanalyse zwischen kategorischen Merkmalen. Kontingenztabellen. Chi-Quadrat-Test

Kapitel XI - Korrelationsrechnung

Statistik und Wahrscheinlichkeitsrechnung

Der χ 2 Test. Bei Verteilungen Beantwortung der Frage, ob eine gemessene Verteilung Gauß- oder Poisson-verteilt ist oder nicht?

2.3 Kontingenztafeln und Chi-Quadrat-Test

Kapitel 3: Bedingte Wahrscheinlichkeiten und Unabhängigkeit

X X Schätzen von Vertrauensintervallen Schwankungsintervall

Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007

Variiert man zusätzlich noch die Saatstärke (z.b. 3 Stärkearten), würde man von einer zweifaktoriellen Varianzanalyse sprechen.

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Lösungen zu den Aufgaben zur Multivariaten Statistik Teil 3: Aufgaben zur Varianzanalyse

Übungen zu QM III Mindeststichprobenumfang

Übungen mit dem Applet erwartungstreu

Statistik und Wahrscheinlichkeitsrechnung

Univariate Verteilungen

Wirksamkeit, Effizienz

Stochastik - Lösung (BSc D-MAVT / BSc D-MATH / BSc D-MATL)

Kapitel 6 : Punkt und Intervallschätzer

5.4.2 Die empirische Verteilungsfunktion als Ausgangspunkt

Mathematik 2 für Naturwissenschaften

Der Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert

Testen statistischer Hypothesen

Formelsammlung Statistik 29. Januar 2019

Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

Statistische Tests zu ausgewählten Problemen

Statistik und Wahrscheinlichkeitsrechnung

Wirksamkeit, Effizienz. Beispiel: Effizienz. Mittlerer quadratischer Fehler (MSE) Konsistenz im quadratischen Mittel

Kapitel VI. Einige spezielle diskrete Verteilungen

Grundlagen der Biostatistik und Informatik

Bei 95%iger Konfidenz wäre der Mittelwert der GG zwischen 1421,17DM und 1778,83DM zu erwarten.

Einführung in die Wahrscheinlichkeitstheorie Lösungen zum Wiederholungsblatt

Kovarianz und Korrelation

Musterlösung für die Klausur zur Vorlesung Stochastik I im WiSe 2014/2015

Grundsätzlich sollen Varianz bzw. Standardabweichung Maße dafür sein, wie stark eine Verteilung um ihren Erwartungswert streut.

Prof. Dr. Roland Füss Statistik II SS 2008

1 Randomisierte Bestimmung des Medians

Mathematik 2 für Naturwissenschaften

( ), der genau auf der Geraden ( ) 2 ( ) #( ) 8. Lineare Regression. = f i. Nach der Summe der kleinsten. mx i

Eingangsprüfung Stochastik,

Lösungsvorschlag Probeklausur zur Elementaren Wahrscheinlichkeitsrechnung

Gütefunktion und Fehlerwahrscheinlichkeiten Rechtsseitiger Test (µ 0 = 500) zum Signifikanzniveau α = Interpretation von Testergebnissen I

Evaluation & Forschungsstrategien

Praktikum Vorbereitung Fertigungsmesstechnik Statistische Qualitätskontrolle

Sind Sie mit unserem Angebot zufrieden? ja nein weiß nicht

Parameterschätzung. Kapitel Schätzfunktionen

AngStat1(Ue13-21).doc 23

3. Grundbegrie der Schätztheorie

Schätzen von Populationswerten

X in einer Grundgesamtheit vollständig beschreiben.

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2015/2016. Aufgabe 1

Diskrete Wahrscheinlichkeitstheorie Wiederholungsklausur

Diplomvorprüfung Stochastik

10. Grundlagen der linearen Regressionsanalyse 10.1 Formulierung linearer Regressionsmodelle

Reader Teil 1: Beschreibende Statistik

Statistik Einführung // Beschreibende Statistik 2 p.2/61

Testverfahren zur Prüfung von Hypothesen über Parameter oder Verteilungen. Einstichprobentest für die Varianz einer Normalverteilung

(a) Richtig, die Varianz ist eine Summe quadratischer Größen.

So lösen Sie die Gleichung für den Korrelationskoeffizienten

Ulrich Stein Fehlerrechnung

Diskrete Zufallsvariablen

Teil II Zählstatistik

TESTEN VON HYPOTHESEN

Wahrscheinlichkeitstheorie und Statistik vom

6. Grenzwertsätze. 6.1 Tschebyscheffsche Ungleichung

Statistik I Februar 2005

Formelsammlung. zur Klausur. Beschreibende Statistik

Transkript:

Hallo, kurze Amerkug: Diese Scripte stamme vo 999. Ich ka leider dazu keie Frage mehr beatworte! : ( Euch trotzdem viel Erfolg! Dorthe dorthe@luebbert.et

Statistik B Script ud Diplomklausurvorbereitug S. Testverfahre aus Statistik A, B ud C Dorthe Lübbert, Dorthe.Luebbert@ruhr-ui-bochum.de Dieser Text ka frei weitergegebe werde, solage dieses Copyright icht etfert wird (Script war viel Arbeit!) Tests bei metrischem Meßiveau... 4. Chi-Quadrat-Tests... 4.. χ -Apassugstest... 4.. χ -Homogeitätstest... 6..3 χ -Uabhägigkeitstest... 7. t-tests... 7.. STUDENTisierug... 7.. t-test bei eier kleie Stichprobe... 7..3 Mittelwertdifferezetest: t-test bei zwei uabhägige kleie Stichprobe... 8..4 Mittelwertdifferezetest: t-test bei zwei verbudee Stichprobe... 9.3 F-Test: Variazquotietetest... 9.3. Testsituatio... 9.3. Die Prüfvariable... 9.3.3 Lösugsasatz... 0.3.4 Beispiel... 0.4 Variazaalyse (egl.: ANOVA)... 0.4. Allgemeies... 0.4. Eifache Variazaalyse = Variazaalyse eifacher Klassifikatio....4.3 Zweifache Variazaalyse = Variazaalyse zweifacher Klassifikatio....4.4 Der Begriff der Wechselwirkug (Iteraktio)....4.5 Was hat die bivariate Regressiosrechug mit der Variazaalyse zu tu?... Tests bei omialem Meßiveau... 3. Vorbemerkug... 3. Biomialtest (= Ateilswerttest)... 3.. Testsituatio... 3.. Testidee... 3..3 Methode... 3..4 Beispiel I (Vorlesug)... 3..5 Beispiel II: klassische Aufgabestellug für de Biomialtest... 4.3 McNEMAR-Test... 5.3. Testsituatio... 5.3. Testidee... 5.3.3 Beispiel (Tiede S. 54)... 5.4 Differezetest für zwei Ateilswerte aus zwei große uabhägige Stichprobe... 6.4. Testsituatio... 6.4. Testidee... 6.5 FISHER-Test... 7.5. Testsituatio... 7.5. Testidee... 7.5.3 Beispiel... 8 3 Tests bei ordialem Meßiveau... 8 3. Mediatest (=Vorzeichetest)... 8 3.. Testsituatio... 8 3.. Testidee... 8 3..3 Bemerkuge... 9 3..4 Beispiel (Tiede S. 74 ute)... 9 3. WILCOXON-Vorzeiche-Ragtest für de Media... 9 3.. Testsituatio... 9 3.. Testidee... 9 3..3 Wertebereich ud Verteilug vo W... 0 3..4 Bemerkuge... 0 3..5 Beispiel (Tiede S. 77)... 0 3..6 Wilcoxo-Vorzeiche-Ragtest für verbudee Paare... 3.3 Kolmogoroff/Smirov-Test (Ei-Stichprobe-Apassugstest)... 3.3. Testsituatio... 3.3. Testidee...

Statistik B Script ud Diplomklausurvorbereitug S. 3.3.3 Bemerkuge... 3.3.4 Beispiel (Graff, S. 34)... 3 3.4 Kolmogoroff/Smirov-Test (Zwei-Stichprobe-Apassugstest)... 3 3.4. Testsituatio... 3 3.4. Testidee... 3 3.4.3 Testdurchführug... 3 3.4.4 Beispiel... 3 3.5 Ma-Whitey-U-Test für zwei uabhägige Stichprobe... 3 3.5. Testsituatio... 4 3.5. Testidee... 4 3.5.3 Die Kostruktio der Prüfvariable... 5 3.5.4 Vorgehesweise... 5 3.5.5 Bemerkuge... 5 3.5.6 Beispiel (Tiede S. 93)... 5 3.6 Kruskal/Wallis-H-Test... 6 3.6. Testsituatio... 6 3.6. Testidee... 6 3.6.3 Bemerkuge... 6 3.6.4 Beispiel (Tiede S. 99)... 7 3.7 Prüfug des Ragkorrelatioskoeffiziete... 7 3.7. Testsituatio... 7 3.7. Testidee... 7 3.8 Literatur... 8

Statistik B Script ud Diplomklausurvorbereitug S. 3 3 Meßiveau omial ordial Kriterie Hypothese Testverfahre Beispiel Stichprobe dichotome Merkmalsausprägug Stichprobe polytome Merkmalsausprägug abhägige Stichprobe dichotome Merkmale uabhägige Stichprobe dichotome Merkmale uabhägige Stichprobe polytome Merkmale mehr als uabhägige Stichprobe Stichprobe ordial skalierte Beobachtugsvariable uabhägige Stichprobe Die GG ud die Stichprobe sid gleich verteilt: F 0 (x)=f(x) Die GG ud die Stichprobe sid gleich verteilt: F 0 (x)=f(x) Uterscheidet sich der Ateilswert eier Gruppe vo Wechsler sigifikat vo 0,5? Uterscheide sich die Ateilswerte der Stichprobe zufällig voeiader oder icht? Das Merkmal A hat i de r GG jeweils dieselbe Verteilug, die Stichprobe komme aus eier GG. H 0 : Der Media der GG hat eie bestimmte Wert c H 0 : F(x)=F 0 (x) Stammt eie Stichprobe aus eier i eier bestimmte Weise verteilte Grudgesamtheit? Stamme die Mediae der Stichprobe aus zwei GG mit gleichem Media, d.h. sid die Verteiluge bis auf die Lageparameter gleich? Stamme zwei Stichprobe aus eier GG? abhägige Stichprobe Stamme die Mediae zweier verbudeer Stichprobe aus eier GG? Stichprobe, Utersuchugsvariable Zwische de beide Merkmale der Grudgesamtheit besteht kei Zusammehag. Biomialtest χ - Apassugstest McNemar-Test Æ Azahl der Wechsler muß bekat sei x Kotigeztafel-Fisher-Test χ - Tests (χ - -Homogeitätstest, χ - -Apassugstest) a) Vorzeichetest (Mediatest) Æ Iformatioe bzgl. Größe vo Differeze werde icht berücksichtigt Æ bei steigede sikt Testeffiziez Æ ka bei großem als Schelltest beutzt werde b) Wilcoxo-Vorzeiche- Ragtest Æ utzt Ifo über Differeze (Räge drücke ragmäßige Abstad aus) Æ ab >5 ka W-V-Test durch eie Normalverteiltug approximiert werde Æ zählt zu de verteilugsfreie Tests mit der höchste Testgüte a) Kolmogoroff/Smirow-Ei- Stichprobe-Apassugstest Æ eifacher als χ -Test, gleich effiziet Æ Voraussetzug: H 0 ist voll spezifiziert b) χ -Test Æ awede, we Parameter der GG icht expliziet vorgegebe sid a) Ma/Whitey-U-Test Æ 95%-Effiziez b) t-test Æ GG muß icht ormalverteilt sei c) Vorzeichetest als Schelltest Æ Effiziez fällt bei steigedem auf 63% gege 95% für +<6 a) Komogoroff/Smirow-Zwei- Stichprobe-Apassugstest Æ Effiziez: 96 % b) U-Test Æ ist bei große effizieter c)t-test a) Wilcoxo-Vorzeiche- Ragtest Æ Effiziez 96% b) t-test c) Vorzeichetest als Schelltest Æ gerigere Effiziez Ei Hersteller vo Geräte behauptet, daß höchstes 5 Prozet defekte Stücke produziert werde. Per Zufall werde 0 Stücke etomme. 3 Stücke sid defekt. Frage: Ka ma dem Hersteller bei 0% Sigifikaziveau traue? 00 Studete wurde ach dem ihe am sympathischste Fach befragt. Hypothese: Geprüft werde soll, ob die Studete alle füf Fächer gleich sympathisch fide. Vor ud ach eier Parteiverastaltug werde die Besucher ach ihrem Wahlverhalte i Bezug auf diese Partei befragt. Währed eier Idustrieausstellug wurde 5 Vertreter ilädischer Uterehme ud 6 Vertreter auslädischer Uterehme über ihre Eidruck vom Geschäftsklima befragt: Geprüft werde soll: Sid die Uterschiede i de Atworte zufällig (H o ) oder icht (H a )? a) Mediatest 7 vo 8 Werte eier Stichprobe liege über dem Hypothesewert der Grudgesamtheit, d.h. v (Azahl der positive Vorzeiche)=7. Frage: Ist der Uterschied zwische vermutetem Grudgesamtheitsmedia ud Ergebis zufällig? b) W-V-Ragtest Ei Lehrer hatte i der Vergageheit die Durchschittsote 3 vergebe. Seier derzeitige Schulklasse gab er Zesure i der folgede Häufigkeit: Geprüft werde soll, ob sich die Schulklasse vo adere Schulklasse im Notedurchschitt uterscheidet. (5% Sigifikaziveau, beidseitig): H o : μ 0,5 =3 a) Die Altersverteilug vo 50 Studetie zwische ud 30 Jahre wurde gemesse. Die Hypothese lautet, daß das Alter i dem gemessee Bereich vo bis 30 Jahre gleichverteilt sei soll. a)m-w-u-test: Zwei Leichtathletikgruppe mit füf bzw. sechs Leute ( =5, =6) mache eie Fitesstest, achdem sie ei uterschiedliches Witertraiig durchgeführt habe. Uterscheide sich die Gruppemittel ur zufällig voeiader? 3

Statistik B Script ud Diplomklausurvorbereitug S. 4 4 metrisch uabhägige kleie Stichprobe uabhägige Stichprobe mehr als uab. Stichprobe zwei verbudee Stichprobe mehr als Stichprobe Uterscheidet sich das arithm. Mittel eier Stichprobe sigifikat vom arithm. Mittel eier GG? Uterscheidet sich das arithm. Mittel eier Stichprobe sigifikat vom arithm. Mittel eier zweite Stichprobe? Stamme zwei oder mehr Mittelwerte aus der gleiche Grudgesamtheit? t-test für eie kleie Stichprobe t-test für zwei uabhägige kleie Stichprobe eifache Variazaalyse t-test für zwei verbudee Stichprobe Variazaalyse zweifacher Klassifikatio I eier Goldmie werde zwei Gruppe gebildet, die mit uterschiedliche Suchstrategie arbeitet. Die erste Gruppe erreicht im Durchschitt 5 kg am Tag, die zweite Gruppe 7 kg. Uterscheide sich die Gruppe sigifikat voeiader? Beeiflusse uterschiedliche Dügersorte (5 Sorte) de Getreideertrag? Beeiflusse verschiedee Afagsgewichte (Faktor ) vo Schweie sowie die verwedete Futterart (Faktor ) die Gewchtszuahme (Utersuchugsvariable)? Tests bei metrischem Meßiveau. Chi-Quadrat-Tests.. χ -Apassugstest... Testsituatio eie eifach Zufallsstichprobe des Umfags die Utersuchugsvariable ist polytom r mögliche Werterealisatioe es werde für die Werterealisatioe die absolute Häufigkeite b i i=,r, gezählt... Testidee Der χ -Apassugstest ist ei recherischer Test. Im Gegesatz zum Kolomogoroff-Smirov-Test muß die H 0 icht voll spezifiziert sei. Geprüft wird, ob eie empirische Häufigkeitsverteilug eier theoretisch ageommee ähelt, ob sie sich ihr apaßt: H 0 : F(x)=F 0 (x) H a : F(x) F 0 (x) Aders formuliert: Gegebe ist eie Stichprobe aus eier Grudgesamtheit. Ma ket die Verteilugsfuktio der Grudgesamtheit icht, testet, ob sie eier theoretische Verteilug folgt, z.b. der Normalverteilug, Biomialverteilug, Poissoverteilug. Die Nullhypothese behauptet also, die Grudgesamtheit habe eie bestimmte Verteilug, wobei es sich um stetige wie diskrete Zufallsverteiluge hadel ka. Mathematisch werde beim Chiquadrat-Apassugstest die Abstäde zwische idividuelle beobachtete ud idividuelle theoretische Häufigkeite i die Prüfvariable U trasformiert, die (approximativ) eie Chiquadratvariable ist....3 Die Prüfvariable Die Prüfvariable ist die Pearsosche Variable U: r ( empirische theoretische Hä ufigkeite ) ( Bi ei) U= = theoretischehä ufigkeite e i i = Es geht icht um sigifikate Abweichuge eizeler Werte, soder um sigifikate Abweichuge der gesamte Verteilugsfuktio. Deshalb wird über summiert. 4

Statistik B Script ud Diplomklausurvorbereitug S. 5 5 Besteht ei großer Abstad zwische e i ud b i, wird die H o eher abgeleht. Bei jedem Chiquadrat-Apassugstest muß ma die Zahl der Freiheitsgrade bestimme. Die Zahl der Freiheitsgrade hägt vo der Zahl der Klasse ud der Azahl der Parameter, die geschätzt werde müsse ab. Bei r Klasse ud γ zu schätzede Parameter beträgt die Zahl der Freiheitsgrade υ: υ = r- γ -. Soll beispielsweise getestet werde, ob eie Nomialverteilug vorliegt, so hat ma zwei Parameter, ämlich μ(mittelwert) ud σ (Streuug), d.h. υ =. Bei eier Biomialverteilug muß π geschätzt werde (υ = ), bei eier Poissoverteilug λ (υ=)....4 Beispiel (aus Tiede, S.4) 00 Studete wurde ach dem ihe am sympathischste Fach befragt. Fach b i e i (b i -e i )² ( bi ei) ei VWL 45 40 5 0,65 BWL 37 40 9 0,5 WiPo 48 40 64,600 Fiazwisseschaft 3 40 64,600 Statistik 39 40 0,05 00 00 4,5 Hypothese: Geprüft werde soll, ob die Studete alle füf Fächer gleich sympathisch fide. Das heißt, we diese Hypothese zutrifft, müßte jeweils /5 der Studete die füf Fächer bevorzuge. Die Nullhypothese lautet: Ho = π = π 0 i = 0, ; i =... 5 oder i Worte ausgedrückt: π ist geauso verteilt wie π 0i. Das Sigifikaziveau sei 5 Prozet. Berechug des Rückweisugspuktes: -α Prüfwert 4,5 (s. Tabelle). Als Wert ergibt sich u=4,5. α Rückweisugspukt:9,55 Da keie Parameter geschätzt werde solle ud wir füf Klasse (=Fächer) habe, ist die Zahl der Freiheitsgrade=5-0-=4. I der Tabelle (Formelsammlug S. 30) liest ma ach, daß für 4 Freiheitsgrade ud füfprozetigem Sigifikaziveau der Rückweisugspukt bei χ = 9, 49 ist. Nu wird die Pearsosche Prüfvariable: r i= ( Bi ei) e i berechet Der Prüfwert u=4,5 ist kleier als der Rückweisugspukt vo 9,45 d.h. die Nullhypothese wird icht verworfe, die Studete fide alle Fächer gleich sympathisch, die Variable ist i Wahrheit gleichverteilt....5 Bemerkuge. Für de Fall, daß der Stichprobeumfag grezelos wächst, folgt U eier Chiquadratverteilug mit v=r- Freiheitsgerade. Die Prüfgröße U ist ämlich approximativ eie χ -Variable.. Eigetlich gilt der χ -Apassugstest ur für, ma ka ih aber auch für kleie Werte vo durchführe. Jede eizele Klasse der theoretische Verteilug muß midestes mit 5 theoretische Beobachtuge besetzt sei: e i 5 3. Die Stichprobe sollte icht zu klei sei, die erwartete Häufigkeite icht uter liege. 5

Statistik B Script ud Diplomklausurvorbereitug S. 6 6 4. Voraussetzug für die Awedbarkeit des χ -Apassugstest (Tiede, S. 4): Die Modellvoraussetzuge für die Multiomialverteilug müsse gegebe sei: Æ bei jedem Eizelzug muß das Stichprobeelemet mit der vo Zug zu Zug uveräderliche Wahrscheilichkeit π i die i-te Klasse falle: Bei großem Auswahlsatz verwedet ma das Modell mit Zurücklege, bei kleie wäre das icht ötig. Führt ma de Test mit Date durch, dere Meßiveau über dem omiale liegt, muß ma die Date gruppiere. 5. Der χ -Apassugstest ist auch für de Fall vo ur zwei Klasse verwedbar, da etspricht er eiem beidseitigem Biomialtest. Im Fall zweier Klasse etspricht der PEARSONsche Stichprobeumfag ämlich approximativ eier quadrierte Stadardormalvariable, also eie χ - Variable mit eiem Freiheitsgrad. Beim χ -Test vergleicht ma k² mit k r ², beim zweiseitige Biomialtest k mit k r... χ -Homogeitätstest Der χ -Homogeitätstest ist ei Test zur Prüfug der Uterschiede zwische Ateilswerte aus mehr als zwei uabhägige Stichprobe. Die Problemstellug etspricht der Problemstellug der Variazaalyse. Testsituatio r uabhägige Stichprobe der Umfäge b i Vorgehesweise Objekte komme i die Auswahl, i jeder Eizelstichprobe werde die s Auspräguge des iteressierede polytome Merkmals A ausgezählt. Ma beobachtet die absolute bij Häufigkeite b ij (bzw. die relative Häufigkeite pij = ) Zu prüfe ist die Hypothese: p ij weicht ur zufällig vo Grudgesamtheitsateilswerte π ij ab. Die Homogeitätshypothese dieses Tests behauptet also, daß ei Merkmal i de r Stichprobe jeweils zugrudeliegede Grudgesamtheite jeweils die gleiche Verteilug hat. Zu prüfe ist also die Hypothese, daß die Stichprobe aus eier Grudgesamtheit stamme: H0:π ij = π j für alle i; j= s Prüfvariable ist wie bei alle Chi-Quadrat-Tests die Pearsosche Variable U: a r ( Bij eij ) U = e j= i= ij Praktisch werde bei diesem Test die beobachtete Häufigkeite b ij mit de aufgrud der Homogeitätshypothese erwartete Werte e ij vergliche. Hierzu wird ei Chi-Quadrat-Test durchgeführt. Beispiel A der Ruhr-Ui Bochum wurde StudetIe befragt, wie sie die Aforderuge ihres Studiums eischätze. Es ergab sich folgeder Befud: Fakultät Aforderuge zu hoch gerade och zu bewältige gut zu bewältige bzw. gerig 47 (37,6) 45 (39,3) 6 (8,5) 9 (8,6) 5 (8,0) Summe Philologie 0 (5,) 58 (6,3) 5 Jura 6 69 0 (5,8) (65,0) Wirtschaftswisseschaft 8 53 87 (,4) (47,) Sozialwisseschaft 3 5 57 (7,5) (30,9) Maschiebau 0 30 55 (7,) (9,8) Summe 57 35 4 434 Etschiede werde soll, ob sich die Atworte über die Studieaforderuge zwische de ausgewählte 5 Fakultäte wesetlich uterscheide. Die Berechug der erwartete Häufigkeite führt zu de eigeklammerte Werte: z.b. für Philologie ud gerade och zu Radsumme Radsumme 5 35 bewältige ergibt sich ei Wert vo e = = = 6, 3 Gesamtsumme 434 6

Statistik B Script ud Diplomklausurvorbereitug S. 7 7 Für die Prüfvariable u ergibt sich ei Wert vo 63,3 (Die Berechug erfolgt aalog zum Chi- Quadrat-Uabhägigkeitstest, S. 5). Die χ -Verteilug besitzt v=(r-)(s-)=4 =8 Freiheitsgrade. Der Rückweisugspukt liegt für v=8 ud ei Sigifikaziveau vo 0 Prozet bei 3,4 (Nachschlage i Chi-Quadrat-Verteilug). Der Stichprobebefud u=63,3 liegt rechts vom etsprechede Rückweisugspukt χ r =3,4, die Hypothese muß zurückgewiese werfe. Ergebis: Die Nullhypothese muß abgeleht werde, die Stichprobe stamme icht aus eier GG, die Uterschiede zwische de Eischätzuge der eizele Studiegäge sid sigfikat...3 χ -Uabhägigkeitstest Testsituatio: zwei dichotome oder polytome Merkmale X ud Y eie Stichprobe mit Objekte, die jeweils eie Ausprägug vo X ud Y habe Vorgehesweise Der χ -Uabhägigkeitstest prüft die Hypothese, daß die beide dichotome/polytome Merkmale i der Grudgesamtheit voeiader uabhägig sid: H 0 : π ij =π i. π.j Das weitere Vorgehe (Berechug der Prüfvariable etc.) etspricht dem Vorgehe beim χ - Apassugstest (S. 4) Beispiel vergleiche das Beispiel zum Apassugstest, S. 4. Gezoge wird eie Stichprobe, wobei jede Perso zwei Merkmale trägt: Zugehörigkeit zu eier Fakultät ud Beurteilug der Studieaforderuge. Geprüft werde soll, ob die These der Uabhägigkeit zwische Zugehörigkeit zu eier Fakultät ud Beurteilug der Studieaforderuge gestützt werde ka oder ob sie widerlegt werde muß. Der u aalog zu de adere Chi-Quadrat-Tests durchzuführede Test wird als χ -Uabhägigkeitstest bezeichet.. t-tests.. STUDENTisierug Die Tatsache, daß die Stichprobeverteilug des arithmetische Mittels bei ormalverteilter Gesamtheit ebefalls ormalverteilt ist, läßt sich bei bekater Grudgesamtheitsvariaz utze. Ist diese jedoch ubekat, wäre eie etsprechede Schätzug über de Stichprobebefud bei kleiem Stichprobeumfag zu ugeau. Eie Prüfvariable, die dies berücksichtigt, läßt sich mit Hilfe des StUDENTisierug-Verfahres gewie: X μ Bei ormalverteilter Grudgesamtheit gilt: K =. σ Es läßt sich zeige, daß σ wie χ verteilt ist (S ist die zur Stichprobestreuug gehörede v Stichprobevariable). Ma ka u die Defiitio der Studet-t-Variable eisetze ud erhält die K X μ Größe t = = χ S v.. t-test bei eier kleie Stichprobe Testsituatio: Der Mittelwertdifferezetest ist ei t-test bei eiem kleie Stichprobeumfag: <30. Voraussetzug ist, daß die Verteilug i der Grudgesamtheit etweder dichotom oder ormalverteil ist, sost sollte ma auf adere verteilugsfreie (aber ebeso effiziete) Prüfverfahre ausweiche, z.b. de U-Test.) 7

Statistik B Script ud Diplomklausurvorbereitug S. 8 8 Der t-test testet, ob das arithmetische Mittel der Stichprobe sich sigifikat vom arithmetische Mittel der Grudgesamtheit uterscheidet. Der t-test utzt die Iformatio, daß die Stichprobeverteilug des arithmetische Mittels bei ormalverteilter GG ebefalls ormalverteilt ist. Diese Beziehug läßt sich utze, we die Grudgesamtheitsvariaz Verteilug der GG ormalverteilt Variaz i der Grudgesamtheit bekat X σ = K σ ubekat ( X μ) = tv, = S icht ormalverteilt ebefalls 0 ist. Ausweiche auf verteilugsfreie Verfahre! Es ergebe sich folgede Testsituatioe: S ist die zur Stichprobestreuug gehörede Stichprobevariable. Vorgehesweise: Die Nullhypothese lautet: H 0 :μ = μ 0 Ma bestimmt de Wert der t-variable uter der Verwedug vo x, μ 0, s ud. Dieser Wert wird mit t r (ist abhägig vom SN α ud dem Parameter v=-) vergliche (Formelsammlug S. 3)..3 Mittelwertdifferezetest: t-test bei zwei uabhägige kleie Stichprobe Testidee Der t-test für zwei uabhägige kleie Stichprobe geht zurück auf das Studetisierugs-Verfahre (s. S.7). Bei kleie Stichprobeumfäge lasse sich Aussage über die Verteiluge der bislag verwedete Prüfgröße ur mache, sofer die Grudgesamtheite ormalverteilt sid. Ist dies icht der Fall, weicht ma am beste auf verteilugsfreie Verfahre aus, z.b. de U-Test. Testsituatio zwei uabhägige kleie Stichprobe (<30) Voraussetzug: GG sid ormalverteilt, Variaze der Gesamtheite sid gleich (Variazquotietetest durchführe!) Die Testsituatio ergibt sich gemäß der Formelsammlug, S. 48. Beispiel Es werde zwei Gruppe vo 4 bzw. 5 Schüler zufällig ausgewählt, die durch uterschiedliche Uterrichtsmethode auf die Lösug vo hadwerkliche Probleme vorbereitet werde. Nach Abschluß des Uterrichts müsse die 9 Schüler jeweils 30 Probleme löse. Ma erhält für die beide Gruppe folgedes Ergebis (gelöste Probleme) ud möchte wisse, ob die Differez zwische de beide Grupemittel bei 5% Sigifikaziveau (eiseitig) ur aus zufällige Grüde aufgetrete ist. Gruppe 3 5 7 8 Gruppe 4 6 8 3. Die Nullhypothese lautet: π =π. Ma berechet die arithmetische Mittel: x = 5, 75 x = 8, 6 3.... ud die Variaze s = 4, 9 ud s = 4, 8 (für de t-test ist Voraussetzug, daß die GG ormalverteilt sid ud die Variaze der Gesamtheite gleich sid Æ ggf mit Variazquotietetest prüfe!) 4. Jetzt wird die Prüfgröße t r berechet: D δ 85, 0 85, 85, σ x 0 σ + = 49, 4, 8 + 4 5 = = = 39, 5, + 96, 05, 8

Statistik B Script ud Diplomklausurvorbereitug S. 9 9 D X : Differez der arithmetische Mittel δ 0 :?, Differez der arithm. Mittel i der Grudgesamtheit (?), ka aufgrud der Homogeitätshypothese mit 0 ageomme werde σ = s =Variaz der Stichprobe, 5. Für v= + -=7 Freiheitsgerade ergibt sich bei eiem SN vo 5% eiseitig (also bei 0% achschaue, Tabelle Formelsammlug S.3) ei Rückweisugspukt vo,8. 6. Die Prüfgröße liegt liks vom Rückweisugspukt (,39<,89), d.h. die Nullhypothese ka bestehe bleibe. Die Differez zwische de beide Gruppemittel ist zufällig...4 Mittelwertdifferezetest: t-test bei zwei verbudee Stichprobe Der t-test für zwei verbudee Stichprobe läßt sich als Problem des t-test-ei-stichprobe-falls (S.7) auffasse. Ausgegage wird vo der Differez der D=X -X. Aus de Paare der Stichprobevariable (X i,x i ) ud berechet daraus de Durchschitt: D = D i = ( X i X i) = X X (weiteres siehe Formelsammlug).3 F-Test: Variazquotietetest Der F-Test heißt auch Variazquotietest. Er ist ei Test für metrisches Meßiveau [Æ Formelsammlug S. 48f] Der F-Test bewertet die Variaze zweier Grudgesamtheite. Er testet, ob zwei Variaze zufällig voeiader verschiede sid oder icht. Bsp.: Eie Klasse wird am Afag des Schuljahres i zwei Gruppe geteilt. Der gleiche Lehrer beutzt uterschiedliche Lehrmethode bei de Gruppe. Am Ede des Schuljahres wird ei Test geschriebe. Die Durchschittspuktzahl beträgt 4.8 ud 5.3. Frage: Ist der Uterschied zufällig? Der F-Test ist auch für kleie Stichprobeumfäge geeiget. Er spielt bei der Variazaalyse eie bedeutede Rolle, ist aber auch vo Bedeutug, we ma prüfe will, ob die Voraussetzuge für die Awedug des t-differezetests für de Vergleich zweier Mittelwerte uabhägiger Stichprobe erfüllt sid..3. Testsituatio Aus zwei uabhägige Stichprobe der Umfäge ud wird die metrisch skalierte Utersuchugsvariable X aus ormalverteilte Grudgesamtheite erhobe. Da die Grudgesamtheite ormalverteilt sid, geügt die Prüfvariable S S v = -. Die Nullhypothese lautet: H 0 σ σ σ H o : Die beide Variaze sid gleich. eier F-Verteilug mit v = - ud Ist s wesetlich größer als s, ka ma sich die geaue Hypotheseprüfug spare. Asoste wird die eigagsformulierte H o mit eiem F-Test geprüft..3. Die Prüfvariable Die Prüfvariable ist gegebe durch: s Streuug zwische de Gruppe = s Streuug ierhalb der Gruppe Sie muß ergebe, we die Variaze aus eier Grudgesamtheit stamme. Die Rückweisugspukte ergebe sich durch v v σ = = Grudgesamtheitswert für s Grudgesamtheitswert für s = r r=azahl der Gruppe, : Azahl der Persoe isgesamt = r( ) 9

Statistik B Script ud Diplomklausurvorbereitug S. 0 0.3.3 Lösugsasatz. Sigifikaziveau festlege. de Wert für die Prüfvariable bereche 3. die Rückweisugspukte bereche 4. I der Formelsammlug auf S. 3 i der Tabelle achschaue, ob der Wert für die Prüfvariable größer oder kleier als der dort agegebee Wert ist. We die Prüfvariable größer als der tabellierte Wert ist, ist die Hypothese bestätigt: Es bestehe sigifikate Uterschiede. We die Prüfvariable kleier als der tabellierte Wert ist, muß die Hypothese verworfe werde: Es bestehe keie sigifikate Uterschiede..3.4 Beispiel Es werde zwei Gruppe vo 4 bzw. 5 Schüler zufällig ausgewählt, die durch uterschiedliche Uterrichtsmethode auf die Lösug vo hadwerkliche Probleme vorbereitet werde. Nach Abschluß des Uterrichts müsse die 9 Schüler jeweils 30 Probleme löse. Uterscheide sich die Variaze sigifikat voeiader? Gruppe 3 5 7 8 Gruppe 4 6 8 3. H 0 : s s. Die Variaze ergebe sich als s 3. Der Prüfwert ergibt sich aus s s = 4, 9 ud s = 4, 8 4, 8 (die größere Variaz steht im Zähler!)= 3 49, 4. Der Rückweisugspukt liegt für v = -=3 ud v =v = -=4 bei 9, (SN=5%) 5. 3<9,, die Nullhypothese (hier: Homogeitätshypothese) wird ageomme, die Variaze uterscheide sich ur zufällig voeiader..4 Variazaalyse (egl.: ANOVA).4. Allgemeies Die Variazaalyse gehört zu de Sigifikaztests. Sie (egl.: ANOVA=aalysis of variace) ist ei statistisches Verfahre, durch das im allgemeie geprüft wird, ob die Mittelwerte μ zweier oder mehrerer Stichprobe aus Grudgesamtheite gezoge wurde, die deselbe Mittelwert besitze. Das Verfahre ist eie Erweiterug der Zweistichprobetests, z.b. des t-tests. Vorraussetzug der Variazaalyse ist die Aahme, daß alle Stichprobe aus ormalverteilte Grudgesamtheite stamme. Uabhägige Variable werde im Zusammehag mit der Variazaalyse als Faktore bezeichet. Es hadelt sich dabei stets um qualitative, omialskalierte Variable. Die eizele qualitative Auspräguge eies Faktors werde als Faktorstufe bezeichet. Im Gegesatz zu de Faktore, hadelt es sich bei de i eier Variazaalyse betrachtete abhägige Variable immer um quatitative, itervallskalierte Variable. Wird geau eie abhägige Variable betrachtet, so spricht ma vo eier uivariate Variazaalyse. Werde mehr als eie abhäige Variable utersucht, so spricht ma vo eier multivariate Variazaalyse. Wird lediglich ei Faktor betrachtet, so spricht ma vo eier eifaktorielle Variazaalyse. Werde mehr als ei Faktor utersucht, so spricht ma vo eier mehrfaktorielle Variazaalyse. Je achdem, wieviele Eiflußgröße [Faktore] auf die Utersuchugsvariable gerichtet sid ud die berücksichtigt werde solle, tret ma Variazaalyse i Variazaalyse eifacher ud mehrfacher Klassifikatio. Die verschiedee, i der Variazaalyse mögliche Variablekostellatioe sid i der folgede Tabelle ochmals zusammegefaßt: 0

Statistik B Script ud Diplomklausurvorbereitug S. Azahl der abhägige Variable Azahl der uabhägige Variable > eifaktorielle uivariate Variazaalyse > eifaktorielle multivariate Variazaalyse mehrfaktorielle uivariate Variazaalyse mehrfaktorielle multivariate Variazaalyse.4. Eifache Variazaalyse = Variazaalyse eifacher Klassifikatio.4.. Praktisches Awedugsbeispiel Für eie bestimmte Getreidesorte stehe verschiedee Düger zur Verfügug. Es soll geprüft werde, ob die verschiedee Düger auf de Erteertrag de gleiche Eifluß ausübe oder icht..4.. Testidee Das Testproblem: Gegebe sid r uabhägige Stichprobe der Umfäge i, dere Variaze zwar ubekat sei dürfe, aber gleich sei müsse. Aus de Meßwerte x, i =... r; j =... bildet ma pro Stichprobe das arithmetische Mittel x i = x i j ij ij i Geprüft werde solle die Uterschiede zwische diese Mittelwerte. Die Hypothese lautet also: H0: μ = μ =... = μr Die Nullhypothese lautet ausformuliert: Die Stichprobe stamme aus ormalverteilte Grudgesamtheite mit gleiche Mittelwerte ud gleiche Variaze, also aus eier eizige Gesamtheit. H a besagt: icht alle Mittelwerte sid gleich, i midestes eiem Fall uterscheide sie sich Für das Prüfverfahre beötigt ma eie Quadratsummezerlegug..4..3 Das Prizip der Quadratsummezerlegug Die Variazaalyse beruht auf eier rei arithmetische Zerlegug der Quadratsumme (=Summe der Quadrate der Abweichuge der Stichprobewerte vom Mittelwert). Die Quadratsumme wird i eie Summe vo Bestadteile zerlegt, jeder Bestadteil etspricht eier bestimmte Variatiosursache eies Sachverhalts. Bei eier eifache Variatiosaalyse wird i zwei Teile zerlegt. Der eie Teil etspricht dem systematische Teil, dem Eifluß, de ma utersuche will. Der adere Teil etspricht der Restgröße, dem Zufallseifluß. r m r r m ij ij i i= i= j= q = ( y y) q = m( y y) q = ( Y y ) = j= q: Summe der Abstadsquadrate aller Beobachtuge q : erklärte Quadratsumme, Summe der Abstadsquadrate der Gruppe-Arithmetische-Mittel umd das Gesamt-Arithmetische-Mittel. q: uerklärte Quadratsumme, Summe der Quadrate ierhalb der Gruppe.4..4 Testdurchführug. Sigifikaziveau festlege. Aus de Messwerte Yij bildet ma pro Stichprobe das arithmetische Mittel 3. Quadratsumme der Mittelwerte der Gruppe bereche

Statistik B Script ud Diplomklausurvorbereitug S. 4. Quotiete bilde: q q s = s = r r Trifft die Ho zu, dürfte sich s ud s ur zufällig uterscheide. Falls sie sich doch uterscheide, müßte mittels eies F-Testes überptüft werde, ob die Uterschiede sigifikat sid. 5. ggf. F-Test durchführe.4.3 Zweifache Variazaalyse = Variazaalyse zweifacher Klassifikatio Hier wird ei zweiter systematischer Faktor berücksichtigt, dieser ka mit dem erste Faktor korrelliere, muß aber icht. Systematische Faktore sid Variable, die Stichprobe tree. Ob die beide Faktore voeiader abhäge oder icht, wird vor Aufstelle der Nullhypothese uabhägig festgelegt. Daher köe zwei Fälle auftrete: Korrelatio ud Nicht-Korrelatio. Beispiel: Erteertrag beeiflußt vo de Faktore Düger ud Bode. Eimal häge diese beide Faktore voeiader ab, eimal icht!.4.3. Eie Beobachtug pro Zelle Faktor A darf i r Stufe, Faktor B i t Stufe auftrete. Gezoge werde r*t Stichprobe, jeweils vom Umfag (Eie Beobachtug pro Zelle). Damit schließt ma aus, daß ma evetuelle Wechselwirkuge (Iteraktioe) beobachtet. Die Faktore A ud B müsse also ukorreliert sei. Geprüft werde muß die Hypothese: H o = μ ik = μ für alle i =...r ud k =...t Die Quadratsummezerlegug heißt i diesem Fall: q=q +q +q 3 (ausführlich, siehe Formelsammlug S.5) Die Stichproberealisatioe s, s ud s 3 dürfe ur durch de Zufall akzeptierbare Greze voeiader abweiche. We die Nullhypothese icht zutrifft, ist s > s oder/ud s > s. Ma führt also zwei F-Tests durch, eie für s s Wechselwirkug uterstellt wird). 3 3 ud für s s.4.4 Der Begriff der Wechselwirkug (Iteraktio) 3 3 (wobei Abweseheit eier Die Wechselwirkug bzw. Iteraktio ist die Bezeichug für die gemeisame Wirkug zweier (z.b. bei der zweifaktorielle Variazaalyse) oder mehrere Variable (mehrfaktorielle VA) auf eie dritte abhägige Variable, die icht aus der Additio der eizele Eiflüsse resultiert. Wechselwirkuge trete icht auf, we die Faktore uabhägig voeiader sid. Bei eier zweifaktorielle Variazaalyse mit ur eier Beobachtug pro Zelle lasse sich die Auswirkuge vo der Iteraktio des Faktors A ud B icht vo de Auswirkuge der Störvariable tree, weil sich da keie zufallabhägige Variatio ierhalb der Zelle bilde läßt. Hier besteht ur die Möglichkeit, die Variatio zwische de Stufekombiatioe der beide Faktore dem Zufall zuzuschreibe ud eie Wechselwirkug auszuschließe. Es empfiehlt sich daher, stets mehrere Beobachtuge pro Zelle durchzuführe, um eie vierte Quadratsumme, die auch die Variatio ierhalb der Zelle erfaßt, als Bezugsgröße zu erhalte..4.5 Was hat die bivariate Regressiosrechug mit der Variazaalyse zu tu? Die Variatio auf der Regressioshyperebee etspricht der Variatio zwische de Stufe der Variazalyse: Bei der eifaktorielle Variazaalyse stützt ma sich zur Prüfug des Eiflusses eier mehrmals gestufte uabhägige Variable auf eie abhägige Variable auf eie Quadratsummezerlegug. Die Gesamtvariaz der Meßwerte q wird i eie Variatio der Gruppemittelwerte bezüglich des Gruppemittelwertes (Variatio zwische de Stufe) q ud i eie Variatio der Eizelwerte bezüglich der Gruppemittelwerte (Variatio ierhalb der Stichprobe) q aufgeteilt. Im allgemeie sid q ud q größer Null, bei q wege der Faktorwirkug ud aus Zufallsgrüde, bei q ausschließlich aus Zufallsgrüde. Bei der multiple Regressioshyperebee (aber auch der eifache Regressiosaalyse) wird ebeso die gesamte Variaz i eie determiistische Teil (Variaz auf der Regressioshyperebee) ud eie stochastische Teil (Variaz um die Regressioshyperebee) aufgeteilt. Uter der

Statistik B Script ud Diplomklausurvorbereitug S. 3 3 Voraussetzug, daß die Gruppemittelwerte der Variazaalyse y i de y i -Werte afu der Regressioshyperebee etspreche, gilt sogar: Die Variatio zwische de Stufe der r Variazaalyse q = m ( yi y ) etspricht der Variatio auf der Regressioshyperebee bei der i=! bivariate (ud multiple) Regressiosaalyse q = ( yi y). Diese Beziehug gilt icht immer, soder ur da, we die exogee Variable klassifiziert vorliegt, z.b. 0--Kodierug. Tests bei omialem Meßiveau. Vorbemerkug Bei omialskalierte Date ist der Ateilswert die statistische Maßzahl beim Teste. Bei eiem große Stichprobeumfag diet die Normalverteilug als Stichprobeverteilug.. Biomialtest (= Ateilswerttest).. Testsituatio eie diskrete dichotome ( zwei Auspräguge) Zufallsvariable (z.b. Geschlecht mit de Auspräguge mälich ud weiblich).. Testidee Geprüft werde soll, ob die Verteilugsfuktio F(x) der Zufallsvariable X der durch die Hypothese festgelegte Verteilugsfuktio F o (x) etspricht, d.h. H o : F(x)=F o (x). Da die Variable dichotom ist, ka ma vereifache zu H o : π =π o Ma prüft also, ob die Verteilug der Variable X i der Stichprobe der i der Grudgesamtheit etspricht. Der Rückweisugspukt beim Biomialtest ist durch das Sigifikaziveau gegebe. Da ei Sigifikaziveau vo 0,05 oder 0,0 etc. icht exakt tabelliert ist, muß ma de Pukt ugefähr bestimme ud modifiziert die Nullhypothese H o : π π o. Jeder Wert dem Rückweisugspukt ist Rückweisugspukt...3 Methode Da wir ur zwei Klasse vorliege habe,. zählt ma die Besetzugszahle der beide Klasse aus ud. berechet ma die relative Häufigkeite p bzw. -p I der Regel ergibt sich ei Uterschied zwische der Verteilug der Grudgesamtheit ud der Stichprobe. Geprüft wird u, ob der Uterschied zufällig oder sigifikat ist. (Sigifikaziveau beispielsweise 5 %)...4 Beispiel I (Vorlesug) Ei Hersteller vo Geräte behauptet, daß höchstes 5 Prozet defekte Stücke produziert werde. Per Zufall werde 0 Stücke etomme. 3 Stücke sid defekt. Frage: Ka ma dem Hersteller bei 0% Sigifikaziveau traue? Folgede Werte sid gegebe: = 0 x = 3 (Azahl der defekte Stücke) x = = 3 p 0 (Ateilswert) Es gibt u zwei Möglichkeite, de Test durchzuführe:. über de Ateilswert p. über die absolute Häufigkeit 3

Statistik B Script ud Diplomklausurvorbereitug S. 4 4 Berechug über de Ateilswert: H o : π o 0,05 (Es sid höchstes 5 Prozet kaputt sid, 5 %=0,05; π etspricht der Erfolgswahrscheilichkeit, ei fehlerhaftes Stück aufzufide) H a : π a >0,05 (i Wirklichkeit ist die Zahl der defekte Stücke größer als 5 Prozet) x 3 p = = = 0,5 (der Ateil der defekte Stücke beträgt 5 Prozet) 0 P folgt B( 0; 0, 05) 0 Der Rückweisugspukt ergibt sich aus dem Sigifikaziveau. Das Sigifikaziveau beträgt 0%, d.h. P(X x r )=0,0. Da 0,0 icht exakt i der Biomialverteilugstabelle tabelliert ist, schlägt ma die beide Werte ach, ie als ächstes a 0, herakomme (dabei beutzt ma die Erfolgswahrscheilichkeit des defekte Stückes vo π=0,05 oder 5%) Biomialverteilug B(, π) (Auszug aus Formelsammlug B-Verteilug, Tafel 9): X 0,050 0 0 0,358 0,377 0,89 3 0,060 4 0,03 5 0,00 6 0,000 Die Wahrscheilichkeit, daß mehr als 3 defekte Stücke auftrete, P(X 3) ist 0,073 ( ma addiert die Werte ab 3 bis 0). 0,073 0,0, d.h. der Rückweisugspukt würde uterschritte. Die Wahrscheilichkeit, daß mehr als defekte Stücke auftrete, P(X ) ist 0,6 ( ma addiert die Werte ab 3 bis 0). 0,6 0,0, d.h. der Rückweisugspukt würde überschritte. Der Wert für de Rückweisugspukt läge zwische ud 3, ma wählt de Pukt, bei dem H o höchstwahrscheilich icht verworfe wird, d.h. der Rückweisugspukt lautet icht mehr p r =0,0, soder p r 0,0, formal korrekt geschriebe: P(X x r ) 0,0. Diese Verschiebug des Sigifikaziveaus bezeichet ma als Koservativer Test : Der Pukt, der für die Beibehaltug der H o tedeziell güstig liegt (Beispiel: geau 0% Sigifikaziveau) ist icht möglich. Ma wählt daher ei kleieres Sigifikaziveau, um die H o beibehalte zu köe. Beim koservative Teste werde die Parameter abgeschätzt, die H o im Zweifel eher ageomme. Ergebis: Der Stichprobebefud vo drei oder mehr defekte Stücke führt zur Rückweisug der H o. Maximal zwei defekte Stücke sid erlaubt...5 Beispiel II: klassische Aufgabestellug für de Biomialtest Zu teste ist die Hypothese, daß der Ateil weiblicher Studiereder a der Ruhr-Ui-Bochum bei 50% liegt (Sigifikaziveau: 0 % eiseitig). I eier Zufallsstichprobe werde =6, x=4 Fraue beobachtet. Frage: Sid die Fraue uterrepräsetiert? Begrüdug des Prüverfahres Geprüft werde soll hier eie Hypothese über die Verteilug eier Zufallsvariable i der Grudgesamtheit. Eie solche Hypothese läßt sich mit eiem Apassugstest prüfe. Da es sich hier um eie dichotome Utersuchugsvariable bei omialem Meßiveau hadelt, ist der Biomialtest das geeigete Prüfistrumet. Prüfug der Voraussetzuge für ei Beroulli-Experimet. Zwei Ergebisalterative: a-weiblich: P(a)=0.5 b-mälich: PA ( ) =-0.5=0.5. Die Eizelwahrscheilichkeite sid mit π=0.5 kostat. 3. Die Wahrscheilichkeit bei de 6 Experimete ist gleich groß. 4. Die Zufallsstichprobe gewährleistet die Uabhägigkeit der Ergebisse. Es liegt eie Versuchsaordug ach Beroulli vor, der Biomialtest ka durchgeführt werde. Die Nullhypothese lautet: H 0 : π 0 = 0. 5 (Die Fraue sid icht uterrepräsetiert) 4

Statistik B Script ud Diplomklausurvorbereitug S. 5 5 Bei eier Beroulli-Verteilug folgt die Zufallsvariable X eier Biomialverteilug B(,π), x folgt hier B(6, 0.5). Utersucht werde muß, ob der Stichprobebefud (4 Fraue) oder ei och weiter vo der Hypothese abweicheder Pukt (3,,, keie Frau) realisiert wird. P(p 0.5 H 0 ) Æ falls p>α, wird die H 0 ageomme Æ falls p<α, wird die H 0 abgeleht Aus der Tabelllierug der Biomialverteilug ka ma die Eizelwahrscheilichkeite für das Auftrete vo keier,,, 3, 4 Fraue ablese: Die Wahrscheilichkeit, daß der Stichprobebefud oder ei och weiter etferter Befud realisiert wird, beträgt 0.039. Das etspricht eier prozetuale Wahrscheilichkeit vo 3,9 Prozet. P(4)=0.08 P(3)=0.009 P()=0.00 P()=0.0 P(0)=0.0 Σ 0.039 Der Rückweisugsput p r ergibt sich durch das Sigifikaziveau vo 0%, also eiem Ateilswert vo 0. 0.039<0. (p<p r ), daraus folgt, daß die H 0 verworfe werde muß. Die Fraue sid i der Stichprobe uterrepräsetiert...5. Bemerkuge Der Biomialtest ist ei koservativer Test. Er begüstigt die Aahme der Nullhypothese..3 McNEMAR-Test.3. Testsituatio Der McNemar-Test ist ei Homogeitätstest, der sich eiget für zwei abhägige (=verbudee) Stichprobe omialskalierte, dichotome Variable! We die Variable mehrstufig sid, z.b. die Religioszugehörigkeit, muß ma dichotomisiere, z.b. Katholike gege Nichtkatholike oder christliche Religioe gege adere..3. Testidee Der McNemar-Test gehört zu de biomiale Testverfahre. Er ka agewedet werde, we eie Vierfeldertafel vorliegt ud we utersucht werde soll, ob sich bestimmte Merkmalskombiatioe i bedeutsamer Weiser verädert habe. Gegebe sid zwei Alterativmerkmale, die jeweils zwei Variatioe aufweise (dichotome Variable). Es werde u die Azahl der Wechsler betrachtet, d.h. der Elemete, die i der zweite Stichprobe eie adere Merkmalsausprägug ageomme habe. Ma prüft, ob sich der Ateilswert vo de Wechsler (siehe Beispiel ute) sigifikat vo 0,5 uterscheidet. 0,5 ist deshalb der Etscheidugswert, weil es sich um eie dichotome Variable hadelt, dere Erfolgswahrscheilichkeit 0,5 beträgt. Letztedlich wird ei Biomialtest durchgeführt, der zur Abweisug oder Aahme der Variable führt (Details siehe Beispiel). Der McNemar-Test ist ei koservativer Test, der oft bei vorher-achher-erhebuge oder mit-ohe Erhebuge durchgeführt wird..3.3 Beispiel (Tiede S. 54) Vor ud ach eier Parteiverastaltug werde die Besucher ach ihrem Wahlverhalte i Bezug auf diese Partei befragt. Für de McNemar-Test iteressiert u die Azahl der Persoe, die ihre Wahlabsichte geädert habe ( Wechsler). vorher achher vorher achher Summe Partei wird gewählt 30 35 65 Partei wird icht gewählt 30 5 55 Summe 60 60 0 Zu diesem Zweck stellt ma die Tabelle folgedermaße um, um die Differez zwische vorher ud achher deutlich mache zu köe: 5

Statistik B Script ud Diplomklausurvorbereitug S. 6 6 vorher Partei wird gewählt Partei wird icht Partei wird icht gewählt 5 0 achher a Partei wird gewählt 5 0 b Summe 30 30 gewählt c d Summe 35 5 60 I de vier Felder stehe die Azahl der Leute, die ihre Meiug geädert habe (b=5, c=0) Persoe, sowie der Azahl der Leute, die ihre Meiug beibehalte habe (a=5, d=0). Falls die Nullhypothese H 0 = π = π zutrifft, wird ma erwarte, daß sich c ud b ur zufällig voeiader uterscheide. Als Prüfvariable diet hier beispielsweise (!) die Zahl der Wechsler b. Sie ist, we die Nullhypothese zutrifft, biomialverteilt ach B(b+c; 0,5). Für c gilt das gleiche! Das heißt, ma ka hier eie Biomialtest (vgl. S. 3) durchführe, der testet, ob sich der Ateilswert b b+ c sigifikat vo 0,5 uterscheidet. Auf das Beispiel agewedet ergibt sich: p = b b + c = 5 5 = + 0 Die Rückweisugspukte der vorliegede Biomialverteilug B(5;0,5) liest ma u i Tiedes Buch, S. 53, Tabelle 3, oder i der Formelsammlug (Tabellierug für Media-Vorzeiche-Test) ab. Die Rückweisugspukte laute 3 ud bei eiem Sigifikaziveau vo 5 %. 3 p r = = 0, ud p 5 r = = 5 08, Da 0, (. Rückweisugspukt) 0,33 (Prüfwert) 0,8 (. Rückweisugspukt) ist, wird die Nullhypothese ageomme. D.h. der Uterschied zwische vorher ud achher ist zufällig. Das heißt ebefalls: De Ateilswerte p 033, a + b 30 a + c 35 = = = 05, ud p = = = 0, 583 uterscheide 60 60 sich icht sigifikat voeiader. Auf de praktische Ihalt der Aufgabe bezoge heißt das, daß die Wahlverastaltug die Chace der Partei icht wesetlich verädert hat. Der McNemar-Test utzt die Tabellierug für de Media-(Vorzeiche)-Test..4 Differezetest für zwei Ateilswerte aus zwei große uabhägige Stichprobe Tiede faßt die Ergebisse des erste Bades, S. 60 ud S. 8, zusamme, i dem die Stichprobeverteilug der Differez zweier Ateilswerte bereits erörtert wurde..4. Testsituatio zwei große uabhägige Stichprobe die dichotome Variable ist omial skaliert die Auszählug der Kategorie ist gegebe, p ud p sid bekat.4. Testidee Gegebe ist eie Stichprobe mit de Ateilswert π. Über die Grudgesamtheit vermutet ma jedoch eie Grudgesamtheitsateilswert vo π. Ist der Uterschied zufällig oder sigifikat? Bei großem Stichprobeumfag ud ubekate Grudgesamtheitsagabe ka ma die Stichprobeverteilug der Differez zweier Ateilswerte durch eie Normalverteilug approximiere. Die Rückweisugspukte für die Hypothese H o :π - π =δ laute: 6

Statistik B Script ud Diplomklausurvorbereitug S. 7 7 δ pr = δ + k 0 r p( p) p( p) + Da ma π ud π icht ket, wird π ud π =0 geschätzt. Der Fischer-Test ist hier der bessere Lösugsweg. Voraussetzug ist allerdigs, daß die Ateilswerte icht zu ahe bei Null liege dürfe Falls die Stichprobe klei ist, greift ma zum Fisher-Test (siehe S. 7).5 FISHER-Test.5. Testsituatio zwei uabhägige Stichprobe mit zwei dichotome Gesamtheite die ubekate Verteilugsfuktioe heiße: F (X) ud F (X)..5. Testidee Der Fishertest ist eie Soderform des χ-test, isofer also auch ei Apassugstest. Mit dem Fisher-Test läßt sich eie Vierfelderverteilug prüfe, auch we die Stichprobe ud damit die erwartete ud beobachtete Häufigkeite klei sid. Mit Hilfe der hypergeometrische Verteilug, die für diskrete Variable defiiert ist, ka ma exakt die Wahrscheilichkeit bestimme, mit der bei gegebee uivariate Radverteiluge eie bestimmte Häufigkeitverteilug i de vier Felder der Tabelle auftritt. Geprüft werde soll: H o : F (X)=F (X) für alle x, d.h. die Verteilug der erste Stichprobe etspricht der der zweite Stichprobe, beide Stichprobe stamme aus der gleiche Grudgesamtheit. Eie Vierfeldertafel sei folgedermaße otiert: Ausprägug des Merkmals a a Summe Nr. der Stichprobe x -x x -x Summe x -x Falls die Nullhypothese zutrifft, uterscheide sich die Ateilswerte p x x = p =, ur zufällig voeiader. Gesucht ist die Wahrscheilichkeit für X x uter der Bedigug, daß H o i Wahrheit zutrifft. Um de Uterschied zwische p ud p zu beurteile, geügt es, sich mit x (oder x ) zu befasse, da die adere Werte (x=π =π =π ud ud ) bekat sid, bzw. sich erreche lasse ( Nur ei Feld i der x-tafel ist frei variierbar). Ma umeriert die Stichprobe so um, daß x die adere drei Häufigkeite ist! Die Prüfgröße X folgt bei korrekter Nullhypothese X eier hypergeometrische Verteilug mit: x x Px ( ) = = x! ( x)! xx!( x)!( x )!! Eigeschafte vo x: relativ größere Werte vo x führe dazu, daß die Differez zwische p ud p größer wird (relativ oberer Bereich). relativ große Werte vo x führe eher zur Ablehug der H o. 7

Statistik B Script ud Diplomklausurvorbereitug S. 8 8.5.3 Beispiel Währed eier Idustrieausstellug wurde 5 Vertreter ilädischer Uterehme ud 6 Vertreter auslädischer Uterehme über ihre Eidruck vom Geschäftsklima befragt: Äderug des Geschäftsklimas Verschlechterug Verbesseru Summe Uterehme g Ilädisch 4 5 Auslädisch 5 6 Summe 6 5 Geprüft werde soll: Sid die Uterschiede i de Atworte zufällig (H o ) oder icht (H a )? 5 H o (umformuliert): p = = 0, ud p 5 = = 083, uterscheide sich ur zufällig voeiader. 6 Gegebe sei ei 5%iges Sigifikaziveau. 5 6 x 6 x 5665!!!! Ma berechet die Prüfgröße X : P( X) = = x! x!( 5 x)!( 6 x )!! 6 Ma prüft u für x =, ob der Rückweisugspukt x r rechts oder liks vo x liegt. P()=0,0649. Bei eiem Sigifikaziveau vo 5%, d.h. eiem P(0,05), wird die Hypothese icht verworfe, da 0,0649>0,05. Ergebis: die Uterschiede i beide Stichprobe sid zufällig! 3 Tests bei ordialem Meßiveau Der χ -Apassugstest ist prizipiell auch für ordialskalierte Date awedbar. Er berücksichtigt jedoch icht die Größer-Kleier-Relatio, die zwische de Stichprobe besteht. 3. Mediatest (=Vorzeichetest) Literatur: Tiede: S 74 ff 3.. Testsituatio gegebe sei ei stetiges Merkmal X, das midestes ordial skaliert ist es wird eie Zufallsstichprobe gezoge mit x i, i=.. Merkmalswerte x 0,5 ist der Media der Stichprobe, d.h. der Wert, der i der Mitte der ach Größe geordete Werte liegt ( Zetralwert) 3.. Testidee Die Hypothese lautet: der Media der Grudgesamtheit hat eie bestimmte Wert c. Hypothese: H o : γ 0,5 =c (c ist irgedei Wert), γ 0,5 ist der Media der Grudgesamtheit Lösugsasatz: Ma vergleicht jede Stichprobewert x i mit dem Hypothesewert c. Falls x i >c ist, otiert ma ei positives Vorzeiche, a i = Falls x i <c ist, otiert ma ei egatives Vorzeiche, a i =0 falls x i =c ist, wird x i etfert, verrigert sich Werde viele Werte aussortiert ud die H o trotzdem ageomme, spricht das Ergebis sehr für die Aahme der H o. Die Prüfvariable V (= Azahl der positive Vorzeiche ) ist die Summe aller a i : V = i A i Falls die Nullhypothese zutrifft, folgt V der Biomialverteilug B(, 0,5), d.h. bei Vergleiche wird die Zahl v positiver Vorzeiche durch B(,0,5) agegebe. Die Wahrscheilichkeit eies positive 8

Statistik B Script ud Diplomklausurvorbereitug S. 9 9 Vorzeiches ist ämlich bei zutreffeder Nullhypothese bei jedem Vergleich zwische x i ud c gleich 0,5. Falls v zu groß oder zu klei ist, wird die Nullhypothese verworfe. Ist v relativ klei oder groß, spricht das eher gege die H o. Ist der Wertebereich vo V eher i der Mitte, köte die H o ageomme werde. Die Rückweisugspukte ergebe sich aus der Zahl der Elemete. Ma sieht i der Biomialtabelle uter der Azahl der Elemete ach ud liest die Rückweisugspukte eifach ab. Geprüft wird u, ob der Stichprobewert v im Aahmebereich liegt. 3..3 Bemerkuge Der Mediatest wird häufig als Schelltest vorgeschobe: We die H o im Media-Test verworfe wird, gilt geerell, daß ei besserer Test auch zur Verwerfug führt. Umgekehrt gilt bei eier Aahme der H o icht ubedigt, daß auch der bessere Test zu diesem Ergebis führe würde. Ei Vorteil des Mediatestes ist es, daß er auch bei kleie Stichprobe agewedet werde ka. Der größte Nachteil besteht i der Tatsache, daß er das ordiale Meßiveau icht utzt, da er ur auf Größer/Kleier-Relatioe zu eiem bestimmte Wert c (Wert des Medias) Iformatioe gibt Æ die Ragfolge bei ordialem Meßiveau werde icht geutzt. Liegt eie metrische Skalierug vor ud ist die Grudgesamtheit symmetrisch verteilt, da ist der Mediatest ei Kokurret zum t-test. De Mediatest ka ma mit oder ohe störede Werte (Ausreißer?) durchführe. 3..4 Beispiel (Tiede S. 74 ute) 7 vo 8 Werte eier Stichprobe liege über dem Hypothesewert der Grudgesamtheit, d.h. v (Azahl der positive Vorzeiche)=7. Frage: Ist der Uterschied zwische vermutetem Grudgesamtheitsmedia ud Ergebis zufällig ( Aahme der H o, daß sich Grudgesamtheits- ud Stichprobemedia ur zufällig uterscheide) oder sigifikat ( Ablehug der H o es existiert ei wirklicher Uterschied zwische Grudgesamtheit ud Stichprobe) Gegebe sei ei 5%iges Sigifikaziveau! Aus der Tabelle etimmt ma die Rückweisugspukte für =8, π=0,5 (V folgt ja B(8;0,5)): v r =0, v r =8. Der Stichprobebefud vo v=7 liegt im Aahmebereich, das heißt, der Uterschied zwische Grudgesamtheit ud Stichprobe ist ur zufällig aufgetrete. Ist die Schlußfolgerug richtig? 3. WILCOXON-Vorzeiche-Ragtest für de Media 3.. Testsituatio Gegebe ist eie eifache Stichprobe. Das Utersuchugsmerkmal X ist i der Grudgesamtheit symmetrisch verteilt. 3.. Testidee Im Gegesatz zum Mediatest berücksichtigt der Wilcoxo-Vorzeiche-Ragtest auch die Iformatio über die i Räge ausgedrückte Größe des Uterschieds zwische jedem Stichprobewert ud dem Hypothesewert. Geprüft werde soll: Der Grudgesamtheitsmedia der stetige Utersuchugsvariable hat eie bestimmte Wert c. 9

Statistik B Script ud Diplomklausurvorbereitug S. 0 0 Die Hypothese lautet also: H 0 μ 0, 5 = = c Jeder Stichprobewert x i wird mit dem Hypothesewert c vergliche.. Ma ordet die berechete Differeze di= x i - c der absolute Größe ach, zuächst ohe Beachtug des Vorzeiches.. di Ragplätze werde vergebe: der kleiste Wert di erhält de Rag, der zweitkleiste de Rag. (Sid eiige di gleich groß, bekomme sie ihre Durchschittsrag zugewiese) 3. Ma ordet de Ragzahle die etsprechede d i zu. 4. Ma summiert die Ragzahle getret für positive ud egative Vorzeiche. 5. Falls die Summe der Räge für egative oder für positive Differeze zu klei oder zu groß ist, wird die Hypothese verworfe (siehe Mediatest, S.8). Bei eiem Wilcoxo-Test bezieht ma sich stets auf die absolut kleiere, icht die größere! Summe der Räge! (Vereibarug uter dem Volk der Statistiker) Die Prüfgröße für de Wilcoxo-Test W ist formal defiiert als: W = ARg( d ), a i =0, falls d i egativ ist, a i =, falls d i positiv ist (oder umgekehrt). i i 3..3 Wertebereich ud Verteilug vo W. W ka 0 sei, we i der Stichprobe alle Werte kleier als der Media sid.. W immt de größtmögliche Wert ei, we alle Werte größer als der Media sid. Der maximale Wert ergibt sich aus w max ( +) = 3. W folgt eier diskrete Verteilug. 4. W ist symmetrisch. 3..4 Bemerkuge. Der Wilcoxo-Vorzeige-Ragtest ist effizieter als der Mediatest, da er auch die Iformatioe über die Räge verwedet. Bei großem Stichprobeumfag (>5) ud α 0,05 läßt sich W durch die folgede Normalverteilug approximiere: N ( + ); ( + )( + ) 4 4 3. Der Wilcoxo-Test setzt Symmetrie i der Grudgesamtheit voraus, die Prüfug der Symmetrie wird i der Praxis oft verachlässigt. 4. Zwei Hypothese köe getestet werde: a) H o : der Media der Grudgesamtheit hat eie bestimmte Wert c. b) H o : Die Grudgesamtheit ist symmetrisch. 5. Die Rückweisugspukte i der Formelsammlug auf S. 4 sid liksseitig tabelliert. 6. Problem des mehrfache Auftretes vo Testwerte: We beim Mediatest mehrere Testwerte gleichgroß sid, ist das kei Problem, da allei das Faktum der Abweichug vom Media beim Media zählt. Beim Wilcoxo-Test wird durch das Zuweise vo Durchschittsräge das Vorliege der sogeate Biduge überwude. Das stellt ei Problem dar, das jedoch ab >0 verachlässigbar ist. 7. Der Wilcoxo-Test gehört mit eier Effiziez vo 95 Prozet zu de treschärfste parameterfreie Verfahre. 3..5 Beispiel (Tiede S. 77) Ei Lehrer hatte i der Vergageheit die Durchschittsote 3 vergebe. Seier derzeitige Schulklasse gab er Zesure i der folgede Häufigkeit: Note 3 4 5 Häufigkeit 0 6 6 4 6 Geprüft werde soll, ob sich die Schulklasse vo adere Schulklasse im Notedurchschitt uterscheidet. (5% Sigifikaziveau, beidseitig): H o : μ 0,5 =3 0