Variiert man zusätzlich noch die Saatstärke (z.b. 3 Stärkearten), würde man von einer zweifaktoriellen Varianzanalyse sprechen.



Ähnliche Dokumente
Statistik Einführung // Konfidenzintervalle für einen Parameter 7 p.2/39

15.4 Diskrete Zufallsvariablen

Statistik I/Empirie I

Auch im Risikofall ist das Entscheidungsproblem gelöst, wenn eine dominante Aktion in A existiert.

6 Vergleich mehrerer unverbundener Stichproben

2 Vollständige Induktion

Innerbetriebliche Leistungsverrechnung

Wissenschaftliches Arbeiten Studiengang Energiewirtschaft

Korrekturrichtlinie zur Studienleistung Wirtschaftsmathematik am Betriebswirtschaft BB-WMT-S

Versicherungstechnik

BINOMIALKOEFFIZIENTEN. Stochastik und ihre Didaktik Referentin: Iris Winkler

Evaluierung einer Schulungsmaßnahme: Punktezahl vor der Schulung Punktezahl nach der Schulung. Autoritarismusscore vor/nach Projekt

n 1,n 2,n 3,...,n k in der Stichprobe auftreten. Für die absolute Häufigkeit können wir auch die relative Häufigkeit einsetzen:

Formelsammlung Mathematik

Stichproben im Rechnungswesen, Stichprobeninventur

Statistische Maßzahlen. Statistik Vorlesung, 10. März, Beispiel. Der Median. Beispiel. Der Median für klassifizierte Werte.

3. Einführung in die Statistik

Lerneinheit 2: Grundlagen der Investition und Finanzierung

h i Deskriptive Statistik 1-dimensionale Daten Daten und Häufigkeiten Seite 1 Nominal Ordinal Metrisch (Kardinal) Metrisch - klassiert

Einfache Varianzanalyse für abhängige

Kleines Matrix-ABC. Fachgebiet Regelungstechnik Leiter: Prof. Dr.-Ing. Johann Reger. 1 Elementares

Übungen zur Vorlesung Funktionentheorie Sommersemester Musterlösung zu Blatt 0

Kapitel 6: Statistische Qualitätskontrolle

Übungsblatt 1 zur Vorlesung Angewandte Stochastik

AUFGABENSTELLUNG (ZUSAMMENFASSUNG) 2 SPEZIFIKATION 2. Datenfluß und Programmablauf 2. Vorbedingung 3. Nachbedingung 3. Schleifeninvariante 3

Institut für Stochastik Prof. Dr. N. Bäuerle Dipl.-Math. S. Urban

Kryptologie: Kryptographie und Kryptoanalyse Kryptologie ist die Wissenschaft, die sich mit dem Ver- und Entschlüsseln von Informationen befasst.

Wahrscheinlichkeit & Statistik Musterlösung Serie 13

LOHN Betriebswirtschaftliche Planung & Controlling

Arbeitsplätze in SAP R/3 Modul PP

VAIO-Link Kundenservice Broschüre

Ausgangspunkt: Über einen endlichen Zeitraum wird aus einem Kapital (Rentenbarwert RBW v n,i

Finanzmathematische Formeln und Tabellen

Die Gasgesetze. Die Beziehung zwischen Volumen und Temperatur (Gesetz von J.-L. und J. Charles): Gay-Lussac

2. Diophantische Gleichungen

Statistik mit Excel Themen-Special. Peter Wies. 1. Ausgabe, Februar 2014 W-EX2013S

Tao De / Pan JiaWei. Ihrig/Pflaumer Finanzmathematik Oldenburg Verlag 1999 =7.173,55 DM. ges: A m, A v

Heute Kapitalanlage morgen ein Zuhause

e) ( 4a + 8b + 9a + 18b ) : a + 2b f) 2 log (x) + 3 log (2y) 0.5 log (z)

Kapitel 6: Quadratisches Wachstum

GIBS. Übungsaufgaben zur Vertiefung. V1. Beschriften Sie die Konstruktionen! n n n n ' ' ' ' Modul 1.5. Geometrische Optik 1 58.

Prof. Dr.-Ing. Bernd Kochendörfer. Bauwirtschaft und Baubetrieb. Investitionsrechnung

3Landlust auf Hofweier? Kaufpreis: ,00 Euro Courtage: 3,57% incl. 19% MwSt für den Käufer

Klausur Grundlagen der Investition und Finanzierung

Flexibilität beim Lagern und Kommissionieren: Schienengeführte Regalbediengeräte

Tutorial: Homogenitätstest

Nachklausur - Analysis 1 - Lösungen

Linsengesetze und optische Instrumente

Investitionsentscheidungsrechnung Annuitäten Methode

HONORAR Honorarabrechnung

Testumfang für die Ermittlung und Angabe von Fehlerraten in biometrischen Systemen

Qualitätskennzahlen für IT-Verfahren in der öffentlichen Verwaltung Lösungsansätze zur Beschreibung von Metriken nach V-Modell XT

Aufgaben und Lösungen der Probeklausur zur Analysis I

Kapitel 5: Schließende Statistik

... a ik) i=1...m, k=1...n A = = ( a mn

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Varianzanalyse (ANOVA: analysis of variance)

Willkommen zur Vorlesung Statistik

10. Testen von Hypothesen Seite 1 von 6

Gliederung. Value-at-Risk

3. Tilgungsrechnung Tilgungsarten

evohome Millionen Familien verfolgen ein Ziel: Energie zu sparen ohne auf Komfort zu verzichten

Das FSB Geldkonto. Einfache Abwicklung und attraktive Verzinsung. +++ Verzinsung aktuell bis zu 3,7% p.a. +++

Fachartikel CVM-NET4+ Erfüllt die Energieeffizienz- Richtlinie. Neuer Multikanal-Leistungs- und Verbrauchsanalyser Aktuelle Situation

Allgemeine Lösungen der n-dimensionalen Laplace-Gleichung und ihre komplexe Variable

1 Analysis T1 Übungsblatt 1

PrivatKredit. Direkt ans Ziel Ihrer Wünsche

Logarithmus - Übungsaufgaben. I. Allgemeines

Klasse: Platzziffer: Punkte: / Graph zu f

KUNDENPROFIL FÜR GELDANLAGEN

Gruppe 108: Janina Bär Christian Hörr Robert Rex

Lösungen zu Kontrollfragen

Zahlenfolgen, Grenzwerte und Zahlenreihen

17. Kapitel: Die Investitionsplanung

BERUFSKOLLEG KAUFMÄNNISCHE SCHULEN DES KREISES DÜREN Zweijährige Höhere Handelsschule

Lösungen der Aufgaben zur Vorbereitung auf die Klausur Mathematik für Informatiker I

Statistik. 5. Schließende Statistik: Typische Fragestellung anhand von Beispielen. Kapitel 5: Schließende Statistik

Finanzwirtschaftliche Formeln

Einführung in die Investitionsrechnung

Lösungen zu den Aufgaben zur Multivariaten Statistik Teil 3: Aufgaben zur Varianzanalyse

Zur Definition. der wirksamen. Wärmespeicherkapazität

FAKTORIELLE VERSUCHSPLÄNE. Andreas Handl

Projektmanagement Solarkraftwerke

Beurteilung des Businessplans zur Tragfähigkeitsbescheinigung

LOHN KUG, ATZ, Pfändung, Darlehen und Bescheinigungswesen

Abschlussprüfung 2013 an den Realschulen in Bayern

3. Varianzanalyse Varianzanalyse ANOVA Varianzanalyse nominalskalierten unabhängigen Variablen Faktoren

Löslichkeitsdiagramm. Grundlagen

Aufgabenblatt 4. A1. Definitionen. Lösungen. Zins = Rate Zinskurve = Zinsstruktur Rendite = Yield

NEL Suchspulen - für jeden Detektor! TOP Leistung von unabhängigen Experten bestätigt. Such Spulen. nel-coils.de Shop ww.nuggets24.

9. Schätzen und Testen bei unbekannter Varianz

Kapitel 4.1: Dr. Jörg Franke. Technische Universität Dortmund. Sommersemester 2011

Methodische Grundlagen der Kostenkalkulation

Satz Ein Boolescher Term t ist eine Tautologie genau dann, wenn t unerfüllbar ist.

Tests statistischer Hypothesen

Etwas positive Tendenz ist beim Wechsel der Temperatur von 120 auf 170 zu erkennen.

IM OSTEN VIEL NEUES... Kaufpreis: ,00 Euro 3,57% incl. 19% MwSt für den Käufer

2. Repetition relevanter Teilbereiche der Statistik

Transkript:

3. Variazaalyse Die Variazaalyse mit eier quatitative abhägige Variable ud eier oder mehrerer qualitativer uabhägiger Variable wird auch als ANOVA (Aalysis of Variace) bezeichet. Mit eier Variazaalyse (ANOVA) wird der Eifluss eier oder mehrer omialskalierter uabhägiger Variabler auf eie metrische skalierte Variable utersucht. Die omialskalierte uabhägige Variable werde hierbei auch als Faktore bezeichet. Die Variazaalyse ist ei gägiges Verfahre zur Auswertug vo Experimete i der Biologie, Ladwirtschaft, Pädagogik, Psychologie ud der Marktforschug. Je ach Azahl der Faktore liegt eie vor. - eifaktorielle Variazaalyse (eifache Variazaalyse), - zweifaktorielle Variazaalyse (zweifache Variazaalyse), - dreifaktorielle Variazaalyse (dreifache Variazaalyse) - etc. Beipiel: I der Ladwirtschaft wird z.b. der Eifluss der Dügug (z.b. 4 Dosierugs- Stufe) auf de Erteertrag utersucht wird. We die ausgewählte Parzelle im Hiblick auf die Größe ud Bodebeschaffeheit gleichwertig sid ist die Dügug hier der eizige Faktore (=omialskalierte uabhägige Variable). Der Ertertrag ist die metrisch skalierte abhägige Variable. Ma würde hier also vo eier eifaktorielle Variazaalyse spreche. Variiert ma zusätzlich och die Saatstärke (z.b. 3 Stärkearte), würde ma vo eier zweifaktorielle Variazaalyse spreche. Beispiel: I der Pädagogik wird der Lererfolg vo Schüler (abhägige Variable) bei uterschiedlich Uterríchtsmethode evaluiert. Im eifachste Fall besteht der Faktor Uterrichtsmethode hier z.b. aus de beide Stufe traditioell ud multimedial. Sofer der Lererfolg geeiget quatifiziert werde ka (z.b. Pukte) ist die eifaktorielle Variazaalyse awedbar.

Die Variazaalyse ist zum feste Bestadteil der multivariate Statistik geworde ud keiesfalls auf die Auswertug vo Experimete beschräkt. I de Wirtschaftswisseschafte wird die Variazaalyse auch auf Beobachtugsdate agewedet. Auf die hierbei auftretede Auswertugsprobleme werde wird eizugehe habe. Beispiel: Im Marketig wird der Absatz eies Produkts (quatitative abhägige Variable) i Abhägigkeit vo verschiedee Werbeträger wie z.b. Pritmedie, Plakate, TV-Spots ud Iteret utersucht. Die Werbträger sid hier der Faktor (=qualitative uabhägige Variable), desse Auspräguge hier aus 4 Stufe (Pritmedie, Plakate, TV-Spots, Iteret) besteht. Es hadelt sich um eie eifaktorielle Variazaalyse. Mit der Variazaalyse (ANOVA) wird also die Abhägigkeit eier quatitative Variable vo eier oder mehrere qualitative Variable utersucht. Aufgrud der Merkmalsauspräguge der qualitative Variable lasse sich die Utersuchugsobekte i Gruppe eiteile. Mit Hilfe der Variazaalyse ka da geprüft werde, ob zwische de Gruppe sigifikate Uterschiede bestehe. Wir behadel hier die eifaktorielle ud zweifaktorielle Variazaalyse: Variazaalyse (ANOVA Eifaktorielle Variazaalyse Eifluss eies Faktors (=qualitative uabh. Variable) auf eie quatitative abh. Variable Zweifaktorielle Variazaalyse Eifluss vo zwei Faktore (=qualitative uabh. Variable) auf eie quatitative abh. Variable ohe Iteraktio mit Iteraktio

3 3. Eifaktorielle Variazaalyse I der eifaktorielle Variazaalyse wird die Abhägigkeit eier metrisch skalierte Variable vo eier omialskalierte Eiflussgröße, die auch als Faktor bezeichet wird, utersucht. Wir bezeiche dabei de Faktor mit A ud die abhägige Variable mit Y: Faktor A (qualitative uabh. Variable) Abhägige Variable Y (quatitativ) Modell der eifaktorielle Variazaalyse Es wird eie Stichprobe vo N statistische Eiheite aus eier Grudgesamtheit gezoge, die sich aufgrud der Stufe des Faktors A (p Stufe) i p Gruppe eiteile lasse. Bei de Utersuchugseiheite wird eweils der Wert der abhägige Variable, y i, ermittelt: Wert der abhägige Variable y i mit Doppelidex: -. Idex: i-te Utersuchugseiheit, i=,,,, -. Idex: -te Gruppe (Faktorstufe A ),,,,p. Das Modell der ifaktorielle Variazaalyse geht davo aus, dass sich der Beobachtugswert y i systematisch aus dem Gesamtmittelwert der Grudgesamtheit, µ, ud dem Effekt des Faktors A, α, ergibt. Alle adere Eiflussgröße, die icht weiter betrachtet werde, schlage sich i eier Restgröße (Störgröße) ε i ieder, die als ormalverteilt ageomme wird: y = µ + α + ε (3..) i i Die Mittelwerte der p Stufe des Faktors A, µ, i der Grudgesamtheit siddurch (3..) µ = µ + α, =,, K, p gegebe. Die Größe α gibt damit de Effekt des Faktors i Form eier Veräderug des Gesamtmitels µ wieder. Getestet wird i der eifaktorielle Variazaalyse die Nullhypothese (3..3) H 0 : µ µ = = µ p = K, die uterstellt, dass die Mittelwerte der abhägige Variable Y i alle Stufe des Faktors A gleich sid. Der Faktor A übt ur da eie Eifluss auf die ab-

4 hägige Variable Y aus, we sich midestes zwei Stufemittelwerte voeiader uterscheide (=Alterativhypothese H ). Uterschiedliche Wirkuge der Stufe des Faktors A auf die abhägige Variable Y werde i der eifaktorielle Variazaalyse durch eie Vergleich der berechete Mittelwerte der p Stufe des Faktors A, y, y,..., y p, mit y = y (3..4) i i= beurteilt. Der Gesamtmittelwert yder Stichprobe lautet (3..5) = p y yi. i= Die Größe gibt dabei die Azahl der Utersuchugseiheite i der -te Gruppe a. Die Besetzugszahle der eizele Gruppe,, summiere sich isgesamt zu N: p = N.

5 Beispiel: Ei Uterehme stellt Teile für PKWs mit vier verschiedee Produktiosverfahre A, A, A3 ud A4 her. 48 Arbeiter werde auf die vier Produktiosverfahre gleichmäßig aufgeteilt, so dass 4 Gruppe á 6 Arbeiter etstehe. Am Ede eier Schicht wird bei edem Arbeiter die Azahl der hergestellte Teile ermittelt. Das Uterehme möchte herausfide, ob die Produktiosmethode uterschiedlich produktiv sid. Produktiosmethode Output e Schicht (Werte der abhägige Variable Y) (Faktor A) 69 77 6 67 65 69 79 83 6 64 7 78 3 80 78 74 76 80 84 4 75 67 70 6 70 76 Produktiosmethode (Faktor A): 4 Verfahre (Faktorstufe) Faktorstufe A (Gruppe ): = 6 Faktorstufe A (Gruppe ): = 6 Faktorstufe A3 (Gruppe 3): 3 = 6 Faktorstufe A4 (Gruppe 4): 4 = 6 4 = = + + 3 + 4 = 4 Azahl der Teile für PKWs (abhägige Variable) Gruppemittelwerte: 6 y = y i 69 77 6 67 65 69 408 6 = + + + + + = = i= 6 6 ( ) 68 6 y = y i 6 = = i= 6 6 ( 79 + 83 + 6 + 64 + 7 + 78) = 438 73 6 y 3 = y i 6 3 = = i= 6 6 ( 80 + 78 + 74 + 76 + 80 + 74) = 46 77 6 y 4 = y i 6 4 = = i= 6 6 ( 75 + 67 + 70 + 6 + 70 + 76) = 40 70

6 Der Gesamtmittelwert beträgt p y = yi 4 i= = (69 4 + 77 +... + 76 = 78 4 = 7 Ma erhält die hier berechete Mittelwerte ebefalls mit SPSS durch Wahl der Meüpukte Mittelwerte vergleiche Mittelwerte Bericht Produktiosergebis e Arbeitsschicht Produktiosmethode 3 4 Isgesamt Stadardab Mittelwert N weichug 68.00 6 5.39 73.00 6 8.53 77.00 6.757 70.00 6 5.77 7.00 4 6.440 Nach (3..) sid die Effekte des Faktors A, α, im variazaalytische Modell durch vo ihm hervorgerufee Veräderuge gegeüber dem Gesamtmittel gegebe: α = µ µ. Gemesse werde die Faktoreffekte durch die Mittelwertdiffereze i der Stichprobe: y y. So sid mit Produktiosverfahres A im Vergleich zum Gesamtdurchschitt im Mittel 4 Teile weiger hergestellt:worde: y y = 68 7 = 4 Mit de Produktiosverfahre A ud A 3 sid dagege überdurchschittlich viele Teile hergestellt worde, währed die Azahl der mit dem Produktiosverfahre A 4 produzierte Teile uter dem Durchschitt liegt: y y = 73 7 = y 3 y = 77 7 = 5 y 4 y = 70 7 =

7 Betrachte wir u das variazaalytische Modell ((3..) für de erste Arbeiter, der i der Schicht eie Produktiosleistug vo y = 69 erzielt hat. Subtrahiert ma hiervo die im Durchschitt zu erwartede Produktiosleistug y = 7 ud de Effekt des Faktors A, y y = 4, da erhält ma eie Restgröße (ε ) vo y y ( y y) = 69 7 ( 4) =. Faktor A Faktor A Das bedeutet, dass produziertes Teil des erste Arbeiters der Gruppe uerklärt bleibt. Ohe Berücksichtigug des spezielle Produktiosverfahres ist vo eiem Arbeiter eie Durchschittsleistug vo 7 produzierte Teile zu erwarte. Mit dem Produktiosverfahre A erzielt ma im Mittel edoch ei um 4 Eiheite gerigeres Produktiosergebis. Da der erste Arbeiter mit dem Produktiosverfahre A arbeitet, liegt seie erwartete Produktiosleistug bei 7-4=68. Tatsächlich hat er aber i der Schicht 69 Teile hergestellt. Die Mehrproduktio vo Teil, die icht durch das Produktiosverfahre A erklärt werde ka, ist ei Restwert, der icht i dem variazaalytische Modell berücksichtigte Eiflussgröße zuzuschreibe ist.

8 Das mit SPSS erstellte horizotale Balkediagramm gibt die vo dem eweilige Produktiosverfahre ermittelte Outputgröße e Schicht aschaulich wieder [Grafike Balke Eifach Kategorieachse: Produktiosmethode, Adere Auswertugsfuktio: MEAN(Produktiosmethode) rechte Maustaste aklicke Obekt: SPSS-Diagramm Öffe Diagramm Diagramm traspoiere]: 4 Produktiosmethode 3 0 0 40 60 Mittelwert Produktiosergebis e Arbeitsschicht 80 Die berechete Gruppemittelwertey spiegel zwar de Effekt des Faktors A wieder. Da sie aber aus de beobachtete Werte des Produktiosergebisses e Arbeitsschicht, y i, berechet worde sid, schlage sich hieri ebefalls die Effekte aller verachlässigte Eiflussgrößte ieder, die durch die Restgröße (Stögröße) ε i erfasst werde. Es stellt sich daher die Frage, ob sich die Mittelwerte der Faktorstufe, y, tatsächlich substaziell uterscheide oder ob die Uterschiede als zufallsbedigt ageomme werde köe. Substazielle Uterschiede, d.h. sigifikate Uterschiede, werde i der Statistik mit Hilfe vo Tests aufgedeckt. Auf der Grudlage des Modells der Variazaalyse ist daher zu teste, ob die Uterschiede der Gruppemittelwerte sigifikat sid. Nur i diesem Fall ka auf eie uterschiedliche Produktivität der Produktiosverfahre geschlosse werde.

9 Streuugszerlegug, mittlere Abweichugsquadratsumme ud Prüfgröße Bei dem Test auf Gleichheit der Gruppemittelwert im Modell der eifaktorielle Variazaalyse wird die Gesamtstreuug der Beobachtugswerte der abhägige Variable i zwei Kompoete aufgespalte. Geauer lässt sich die Gesamtstreuug, d.h. die Summe der quadrierte Abweichuge vo ihrem Gesamtmittel (Q T ), aus eier - Abweichugsquadratsumme, die die Streuug zwische de Gruppe wiedergibt (durch Faktor A bedigte Streuug Q A ), - ud eier Abweichugsquadratsumme, die die Streuug ierhalb der Gruppe erfasst (Reststreuug Q R ), zusammesetze: Streuugszerlegug: Gesamtstreuug (Q T ) = Streuug zwische de Gruppe (Q A ) + Streuug ierhalb der Gruppe (Q R ) Totale (gesamte) Abweichugsquadratsumme: i i= 4444 3 Q p p p (3..6) Q = ( y y) = ( y y) + ( y y ) T i= Streuug zwische de Gruppe: Q p = (3..7) ( ) A i y y i= 44 443 Q Weiche die Gruppemittelwerte y stark voeiader ab, sid ihre Abweichuge vom Gesamtmittelwert y ebefalls groß Streuug ierhalb der Gruppe (=Reststreuug): = p R i= (3..8) Q ( y y ) i A R

0 Sofer die Streuug zwische de Gruppe uter Berücksichtigug der Freiheitsgrade sigifikat größer ist als die Streuug ierhalb der Gruppe, muss die Nullhypothese eier Mittelwertgleichheit abgeleht werde. Die Streuug zwische de Gruppe, die durch die Mittelwertuterschiede hervorgerufe wird, lässt sich da icht mehr als Zufallsstreuug auffasse. Der Faktor A lässt sich da für die Gruppeuterschiede veratwortlich mache. Dividiert ma die eweilige Abweichugsquadratsumme durch die dazugehörige Freiheitsgrade [degrees of freedom (df)], da erhält ma so geate mittlere Abweichugsquadratsumme MQ. Die Azahl der Freiheitsgrade gibt a, wie viele Messwerte bei der Berechug der Abweichugsquadratsumme tatsächlich frei variiere köe. Bei der Gesamtabweichugsquadratsumme geht ei Freiheitsgrad dadurch verlore, dass mit N y-werte ud dem Gesamtmittelwert die Abweichug des -te y-wertes vo y, y N - y, berechet werde ka. Es sid also ur N y-werte frei variierbar, so dass die totale mittlere Abweichugsquadratsumme durch Q p (3..9) = T MQ = ( y y) T N N i= gegebe ist. Etspreched geht bei p Gruppemittelwerte ei Freiheitsgrad durch die Verwedug des Gesamtmittelwerts y verlore. Als mittlere Abweichugsquadratsumme zwische de Gruppe erhält ma damit: Q p (3..0) = A MQ = ( y y) A p p i= Die mittlere Abweichugsquadratsumme ierhalb der Gruppe (Residualabweichugsquadratsumme) besitzt bei y-werte ud p Gruppemittelwerte -p Freiheitsgrade: i.. Q p (3..) = R MQ = ( y y ) R N p N p i= i.

Die Prüfgröße des Tests auf Gleichheit der Gruppemittelwerte ermittelt ma als Quotiete zwische der mittlere Abweichugsquadratsumme zwische de Gruppe (MQ A ) ud der mittlere Abweichugsquadratsumme ierhalb der Gruppe (Residualabweichugsquadratsumme) (MQ R ): (3..) p ( y y) MQ = = = A p i F =. MQ p R ( yi y ) N p i= Uter Gültigkeit der Nullhypothese ist davo auszugehe, dass die Gruppemittelwerte i der Stichprobe gerig voeiader abweiche. Da ist auch die Differez zwische de Gruppemittelwerte y ud de Gesamtmittelwert y klei. Der Zähler i (3..) würde da eie iedrige Wert aehme, was da, da der Neer als Schätzer für die Streuug (σ²) der Grudgesamtheit betrachtet wird, auch für de Wert der Prüfgröße F selbst gelte würde. Die folgede ANOVA-Tabelle gibt die Quelle der Streuug übersichtlich wieder: Quelle Abweichugsquadratsumme Freiheitsgrade = p Q T i= i N p QA = y y p = p Q R yi y i= N p isgesamt ( y y) Faktor A ( ) Rest (icht erklärt) ( ) Mittlere Abweichugsquadratsumme MQT MQ A Q = T N Q = A p Q MQ R R = N p

Beispiel: I dem Beispiel des Produktiosergebisses pro Schicht i Abhägigkeit vo dem Produktiosverfahre hatte wir eie Gesamtmittelwert vo y = 7 ud die Gruppemittelwerte y = 68, mit = y = 3 = 73, = 4 = 6 y3 = 77, y4 = 70 berechet. Die Abweichugsquadratsumme Q T ud Q R lasse sich aus eier Arbeitstabelle bereche: Prod.- verf. A A A3 A4 i y i. y ( y y) ( y ) i i y 69 68 9 77 68 5 8 3 6 68 49 4 67 68 5 5 65 68 49 9 6 69 68 9 79 73 49 36 83 73 00 3 6 73 00 4 64 73 64 8 5 7 73 0 6 78 73 36 5 3 80 77 64 9 3 78 77 36 3 3 74 77 4 9 4 3 76 77 6 5 3 80 77 64 9 6 3 74 77 4 9 4 75 70 9 5 4 67 70 5 9 3 4 70 70 4 0 4 4 6 70 00 64 5 4 70 70 4 0 6 4 76 70 6 36 Summe - - Q T = 954 Q R = 678

3 Die Abweichugsquadratsumme Q A erhält ma durch Awedug der Formel (3..7): Q 4 A = = 6 ( y y) ( 68 7) + 6 ( 73 7) + 6 ( 77 7) + 6 ( = 6 6 + 6 + 6 5 + 6 4 = 96 + 6 + 50 + 4 = 76 70 7 Wege Q T = Q A + Q R würde es aber auch ausreiche, ur Q T ud Q A direkt zu bereche. Die Restabweichugsquadratsumme ergibt sich da aus Q R = Q T Q A = 954 76 = 678. Für die mittlere Abweichugsquadratsumme erhält ma Q 954 954 MQ T T = = = = 4,478 N - N 4 Q 76 76 MQ A A = = = = 9 p - p 4 Q Q 678 678 MQ R R R = = = = = 33,9, N - p N p 4 4 0 so dass die Prüfgröße F de Wert F = ( p ) ( N p) QA MQ 9 = A = =,74. QR MQR 33,9 aimmt. ).

4 Mit SPSS erhalte wir dieselbe Ergebisse mit der Meüwahl Aalysiere Mittelwerte vergleiche Eifaktorielle ANOVA : Produktiosergebis e Arbeitsschicht Zwische de Gruppe Ierhalb der Gruppe Gesamt ONEWAY ANOVA Quadrats Mittel der umme df Quadrate F Sigifikaz 76.000 3 9.000.74.07 678.000 0 33.900 954.000 3 Die letzte Spalte der SPSS-Tabelle ONEWAY ANOVA bezieht sich auf die Sigifikaz der Prüfgröße, auf die wir etzt och eizugehe habe.

5 Verteilug der Prüfgröße ud kritischer Wert Uter der Aahme der Normalverteilug stellt sich die Prüfgröße F dar als Quotiet vo zweier χ -verteilter Zufallsvariable (χ : Chi-Quadrat) mit p- ud N-p Freiheitsgrade. Die Teststatistik F folgt daher eier F-Verteilug mit p- ud N-p Freiheitsgrade: F ~ F p ;N p Der F-Test auf Gleichheit der Gruppemittelwerte prüft, ob die Streuug der Gruppemittelwerte bei Berücksichtigug der Freiheitsgrade, MQ A, sigifikat größer ist als die Reststreuug MQ R. Da die Reststreuug eie zufallbedigte Streuug ist, ka bei gleicher Größeordug kei substazieller Eifluss des Faktors A gefolgert werde. Erst we die durch MQ A gemessee Streuug der Gruppemittelwerte sigifikat größer als die mittlere Reststreuug MQ R ist, ist für de Faktor A ei Effekt achgewiese, der über eie zufällige Eifluss hiausgeht. Als Verhältis vo Abweichugsquadrate ist der empirische F-Wert stets positiv ud der F-Test ei eiseitiger Test (rechtsseitiger Test). Die Nullhypothese gleicher Gruppemittelwerte wird verworfe, we der Wert der Prüfgröße (empirischer F-Wert) F bei eiem Sigifikaziveau vo α das (-α)-quatil der F-Verteilug mit p- ud N-p Freiheitsgrade übersteigt: F > F p-;n-p;-α Nullhypothese ablehe. f( F) α 0 Fp ;N p; α F Aahmebereich Ablehugsbereich

6 Beispiel: I userem Beispiel der eifaktorielle Variazaalyse gebe wir ei Sigifikaziveau vo 5% vor. Der kritische F-Wert ist eier F-Verteilugstabelle zu etehme, aus der ute ei Ausschitt agebe ist. Zu diesem Sigifikaziveau lese wir für eie Freiheitsgradzahl des Zählers (v ) vo p-=4- =3 ud eier Freiheitsgradzahl des Neers (v ) vo N-p=4-4=0 de kritische Wert ab. F 3;0;0,95 = 3,0 Quatile der F-Verteilug v F(x) v 3 4 M M M M M M 0,95 4,35 3,49 3,0,87 0 0,99 8,0 5,85 4,94 4,43 0,95 4,7 3,3,9,69 30 0,99 7,56 5,39 4,5 4,0 0,95 4,08 3,3,84,6 40 0,99 7,3 5,8 4,3 3,83 0,95 4,03 3,8,79,56 50 0,99 7,7 5,06 4,0 3,7 0,95 4,00 3,5,76,53 60 0,99 7,08 4,98 4,3 3,65 M M M M M M M Da der empirische F-Wert vo,74 kleier als der kritische Wert vo 3,0 ist, lässt sicht die Nullhypothese gleicher Gruppemittelwerte auf eiem Sigifikaziveau vo 5% icht abgelehe: F =,74 < F3 ;0;0, 95 = 3,0 Beibehaltug der Nullhypothese. Das bedeutet, dass die Uterschiede der mit de verschiedee Produktiosverfahre durchschittlich produzierte Teile icht auf substazielle Produktivitätsuterschiede der Produktiosverfahre zurückgeführt werde köe. Vielmehr liege die Uterschiede och im Bereich der Zufallsabweichuge, die durch de Stichprobefehler bedigt sid. Die i der Stichprobe ermittelte Produktivitätsuterschiede der Produktiosverfahre sid damit icht statistisch gesichert. [Amerkug: Ma beachte, dass hier ei relativ kleier Stichprobeumfag vorliegt, bei dem der Stichprobefehler größer ist als bei große Stichprobeum-

7 fäge. Bei große Stichprobe lasse sich sigifikate Uterschiede daher erheblich leichter achweise. ] I der Grafik fällt der empirische F-Wert i de Aahmebereich, da er liksseitig des kritische Werts F 3;0;0,95 = 3,0 liegt. Aus diesem Grud wird die Nullhypothese eier Gleichheit der Gruppemittelwerte beibehalte. Würde er dagege i de Ablehbereich H0,05 = (F3;0;0,95 = 3,0; ) falle, der rechtsseitig des kritische Wertes F 3;0;0,95 = 3,0 liegt, müsste die Nullhypothese verworfe werde. I diesem Fall würde ma die gemessee verfahresbedigte Uterschiede der Produktiosleistug e Schicht icht mehr als Zufallsabweichuge iterpretiere köe. Im Vergleich zu dem Stichprobefehler wäre die Uterschiede der Gruppemittelwerte so groß, dass ma sie auf substa- fhfl zielle Produktivitätsuterschiede der Produktiosverfahre zurückführe würde. 0.8 0.7 0.6 0.5 0.4 0.3 0. 0. α=0,05 3 4 Aahmebereich emp F =,74 F 3;0;0,95 = 3,0 Ablehugsbereich F

8 Sigifikaztest ud p-wert SPSS weist i der Tabelle ONEWAY ANOVA uter Sigifikaz de Wert.07 aus. Dieser Wert wird auch als p-wert bezeichet. Er gibt die Überschreitugswahrscheilichkeit des empirische F-Wertes vo,74 a. Währed α das vorgegebee Sigifikaziveau (omiales Sigifikaziveau) ist, gibt der p-wert das tatsächliche Sigifikaziveau, d.h. die tatsächliche Irrtumswahrscheilichkeit, des Tests a. Isofer gibt der p-wert mehr Iformatioe wieder als der Vergleich zwische dem empirische F-Wert ud dem kritische Wert. Da ma zur Berechug des p-wertes mauell aber sehr aufwedig ist, wird er im Allgemeie ur i eier computergestützte Dateaalyse ausgewiese. Uter Verwedug des p-wertes lautet die Testetscheidug: p < α Nullhypothese ablehe p α Nullhypothese beibehalte.

9 Beispiel: I userem Beispiel liegt ei icht-sigifikates Testergebis. Durch eie Vergleich des empirische F-Wertes vo,74 mit dem kritische Wert vo 3,0 habe wir die Testetscheidug F =,74 < F 3;0;0,95 = 3,0 Nullhypothese beibehalte. gefällt. SPSS weist demgegeüber de p-wert vo 0,07 aus. Vergleicht ma diese p-wert mit dem vorgegebee Sigifikaziveau, kommt ma zur selbe Testetscheidug: p = 0,07 > α = 0,05 Nullhypothese beibehalte. Die Aalogie fhfl des Vergleichs der F-Werte ud der Wahrscheilichkeite geht aus der ute stehede Grafik hervor. 0.8 0.7 0.6 0.5 0.4 0.3 0. 0. p = 0, 07 α= 0,05 3 4 emp F =,74 F 3;0;0,95 = 3,0 F

0 Exkurs: Chi-Quadrat-Verteilug ud F-Verteilug Chi-Quadrat-Verteilug Es seie Z, Z, K, Z, Xi µ Zi =, σ uabhägige, stadardormalverteilte Zufallsvariable. Da besitzt die Quadratsumme f ( χ ) (*) χ = Z + Z + K + Z = i= Z i χ eie -Verteilug mit Freiheitsgrade. Hierbei lässt sich die Quadratsumme auch i der Form ( ) = Xi µ Xi µ χ = i= i= σ σ darstelle. Wird µ durch de Stichprobemittelwert geschätzt, da ist die Quadratsumme ( X i X ) i= χ = σ χ mit Freiheitsgrade. Allgemei ist eie Quadratsumme der Form (*) χ - verteilt mit k Freiheitsgrade, we hier i k Parameter aus der Stichprobe zu schätze sid. F-Verteilug Es seie χ ud χ zwei uabhägige -verteilte Zufallsvariable mit v v v ud v Freiheitsgrade. Da ist das Verhältis χ χ

χ v F = χ v F-verteilt mit v ud v Freiheitsgrade.