Einführung in die Kovarianzanalyse (ANCOVA)

Größe: px
Ab Seite anzeigen:

Download "Einführung in die Kovarianzanalyse (ANCOVA)"

Transkript

1 Arbeitsunterlage Einführung in die Kovarianzanalyse (ANCOVA) ARGE-Bildungsforschung

2 2 Einführung in die Kovarianzanalyse (ANCOVA) 1 Die Varianzanalyse ist ein Verfahren, das die Wirkung einer (oder mehrerer) unabhängiger Variable auf eine (oder mehrere) abhängige Variable untersucht. Für die unabhängige Variable wird dabei lediglich Nominalskalierung verlangt, während die abhängige Variable metrisches Skalenniveau aufweisen muss. Die Varianzanalyse ist das wichtigste Analyseverfahren zur Auswertung von Experimenten. Typische Anwendungsbeispiele sind: - Verbessern Brain-Gym-Übungen aus dem Programm der Edu-Kinestetik die Konzentrationsfähigkeit von Volksschülern? - Unterscheiden sich die Englischleistungen von Buben und Mädchen in Stadthauptschulen, Landhauptschulen und Gymnasien? - Haben attraktive Zusatzangebote von Schulen einen Einfluss auf das von Schülern wahrgenommene Sozialklima, die Schulleistungen, sowie die Elternzufriedenheit? Gemeinsam ist allen Beispielen, dass ihnen eine Vermutung über die Wirkungsrichtung der Variablen zugrunde liegt. Wie in der Regressionsanalyse, die einen Erklärungszusammenhang der Art Y = f(x 1, X 2,, X J ) über metrische Variable herstellt, formuliert auch die Varianzanalyse einen solchen Zusammenhang, allein mit dem Unterschied, dass die Variablen X 1, X 2,, X J nominal skaliert sein dürfen. Die Beispiele verdeutlichen dies. So nimmt man im ersten Beispiel an, dass ein bestimmtes Treatment als unabhängige Variable mit den beiden Ausprägungen Übungsprogramm und kein Übungsprogramm einen Einfluss auf die Konzentrationsfähigkeit hat. Die Ausprägungen der unabhängigen Variablen beschreiben dabei stets alternativ Zustände. Demgegenüber ist die abhängige Variable, hier die Konzentrationsfähigkeit metrisch skaliert. Gemeinsam ist weiterhin allen Anwendungsbeispielen, dass sie experimentelle Situationen beschreiben: Feldexperimente im zweiten und dritten Beispiel, ein Laborexperiment im ersten Beispiel. Die Varianzanalyse ist das klassische Verfahren zur Analyse von Experimenten mit Variablen des bezeichneten Skalenniveaus. Die genannten Beispiele unterscheiden sich durch die Zahl der Variablen. So wird im ersten Beispiel die Wirkung einer unabhängigen Variablen (Treatment) auf eine abhängige Variable (Konzentrationsfähigkeit) untersucht. Im zweiten Beispiel wird demgegenüber die Wirkung von zwei unabhängigen Variablen (Schulart und Geschlecht) auf eine abhängige Variable (Englischleistungen) analysiert. Im dritten Beispiel gilt das Interesse ausschließlich der Wirkung einer unabhängigen Variablen (attraktive Zusatzangebote) auf drei abhängige Variablen (Sozialklima, Schulleistungen, Elternzufriedenheit). Die unabhängigen Variablen werden als Faktoren bezeichnet, die einzelnen Ausprägungen als Faktorstufen. Die Typen der Varianzanalyse lassen sich nach der Zahl der Faktoren differenzieren. Wenn eine abhängige Variable und eine unabhängige gegeben sind, spricht man von einfaktorieller, entsprechend bei zwei unabhängigen von zweifaktorieller Varianzanalyse usw. Bei mehr als einer abhängigen Variablen spricht man von mehrdimensionaler (multivariater) Varianzanalyse. 1 Textteile entnommen aus: BACKHAUS, Klaus, ERICHSON, Bernd, PLINKE, Wulff, WEIBER, Rolf (2008): Multivariate Analysemethoden. Eine anwendungsorientierte Einführung (12., vollst. überarb. Auflage). Berlin: Springer, S

3 3 Exemplarisches Beispiel Problem Der Leiter einer Supermarktkette will die Wirkung verschiedener Arten der Warenplatzierung überprüfen. Er wählt dazu Margarine in der Becherverpackung aus, wobei ihm drei Möglichkeiten der Regalplatzierung offen stehen: - Platzierung im Normalregal der Frischwarenabteilung - Platzierung im Normalregal der Frischwarenabteilung und Zweitplatzierung im Fleischmarkt - Platzierung im Kühlregal der Frischwarenabteilung Anschließend wird folgendes experimentelle Design entworfen: Aus den insgesamt vorhandenen Supermärkten werden drei weitgehend vergleichbare Supermärkte des Unternehmens ausgewählt, die sich durch unterschiedliche Präsentation von Margarine unterscheiden. In einem Zeitraum von 5 Tagen wird in jedem der drei Supermärkte jeweils eine Form der Margarine-Präsentation durchgeführt. Die Auswirkungen der Maßnahmen werden jeweils in der Größe kg Margarineabsatz pro Kassenvorgänge erfasst. Die folgende Tabelle zeigt die Ergebnisse der Datenerhebung: Platzierung in 3 Supermärkten Montag Dienstag Mittwoch Donnerstag Freitag Normalregal Zweitplatzierung Kühlregal Aufgabe 1 1. Definieren Sie für das o.a. Problem eine passende Datenmatrix in SPSS. 2. Tragen Sie die Daten der Tabelle ein. 3. Berechnen Sie die Mittelwerte (gesamt und getrennt nach Platzierung). Lösung Sie erhalten drei Teilstichproben mit jeweils genau fünf Beobachtungswerten; die Teilstichproben haben also den gleichen Umfang. Es fällt ins Auge, dass die drei Supermärkte unterschiedliche Erfolge im Margarineabsatz aufweisen. Die Mittelwerte zeigt folgende Tabelle: Platzierung der Margarine Mittelwert der Absatzmenge Normalregal 43,40 Zweitplatzierung 64,40 Kühlregal 52,20 Gesamt 53,33 Der Leiter des Unternehmens will nun wissen, ob die unterschiedlichen Absatzergebnisse in den drei Supermärkten auf die Variation der Warenplatzierung zurückzuführen sind. Nehmen wir zur Vereinfachung an, dass keine Einflussgrößen von außen (d. h. außerhalb der experimentellen Anordnung, wie z. B. Preiseinflüsse, Konkurrenzeinflüsse, Standorteinflüsse) das Ergebnis mitbestimmt haben. Dann dürften, wenn kein Einfluss der Art der Warenplatzierung auf den Absatz bestünde, auch keine größeren Unterschiede zwischen den Mittelwerten der

4 4 drei Supermärkte auftreten. Umgekehrt kann bei Vorliegen von Mittelwertunterschieden auf das Wirksamwerden der unterschiedlichen Warenplatzierung geschlossen werden. Platzierung in 3 Supermärkten Montag Dienstag Mittwoch Donnerstag Freitag Mittelwert Normalregal ,40 Zweitplatzierung ,40 Kühlregal ,20 Streuung der Beobachtungswerte Nun zeigen die einzelnen Beobachtungswerte, dass sie deutlich um den Mittelwert je Supermarkt streuen. Diese Streuung ist allein auf andere absatzwirksame Einflussgrößen als die Warenplatzierung zurückzuführen. Absatzmenge 80 kg pro 1000 Kassenvorgänge Zweitplatzierung Kühlregal Normalregal Tag Streng genommen muss die vereinfachende Annahme keine Einflussgrößen von außen also genauer formuliert werden: Es gibt Einflüsse von außen, jedoch geht die Varianzanalyse davon aus, dass diese Einflüsse bis auf zufällige Abweichungen in allen drei Supermärkten gleich sind. Wenn nun der Frage nachgegangen wird, ob die Warenplatzierung einen signifikanten Einfluss auf den Absatz hat, dann müssen die im Modell nicht erfassten Einflüsse von den im Modell erfassten Einflüssen getrennt werden. Dies geschieht, indem gefragt wird, ob sich ein bestimmter Beobachtungswert, z. B. der Wert y 11 = 47, zufällig (d.h. nur durch nicht erfasste äußere Einflüsse erklärt) oder systematisch (d.h. durch die Warenplatzierung erklärt) vom Gesamtmittelwert 53,33 unterscheidet. Wenn die im Modell nicht erfassten Einflüsse sich in allen drei Supermärkten bis auf zufällige Abweichungen gleich stark auswirken, dann drückt sich in den Abweichungen der Mittelwerte je Supermarkt vom Gesamtmittelwert die untersuchte Einflussgröße Warenplatzierung aus.

5 5 Grafische Erläuterung Die obige Grafik lässt sich auch so interpretieren: Der Prognosewert für den Margarineabsatz ist y M, wenn kein Einfluss der Warenplatzierung vorhanden wäre. Nimmt man einen Einfluss der Warenplatzierung auf den Absatz an, dann ist der Prognosewert für den Margarineabsatz je nach Art der Platzierung y 1, y 2 oder y 3. Die Abweichungen vom Prognosewert sind auf zufällige äußere Einflüsse zurückzuführen und somit nicht erklärt. Die Gesamtabweichung der Mittelwerte lässt sich also in zwei Komponenten zerlegen (sog. Streuungszerlegung! Varianzanalyse): Gesamtabweichung = erklärte Abweichung + nicht erklärte Abweichung Analyse der Abweichungsquadrate (Quadrate der Abweichungen vom Mittelwert) Diese Zerlegung der Gesamtabweichung je Beobachtung lässt sich in der Varianzanalyse auf die Summe der Gesamtabweichungen aller Beobachtungen übertragen (SS = sum of squares). Gesamtabweichung = erklärte Abweichung + nicht erklärte Abweichung Summe der quadrierten Gesamtabweichungen = Summe der quadrierten Abweichungen zwischen den Faktorstufen + Summe der quadrierten Abweichungen innerhalb der Faktorstufen SS t(otal) = SS b(etween) + SS w(ithin) Die Quadratsumme der Abweichungen als Maß für die Streuung wird um so größer, je größer die Zahl der Einzelwerte ist. Um eine aussagefähigere Schätzgröße für die Streuung zu erhalten, wird die SS durch die Zahl der Einzelwerte vermindert um 1 geteilt. Somit erhält man die Varianz, die unabhängig von der Zahl der Beobachtungswerte ist. Allgemein ist die (empirische) Varianz definiert als mittlere quadratische Abweichung (MS mean sum of squares ): Varianz MS = SS Zahl der Beobachtungen 1

6 6 Freiheitsgrade Die Größe im Nenner ist die Zahl der Freiheitsgrade df (degrees of freedom). Der Wert ergibt sich aus der Zahl der Beobachtungswerte vermindert um 1, weil der Mittelwert, von dem die Abweichungen berechnet wurden, aus den Beobachtungswerten selbst errechnet wurde. Demnach lässt sich immer einer der Beobachtungswerte aus den anderen Beobachtungswerten und dem geschätzten Mittelwert errechnen, d.h. er ist nicht mehr frei. So wie die Gesamtquadratsumme in SS b und SS w aufgeteilt wurde, können auch die Freiheitsgrade aufgeteilt werden. In unserem Beispiel haben wir 3 Faktorstufen mit je 5 Beobachtungen, d.h. 15 Beobachtungen insgesamt. df t ist demnach 15 1 = 14. Da nun jede Faktorstufe 5 Beobachtungen enthält, von denen nur 5 1 frei variieren können, ergeben sich bei drei Faktorstufen 3 (5 1) Freiheitsgrade. Der Wert für df w ist demnach 12. Bei 3 vorhandenen Faktorstufenmittelwerten können nur 3 1 frei variieren. Demnach ist df b = 2. Mit Hilfe der verschiedenen Freiheitsgrade können nun die Varianzen (a) zwischen den Faktorstufen und (b) innerhalb der Faktorstufen sowie (c) die Gesamtvarianz bestimmt werden. Ausgehend von den bisher gesetzten vereinfachenden Annahmen über das Wirksamwerden von den im Modell erfassten und von den im Modell nicht erfassten Einflussgrößen kann nun gefolgert werden, dass SS b von der Warenplatzierung und SS w von den nicht erfassten Einflüssen bestimmt wird. Ein Vergleich beider Größen kann Auskunft über die Bedeutung der unabhängigen Variablen im Vergleich zu den nicht erfassten Einflüssen geben. Wenn bei gegebener Gesamtvarianz (MS t(otal) ) MS w Null wäre, dann könnte gefolgert werden, dass MS t allein durch die experimentelle Variable erklärt wird. Je größer MS w ist, desto geringer muss gemäß dem Grundprinzip der Streuungszerlegung (SS t = SS b + SS w ) der Erklärungsanteil der experimentellen Variablen sein. Je größer demnach MS b im Verhältnis zu MS w ist, desto eher ist eine Wirkung der unabhängigen Variablen anzunehmen. Aufgabe 2 1. Führen Sie im SPSS mit den Daten aus Aufgabe 1 eine Varianzanalyse durch. 2. Berechnen Sie die Effektgröße (Eta-Quadrat). 3. Interpretieren Sie die Ergebnisse. Lösung Abhängige Variable: Absatzmenge Margarine Quelle Quadratsumme vom Typ III df Mittel der Quadrate F Signifikanz Partielles Eta-Quadrat Korrigiertes Modell 1112,133 a 2 556,067 38,087,000,864 Konstanter Term 42666, , ,374,000,996 REGAL 1112, ,067 38,087,000,864 Fehler 175, ,600 Gesamt 43954, Korrigierte Gesamtvariation 1287, a. R-Quadrat =,864 (korrigiertes R-Quadrat =,841) In unserem Beispiel übersteigt MS b = 556,07 den Wert für MS w = 14,6 erheblich, so dass ein Einfluss der unabhängigen Variablen Warenplatzierung vermutet werden kann. Die ermittelten mittleren quadratischen Abweichungen zwischen den und innerhalb der Faktorstufen können also dahingehend interpretiert werden, dass ein Einfluss des Faktors Warenplatzierung vermutet werden kann. Um diese interpretierende Aussage über die Wirkung des Faktors statistisch prüfen zu können, werden MS b und MS w in folgende Beziehung gesetzt:

7 7 F emp = MS MS b w (empirischer F-Wert) = 556,067 14,6 = 38,087 Den Maßstab zur Beurteilung des empirischen F-Wertes bildet die theoretische F-Verteilung. Die F-Verteilung oder FISHER-Verteilung (nach Ronald Aylmer FISHER) ist die Wahrscheinlichkeitsverteilung einer stetigen Zufallsvariable n und ergibt sich als Quotient zweier Chi- Quadrat-verteilter Zufallsvariablen. Sie besitzt zwei unabhängige Freiheitsgrade als Parameter und bildet so selbst eine zwei-parameter-verteilungsfamilie. Als Test wird die F-Verteilung verwendet, um festzustellen, ob die Grundgesamtheiten zweier oder mehrerer Stichproben die gleiche Varianz haben (Varianzanalyse). Ausgangspunkt der Prüfung ist die Nullhypothese (H o ): Es bestehen bezüglich des Margarineabsatzes keine Unterschiede in der Wirkung durch die Art der Warenplatzierung. Die Alternativhypothese H 1 lautet: Es besteht bezüglich des Margarineabsatzes ein Unterschied in den Wirkungen alternativer Arten der Warenplatzierung. Die Prüfung erfolgt anhand eines Vergleichs des empirischen F-Wertes mit dem theoretischen F-Wert lt. Tabelle. Die Tabelle der theoretischen F-Werte zeigt für jeweilige Vertrauenswahrscheinlichkeit einen Prüfwert. Seine Höhe hängt von der Zahl der Freiheitsgrade im Zähler und von der Zahl der Freiheitsgrade im Nenner ab. Die Ermittlung des theoretischen F-Wertes in unserem Beispiel führt zu df = 2 im Zähler und df = 12 im Nenner, d.h. zu dem theoretischen Wert 6, 93 (muss in einer Tabelle nachgeschlagen werden). Empirischer und theoretischer F-Wert werden verglichen. Ist der empirische Wert größer als der theoretische, dann kann die Nullhypothese verworfen werden, d.h. es kann ein Einfluss des Faktors gefolgert werden. Theoretische F-Werte werden üblicherweise für Vertrauenswahrscheinlichkeiten von 90%, 95% und 99% in Tabellenform aufbereitet. Die materielle Bedeutung der Vertrauenswahrscheinlichkeiten ist die Erfassung der grundsätzlich verbleibenden Restunsicherheit, dass eine Wirkung der unabhängigen Variablen angenommen wird, obwohl tatsächlich der Einfluss nur zufälliger Natur ist.

8 8 Im Beispiel überschreitet der empirische F-Wert von 38,09 den theoretischen 2 von 6,93 erheblich, so dass im Rahmen der gesetzten Annahmen die Nullhypothese verworfen, d.h. (mit einer Vertrauenswahrscheinlichkeit von 99 %) der Schluss gezogen werden kann, dass die Platzierung Einfluss auf die Absatzmenge hat. SPSS gibt die Irrtumswahrscheinlichkeit (α-fehler, Fehler 1. Art) an, mit der man sich irrt, wenn man die Alternativhypothese H 1 annimmt, obwohl in der Wirklichkeit die Nullhypothese H 0 gilt. In unserem Beispiel ist die Signifikanz p < 0,001. Somit kann von einem signifikanten (bedeutsamen) statistischen Unterschied zwischen den 3 Platzierungen der Margarine hinsichtlich der Absatzmenge ausgegangen werden. Die Effektgröße wird bei der nächsten Aufgabe behandelt. Zweifaktorielle Varianzanalyse Problem Der Leiter der Supermarktkette will nicht nur wissen welchen Einfluss (1) die Warenplatzierung auf den Absatz hat, sondern auch, ob (2) die Verpackungsart den Absatz mitbestimmt. Dazu wird das Experiment erweitert. Bei drei Platzierungsarten und zwei Verpackungsarten ( Becher und Papier ) ergeben sich genau 3 x 2 experimentelle Kombinationen der Faktorstufen. Dies ist daher ein 3x2-faktorielles Design. Die notwendige Zahl von Teilstichproben im Experiment erhöht sich also auf sechs. Demnach werden sechs annähernd gleiche Supermärkte ausgesucht und wiederum wird die vereinfachende Annahme gesetzt, dass mögliche äußere Einflüsse bis auf Zufallsabweichungen jeweils einen gleich starken Einfluss auf die 6 Teilstichproben haben. Folgende Absatzmengen in kg pro Kassenvorgängen in sechs Supermärkten wurden erhoben: Platzierung Normalregal Zweitplatzierung Kühlregal Tag Verpackung Becher Papier In einer F-Werte-Tabelle würde man bei einem Signifikanzniveau von 1 % und bei 2 Freiheitsgraden im Zähler und 12 Freiheitsgraden im Nenner den theoretischen F-Wert von 6,93 ablesen können.

9 9 Aufgabe 3 1. Erweitern Sie Ihre SPSS-Datei mit den in der o.a. Tabelle stehenden Daten. 2. Suchen Sie Antworten auf die drei Fragen: (a) Hat die Warenplatzierung Einfluss auf den Absatz? Wie groß ist der Effekt? (b) Hat die Verpackung Einfluss auf den Absatz? Wie groß ist der Effekt? (c) Besteht eine Wechselwirkung zwischen Verpackung und Warenplatzierung? Wie groß ist der Effekt? Lösung Die Fragestellung der Varianzanalyse ist im faktoriellen Design gegenüber der einfachen Varianzanalyse erweitert. Zunächst werden die beiden Faktoren betrachtet. Falls für jede Kombination von Faktorausprägungen mehr als eine Beobachtung vorliegt (K > 1), erlaubt die zweifaktorielle Varianzanalyse gegenüber der einfaktoriellen zusätzlich die Erfassung des gleichzeitigen Wirksamwerdens zweier Faktoren, indem das Vorliegen von Wechselwirkungen (Interaktionen) zwischen den Faktoren getestet wird. So mag beispielsweise die Vermutung gerechtfertigt erscheinen, dass der durchschnittliche Absatz von Margarine in Becherform anders auf die Variation der Platzierung reagiert als die Papierverpackung, etwa, weil ein Weichwerden der Margarine im Normalregal eher auffällt als im Kühlregal. Eine einfache und sehr anschauliche Methode, das Vorhandensein von Interaktion zu prüfen ist ein Plot der Faktorstufenmittelwerte. Keine Interaktionen liegen vor, wenn die Verbindungslinien der Mittelwerte (die hier nur zur Verdeutlichung eingezeichnet sind) parallel laufen. Nichtparallele Verläufe sind ein klares Indiz für das Vorhandensein und die Stärke von Interaktionen. Im vorliegenden Fall bietet sich ein Anhaltspunkt für eine schwache Interaktion von Verpackung und Platzierung, da der Wirkungsunterschied zwischen Becher und Papier im Kühlregal im Analyseergebnis nahezu verschwindet, möglicherweise, weil dort von den Käufern ein Unterschied nicht wahrgenommen wird.

10 10 Analyse der Abweichungsquadrate (Quadrate der Abweichungen vom Mittelwert) Die Absatzmenge wird bestimmt vom (1) Einfluss des Faktors Platzierung, (2) Einfluss des Faktors Verpackungsart, (3) Einfluss der Interaktion zwischen den beiden Faktoren sowie (4) Zufallseffekt nicht kontrollierter Einflüsse. Die Gesamtstreuung teilt sich im zweifaktoriellen Design folgendermaßen auf: Gesamtstreuung SS t Streuung zwischen den Gruppen SS b (4) Streuung innerhalb der Gruppen SS w (1) Streuung durch Platzierung SS A (2) Streuung durch Verpackung SS B (3) Streuung durch Wechselwirkung von Platzierung und Verpackung SS AxB Berechnung mit SPSS Anzahl der Fälle je Faktorstufe: Faktoren Faktorstufen N Verpackungsart Becher 15 Papier 15 Platzierung Normalregal 10 Zweitplatzierung 10 Kühlregal 10 Abhängige Variable: Absatzmenge Quelle Quadratsumme Mittel der Partielles df F Signifikanz vom Typ III Quadrate Eta-Quadrat Korrigiertes Modell 2233,500 a 5 446,700 45,045,000,904 Konstanter Term 76507, , ,042,000,997 VERPACK 240, ,833 24,286,000,503 REGAL 1944, ,100 98,027,000,891 VERPACK * REGAL 48, ,233 2,444,108,169 Fehler 238, ,917 Gesamt 78979, Korrigierte Gesamtvariation 2471, a. R-Quadrat =,904 (korrigiertes R-Quadrat =,884) Varianzzerlegung SS t (Gesamtstreuung) = 2471,5 SS A (Streuung erklärt durch Platzierung Haupteffekt Platzierung) = 1944,2 SS B (Streuung erklärt durch Verpackung Haupteffekt Verpackung) = 240,833 SS AxB (Streuung erklärt durch Wechselwirkung Interaktionseffekt) = 48,467 SS w (Reststreuung, innerhalb der Zellen) = 238,0 SS b (Abweichungen zwischen den Gruppenmitteln und dem Gesamtmittel) = 2233,5

11 11 Die Gesamtstreuung teilt sich im konkreten zweifaktoriellen Design folgendermaßen auf: Gesamtstreuung SS t = 2471,5 Streuung zwischen den Gruppen SS b = 2233,5 Streuung innerhalb der Gruppen SS w = 238,0 Streuung durch Platzierung SS A = 1944,2 Streuung durch Verpackung SS B = 240,833 Streuung durch Wechselwirkung von Platzierung und Verpackung SS AxB = 48,467 Die empirischen Varianzen (MS = mean (sum of) squares, mittlere quadratische Abweichung) werden berechnet, indem die Streuungen durch die Zahl der Freiheitsgrade dividiert werden: 1944,2 MS Regal = = 972,1 2 Die Ermittlung des empirischen F-Wertes erfolgt durch Division der MS der betrachteten Faktoren durch die MS der Reststreuung: 972,1 F = = 98,027 9,917 Übersteigt der empirische F-Wert den theoretischen F-Wert, kann die Nullhypothese verworfen werden. SPSS gibt den p-wert der Signifikanzprüfung gleich mit aus. In unserem Fall ist für den Faktor Platzierung p < 0,001. Die Nullhypothese darf also zugunsten der Alternativhypothese verworfen werden. Antworten Hat die Warenplatzierung Einfluss auf den Absatz? Ja, die Warenplatzierung hat einen signifikanten Einfluss auf den Absatz. Der alleinige Faktor Platzierung klärt 89,1% der Absatzvarianz auf. Hat die Verpackung Einfluss auf den Absatz? Ja, die Verpackungsart hat einen signifikanten Einfluss auf den Absatz. Der alleinige Faktor Verpackungsart klärt 50,3% der Absatzvarianz auf. Besteht eine Wechselwirkung zwischen Verpackung und Warenplatzierung? Nein, es lässt sich keine signifikante Interaktion zwischen den beiden Faktoren Platzierung und Verpackungsart nachweisen (Irrtumswahrscheinlichkeit p = 10,8%). Mit dem gesamten Modell können 90,4% Varianz der abhängigen Variablen Absatzmenge aufgeklärt werden.

12 12 Kovarianzanalyse Eine Erweiterung der Varianzanalyse liegt in der Einbeziehung von Kovariaten in die Analyse ((M)ANCOVA, (Multivariate) Analysis of Covariance). Kovariaten sind metrisch skalierte unabhängige, d.h. erklärende Variablen in einem faktoriellen Design. Häufig ist dem Forscher bewusst, dass es außer den Faktoren Einflussgrößen auf die abhängige Variable gibt, deren Einbeziehung sinnvoll und notwendig sein kann. Wenn in unserem Margarine-Beispiel der Absatzpreis in den 6 Zellen der Erhebung unterschiedlich ist (z. B. aufgrund unterschiedlicher Preise je Verpackungsart oder aufgrund unterschiedlicher Preise für Zweitplatzierung), dann würde die Reststreuung nicht nur zufällige, sondern auch systematische Einflüsse enthalten. Indem der Preis als Kovariate eingeführt wird, kann ein Teil der Gesamtvarianz möglicherweise auf die Variation des Preises zurückgeführt werden, was sich bei Nichterfassung in einer erhöhten Reststreuung (SSW) ausdrücken würde. Üblicherweise geht die Varianzanalyse bei einem Untersuchungsdesign mit Kovariaten ( Kovarianzanalyse ) so vor, dass zunächst der auf die Kovariaten entfallende Varianzanteil ermittelt wird. Dieses entspricht im Prinzip einer vorgeschalteten Regressionsanalyse. Die Beobachtungswerte der abhängigen Variablen werden um den durch die Regressionsanalyse ermittelten Einfluss korrigiert und anschließend der Varianzanalyse unterzogen. Dadurch wird rechnerisch der Einfluss der Kovariaten bereinigt. Problem Der Leiter der Supermarktkette gibt keine Ruhe. Nun will er zusätzlich überprüfen, ob nicht außer den Faktoren (1) Verpackungsart und (2) Platzierung auch (3) der Verkaufspreis sowie (4) die durchschnittliche Temperatur im Supermarkt die nachgefragte Menge erklärt. Aufgabe 4 1. Erweitern Sie Ihren Datensatz mit den u.a. Beobachtungswerten. 2. Berechnen Sie den Einfluss aller Faktoren bzw. Variablen auf die Absatzmenge. 3. Interpretieren Sie die Ergebnisse. Verpackung Becher Papier Platzierung Tag Absatz Preis Temp. Absatz Preis Temp. Normalregal , , , , , , , , , ,09 20 Zweitregal , , , , , , , , , ,09 18 Kühlregal , , , , , , , , , ,13 18

13 13 Lösung Die Aufnahme der Kovariaten PREIS und TEMP in das Modell erfolgt wiederum im Dialogfeld Univariat durch Übertragen dieser Variablen in das Feld Kovariate. Durch den erneuten Aufruf der Prozedur und eine neue Analyse zeigt sich folgendes Ergebnis: Abhängige Variable: Absatzmenge Quadratsumme Mittel der Partielles Quelle vom Typ III df Quadrate F Signifikanz Eta-Quadrat Korrigiertes Modell 2247,511 a 7 321,073 31,536,000,909 Konstanter Term 8, ,815,866,362,038 PREIS 5, ,010,492,490,022 TEMP 4, ,884,480,496,021 REGAL 1207, ,941 59,319,000,844 VERPACK 82, ,605 8,113,009,269 REGAL * VERPACK 13, ,610,649,532,056 Fehler 223, ,181 Gesamt 78979, Korrigierte Gesamtvariation 2471, a. R-Quadrat =,909 (korrigiertes R-Quadrat =,881) Wiederum finden wir in der ersten Spalte der Tabelle die Zerlegung der Gesamtstreuung in die erklärte Streuung (Korrigiertes Modell) und in die Reststreuung (Fehler). Die mittleren Zeilen zeigen nunmehr in der ersten Spalte eine Aufteilung der durch die Kovariaten und durch die Faktoren erklärten Streuung (Korrigiertes Modell) in ihre jeweiligen Einzelbeiträge (PREIS, TEMP, REGAL, VERPACK, REGAL*VERPACK). Die übrigen Spalten enthalten die Freiheitsgrade (df), die empirischen F-Werte (F), das Signifikanzniveau der F-Statistik (Signifikanz) sowie die partiellen Eta 2 -Werte (Partielles Eta-Quadrat). Antwort Der SPSS-Output verdeutlicht, dass (1) die Platzierung der Margarine den größten Einfluss auf die Absatzmenge hat (84% Varianzaufklärung, höchst signifikant), (2) die Verpackungsart einen deutlichen, aber geringeren Einfluss auf die Absatzmenge hat (27% Varianzaufklärung, sehr signifikant), (3) kein signifikanter Interaktionseffekt zwischen Verpackungsart und Platzierung nachweisbar ist, (4) für eine gegebene Vertrauenswahrscheinlichkeit von 95% der Einfluss der Kovariaten (a) Preis und (b) Temperatur im Supermarkt auf die abhängige Variable Absatzmenge als nicht signifikant einzustufen ist, (5) das Modell insgesamt 91% der Varianz aufklärt und somit mit sehr gut beurteilt werden kann.

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse

Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Allgemeines Lineares Modell: Univariate Varianzanalyse und Kovarianzanalyse Univariate Varianz- und Kovarianzanlyse, Multivariate Varianzanalyse und Varianzanalyse mit Messwiederholung finden sich unter

Mehr

V A R I A N Z A N A L Y S E

V A R I A N Z A N A L Y S E V A R I A N Z A N A L Y S E Ziel / Funktion: statistische Beurteilung des Einflusses von nominal skalierten (kategorialen) Faktoren auf intervallskalierte abhängige Variablen Vorteil: die Wirkung von mehreren,

Mehr

Varianzanalyse. Seminar: Multivariate Verfahren Dr. Thomas Schäfer. Datum: 25. Mai 2010

Varianzanalyse. Seminar: Multivariate Verfahren Dr. Thomas Schäfer. Datum: 25. Mai 2010 Varianzanalyse Seminar: Multivariate Verfahren Dozent: Dr. Thomas Schäfer Referenten: Ralf Hopp, Michaela Haase, Tina Giska Datum: 25. Mai 2010 Gliederung I Theorieteil 1. Das Prinzip der Varianzanalyse

Mehr

6. METRISCHE UND KATEGORIALE MERKMALE

6. METRISCHE UND KATEGORIALE MERKMALE 6. METRISCHE UND KATEGORIALE MERKMALE wenn an einer Beobachtungseinheit eine (oder mehrere) metrische und eine (oder mehrere) kategoriale Variable(n) erhoben wurden Beispiel: Haushaltsarbeit von Teenagern

Mehr

Kapitel 7: Varianzanalyse mit Messwiederholung

Kapitel 7: Varianzanalyse mit Messwiederholung Kapitel 7: Varianzanalyse mit Messwiederholung Durchführung einer einfaktoriellen Varianzanalyse mit Messwiederholung 1 Durchführung einer zweifaktoriellen Varianzanalyse mit Messwiederholung auf einem

Mehr

8. Methoden der klassischen multivariaten Statistik

8. Methoden der klassischen multivariaten Statistik 8. Methoden der klassischen multivariaten Statistik 8.1. Darstellung von Daten Voraussetzungen auch in diesem Kapitel: Grundgesamtheit (Datenraum) Ω von Objekten (Fällen, Instanzen), denen J-Tupel von

Mehr

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1

Inhaltsverzeichnis. Regressionsanalyse. http://mesosworld.ch - Stand vom: 20.1.2010 1 Inhaltsverzeichnis Regressionsanalyse... 2 Lernhinweise... 2 Einführung... 2 Theorie (1-8)... 2 1. Allgemeine Beziehungen... 3 2. 'Best Fit'... 3 3. 'Ordinary Least Squares'... 4 4. Formel der Regressionskoeffizienten...

Mehr

Varianzanalyse * (1) Varianzanalyse (2)

Varianzanalyse * (1) Varianzanalyse (2) Varianzanalyse * (1) Einfaktorielle Varianzanalyse (I) Die Varianzanalyse (ANOVA = ANalysis Of VAriance) wird benutzt, um Unterschiede zwischen Mittelwerten von drei oder mehr Stichproben auf Signifikanz

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen

Tabelle 6a: Deskriptive Statistiken der metrischen Variablen Ergebnisse 77 5 Ergebnisse Das folgende Kapitel widmet sich der statistischen Auswertung der Daten zur Ü- berprüfung der Hypothesen. Die hier verwendeten Daten wurden mit den in 4.3 beschriebenen Instrumenten

Mehr

Varianzananalyse. How to do

Varianzananalyse. How to do Varianzananalyse How to do Die folgende Zusammenfassung zeigt beispielhaft, wie eine Varianzanalyse mit SPSS durchgeführt wird und wie die Ergebnisse in einem Empra-Bericht oder in einer Bachelor- oder

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

Übungsserie Nr. 10 mit Lösungen

Übungsserie Nr. 10 mit Lösungen Übungsserie Nr. 10 mit Lösungen 1 Ein Untersuchungsdesign sieht einen multivariaten Vergleich einer Stichprobe von Frauen mit einer Stichprobe von Männern hinsichtlich der Merkmale X1, X2 und X3 vor (Codierung:

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav

Beispiel für eine multivariate Varianzanalyse (MANOVA) Daten: POKIV_Terror_V12.sav Beispiel für eine multivariate Varianzanalyse () Daten: POKIV_Terror_V12.sav Es soll überprüft werden, inwieweit das ATB-Syndrom (Angst vor mit den drei Subskalen affektive Angst von, Terrorpersistenz,

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression

Institut für Soziologie. Methoden 2. Regressionsanalyse I: Einfache lineare Regression Institut für Soziologie Methoden 2 Regressionsanalyse I: Einfache lineare Regression Programm Anwendungsbereich Vorgehensweise Interpretation Annahmen Zusammenfassung Übungsaufgabe Literatur # 2 Anwendungsbereich

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Multivariate Statistik mit Mathematica und SPSS

Multivariate Statistik mit Mathematica und SPSS Multivariate Statistik mit Mathematica und SPSS von Dipl.-Math. Marco Schuchmann Dipl.-Math. Werner Sanns Seite 2 Varianzanalyse Die Informationen in diesem Buch entstammen langjähriger Erfahrung in Praxis

Mehr

2. Korrelation, lineare Regression und multiple Regression

2. Korrelation, lineare Regression und multiple Regression multiple 2.2 Lineare 2.2 Lineare 1 / 130 2.2 Lineare 2 / 130 2.1 Beispiel: Arbeitsmotivation Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern 25 Personen werden durch Arbeitsplatz zufällig

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik

Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik Ludwig Fahrmeir, Nora Fenske Institut für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit dem Wahlfach Statistik 29. März 21 Hinweise:

Mehr

Varianzanalyse. Einleitung - 1 -

Varianzanalyse. Einleitung - 1 - - 1 - Varianzanalyse Einleitung Die Varianzanalyse ist ein sehr allgemein einsetzbares multivariates Analyseverfahren, mit dessen Hilfe Meßwerte einer abhängigen Variablen Y, die in der Regel von mehreren

Mehr

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen

Univariate/ multivariate Ansätze. Klaus D. Kubinger. Test- und Beratungsstelle. Effektgrößen Univariate/ multivariate Ansätze Klaus D. Kubinger Effektgrößen Rasch, D. & Kubinger, K.D. (2006). Statistik für das Psychologiestudium Mit Softwareunter-stützung zur Planung und Auswertung von Untersuchungen

Mehr

Entscheidungsanalyse unter Unsicherheit Entscheidungskriterien in ökonomischen Netzen

Entscheidungsanalyse unter Unsicherheit Entscheidungskriterien in ökonomischen Netzen Entscheidungsanalyse unter Unsicherheit Entscheidungskriterien in ökonomischen Netzen Referat von Guido RECKE Institut für Agrarökonomie der Georg-August-Universität Göttingen Platz der Göttinger Sieben

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

9. StatistischeTests. 9.1 Konzeption

9. StatistischeTests. 9.1 Konzeption 9. StatistischeTests 9.1 Konzeption Statistische Tests dienen zur Überprüfung von Hypothesen über einen Parameter der Grundgesamtheit (bei einem Ein-Stichproben-Test) oder über die Verteilung einer Zufallsvariablen

Mehr

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

14.01.14 DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler DAS THEMA: INFERENZSTATISTIK II INFERENZSTATISTISCHE AUSSAGEN Standardfehler Konfidenzintervalle Signifikanztests Standardfehler der Standardfehler Interpretation Verwendung 1 ZUR WIEDERHOLUNG... Ausgangspunkt:

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Prüfen von Mittelwertsunterschieden: t-test

Prüfen von Mittelwertsunterschieden: t-test Prüfen von Mittelwertsunterschieden: t-test Sven Garbade Fakultät für Angewandte Psychologie SRH Hochschule Heidelberg sven.garbade@hochschule-heidelberg.de Statistik 1 S. Garbade (SRH Heidelberg) t-test

Mehr

3.2 Bivariate Verteilungen

3.2 Bivariate Verteilungen 3.2 Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt i, i = 1,..., n, werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare/Kombinationen von

Mehr

Anhang A: Fragebögen und sonstige Unterlagen

Anhang A: Fragebögen und sonstige Unterlagen Anhang Anhang A: Fragebögen und sonstige Unterlagen A.: Flyer zur Probandenrekrutierung 46 A.: Fragebogen zur Meditationserfahrung 47 48 A.3: Fragebogen Angaben zur Person 49 5 5 A.4: Termin- und Einladungsschreiben

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen

Veranstaltungsort Bildungsherberge der Studierendenschaft der FernUniversität Hagen Bildungsurlaub-Seminare: Lerninhalte und Programm Seminartitel SPSS für Psychologen/innen (BH15113) Termin Mo, den 18.05.bis Fr, den 22.05.2015 (40 UStd.) Veranstaltungsort Bildungsherberge der Studierendenschaft

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung Mess-System-Analyse.1 ANOVA-Methode. Maße für

Mehr

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall )

Regressionsanalysen. Zusammenhänge von Variablen. Ziel der Regression. ( Idealfall ) Zusammenhänge von Variablen Regressionsanalysen linearer Zusammenhang ( Idealfall ) kein Zusammenhang nichtlinearer monotoner Zusammenhang (i.d.regel berechenbar über Variablentransformationen mittels

Mehr

T-TEST BEI EINER STICHPROBE:

T-TEST BEI EINER STICHPROBE: Kapitel 19 T-Test Mit Hilfe der T-TEST-Prozeduren werden Aussagen über Mittelwerte getroffen. Dabei wird versucht, aus den Beobachtungen einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen.

Mehr

Kommentierter SPSS-Ausdruck zur logistischen Regression

Kommentierter SPSS-Ausdruck zur logistischen Regression Daten: POK V AG 3 (POKV_AG3_V07.SAV) Kommentierter SPSS-Ausdruck zur logistischen Regression Fragestellung: Welchen Einfluss hat die Fachnähe und das Geschlecht auf die interpersonale Attraktion einer

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Korrelation - Regression. Berghold, IMI

Korrelation - Regression. Berghold, IMI Korrelation - Regression Zusammenhang zwischen Variablen Bivariate Datenanalyse - Zusammenhang zwischen 2 stetigen Variablen Korrelation Einfaches lineares Regressionsmodell 1. Schritt: Erstellung eines

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/35 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/35 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis:

Übungsaufgaben zu Kapitel 5. Aufgabe 101. Inhaltsverzeichnis: Inhaltsverzeichnis: Übungsaufgaben zu Kapitel 5... 1 Aufgabe 101... 1 Aufgabe 102... 2 Aufgabe 103... 2 Aufgabe 104... 2 Aufgabe 105... 3 Aufgabe 106... 3 Aufgabe 107... 3 Aufgabe 108... 4 Aufgabe 109...

Mehr

Univariate Lineare Regression. (eine unabhängige Variable)

Univariate Lineare Regression. (eine unabhängige Variable) Univariate Lineare Regression (eine unabhängige Variable) Lineare Regression y=a+bx Präzise lineare Beziehung a.. Intercept b..anstieg y..abhängige Variable x..unabhängige Variable Lineare Regression y=a+bx+e

Mehr

Kontingenzkoeffizient (nach Pearson)

Kontingenzkoeffizient (nach Pearson) Assoziationsmaß für zwei nominale Merkmale misst die Unabhängigkeit zweier Merkmale gibt keine Richtung eines Zusammenhanges an 46 o jl beobachtete Häufigkeiten der Kombination von Merkmalsausprägungen

Mehr

Multivariate Verfahren

Multivariate Verfahren Selbstkontrollarbeit 2 Multivariate Verfahren Musterlösung Aufgabe 1 (28 Punkte) Der Marketing-Leiter einer Lebensmittelherstellers möchte herausfinden, mit welchem Richtpreis eine neue Joghurt-Marke auf

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung Die Messung Skalenniveaus 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Grundbegriffe Statistische Einheit,

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

Regression mit Gretl Eine erste Einführung 1

Regression mit Gretl Eine erste Einführung 1 Kurzeinführung in Gretl S. 1 Regression mit Gretl Eine erste Einführung 1 Installation: Gretl für das entsprechende Betriebssystem herunterladen und die Setup-Datei ausführen. Hinweis: Für die Benutzung

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

Kapitel 23 Lineare Regression

Kapitel 23 Lineare Regression Kapitel 23 Lineare Regression Sowohl einfache als auch multiple Regressionsanalysen können Sie mit dem Befehl STATISTIK REGRESSION LINEAR... durchführen. Dabei lassen sich mit Hilfe diverser Optionen zahlreiche

Mehr

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe.

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe. Conjoint Analyse CONsidered JOINTly Conjoint Analyse Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe. traditionelle auswahlbasierte Wählen Sie bitte aus den Alternativen,

Mehr

Grundlagen von Versuchsmethodik und Datenanalyse

Grundlagen von Versuchsmethodik und Datenanalyse Grundlagen von Versuchsmethodik und Datenanalyse Der Anfang: Hypothesen über Ursache-Wirkungs-Zusammenhänge Ursache Wirkung Koffein verbessert Kurzzeitgedächtnis Gewaltfilme führen zu aggressivem Verhalten

Mehr

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse

Multiple Regression II: Signifikanztests, Gewichtung, Multikollinearität und Kohortenanalyse Multiple Regression II: Signifikanztests,, Multikollinearität und Kohortenanalyse Statistik II Übersicht Literatur Kausalität und Regression Inferenz und standardisierte Koeffizienten Statistik II Multiple

Mehr

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14.

Standardab er des. Testwert = 145.5 95% Konfidenzintervall. T df Sig. (2-seitig) Differenz Untere Obere -2.011 698.045-5.82-11.50 -.14. Aufgabe : einfacher T-Test Statistik bei einer Stichprobe Standardfehl Standardab er des Mittelwert weichung Mittelwertes 699 39.68 76.59 2.894 Test bei einer Sichprobe Testwert = 45.5 95% Konfidenzintervall

Mehr

Abhängigkeit zweier Merkmale

Abhängigkeit zweier Merkmale Abhängigkeit zweier Merkmale Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/33 Allgemeine Situation Neben der Untersuchung auf Unterschiede zwischen zwei oder mehreren Untersuchungsgruppen hinsichtlich

Mehr

Eine computergestützte Einführung mit

Eine computergestützte Einführung mit Thomas Cleff Deskriptive Statistik und Explorative Datenanalyse Eine computergestützte Einführung mit Excel, SPSS und STATA 3., überarbeitete und erweiterte Auflage ^ Springer Inhaltsverzeichnis 1 Statistik

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table(c:\\compaufg\\kredit. Lösung 16.3 Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit

Mehr

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche

25. Januar 2010. Ruhr-Universität Bochum. Methodenlehre III, WS 2009/2010. Prof. Dr. Holger Dette. 4. Multivariate Mittelwertvergleiche Ruhr-Universität Bochum 25. Januar 2010 1 / 75 2 / 75 4.1 Beispiel: Vergleich von verschiedenen Unterrichtsmethoden Zwei Zufallsstichproben (A und B) mit je 10 Schülern und 8 Schülern Gruppe A wird nach

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Datenanalyse mit SPSS spezifische Analysen

Datenanalyse mit SPSS spezifische Analysen Datenanalyse mit SPSS spezifische Analysen Arnd Florack Tel.: 0251 / 83-34788 E-Mail: florack@psy.uni-muenster.de Raum 2.015 Sprechstunde: Dienstags 15-16 Uhr 25. Mai 2001 2 Auswertung von Häufigkeitsdaten

Mehr

3 Zusammenhangsmaße Zusammenhangshypothesen

3 Zusammenhangsmaße Zusammenhangshypothesen 3 Zusammenhangsmaße Zusammenhangshypothesen Zusammenhänge (zwischen 2 Variablen) misst man mittels Korrelationen. Die Wahl der Korrelation hängt ab von: a) Skalenniveau der beiden Variablen: 1) intervallskaliert

Mehr

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav)

Varianzanalytische Methoden Zweifaktorielle Versuchspläne 4/13. Durchführung in SPSS (File Trait Angst.sav) Zweifaktorielle Versuchspläne 4/13 Durchführung in SPSS (File Trait Angst.sav) Analysieren > Allgemeines Lineares Modell > Univariat Zweifaktorielle Versuchspläne 5/13 Haupteffekte Geschlecht und Gruppe

Mehr

Lösung zu Kapitel 11: Beispiel 1

Lösung zu Kapitel 11: Beispiel 1 Lösung zu Kapitel 11: Beispiel 1 Eine Untersuchung bei 253 Personen zur Kundenzufriedenheit mit einer Einzelhandelskette im Südosten der USA enthält Variablen mit sozialstatistischen Daten der befragten

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

EVALUATION DER VS PFEILGASSE PANELSTUDIE IM RAHMEN EINES QUALITÄTSENTWICKLUNGSPRO- GRAMMS IN DER BEGABTENFÖRDERUNG

EVALUATION DER VS PFEILGASSE PANELSTUDIE IM RAHMEN EINES QUALITÄTSENTWICKLUNGSPRO- GRAMMS IN DER BEGABTENFÖRDERUNG EVALUATION DER VS PFEILGASSE PANELSTUDIE IM RAHMEN EINES QUALITÄTSENTWICKLUNGSPRO- GRAMMS IN DER BEGABTENFÖRDERUNG Veröffentlicht in: news&science. Begabtenförderung und Begabungsforschung. ÖZBF, Nr. 26/Ausgabe

Mehr

Neuerungen in Minitab 16

Neuerungen in Minitab 16 Neuerungen in Minitab 16 minitab@additive-net.de - Telefon: 06172 / 5905-30 Willkommen zu Minitab 16! Die neueste Version der Minitab Statistical Software umfasst mehr als siebzig neue Funktionen und Verbesserungen,

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17)

Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) R.Niketta Multiple Regressionsanalyse Kommentierter SPSS-Output für die multiple Regressionsanalyse (SPSS-Version 17) Daten: Selbstdarstellung und Kontaktsuche in studi.vz (POK VIII, AG 3) Fragestellung:

Mehr

Kommentierte Formelsammlung multivariater statistischer Verfahren. Prof. Dr. Irene Rößler Prof. Dr. Albrecht Ungerer

Kommentierte Formelsammlung multivariater statistischer Verfahren. Prof. Dr. Irene Rößler Prof. Dr. Albrecht Ungerer Kommentierte Formelsammlung multivariater statistischer Verfahren Prof Dr Irene Rößler Prof Dr Albrecht Ungerer Inhaltsverzeichnis i Inhaltsverzeichnis Verfahren im Überblick Beispieldatensatz 1 1 Multiple

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

8. Februar 2007. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 8. Februar 2007 Hinweise:

Mehr

Tutorial: Homogenitätstest

Tutorial: Homogenitätstest Tutorial: Homogenitätstest Eine Bank möchte die Kreditwürdigkeit potenzieller Kreditnehmer abschätzen. Einerseits lebt die Bank ja von der Vergabe von Krediten, andererseits verursachen Problemkredite

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

ALM. Allgemeines lineares Modell. Teil 1. Regressionsanalyse Varianzanalyse Kovarianzanalyse Diskriminanzanalyse. Kurt Holm

ALM. Allgemeines lineares Modell. Teil 1. Regressionsanalyse Varianzanalyse Kovarianzanalyse Diskriminanzanalyse. Kurt Holm ALM Allgemeines lineares Modell Teil 1 Regressionsanalyse Varianzanalyse Kovarianzanalyse Diskriminanzanalyse Kurt Holm Almo Statistik-System www.almo-statistik.de holm@almo-statistik.de kurt.holm@jku.at

Mehr

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31

Verteilungsanalyse. Johannes Hain. Lehrstuhl für Mathematik VIII Statistik 1/31 Verteilungsanalyse Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/31 Datentypen Als Sammeln von Daten bezeichnet man in der Statistik das Aufzeichnen von Fakten. Erhobene Daten klassifziert man

Mehr

Kapitel 3: Interpretationen

Kapitel 3: Interpretationen Kapitel 3: 1. Interpretation von Outputs allgemein... 1 2. Interpretation von Signifikanzen... 1 2.1. Signifikanztests / Punktschätzer... 1 2.2. Konfidenzintervalle... 2 3. Interpretation von Parametern...

Mehr

$ % + 0 sonst. " p für X =1 $

$ % + 0 sonst.  p für X =1 $ 31 617 Spezielle Verteilungen 6171 Bernoulli Verteilung Wir beschreiben zunächst drei diskrete Verteilungen und beginnen mit einem Zufallsexperiment, indem wir uns für das Eintreffen eines bestimmten Ereignisses

Mehr

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest

Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Universität Wien Institut für Mathematik Wintersemester 2009/2010 Medizinische Statistik Epidemiologie und χ 2 Vierfeldertest Seminar Angewandte Mathematik Ao. Univ. Prof. Dr. Peter Schmitt von Nadja Reiterer

Mehr

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007

Faktorenanalyse. 1. Grundlegende Verfahren. Bacher, SoSe2007 Faktorenanalyse Bacher, SoSe2007 1. Grundlegende Verfahren explorative FA (EXFA): Für eine Menge von Variablen/Items werden zugrunde liegende gemeinsame (latente) Dimensionen/Faktoren gesucht, die Faktorstruktur

Mehr

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG

Christian FG Schendera. Regressionsanalyse. mit SPSS. 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Christian FG Schendera Regressionsanalyse mit SPSS 2. korrigierte und aktualisierte Auflage DE GRUYTER OLDENBOURG Inhalt Vorworte V 1 Korrelation 1 1.1 Einführung 1 1.2 Erste Voraussetzung: Das Skalenniveau

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Lineare Reression Zweck: Vorhersae Dimensionsreduktion Klassifizierun Hauptkomponentenanalyse Korrespondenzanalyse Clusteranalyse Diskriminanzanalyse Eienschaften: nicht-linear verteilunsfrei

Mehr

6.1 Grundbegriffe und historischer Hintergrund

6.1 Grundbegriffe und historischer Hintergrund Kapitel 6 Regression 61 Grundbegriffe und historischer Hintergrund Bedeutung der Regression: Eines der am häufigsten verwendeten statistischen Verfahren Vielfache Anwendung in den Sozialwissenschaften

Mehr

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY

5.2. Nichtparametrische Tests. 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY 5.2. Nichtparametrische Tests 5.2.1. Zwei unabhängige Stichproben: U- Test nach MANN- WHITNEY Voraussetzungen: - Die Verteilungen der beiden Grundgesamtheiten sollten eine ähnliche Form aufweisen. - Die

Mehr

Klausur Sommersemester 2010

Klausur Sommersemester 2010 Klausur Sommersemester 2010 Lehrstuhl: Wirtschaftspolitik Prüfungsfach: Empirische Wirtschaftsforschung Prüfer: Prof. Dr. K. Kraft Datum: 04.08.2010 Hilfsmittel: Nicht-programmierbarer Taschenrechner Klausurdauer:

Mehr

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS (ab V. 11.0)

Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische Modelle Lösung von Grundaufgaben mit SPSS (ab V. 11.0) Ausgewählte Kapitel der Statistik: Regressions- u. varianzanalytische e Lösung von Grundaufgaben mit SPSS (ab V..0) Text: akmv_v.doc Daten: akmv??.sav Lehrbuch: W. Timischl, Biostatistik. Wien - New York:

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Analyse bivariater Kontingenztafeln

Analyse bivariater Kontingenztafeln Analyse bivariater Kontingenztafeln Werden zwei kategoriale Merkmale mit nicht zu vielen möglichen Ausprägungen gemeinsam analysiert, so kommen zur Beschreibung der gemeinsamen Verteilung im allgemeinen

Mehr

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik

Hans-Friedrich Eckey SS 2004. Skript zur Lehrveranstaltung Multivariate Statistik Hans-Friedrich Eckey SS 2004 Skript zur Lehrveranstaltung Multivariate Statistik Vormerkungen I Vorbemerkungen Das Manuskript beinhaltet den gesamten Stoff, der Bestandteil der Lehrveranstaltung "Multivariate

Mehr

1 Ein Beispiel: Das Berechnen eines Schulzeugnisses

1 Ein Beispiel: Das Berechnen eines Schulzeugnisses Funktionen in Excel 1 Ein Beispiel: Das Berechnen eines Schulzeugnisses Jim hat die folgenden Noten im 1. Trimester: Fach Prüfung 1 Prüfung 2 Prüfung 3 Englisch 35 38 43 Deutsch 44 42 48 Französisch 28

Mehr

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundlagen der Datenanalyse am Beispiel von SPSS Grundlagen der Datenanalyse am Beispiel von SPSS Einführung Dipl. - Psych. Fabian Hölzenbein hoelzenbein@psychologie.uni-freiburg.de Einführung Organisatorisches Was ist Empirie? Was ist Statistik? Dateneingabe

Mehr

Klausur Wirtschaftsmathematik Lösungshinweise

Klausur Wirtschaftsmathematik Lösungshinweise Klausur Wirtschaftsmathematik Lösungshinweise Prüfungsdatum: 27. Juni 2015 Prüfer: Etschberger Studiengang: Wirtschaftsingenieurwesen Aufgabe 1 16 Punkte Anton Arglos hat von seiner Großmutter 30 000 geschenkt

Mehr

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen -

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen - Die Duration von Standard-Anleihen - Berechnungsverfahren und Einflussgrößen - Gliederung Einleitendes Herleitung einer Berechnungsvorschrift Berechnungsvorschriften für Standardfälle Einflussgrößen und

Mehr