Primer: Deskriptive Statistik 1.0

Transkript

1 Primer: Deskriptive Statistik 1.0 Dr. Malte Persike methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ Folie 1

2 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Was ist eigentlich Deskriptive Statistik? Und wozu brauchen wir sie überhaupt? Folie 2

3 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Folie 3

4 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Statistik ist ein Grundpfeiler der empirischen Forschung und Wissenschaft Empirie = Erfahrungswissen Empirische Forschung = auf Messung und systematischer Beobachtung beruhende Forschung Empirische Forschung produziert immer Daten, zumeist sehr viele davon, in numerischer Form ( Zahlen ) Folie 4

5 Variablen & Skalen Nominaldaten Variablen Deskriptive Statistik Warum das Alles? Skalen Nominalskala Notation Deskriptive Statistik ist ein Verfahren zur Beschreibung von Zahlen vielen Daten durch andere Zahlen wenige Werte ( Kennwerte ) Folie 5 Die Deskriptive Statistik dient also der Reduktion einer Datenmenge auf einen überschaubaren Satz an zahlenmäßigen Charakterisierungen

6 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & ihre Träger Grundbegriffe empirischer Forschung Merkmal: Isolierte Eigenschaft eines größeren Ganzen, z.b. Intelligenz, Farbe, BMI, Einkommen Ausprägung: Zustand des Merkmals, z.b. IQ = 115, Farbe =, BMI = 21.3, Einkommen = hoch Ein Merkmal hat mindestens zwei Ausprägungen, die beliebig beschrieben sein können, z.b. verbal (jung/alt), numerisch (0/1), bildlich ( / ) Folie 6

7 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & ihre Träger Grundbegriffe empirischer Forschung Merkmalsträger (statistische Einheiten, Beobachtungseinheiten) sind alle Objekte, bei denen man die Ausprägung von Merkmalen feststellen kann In den Humanwissenschaften sind Merkmalsträger zumeist Menschen oder Tiere, aber auch Aggregate wie z.b. Abteilungen in Firmen Beobachtungen: Feststellung der Ausprägung von Merkmalen bei Merkmalsträgern Folie 7

8 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Merkmale & ihre Träger Grundbegriffe empirischer Forschung Beobachtungen im engeren Sinn sind z.b. die echte Verhaltensbeobachtung oder bildgebende Verfahren Zu den Beobachtungen im weiteren Sinn zählen aber auch Ergebnisse in einem Leistungstest oder Selbst- und Fremdauskünfte in Fragebögen Daten sind sämtliche Beobachtungen bei der Informationssammlung Statistik sind Methoden zur Sammlung und Analyse von Daten Folie 8

9 Variablen & Skalen Nominaldaten Variablen Vom Merkmal zur Variable Statistik braucht Zahlen Skalen Nominalskala Notation Die Ausprägungen eines Merkmals können beliebiger Art sein (z.b. Worte, Formen, Farben) Die Statistik als mathematische Disziplin arbeitet nur mit Zahlen und benutzt deshalb Variablen Eine Variable wird definiert, indem den Ausprägungen des Merkmals Zahlen zugeordnet werden. Diese Zahlen heißen Realisationen oder Werte. Merkmal Punkte auf Fläche 2 5 Variable Zahlen Folie 9

10 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Notation Nominalskala Notation Variablen werden mit Großbuchstaben symbolisiert, häufig verwendet man X und Y Die Realisationen einer Variablen werden dann mit den entsprechenden Kleinbuchstaben gekennzeichnet, also x und y Die Menge aller möglichen Realisationen ist der Wertebereich einer Variablen Folie 10

11 Variablen & Skalen Nominaldaten Variablen Variablen Definition Skalen Variablen werden immer über eine mathematische Formulierung definiert, z.b. Nominalskala Notation Merkmal X Variable x: 1 1, 0, wenn x: 2 2, 1, wenn x: 6 6, 5, wenn Die extensionale Definition zählt alle Realisationen der Variablen auf. Folie 11

12 Variablen & Skalen Nominaldaten Variablen Variablen Definition Skalen Variablen werden immer über eine mathematische Formulierung definiert, z.b. Nominalskala Merkmal Variable Notation X 0 Die intensionale Definition gibt eine Vorschrift an, die die Variable eindeutig spezifiziert. Folie 12

13 Variablen & Skalen Nominaldaten Variablen Variablen & Messungen Grundlagen Skalen Nominalskala Notation Folie 13 Die empirische Feststellung der Realisation einer Variablen wird als Messung bezeichnet Dabei ist zu unterscheiden zwischen der Beobachtung der Ausprägung des Merkmals und der Messung der Realisation der Variablen Denn: Die Beobachtung kann eine Information in beliebiger Form erheben (z.b. verbal, bildlich), die Messung liefert immer eine Zahl. Die gemessenen Zahlen heißen Messwerte oder Ergebnisse

14 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Unterscheidung nach Art der Daten Eine wesentliche Unterscheidung von Typen von Variablen trennt diskrete von stetigen Variablen Nominalskala Eine diskrete Variable besitzt zumeist endlich viele und feste Werte, die man über Ganzzahlen beschreiben kann Notation Dichtome Variablen haben genau zwei diskrete Werte Polytome Variablen haben mehr als zwei diskrete Werte Eine stetige (kontinuierliche) Variable kann (unendlich viele) beliebige Werte annehmen, die man über reelle Zahlen beschreibt Folie 14

15 Variablen & Skalen Nominaldaten Variablen Skalen Variablen Unterscheidung nach Art der Daten Achtung: Es sind streng Typen von Merkmalen und Typen von Variablen zu unterscheiden. Nominalskala Notation Alter ist ein kontinuierliches bzw. stetiges Merkmal. Eine Variable Alter kann nun aber diskret definiert werden als x1: -1, wenn <18 Alter X x2: 0, wenn <67 x3: 1, wenn 67 Folie 15 Gleiches gilt z.b. für Intelligenz, Schulleistung, Sehvermögen, Fahreignung

16 Variablen & Skalen Nominaldaten Variablen Skalen Definition Skalen Nominalskala Notation Definition der Skala (oder richtiger: Skale) Eine Skale ist die Festlegung von Einheiten, in denen ein gegebenes Merkmal gemessen wird Die Einheiten sind zumeist numerisch (Zahlen), können aber auch beliebige andere Symbole sein Nur Variablen, die auf derselben Skale gemessen wurden, sind direkt miteinander vergleichbar In allen anderen Fällen müssen die Skalen sofern möglich ineinander überführt werden (Skalentransformation). Folie 16

17 Variablen & Skalen Nominaldaten Variablen Skalen Vom Merkmal zur Skale Am Beispiel des MOCI (Hodgson & Rachman, 1977) Nominalskala Notation Konstrukt: OCSD Merkmal: Kreuze im MOCI? Skale 19 X x : 0, wenn 0 ja 1 x : 1, wenn 1 ja 2 x : 30, wenn 30 ja 31 Folie 17 Messung Variable: MOCI-Score

18 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Notation Vom Merkmal zur Skale Am Beispiel des MOCI (Hodgson & Rachman, 1977) Y=1: Keine OCSD Y=2: Leichte OCSD Y=3: Mittlere OCSD Y=4: Schwere OCSD Konstrukt: OCSD Skalentransformation Merkmal: Kreuze im MOCI y1: 1, X 0,14 y2: 2, X 15,18 Y( X) y3: 3, X 19, 23 y4: 4, X 24,30 19 X 0, wenn 0 ja 1, wenn 1 ja 30, wenn 30 ja Variable: Schweregrad Messung Variable: MOCI-Score Folie 18

19 Variablen Skalen Nominalskala Notation Variablen & Skalen Skalenniveaus Übersicht Es gibt verschiedene Typen von Skalen, die als Skalenniveaus bezeichnet werden. Nominalskala qualitativ Ordinalskala Intervallskala Verhältnisskala quantitativ (Ratioskala) Absolutskala Nominaldaten Bortz, S Der Informationsgehalt nimmt von der Nominalskala zur Absolutskala hin zu Bei Messungen kognitiver Merkmale kommen die Verhältnis- und die Absolutskala so gut wie nie vor Folie 19

20 Variablen & Skalen Nominaldaten Variablen Skalenniveaus Skalen Nominalskala Notation Folie 20 Frage: Warum ist die Kenntnis des Skalenniveaus so wichtig für die empirische Forschung? 1. Das Skalenniveau bestimmt die erlaubten mathematischen Operationen (=,, <, > etc.) 2. Das Skalenniveau bestimmt, welche mathematischen Transformationen auf die Messwerte einer Variablen angewandt werden dürfen, ohne Informationen zu verlieren. Beispiele: Hat eine Person mit X=20 eine doppelt so schwere OCSD wie jemand mit X=10? Hat eine Person mit Y=2 eine doppelt so schwere OCSD wie jemand mit Y=1? Verliert man durch die Transformation Y(X) Informationen?

21 Variablen & Skalen Nominaldaten Variablen Skalenniveaus Skalen Nominalskala Notation Frage: Warum ist die Kenntnis des Skalenniveaus so wichtig für die empirische Forschung? 1. Das Skalenniveau bestimmt die erlaubten mathematischen Operationen (=,, <, > etc.) 2. Das Skalenniveau bestimmt, welche mathematischen Transformationen auf die Messwerte einer Variablen angewandt werden dürfen, ohne Informationen zu verlieren. 3. Das Skalenniveau bestimmt damit auch, welche statistischen Verfahren überhaupt auf Daten angewandt werden dürfen. Also: Ohne Skalenniveau keine Statistik Folie 21

22 Variablen Skalen Variablen & Skalen Nominalskala Definition Nominaldaten Bortz, S. 12 Nominalskala Notation Bei einer Nominalskala werden den Realisationen einer Variablen Zahlen mit dem Ziel zugeordnet, Kategorien zu unterscheiden Die Zahlen selbst sind vollständig beliebig und damit nicht interpretierbar Die Anwendung mathematischer Operationen auf die Werte einer nominalskalierten Variablen ist unter bestimmten Voraussetzungen möglich, aber zumeist nicht sinnvoll. Folie 22

23 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Beispiele Konstitutionstypen Nominalskala Notation a) Leptosomer Typ b) Athletischer Typ c) Pyknischer Typ Temperamentstypen Folie 23

24 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Zulässige Operationen Nominalskala Zulässige Operationen sind ausschließlich Äquivalenzrelationen, d.h. Gleich und Ungleich Notation Jede andere Aussage als A ist gleich/ungleich B ist bei einer nominalskalierten Variable unzulässig! Folie 24

25 Variablen & Skalen Nominaldaten Variablen Nominalskala Zulässige Transformationen Skalen Nominalskala Zulässige Transformationen sind eineindeutige Abbildungen, so dass die Unterscheidbarkeit der Realisationen erhalten bleibt. Notation Folie 25

26 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). x1: 1, wenn <18 Alter X x2: 2, wenn <68 x3: 3, wenn 68 y1: 0, wenn <18 Alter Y y2: 18, wenn <68 y3: 68, wenn 68 Folie 26

27 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 27 Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). Das Symbol x j mit j = 1 k bezeichnet dann die j-te Realisation der Zufallsvariablen X. Diese Indizierung ist nur für diskrete Variablen sinnvoll, da stetige Variablen unendlich viele Realisationen haben

28 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 28 Frage: Wie werden Merkmalsträger formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Person in der Stichprobe zu finden Konvention: Für die Gesamtzahl von Personen wird nahezu immer das Zeichen n (oder N) benutzt. Für die Gesamtzahl von Realisationen werden andere Kleinbuchstaben verwendet (z.b. k) Dann dient wieder ein Laufindex dazu, die einzelnen Personen zu adressieren Das Symbol x i mit i = 1 n bezeichnet dann die i-te Messung der Zufallsvariablen X.

29 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Problem: Das Symbol x 3 kann die dritte Realisation der Zufallsvariablen X sein oder auch der Wert der 3. Person in der Stichprobe Also: Es muss vorher definiert sein, was der Laufindex bedeutet, z.b. Die Variable X habe k Realisationen und sei an n Personen gemessen worden. x i x j Folie 29 mit i = 1 n mit j = 1 k

30 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 30 In der empirischen Forschung gibt es oft viele Variablen, die als UV oder AV erhoben werden. Beispiel: An einer Stichprobe von Personen verschiedenen Geschlechts wird der durchschnittliche Alkoholkonsum über einen Monat hinweg gemessen. Man hat hier offenbar 3 Variablen sowie mehrere Messungen verschiedener Merkmalsträger IQ als AV: (X) Geschlecht als UV (Y) Alkoholabhängigkeit als UV (Z) Frage: Wie indiziert man z.b. Die IQ-Messung des 4. Mannes in der Gruppe der Alkoholiker?

31 Variablen & Skalen Nominaldaten Variablen Skalen Nominalskala Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Die Variable Geschlecht (Y) wird in k=2 Ausprägungen gemessen: y 1 : 0 = männlich y 2 : 1 = weiblich Notation Die Variable Alkoholkonsum (Z) wird diskretisiert in m=5 Ausprägungen (Jelinek, 1951) gemessen: Z = z 1 : 0 = Kein Alkoholkonsum z 2 : 1 = Konflikt-/Erleichterungstrinker z 3 : 2 = Gelegenheitstrinken z 4 : 3 = Rauschtrinken (Alkoholiker) z 5 : 4 = Periodisches Trinken (Alkoholiker) Folie 31 Es nehmen insgesamt n=220 Personen teil

32 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die AV ist der IQ. Dies ist die Variable, deren Realisation im Experiment bei den Merkmalsträgern gemessen wird. Die beiden anderen Variablen sind UVen, deren Realisationen vor dem Experiment bereits feststehen, bzw. erhoben werden. Zur eindeutigen Indizierung des IQ eines Merkmalsträgers werden nun mehrere Laufindizes benötigt Folie 32

33 Variablen & Skalen Nominaldaten Variablen Skalen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Eine Person fällt immer in eine der km = 25 = 10 Gruppen von Geschlecht und Alkoholkonsum Nominalskala Notation Der Laufindex für Geschlecht sei r = 1 k und für Alkoholkonsum s = 1 m Jede der 10 Gruppen hat also n rs Mitglieder Jede Person kann eindeutig identifiziert werden über x irs mit i=1 n rs r=1 k, s=1 m Folie 33 So ist z.b. x 4,1,3 der IQ des vierten Mannes unter den Gelegenheitstrinkern

34 Variablen & Skalen Nominaldaten Variablen Exkurs: Notation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Oft möchte man über einen der Indizes aggregieren (z.b. mitteln) Beispiel: Alle weiblichen Rauschtrinker Dann kommt die Punktnotation zum Einsatz x rs hier: x,2,5 Der Punkt symbolisiert Alle, in diesem Fall also Alle Personen in Gruppe Y=y r, Z=z s. Folie 34

35 Variablen & Skalen Nominaldaten Bortz, S. 47 Häufigkeiten Nominaldaten Numerische Beschreibung: Häufigkeiten Kreuztabellen Kennwerte Grafische Darstellung Nominalskalierte Variablen sind praktisch immer diskret und endlich Die empirische beobachtete Häufigkeit des Auftretens einer Realisation X = x wird als h(x = x) oder vereinfacht h(x) geschrieben. h(x) bezeichnet man als absolute Häufigkeit Die relative Häufigkeit f(x = x) bzw. f(x) ist dann definiert als der Quotient aus absoluter Häufigkeit und der Anzahl n aller Beobachtungen hx ( ) f ( x) h( x) f( x) n n Achtung: Relative Häufigkeiten sind nicht Wahrscheinlichkeiten Folie 35

36 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: univariate Kreuztabellen Kreuztabellen Kennwerte Grafische Darstellung Folie 36 Wert von X h(x = x j ) f(x = x j ) x 1 h(x 1 ) f(x 1 ) x 2 h(x 2 ) f(x 2 ) x i h(x i ) f(x i ) x k h(x k ) f(x k ) Die Sammlung der Zahlenwerte der h(x = x j ) und f(x = x j ) für alle möglichen j = 1 k wird als diskrete Häufigkeitsverteilung bezeichnet Die tabellarische Darstellung erfolgt über Häufigkeitstabellen

37 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: bivariate Kreuztabellen Kreuztabellen Kennwerte Grafische Darstellung Oft betrachtet man Häufigkeiten für das gemeinsame Auftreten zweier Merkmale Beispiel: Frauen/Männer, die unter-/normal- /übergewichtig sind In diesem Fall werden 2 Variablen betrachtet: X: Geschlecht (x 1, x 2 ) Y: Gewichtsstatus (y 1, y 2, y 3 ) Die Häufigkeiten sind nun so genannte Verbundhäufigkeiten, die das Vorkommen jeder möglichen Kombination aus x und y beschreiben Folie 37

38 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: bivariate Kreuztabellen Kreuztabellen Absolute Verbundhäufigkeiten werden im bivariaten Fall symbolisiert als h(x=x, Y=y) bzw. h(x, y) Kennwerte Grafische Darstellung Folie 38 Relative Verbundhäufigkeiten als f(x=x, Y=y) bzw. f(x, y) Tabellarische Darstellung über Kreuztabellen (oder Kontingenztabellen) Geschlecht Männlich (x 1 ) Weiblich (x 2 ) Σ Unter (y 1 ) f(x 1,y 1 ) f(x 2,y 1 ) f(,y 1 ) Gewicht Normal (y 2 ) f(x 1,y 2 ) f(x 2,y 2 ) f(,y 2 ) Über (y 3 ) f(x 1,y 3 ) f(x 2,y 3 ) f(,y 3 ) Σ f(x 1, ) f(x 2, ) f(, ) Randhäufigkeiten

39 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: multivariate Kreuztabellen Kreuztabellen Kennwerte Grafische Darstellung Auch das gemeinsame Vorkommen von mehr als zwei Merkmalen ist über Kreuztabellen darstellbar Beispiel: Frauen/Männer, die unter-/normal- /übergewichtig sind und Stricken/World of Warcraft spielen In diesem Fall werden 3 Variablen betrachtet: X: Geschlecht (x 1, x 2 ) Y: Gewichtsstatus (y 1, y 2, y 3 ) Z: Freizeitbeschäftigung (z 1, z 2 ) Folie 39

40 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: multivariate Kreuztabellen Kreuztabellen Kennwerte Absolute Verbundhäufigkeiten werden im multivariaten Fall symbolisiert als h(x=x, Y=y, ) bzw. h(x, y, ) Relative Verbundhäufigkeiten als f(x=x, Y=y, ) bzw. f(x, y, ) Grafische Darstellung Tabellarische Darstellung über geschachtelte (oder genestete ) Kreuztabellen Geschlecht Männlich (x 1 ) Weiblich (x 2 ) Freizeit Stricken (z 1 ) WoW (z 2 ) Stricken (z 1 ) WoW (z 2 ) Unter (y 1 ) f(x 1,y 1,z 1 ) f(x 1,y 1,z 2 ) f(x 2,y 1,z 1 ) f(x 2,y 1,z 2 ) Gewicht Normal (y 2 ) f(x 1,y 2,z 1 ) f(x 1,y 2,z 2 ) f(x 2,y 2,z 1 ) f(x 2,y 2,z 2 ) Über (y 3 ) f(x 1,y 3,z 1 ) f(x 1,y 3,z 2 ) f(x 2,y 3,z 1 ) f(x 2,y 3,z 2 ) Folie 40

41 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Numerische Beschreibung: Kennwerte Kreuztabellen Kennwerte Grafische Darstellung Als Kennwert bezeichnet man ein statistisches Maß, das eine Menge von Messwerten über zumeist nur eine Zahl beschreibt Kennwerte dienen damit der Datenreduktion Kennwerte charakterisieren lediglich bestimmte Eigenschaften der gegebenen Menge von Messwerten, sie bedeuten als einen Informationsverlust Folie 41

42 Variablen & Skalen Nominaldaten Bortz, S Häufigkeiten Nominaldaten Numerische Beschreibung: Kennwerte Kreuztabellen Kennwerte Grafische Darstellung Ein Kennwert für nominalskalierte Daten ist der Modalwert (oder Modus ) Er bezeichnet die unter den Messwerten am häufigsten vorkommende Realisation x : x f( x) max. mod Wichtig: Der Modalwert ist nicht die Häufigkeit des Messwertes, sondern der Wert selbst. Folie 42 Bei mehreren Maxima sinkt die Aussagekraft von x mod

43 Variablen & Skalen Nominaldaten Bortz, S Häufigkeiten Kreuztabellen Kennwerte Grafische Darstellung Nominaldaten Grafische Beschreibung: Kreisdiagramm Das Kreis- oder Tortendiagramm stellt die absoluten oder relativen Häufigkeiten von Klassen als Kreissegmente eines Vollkreises ( Tortenstücke ) dar. Der Öffnungswinkel α eines Tortenstücks ist dabei durch den Anteil der Klassenelemente an allen Elementen definiert und wird berechnet als hx ( ) f ( x) n Die Summe der Öffnungswinkel aller Kreissegmente sollte wieder 360 ergeben Folie 43

44 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Grafische Beschreibung: Kreisdiagramm Beispiel: Von den Wahlgängern der Bundestagswahl 2009 haben gewählt: Kennwerte % % Grafische Darstellung Folie % % % % SPD CDU/CSU FDP Grüne Linke Sonstige

45 Variablen & Skalen Nominaldaten Häufigkeiten Nominaldaten Grafische Beschreibung: Säulendiagramm Kreuztabellen Kennwerte Grafische Darstellung Das Balken- oder Säulendiagramm stellt die absoluten oder relativen Häufigkeiten von Realisationen einer Variablen als Balken (waagerecht) oder Säulen (senkrecht) dar. Die verschiedenen möglichen Realisationen werden hier auch als Klassen bezeichnet Der Länge der Säulen bzw. Balken ist dabei durch den Anteil der Klassenelemente am Ganzen bzw. die absolute Anzahl definiert. Die Breite der Balken variiert niemals innerhalb eines Balkendiagramms Folie 45

46 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Grafische Beschreibung: Säulendiagramm Beispiel: Von den Wahlgängern der Bundestagswahl 2009 haben gewählt: Kennwerte Grafische Darstellung Folie 46

47 Variablen & Skalen Nominaldaten Häufigkeiten Kreuztabellen Nominaldaten Grafische Beschreibung: Säulendiagramm Warum gleiche Säulenbreiten? Kennwerte Grafische Darstellung Folie 47 Menschen neigen zur Größenbewertung anhand der Fläche.

48 Variablen & Skalen Nominaldaten Grafische Beschreibung How-not -to Folie 48 Quelle:

49 Ordinaldaten Intervalldaten Grafische Beschreibung How-not -to Bild fragt: Brauchen wir eine Ausländerquote an deutschen Schulen? als Reaktion auf PISA 2008 Folie 49

50 Variablen & Skalen Nominaldaten Grafische Beschreibung How-not -to Quelle: Folie 50

51 Variablen & Skalen Nominaldaten Grafische Beschreibung How-not -to Keine Geschlechterlücke mehr beim Gehalt von Führungskräften Folie 51

52 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). x1: 1, wenn <18 Alter X x2: 2, wenn <68 x3: 3, wenn 68 y1: 0, wenn <18 Alter Y y2: 18, wenn <68 y3: 68, wenn 68 Folie 2

53 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 3 Frage: Wie werden Realisationen formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Ausprägung von X zu finden Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x 1, x 2,, x k indiziert Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). Das Symbol x j mit j = 1 k bezeichnet dann die j-te Realisation der Zufallsvariablen X. Diese Indizierung ist nur für diskrete Variablen sinnvoll, da stetige Variablen unendlich viele Realisationen haben

54 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 4 Frage: Wie werden Merkmalsträger formal kodiert? Ziel: Eine symbolische Schreibweise für Der Wert der vierten Person in der Stichprobe zu finden Konvention: Für die Gesamtzahl von Personen wird nahezu immer das Zeichen n (oder N) benutzt. Für die Gesamtzahl von Realisationen werden andere Kleinbuchstaben verwendet (z.b. k) Dann dient wieder ein Laufindex dazu, die einzelnen Personen zu adressieren Das Symbol x i mit i = 1 n bezeichnet dann die i-te Messung der Zufallsvariablen X.

55 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Problem: Das Symbol x 3 kann die dritte Realisation der Zufallsvariablen X sein oder auch der Wert der 3. Person in der Stichprobe Also: Es muss vorher definiert sein, was der Laufindex bedeutet, z.b. Die Variable X habe k Realisationen und sei an n Personen gemessen worden. x i x j Folie 5 mit i = 1 n mit j = 1 k

56 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Folie 6 In empirischen Forschung gibt es oft viele Variablen, die erhoben werden. Beispiel: An einer Stichprobe von Personen verschiedenen Geschlechts wird der durchschnittliche Alkoholkonsum über einen Monat hinweg gemessen. Man hat hier offenbar 3 Variablen sowie mehrere Messungen verschiedener Merkmalsträger IQ: X Geschlecht: Y Alkoholabhängigkeit: Z Frage: Wie indiziert man z.b. Die IQ-Messung des 4. Mannes in der Gruppe der Alkoholiker?

57 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die Variable Geschlecht (Y) wird in k=2 Realisationen gemessen: y 1 : 0 = männlich y 2 : 1 = weiblich Die Variable Alkoholkonsum (Z) wird diskretisiert in m=5 Realisationen (Jelinek, 1951) gemessen: Z = z 1 : 0 = Kein Alkoholkonsum z 2 : 1 = Konflikt-/Erleichterungstrinker z 3 : 2 = Gelegenheitstrinken z 4 : 3 = Rauschtrinken (Alkoholiker) z 5 : 4 = Periodisches Trinken (Alkoholiker) Folie 7 Es nehmen insgesamt n=220 Personen teil

58 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Die AV ist der IQ. Dies ist die Variable, deren Realisation im Experiment bei den Merkmalsträgern gemessen wird. Die beiden anderen Variablen sind UVen, deren Realisationen vor dem Experiment bereits feststehen, bzw. erhoben werden. Zur eindeutigen Indizierung des IQ eines Merkmalsträgers werden nun mehrere Laufindizes benötigt Folie 8

59 Variablen & Skalen Nominaldaten Variablen Skalen Indexnotation Indizierung von Realisationen und Merkmalsträgern Eine Person fällt immer in eine der km = 25 = 10 Gruppen von Geschlecht und Alkoholkonsum Nominalskala Notation Der Laufindex für Geschlecht sei r = 1 k und für Alkoholkonsum s = 1 m Jede der 10 Gruppen hat also n rs Mitglieder Jede Person kann eindeutig identifiziert werden über x irs mit i=1 n rs r=1 k, s=1 m Folie 9 So ist z.b. x 4,1,3 der IQ des vierten Mannes unter den Gelegenheitstrinkern

60 Variablen & Skalen Nominaldaten Variablen Indexnotation Indizierung von Realisationen und Merkmalsträgern Skalen Nominalskala Notation Oft möchte man über einen der Indizes aggregieren (z.b. mitteln) Beispiel: Alle weiblichen Rauschtrinker Dann kommt die Punktnotation zum Einsatz x rs hier: x,2,5 Der Punkt symbolisiert Alle, in diesem Fall also Alle Personen in Gruppe Y=y r, Z=z s. Folie 10

61 Notation Das Summenzeichen Σ Notation Rechenregeln Schachtelung X sei irgendeine Variable, z.b. Körpergröße An n Messobjekten seien die Werte dieser Variablen gemessen worden Es liegen also die n Messungen x 1, x 2,,x n vor, wobei jedes der x irgendeine Zahl ist Wenn man alle n Messungen aufsummieren wollte, so müsste man schreiben Summe aller x x1x2... xn Folie 2

62 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Notation Für die linke Seite der Gleichung, also die Summe aller x hat die Mathematik ein Symbol entwickelt Man schreibt Und spricht n i1 x x x... x i 1 2 n Summe aller x i, wobei i von 1 bis n läuft Der Laufindex i bezeichnet dabei einfach die laufende Nummer des Messwertes von einem der n Messobjekte Folie 3

63 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Beispiel Messung Nr. Symbol Messwert 1 x x x x x 5 2 Die Summe aller fünf x i mithilfe des Summenzeichens wird nun geschrieben als Folie 4 5 i1 x i

64 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 1. Multiplikation jeder Beobachtung mit einer Konstanten n i1 a x ax ax... ax i 1 2 a( x x... x ) a n i1 1 2 x i mit a const. n n Folie 5

65 Notation Rechenregeln Das Summenzeichen Σ Rechenregeln 2. Summation einer Konstanten Schachtelung n b b b... b i1 n-mal nb mit b const. Folie 6

66 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 3. Addition einer Konstanten zu jeder Beobachtung n i1 x b x bx b... x b i 1 2 x1x2... xn b b... n n n i i1 i1 i1 i n n-mal x b x nb mit b const. Folie 7

67 Ordinaldaten Intervalldaten Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 4. Verbindung von Multiplikation und Addition einer Konstanten n n n i i a x b a x b i1 i1 i1 n a x nb i1 mit a, b const. i Folie 8

68 Ordinaldaten Intervalldaten Notation Rechenregeln Schachtelung Das Summenzeichen Σ Rechenregeln 5. Addition zweier Variablen n i1 x y x y x y... x y i i n n x x... x y y... y 1 2 n 1 2 n x n i i1 i1 y i n Hinweis: Diese Addition ist nur sinnvoll, wenn die Messwerte x und y paarweise zuordenbar sind. Folie 9

69 Ordinaldaten Intervalldaten Notation Das Summenzeichen Σ Geschachtelte Summen - Notation Rechenregeln Schachtelung X sei eine Variable und Y eine zweite Variable X wird n-mal gemessen und Y wird m-mal gemessen. Die Messwerte von X erhalten den Laufindex i und die Messwerte von Y erhalten den Laufindex j Angenommen, alle Kombinationen von x i und y j sollen nun über eine mathematische Funktion miteinander verrechnet und aufsummiert werden Die mathematische Funktion könnte z.b. sein y i j i j f ( x, y ) x Folie 10

70 Ordinaldaten Intervalldaten Notation Das Summenzeichen Σ Geschachtelte Summen - Notation Rechenregeln Schachtelung Daraus ergibt sich eine geschachtelte Summe Sie wird geschrieben als f ( x, y ) f( x, y )... f( x, y ) n m m f( xi, yj) i1 j1 f x2 y1 f x2 y2 f x2 ym... (, ) (, )... (, ) f ( x, y ) f( x, y )... f( x, y ) n 1 n 2 n m Folie 11

71 Ordinaldaten Intervalldaten Notation Das Summenzeichen Σ Geschachtelte Summen - Beispiel Rechenregeln Schachtelung Daraus ergibt sich eine geschachtelte Summe Oder mit der gerade beispielhaft angegebenen mathematischen Funktion, y1 y2 x x... x n m y y j x i i1 j1 y1 y2 y x2 x2... x2... x y1 xy2 x... y n n n m m m Folie 12

72 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Geschachtelte Summen - Rechenregeln 1. Es gilt das Kommutativgesetz n m m n,, f x y f x y i j i j i1 j1 j1 i1 2. Aber keine Trennung von geschachtelten Summen n m n m,,, f x y f x y f x y i j i j i j i1 j1 i1 j1 nicht definiert Folie 13

73 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Geschachtelte Summen Beispiel Messung Nr. Symbol Messwert Symbol Messwert 1 x 1 4 y x 2 2 y x 3 9 Die Summe aller Kombinationen wird für dieses Beispiel geschrieben als geschachtelte Summe: 3 2 i1 j1 f x, y i j f f f 4,5 f 4, 7 2,5 f 2, 7 9,5 f 9, 7 Folie 14

74 Notation Rechenregeln Schachtelung Das Summenzeichen Σ Geschachtelte Summen Beispiel Messung Nr. Symbol Messwert Symbol Messwert 1 x 1 4 y x 2 2 y x 3 9 Mit dem Kommutativgesetz kann also die geschachtelte Summe auch so geschrieben werden: 2 3 j1 i1 f x, y i j f 4,5 f 2,5 f 9,5 f 4,7 f 2,7 f 9,7 Folie 15

75 Ordinalskala Ordinalskala Ordinalskala Definition Darstellungen Bortz, S Häufigkeiten Kennwerte Grafische Darstellung Bei einer Ordinalskala können die Realisationen einer Variablen (natürlich) geordnet werden Die Zuordnung der Zahlen zu den Ausprägungen des Merkmals spiegelt deren Ordnung wider Numerische Abstände zwischen den Realisationen können nicht interpretiert werden Die Anwendung von Rechenoperationen auf die Werte einer ordinalskalierten Variablen ist unter bestimmten Voraussetzungen erlaubt, aber im Allgemeinen eher wenig sinnvoll Folie 2

76 Ordinalskala Darstellungen Ordinalskala Ordinalskala Beispiel Häufigkeiten Kennwerte Grafische Darstellung Folie 3 Social Penetration Theory von Altman und Taylor (1958) (I) (II) (III) (IV) (V) Orientierungsstadium: Sozial erwünschte Normen und Verhaltensschemata werden ausgetauscht (z.b. Smalltalk) Exploratorisch-affektives Stadium: Partielle Öffnung der eigenen Einstellungs- und Wahrnehmungswelt gegenüber dem Anderen im Hinblick auf private, vor allem aber berufliche und weltanschauliche Inhalte. Weiterhin vorsichtige Prüfung der Interaktionsformen ( Bekanntschaftsphase ). Affektives Stadium: Intensiver und möglicherweise kritischer Austausch über private und persönliche Themen. Körperliche Zuwendung wie Berühren und Küssen. Stabiles Stadium: Die Beziehung erreicht ein Plateau, persönliche Inhalte sind geteilt, Verhalten und Emotionen des Anderen vorhersagbar. Depenetration: Zusammenbruch und mögliches Ende der Beziehung, Überwiegen von Kosten gegenüber dem Nutzen.

77 Ordinalskala Darstellungen Ordinalskala Ordinalskala Zulässige Operationen Häufigkeiten Kennwerte Grafische Darstellung Zulässige Operationen sind Äquivalenzrelationen, d.h. Gleich und Ungleich Zudem erlaubt sind qualitative Vergleichsrelationen, d.h. Größer oder Kleiner Wichtig: Diese Vergleichsrelationen umfassen nicht jede Art quantitativer Vergleiche Eine Aussage wie A ist gleich/ungleich/größer/kleiner B ist bei einer ordinalskalierten Variable zulässig, nicht aber A ist viermal so groß wie B. Folie 4

78 Ordinalskala Darstellungen Ordinalskala Ordinalskala Zulässige Transformationen Häufigkeiten Zulässig sind alle streng monotonen Transformationen, so dass die Rangordnung der Werte erhalten bleibt. Kennwerte Grafische Darstellung Folie 5

79 Ordinalskala Darstellungen Ordinalskala Ordinalskala Kritische Betrachtung Häufigkeiten Kennwerte Grafische Darstellung Bei Ordinalskalen und höheren Skalenniveaus können Intransitivitäten auftreten Intransitivität = Eine angenommene Ordnung gilt nicht für bestimmte einzelne Paarungen Beispiel: Nahrungskette in chinesischen Restaurants Mensch Hund Ratte Mensch (nach Glutamatvergiftung) Lösungen: Annahme eines niedrigeren Skalenniveaus, Einführung neuer Skalenstufen Folie 6

80 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Häufigkeiten Häufigkeiten Kennwerte Grafische Darstellung Folie 7 Ordinalskalierte Variablen sind sehr häufig diskret und endlich Es gelten die bereits eingeführten Notationen und Berechnungsvorschriften für Häufigkeiten Neben der Häufigkeitsverteilung kann auch noch die empirische Verteilungsfunktion bestimmt werden. Diese gibt an, wie viele Beobachtungen kleiner oder gleich einer bestimmten Realisation sind. Zur Berechnung der Verteilungsfunktion müssen die Realisationen zunächst der Größe nach geordnet werden.

81 Ordinalskala Darstellungen Bortz, S. 47 Ordinalskala Ordinaldaten Numerische Beschreibung: Häufigkeiten Häufigkeiten Kennwerte Grafische Darstellung Empirische Häufigkeitsverteilung und Verteilungsfunktion: Wert von X (geordnet) h(x f(x = x j ) H(X F(X x j ) x 1 h(x f(x 1 ) h(x f(x 1 ) x 2 h(x f(x 2 ) h(x f(x 1 )+h(x )+f(x 2 ) x k h(x f(x k ) h(x f(x 1 )+h(x )+f(x 2 )+ +f(x )+ +h(x k ) k ) Berechnungsvorschrift: analog für absolute Vert.funkt. H(X x j ) HF ( X x ) hf ( x ) j j c 1 c Für Ordinaldaten gelten die bereits eingeführten Konventionen zur Erstellung von Kreuztabellen Folie 8

82 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Kennwerte Häufigkeiten Kennwerte Grafische Darstellung Maße der zentralen Tendenz Modalwert Median Andere Lagemaße Extrema (Minimum, Maximum) Quantile, Quantilsrang Generell gilt: Kennwerte für niedrigere Skalenniveaus sind für alle höheren anwendbar Folie 9

83 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Der Modus oder Modalwert für ordinalskalierte Daten ist genau so definiert wie für nominalskalierte Daten Er ist schlichtweg die Realisation x der Variablen X mit dem häufigsten Vorkommen h(x) Aber: Der Modalwert von Ordinaldaten sagt uns mehr über ihre Häufigkeitsverteilung als bei Nominaldaten: 1. Der Modalwert markiert die Lage der häufigsten Realisation relativ zu den anderen Realisationen Folie 10

84 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Folie 11

85 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Der Modus oder Modalwert für ordinalskalierte Daten ist genau so definiert wie für nominalskalierte Daten Er ist schlichtweg die Realisation x der Variablen X mit dem häufigsten Vorkommen h(x) Aber: Der Modalwert von Ordinaldaten sagt uns mehr über ihre Häufigkeitsverteilung als bei Nominaldaten: 1. Der Modalwert markiert die Lage der häufigsten Realisation relativ zu den anderen Realisationen 2. Und man kann uni-, bi- und multimodale Verteilungen unterscheiden Folie 12

86 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Modalwert Häufigkeiten Kennwerte Grafische Darstellung Folie 13

87 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Der Median ist der Grafische Darstellung 50 : 50 Punkt einer Datenreihe Folie 14

88 Ordinalskala Darstellungen Bortz, S Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Der Median ist der Grafische Darstellung 0.50 : 0.50 Punkt einer Datenreihe Folie 15

89 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Grafische Darstellung Der Median ist der Wert, der einen Datensatz mit n Messwerten in zwei gleich große Hälften teilt. Notation: x med oder x med besitzt folgende Eigenschaften: x 1. Mindestens 0.5 n (50%) der Messwerte sind kleiner oder gleich dem Median 2. Mindestens 0.5 n (50%) der Messwerte sind größer oder gleich dem Median Folie 16 Problem: Bei einer geraden Zahl von Messwerten ist der Median nicht eindeutig er liegt dann zwischen den Messwerten

90 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Median Häufigkeiten Kennwerte Grafische Darstellung Folie 17 Der Median stimmt häufig mit keinem tatsächlichen Messwert überein Median (wie auch der Modalwert) sind äquivariant gegenüber gewissen (z.b. linearen) Transformationen Insbesondere 1. Addition einer Konstanten a zu allen n Messwerten x 1 x n x a x a 2. Multiplikation aller n Messwerte x 1 x n mit einer Konstanten a x a x a

91 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Quantile Häufigkeiten Kennwerte Ein Quantil ist der Grafische Darstellung p : q Punkt einer Datenreihe, wobei q = 1 p Folie 18

92 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Numerische Beschreibung: Quantile Häufigkeiten Kennwerte Ein Quantil ist z.b. der Grafische Darstellung 0.50 : 0.50 Punkt einer Datenreihe. Folie 19

95 Ordinalskala Darstellungen Bortz, S Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Folie 22 Ordinaldaten Numerische Beschreibung: Quantile Quantile sind Zahlen, die einen Datensatz mit n Messwerten in bestimmtem Verhältnis teilen Notation: x p (z. B. x 0.75 ) x p (0 p 1) besitzt folgende Eigenschaften: 1. Mindestens n p Messwerte sind kleiner oder gleich dem Quantil 2. Mindestens n (1 p) Messwerte sind größer oder gleich dem Quantil Je nach der Anzahl von Unterteilungen unterscheidet man Percentile (100er Einteilung), Dezentile (10er Einteilung) und Quartile (4er Einteilung)

96 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Ordinaldaten Numerische Beschreibung: Quantile Wichtige Quantile sind: Perzentile: x.01, x.02,, x.99, x 1.0 bzw. x 1%, x 2%,, x 99%, x 100% Grafische Darstellung Median (2. Quartil, 50% Perzentil) 25% Perzentil (1. Quartil, unteres Quartil) und 75% Perzentil (3. Quartil, oberes Quartil) Dezile: x.10, x.20,, x.90 Folie 23

97 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Quantile A cautionary note about conventions In Literatur und Softwarepaketen sind die Berechnungsvorschriften für Quantile häufig unterschiedlich definiert. Maß Bortz Excel SPSS Median Quartil Quartil Für einen Beispieldatensatz mit n=12. Folie 24

98 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Der Quantilsrang Häufigkeiten Kennwerte Grafische Darstellung Als Quantil x p war diejenige Realisation x der Variablen X definiert, die die Daten in einen Anteil von p Messwerten unterhalb oder gleich der Realisation x sowie 1-p Messwerten oberhalb oder gleich x teilt. Besonders bei angewandten Fragestellungen ist oft auch die entgegengesetzte Sichtweise relevant. Beispiel: Eine Person habe in einem Leistungstest einen Wert von 105 Punkten erzielt. Wie viele Personen in der Stichprobe sind nun besser/schlechter? Dies kann über den Quantilsrang p x ermittelt werden. Folie 25

99 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Der Quantilsrang Verfahren der Rangbildung Bei der Rangbildung von n Messwerten x 1 x n einer Variablen X können maximal n Ränge vergeben werden. Per Konvention erhält die numerisch niedrigste Ausprägung von X den Rangplatz 1, die höchste den Rangplatz n (kleinere Zahl = kleinerer Rang). Bei mehreren gleichen Werten ( Ties ) von X wird der mittlere Rangplatz vergeben nach der Regel: Es gebe m gleiche Werte von X. Wären sie unterschiedlich und direkt aufeinander folgend, erhielten sie die Rangplätze rg j rg j+m-1. Der mittlere Rang ist dann Folie 26 rg Tie rg 1 j m m1 irg j rg i

100 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Der Quantilsrang Berechung Häufigkeiten Kennwerte Grafische Darstellung Folie 27 Nach der Berechnung der Rangzahl rg(x) eines Merkmalsträgers ermittelt man seinen Quantilsrang p x über p x 0.5 rg x n = Stichprobengröße (d.h. der maximale Rang) Problem: p x reicht nicht von 0 bis 1, sondern liegt in einem etwas schmaleren Bereich, abhängig von der Größe des n. Die Korrekturformel für den Quantilsrang behebt dieses Problem p xcorr, p p n x max p min p min

101 Ordinalskala Darstellungen Ordinalskala Ordinaldaten Der Quantilsrang Berechung Häufigkeiten Kennwerte Grafische Darstellung Folie 28 Nach der Berechnung der Rangzahl rg(x) eines Merkmalsträgers ermittelt man seinen Quantilsrang p über p x 0.5 rg x n = Stichprobengröße (d.h. der maximale Rang) Problem: p reicht nicht von 0 bis 1, sondern liegt in einem etwas schmaleren Bereich, abhängig von der Größe des n. Statt der Korrekturformel gilt einfacher auch direkt p xcorr, n rg x 1 n 1

102 Ordinalskala Darstellungen Bortz, S Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Numerische Beschreibung: Extrema Extrema sind die Grenzen des beobachteten Bereichs von Messwerten Das Minimum x min ist die untere Grenze (UG) Das Maximum x max ist die obere Grenze (OG) Die Extrema können als spezielle Quantile aufgefasst werden (0. und 4. Quartil) Achtung: Die Extrema einer Messwertreihe sind nicht notwendigerweise identisch mit den Grenzen des Wertebereichs der Variablen Folie 29

103 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Grafische Beschreibung: Häufigkeitsverteilung Für die empirische Häufigkeitsverteilung von Ordinaldaten werden dieselben Darstellungen verwendet wie bei Nominaldaten Achtung: Die Abfolge auf der x-achse ist geordnet! Note x h(x) f(x) F(x) Folie 30

104 Ordinalskala Darstellungen Ordinalskala Häufigkeiten Kennwerte Grafische Darstellung Ordinaldaten Grafische Beschreibung: Verteilungsfunktion Die empirische Verteilungsfunktion bei k Realisationen ist j F( X x ) F( x ) f ( x ) j j c c1 mit j = 1 k Note x h(x) f(x) F(x) Zur grafischen Darstellung werden also die empirischen relativen Häufigkeiten aufsummiert Folie 31

105 Ordinalskala Ordinalskala Ordinaldaten Lagemaße veranschaulicht Darstellungen Häufigkeiten Kennwerte Grafische Darstellung Folie 32

106 Ordinalskala Ordinalskala Ordinaldaten Lagemaße veranschaulicht Darstellungen Häufigkeiten Kennwerte Grafische Darstellung Folie 33

107 Einführung Kreuztabellen Intervalldaten I Intervallskala Definition Es wird eine Einheit definiert Intervalldaten II Bortz, S Grafische Darstellung I Es existiert kein natürlicher Nullpunkt Differenzen von Werten können verglichen werden, nicht aber die Werte selbst Wird am häufigsten in empirischen Untersuchungen angenommen Intervallskalierte Variablen können diskret oder stetig sein Folie 2

108 Intervalldaten I Intervalldaten II Einführung Intervallskala Beispiel Kreuztabellen Grafische Darstellung I Attitudes Toward Housecleaning Scale von Ogletree, Worthen, Turner & Vickers (2006). Ihre Aufgabe ist es, ihre Gefühle gegenüber jeder Aussage dahingehend zu kennzeichnen, ob sie (1) stark zustimmen, (2) etwas zustimmen, (3) weder zustimmen noch ablehnen, (4) etwas ablehnen oder (5) stark ablehnen. Bitte verdeutlichen Sie Ihre Meinung dadurch, dass sie entweder 1, 2, 3, 4 oder 5 auf dem Antwortblatt schwärzen. Folie 3 Einen Stapel dreckigen Geschirrs über Nacht im Spülbecken liegen zu lassen finde ich ekelhaft. Ich finde Staubwischen entspannend. Den Müll rauszubringen macht mir Spaß Frauen sollten die primäre Verantwortung für die Hausarbeit übernehmen. Eine unordentliche Wohnung zu haben macht mir nichts

109 Intervalldaten I Intervalldaten II Einführung Intervallskala Zulässige Transformationen Kreuztabellen Grafische Darstellung I Zulässige Operationen sind Äquivalenzrelationen, d.h. Gleich und Ungleich Zudem erlaubt sind qualitative Vergleichsrelationen, d.h. Größer oder Kleiner Erlaubt sind weiterhin quantitative Vergleichsrelationen, die sich auf Differenzen beziehen Eine Aussage wie Der Unterschied zwischen A und B ist doppelt so groß wie zwischen A und C ist bei einer intervallskalierten Variable zulässig, nicht aber A ist doppelt so groß wie B. Folie 4

110 Intervalldaten I Intervalldaten II Einführung Intervallskala Zulässige Transformationen Kreuztabellen Grafische Darstellung I Zulässig sind alle linearen Transformationen (die Grundrechenarten), so dass die Verhältnisse zwischen Differenzen erhalten bleiben. Folie 5

111 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Intervallskala Zulässige Transformationen Grafische Darstellung I Folie 6 Die Aussage Person E ist doppelt so gut wie Person C, ausgehend von Skala 1, gilt nicht für Skala 3 und 4.

112 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Intervallskala Zulässige Transformationen Grafische Darstellung I Folie 7 Wohl aber gilt immer: Der Unterschied zwischen A und B ist doppelt so groß wie zwischen B und C

113 Intervalldaten I Intervalldaten II Einführung Intervallskala Kritische Betrachtung Kreuztabellen Grafische Darstellung I Die bekanntesten und am meisten verbreiteten statistischen Verfahren setzen eine Intervallskala voraus Der Umgang mit niedrigeren Skalenniveaus ist mathematisch oftmals weitaus komplexer Die ungeprüfte Annahme der Intervallskala in empirischen Untersuchungen ist oft problematisch Folie 8

114 Intervalldaten I Intervalldaten II Einführung Intervalldaten Numerische Beschreibung: Das Problem Häufigkeit Kreuztabellen Grafische Darstellung I Problem: Intervallskalierte Variablen können u.u. beliebige Ausprägungen besitzen, die sich nicht mehr sinnvoll in einer Tabelle darstellen lassen Beispiele: Körpergrößen, Serotoninspiegel, Reaktionszeit Lösung: Es muss eine Aggregation vieler Realisationen in wenige Kategorien (oder Klassen ) stattfinden Bei der Klassenbildung für eine Variable X findet im Prinzip nichts anderes als eine Transformation von X in eine neue Variable C statt, und zwar gemäß: C c1 : 1, wenn X { } c2 : 2, wenn X { } ck : k, wenn X { } Folie 9

115 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Klassenbildung Bei der Klassen-/Kategoriebildung sind zwei Fragen zu beantworten: 1. Wie viele Klassen sollen gebildet werden? 2. Wie werden die Grenzen dieser Klassen festgelegt? Dabei kommt es entscheidend darauf an, ob die Daten diskret oder stetig sind Folie 10

116 Intervalldaten I Intervalldaten II Einführung Intervalldaten Numerische Beschreibung: Klassenbildung Kreuztabellen Grafische Darstellung I Folie 11 Zur Bestimmung der Anzahl k von Klassen gibt es verschiedene Formeln. Als Faustregeln gelten: Anzahl der Beobachtungen n 5 bis 50 5 bis 8 Klassenzahl k 50 bis bis bis bis 12 >250 8 bis 25 Eine einfache Formel, die oft zu einer sinnvollen Klassenanzahl k führt, lautet k n log2 1 mit Aufrundung Statt der Beobachtungen n wird zuweilen auch die Anzahl der Realisationen verwendet.

117 Intervalldaten I Intervalldaten II Bortz, S Einführung Intervalldaten Numerische Beschreibung: Klassenbildung Kreuztabellen Grafische Darstellung I Folie 12 Die k Messwertklassen dürfen sich nicht überschneiden, sie sind also wechselseitig ausschließend. Die untere und obere Klassengrenze UG j und OG j gehören zur Klasse c j, die obere Grenze der vorherigen Klasse OG j-1 jedoch nicht (j = 1 k) c j = [UG j OG j ] oder c j = (OG j-1 OG j ] Alle Klassen haben im Normalfall dieselbe Breite. Die Anzahl der Klassen ist zunächst frei wählbar. Es ist aber zu beachten: 1. Es sollte möglichst wenige leere Klassen geben 2. Es sollten keine in den Daten enthaltenen wichtigen Informationen herausggregiert werden (z.b. mehrere Modalwerte)

118 Intervalldaten I Intervalldaten II Einführung Intervalldaten Numerische Beschreibung: Klassenbildung Kreuztabellen Grafische Darstellung I Folie 13 Die Klassenbreite d bei einer gewünschten Anzahl von k gleich breiten Klassen wird berechnet als d max( X) min( X) k Hier ist X die ursprüngliche intervallskalierte Variable Es können die beobachteten Messwerte oder die theoretischen Realisationen von X verwendet werden Bei der Berechnung der Klassenbreite muss auf Ausreißer in der Variablen X geachtet werden, da solche die Klassenbreite erheblich verzerren können.

119 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Klassenbildung Bei diskreten Daten werden die Klassengrenzen nach Möglichkeit nicht-überlappend angegeben. Bei kontinuierlichen Daten werden die Klassengrenzen überlappend angegeben, wobei per Konvention die obere Grenze zur Klasse gehört, die untere aber nicht (mit Ausnahme der ersten Klasse). Die Klassenbreite einer Klasse c j ist d j = OG j OG j-1 Achtung: Für die unterste Klasse (j = 1) nimmt man UG 1 statt OG j-1 Folie 14

120 Intervalldaten I Intervalldaten II Bortz, S. 62 Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Häufigkeiten Absolute und relative Häufigkeiten für n Messwerte einer kategorisierten Variablen C werden wie üblich berechnet Die absolute Häufigkeit einer hc der k Klassen ist h(c j ) Also ist: j mit j = 1 k f( c ) Klasse C h(c) f(c) H(c) F(c) j n Folie 15

121 Intervalldaten I Intervalldaten II Bortz, S. 62 Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Verteilungsfunktion Die empirische Verteilungsfunktion bei k Klassen ist k FC ( c) Fc ( ) f ( c ) mit j = 1 k j j j j1 Es werden also die empirischen relativen Häufigkeiten aufsummiert Klasse C h(c) f(c) H(c) F(c) Folie 16

122 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Beispiel 25 Abiturienten erreichen in ihrer Abschlussarbeit folgende Punktzahlen: (11, 15, 8, 13, 8, 11, 14, 11, 11, 14, 13, 11, 2, 9, 10, 10, 14, 7, 7, 12, 12, 8, 6, 11, 13) Unter der Annahme, dass die Skala von 0 bis 15 reicht, ergibt sich diese Häufigkeitstabelle bei 5 Klassen: Note h(x) f(x) F(x) Folie 17

123 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Beispiel 25 Ratten erreichen in einem Experiment folgende Reaktionszeiten: (11.23, 15.0, , 13.3, 8.955, 11.0, , 11.63, 11.39, , , 11.32, 2.5, 9.814, 10.03, 10.99, 14.3, 7.523, 7.49, , 12.88, 8.0, 6.748, 11.1, 13.0) Schreibweise der Klassengrenzen in der Tabelle? Note Reak.z. h(x) f(x) F(x) Folie 18

124 Intervalldaten I Intervalldaten II Bortz, S Einführung Intervalldaten Grafische Beschreibung: Histogramm Kreuztabellen Grafische Darstellung I Folie 19 Das Histogramm stellt die Häufigkeiten vieler Realisationen in einem Säulendiagramm mit weniger Klassen als Realisationen dar Die Klassen müssen nicht notwendig gleich breit sein Für die Klassenbildung beim Histogramm gelten dieselben Faustregeln wie bei den Kreuztabellen Die Häufigkeiten können entweder absolute Häufigkeiten (absolutes Histogramm) sein oder relative Häufigkeiten (relatives Histogramm) Bei gleichen Klassenbreiten zeigt zumeist die Höhe einer Säule die Häufigkeit der Elemente in der Klasse. (wie beim Säulen-/Balkendiagramm)

125 Intervalldaten I Intervalldaten II Einführung Kreuztabellen Intervalldaten Grafische Beschreibung: Histogramm Beispiel: Verteilung des IQ unserer Teilnehmer. Grafische Darstellung I Folie 20 Student IQ h(iq) 92 Werte zwischen 89 und Absolutes Histogramm

126 Intervalldaten I Intervalldaten II Einführung Intervalldaten Grafische Beschreibung: Histogramm Kreuztabellen Grafische Darstellung I Frage: Warum darf die Höhe der Säule in einem Histogramm nur dann die Häufigkeit der Elemente in den Klassen repräsentieren, wenn diese gleich breit sind? Beispiel: Säule 1 ist etwas höher als Säule 3, allerdings ist die Klassenbreite unterschiedlich groß Folie 21 Aufgrund der Flächenbewertung der menschlichen Wahrnehmung scheint Klasse 3 wesentlich mehr Merkmalsträger zu umfassen als Klasse 1

127 Intervalldaten I Intervalldaten II Einführung Intervalldaten Grafische Beschreibung: Histogramm Kreuztabellen Grafische Darstellung I Regel: Wählt man ungleiche Klassenbreiten, muss das Histogramm normiert werden (wegen der Flächenbeurteilung der menschlichen Wahrnehmung). Wenn nicht die Höhe, sondern die Fläche A j einer Säule die Häufigkeit repräsentieren soll, gilt für eine Klasse x j : A = f(x j ), und damit f(x j ) = a j d j (a j ist die Höhe der Säule, d j die Klassenbreite) Somit ist die Höhe einer Säule a j = f(x j ) / d j Folie 22 Dies gilt auch für die Darstellung mit absoluten Häufigkeiten h(x j ) Dann ist die Höhe einer Säule a j = h(x j ) / d j

128 Intervalldaten I Intervalldaten II Einführung Intervalldaten Grafische Beschreibung: Histogramm Kreuztabellen Grafische Darstellung I Regel: Wählt man ungleiche Klassenbreiten, muss das Histogramm normiert werden (wegen der Flächenbeurteilung der menschlichen Wahrnehmung). Wenn nicht die Höhe, sondern die Fläche A j einer Säule die Häufigkeit repräsentieren soll, gilt für eine Klasse x j : A = f(x j ), und damit f(x j ) = a j d j (a j ist die Höhe der Säule, d j die Klassenbreite) bzw. a j = f(x j ) / d j Normierte relative Häufigkeit Folie 23

129 Intervalldaten I Intervalldaten II Bortz, S. 62 Einführung Kreuztabellen Intervalldaten Grafische Beschreibung: Empirische Verteilungsfunktion Die empirische Verteilungsfunktion bei k Klassen ist Grafische Darstellung I Folie 24 k F( X x ) F( x ) f ( x ) j j j j1 mit j = 1 k Note x h(x) f(x) F(x) Es werden also die empirischen relativen Häufigkeiten aufsummiert

130 Intervalldaten I Intervalldaten II Einführung Intervalldaten Grafische Beschreibung: Histogramm Kreuztabellen Grafische Darstellung I Problem: Ein normiertes Histogramm ist in Bezug auf die y-achse nur schwer interpretierbar. Um die relative/absolute Häufigkeit einer Klasse zu bestimmen, muss außer bei einer Klassenbreite von 1 stets gerechnet werden Dies führt ungleichen Klassenbreiten zu unnötigem Interpretationsaufwand Normierte relative Häufigkeit Folie 25

131 Intervalldaten I Intervalldaten II Intervalldaten Grafische Beschreibung: Histogramm Achtung: Die Wahl der Klassenanzahl kann für die Aussage entscheidend sein. Beispiel: Körpergrößen an der Geisteswissenschaftlichen Fakultät der Uni Mainz Klassenanzahl: 25 Klassenanzahl: 10 f(iq) f(iq) Folie 26

132 Intervalldaten I Intervalldaten II Einführung Intervalldaten Grafische/verbale Beschreibung: Modalität Kreuztabellen Grafische Darstellung I Je nach Anzahl der (lokalen) Maxima unterscheidet man uni-, bi- und multimodale Verteilungen. Folie 27

133 Intervalldaten I Intervalldaten II Intervalldaten Grafische/verbale Beschreibung: Schiefe Symmetrische Verteilungen: Häufigkeiten für die Ausprägungen einer Zufallsvariablen verlaufen (annähernd) gleichartig um den Mittelpunkt. Linkssteile/rechtsschiefe Verteilungen: Häufigkeiten laufen rechts des Mittelpunktes flacher aus. Rechtssteile/linksschiefe Verteilungen: Häufigkeiten laufen links des Mittelpunktes flacher aus. Folie 28

134 Intervalldaten I Intervalldaten II Bortz, S Kreuztabellen Intervalldaten Numerische Beschreibung: Kennwerte Grafische Darstellung I Kennwerte Grafische Darstellung II Folie 29 Maße der zentralen Tendenz Modalwert Median Mittelwert Andere Lagemaße Extrema (Minimum, Maximum) Quantile, Quantilsrang Streuungsmaße (Dispersionsmaße) Spannweite Interquartilsabstand Mittlere Differenz (Abweichungs-)Quadratsumme Varianz Standardabweichung

135 Intervalldaten I Intervalldaten II Kreuztabellen Intervalldaten Numerische Beschreibung: Alte Bekannte Grafische Darstellung I Kennwerte Grafische Darstellung II Modus, Median, Quantile und Quantilsränge sind bei Intervalldaten identisch definiert wie bei Nominalbzw. Ordinaldaten Es gelten dieselben Regeln der Berechnung und Interpretation Auch die Eigenschaft der Äquivarianz gegenüber den erlaubten (linearen) Transformationen bleibt erhalten a ax b X ω = einer der genannten Kennwerte b Folie 30

136 Intervalldaten I Intervalldaten II Kreuztabellen Intervalldaten Numerische Beschreibung: Mittelwert Grafische Darstellung I Kennwerte Grafische Darstellung II Folie 31 Der Mittelwert ist bei n Beobachtungen x 1 x n definiert als 1 1 x x x x x n ( 1 2 n) n n i 1 x quer ist durch extreme Werte beeinflussbar (ausreißerempfindlich) Ist der Schwerpunkt der Beobachtungen, d.h. n i1 x i x 0 i

137 Intervalldaten I Intervalldaten II Kreuztabellen Intervalldaten Numerische Beschreibung: Mittelwert Grafische Darstellung I Kennwerte Grafische Darstellung II Folie 32 Der Mittelwert stimmt häufig mit keiner beobachteten Realisation überein Der Mittelwert ist äquivariant gegenüber bestimmten (z.b. linearen) Transformationen Insbesondere 1. Addition einer Konstanten b zu allen n Beobachtungen x 1 x n x b x b 2. Multiplikation aller n Beobachtungen x 1 x n mit einer Konstanten a a xax

138 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Intervalldaten Numerische Beschreibung: Lageregeln Lageregeln für die Maße der zentralen Tendenz bei unimodalen Verteilungen Bei symmetrischen Verteilungen: x x x med Bei linkssteilen Verteilungen: x x x med mod mod Bei rechtssteilen Verteilungen x x x med mod Folie 33

139 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Lageregeln Bei symmetrischen Verteilungen x x x med mod Kennwerte Grafische Darstellung II Folie 34 x x med x mod

140 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Lageregeln Bei linkssteilen Verteilungen x x x med mod Kennwerte Grafische Darstellung II x mod x x med Folie 35

141 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Lageregeln Bei rechtssteilen Verteilungen x x x med mod Kennwerte Grafische Darstellung II x x med x mod Folie 36

142 Intervalldaten I Intervalldaten II Bortz, S. 32 Kreuztabellen Intervalldaten Numerische Beschreibung: Spannweite Grafische Darstellung I Kennwerte Grafische Darstellung II Die Spannweite d n ist die Differenz zwischen dem kleinsten und größten Wert aller n Messwerte. Sie ist definiert als: d x x n max min Die Spannweite ist ausreißerempfindlich. Die Spannweite ist eher uninformativ, da sie nur zwei von n Messwerten berücksichtigt. Folie 37

143 Intervalldaten I Intervalldaten II Kreuztabellen Intervalldaten Numerische Beschreibung: Interquartilsabstand Grafische Darstellung I Kennwerte Grafische Darstellung II Der Interquartilsabstand d q ist die Differenz zwischen dem 1. und 3. Quartil Er ist definiert als d x x q Manchmal wird auch ein halber Interquartilsabstand berechnet als d q /2. Folie 38

144 Intervalldaten I Intervalldaten II Bortz, S Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Folie 39 Intervalldaten Numerische Beschreibung: Mittlere Abweichung Als mittlere Abweichung (MD) von n Beobachtungen x 1 x n in einem Datensatz wird die Summe aller Abweichungsbeträge zum Median bezeichnet. 1 n i n i 1 MD x x Für jeden anderen Wert als für den Median ist der mittlere Abweichungsbetrag größer, d.h. n 1 1 n x x x c i i1 n i1 n i

145 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Folie 40 Intervalldaten Numerische Beschreibung: Abweichungsquadratsumme Die Abweichungsquadratsumme (oder auch: Fehlerquadratsumme oder einfach Quadratsumme) ist die Summe der quadrierten Abweichungen aller n Beobachtungen x 1 x n vom Mittelwert. QS x x x n 2 i1 Erfasst die Streuung um den Mittelwert Nur falls keine Streuung besteht, ist QS = 0, d.h. alle beobachteten Werte sind gleich. Sonst: QS> 0 Je größer die Streuung, desto größer ist die QS Problem: Die Fehlerquadratsumme wird um so größer, je mehr Beobachtungen vorliegen i

146 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Intervalldaten Numerische Beschreibung: Abweichungsquadratsumme Für jeden anderen Wert als für den Mittelwert ist die Summe der Abweichungsquadrate höher n n 2 2 xi x xi c i1 i1 Der Mittelwert minimiert also die quadrierten Abweichungen aller Beobachtungen. Folie 41

147 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Varianz Die Varianz ist das mittlere Abweichungsquadrat aller n Beobachtungen x 1 x n vom Mittelwert. Kennwerte Grafische Darstellung II Folie n s x xi x n i 1 2 Erfasst die mittlere quadrierte Streuung um den Mittelwert Nur falls keine Streuung besteht, ist s² = 0, d.h. alle beobachteten Werte sind gleich. Sonst: s² > 0 Je größer die Streuung, desto größer ist die Varianz Ist anfällig gegenüber Ausreißern

148 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Intervalldaten Numerische Beschreibung: Varianz Die Formel für die Varianz lässt sich leicht umformen in eine rechnerisch manchmal günstigere Variante: Kennwerte Grafische Darstellung II Folie 43 n 1 1 n i i1 n i1 n x x x x x x Die Varianz ist also die Differenz des Mittelwerts der quadrierten Daten und dem quadrierten Mittelwert der Daten. Dies wird auch als Momentenschreibweise der Varianz bezeichnet. i

149 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Intervalldaten Numerische Beschreibung: Standardabweichung Problem: Die Varianz ist nicht äquivariant zu erlaubten Skalentransformationen s ax a s x ( ) ( ) (mit a = const.) Durch Wurzelziehen erhält man die Standardabweichung (SD, standard deviation) 1 n i n i 1 s x s x x x 2 2 Folie 44 Die Standardabweichung ist äquivariant zu den erlaubten Skalentransformationen

150 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Folie 45 Intervalldaten Numerische Beschreibung: s² und s Verhalten von Varianz und Standardabweichung bei Transformationen der n Beobachtungen x 1 x n 1. Die Addition einer Konstanten a zu allen Werten x verändert Varianz und Standardabweichung nicht s²(x + a) = s²(x) s(x + a) = s(x) 2. Die Multiplikation aller Werte x mit einer Konstanten a führt zu einer Erhöhung der Varianz um a² und der Standardabweichung um a s²(a x) = a² s²(x) s(a x) = a s(x)

151 Intervalldaten I Intervalldaten II Bortz, S Kreuztabellen Intervalldaten Grafische Beschreibung: Box-Whisker-Plot Grafische Darstellung I Kennwerte Mithilfe der Fünf-Punkte- Zusammenfassung (x min, x.25, x med, x.75, x max ) können Daten grafisch am Boxplot veranschaulicht werden x max x.75 x x.25 Grafische Darstellung II Diese Variante ist problematisch, weil Ausreißer die Länge der Whisker erheblich vergrößern können x min Note Folie 46

152 Intervalldaten I Intervalldaten II Kreuztabellen Intervalldaten Grafische Beschreibung: Box-Whisker-Plot Grafische Darstellung I Kennwerte Grafische Darstellung II Eine zweite, häufiger verwendete Variante des Boxplots verwendet den 1.5fachen Interquartilsabstand d q für die Länge der Whisker. Box und Whisker enden am letzten Datenpunkt innerhalb ihrer Reichweite Datenpunkte außerhalb der Whisker werden explizit eingetragen (ο) dq x.75 x x dq 3 dq dq Folie 47 Ausreißer >3d q werden mit Sternchen (*) markiert. Note

153 Intervalldaten I Intervalldaten II Intervalldaten Grafische Beschreibung: Box-Whisker-Plot Folie 48

154 Intervalldaten I Intervalldaten II Intervalldaten Grafische Beschreibung: Box-Whisker-Plot Folie 49

155 Intervalldaten I Intervalldaten II Kreuztabellen Grafische Darstellung I Kennwerte Intervalldaten Grafische Beschreibung: Fehlerbalkendiagramm Das Fehlerbalkendiagramm (Error Bar) veranschaulicht Mittelwerte und die Streuung von Daten für mindestens eine Stichprobe. Für die Länge der Fehlerbalken existieren verschiedene Konventionen (± 1 SD, ± 1.96 SD, ± 2.58 SD) Grafische Darstellung II Körpergröße in in cm cm (+/ (+/ SD) SD) Folie Frauen Geschlecht Männer

156 Kreuztabellen Grafische Darstellung I Kennwerte Grafische Darstellung II Intervalldaten Mittelwert und Varianz aus kategorisierten Daten Liegen intervallskalierte Daten bereits in kategorisierter Form vor (z.b. in einer Häufigkeitstabelle), so können daraus Mittelwert und Varianz näherungsweise bestimmt werden. Es sei x jmid, OG j UG 2 die Kategoriemitte der j-ten von insgesamt k Kategorien mit der Untergrenze UG j, der Obergrenze OG j und der Häufigkeit f(x j ) j Bortz, S. 41, 46 Mittelwert k j1 j, x f x x jmid Varianz k 2 s ( x) f xj xj, mid x j1 2 Folie 2

157 Bortz, S z-standardisierung Transformationsregel Ziel: Angabe der relativen Lage von Werten in einer Verteilung. 1. Quantile: wie bereits gesehen 2. Angabe einer normierten Differenz eines Messwertes zum Mittelwert Berechnungsvorschrift: Jede Differenz eines Messwertes wird durch die Standardabweichung aller Messwerte geteilt. Die erhaltenen Werte werden als z-werte bezeichnet. z x x s x x Folie 3

158 z-standardisierung Eigenschaften Der z-wert kann auch als Differenz eines normierten Datenwertes vom normierten Mittelwert betrachtet werden, denn z x x x x x s s s x x x Der Mittelwert von z-werten ist immer 0 Die Standardabweichung von z-werten ist immer 1 Folie 4

159 z-standardisierung Skalentransformation Mithilfe der z-transformation können Messdaten mit beliebigem Mittelwert und Standardabweichung in Daten transformiert werden, die einen definierten Mittelwert und Standardabweichung aufweisen. Schritt 1: z-standardisierung jedes Datenpunktes Schritt 2: Transformation jedes Datenpunktes in die neue Skala x neu zsneu xneu Folie 5 Beispiele: Hamburg-Wechsler IQ-Test (MW=100, s=15), IQ-Skala laut IST (MW=100, s=10), Stanine- Skala (MW=5, s=2),

160 Bortz, S Einführung Scatterplot Kovarianz Korrelation Bivariate Daten Grundlagen Bisher wurden Kennwerte für den univariaten Fall betrachtet, d.h. für Daten einer Variablen Mit geschachtelten Kontingenztabellen wurde eine kompakte Darstellungsmöglichkeit für den multivariaten Fall beschrieben, d.h. für Daten mehrerer Variablen In der Statistik sind weitere Verfahren gebräuchlich, die speziell den Zusammenhang zweier Variablen (also für den bivariaten Fall) beschreiben. Beispiel: Man weiß, dass die Nervenleitgeschwindigkeit am Unterarm und der im Intelligenztest gemessene IQ positiv zusammenhängen. Folie 6 Frage: Wie kann ein solcher Zusammenhang einfach grafisch/numerisch dargestellt werden?

161 Einführung Bivariate Intervalldaten Grundlagen Scatterplot Kovarianz Korrelation Die Intervallskala trägt Informationen über die Ordnung von Ausprägungen und hat eine feste Einheit zwischen den Ausprägungen Die Werte einer intervallskalierten Variablen sind nicht direkt vergleichbar, wohl aber die Unterschiede zwischen Werten Weil die Ausprägungen einer festen Einheit folgen, kann man intervallskalierte Daten sowohl grafisch als auch numerisch sehr einfach behandeln. Folie 7

162 Einführung Bivariate Intervalldaten Grafische Beschreibung Scatterplot Scatterplot Kovarianz Korrelation Folie 8

163 Einführung Scatterplot Kovarianz Korrelation Bivariate Intervalldaten Numerische Beschreibung - Kennwerte Gewünschte Eigenschaften eines Zusammenhangskoeffizienten Sollte die Stärke eines Zusammenhangs numerisch ausdrücken Sollte die Richtung des Zusammenhangs anzeigen (sofern sinnvoll) Sollte invariant unter zulässigen Transformationen sein (z.b. m in cm) Sollte einfach interpretierbar sein Folie 9

164 Einführung Scatterplot Kovarianz Korrelation Bivariate Intervalldaten Numerische Beschreibung - Kovarianz Für n Beobachtungen aus zwei Variablen x 1 x n und y 1 y n ist die Kovarianz definiert als n 1 cov( x, y) s ( x x)( y y) xy i i n i 1 Die Kovarianz ist Null, wenn kein Zusammenhang zwischen den Realisationen der Variablen besteht Die Kovarianz ist positiv, wenn ein gleichsinniger Zusammenhang besteht Die Kovarianz ist negativ, wenn ein gegensinniger Zusammenhang besteht. Folie 10

165 Einführung Scatterplot Kovarianz Korrelation Bivariate Intervalldaten Numerische Beschreibung - Kovarianz Die Kovarianz erfüllt nicht die Forderung der Invarianz gegenüber erlaubten Transformationen Addition einer Konstanten zu x und y: s ( x a, y b) s ( x, y) xy xy Aber: Multiplikation von x und y mit einer Konstanten s ( a x, by) abs ( x, y) xy xy Die Kovarianz ist also numerisch schwer zu interpretieren Folie 11

166 Einführung Scatterplot Bivariate Intervalldaten Numerische Beschreibung - Korrelation Für n Beobachtungen aus einem Zufallsexperiment x 1 x n und y 1 y n ist der Korrelationskoeffizient definiert als Kovarianz Korrelation r xy 1 n n i1 ( x x)( y y) 1 1 n i n n ( x ) 2 ( ) 2 i x yi y i1 n i1 i s s x xy s y Für die Richtungsinformation gelten dieselben Regeln wie bei der Kovarianz Folie 12 Bei der Korrelation ist zudem die Stärke (der Betrag) des Zusammenhangs interpretier- und vergleichbar.

167 Einführung Scatterplot Kovarianz Korrelation Bivariate Intervalldaten Numerische Beschreibung - Korrelation Der so definierte Korrelationskoeffizient r xy wird auch als Produkt-Moment-Korrelation oder Korrelationskoeffizient nach Pearson bezeichnet. Für Daten unterhalb Intervallskalenniveau gibt es andere Berechnungsformeln für die Korrelation Die Korrelation ist Null, wenn kein Zusammenhang zwischen den Ausprägungen der Zufallsvariablen besteht Die Korrelation liegt immer zwischen -1 und 1. Negative Werte zeigen einen gegensinnigen, positive Werte einen gleichsinnigen Zusammenhang an Folie 13 Die Korrelation ist anfällig gegenüber Ausreißern

168 Einführung Bivariate Intervalldaten Nichtlineare Zusammenhänge und die Korrelation Scatterplot Kovarianz Korrelation Folie 14

169 Einführung Bivariate Intervalldaten Numerische Beschreibung - Vergleich Scatterplot Kovarianz Korrelation Kovarianz s xy (x,y) = s xy (y,x) s xy (x, a) = 0 s xy (a, b) = 0 Korrelation r(x,y) = r(y,x) r(x, a) = nicht def. r(a, b) = nicht def. s xy (x, x) = s² x (x) r(x, x) = 1 s xy (a x+b, c y+d) = a c s xy (x, y) r(a x+b, c y+d) = r(x, y) Achtung: Ist a oder b negativ, verändert sich das Vorzeichen von r, sind beide negativ, bleibt r gleich. Folie 15 Mit a, b, c, d = konstante Werte

170 Einführung Scatterplot Kovarianz Korrelation Bivariate Intervalldaten Numerische Beschreibung - Faustregeln Für die Bewertung der absoluten Höhe der Produkt- Moment-Korrelation existieren Faustregeln nach Cohen (1988) r < ±0.10 keine Korrelation r < ±0.30 kleine Korrelation r <±0.50 mittlere Korrelation r ± 0.50 hohe Korrelation In der nicht-experimentellen Forschung liegen Korrelationen selten über Folie 16

171 Punktbiseriale Korrelation Biseriale Korrelation Tetrachorische Korrelation Gegeben seien zwei Variablen X und Y. X sei dichotom nominalskaliert (mit zwei Ausprägungen 0 und 1), Y intervallskaliert. Hier kann wie auch bei zwei intervallskalierten Variablen die Produkt-Moment-Korrelation berechnet werden. Die Formel lässt sich aber auch zur Formel für die punktbiseriale Korrelation vereinfachen Bortz, S Bivariate Intervalldaten Spezielle Koeffizienten Punktbiseriale Korrelation Mittelwert der Y-Werte, für die X=1 Mittelwert der Y-Werte, für die X=0 Folie 17 r pbis y n 1 0 X 0 n X yx X1 s y n Anzahl der Fälle, für die X=0 bzw. X=1

172 Punktbiseriale Korrelation Biseriale Korrelation Tetrachorische Korrelation Bivariate Intervalldaten Spezielle Koeffizienten Biseriale Korrelation Häufig werden in empirischen Untersuchungen eigentlich (mindestens) intervallskalierte Merkmale künstlich auf dichotome Variablen reduziert. Beispiele: Alter (unter 25, über 25), Einkommen (niedrig, hoch), Depression (nein, ja), versetzungsfähig (nein, ja) Hier führt die konkrete Setzung des impliziten Kriteriums, welches die intervallskalierte Variable in zwei Gruppen teilt, zu beliebigen Ergebnissen, obwohl der wahre Zusammenhang unverändert ist. Folie 18

173 Punktbiseriale Korrelation Biseriale Korrelation Tetrachorische Korrelation Bivariate Intervalldaten Spezielle Koeffizienten Biseriale Korrelation Die Korrektur dieser kriteriumsabhängigen Veränderung des Zusammenhangs leistet die biseriale Korrelation: r bis r pbis X0 X1 Dabei ist ω die Ordinate der Standardnormalverteilung für den z-wert an der Stelle der Dichotomisierung (p). n n n r pbis und r bis Korrelation haben dieselben Eigenschaften wie der Produkt-Moment-Korrelationskoeffizient r pbis ist zumeist vorzuziehen, da hier keine Normalverteilungsannahme gemacht werden muss Folie 19

174 Punktbiseriale Korrelation Biseriale Korrelation Sind beide Variablen künstlich dichotomisiert und eigentlich normalverteilt, so kann der Zusammenhang durch die tetrachorische Korrelation ausgedrückt werden. Ausgegangen wird zunächst von einer 2 2 Kontingenztabelle Bortz, S Bivariate Intervalldaten Spezielle Koeffizienten Tetrachorische Korrelation x 1 x 2 Tetrachorische Korrelation Daraus berechnet sich die tetrachorische Korrelation als: r tet cos 1 n n n n y 1 n 11 n 12 n 1 y 2 n 21 n 22 n 2 n 1 n 2 n Folie 20 r tet überschätzt die wahre Korrelation, wenn die Randverteilungen stark asymmetrisch sind oder ein n XY <5 ist.

175 Einführung Rangkorrelation Konkordanzmaße Bivariate Ordinaldaten Grundlagen Bei der Ordinalskala ist der numerische Abstand zwischen zwei Realisationen einer Variablen nicht interpretierbar. Die Ordinalskala trägt lediglich Information über die Ordnung der Realisationen. Damit sind mathematische Transformationen direkt auf den Werten einer ordinalskalierten Variablen nicht sinnvoll, also auch nicht die Produkt-Moment-Korrelation. Ansatz: Die Ordnung selbst muss genutzt werden, um Kennwerte zu berechnen. Folie 21

176 Bortz, S. 178 Recap Rangkorrelation Konkordanzmaße Bivariate Ordinaldaten Numerische Beschreibung - Rangbildung Bei der Rangbildung von n Messungen x 1 x n einer Variablen X können maximal n Ränge vergeben werden. Per Konvention erhält der numerisch niedrigste Messwert von X den Rangplatz 1, die höchste den Rangplatz n (kleinere Zahl = kleinerer Rang). Bei gleichen mehreren gleichen Werten ( Ties ) von X wird der mittlere Rangplatz vergeben nach der Regel: Es gebe m gleiche Werte von X. Wären sie unterschiedlich und direkt aufeinander folgend, erhielten sie die Rangplätze rg j rg j+m-1. Der mittlere Rang ist dann Folie 22 rg Tie rg 1 j m m1 irg j rg i

177 Recap Rangkorrelation Konkordanzmaße Bivariate Ordinaldaten Numerische Beschreibung Spearman s r s Nach der Rangbildung ordinalskalierter Daten für zwei Variablen X und Y kann die Produkt-Moment-Korrelation der Ränge rg(x) und rg(y) berechnet werden Diese wird Spearman s r s oder Rangkorrelation genannt und berechnet als r s n n i1 rg( x ) ( ) ( ) ( ) i rg x rg yi rg y 2 n 2 rg( x ) ( ) ( ) ( ) i rg x rg yi rg y i1 i1 Folie 23 was nichts anderes ist als r s s s rg rg x x, rg s y rg y

178 Recap Rangkorrelation Konkordanzmaße Bivariate Ordinaldaten Numerische Beschreibung Spearman s r s Wertebereich von 1 bis +1 Vorzeichen gibt die Richtung des Zusammenhangs an Ist robust bezüglich Ausreißern Ist invariant bei streng monotonen Transformationen Liegen wenige Ties vor, gibt es vereinfachte näherungsweise Berechnungsformeln, die aber kaum mehr Anwendung finden. Folie 24

179 Recap Rangkorrelation Konkordanzmaße Bivariate Ordinaldaten Numerische Beschreibung Weitere Kennwerte Neben Spearman s r s existieren weitere Kennwerte für den Zusammenhang zweier ordinalskalierter Merkmale Die bekanntesten sind der Konkordanzkoeffizient γ ( gamma ) nach Goodman-Kruskal und die daraus abgeleitete Weiterentwicklung Kendall s τ ( tau ) für zwei ordinalskalierte Variablen Die Interpretation dieser Koeffizienten verläuft analog zu r und r s Folie 25

180 -Koeffizient χ²-koeffizient Cramérs V Bivariate Nominaldaten Recap: Kontingenztabellen Wir haben Kontingenztabellen empirischer Verbundhäufigkeiten kennen gelernt. Schreibt man statt h(x i, y j ) kurz n ij, so lautet die vereinfachte Notation für Kontingenztabellen: y 1 y 2 y m Σ x 1 n 11 n 12 n 1m n 1 x 2 n 21 n 22 n 2m n 2 Zeilen x Spalten x k n k1 n k2 n km n k Σ n 1 n 2 n m n Folie 26 Analoge Notation für relative Häufigkeiten (mit f ij statt n ij )

181 -Koeffizient χ²-koeffizient Cramérs V Bivariate Nominaldaten Zusammenhangsmaße für 2 2 Kontingenztabellen Viele empirische Fragestellungen über Zusammenhänge von Variablen beziehen sich auf 2 Merkmale mit je 2 Ausprägungen. Beispiele: Auftreten eines bestimmten Genmarkers bei Frauen/Männern Bortz, S. 158 In solchen 2x2 Situationen kann jeder beiden Variablen durch zwei Werte abgebildet werden. X x : 0, wenn Gesund 1 1 x : 1, wenn Schizophrenie 2 y: 1, wenn Frau Y y2: 2, wenn Mann Folie 27

182 -Koeffizient Bivariate Nominaldaten Zusammenhangsmaße für 2 2 Kontingenztabellen χ²-koeffizient Cramérs V Folie 28 Weil hier de facto eine Intervallskala erzwungen wird (genau ein Abstand zwischen Skalenwerten = konstanter Abstand zwischen Skalenwerten), kann immer die Produkt-Moment- Korrelation r als Zusammenhangsmaß berechnet werden Idee: Der 2x2 Fall bei Nominaldaten kann immer auf den ja/nein bzw. 0/1 Fall zurückgeführt werden Die Berechnungsformel für r vereinfacht sich dadurch erheblich X Y

183 -Koeffizient χ²-koeffizient Bivariate Nominaldaten Zusammenhangsmaße für 2 2 Kontingenztabellen Der Phi-Koeffizient () beschreibt die Stärke des Zusammenhangs zweier dichotomer Variablen Cramérs V Der -Koeffizient lässt sich nach folgender Formel berechnen: n n n n nnnn liegt zwischen -1 und 1. x 1 x 2 y 1 n 11 n 12 n 1 y 2 n 21 n 22 n 2 n 1 n 2 n Folie 29

184 -Koeffizient χ²-koeffizient Cramérs V Bivariate Nominaldaten Zusammenhangsmaße für 2 2 Kontingenztabellen Problem: Bei schiefen Randverteilungen kann der - Koeffizient selbst bei maximalem Zusammenhang zwischen den Variablen die Grenze ±1 nicht erreichen Bei schiefen Randverteilungen sollte daher an der maximal möglichen Korrelation normiert werden. Die maximale positive Korrelation berechnet sich als min( n, n ) min( n, n ) max(, ) max(, ) max n1 n 1 n2 n 2 Und die maximale negative Korrelation ist Folie 30 min( n, n ) min( n, n ) max(, ) max(, ) max n1 n 2 n2 n 1

185 -Koeffizient Bivariate Nominaldaten Zusammenhangsmaße für 2 2 Kontingenztabellen χ²-koeffizient Cramérs V Ist also der tatsächliche -Koeffizient positiv, kann/soll er an der maximal möglichen positiven Korrelation normiert werden über norm max Ist er negativ, berechnet sich die Normierung ganz analog als norm max (den Betrag im Nenner beachten) Folie 31

186 -Koeffizient χ²-koeffizient Cramérs V Ansatz: Man vergleicht die beobachteten Kontingenztabelle mit einer fiktiven Kontingenztabelle, die entstanden wäre, hätte kein Zusammenhang zwischen den Variablen bestanden. Abweichungen der beobachteten von den erwarteten Häufigkeiten sind dann als Abweichungen von der Unabhängigkeit aufzufassen Bortz, S Bivariate Nominaldaten Zusammenhangsmaße für k m Kontingenztabellen Zur Konstruktion der Indifferenztabelle rechnet man für absolute Häufigkeiten aus n Beobachtungen hx (, y) i ( ~ = erwartet ) j hx (, ) h(, y) i n j Folie 32

187 -Koeffizient χ²-koeffizient Cramérs V Bivariate Nominaldaten Zusammenhangsmaße für k m Kontingenztabellen Die Indifferenztabelle konstruiert sich also durch y 1 y 2 y m Σ x 1 ñ 11 ñ 12 ñ 1m n x 2 ñ 21 ñ 22 ñ 2m n x k ñ k1 ñ k2 ñ km n k Σ n 1 n 2 n m n hx (, y) hx (, ) h(, y) Mit bzw. i j i n j n i n n j Folie 33

188 -Koeffizient χ²-koeffizient Cramérs V Bivariate Nominaldaten Zusammenhangsmaße für k m Kontingenztabellen Aus den beobachteten und unter der Annahme keines Zusammenhangs (Indifferenz) erwarteten Häufigkeiten berechnet sich nun: 2 k m ( nij n ij ) n i1 j1 ij 2 ( beob - erw) 2 erw χ² ist Null bei perfekter Unabhängigkeit, ansonsten größer Null χ² kann beliebig große Werte annehmen, abhängig von der Anzahl der Ausprägungen und der Beobachtungen Folie 34

189 -Koeffizient χ²-koeffizient Cramérs V Bivariate Nominaldaten Zusammenhangsmaße für k m Tabellen Cramérs V Um aus dem nicht normierten χ²-koeffizienten ein als Korrelationskoeffizient interpretierbares Maß zu berechnen, wird folgende Formel verwendet: V n 2 min k, m 1 Bortz, S. 180 mit k = Anzahl der Zeilen; m = Anzahl der Spalten Cramérs V ist wie χ² Null bei perfekter Unabhängigkeit, ansonsten größer Null V schwankt zwischen 0 und 1 Folie 35

190 Assoziation Zusammenhangsmaße Interpretation von Korrelationen Bortz, S Kausalität Eine vorhandene (hohe) Korrelation zwischen zwei Variablen X und Y darf nicht ohne weiteres als Kausalität zwischen den Variablen interpretiert werden. Eine vorhandene Korrelation zeigt zunächst nur eine Assoziation an. Diese kann viele Ursachen haben, z.b. X X X Z Y Y Y Korrelation ist nicht Kausalität sondern Assoziation Folie 36

191 Assoziation Kausalität Zusammenhangsmaße Interpretation von Korrelationen Frage: Wann darf in der empirischen Forschung von einer Korrelation auf Kausalität geschlossen werden? 1. Die betrachteten Variablen müssen kovariieren die Korrelation muss ungleich Null sein Probleme: Standards ( wann ist eine Korrelation ungleich Null ) sind normativ Je kleiner n, desto größere Korrelationen können per Zufall auftreten Folie 37

192 Assoziation Kausalität Zusammenhangsmaße Interpretation von Korrelationen Frage: Wann darf in der empirischen Forschung von einer Korrelation auf Kausalität geschlossen werden? 1. Die betrachteten Variablen müssen kovariieren die Korrelation muss ungleich Null sein 2. Die Ursache muss der Wirkung zeitlich vorausgehen (z.b. Pretest Treatment Posttest) 3. Andere plausible Erklärungen für die Kovariation müssen ausgeschlossen werden können 4. Die Kovariation muss raum-zeitlich indifferent sein Generalisierung auf eine Population zu jeder Zeit Folie 38

193 & Statistik Primer: Multiple & Polynomiale Regression 1.0 Dr. Malte Persike methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ Folie 1

194 & Statistik Multiple Regression Polynomische Regression Bortz, S Grundlagen Gleichung Minimierung Normalgleichungen Multiple Regression Grundlagen Oft werden in psychologischen Untersuchungen nicht nur eine sondern mehrere UVn betrachtet, die eine AV beeinflussen (oder vorhersagen sollen). Beispiele: Abhängigkeit der Lebenszufriedenheit von sozialem, ökonomischem und Gesundheitsstatus; Beeinflussung sportlicher Leistung durch Trainingszustand und Anwesenheit von Zuschauern. Solche Fragestellungen werden auch als multifaktoriell bezeichnet Ziel: Die UVn sollen mithilfe einer mathematischen Regel so miteinander verrechnet werden, dass eine möglichst gute Vorhersage der AV erreicht wird Folie 2

195 & Statistik Multiple Regression Polynomische Regression Grundlagen Multiple Regression Grundlagen Gleichung Minimierung Normalgleichungen Drei Hauptfragestellungen der Regressionsrechnung: 1. Gibt es eine statistische Beziehung zwischen mehreren Variablen, die die Vorhersage der AV aus der UV erlaubt? 2. Kann eine möglichst einfache mathematische Regel formuliert werden, die diesen Zusammenhang beschreibt? 3. Wie gut ist diese Regel im Hinblick auf die Vorhersage? Folie 3

196 & Statistik Multiple Regression Polynomische Regression Grundlagen Gleichung Minimierung Normalgleichungen Multiple Regression Grundgleichung Die vorherzusagende Variable (AV, y-wert) wird als Kriterium oder Response bezeichnet, die vorhersagenden Variablen (UVn, x-werte) als Prädiktoren oder erklärende Variablen. Die Vorhersagegleichung der multiplen Regression mit k Prädiktoren wird geschrieben als ˆ k k y b b x b x b x Folie 4 Bei standardisierten Daten verwendet man das Symbol β für die k Regressionsparameter (bzw. -gewichte ) zˆ z z z y 1 x1 2 x2 k x k

197 & Statistik Multiple Regression Polynomische Regression Grundlagen Gleichung Minimierung Normalgleichungen Multiple Regression Grundgleichung Gründe für die Annahme einer linearen Gleichung: Lineare Zusammenhänge sind einfach zu verstehen Lineare Zusammenhänge sind mathematisch und statistisch einfach zu behandeln Lineare Gleichungen haben sich vielfach als gute Approximationen für komplexe Beziehungen erwiesen Achtung: Auch wenn die Beziehung zwischen zwei Variablen linear aussieht, muss es sich nicht zwangsläufig um einen linearen Zusammenhang handeln. Folie 5

198 & Statistik Multiple Regression Polynomische Regression Grundlagen Regression Methode der kleinsten Quadrate (KQ-Kriterium) Gleichung Minimierung Normalgleichungen Folie 6 Für eine Versuchsperson i aus allen n gelte: y yˆ e e y yˆ i i i i i i beobachteter Kriteriumswert = vorhergesagter Wert + Residuum Zur Minimierung des Vorhersagefehlers wird oft das Kleinste-Quadrate Kriterium verwendet (KQ; oder Ordinary Least Squares, OLS) Parameter der multiplen Regressionsgleichung werden so gewählt, dass das Quadrat der Abweichungen von gemessenem und geschätztem Wert minimiert wird Dann soll für alle n Datenwerte erreicht werden, dass n y yˆ 2 e2 i i i i1 i1 n min Minimierung der Quadratsumme des Vorhersagefehlers

199 & Statistik Multiple Regression Polynomische Regression Grundlagen Gleichung Minimierung Regression Methode der kleinsten Quadrate (KQ-Kriterium) Mithilfe der Allgemeinen Gleichung der einfachen linearen Regression lässt sich für die Streuung des Vorhersagefehlers QS e also schreiben: n n 2 2 ˆ e i i i 0 1 i1 2 i2 k ik i1 i1 QS y y y b b x b x b x min Normalgleichungen bzw. in der standardisierten Form n 2 n 2 ˆ 1 2 QS z z z z z z e y y y x x k x i1 i1 i i i i1 i2 ik min Folie 7 Die Minimierung der Regressionsparameter erfolgt über partielle Differenzierung nach jedem einzelnen der b- bzw. β-gewichte

200 & Statistik Multiple Regression Polynomische Regression Grundlagen Gleichung Minimierung Normalgleichungen Folie 8 Regression Normalgleichungen der multiplen Regression Die partielle Differenzierung der nichtstandardisierten Gleichung mit k Prädiktoren führt immer auf ein System von k+1 Normalgleichungen, das wie folgt aufgebaut ist: n n n n n y b b x b x b x k k i1 i1 i1 i1 i1 n n n n n k 1 i1 i1 i1 i1 i1 n n n n n k 2 i1 i1 i1 i1 i1 yx b x b x b x x b x x yx b x b x x b x b x x n n n n yx b x b x x b x x bk x k 0 k 1 1 k 2 2 k i1 i1 i1 i1 n i1 k k 2 k

201 & Statistik Multiple Regression Polynomische Regression Grundlagen Gleichung Minimierung Normalgleichungen Regression Normalgleichungen der multiplen Regression In der standardisierten Form ergibt sich ein System von k Normalgleichungen: n n n n 2 zx z 1 y 1 zx 1 2 zx z 1 x 2 k zx z 1 xk i1 i1 i1 i1 n n n n 2 zx z 2 y 1 zx z 1 x 2 2 zx 2 k zx z 2 x i1 i1 i1 i1 n n n n 2 zx zy 1 zx zx 2 zx zx k zx i1 i1 i1 i1 k 1 k 2 k k k Folie 9 Die Normalgleichungssysteme können nun durch Substitution oder Diagonalisierung gelöst werden

202 & Statistik Multiple Regression Polynomische Regression Bortz, S Matrixalgebraische Berechnung Interpretation der b und β Berechnung der Multiplen Regression Lösung über Lineare Algebra Beide Verfahren sind eher mühselig. In der Praxis wird deshalb ein drittes, einfacheres Verfahren verwendet, das auf vektoralgebraischen Methoden basiert. Mit wenigen Rechenschritten gelangt man hier zu den -Gewichten Benötigt werden dazu lediglich: 1. Alle Prädiktorinterkorrelationen: die Korrelationen zwischen den Prädiktoren x 1 k 2. Alle Kriteriumskorrelationen: die Korrelationen zwischen den Prädiktoren x 1 k und dem Kriterium y Folie 10

203 & Statistik Multiple Regression Polynomische Regression Matrixalgebraische Berechnung Interpretation der b und β Berechnung der Multiplen Regression Umrechnung zwischen b und Zwischen β-parametern für die z-standardisierten Daten und b-parametern für die unstandardisierten Daten existiert ein einfacher Zusammenhang, der beliebige Hin- und Rücktransformationen zulässt: SDy bi i mit i 1, 2,..., k SD x i Die Konstante b 0 wird dann berechnet als b0 ybx 1 1b2x2... bkxk Folie 11 da die Regressionsgerade immer durch den Punkt der Mittelwerte von Prädiktoren und Kriterium geht

204 & Statistik Multiple Regression Polynomische Regression Bortz, S Matrixalgebraische Berechnung Interpretation der b und β Berechnung der Multiplen Regression Spezialfall: Nur 1 Prädiktor Bei nur einem Prädiktor vereinfacht sich die Berechnung der Regressionsgewichte erheblich. 1. Es gilt dann: 1 rxy ŷ b0 b1x 2. Steigung: b 1 r xy SD SD y x 3. y-achsenabschnitt: b0 yb1x Folie 12

205 & Statistik Multiple Regression Polynomische Regression Matrixalgebraische Berechnung Interpretation der b und β Interpretation der Lösung b- und β-gewichte Die Größe eines b-gewichtes gibt an, um wieviele Einheiten sich der Wert des unstandardisierten Kriteriums verändert, wenn der Betrag des unstandardisierten Prädiktors um 1 steigt. Die Größe des β-gewichtes gibt dasselbe für die standardisierten Variablen an Das b-gewicht beantwortet die Frage: Ich möchte einen der Prädiktoren um 1 erhöhen. Welchen sollte ich wählen, damit das Kriterium maximal steigt? Das β-gewicht beantwortet die Frage: Mit welchem Prädiktor erhöhe ich das Kriterium am effizientesten? Folie 13 Das b-gewicht liefert also eine absolute, das β-gewicht eine relative Information.

206 & Statistik Multiple Regression Polynomische Regression Matrixalgebraische Berechnung Interpretation der b und β Regression Interpretation der Lösung Vorsicht bei der Interpretation der Regressionsgleichung Bei der Korrelationsrechnung bedeutet ein Zusammenhang niemals Kausalität, lediglich Assoziation Bei der Regressionsrechnung gilt zunächst dasselbe Die Kausalitätsvermutung wird (wenn überhaupt) schon bei der Aufstellung der Regressionsgleichung getroffen, nicht erst bei der Interpretation der Ergebnisse. Um tatsächlich Kausalität festzustellen, müssen weitere Randbedingungen vorliegen (i.e. zeitliche Antezedenz von Ursache vor Wirkung, Generalisierbarkeit etc.). Folie 14

207 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 1. Der multiple Korrelationskoeffizient R Definition: Der multiple Korrelationskoeffizient R repräsentiert die Korrelation zwischen dem Kriterium y und allen Prädiktoren x 1 x k Dabei berücksichtigt R etwaige Interkorrelationen zwischen den Prädiktoren (und entfernt sie) Der multiple Korrelationskoeffizient R ist definiert als R yxx 1 2xk j x jy j1 k r Folie 15 Er ist mathematisch äquivalent zur Korrelation zwischen den gemessenen y-werten und den vorhergesagten y dach -Werten, also R r yxx x yy 1 2 k ˆ

208 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. Der multiple Determinationskoeffizient R² Definition: Der multiple Determinationskoeffizient R² repräsentiert die Varianzaufklärung, die alle Prädiktoren x 1 x k am Kriterium y leisten Der multiple Determinationskoeffizient R² ist definiert als 2 Erklärte Streuung Fehlerstreuung R 1 Gesamt-Streuung Gesamt-Streuung Folie 16 Rechnerisch: R n 1 2 ( y yˆ ) Var( yˆ ) n Var( e) 1 Var( y) 1 2 Var( y) ( y y) n 2 i1 n i1

209 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² R und R² sind tatsächlich direkt ineinander transformierbar k k j xjy j xjy j1 j1 R r r R 2 Folie 17 Für die Bewertung des R können wieder die Daumenregeln nach Cohen (1988) verwendet werden: R < ± 0.10 keine Korrelation R < ± 0.30 kleine Korrelation R < ± 0.50 mittlere Korrelation R ±0.50 hohe Korrelation

210 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² Dies führt aber auf ein Problem bei der Bewertung des R², denn die Quadratur der Daumenregeln liefert R² < ± 0.01 keine Korrelation R² < ± 0.10 kleine Korrelation R² < ± 0.25 mittlere Korrelation R² ±0.25 hohe Korrelation Folie 18

211 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² Dies führt aber auf ein Problem bei der Bewertung des R², denn die Quadratur der Daumenregeln liefert R² < ± 0.01 keine Varianzaufklärung R² < ± 0.10 kleine Varianzaufklärung R² < ± 0.25 mittlere Varianzaufklärung R² ±0.25 hohe Varianzaufklärung In der Praxis bedeuten 25% aufgeklärte Varianz, dass 75% der Streuung in der AV nicht durch die Regressionsgleichung, d.h. die Prädiktoren erklärt wird Folie 19

212 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² Daher hat Cohen alternative Daumenregeln für die Bewertung des R² vorgeschlagen (beruhend auf seiner Definition der Effektstärke) R² < ± 0.20 keine Varianzaufklärung R² < ± 0.50 kleine Varianzaufklärung R² < ± 0.80 mittlere Varianzaufklärung R² ±0.80 hohe Varianzaufklärung Diese Regeln sind recht streng, insbesondere in der Feldforschung, wo 20-30% Varianzaufklärung bereits als gutes Ergebnis gewertet werden Folie 20

213 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3. Abhängigkeit a) Sind die Prädiktoren unabhängig, so sind die ß-Gewichte gleich den Kriteriumskorrelationen und die aufgeklärte Varianz ist die Summe der Quadrate der ß-Gewichte Folie 21 Erklärung: Bei perfekt unabhängigen Prädiktoren ist die Prädiktorinterkorrelationsmatrix R xx gleich der Identitätsmatrix I. Damit gilt für den multiplen Korrelationskoeffizienten R Und R² ist einfach die Summe der quadrierten Kriteriumskorrelationen Ir r R R xy k 2 yxx 1 2 x r k xjy j1 k 2 2 yxx 1 2 x r k xjy j1 xy

214 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3. Abhängigkeit a) Sind die Prädiktoren unabhängig, so sind die ß-Gewichte gleich den Kriteriumskorrelationen und die aufgeklärte Varianz ist die Summe der Quadrate der ß-Gewichte b) Sind die Prädiktoren abhängig (interkorreliert), so sind 3 Fälle zu unterscheiden: 1. Der Prädiktor klärt zumindest Teile der Varianz am Kriterium auf, die andere Prädiktoren nicht aufklären: er ist nützlich. 2. Der Prädiktor enthält (nur) Information, die auch andere Prädiktoren enthalten: er ist redundant 3. Der Prädiktor unterdrückt irrelevante Varianz in anderen Prädiktoren: er ist ein Suppressor Folie 22

215 & Statistik Multiple Regression Polynomiale Regression Bortz, S. 349 Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3a. Nützlichkeit Nützlichkeit = Der Beitrag, den eine Variable zur Varianzaufklärung des Kriteriums leistet, der von den anderen Variablen nicht geleistet wird Die Nützlichkeit einer Variablen x j berechnet sich als U R R 2 2 j y, x y, x 1,2,..., k j 1,2,..., k j U j ist also der Betrag, um den R² wächst, wenn die Variable x j in die multiple Regressionsgleichung aufgenommen wird. Folie 23

216 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3b. Redundanz Redundanz = die vielen Variablen messen Aspekte gemeinsam, so dass man prinzipiell weniger Prädiktoren benötigte unerwünschter Aspekt Die Variable x j ist redundant zur Vorhersage von Variable y wenn gilt r r 2 x x y x y j j j Prädiktoren enthalten empirisch nahezu immer gemeinsame Varianzanteile und sind somit teilweise redundant. Echte Redundanz liegt erst gemäß obiger Definition vor. Folie 24 Multikollinearität: Die Kovarianz eines Prädiktors mit dem Kriterium ist in den anderen Prädiktoren (fast) vollständig enthalten extremer Fall von Redundanz, der unbedingt zu vermeiden ist.

217 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3c. Suppression r x1 y r x1 x2 r x2 y =0 x 1 x 2 y Folie 25

218 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Kennwerte der multiplen Regression 3c. Suppression Test der Gewichte gegen Null x 1 x 2 y Folie 26

219 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3c. Suppression r x1 y r x1 x2 r x2 y =0 x 1 x 2 y x 2 bindet irrelevante Prädiktorinformation x 2 hängt nicht mit y zusammen, trotzdem erhöht sie R² Folie 27

220 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3c. Suppression Defintion: Eine Variable x j ist ein Suppressor, wenn gilt: U x j r 2 x y j Die Zunahme der erklärten Varianz durch Aufnahme der Variable ist also größer als die einzelne Varianzaufklärung. Folie 28

221 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression Anwendung von Nützlichkeit, Redundanz, Suppression Nützlichkeit, Redundanz und Suppression werden verwendet, um durch die Selektion geeigneter Prädiktoren eine möglichst sparsame Regressionsgleichung zu generieren Die Suppression hilft oft dabei, theoretisch unerwartete Prädiktoren zu identifizieren und beizubehalten Nützlichkeit und Redundanz haben eher das Ziel, ungeeignete Prädiktoren auszuschließen Dazu gibt es statistische Verfahren, die die Frage beantworten, wann eine Nützlichkeit hoch genug ist Es gibt weitere Verfahren zur Prädiktorselektion, z. B. den statistischen Test der -Gewichte Folie 29

222 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 1. Der multiple Korrelationskoeffizient R Definition: Der multiple Korrelationskoeffizient R repräsentiert die Korrelation zwischen dem Kriterium y und allen Prädiktoren x 1 x k Dabei berücksichtigt R etwaige Interkorrelationen zwischen den Prädiktoren (und entfernt sie) Der multiple Korrelationskoeffizient R ist definiert als R yxx 1 2xk j x jy j1 k r Folie 2 Er ist mathematisch äquivalent zur Korrelation zwischen den gemessenen y-werten und den vorhergesagten y dach -Werten, also R r yxx x yy 1 2 k ˆ

223 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. Der multiple Determinationskoeffizient R² Definition: Der multiple Determinationskoeffizient R² repräsentiert die Varianzaufklärung, die alle Prädiktoren x 1 x k am Kriterium y leisten Der multiple Determinationskoeffizient R² ist definiert als 2 Erklärte Streuung Fehlerstreuung R 1 Gesamt-Streuung Gesamt-Streuung Folie 3 Rechnerisch: R n 1 2 ( y yˆ ) Var( yˆ ) n Var( e) 1 Var( y) 1 2 Var( y) ( y y) n 2 i1 n i1

224 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² R und R² sind tatsächlich direkt ineinander transformierbar k k j xjy j xjy j1 j1 R r r R 2 Folie 4 Für die Bewertung des R können wieder die Daumenregeln nach Cohen (1988) verwendet werden: R < ± 0.10 keine Korrelation R < ± 0.30 kleine Korrelation R < ± 0.50 mittlere Korrelation R ±0.50 hohe Korrelation

225 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² Dies führt aber auf ein Problem bei der Bewertung des R², denn die Quadratur der Daumenregeln liefert R² < ± 0.01 keine Korrelation R² < ± 0.10 kleine Korrelation R² < ± 0.25 mittlere Korrelation R² ±0.25 hohe Korrelation Folie 5

226 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² Dies führt aber auf ein Problem bei der Bewertung des R², denn die Quadratur der Daumenregeln liefert R² < ± 0.01 keine Varianzaufklärung R² < ± 0.10 kleine Varianzaufklärung R² < ± 0.25 mittlere Varianzaufklärung R² ±0.25 hohe Varianzaufklärung In der Praxis bedeuten 25% aufgeklärte Varianz, dass 75% der Streuung in der AV nicht durch die Regressionsgleichung, d.h. die Prädiktoren erklärt wird Folie 6

227 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 2. R und R² Daher hat Cohen alternative Daumenregeln für die Bewertung des R² vorgeschlagen (beruhend auf seiner Definition der Effektstärke) R² < ± 0.20 keine Varianzaufklärung R² < ± 0.50 kleine Varianzaufklärung R² < ± 0.80 mittlere Varianzaufklärung R² ±0.80 hohe Varianzaufklärung Diese Regeln sind recht streng, insbesondere in der Feldforschung, wo 20-30% Varianzaufklärung bereits als gutes Ergebnis gewertet werden Folie 7

228 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3. Abhängigkeit a) Sind die Prädiktoren unabhängig, so sind die ß-Gewichte gleich den Kriteriumskorrelationen und die aufgeklärte Varianz ist die Summe der Quadrate der ß-Gewichte Folie 8 Erklärung: Bei perfekt unabhängigen Prädiktoren ist die Prädiktorinterkorrelationsmatrix R xx gleich der Identitätsmatrix I. Damit gilt für den multiplen Korrelationskoeffizienten R Und R² ist einfach die Summe der quadrierten Kriteriumskorrelationen Ir r R R xy k 2 yxx 1 2 x r k xjy j1 k 2 2 yxx 1 2 x r k xjy j1 xy

229 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3. Abhängigkeit a) Sind die Prädiktoren unabhängig, so sind die ß-Gewichte gleich den Kriteriumskorrelationen und die aufgeklärte Varianz ist die Summe der Quadrate der ß-Gewichte b) Sind die Prädiktoren abhängig (interkorreliert), so sind 3 Fälle zu unterscheiden: 1. Der Prädiktor klärt zumindest Teile der Varianz am Kriterium auf, die andere Prädiktoren nicht aufklären: er ist nützlich. 2. Der Prädiktor enthält (nur) Information, die auch andere Prädiktoren enthalten: er ist redundant 3. Der Prädiktor unterdrückt irrelevante Varianz in anderen Prädiktoren: er ist ein Suppressor Folie 9

230 & Statistik Multiple Regression Polynomiale Regression Bortz, S. 349 Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3a. Nützlichkeit Nützlichkeit = Der Beitrag, den eine Variable zur Varianzaufklärung des Kriteriums leistet, der von den anderen Variablen nicht geleistet wird Die Nützlichkeit einer Variablen x j berechnet sich als U R R 2 2 j y, x y, x 1,2,..., k j 1,2,..., k j U j ist also der Betrag, um den R² wächst, wenn die Variable x j in die multiple Regressionsgleichung aufgenommen wird. Folie 10

231 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3b. Redundanz Redundanz = die vielen Variablen messen Aspekte gemeinsam, so dass man prinzipiell weniger Prädiktoren benötigte unerwünschter Aspekt Die Variable x j ist redundant zur Vorhersage von Variable y wenn gilt r r 2 x x y x y j j j Prädiktoren enthalten empirisch nahezu immer gemeinsame Varianzanteile und sind somit teilweise redundant. Echte Redundanz liegt erst gemäß obiger Definition vor. Folie 11 Multikollinearität: Die Kovarianz eines Prädiktors mit dem Kriterium ist in den anderen Prädiktoren (fast) vollständig enthalten extremer Fall von Redundanz, der unbedingt zu vermeiden ist.

232 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3c. Suppression r x1 y r x1 x2 r x2 y =0 x 1 x 2 y Folie 12

233 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Kennwerte der multiplen Regression 3c. Suppression Test der Gewichte gegen Null x 1 x 2 y Folie 13

234 & Statistik Multiple Regression Polynomiale Regression Bortz, S Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3c. Suppression r x1 y r x1 x2 r x2 y =0 x 1 x 2 y x 2 bindet irrelevante Prädiktorinformation x 2 hängt nicht mit y zusammen, trotzdem erhöht sie R² Folie 14

235 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression 3c. Suppression Defintion: Eine Variable x j ist ein Suppressor, wenn gilt: U x j r 2 x y j Die Zunahme der erklärten Varianz durch Aufnahme der Variable ist also größer als die einzelne Varianzaufklärung. Folie 15

236 & Statistik Multiple Regression Polynomiale Regression Kennwerte Test der Gewichte gegen Null Kennwerte der multiplen Regression Anwendung von Nützlichkeit, Redundanz, Suppression Nützlichkeit, Redundanz und Suppression werden verwendet, um durch die Selektion geeigneter Prädiktoren eine möglichst sparsame Regressionsgleichung zu generieren Die Suppression hilft oft dabei, theoretisch unerwartete Prädiktoren zu identifizieren und beizubehalten Nützlichkeit und Redundanz haben eher das Ziel, ungeeignete Prädiktoren auszuschließen Dazu gibt es statistische Verfahren, die die Frage beantworten, wann eine Nützlichkeit hoch genug ist Es gibt weitere Verfahren zur Prädiktorselektion, z. B. den statistischen Test der -Gewichte Folie 16

237 & Statistik Multiple Regression Polynomiale Regression Bortz, S Grundlagen Linearisierbare Formen Polynome Nichtlineare Regression Grundlagen Bei einer Reihe psychologischer Fragestellungen ergeben sich nichtlineare Zusammenhänge zwischen UV & AV. Beispiele: Reaktionszeit, Blutalkohol und psychomotorische Leistungen, Fehlerraten in Leistungstests bei verschiedenen Aufgabenschwierigkeiten Solche nichtlinearen Zusammenhänge lassen sich in zwei Klassen einteilen: 1. Zusammenhänge, die sich durch eine einfache (nichtlineare) Transformationen in lineare Zusammenhänge überführen lassen Folie 2 2. Zusammenhänge, für die eine nichtlineare Regressionsgleichung gelöst werden muss.

238 & Statistik Multiple Regression Polynomiale Regression Grundlagen Linearisierbare Formen Polynome Nichtlineare Regression Beispiel: Logistische Regression Gemessene Daten verlaufen logarithmisch und variieren zwischen 0 und 1 Umformung der x-werte durch Logarithmieren bewirkt eine Linearisierung der Datenlage Mithilfe dieser neuen y-werte kann eine lineare Regression bestimmt werden, um die Parameter b 0 und b 1 zu errechnen Folie 3

239 & Statistik Multiple Regression Polynomiale Regression Grundlagen Linearisierbare Formen Polynome Nichtlineare Regression Linearisierbare und polynomiale Formen Fall 1: Linearisierende Transformation, z.b. ˆ ln ˆ ln ln ln y b xb1 y b b x (hier nicht weiter behandelt) Fall 2: Nicht (einfach) linearisierbar ŷ b b xb x Folie 4

240 & Statistik Multiple Regression Polynomiale Regression Grundlagen Linearisierbare Formen Polynome Polynomiale Regression Grundlagen und Durchführung Häufig können Merkmalszusammenhänge durch Polynome 2. oder 3. Ordnung gut beschrieben werden, d.h. oder ŷ b b xb x ŷ b b xb x b x Dies ist formal eine lineare multiple Regression, allerdings nicht mit mehreren Prädiktoren, sondern mit einem Prädiktor sowie Transformationen seiner selbst. Folie 5

241 & Statistik Multiple Regression Polynomiale Regression Grundlagen Linearisierbare Formen Polynome Polynomiale Regression Grundlagen und Durchführung Eine solche polynomiale Regression wird berechnet, indem einfach die transformierten Prädiktorterme x², x³ usw. bestimmt werden Dann wird auf diesen eine übliche lineare multiple Regression durchgeführt Es können alle von Kennwerte und Gütemaße der multiplen Regression bestimmt werden Zur Reduzierung von Multikollinearität kann der Prädiktor vor der Transformation auch in seinem Mittelwert zentriert werden Folie 6 Die polyn. Regression ist auch über die KQ-Methode (inkl. Normalgleichungen) herzuleiten. Dies führt auf dasselbe Ergebnis wie der hier verfolgte Ansatz.

242 & Statistik Voraussetzungen Multiple Regression Voraussetzungen der Regression Mathematische und statistische Betrachtung Darstellungen Mathematisch ist eine multiple Regression praktisch immer zu rechnen, da nur in Ausnahmefällen die Invertierung der Prädiktorinterkorrelationsmatrix fehlschlägt Statistisch aber sollen eine Reihe von Voraussetzungen erfüllt sein, damit Kennwerte und inferenzstatistische Verfahren (z.b. der statistische Test der β Gewichte) anwendbar sind die Regressionsgleichung empirische Aussagekraft besitzt Folie 2

243 & Statistik Voraussetzungen Darstellungen Multiple Regression Voraussetzungen der Regression 1. Skalenniveaus Die Prädiktoren können entweder intervallskaliert oder dichotom sein Das Kriterium muss intervallskaliert sein und die Skala soll unbeschränkt sein (keine untere und obere Schranke Ungebundenheit) Für andere Skalenniveaus des Kriteriums existieren verschiedene Regressionsvarianten: Logistische Regression für dichotome Kriteriumsvariablen Multinomiale Regression für nominalskalierte Kriterien Ordinale Regression für ordinalskalierte Kriterien Folie 3

244 & Statistik Voraussetzungen Darstellungen Multiple Regression Voraussetzungen der Regression 2. Eigenschaften der Prädiktoren Keine zu hohen Interkorrelationen zwischen den Prädiktoren, i.e. Vermeidung von Multikollinearität Es sollen alle wesentlichen Einflussvariablen des Kriteriums erfasst werden, d.h. hinreichend hohes R² Der Zusammenhang zwischen den Prädiktoren und dem Kriteriums soll dem Modell der Regressionsgleichung entsprechen (linear, polynomisch etc.) Es soll eine hinreichend hohe Stichprobengröße vorliegen, Daumenregeln empfehlen hier zwischen 10 und 25 Personen pro Prädiktor Folie 4

245 & Statistik Voraussetzungen Darstellungen Multiple Regression Voraussetzungen der Regression 3. Eigenschaften der Fehler bzw. Residuen Erinnerung: Der Vorhersagefehler in der Regression wird auch als Residuum bezeichnet e y yˆ i i i für den Vorhersagefehler des Merkmalsträgers i aus allen n Folie 5

246 & Statistik Voraussetzungen Darstellungen Multiple Regression Voraussetzungen der Regression 3. Eigenschaften der Fehler bzw. Residuen Erinnerung: Der Vorhersagefehler in der Regression wird auch als Residuum bezeichnet Die Residuen dürfen nicht untereinander korreliert sein, d.h. die Höhe des Vorhersagefehlers für Merkmalsträger 1 darf nicht den Fehler für Merkmalsträger 2 beeinflussen Die Residuen sollen normalverteilt sein Für die Residuen soll der erwartete Mittelwert 0 sein Die Residuen sollen dem Gebot der Homoskedastizität genügen, d.h. ihre Varianz soll unabhängig vom Kriteriumswert sein. Folie 6

247 & Statistik Voraussetzungen Darstellungen Multiple Regression Voraussetzungen der Regression Prüfung der Voraussetzungen Für die meisten der Fehlereigenschaften gibt es statistische Tests zur Voraussetzungsprüfung o Variance Inflation Factor (VIF) für Multikollinearität o Durbin-Watson Test für Unkorreliertheit o Levene-Test für Homoskedastizität o Kolmogoroff-Smirnov Test für Normalverteilung Zur ersten optischen Prüfung eignen sich spezielle Darstellungsvarianten, z.b. der Fit-Plot des Kriteriums sowie der Residualplot Folie 7

248 & Statistik Voraussetzungen Multiple Regression Darstellungen der Regression Die Matrixdarstellung der Scatterplots Darstellungen Der Matrixplot ist eine platzsparende Möglichkeit, die paarweisen Zusammenhänge zwischen allen an der Regression beteiligten Variablen darzustellen Es handelt sich einfach um eine geordnete Darstellung aller möglichen Scatterplots für die Daten Der Matrixplot erlaubt eine schnelle Beurteilung von Form und Stärke der Zusammenhänge innerhalb der Prädiktoren sowie zwischen den Prädiktoren und dem Kriterium Folie 8

249 & Statistik Voraussetzungen Multiple Regression Darstellungen der Regression Die Matrixdarstellung der Scatterplots Erwartung Darstellungen Dauer Pillen Erfolg Folie 9

250 & Statistik Voraussetzungen Darstellungen Multiple Regression Darstellungen der Regression Der Fit-Plot des Kriteriums Der Fit-Plot des Kriteriums ist ein optisches Verfahren zur Prüfung der Übereinstimmung zwischen vorhergesagten und beobachteten Kriteriumswerten Er stellt die vorhergesagten Kriteriumswerte (x-achse) und die beobachteten (y-achse) gegenüber Er ist eine direkte Darstellung des Multiplen Korrelationsbzw. Determinationskoeffizienten Bei perfekter Passung der Regressionsgleichung gilt y yˆ für alle i i i Folie 10 womit die Wertpaare für alle i Merkmalsträger auf der Winkelhalbierenden liegen müssen

251 & Statistik Voraussetzungen Multiple Regression Darstellungen der Regression Der Fit-Plot des Kriteriums Guter Modellfit Schlechter Modellfit Darstellungen Nichtlinearität Nicht möglich Folie 11

252 & Statistik Voraussetzungen Darstellungen Multiple Regression Darstellungen der Regression Der Residualplot Der Residualplot ist ein optisches Verfahren zur Prüfung der Voraussetzungen Er stellt die vorhergesagten Kriteriumswerte (x-achse) und die Regressionsresiduen (y-achse) gegenüber An ihm kann man Homoskedastizität und Modellpassung optischen gut überprüfen Folie 12

253 & Statistik Multiple Regression Darstellungen der Regression Voraussetzungen Der Residualplot Darstellungen Guter Modellfit Nichtlinearität Heteroskedastizität Folie 13

254 & Statistik Voraussetzungen Darstellungen Multiple Regression Darstellungen der Regression Der Residualplot Der Residualplot ist ein optisches Verfahren zur Prüfung der Voraussetzungen Er stellt die vorhergesagten Kriteriumswerte (x-achse) und die Regressionsresiduen (y-achse) gegenüber An ihm kann man Homoskedastizität und Modellpassung optischen gut überprüfen Oft werden Residuen (und auch die Kriteriumswerte) der standardisierten Daten dargestellt, was die Normalverteilung der Residuen optisch gut einschätzbar macht Folie 14

255 & Statistik Multiple Regression Darstellungen der Regression Voraussetzungen Der Residualplot Darstellungen Guter Modellfit Nichtlinearität Heteroskedastizität Folie 15

256 & Statistik Spezielle Regressionen Partialkorrelation Partialkorrelation Deutungsmöglichkeiten der bivariaten Korrelation Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation 1. Direkte Kausalität Y 1 Y 2 2. Zufall 3. Drittvariable(n) X Y 1 4. Direkte + indirekte Kausalität X Y 2 Y 1 Folie 2 Y 2

257 & Statistik Spezielle Regressionen Partialkorrelation Scheinkorrelation Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation Partialkorrelation im Fall zweier korrelierter Variablen Definition: Eine Partialkorrelation ist die Korrelation zweier Variablen, die vom Effekt einer dritten Variablen bereinigt wurden. Einsatzzweck: Prüfung einer Kausalvermutung G Kommt r y1y2 dadurch zustande, dass eine Drittvariable x ursächlich auf y 1 und y 2 einwirkt? x r x,y1 G G r x, y2 Folie 3 r y1,y2 y 1 y 2

258 & Statistik Spezielle Regressionen Partialkorrelation Partialkorrelation Berechnung und Prüfung Partialkorrelation Semipartialkorrelation 1. Sage y 1 aus x voraus und berechne Residuen e y1 2. Sage y 2 aus x voraus und berechne Residuen e y2 3. Berechne die Korrelation r ey1 e y2 Schreibe: r y1y2 x Multiple Partialkorrelation r y1y2 x y 1 y 2 r y1y2 x x ohne Folie 4 Ist Partialkorrelation nahe Null, so beruht die Korrelation r y1y2 tatsächlich vor allem auf der Einwirkung von x. (Prüfung mit Korrelationstest)

259 & Statistik Spezielle Regressionen Partialkorrelation Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation Partialkorrelation Vereinfachte Berechnung Für die Varianz der Vorhersagefehler gilt Var( e ) Var( y ) (1 r ) 2 x, y 1 x, y 1 1 Die Korrelation der Fehler lässt sich schreiben als xy, 1 xy, 1 Man kann nun zeigen, dass gilt r e e Var( e ) Var( y ) (1 r ) Cov( e e ) s e 2 xy, 2 xy, xy, xy, s e xy, 1 xy, 2 Cov( e, e ) Cov( y, y ) b b Var( x) xy, xy, 1 2 xy, xy, Folie 5

260 & Statistik Spezielle Regressionen Partialkorrelation Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation Folie 6 Partialkorrelation Vereinfachte Berechnung Für die Varianz der Vorhersagefehler galt Var( e ) Var( y ) (1 r ) 2 x, y 1 x, y 1 1 Die Korrelation der Fehler lässt sich schreiben als xy, 1 xy, 1 Man kann nun zeigen, dass gilt r e e Var( e ) Var( y ) (1 r ) Cov( e e ) 2 xy, 2 xy, xy, xy, xy, 1 xy, 2 Damit errechnet sich die Partialkorrelation als Cov( e, e ) Cov( y, y ) b b Var( x) xy, xy, 1 2 xy, xy, r y, y x 1 2 s e s e r r r y, y xy, xy, r 1r 2 2 x, y x, y 1 2

261 & Statistik Spezielle Regressionen Partialkorrelation Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation Semipartialkorrelation im Fall zweier korrelierter Variablen Definition: Eine Semipartialkorrelation ist die Korrelation zweier Variablen, von denen eine vom Effekt einer anderen Variablen bereinigt wurden. Einsatzzweck: Prüfung der zusätzlichen Information eines Prädiktors bei der Erklärung des Kriteriums Die Semipartialkorrelation ist eng verbunden mit der Nützlichkeit. Es gilt nämlich U x 1 = r² y(x1 x2) r y1 x y2 Folie 7 y 1 y 2 x r y1y2

262 & Statistik Spezielle Regressionen Partialkorrelation Semipartialkorrelation Berechnung Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation 1. Sage y 2 aus x voraus und berechne Residuen e y2 2. Berechne die Korrelation r y1 e y2 Schreibe: r y1(y2 x) (analog für Auspartialisierung von x aus y1) 3. Oder verwende die vereinfachte Formel ohne r y ( y x) 1 2 r r r y, y xy, xy, r 2 xy, 2 Folie 8

263 & Statistik Spezielle Regressionen Partialkorrelation Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation (Semi-)Partialkorrelation höherer Ordnung Prinzip Soll der Zusammenhang zwischen zwei Variablen um mehrere andere Variablen bereinigt werden, spricht man von (Semi-)Partialkorrelationen höherer Ordnung Die Berechnung verläuft analog zu den (Semi-)Partialkorrelationen bei nur einer auszupartialisierenden Variable x 1 x 3 x 2 r y1y2 y 1 y 2 Folie 9

264 & Statistik Spezielle Regressionen Partialkorrelation (Semi-)Partialkorrelation höherer Ordnung Berechnung über multiple Regression Partialkorrelation Semipartialkorrelation Multiple Partialkorrelation 1. Sage y 1 aus den x 1 x k voraus und berechne Residuen e y1 2. Sage y 2 aus den x 1 x k und berechne Residuen e y2 3. Berechne die Korrelation r ey1 e y2 r y 1y2 x1 xk (Partialkorrelation) oder Berechne die Korrelation r y1 e y2 (Semipartialkorrelation) r y 1(y2 x1 xk) Folie 10

265 & Statistik Primer: ANOVA 1.0 Dr. Malte Persike methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ Folie 1

266 & Statistik Einführung Lineares Modell Voraussetzungen Partialkorrelation Varianzanalyse Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Ziel: Analyse des Einflusses unabhängiger Variablen (UVn) auf eine abhängige Variable (AV) Beispiele: Wie gut wirken unterschiedliche Therapieformen bei spezifischen Phobien bei verschiedenen Geschlechtern? Wie verändert sich die Schulleistung von Kindern über mehrere Nachhilfesitzungen hinweg? Bortz, S S Generell versucht die ANOVA immer, Unterschiede zwischen Gruppen in der Höhe der AV aufzuzeigen. Während bei der Regression der Fokus auf den Zusammenhängen zwischen UVn und AV liegt, soll die ANOVA gemessene Unterschiede in der AV erklären. Folie 2

267 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Voraussetzungen Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die AV muss dabei stetig sein (intervallskaliert) die UVn sind i.d.r nominal- oder ordinalskaliert Die UVn werden im Rahmen der ANOVA auch als Treatments oder Faktoren bezeichnet, die Ausprägungen eines Treatments als Treatmentstufen oder Faktorstufen Nach der Anzahl der Treatments unterscheidet man die einfaktorielle, zweifaktorielle oder allgemein mehrfaktorielle ANOVA Folie 3

268 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Voraussetzungen Folie 4 Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Beispiel: Experiment mit einem 3stufigen Treatment A Man habe an 3 Personengruppen (definiert durch die Treatmentstufen A 1 bis A 3 ) die Werte einer AV erhoben. A 1 A 2 A In der Praxis können die Gruppengrößen verschieden sein

269 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Voraussetzungen Folie 5 Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Beispiel: Nun nehme man das Geschlecht als Treatment B mit zwei Stufen hinzu Man hat nun 6 Personengruppen (oder Zellen ) A 1 A 2 A 3 B B

270 & Statistik Partialkorrelation Varianzanalyse Einführung Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Lineares Modell Voraussetzungen Folie 6 Die abhängige Variable sei X genannt. Mit der korrekten Indizierung lässt sich die Tabelle dann schreiben als A 1 A 2 A 3 B 1 x 1,1,1 = 9 x 1,1,2 = 6 x 1,1,3 = 10 x n11,1,1 = 12 x n12,1,2 = 13 x n13,1,3 = 7 B 2 x 1,2,1 = 17 x 1,2,2 = 19 x 1,2,3 = 14 x n21,2,1 = 15 x n22,2,2 = 11 x n23,2,3 = 12

271 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Voraussetzungen Folie 7 Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die ANOVA geht davon aus, dass am Zustandekommen jedes Messwertes x i,j,k (i =1 n kj, j =1 p, k =1 q mit p=3, q=2) mehrere Komponenten beteiligt sind: 1. Populationswert, von allen Personen geteilt Dieser ist für alle Personen konstant 2. Effekt der Treatmentstufe j des Treatments A Dieser ist für jede Person in Gruppe A j konstant 3. Effekt der Treatmentstufe k des Treatments B Dieser ist für jede Person in Gruppe B k konstant 4. Interaktionseffekt jeder spezifischen Kombination von A j und B k Dieser ist für jede Person in Zelle A j B k konstant 5. Zufallsfehler, der Unterschiede zwischen Personen ausmacht, die nicht auf A oder B zurückgehen Dieser ist individuell für jede Person

272 & Statistik Partialkorrelation Varianzanalyse Wie die Regression geht die ANOVA von einem einfachen linearen Modell aus. Sie nimmt an, dass der Messwert einer Person auf einer beliebigen AV additiv aus systematischen Komponenten und einer Fehlerkomponente besteht Wir betrachten hier nur den Fall gleicher Zellhäufigkeiten n= x Streuung von Von allen geteilter Populationswert x e plus Fehler Fehlerstreuung n 1 =n 2 =n 3 = x ae Treatment -streuung A plus Effekt A Folie 8

273 & Statistik Partialkorrelation Varianzanalyse Wie die Regression geht die ANOVA von einem einfachen linearen Modell aus. Sie nimmt an, dass der Messwert einer Person auf einer beliebigen AV additiv aus systematischen Komponenten und einer Fehlerkomponente besteht Wir betrachten hier nur den Fall gleicher Zellhäufigkeiten x ae Treatment -streuung A plus Effekt A n 11 = =n 23 = x abe Treatment -streuung B plus Effekt B x ababe Treatment -streuung AB plus Effekt AB Folie 9

274 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Voraussetzungen Folie 10 Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Der Varianzanalyse liegt also formal ein sehr einfaches lineares Modell zugrunde x Messwert der Person i unter Treatmentstufen j und k ijk Populationswert aller n N Personen a Effekt der Treatmentstufe k des Faktors A j j bk Effekt der Treatmentstufe j des Faktors B ab Interaktionseffekt der Treatmentstufen j und k k e Fehler der Person i unter Treatmentstufen j und k ikj x a b a b e ijk k j k j ijk Merke: Der Messwert einer beliebigen aller N Personen setzt sich zusammen aus einem Populationswert, den Treatmenteffekten & einem individuellen Messfehler. jk

275 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Voraussetzungen Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Der beobachtete Messwert jeder Person ist also in drei Komponenten zerlegt Damit lässt sich die Tabelle schreiben als A 1 A p B 1 +a 1+b 1+a 1b 1+e 1,1,1 +a p +b 1 +a p b 1 +e 1,1,p +a 1 +b 1 +a 1 b 1 +e n 11,1,1 +a 1+b q+a 1b q+e 1,q,1 +a p +b 1 +a p b 1 +e n 1p,1,p +a p +b q +a p b q +e 1,q,p B q +a 1 +b q +a 1 b q +e n q1,q,1 +a p +b q +a p b q +e n qp,q,p Folie 11

276 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die zentrale Forschungsfrage, die von der ANOVA beantwortet werden soll, lautet nun: Voraussetzungen Gilt a j = a j oder a j a j für alle für mindestens eine der paarweisen Kombinationen von j und j. In Worten: Gibt es mindestens eine Treatmentstufe von A, die auf die gemessene Variable der Versuchspersonen anders wirkt als die übrigen Treatmentstufen von A? Folie 12

277 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die zentrale Forschungsfrage, die von der ANOVA beantwortet werden soll, lautet nun: Voraussetzungen Gilt b k = b k oder b k b k für alle für mindestens eine der paarweisen Kombinationen von k und k. In Worten: Gibt es mindestens eine Treatmentstufe von B, die auf die gemessene Variable der Versuchspersonen anders wirkt als die übrigen Treatmentstufen von B? Folie 13

278 & Statistik Partialkorrelation Varianzanalyse Einführung Lineares Modell Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die zentrale Forschungsfrage, die von der ANOVA beantwortet werden soll, lautet nun: Voraussetzungen Gilt a j b k = a j b k oder a j b k a j b k für alle für mindestens eine der paarweisen Kombinationen von jk & j k. Folie 14 In Worten: Gibt es mindestens eine Interaktion von A und B, die auf die gemessene Variable der Versuchspersonen anders wirkt als die übrigen Kombinationen von A und B?

279 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Hat das Treatment keinen Effekt, so sind Unterschiede zwischen Mittelwerten der Treatmentstufen rein zufällig Prüfgröße & Ergebnistab. Plots Folie 15 A 1 A p B 1 +a 1+b 1+a 1b 1+e 1,1,1 +a p +b 1 +a p b 1 +e 1,1,p B q +a 1 +b 1 +a 1 b 1 +e n 11,1,1 +a 1+b q+a 1b q+e 1,q,1 +a p +b 1 +a p b 1 +e n 1p,1,p +a p +b q +a p b q +e 1,q,p +a 1 +b q +a 1 b q +e n q1,q,1 Mittelwert: A1... +a p +b q +a p b q +e n qp,q,p Ap B 1 B 2

280 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Hat das Treatment keinen Effekt, so sind Unterschiede zwischen Mittelwerten der Treatmentstufen rein zufällig Die Streuung der Stufenmittelwerte kann dann nur aus der Fehlerstreuung entstehen. Es muss gelten: QS Treat ˆ QS Ansatz: Wenn man also feststellt, dass die Streuung der Stufenmittelwerte deutlich größer ist als die Fehlerstreuung, kann die Fehlerstreuung allein nicht mehr für die Streuung der Stufenmittelwerte verantwortlich sein Fehler Das Treatment hat dann einen Effekt, es gibt also systematische Unterschiede zwischen den Stufenmittelwerten Folie 16

281 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) QS-Zerlegung Prüfgröße & Ergebnistab. Plots Die ANOVA leistet also das Auffinden von indem sie Unterschieden zwischen Gruppen- Mittelwerten Streuungen von Fehlern und Treaments miteinander vergleicht Folie 17

282 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Problem: Diese Logik von Fehler- und Treatmentstreuung ist nur dann hilfreich, wenn sie nicht nur für alle Treatmentstufen gemeinsam, sondern individuell für jedes Treatment bzw. die Interaktion gilt. Denn: Ziel der ANOVA ist das Treffen separater Aussagen über die Wirkung der einzelnen Treatments. Ansatz: Es ist zu zeigen, dass die Streuung der Stufenmittelwerte des Faktors A nicht auch von einem möglichen Effekt des Faktors B oder der Interaktion AB abhängt. Diesen Beweis liefert die Quadratsummenzerlegung in der Varianzanalyse Folie 18

283 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Exakt wie in der Multiplen Regression wird von der Streuung aller Daten um den Mittelwert ausgegangen. Der Mittelwert aller Daten (Grand Mean) x n p q 1 xikj G G n p q i 1 j 1 k 1 wird in der ANOVA oft als G oder G quer bezeichnet Deren Streuung, ausgedrückt als Quadratsumme ist Folie 19 Tot n p q 2 ikj QS x G i1 j1 k1

284 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Man könnte statt der Quadratsumme auch die Varianz betrachten, hätte aber lediglich den zusätzlichen Faktor 1 / N bzw. 1 / npq in voriger Gleichung Prüfgröße & Ergebnistab. Plots Folie 20 Mit dem linearen Modell der ANOVA wird daraus n p q 2 QS a b a b e G Tot j k j k ikj i1 j1 k1 indem einfach der Messwert jeder Person x ikj durch die Modellgleichung ersetzt wird Diese Quadratsumme repräsentiert die gesamte Streuung in den Daten um den gemeinsamen Mittelwert aller Daten

285 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die Aufteilung der Streuung in Fehler- und Treatmentstreuung läuft nun darauf hinaus zu verstehen, wie sich die Gesamtstreuung der Daten N= zerlegen lässt in n p q 2 Datenstreuung: QS a b a b e G Tot j k j k ikj i1 j1 k1 Fehlerstreuung Treatment -streuung B Treatment -streuung A Treatment -streuung A B Folie 21

286 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Problem: a j und b k und a j b k und e ijk und μ sind unbekannt. Man kann aber aus den Daten andere, inhaltlich ähnliche Kennzahlen berechnen. Prüfgröße & Ergebnistab. Plots A 1 A p B 1 +a 1+b 1+a 1b 1+e 1,1,1 +a p +b 1 +a p b 1 +e 1,1,p +a 1 +b 1 +a 1 b 1 +e n 11,1,1 +a 1+b q+a 1b q+e 1,q,1 +a p +b 1 +a p b 1 +e n 1p,1,p +a p +b q +a p b q +e 1,q,p B 1 Folie 22 B q Mittelwert: A1 +a 1 +b q +a 1 b q +e n q1,q,1... +a p +b q +a p b q +e n qp,q,p Gesamtmittel Ap x B 2 oder G

287 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) So muss für den Mittelwert aller Personen in einer Faktorstufe des Faktors A gelten: n q 1 A a b a b e j j k j k ikj nq i1 k1 Und ebenso für die Stufenmittelwerte des Faktors B: n p 1 B a b a b e k j k j k ikj n p i1 j1 Folie 23 Und natürlich auch für die Zellmittelwerte: 1 n j k j k j k ikj n i1 A B a b a b e

288 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) QS-Zerlegung Prüfgröße & Ergebnistab. Plots Für den Gesamtmittelwert aller Personen gilt zudem n p q 1 G a b a b e n pq i1 j1 k1 j k j k ikj Diese Gleichungen kann man nach den bekannten Termen G, Aj, Bk, AjBk umformen und in die Gleichung der Quadratsumme einsetzen Nach weiteren Umformungen erhält man eine Gleichung, die zeigt, dass sich die gesamte Quadratsumme tatsächlich aufteilen lässt in unabhängige Quadratsummen für die Treatments und den Fehler. Folie 24

289 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Es zeigt sich nämlich, dass gilt: QS-Zerlegung QS QS QS QS QS Tot TreatA TreatB TreatAB Fehler Prüfgröße & Ergebnistab. Plots Folie 25 Gesamte QS: QS Treatment A: (q = Treat.stufen von B) QS Treatment B: (p = Treat.stufen von A) QS Fehler: Tot n p q 2 ikj QS x G TreatA i1 j1 k1 n p q 2 j QS A G TreatB i1 j1 k1 p q n 2 k QS B G i1 j1 k1 n p 2 QS x A B Fehler ikj j k i1 j1 k1 q

290 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Folie 26 Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Gäbe es keine Interaktion, so sollte man annehmen, dass die beiden Faktoren additiv zusammenwirken. Dann sollte gelten: AB ' A B G j k j k Der Grand Mean muss einmal subtrahiert werden, da er in beiden Stufenmittelwerten enthalten ist Die Differenz dieser beiden Terme ist dann die Interaktionswirkung (i.e. der nicht-additive Teil des gemeinsamen Effektes von A und B. n p q ' 2 QS AB AB AB j k j k i1 j1 k1 mit AB ' jk A j B k G

291 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Zurückkehrend zur Ausgangsidee sollte man nun vermuten, dass kein Effekt eines Treatments dazu führt, dass die Streuung zwischen seinen Stufenmittelwerten ähnlich hoch ist wie die Fehlerstreuung Prüfgröße & Ergebnistab. Also: QS TreatB TreatA AB QS Fehler wenn der Faktor keinen Effekt hat Plots Aber: Es kann gezeigt werden, dass die Quadratsummen zuvor transformiert werden müssen, damit der Vergleich stimmt Diese transformierten Quadratsummen werden als Populationsvarianzen bezeichnet Folie 2

292 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) QS-Zerlegung Die Berechnung der Populationsvarianzen erfordert statt des bei der Varianzberechnung üblichen Terms 1 / n andere Nenner. Prüfgröße & Ergebnistab. Statt des n werden die so genannten Freiheitsgrade (df, degrees of freedom) eingesetzt. Es gilt: df Tot np q 1 Plots df TreatA p 1 df TreatB q 1 df p 1 q 1 TreatAB Folie 3 df p q ( n 1) Fehler

293 & Statistik Streuungsvergleich Zweifaktorielle ANOVA Varianzanalyse Zweifaktorielle ANOVA Einzelvergleiche QS-Zerlegung Prüfgröße & Ergebnistab. Plots Folie 4 Damit werden die Populationsvarianzen berechnet als ˆ ˆ ˆ 2 Tot 2 TreatA 2 TreatB QS df QS df QS df Tot tot TreatA TreatA TreatB TreatB n p q i1 j1 k1 n n p q 1 p q i1 j1 k1 n p i1 j1 k1 ikj p 1 q x A B q 1 G j k 2 G G 2 2

294 & Statistik Streuungsvergleich Zweifaktorielle ANOVA Varianzanalyse Zweifaktorielle ANOVA Einzelvergleiche QS-Zerlegung Prüfgröße & Ergebnistab. Plots Damit werden die Populationsvarianzen berechnet als ˆ ˆ 2 AB 2 Fehler n p AB AB QS AB i1 j1 k1 df ( p 1) ( q 1) AB n p x A B QSFehler i1 j1 k1 df p q ( n 1) Fehler q q j k j k ikj j k ' 2 2 Folie 5

295 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Mit den Populationsvarianzen stimmt die zuvor angenommene Beziehung Ohne Effekt eines Treatments kann die Treat Streuung der Stufenmittelwerte nur aus der Fehlerstreuung entstehen. Daraus konstruiert man die Prüfgröße ˆ Treat ˆ ˆ Fehler 1 ˆ 2 Fehler F ˆ ˆ 2 Treat 2 Fehler Sie ist F-verteilt mit df Treat = p 1 Zählerfreiheitsgraden und df Fehler = p (n-1) Nennerfreiheitsgraden. Folie 6 Aus der F-Verteilung kann die Wahrscheinlichkeit p(f) für das Auftreten dieser Prüfgröße ermittelt werden

296 & Statistik Folie 7

297 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Folie 8 Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Man berechnet also zunächst die Prüfgröße F Die F-Verteilung gibt nun an, welche Wahrscheinlichkeit p(f) das Auftreten der Prüfgröße hat unter der Annahme, dass Treatmentvarianz und Fehlervarianz gleich sind. Ist diese Wahrscheinlichkeit zu klein, so muss es Einflüsse auf die Treatmentstreuung geben, die nicht auf die Fehlerstreuung zurückzuführen sind. Diese Einflüsse können nur durch das Treatment hervorgerufen werden, es hat also eine Wirkung. Das bedeutet gleichzeitig, dass die Mittelwerte der Treatmentstufen systematisch unterschiedlich sind (dieser Unterschied erzeugt gerade die Treatmentstreuung).

298 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) QS-Zerlegung Prüfgröße & Ergebnistab. Ist die berechnete Wahrscheinlichkeit p(f) also zu klein, gibt es Unterschiede in den Stufenmittelwerten. Problem: Wie klein ist zu unwahrscheinlich? Es gibt hier Konventionen, die so genannten Signifikanzniveaus Plots 0.05 statistisch nicht signifikant 0.05 statistisch signifikant 0.01 statistisch hochsignifikant Folie 9

299 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Beobachtung im Experiment: ˆ 2 Treat und ˆ 2 Fehler Frage: Sind die Varianzen in Wahrheit gleich? Geht die Streuung der Mittelwerte der Treatmentstufen nur auf die Fehlerstreuung zurück? (1) Festlegung eines Signifikanzniveaus α (2) Berechnung der Prüfgröße für jeden Faktor: F A,F B,F AB deren Häufigkeitsverteilung theoretisch bekannt ist (F-Verteilung) (3) Berechnung der Wahrscheinlichkeit für diese Prüfgröße: p(f A ), p(f B ), p(f AB ) Folie 10 (4) Rückschluss: (5) Vergleich von p mit α und Treffen der Signifikanzaussage pf pˆ ˆ ( ) 2 2 Treat Fehler Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α 100%

300 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Plots Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Man erstellt folgende Ergebnistabelle Faktor QS df Var F p A B A B Fehler Total Zusätzlich ist zu empfehlen, die Varianzaufklärung der Treatments zu bestimmen. Diese bezeichnet den Anteil an der Gesamtstreuung, für den das Treatment verantwortlich ist. Folie 11

301 & Statistik Varianzanalyse Mit Messwiederholung Streuungsvergleich QS-Zerlegung Prüfgröße & Ergebnistab. Varianzanalyse Ein-/Mehrfaktorielle ANOVA (ANalysis Of VAriance) Die Varianzaufklärung in der ANOVA wird als η² (eta²) bezeichnet und prinzipiell berechnet als: QS 2 Treat Treat QSTot mit QS QS oder QS oder QS Treat A B A B Plots Folie 12 Ebenso ist die nicht aufgeklärte Varianz zu bestimmen als der Anteil der verbleibenden Fehlerstreuung an der Gesamtstreuung, also: QS 2 Fehler Fehler QSTot

302 & Statistik Annahmen Fixed vs. Random Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Ein-/Mehrfaktorielle ANOVA - Voraussetzungen Bortz, S Die Beobachtungen müssen unabhängig sein, d.h. sie müssen von verschiedenen Merkmalsträgern stammen Die Fehler in jeder Treatmentstufe sollten normalverteilt sein mit einem erwarteten Mittelwert von 0. ekj 0 Die Fehlervarianzen in jeder Zelle der ANOVA sollen erwartet (nicht numerisch) gleich sein (Homoskedastizität). s s s e1,1 e1,2 e qp, Folie 13 Treatmenteffekte und Fehler müssen additiv sein, d.h. die Fehler dürfen nicht mit den Erwartungswerten der Treatmentstufen korrelieren.

303 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Annahmen Fixed vs. Random Varianzanalyse Ein-/Mehrfaktorielle ANOVA Voraussetzungsprüfung Die Unabhängigkeit der Beobachtungen wird i.d.r. begründet angenommen (educated guess). Zur Prüfung der Normalverteilungsannahme der Fehler (i.e. Zellresiduen) wird der Kolmogoroff-Smirnov Test verwendet Zur Prüfung der Homogenität der Fehlervarianzen wird zumeist der Bartlett Test, seltener der Levene Test bzw. der F-Test verwendet. Die Unabhängigkeit der Treatmenteffekte und Messfehler kann über einen Korrelationstest von Zellmittelwerten und Varianzen geprüft werden (selten praktiziert) Folie 14

304 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Annahmen Fixed vs. Random Varianzanalyse Ein-/Mehrfaktorielle ANOVA - Stichprobengröße Für alle Zellhäufigkeiten sollte n ij 10 gelten Zellhäufigkeiten n ij sollten (annähernd) gleich sein. Sind die Zellhäufigkeiten ungleich 1. müssen verschiedene Größen in der ANOVA- Berechnung approximiert bzw. gewichtet werden, z.b. der Grand Mean. 2. ist in der einfaktoriellen ANOVA die Annahme der Varianzhomogenität der Fehler schneller verletzt. Folie funktioniert die Quadratsummenzerlegung in der mehrfaktoriellen ANOVA nicht mehr, so dass die Faktoren nicht mehr trennbar sind.

305 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Annahmen Fixed vs. Random Varianzanalyse Ein-/Mehrfaktorielle ANOVA - Stichprobengröße Zu große Stichproben sind gleichermaßen problematisch Die ANOVA hat dann zu viel statistische Power, d.h. sie kommt selbst bei klein(st)en Unterschieden zu einer Signifikanzaussage Dies ist auf die Größe der Fehlerfreiheitsgrade (df Error ) zurückzuführen, in die der Stichprobenumfang direkt eingeht Die praktische Bedeutsamkeit von Effekten bei großen Stichproben sollte über die Varianzaufklärung ² bewertet werden Folie 16

306 & Statistik Zweifaktorielle ANOVA Varianzanalyse Spezialfall: Einfaktorielle ANOVA Einzelvergleiche Die ANOVA kann problemlos auch mit einer anderen Faktorenzahl als 2 berechnet werden Wird nur ein Faktor betrachtet, spricht man von einer einfaktoriellen ANOVA Es gibt bei der einfaktoriellen ANOVA nur einen Haupteffekt und keine Interaktion Die Ergebnistabelle ist dann stark vereinfacht Folie 20 Faktor QS df Var F p A Fehler Total

307 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Allgemeiner Fall: Mehrfaktorielle ANOVA Die ANOVA kann problemlos auch mit einer anderen Faktorenzahl als 2 berechnet werden Die ANOVA Ergebnistabelle z. B. bei 3 Faktoren lautet Folie 21 Faktor QS df Var F p A... B C A B A C A B C Fehler Total

308 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Weitere wichtige Typen von Varianzanalysen Oft werden in jeder Stufe bzw. Zelle der ANOVA Messwerte von denselben Personen erhoben Von jeder Person liegen also so viele Messungen der AV vor wie die ANOVA Zellen hat Beispiel: Studie zur Diabetesbehandlung bei Ratten, in der der Insulinspiegel über mehrere Wochen hinweg mehrfach erhoben wird. ANOVA mit Messwiederholung Folie 22

309 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Weitere wichtige Typen von Varianzanalysen Es können in abhängigen und unabhängigen ANOVA Designs beliebig viele Faktoren mit beliebig vielen Stufen miteinander kombiniert werden Auch die Kombination von abhängigen und unabhängigen Faktoren ist möglich (mixed ANOVA) Beispiel: Therapiestudie mit einem Messwiederholungsfaktor, einem Geschlechtsfaktor und einem Faktor Therapieart Messwiederholungsdesigns mit Gruppenfaktoren Folie 23

310 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Weitere wichtige Typen von Varianzanalysen Die Anzahl von Zellen in der ANOVA wird bei multiplen Faktoren mit vielen Stufen sehr schnell sehr groß (kombinatorische Explosion) Wenn der Experimentator nur an den Haupteffekten interessiert ist, kann der Versuchsplan drastisch reduziert werden, indem nur bestimmte Kombinationen von Stufen der Faktoren realisiert werden a1 a2 a3 b1 c1 c2 c3 b2 c2 c3 c1 b3 c3 c1 c2 Folie 24 Lateinische Quadrate

311 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Weitere wichtige Typen von Varianzanalysen In einigen Untersuchungsdesigns wird ein zweiter Faktor nur für bestimmte Stufen eines anderen Faktors realisiert Beispiel: Therapiestudie mit Placebogruppe, Medikamentengruppe und VT-Gruppe. Die Medikamentengruppe zerfällt in drei Untergruppen (kleine, mittlere, starke Dosis) Hierarchische ANOVA Designs Folie 25

312 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Varianzanalyse Weitere wichtige Typen von Varianzanalysen Bei vielen Fragestellungen ist es sinnvoll, verschiedene Treatments an denselben Merkmalsträgern zu testen. Beispiel: Strahlungsstärken in der Krebstherapie, Reizstärken bei Tests auf Schmerzempfindlichkeit, Effektivität verschiedener Düngemittel. Problem: Die einer Treatmentstufe ausgesetzte Stelle ist kontaminiert und für weitere Stufen unbrauchbar. Lösung: Man teilt den Merkmalsträger auf in verschiedene, als eigenschaftsgleich definierte Stücke ( Plots ) und appliziert hier die verschiedenen Stufen des Treatments. Folie 26 Split Plot Designs

313 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Problem: Ein signifikantes Ergebnis in der ANOVA zeigt nicht an, zwischen welchen Treatmentstufen der Effekt besteht. Für die Prüfung der Mittelwerte einzelner Faktorstufen gibt es zwei unterschiedliche Verfahrensweisen 1. A-Priori Tests zur Prüfung von Hypothesen, die bereits vor der Untersuchung formuliert worden sind. 2. A-Posteriori Tests (Post-hoc Tests) zur Prüfung von Hypothesen, die nach Ansehen der Daten gebildet wurden. Folie 2

314 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Bei den Mittelwertevergleichen im Rahmen der ANOVA können einzelne und Kombinationen von Mittelwerten verglichen werden. Es können Fragen beantwortet werden wie z.b. 1. Sind die Mittelwerte zweier Faktorstufen unterschiedlich? 2. Ist eine Faktorstufe unterschiedlich zum Mittelwert aller vorhergehenden Faktorstufen? 3. Sind die letzten beiden Faktorstufen unterschiedlich zu den ersten beiden? Folie 3

315 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Folie 4 Sind die Mittelwerte zweier Faktorstufen unterschiedlich? D A A j Ist eine Faktorstufe unterschiedlich zum Mittelwert aller vorhergehenden Faktorstufen? 1 D A p A1 A2... Ap 1 0 p 1 Sind die letzten beiden Faktorstufen unterschiedlich zu den ersten beiden? 1 1 D A 1 A2 Ap 1 Ap k 0

316 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Frage: Wann ist ein so berechnetes D verschieden genug von Null, damit der Mittelwerteunterschied als statistisch signifikant bewertet wird? Lösung: Aus dem D muss eine Prüfgröße mit bekannter Häufigkeitsverteilung konstruiert werden, um die Auftretenswahrscheinlichkeit des gemessenen D zu ermitteln, wenn in Wahrheit kein Unterschied besteht. Zur Berechnung einer F-verteilten Prüfgröße wird die (theoretische) Varianz der Mittelwerte benötigt Zusätzlich wird die Fehlervarianz benötigt Folie 5 Die Berechnung dieser Varianzen ist dabei von der Art des Mittelwertevergleichs abhängig.

317 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Es können sowohl Stufen- als auch Zellmittelwerte miteinander verglichen werden. Ein solcher Vergleich ist nur dann erlaubt, wenn der zugehörige Faktor signifikant geworden ist. A 1 A 2 A 3 Folie 6 B 1 A B B A B 1 2 A2B 1 A2B 2 A3B 1 A3B 2 A1 A2 A3 verschieden? verschieden? B 1 B 2 verschieden?

318 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Zur statistischen Prüfung von Differenzen in der Mittelwertetabelle der ANOVA kann eine ganz ähnliche Logik angewandt werden wie bei der ANOVA Sind Mittelwerte unterschiedlich, haben sie eine Streuung Diese Streuung entsteht a) aus dem Messfehler und b) einer eventuell vorhandenen systematischen Wirkung der beteiligten Faktorstufen Man kann dann wieder eine Prüfgröße definieren gemäß Treatmentstreuung Fehlerstreuung F = Treatmentvarianz Fehlervarianz Folie 7

319 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Zur statistischen Prüfung der Mittelwertsdifferenz lässt sich eine F-verteilte Prüfgröße konstruieren über F = D s 2 2 ˆ D mit df df Zähler Nenner Aus der F-Verteilung lässt sich nun die Wahrscheinlichkeit p(f) ermitteln, mit der der beobachtete Wert der Prüfgröße auftritt unter der Annahme, dass es in Wahrheit keinen Unterschied zwischen den Stufenmittelwerten gibt (D=0). Folie 8 Ist p(f) zu klein, liegt ein statistisch signifikanter Unterschied zwischen den verglichenen Mittelwerten vor, die Treatmentstufen haben verschieden große Effekte.

320 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA Einzelvergleiche Einzelvergleiche A-Priori Kontraste Scheffé Test Die Fehlervarianz zur Bewertung einer Mittelwertestreuung D² in der ANOVA ist prinzipiell: sˆ = Var D = 2 N sˆ 2 ( ) 2 D Fehler mit N = Anzahl Personen, die in das D eingehen, wobei sich für spezifische Vergleiche andere Werte ergeben Es wird also die in der ANOVA bereits berechnete Fehlervarianz zugrunde gelegt und so angepasst, dass sie als Vergleichsgröße für das D² geeignet ist Folie 9

321 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse Prinzip des Testens Einzelvergleiche A-Priori Kontraste Scheffé Test Beobachtung im Experiment: Stufen- oder Zellmittelwerte Frage: Sind die Mittelwerte in Wahrheit gleich? Ist ihre Differenz D=0? (1) Festlegung eines Signifikanzniveaus α (2) Berechnung der Prüfgröße: F deren Häufigkeitsverteilung theoretisch bekannt ist (F-Verteilung) (3) Berechnung der Wahrscheinlichkeit für diese Prüfgröße: p(f) Folie 10 (4) Rückschluss: pf ( ) p D 0 (5) Vergleich von p mit α und Treffen der Signifikanzaussage Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α 100%

322 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse A-Priori Tests Kontraste I Einzelvergleiche A-Priori Kontraste Scheffé Test Oft sollen in einer ANOVA beliebige Zellmittelwerte paarweise miteinander verglichen werden. Hat a-priori eine Hypothesenbildung stattgefunden, kann auch dies über Kontraste erreicht werden A 1 A 2 A 3 B 1 A1B 1 A2B 1 A3B 1 B 2 A1B 2 A2B 2 A3B 2 Folie 11 verschieden?

323 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse A-Priori Tests Kontraste I Einzelvergleiche A-Priori Kontraste Scheffé Test Für a-priori Vergleiche zweier beliebiger Zellmittelwerte in einer ANOVA mit n Personen je Zelle gilt für den Kontrast Die Prüfgröße ist F = D 2 2 ˆ D s mit sˆ 2 = sˆ n 2 2 D Fehler Folie 12 Für die Prüfgröße F gilt: df df Zähler Nenner = 1 = df Fehler

324 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse A-Priori Tests Kontraste II Einzelvergleiche A-Priori Kontraste Scheffé Test Oft sollen auch Stufenmittelwerte statt der Zellmittelwerte verglichen werden. Hier gehen in die Mittelwertsdifferenz D mehr Personen als nur die n Personen einer Zelle ein A 1 A 2 A 3 B 1 A B B A B 1 2 A2B 1 A2B 2 A3B 1 A3B 2 A1 A2 A3 B 1 B 2 verschieden? Folie 13 verschieden?

325 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse A-Priori Tests Kontraste II Einzelvergleiche A-Priori Kontraste Scheffé Test Für a-priori Vergleiche zweier beliebiger Stufenmittelwerte eines Faktors in einer ANOVA mit n Personen je Zelle gilt für den Kontrast Die Prüfgröße ist F = D 2 2 ˆ D s mit sˆ 2 = sˆ k n 2 2 D Fehler wobei k = Produkt aller Stufen auf den festgesetzten Faktoren ( summierte Zellen ) Für die Prüfgröße F gilt wieder: df df Zähler Nenner = 1 = df Fehler Folie 14

326 & Statistik Einführung Zweifaktorielle ANOVA Varianzanalyse ANOVA A-Posteriori Tests Einzelvergleiche A-Priori Kontraste Scheffé Test Gerade bei umfangreicheren Versuchsdesigns und unklaren Hypothesen werden während der Auswertung Effekte entdeckt, für die zuvor keine Hypothesen bestanden. In solchen Fällen ist es trotzdem sinnvoll zu prüfen, ob sich Signifikanzen ergeben, um gezielt Fragestellungen für weitere Untersuchungen zu entwickeln Achtung: Eine im Nachhinein aufgestellte Hypothese mit einem a-posteriori Test zu prüfen und zu belegen, hat faktisch keine Aussagekraft (ist jedoch in der empirischen Forschung durchaus verbreitet) Folie 15

327 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Einführung A-Priori Kontraste Scheffé Test Varianzanalyse A-Posteriori Tests Scheffé Test I Mit dem Scheffé Test können beliebige Zellen miteinander verglichen werden. Dieser Test ist ein a-posteriori Test und kommt eher spät (i.e. bei größeren Unterschieden) zu einer Signifikanzaussage. A 1 A 2 A 3 B 1 A1B 1 A2B 1 A3B 1 B 2 A1B 2 A2B 2 A3B 2 Folie 16 verschieden?

328 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Einführung A-Priori Kontraste Varianzanalyse A-Posteriori Tests Scheffé Test I Für a-posteriori Vergleiche zweier beliebiger Zellmittelwerte einer ANOVA mit m Zellen und n Personen je Zelle gilt nach Scheffé Scheffé Test Die Prüfgröße ist F corr 1 1 D = F = df df sˆ 2 Zähler Zähler D 2 wieder mit sˆ 1 = 2 sˆ n 2 2 D Fehler Für die Prüfgröße F corr gilt df df Zähler Nenner = m-1 = df Fehler Folie 17

329 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Einführung A-Priori Kontraste Scheffé Test Varianzanalyse A-Posteriori Tests Scheffé Test II Oft sollen in einer ANOVA a-posteriori auch Mittelwerte von Treatmentstufen ohne Beachtung des anderen Faktors geprüft werden. Es gehen hier wieder mehr als nur die n Personen einer Zelle in die Prüfgröße nach Scheffé ein A 1 A 2 A 3 B 1 A B B A B 1 2 A2B 1 A2B 2 A3B 1 A3B 2 A1 A2 A3 B 1 B 2 Folie 18 verschieden?

330 & Statistik Einfaktorielle ANOVA Einzelvergleiche Einführung A-Priori Kontraste Varianzanalyse A-Posteriori Tests Scheffé Test I Für a-posteriori Vergleiche zweier beliebiger Stufenmittelwerte eines Faktors mit p Stufen und n Personen je Zelle gilt nach Scheffé Scheffé Test Die Prüfgröße ist F corr 1 1 D = F = df df sˆ 2 Zähler Zähler D 2 wieder mit sˆ 1 = 2 sˆ k n 2 2 D Fehler wobei k = Produkt aller Stufen auf den festgesetzten Faktoren ( summierte Zellen ) Folie 19 Die Prüfgröße F corr hat df df Zähler Nenner = p -1 = df Fehler

331 & Statistik Zweifaktorielle ANOVA Einzelvergleiche Einführung A-Priori Kontraste Scheffé Test Varianzanalyse ANOVA Weitere A-Posteriori Tests Der Scheffé Test ist der konservativste unter den üblichen a-posteriori Tests, d.h. er kommt erst bei größeren Mittelwertsunterschiede zu einer signifikanten Entscheidung. Er ist robust gegenüber Verletzungen der Voraussetzungen der ANOVA Andere, progressivere Tests sind der Least Significant Difference Test (LSD) nach Fisher, der Honest Significant Difference Test (HSD) nach Tukey, der Duncan-Test oder der Newman-Keuls Test Folie 20

332 & Statistik ANOVA Ausblick Varianzanalyse Weitere wichtige Typen von Varianzanalysen Oft werden in jeder Stufe bzw. Zelle der ANOVA Messwerte von denselben Personen erhoben Von jeder Person liegen also so viele Messungen der AV vor wie die ANOVA Zellen hat Beispiel: Studie zur Diabetesbehandlung bei Ratten, in der der Insulinspiegel über mehrere Wochen hinweg mehrfach erhoben wird. ANOVA mit Messwiederholung Folie 21

333 & Statistik ANOVA Ausblick Varianzanalyse Weitere wichtige Typen von Varianzanalysen Es können in abhängigen und unabhängigen ANOVA Designs beliebig viele Faktoren mit beliebig vielen Stufen miteinander kombiniert werden Auch die Kombination von abhängigen und unabhängigen Faktoren ist möglich (mixed ANOVA) Beispiel: Therapiestudie mit einem Messwiederholungsfaktor, einem Geschlechtsfaktor und einem Faktor Therapieart Messwiederholungsdesigns mit Gruppenfaktoren Folie 22

334 & Statistik ANOVA Ausblick Varianzanalyse Weitere wichtige Typen von Varianzanalysen Die Anzahl von Zellen in der ANOVA wird bei multiplen Faktoren mit vielen Stufen sehr schnell sehr groß (kombinatorische Explosion) Wenn der Experimentator nur an den Haupteffekten interessiert ist, kann der Versuchsplan drastisch reduziert werden, indem nur bestimmte Kombinationen von Stufen der Faktoren realisiert werden a1 a2 a3 b1 c1 c2 c3 b2 c2 c3 c1 b3 c3 c1 c2 Folie 23 Lateinische Quadrate

335 & Statistik ANOVA Ausblick Varianzanalyse Weitere wichtige Typen von Varianzanalysen In einigen Untersuchungsdesigns wird ein zweiter Faktor nur für bestimmte Stufen eines anderen Faktors realisiert Beispiel: Therapiestudie mit Placebogruppe, Medikamentengruppe und VT-Gruppe. Die Medikamentengruppe zerfällt in drei Untergruppen (kleine, mittlere, starke Dosis) Hierarchische ANOVA Designs Folie 24

336 & Statistik ANOVA Ausblick Varianzanalyse Weitere wichtige Typen von Varianzanalysen Bei vielen Fragestellungen ist es sinnvoll, verschiedene Treatments an denselben Merkmalsträgern zu testen. Beispiel: Strahlungsstärken in der Krebstherapie, Reizstärken bei Tests auf Schmerzempfindlichkeit, Effektivität verschiedener Düngemittel. Problem: Die einer Treatmentstufe ausgesetzte Stelle ist kontaminiert und für weitere Stufen unbrauchbar. Lösung: Man teilt den Merkmalsträger auf in verschiedene, als eigenschaftsgleich definierte Stücke ( Plots ) und appliziert hier die verschiedenen Stufen des Treatments. Folie 25 Split Plot Designs

337 & Statistik Annahmen Zweifaktorielle ANOVA Varianzanalyse Fixed & Random Factors Einzelvergleiche Fixed vs. Random Fixed Factor Modelle: Die im Experiment realisierten Stufen eines Faktors beschreiben die UV für den Experimentator vollständig (kategorial geschlossen). Das Experiment gibt die Wirkung des Faktors über alle möglichen (bzw. interessierenden) Realisierungen an. Beispiele: Geschlecht, Schulabschluss, Altersgruppen Random Factor Modelle: Alle im Experiment realisierten Stufen eines Faktors stellen nur eine zufällige Auswahl aus vielen möglichen dar Das Experiment liefert eine Probe aus dem gesamten Wirkspektrum des Faktors. Beispiele: Rauschmitteldosis, Lichtintensität Folie 17

338 & Statistik Annahmen Zweifaktorielle ANOVA Varianzanalyse Fixed & Random Factors Einzelvergleiche Fixed vs. Random Motivation: Will der Experimentator Aussagen über die Wirkung von Faktorstufen treffen, die er nicht im Experiment untersucht hat, muss er interpolieren. Diese Interpolation ist nur bei Random Factor Modellen erlaubt Bei einem Fixed Factor Modell ist die Gefahr groß, dass wichtige Stufen eines Faktors übersehen oder vergessen wurden Problematisch wird hier vor allem die Nichtberücksichtigung wichtiger Interaktionen durch bestimmte Kombinationen von Faktoren Folie 18

339 & Statistik Annahmen Zweifaktorielle ANOVA Varianzanalyse Fixed & Random Factors Einzelvergleiche Fixed vs. Random Praktische Konsequenz: Effekte der Faktoren müssen an anderen Prüfvarianzen (i.e. Nennervarianzen) getestet werden, je nachdem, ob sie fixed oder random sind. Folie 19 Dasselbe gilt für die Einzelvergleiche innerhalb von Fixed oder Random Factors.