Quantitative Methoden Skalen der Messtheorie Deskriptive Statistik Andreas Opitz (Vertretung von Prof. Thomas Pechmann) Universität Leipzig Institut für Linguistik
Ausfall der VL am 02. Juni 2015 (nächste Woche)
Arten von Variablen im Experiment (Wiederholung)
Arten von Variablen im Experiment unabhängige Variablen abhängige Variablen Störvariablen
Arten von Variablen im Experiment Unabhängige Variable: Ihr Einfluss soll untersucht werden. Dazu wird sie im Experiment planmäßig variiert. Abhängige Variable: Die Variable, deren Abhängigkeit (Beeinflussbarkeit) von der unabhängigen Variablen Gegenstand der Untersuchung ist. (Die Ausprägung dieser Variablen wird i.d.r. im Experiment gemessen.) Störvariable: Alle Variablen die sonst noch (d.h. außer der planmäßig variierten unabhängigen Variablen) einen Einfluss auf die abhängige Variable haben. Die Störvariablen müssen in einem Experiment so kontrolliert werden, dass sie keinen Einfluss auf das Testergebnis haben.
unabhängige Variablen werden vom Versuchsleiter (VL) verändert (manipuliert, variiert)
unabhängige Variablen Faktoren Faktorenstufe Bedingung Multiplikation der Stufen aller Faktoren (alle Zellen müssen gefüllt sein)
unabhängige Variablen Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel Genus oder lexikalischer Status Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: maskulin, feminin, neutrum oder reales Wort / Pseudo-Wort Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.b.: Genus x lex. Status = 2 x 3 = 6 Bedingungen
unabhängige Variablen Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel Genus oder lexikalischer Status Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: maskulin, feminin, neutrum oder reales Wort / Pseudo-Wort Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.b.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Reales Wort Maskulinum Femininum Neutrum Pseudo-Wort
unabhängige Variablen Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel Genus oder lexikalischer Status Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: maskulin, feminin, neutrum oder reales Wort / Pseudo-Wort Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.b.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort der Baum die Welt das Haus Pseudo-Wort
unabhängige Variablen Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel Genus oder lexikalischer Status Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: maskulin, feminin, neutrum oder reales Wort / Pseudo-Wort Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.b.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort der Baum die Welt das Haus Pseudo-Wort der Waum die Selt das Vaus
unabhängige Variablen Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel Genus oder lexikalischer Status Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: maskulin, feminin, neutrum oder reales Wort / Pseudo-Wort Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.b.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort der Baum die Welt das Haus (mask real) (fem real) (neut real) Pseudo-Wort der Waum die Selt das Vaus (mask pseudo) (fem pseudo) (neut pseudo)
unabhängige Variablen Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel Genus oder lexikalischer Status Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: maskulin, feminin, neutrum oder reales Wort / Pseudo-Wort Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.b.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort B1 B2 B3 (mask real) (fem real) (neut real) der Baum die Welt das Haus Pseudo-Wort B4 B5 B6 (mask pseudo) (fem pseudo) (neut pseudo) der Waum die Selt das Vaus
das, was gemessen wird abhängige Variablen
Messen Realen Objekten oder Ereignissen werden nach definierten Regeln Zahlenwerte zugeordnet. Das numerische Relativ ist eine homomorphe Abbildung des empirischen Relativs. Das resultierende numerische Relativ wird als Skala bezeichnet.
Abbildungsrelationen Homomorphismus (Funktion) Ereignis Zahl A 1 B 2 C 3 D 4
Abbildungsrelationen Homomorphismus (Funktion) Isomorphismus (bijektive Funktion) Ereignis Zahl Ereignis Zahl A 1 A 1 B 2 B 2 C 3 C 3 D 4 D 4
Abbildungsrelationen Homomorphismus (Funktion) Isomorphismus (bijektive Funktion) Ereignis Zahl Ereignis Zahl Ereignis Zahl A 1 A 1 A 1 B 2 B 2 B 2 C 3 C 3 C 3 D 4 D 4 D 4
Gütekriterien wissenschaftlicher Messungen Objektivität: Sind die Ergebnisse unabhängig von Einflüssen der Untersucher oder der Untersuchungssituation bei Durchführung, Auswertung und Interpretation zustande gekommen? Reliabilität: Wird die abhängige Variable zuverlässig gemessen oder ist die Messung in zu großem Ausmaß mit Messfehlern behaftet? Validität: Misst das Verfahren tatsächlich das gewünschte Merkmal? (Oder ist es zum Beispiel zu stark von Störvariablen beeinflusst?)
(was kann gemessen werden) Verhalten der VP (behaviorale Mehtoden) Tastendruck (Reaktionszeiten, Anteil der Fehler) Augenbewegungen Artikulation (Benennen, Lesen ) Ankreuzen Physiologische Reaktionen der VP Veränderungen der: Hirnströme (EEG) Magnetfelder (MEG) Stoffwechselprozesse im Gehirn (fmri)
Reaktionszeiten VP reagieren (i.d.r. per Tastendruck) auf einen präsentierten Stimulus Beispiel: Lexikalische Entscheidung Ist die folgende Zeichenkette ein Wort des Deutschen? präsentiert werden dann z.b. Haus, Kleum usw. VP reagiert durch drücken von zwei Tasten mit ja oder nein Gemessen wird die Zeit (Latenz) und ggf. die Art der Entscheidung (Korrektheit).
Skalen der Messtheorie
Skalen Nominalskala Ordinalskala Intervallskala Rationalskala
Nominalskala nicht-numerische, verbalisierte Daten Entscheidung über Gleichheit vs. Verschiedenheit Werte nicht zu einander geordnet Statistik: Häufigkeit (N), Chi-Quadrat Bsp. Blutgruppen Geschlecht Korpusanalyse: Wortartenbestimmung strukturelles Priming: Antwort ist vom Typ A oder Typ B
Ordinalskala numerische Daten größer/kleiner-entscheidung Statistik: Median, Mann-Whitney-U-Test Bsp. Schulnoten Erreichter Bildungsabschluss Rating auf Skala, z.b. Akzeptabilität
Intervallskala ordinalskalierte Daten mit gleichen Abständen zwischen Werten (x ist genauso weit von y entfernt wie y von z) Einheiten und Nullpunkt willkürlich festgelegt Statistik: arithmetisches Mittel; Korrelation, T-Test, Varianzanalyse Bsp. Temperaturmessung in Celsius Jahreszahlen
Rationalskala (auch: Verhältnisskala, Ratio-Skala) Einheiten willkürlich festgelegt, theoretisch bestimmter ( logischer bzw. absoluter) Nullpunkt Bsp. absolute Temperaturskala Lebensalter Geldbeträge Reaktionszeiten Rating mittels magnitude estimation
Skalenniveaus Nominalskala qualitative Methoden Ordinalskala quantitative Methoden Intervallskala Rationalskala 28
Skalenniveaus Nominalskala qualitative Methoden nicht-parametrische Tests Ordinalskala quantitative Methoden Intervallskala parametrische Tests Rationalskala 29
Skalenniveaus
Stichproben in der Psycholinguistik
Stichprobe - Grundgesamtheit Durch das Experiment will man Aussagen über die Grundgesamtheit treffen. Es wird jedoch nur eine sehr kleine Stichproben untersucht. Von dieser muss auf die Grundgesamtheit geschlussfolgert werden. Grundgesamtheit: Für alle X gilt (X) Stichprobe: Es gibt mindestens ein X, für das gilt (x) Im Experiment wird meist versucht, Unterschiede zwischen Bedingungen zu finden. Nullhypothese: es gibt keinen Unterschied Alternativ-Hypothese: es gibt einen Unterschied
Stichprobe - Grundgesamtheit Um zu beweisen, dass eine Hypothese für alle X gilt, müssten alle X untersucht werden. Eine Hypothese kann mit einer Stichprobe also nie verifiziert werden. (Es kann ein Individuum außerhalb der Stichprobe geben, dass die Hypothese widerlegt.) Eine Hypothese kann mit einer Stichprobe nur falsifiziert werden. (Es genügt, ein X zu finden, für das die Hypothese nicht gilt, um sie zu widerlegen.) Wenn man eigentlich an Unterschieden interessiert ist, muss man also die Nullhypothese (H 0 = es gibt keine Unterschiede) für die Stichprobe falsifizieren. (Die eigentlich interessierende Hypothese ist dann die Alternativhypothese.) Ist die Nullhypothese falsifiziert, hat man indirekte Evidenz, dass die Alternativhypothese (H 1 ) für die Grundgesamtheit gelten kann. (Wenn es Unterschiede in der Stichprobe gibt, gilt dies logisch auch für die Grundgesamtheit.)
Stichprobe - Grundgesamtheit Wichtig: Liefert ein Experiment ein Null-Ergebnis, das heißt, kann die Null-Hypothese nicht abgewiesen werden (kein Unterschied feststellbar), dann bedeutet das nicht, dass der untersuchte Faktor keinen Einfluss in der Grundgesamtheit hat. Mögliche Ursachen für Null-Ergebnis: der untersuchte Faktor hat tatsächlich keinen Einfluss es gibt Elemente außerhalb der Stichprobe, auf die der Faktor einen Einfluss hat ungenaue Messung, Messfehler falsches experimentelles Design
Deskriptive Statistik
Deskriptive Statistik deskriptive Statistik erfolgt immer vor Inferenzstatistik! Beschreibung der Daten anhand von Kennwerten Anzahl der gültigen Werte Kennwerte der zentralen Tendenz Kennwerte der Streuung tabellarische Darstellung Abbildung 36
Deskriptive Statistik deskriptive Statistik vor Inferenzstatistik! Prüfung Hat die Messung funktioniert? Genügen die Daten den Kriterien der inferenzstatistischen Verfahren? Ausschluss von Versuchspersonen oder Items nach vordefinierten Kriterien: fehlende Werte Fehlerrate Reaktionszeiten Extremwerte 37
Verteilungsformen
Histogramm Deskriptive Statistik Deskriptive Statistik 39
Histogramm Deskriptive Statistik Deskriptive Statistik 40
Verteilungsformen (Bortz, 1999, S. 35)
Normalverteilung
Normalverteilung
Normalverteilung Die Normal- oder Gauß-Verteilung ist ein wichtiger Typ stetiger Wahrscheinlichkeitsverteilungen. Die Abweichungen der (Mess-)Werte vieler naturwissenschaftlicher Vorgänge vom Mittelwert lassen sich durch die Normalverteilung (oft auch logarithmische Normalverteilung) entweder exakt oder wenigstens in sehr guter Näherung beschreiben. Dies gilt vor allem für Werte, die von mehreren Faktoren unabhängig voneinander in verschiedene Richtungen beeinflusst werden. (Zentraler Grenzwertsatz) mehr dazu später im Semester
Kennwerte der zentralen Tendenz Modalwert arithmetisches Mittel Median 45
Kennwerte der zentralen Tendenz Modalwert (Modus, engl. mode) der am häufigsten in einer Verteilung vorkommende Wert Beispiel: 25 zufällige Werte (Bereich 1-9): 4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6 Sortiert noch Größe: 1 1 2 2 2 3 3 3 4 4 4 4 4 5 5 6 6 6 7 7 7 7 8 9 9 4 kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert 1 2 3 4 5 6 7 8 9 Anzahl 2 3 3 5 2 3 4 1 2 46
Kennwerte der zentralen Tendenz 4 kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert 1 2 3 4 5 6 7 8 9 Anzahl 2 3 3 5 2 3 4 1 2 47
Kennwerte der zentralen Tendenz Auch für nominale Skalen geeignet (kategoriale Werte) Beispiel: Werte (Kategorien): b e e a b c c c a a c e f a c e Sortiert noch Kategorie: a a a a b b c c c c c e e e e f c kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert a b c e f Anzahl 4 2 5 4 1 48
Kennwerte der zentralen Tendenz c kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert a b c e f Anzahl 4 2 5 4 1 49
Beispiel: Rosen-Experiment Dieses hypothetische Beispiel wird uns als Illustration für einige statistische Konzepte noch häufiger im Semester beschäftigen. 50
Beispiel: Rosen-Experiment Hypothetisches Szenario: Karl ist Rosenzüchter. Er möchte herausfinden, wie lange es dauert, bis eine frische Rose seiner neuen Züchtung in einer Vase mit Wasser verwelkt. (Eigenschaft der Population) Vorgehen: Am Tag des Aufblühens wird eine Rose abgeschnitten und in eine genormte Vase mit Wasser gestellt. Notiert wird am wievielten Tag das erste Blütenblatt welkt ist. Karl führt diesen Versuch mit insgesamt 100 Rosen durch. 51
Ergebnis: Versuch Nr. 1 2 3 4 5 6 10 0 Verblüh-Tag 5 2 4 6 5 4 3
Ergebnis: Verblüh-Tag 1 2 3 4 5 6 7 8 Anzahl 0 2 15 39 30 12 2 0
Ergebnis: Modus = 4
Kennwerte der zentralen Tendenz arithmetisches Mittel ( Mittelwert, engl. mean) arithmetischer Durchschnittswert einer Verteilung Summe der Werte durch Anzahl der Werte 55
Arithmetisches Mittel arithmetisches Mittel ( Mittelwert, engl. mean) Beispiel: 24 zufällige Werte (Bereich 1-9): 4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6 n i=1 Mittelwert = n xi = 4+6+2+4+7+4+1+4+7+3+2+7+4+7+9+3+1+8+6+5+9+5+2+3+6 24 = 4.76 56
Arithmetisches Mittel arithmetisches Mittel mindestens intervallskalierte Daten bei symmetrischer Verteilung nicht bei kleinen Stichproben relativ anfällig gegen Ausreißer 57
Arithmetisches Mittel Beispiel aus dem Rosen-Experiment: mean = 5+2+4+6+5+ 4+3 100 = 4.41 58
Arithmetisches Mittel Gründe gegen das arithmetische Mittel Mehrgipflige Verteilungen Keine intervallskalierten Daten Extrem kleine Stichprobe Asymmetrische Verteilung 59
Arithmetisches Mittel Anfälligkeit gegen Ausreißer Königreich-Beispiel : Angenommen Sie möchten eine Aussage über das Vermögen aller Menschen in einem fiktiven mittelalterlichen Königreich machen. Aus diesem Grund bestimmen Sie bei einer Volkszählung das Vermögen eines jeden Einwohners inklusive des Königs und seiner Familie. Das Vermögen ist sehr ungleich verteilt. 60
Arithmetisches Mittel Königreich-Beispiel : Einwohner: 100 Personen (90 Bürger, 9 Adlige, 1 König) Gesamtvermögen im Land: 2791 Goldtaler Durchschnittliches Vermögen (Mittelwert): 27.91 Goldtaler 61
Arithmetisches Mittel Königreich-Beispiel (Anfallen der Messpunkte): Deskriptive Statistik 62
Arithmetisches Mittel Königreich-Beispiel (sortiert Werte): Deskriptive Statistik 63
Arithmetisches Mittel Königreich-Beispiel : Gesamtvermögen im Land: 2791 Goldtaler Vermögen des Königs: 1000 Goldtaler gesamtes Vermögen der 9 Adligen: 898 Goldtaler gesamtes Vermögen der übrigen 90 Bürger: 893 Goldtaler 64
Königreich-Beispiel : Arithmetisches Mittel Deskriptive Statistik 65
Königreich-Beispiel : Arithmetisches Mittel Mittel im Land: 27.91 Taler Mittel ohne König: 18.09 Taler Mittel ohne Adlige und ohne König: 9.92 Taler Welches ist der aussagekräftigste Wert für das Land? 66
Königreich-Beispiel : Arithmetisches Mittel das obere 1% der Bevölkerung (König) besitzt 35.8% des Vermögens (1000 von 2791 Talern) die oberen 10% der Bevölkerung (König + Adel) besitzen 68.0% des Vermögens (1000 + 898 von 2791 Talern) 67
Königreich-Beispiel : Arithmetisches Mittel Wie sehen eigentlich reale Vermögensverhältnisse aus? 68
Quelle: Stefan Bach, Martin Beznoska, Viktor Steiner (2011): "A Wealth Tax on the Rich to Bring down Public Debt?", DIW 2011, S. 11.
Quelle: http://phasenraum.blogspot.de/2012/07/ware-deutschlands-flache-nach-vermogen.html (abgerufen am 05.05.2014)
Kennwerte der zentralen Tendenz Median der Wert, über und unter dem gleich viele Werte liegen mindestens ordinalskalierte Daten auch bei asymmetrischer Verteilung auch bei kleinen Stichproben nicht sehr anfällig für Ausreißer 71
Median Median Beispiel 24 zufällige Werte (Bereich 1-9): 4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6 Sortiert noch Größe: 1 1 2 2 2 3 3 3 4 4 4 4 4 5 5 6 6 6 7 7 7 7 8 9 9 Mitte der Zahlenreihe suchen: 1 1 2 2 2 3 3 3 4 4 4 4 4 5 5 6 6 6 7 7 7 7 8 9 9 = 4 Über und unter der Mitte liegen hier je 12 Messwerte. 72
Median Rosen Beispiel: Deskriptive Statistik 73
Median Rosen Beispiel: Werte nach Größe sortieren: Deskriptive Statistik 74
Median Rosen Beispiel: Mitte bestimmen: Deskriptive Statistik 75
Median Rosen Beispiel: Median ablesen: Median = 4 (mean = 4.41) Deskriptive Statistik 76
Median Königreich-Beispiel: (nach Größe sortiert) 77
Median Königreich-Beispiel: (nach Größe sortiert) Mitte bestimmen 78
Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen 79
Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen 80
Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen 81
Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen Median = 10 (Mean = 27.91) 82
Kennwerte der zentralen Tendenz Median und Mittelwert Bei extremen Werten am oberen oder unteren Ende des Wertebereichs ist der Median ein besseres Maß als der Mittelwert. Siehe Beispiel: Einkommensverhältnisse eines hypothetischen Königreiches 83
Median in den Medien http://www.welt.de/wirtschaft/article114649182/italiener-und- Spanier-sind-reicher-als-Deutsche.html http://www.zeit.de/2013/14/europa-vermoegensverteilung http://www.spiegel.de/politik/deutschland/faktencheck-zur- bundesbank-studie-private-haushalte-und-ihre-finanzen-a- 890877.html 84
Kennwerte der Dispersion Varianzbreite (range) Varianz Standardabweichung (Streuung)