Professur Psychologie digitaler Lernmedien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Tabellen und Abbildungen
Überblick Tabellen Abbildungen Histogramm und Polygonzug Box-Plot und Violin-Plot Balken- und Säulendiagramm Streudiagramm Kreisdiagramm Exkurs: Standardabweichung vs. Standardfehler 2
Einführung Statistik als Suche nach Mustern in Zahlen Wie stellt man das Ergebnis dieser Suche adäquat dar? Mehrere Möglichkeiten der Ergebnisdarstellung Fließtext: Statistische Kennwerte im Fließtext einfügen Tabellen: Statistische Kennwerte in Tabellen aufbereiten Abbildungen: Statistische Kennwerte in Abbildungen visualisieren 3
Empfehlungen zur Gestaltung von Tabellen Weniger ist (oftmals) mehr Tabellen sparsam verwenden Keine oder nur wenige Farben einsetzen Konventionen zur Gestaltung Formatierung nach APA-Richtlinien Nur horizontale Linien verwenden Zu Maßen der zentralen Tendenz immer auch Streuungsmaße (z. B. Standardabweichungen) hinzufügen 4
Beispiele für Tabellen in Fachzeitschriften I Quelle: Florax und Plötzner (2010) Quelle: Rey und Steib (2013) 5
Beispiele für Tabellen in Fachzeitschriften II Quelle: Bokosmaty, Sweller und Kalyuga (2015) 6
Tabellen Was kann man an der unten dargestellten Tabelle kritisieren? A: Unnötiger Einsatz von Farben B: Tabelle enthält keine Streuungsmaße C: Tabelle enthält vertikale Linien D: Tabelle insgesamt überflüssig Rey.participoll.com Gruppengröße Lernleistung Mit Personalisierungen 47 2.15 Ohne Personalisierungen 46 1.34 A B C D 0 7
Abbildungen (z. B. Leonhart, 2013) Formen von Abbildungen Histogramm Polygonzug Box-Plot Balkendiagramm Säulendiagramm Streudiagramm Kreisdiagramm Empfehlungen zur Gestaltung von Abbildungen 8
Histogramm Histogramm: Abbildung einer Häufigkeitsverteilung in Säulenform Beispiel: Kognitive Belastung auf einer 100-stufigen Ratingskala Häufigkeit 100 90 80 70 60 50 40 30 20 10 0 1-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90 91-100 Kognitive Belastung 9
Polygonzug Polygonzug: Abbildung einer Häufigkeitsverteilung in Linienform Beispiel: Altersverteilung einer Stichprobe Häufigkeit 30 25 20 15 10 5 0 18 19 20 21 22 23 24 25 26 Alter 10
Box-Plot (z. B. Leonhart, 2013) Box-Plot (auch Box-Whisker-Plot genannt): Abbildung, die Maße der zentralen Tendenz (meist der Median) und Streuungsmaße (meist Quartile der Gruppen) darstellt Beispiel: Vergleich der Lernleistungen zwischen den Gruppen mit und ohne Signalisierungen Lernleistung 100 Median: Linie in der Box 90 80 Interquartilbereich: Box 70 Q 1 : Unteres Ende der Box 60 50 Q 3 : Oberes Ende der Box 40 Whiskers: Enthalten alle 30 20 weiteren Werte, aber ohne 10 0 Ausreißer oder Extremwerte Mit Signalisierungen Ohne Signalisierungen 11
Box-Plot (z. B. Leonhart, 2013) Beispiel: Box-Plot mit Ausreißern und Extremwerten Ausreißer (als Kreise dargestellt): Werte zwischen dem 1.5- und 3-fachen Abstand des Interquartilbereichs zu Q 1 bzw. Q 3 Extremwerte (als Kreuze oder Sterne dargestellt): Werte größer als der 3-fache Abstand des Interquartilbereichs zu Q 1 bzw. Q 3 Quelle: Leonhart (2013) 12
Violin-Plot (Hintze & Nelson, 1998) Violin-Plot: Weiterentwicklung des Box-Plot mit Darstellung der Wahrscheinlichkeitsdichte der Daten Violin-Plots enthalten mehr Informationen als Box-Plots Beispiel: Quelle: https://blog.modeanalytics.com/violin-plot-examples Quelle: https://seaborn.pydata.org/generated/seaborn.violinplot.html 13
Balken- und Säulendiagramm (z. B. Leonhart, 2013) Balken- und Säulendiagramm: Abbildung von Daten in Balken- oder Säulenform Häufig werden die Mittelwerte verschiedener Gruppen und die dazugehörigen Streuungen (z. B. Standardabweichungen in Form von Fehlerbalken) dargestellt Beispiel: Experiment zum Split-Attention Effekt von Florax und Plötzner (2010) 14
Säulendiagramm Was kann man an dem unten dargestellten Säulendiagramm kritisieren? A: Unklar, was die y-achse inhaltlich repräsentiert B: Fehlende Streuungsmaße C: Fehlende Farben in der Abbildung Rey.participoll.com Quelle: Homer, Plass und Blake (2008, Exp. 2) A B C 0 15
Transfer Streudiagramm (z. B. Leonhart, 2013) Streudiagramm (engl. scatter plot oder scattergraph): Abbildung, die den Zusammenhang zwischen zwei stetigen Variablen verdeutlicht Form der Punktwolke liefert Hinweise über den Zusammenhang der beiden Variablen Beispiel: Fiktiver Zusammenhang zwischen Behaltens- und Transferlernleistungen 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 Behalten 16
IQ-Test 2 Streudiagramm Was kann man an dem unten dargestellten Streudiagramm kritisieren? A: Achsen beginnen nicht bei Null B: Unnötige farbige Markierungen C: Kreise statt Kreuze als Markierungen D: Unnötige Hilfsgitterlinien Rey.participoll.com 130 120 110 100 90 80 70 70 80 90 100 110 120 130 IQ-Test 1 A B C D 0 17
Kreisdiagramm Kreisdiagramm (auch als Kuchen- oder Tortendiagramm bezeichnet): Abbildung, die Teile eines Ganzen in Kreissektoren anordnet Prozentwerte werden z. T. als Kreisdiagramme visualisiert Beispiel: Prozentuale Aufschlüsselung der Studierenden nach Studienfächern 8% 5% Medienkommunikation 13% 18% 56% Psychologie Pädagogik Soziologie Germanistik 18
Empfehlungen zur Gestaltung von Abbildungen (Rey, 2012) Weniger ist (oftmals) mehr Abbildungen äußerst sparsam verwenden Gestaltungsempfehlungen aus der CLT und CTML beachten Keine oder nur wenige Farben einsetzen Wahrheit und Klarheit Zusammenhänge in den Daten nicht vortäuschen Daten in den Vordergrund stellen Verständliche und vollständige Abbildungsbeschriftung (Legende) hinzufügen Abbildungen sollten neben Maßen der zentralen Tendenz auch Streuungsmaße (z. B. Standardabweichungen) enthalten 19
Beispiele für Abbildungen (Rey, 2012) Einfarbige vs. mehrfarbige Abbildungen Abbildungen mit vs. ohne Streuungsmaß (hier: Standardabweichung) Zweidimensionale vs. dreidimensionale Abbildungen Abbildungen ohne vs. mit Hilfslinien Lernleistung Lernleistung 16 14 12 10 8 6 4 2 0 Trainingsbedingung Kontrollbedingung 16 14 12 10 8 6 4 2 0 Trainingsbedingung Kontrollbedingung Quelle: Rey (2012) 20
Beispiele für Abbildungen (Rey, 2012) Abbildungen mit vs. ohne Streuungsmaß (hier: Standardabweichung) Abbildungen mit großem vs. kleinem Wertebereich der y-achse Lernleistung 16 Lernleistung 12,3 14 12,0 12 11,6 10 11,3 8 10,9 6 10,6 4 10,2 2 9,9 0 Trainingsbedingung Kontrollbedingung 9,5 Trainingsbedingung Kontrollbedingung Quelle: Rey (2012) 21
Exkurs: Standardabweichung vs. Standardfehler (z. B. Koschack, 2008) Standardabweichung und Standardfehler unterscheiden sich Standardabweichung (engl. standard deviation, SD): Grob gesagt die durchschnittliche Abweichung der Messwerte von ihrem Mittelwert Formel: Standardfehler (engl. standard error of the mean, SEM bzw. SE): Theoretische Streubreite der Gruppenmittelwerte, die sich aus unendlich vielen, aus der Population gezogenen Stichproben ergeben würde Formel: SD n i 1 SD SEM n x i x n 1 2 (Wichtig: SEM über SD und nicht SD² berechnen) 22
Exkurs: Standardabweichung vs. Standardfehler (Koschack, 2008) Vergleich zwischen Standardabweichung und Standardfehler: Standardabweichung (SD) Aussage über die Streuung der erhobenen Werte in einer Stichprobe Abhängig von der Variabilität des zu messenden Konstruktes Deskriptivstatistisches Maß Sehr geringer Einfluss der Stichprobengröße auf dieses Maß Standardfehler (SE bzw. SEM) Aussage über die Genauigkeit des Mittelwerts in einer Stichprobe Abhängig von der Messgenauigkeit Inferenzstatistisches Maß Sehr großer Einfluss der Stichprobengröße auf dieses Maß Empfehlung von Koschack (2008, S. 259): Die Angabe der Standardabweichung ist also auf jeden Fall der des Standardfehlers vorzuziehen. 23
Exkurs: Standardabweichung vs. Standardfehler Beispiel für den Unterschied zwischen Standardabweichung und Standardfehler (für ein Experiment mit zwei Gruppen und N = 113): Säulendiagramm mit Standardabweichungen Säulendiagramm mit Standardfehlern 10 10 9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 Links-Rechts Rechts-Links 0 Links-Rechts Rechts-Links 24
Zusammenfassung Fließtext, Tabellen und Abbildungen: Unterschiedliche Möglichkeiten der Ergebnisdarstellung Tabellen sparsam einsetzen und nach gängigen Konventionen gestalten Histogramm, Polygonzug, Box- und Violin-Plot, Balken- und Säulendiagramm, Streudiagramm und Kreisdiagramm: Ausgewählte Formen von Abbildungen Für Tabellen und Abbildungen gilt: Weniger ist (oftmals) mehr; Wahrheit und Klarheit herstellen Da sich Standardabweichung und Standardfehler unterscheiden, immer angeben, welches Streuungsmaß visualisiert wird 25
Lernspiel zur Wiederholung der letzten Sitzungen Kahoot.it 26
Prüfungsliteratur Leonhart, R. (2013). Lehrbuch Statistik. Einstieg und Vertiefung (3. Aufl.). Bern: Huber. Grafische Darstellungen (S. 83-95) Rasch, B., Friese, M., Hofmann, W., & Naumann, E. (2014). Quantitative Methoden 1: Einführung in die Statistik für Psychologen und Sozialwissenschaftler (4. Aufl.). Heidelberg: Springer. Darstellung von Daten (S. 4-6) Rey, G. D. (2012). Methoden der Entwicklungspsychologie. Datenerhebung und Datenauswertung. Norderstedt bei Hamburg: BoD. Datenvisualisierung (S. 102-103) Koschack, J. (2008). Standardabweichung und Standardfehler: der kleine, aber feine Unterschied. Z Allg Med, 84, 258-260. 27
Weiterführende Literatur Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Aufl.). Berlin: Springer. Grafische Darstellungen von Merkmalsverteilungen (S. 39-47) Eid, M., Gollwitzer, M., & Schmitt, M. (2015). Statistik und Forschungsmethoden (4. Aufl.). Weinheim: Beltz. Univariate Deskriptivstatistik (S. 127-168) Tufte, E. R. (2001). The visual display of quantitative information (2. Aufl.). Cheshire, Connecticut: Graphics Press. Hintze, J. L., & Nelson, R. D. (1998). Violin plots: a box plot-density trace synergism. The American Statistician, 52, 181-184. 28