Kreisdiagramm, Tortendiagramm Darstellung der relativen (absoluten) Häufigkeiten als Fläche eines Kreises Anwendung: Nominale Merkmale Ordinale Merkmale (Problem: Ordnung nicht korrekt wiedergegeben) Gruppierte Daten Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 95 / 355
Beispiel Redakteure: Kreisdiagramm Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 96 / 355
Stabdiagramm, Säulen- und Balkendiagramm Stabdiagramm: Trage über a 1,..., a k jeweils einen zur x-achse senkrechten Strich (Stab) mit Höhe h 1,..., h k (oder f 1,..., f k ) ab. Säulendiagramm: wie Stabdiagramm, aber mit Rechtecken statt Strichen. Balkendiagramm: wie Säulendiagramm, aber mit vertikal statt horizontal gelegter x-achse. Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 97 / 355
Säulendiagramm Darstellung der absoluten oder relativen Häufigkeiten als Höhen (Längen) x-achse: Ausprägungen des Merkmals y-achse: absolute/ relative Häufigkeiten Anwendungen: Ordinale Merkmale Metrische Merkmale mit wenigen Ausprägungen Nominale Merkmale (Problem: Ordnung nicht vorhanden) Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 98 / 355
Beispiel Redakteure: Säulendiagramm vertikal Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 99 / 355
Beispiel Redakteure: Säulendiagramm horizontal Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 100 / 355
Stapeldiagramm Darstellen der absoluten oder relativen Häufigkeiten als Länge. Die Abschnitte werden übereinander in verschiedenen Farben gestapelt. Anwendungen: Ordinale Daten Gruppierte Daten Metrische Daten mit wenigen Ausprägungen Besonders geeignet für den Vergleich verschiedener Gruppen durch nebeneinander liegende Stapel. Zu beachten ist dann die Unterscheidung: relative Häufigkeit absolute Häufigkeit Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 101 / 355
Beispiel Redakteure: Stapeldiagramm I Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 102 / 355
Beispiel Redakteure: Stapeldiagramm II Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 103 / 355
Beispiel Redakteure: Vergleich mit Kreisdiagramm Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 104 / 355
Das Histogramm Darstellung der relativen Häufigkeiten durch Flächen (Prinzip der Flächentreue) Vorgehen: 1 Aufteilung in Klassen (falls die Daten noch nicht gruppiert sind) 2 Bestimmung der relativen Häufigkeiten f j = n j n 3 Bestimmung der Höhen h j, so dass gilt b j h j = f j wobei b j : Breite der Klasse j. Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 105 / 355
Beispiel: Alter der Redakteure Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 106 / 355
Beispiel: Alter der Redakteure Altersklassen in Abständen von 5 Jahren Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 107 / 355
Histogramm mit Standardeinstellung aus SPSS Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 108 / 355
Histogramm Anwendung bei metrischen Daten Beachte: Abhängigkeit von der Breite Klasse inhaltlich vorgeben, verschiedene Varianten ansehen. Vorsicht bei Rändern Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 109 / 355
Stamm-Blätter-Diagramm (Stem and leaf plot) Spezielles Histogramm mit Klassen nach Dezimalsystem Einzeldaten reproduzierbar Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 110 / 355
Beispiel: Alter der Redakteure Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 111 / 355
Empirische Verteilungsfunktion H(x) := Anzahl der Werte <= x bzw. F (x) = H(x)/n = Anteil der Werte x i mit x i x F (x) = f (a 1 ) +... + f (a j ) = f i, i:a i x wobei a j x und a j+1 > x ist. Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 112 / 355
Eigenschaften von F (x) monoton wachsende Treppenfunktionen mit Sprüngen an den Ausprägungen a 1,..., a k Sprunghöhen: h 1,..., h k bzw. f 1,..., f k rechtsseitig stetig H(x) = 0 für x < a 1, H(x) = n für x a k F (x) = 0 für x < a 1, F (x) = 1 für x a k Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 113 / 355
Beispiel für eine Empirische Verteilungsfunktion Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 114 / 355
Eindimensionale statistische Kennwerte Lagemaßzahlen Wo liegt die Masse der Daten? Wo liegt die Mehrzahl der Daten? Wo liegt die Mitte der Daten? Welche Merkmalsausprägung ist typisch für die Häufigkeitsverteilung? Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 115 / 355
Statistische Kennwerte Streumaßzahlen Über welchen Bereich erstrecken sich die Daten? Wie groß ist die Schwankung der Ausprägungen? Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 116 / 355
Der Modus Definition: Häufigster Wert Eigenschaften: oft nicht eindeutig nur bei gruppierten Daten oder bei Merkmalen mit wenigen Ausprägungen sinnvoll stabil bei allen eindeutigen Transformationen geeignet für alle Skalenniveaus Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 117 / 355
Der Median Definition: Wert für den gilt Mindestens 50% der Daten sind kleiner oder gleich med Mindestens 50% der Daten sind größer oder gleich med { x(k) falls k = n+1 med = 2 ganze Zahl 1 2 (x (k) + x (k+1) ) falls k = n 2 ganze Zahl x (1),..., x (n) sind geordnete Werte Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 118 / 355
Eigenschaften des Medians anschaulich stabil gegenüber monotonen Transformationen geeignet für ordinale Daten stabil gegenüber Ausreißern Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 119 / 355
Das Quantil Definition: Wert für den gilt: Mindestens Anteil p der Daten sind kleiner oder gleich x p Mindestens Anteil 1 p der Daten sind größer oder gleich x p { x(k) falls np keine ganze Zahl und k kleinste Zahl > np [ ] x (k) ; x (k+1) falls k = np ganze Zahl Es gibt weitere Definitionen von Quantilen (in R 9 Typen), die sich aber in der Praxis kaum unterschieden. Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 120 / 355
Boxplot Einfacher Boxplot x 0.25 = Anfang der Schachtel (Box) x 0.75 = Ende der Schachtel d Q = Länge der Schachtel Der Median wird durch den Strich in der Box markiert Zwei Linien ( whiskers ) außerhalb der Box gehen bis zu x min und x max. Modifizierter Boxplot Die Linien außerhalb der Schachtel werden nur bis zu x min bzw. x max gezogen, falls x min und x max innerhalb des Bereichs [z u, z o] der Zäune liegen. z u = x 0.25 1, 5d Q, z o = x 0.75 + 1, 5d Q Ansonsten gehen die Linien nur bis zum kleinsten bzw. größten Wert innerhalb der Zäune, die außerhalb liegenden Werte werden individuell eingezeichnet. Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 121 / 355
Boxplot Eindimensionale Darstellung auf der zugehörigen Skala Visualisieren der 5-Punkte-Zusammenfassung Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 122 / 355
Beispiel Redakteure: Boxplot Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 123 / 355
Beispiel: Boxplot für Gruppen Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 124 / 355
Boxplot: Vor- und Nachteile pro: kompakt geeignet für Vergleiche Ausreißer sichtbar Schiefe sichtbar contra gegen Intuition (Viel Farbe wenig Daten) Bimodale Verteilungen nicht sichtbar Ausreißer sichtbar Breite redundant Deskriptive Statistik WiSe 2015/2016 Helmut Küchenhoff (Institut für Statistik, LMU) 125 / 355