2.1 Grundbegriffe 2.3 Fehler, Ausreißer und fehlende Werte 2.4 Merkmale 2.5 Definition: Urliste, relative und absolute Häufigkeit 2.6 Tabellarische und graphische Darstellung: Häufigkeit 2.7 Klasseneinteilung 2.8 Regeln für die Wahl von Klassen 2.9 Maßzahlen einer eindimensionalen Stichprobe (Lage und Streuung) 2.10 Lagemaße 2.11 Streuungsmaße 1
2.1 Grundbegriffe Grundgesamtheit: Alle Objekte, über die man eine Aussage gewinnen will, die man aber eventuell nicht vollständig erfassen kann. Stichprobe: Eine Teilmenge der Grundgesamtheit, die tatsächlich befragt wurden. Stichprobenumfang: Die Anzahl n der Objekte der Stichprobe heißt Stichprobenumfang 2
Schichtenstichprobe Klumpenstichprobe Quotenstichprobe Repräsentative Stichprobe 3
Schichtenstichprobe Die Elemente einer Stichprobe müssen der Klumpenstichprobe Grundgesamtheit zufällig entnommen werden. Quotenstichprobe Repräsentative Stichprobe 4
Um Schichtenstichprobe den Zufall zu garantieren, ist es zweckmäßig, die Elemente durchzunummerieren. Klumpenstichprobe Dies ermöglicht -Quotenstichprobe Schlussziffernverfahren : z.b. Matrikel abcde 3 -Repräsentative Periodische Auswahl Stichprobe : z.b. Vielfaches von 50 - Auswahl mit Zufallszahlen 5
Schichtenstichprobe Klumpenstichprobe Die Gesamtheit kann in unterschiedliche Schichten aufgeteilt Quotenstichprobe werden, z.b. Produktion (Früh-, Spät- & Nachtschicht), Betriebe Repräsentative (unter 100 Mitarbeiter, Stichprobe mit 101 bis 500 Mitarbeiter, usw.). Bei einer disproportionalen Schichtung kommt es zu Verzerrungen, die man später erklären oder eliminieren muss. 6
Schichtenstichprobe Klumpenstichprobe Alle Probenelemente werden aus einer ausgewählten Teilmasse (Klumpen) gezogen. Vorteil : geringer Aufwand Nachteil : systematische Fehler verzerren Ergebnis 7
Schichtenstichprobe Klumpenstichprobe Quotenstichprobe Die Stichprobe soll die Werte mit den gleichen Quoten bzw. Anteilen, wie in der Grundgesamtheit enthalten. z.b. Doping-Proben bei allen Mannschaften der 1.Bundesliga, also nicht nur bei Bayern, Wolfsburg und Hoffenheim. 8
Schichtenstichprobe Klumpenstichprobe Quotenstichprobe Die Stichprobe soll die Werte mit den gleichen Quoten bzw. Anteilen, wie in der Grundgesamtheit enthalten. z.b. Doping-Proben bei allen Mannschaften der 1.Bundesliga, nicht nur bei Bayern, Wolfsburg und Hoffenheim. => Repräsentative Stichprobe 9
2.3 Fehler, Ausreißer und fehlende Werte Grafik: q-das 10
2.3 Fehler, Ausreißer und fehlende Werte Behandlung von Datenausreißer Ausreißer Extremwert innerhalb einer Stichprobe, der nicht stimmen kann Ausreißer identifizieren Überprüfen und ggf. Korrigieren Datensatz streichen fehlerhafte Daten abändern ( z.b. Mittelwert einsetzen ) Datensatz beibehalten (Extremwert kommentieren) Unmögliche oder unplausible Werte Behandlung wie Ausreißer Fehler Behandlung wie Ausreißer, aber nie beibehalten! 11
2.3 Fehler, Ausreißer und fehlende Werte Grafik: q-das 12