Gewichtung in der Umfragepraxis Von Tobias Hentze
Gliederung 1. Einführung 2. Gewichtungsarten 1. Designgewichtung 2. Non-Response-Gewichtung 3. Zellgewichtung 3. Fazit
Gewichtung Definition: Ein Gewicht ist ein multiplikativer Faktor (kleiner, größer oder gleich 1), der die relative Wichtigkeit der Respondents verändert Ziel: Das Stichprobenprofil einer Variablen soll der Grundgesamtheit nach einer Gewichtung ähnlicher sein als ungewichtet: besserer Schätzer, kleinere Varianz (?) Gründe: ungleiche Auswahlwahrscheinlichkeiten, unterschiedliche Response-Raten, keine Proportion zur Grundgesamtheit
Formen der Gewichtung 1. Designgewichtung 2. Non-Response-Gewichtung 3. Zellgewichtung
1. Designgewichtung Stichprobe wird bewusst disproportional zur Grundgesamtheit gewählt, um bestimmte Merkmale für eine Gruppe genauer zu untersuchen Bei gleichen Auswahlwahrscheinlichkeiten würden von einer Gruppe (z.b. Immigranten) ggf. zu wenige ausgewählt werden, um aussagekräftige Resultate zu bekommen Kein Problem solange jede Gruppe für sich betrachtet wird
1. Designgewichtung Sollen für verschiedene Gruppen Rückschlüsse auf die Grundgesamtheit gezogen werden, entstehen Probleme Wahrscheinlichkeit, ausgewählt zu werden, sollte für alle relativ gesehen gleich und proportional zur Zielgruppe sein, sonst Verzerrungen Um Rückschlüsse auf die Grundgesamtheit zu ziehen, erfolgt eine Designgewichtung, die sich aus den Auswahlwahrscheinlichkeiten berechnet (Immigrant oder nicht)
1. Designgewichtung Beispiel: Es interessiert, wie viele Personen ab 30 Jahren mit und ohne Uni-Abschluss verheiratet sind Wurden im Verhältnis zur Grundgesamtheit in der Stichprobe bewusst relativ gesehen zu viele Uni- Absolventen befragt, muss eine Gewichtung erfolgen, um Aussagen über die Gesamtheit treffen zu können Ist die Verteilung in der Bevölkerung 50:50, in der Stichprobe aber 40:60, lauten die Gewichte 5/4 und 5/6
1. Designgewichtung Weiteres Beispiel: Haushalte vs. Personen: Für jeden Haushalt kann die Auswahlwahrscheinlichkeit bei einer Stichprobe gleich sein, für die darin lebenden Personen ist sie es dann aber nicht (bei unterschiedlichen Haushaltsgrößen)
2. Nonresponse-Gewichtung Unterschiedliche Gruppen von Befragten (z.b. nach Altersklassen) weisen unterschiedliche Response- Raten auf: Unit Nonresponse als faktisches Problem Antworten der Gruppe mit niedriger Response-Rate müssen höher gewichtet werden, um Verzerrungen zu vermeiden (eine Gruppe ist überrepräsentiert) Merkmal (z.b. Alter) muss für alle Befragten bekannt sein (auch für die, die nicht antworten, sonst Gewichtung nicht möglich): Gewichtung zusätzlich zur Designgewichtung
2. Nonresponse-Gewichtung Beispiel: Proportional zur Grundgesamtheit werden in einer Stichprobe zwei Altersklassen nach ihrem Einkommen befragt Bei unterschiedlichen Response-Raten wird das Durchschnittseinkommen ungewichtet in Richtung der Altersklasse mit der höheren Response-Rate verzerrt Berechnung der Gewichtung: Umkehrung der Response-Rate, z.b. 1/80%=1,25 (Annahme: Nonrespondents ist zufällig, also unsystematisch)
3. Zellgewichtung Gewichte für Gruppen, die nicht Gegenstand der Auswahlwahrscheinlichkeit waren, werden getrennt berechnet (z.b. Frauen und Männer) Wenn die Verteilung der Gruppen in der Grundgesamtheit von der in der Stichprobe abweicht, wird bei Zusammenführung der beiden Gruppen Zellgewichtung notwendig (Redressment) Ex-post stimmt die Verteilung des Kriteriums (z.b. Geschlecht oder Konfession) aktuell in der Stichprobe nicht mit der in der Grundgesamtheit überein, daher Anpassung der Stichprobe an externe Vorgaben Möglich anhand von Regressionsanalysen
3. Zellgewichtung Beispiel: Wurden gleich viele Frauen und Männer befragt, gibt es in der Grundgesamtheit allerdings mehr Frauen, müssen die Gewichte für die Respondents der Frauen nachträglich erhöht werden (nachträglich zu Design- und Nonresponse- Gewichtung) Berechnung: Anteil in der Grundgesamtheit/Anteil in der Stichprobe, z.b. 0,6/0,4=1,5 für Gewichtung der Katholiken, wenn in der Stichprobe 40% Katholiken vertreten waren, in der Grundgesamtheit jedoch 60%
Fazit Aus den vier einzelnen Gewichtungsarten wird eine finale Gewichtung berechnet, die dann für die gesamte Stichprobe verwendet wird Verzerrungen sollen dadurch vermieden werden und die Qualität der Stichprobe als Schätzer für die Grundgesamtheit soll verbessert werden Keine Garantie, dass Gewichtung für bessere Schätzer und geringere Varianz (?) sorgt, aber sehr wahrscheinlich