Gewichtung in der Umfragepraxis. Von Tobias Hentze

Ähnliche Dokumente
1. Gewichtung zum Ausgleich unterschiedlicher Auswahlwahrscheinlichkeiten

Gewichtung und Validierung der Nettostichprobe (Welle 1 des Projekts Lebensziele und Lebensverläufe in Ostdeutschland )

Gewichtungsverfahren und Kriterien der Gewichtung

Warum Stichproben? Vollerhebungen sind teuer Nehmen (zu)viel Zeit in Anspruch Sind evtl. destruktiv

Methode im Detail. TNS Infratest Digitalisierungsbericht

Imputation (Ersetzen fehlender Werte)

Eine kurze Einleitung in das Sozio-Oekonomische Panel (SOEP) Teil 4 Gewichtung im SOEP

Gewichtung und Fehlerquellen

So berechnen Sie einen Schätzer für einen Punkt

Experimentelle und quasiexperimentelle

3.2 Stichprobenauswahl (Sampling)

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft.

CATI-Übung 5. Sitzung Abschlussveranstaltung SS 09

7 Berechnung der Survey-Gewichte

2. Beschreibende ( deskriptive ) Statistik 2.1 Grundbegriffe 2.2 Stichproben 2.3 Fehler, Ausreißer und fehlende Werte 2.4 Merkmale 2.

YouGov Wahlumfrage

Grundlagen der Statistik

Willkommen zur Vorlesung Statistik (Master)

Auswahlverfahren. Verfahren, welche die prinzipiellen Regeln zur Konstruktion von Stichproben angeben

Sozio-oekonomisches Panel (SOEP) II

Statistik II: Signifikanztests /2

Wunsch und Wirklichkeit: Lebensentwürfe und ihre Umsetzung

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

Kapitel 3 Schließende Statistik

NONRESPONSE in der Umfragepraxis

1. Einführung in die induktive Statistik

5. Stichproben und Statistiken

Willkommen zur Vorlesung Statistik (Master)

Wahrscheinlichkeitsverteilungen

Forschungsstatistik I

YouGov Wahlumfrage

Ab wann sind Effekte messbar? Zum Problem der kleinen Fallzahlen

Mehrdimensionale Zufallsvariablen

Softwaretechnik. Prof. Dr. Rainer Koschke. Fachbereich Mathematik und Informatik Arbeitsgruppe Softwaretechnik Universität Bremen

BKK Umfrage 2013 Thema: Betriebliche Gesundheitsförderung Erhebungszeitraum: Oktober 2013

Wahrscheinlichkeitsrechnung und Statistik

TEIL 5: AUSWAHLVERFAHREN

Forschungsstatistik I

Statistik II: Signifikanztests /1

Wozu brauche ich Statistik? Markus Lehmann, DAAD ida Seminar

Beschreibende Statistik Deskriptive Statistik. Schließende Statistik Inferenzstatistik. Schluss von der Stichprobe auf die Grundgesamtheit

Datenstrukturen. Querschnitt. Grösche: Empirische Wirtschaftsforschung

Fundierte Stichproben der IHA-GfK auf Grundlage der Schweizer Volkszählung 2000 und einer jährlichen Fortschreibung in der GfK

CATI-Omnibus-Befragung

Verteilung von Summen

Forschungsmethoden VORLESUNG SS 2018

Rangkorrelationskoeffizient nach Spearman

Wahrscheinlichkeitsrechnung und Statistik

Biomathematik für Mediziner, Klausur WS 2000/2001 Seite 1

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Population und Stichprobe Wahrscheinlichkeitstheorie II

Kapitel 10. Stichproben

Dr. H. Grunert Schließende Statistik Vorlesungscharts. Vorlesung 7. Schätzverfahren

von x-würfeln bei wachsendem n? Zur Beantwortung führen wir ein Simulationsexperiment durch.

FGW-Umfrage zur Glaubwürdigkeit verschiedener Medien und von Nachrichtensendungen verschiedener Fernsehsender

Modelle diskreter Zufallsvariablen

1. Eigenschaften einer Zufallsstichprobe

Vorlesung Stichproben WS 2009/2010

Das European Social Survey

Gesundheitsmonitor Feld- und Methodenbericht - Welle 22 - Bevölkerungsbefragung. GfK Health Care Im Auftrag der Bertelsmann Stiftung

Untersuchungsarten im quantitativen Paradigma

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

kein Schulabschluss, 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre Hauptschulabschluss

Schließende Statistik

Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Thema: Wahrscheinlichkeit. Übungsklausur Wahrscheinlichkeit und Regression

Ringvorlesung Einführung in die Methoden der empirischen Sozialforschung II

Wahrscheinlichkeit 1-α: richtige Entscheidung - wahrer Sachverhalt stimmt mit Testergebnis überein. Wahrscheinlichkeit α: falsche Entscheidung -

Studienergebnisse zur Presseerklärung Gerechter Arbeitmarkt. November 2011

Über Nutzungswahrscheinlichkeiten und fusionierte Datensätze. Werbeträgerkontaktchancen als intermedial vergleichende Medienwährung in Deutschland

Stichproben: Theorie und Verfahren

Silvesterfeuerwerke in der Region München

Statistik für Betriebswirte I 1. Klausur Wintersemester 2014/

Der χ 2 -Test (Chiquadrat-Test)

YouGov Wahlumfrage

Grundlagen der empirischen Sozialforschung

Beschreibung der Studienbevölkerung

Stichproben Parameterschätzung Konfidenzintervalle:

Statistische Matching-Verfahren

1.2 Stichprobenarten. 20 Elementare Definitionen

kein Abschluss, Hauptschulabschluss 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre

kein Abschluss, Hauptschulabschluss 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre

kein Abschluss, Hauptschulabschluss 45 bis 64 Jahre 65 Jahre und älter 25 bis 44 Jahre

Wahlumfrage

Forschungsmethoden VORLESUNG WS 2017/2018

Stichprobenverteilung bei unterschiedlichen Auswahlsätzen

Auswahlverfahren. Zufallsauswahl Bewusste Auswahl Willkürliche Auswahl. Dipl.-Päd. Ivonne Bemerburg

YouGov Wahlumfrage

Wahlumfrage

Kommunikation und zwischenmenschliche Beziehungen

25 bis 44 Jahre. 45 bis 64 Jahre. 65 Jahre und älter

Klassifikation von Signifikanztests

Bonusprogramme in Deutschland Eine Studie der TNS Emnid Medien- und Sozialforschung GmbH im Auftrag der PAYBACK GmbH. Bielefeld, Dezember 2014

Bekanntheit / Sympathie Münchner Rathaus-Politiker

Was sind Zusammenhangsmaße?

Grundlegende Eigenschaften von Punktschätzern

Digitale Entwicklung in Rheinland-Pfalz und im Saarland Digitalisierungsbericht 2016

Überblick PUMA-Umfragen

Teil VIII. Zentraler Grenzwertsatz und Vertrauensintervalle. Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle. Lernziele. Typische Situation

Transkript:

Gewichtung in der Umfragepraxis Von Tobias Hentze

Gliederung 1. Einführung 2. Gewichtungsarten 1. Designgewichtung 2. Non-Response-Gewichtung 3. Zellgewichtung 3. Fazit

Gewichtung Definition: Ein Gewicht ist ein multiplikativer Faktor (kleiner, größer oder gleich 1), der die relative Wichtigkeit der Respondents verändert Ziel: Das Stichprobenprofil einer Variablen soll der Grundgesamtheit nach einer Gewichtung ähnlicher sein als ungewichtet: besserer Schätzer, kleinere Varianz (?) Gründe: ungleiche Auswahlwahrscheinlichkeiten, unterschiedliche Response-Raten, keine Proportion zur Grundgesamtheit

Formen der Gewichtung 1. Designgewichtung 2. Non-Response-Gewichtung 3. Zellgewichtung

1. Designgewichtung Stichprobe wird bewusst disproportional zur Grundgesamtheit gewählt, um bestimmte Merkmale für eine Gruppe genauer zu untersuchen Bei gleichen Auswahlwahrscheinlichkeiten würden von einer Gruppe (z.b. Immigranten) ggf. zu wenige ausgewählt werden, um aussagekräftige Resultate zu bekommen Kein Problem solange jede Gruppe für sich betrachtet wird

1. Designgewichtung Sollen für verschiedene Gruppen Rückschlüsse auf die Grundgesamtheit gezogen werden, entstehen Probleme Wahrscheinlichkeit, ausgewählt zu werden, sollte für alle relativ gesehen gleich und proportional zur Zielgruppe sein, sonst Verzerrungen Um Rückschlüsse auf die Grundgesamtheit zu ziehen, erfolgt eine Designgewichtung, die sich aus den Auswahlwahrscheinlichkeiten berechnet (Immigrant oder nicht)

1. Designgewichtung Beispiel: Es interessiert, wie viele Personen ab 30 Jahren mit und ohne Uni-Abschluss verheiratet sind Wurden im Verhältnis zur Grundgesamtheit in der Stichprobe bewusst relativ gesehen zu viele Uni- Absolventen befragt, muss eine Gewichtung erfolgen, um Aussagen über die Gesamtheit treffen zu können Ist die Verteilung in der Bevölkerung 50:50, in der Stichprobe aber 40:60, lauten die Gewichte 5/4 und 5/6

1. Designgewichtung Weiteres Beispiel: Haushalte vs. Personen: Für jeden Haushalt kann die Auswahlwahrscheinlichkeit bei einer Stichprobe gleich sein, für die darin lebenden Personen ist sie es dann aber nicht (bei unterschiedlichen Haushaltsgrößen)

2. Nonresponse-Gewichtung Unterschiedliche Gruppen von Befragten (z.b. nach Altersklassen) weisen unterschiedliche Response- Raten auf: Unit Nonresponse als faktisches Problem Antworten der Gruppe mit niedriger Response-Rate müssen höher gewichtet werden, um Verzerrungen zu vermeiden (eine Gruppe ist überrepräsentiert) Merkmal (z.b. Alter) muss für alle Befragten bekannt sein (auch für die, die nicht antworten, sonst Gewichtung nicht möglich): Gewichtung zusätzlich zur Designgewichtung

2. Nonresponse-Gewichtung Beispiel: Proportional zur Grundgesamtheit werden in einer Stichprobe zwei Altersklassen nach ihrem Einkommen befragt Bei unterschiedlichen Response-Raten wird das Durchschnittseinkommen ungewichtet in Richtung der Altersklasse mit der höheren Response-Rate verzerrt Berechnung der Gewichtung: Umkehrung der Response-Rate, z.b. 1/80%=1,25 (Annahme: Nonrespondents ist zufällig, also unsystematisch)

3. Zellgewichtung Gewichte für Gruppen, die nicht Gegenstand der Auswahlwahrscheinlichkeit waren, werden getrennt berechnet (z.b. Frauen und Männer) Wenn die Verteilung der Gruppen in der Grundgesamtheit von der in der Stichprobe abweicht, wird bei Zusammenführung der beiden Gruppen Zellgewichtung notwendig (Redressment) Ex-post stimmt die Verteilung des Kriteriums (z.b. Geschlecht oder Konfession) aktuell in der Stichprobe nicht mit der in der Grundgesamtheit überein, daher Anpassung der Stichprobe an externe Vorgaben Möglich anhand von Regressionsanalysen

3. Zellgewichtung Beispiel: Wurden gleich viele Frauen und Männer befragt, gibt es in der Grundgesamtheit allerdings mehr Frauen, müssen die Gewichte für die Respondents der Frauen nachträglich erhöht werden (nachträglich zu Design- und Nonresponse- Gewichtung) Berechnung: Anteil in der Grundgesamtheit/Anteil in der Stichprobe, z.b. 0,6/0,4=1,5 für Gewichtung der Katholiken, wenn in der Stichprobe 40% Katholiken vertreten waren, in der Grundgesamtheit jedoch 60%

Fazit Aus den vier einzelnen Gewichtungsarten wird eine finale Gewichtung berechnet, die dann für die gesamte Stichprobe verwendet wird Verzerrungen sollen dadurch vermieden werden und die Qualität der Stichprobe als Schätzer für die Grundgesamtheit soll verbessert werden Keine Garantie, dass Gewichtung für bessere Schätzer und geringere Varianz (?) sorgt, aber sehr wahrscheinlich