Zensus 2011 - Projekt zur methodischen Grundlagenforschung Ralf Münnich, Siegfried Gabler, Matthias Ganninger, Nicole Thees Universität Trier, Fachbereich IV, VWL Wirtschafts- und Sozialstatistik und GESIS-ZUMA, Mannheim Kiel, 26. September 2007 Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 1 (21)
Der deutsche Zensus Letzter Zensus 1987 (1981 in der früheren DDR) 11. November 2005: Koalitionsvertrag 29. August 2006: Grundsatzentscheidung des Bundeskabinetts über den registergestützten Zensus 28. März 2007: Zustimmung zum Entwurf des Zensusvorbereitungsgesetztes 11. Mai 2007: Stellungnahme des Bundesrates in seiner 833. Sitzung 20. September 2007: Zensusvorbereitungsgesetz Zensusanordnungsgesetz - bis Ende 2008 Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 2 (21)
Der registergestützte Zensus 2011 Koalitionspapier Belastungsreduktion durch moderne Verfahren Kostenreduktion Grunddatenermittlung in erforderlicher Qualität Registergestützter Zensus (Einwohnermeldeamtsregister) mit einer zusätzlichen Stichprobe (ca. 7 9%) Informationsgewinn über Registerfehler Informationsgewinn über zusätzliche interessierende Variablen Planungs- und Entscheidungsgrundlage für Verwaltung Datengrundlage für etwa 50 Gesetze Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 3 (21)
Ergebnisse des Zensustests 2001 Karteileichen: 1,8 % Fehlbestände: 1,7 % Große Differenzen zwischen den Gemeinden Karteileichen: 0,7% in Gemeinden bis 10 000 Einwohner 1,4% in Gemeinden mit 10 000-50 000 Einwohner 1,5% in Gemeinden mit 50 000-100 000 Einwohner 3,4% in Gemeinden mit 100 000 und mehr Einwohner Fehlbestände: 1,3% in Gemeinden bis 10 000 Einwohner 1,3% in Gemeinden mit 10 000-50 000 Einwohner 2,1% in Gemeinden mit 50 000-100 000 Einwohner 2,4% in Gemeinden mit 100 000 und mehr Einwohner Weitere Abhängigkeiten: z.b. Adressgröße Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 4 (21)
Entwicklung von Auswahlverfahren und Schätzmethoden für den registergestützen Zensus 2011 Ziel 1: Korrektur von Registerdaten Schätzung von Karteileichen und Fehlbestände Schätzung der Bevölkerungszahl Ziel 2: Schätzung von zusätzlichen Personenmerkmalen (z.b. Erwerbstätigkeit/Arbeitslosigkeit, höchster Bildungsabschluss...) Analyse der Wirkung des Stichprobendesigns auf die Schätzungen Entwicklung adäquater Fehlerrechnungen Entwicklung geeigneter Beurteilungskriterien Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 5 (21)
Entwicklung von Auswahlverfahren und Schätzmethoden für den registergestützen Zensus 2011 Ziel 1: Korrektur von Registerdaten Schätzung von Karteileichen und Fehlbestände Schätzung der Bevölkerungszahl Ziel 2: Schätzung von zusätzlichen Personenmerkmalen (z.b. Erwerbstätigkeit/Arbeitslosigkeit, höchster Bildungsabschluss...) Analyse der Wirkung des Stichprobendesigns auf die Schätzungen Entwicklung adäquater Fehlerrechnungen Entwicklung geeigneter Beurteilungskriterien Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 5 (21)
Fehlbestands- und Karteileichenmodelle (M01 M04) Modell 1 NAT 1+ AGK 6+ ADK 2 Modell ohne Wechselwirkungen Modell 2 SEX 1 + NAT 1 + ADK 2 + AGK 6 + SEX*AGK 6 + NAT*ADK 2 + NAT*AGK 6 + AGK*ADK 12 Reduziertes Modell mit Wechselwirkungen Modell 3 SEX 1 + NAT 1+ AGK 6 + ADK 2 Modell ohne Wechselwirkungen Modell 4 SEX 1 + NAT 1 + ADK 2 + AGK 6 + SEX*AGK 6 + SEX*NAT 1 + SEX*ADK 2 + NAT*ADK 2 + NAT*AGK 6 + AGK*ADK 12 Modell mit Wechselwirkungen Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 6 (21)
Fehlbestands- und Karteileichenmodelle (M05 M08) Zusätzliche Abhängigkeit von der Gemeindegröße Verschieben von Fehlbeständen und Karteileichen von kleinen Adressen in große Adressen Besondere Betrachtung von: M02.D, M03C.D, M06.SAL, M07C.SAL Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 7 (21)
Karteileichen und Fehlbestände nach Gemeinden und Modell 5 10 15 20 5 10 15 20 Karteileichen Model M02.D Karteileichen Model M03C.D Karteileichen Model M06.SAL Karteileichen Model M07C.SAL 52 Gemeinden des Saarlands Fehlbestände Model M02.D Fehlbestände Model M03C.D Fehlbestände Model M06.SAL Fehlbestände Model M07C.SAL 5 10 15 20 Prozent 5 10 15 20 Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 8 (21)
Klumpeneffekt 1.00 1.05 1.10 1.15 1.20 1.25 1.00 1.05 1.10 1.15 1.20 1.25 Karteileichen Model M02C.D Karteileichen Model M03C.D Karteileichen Model M06C.SAL Karteileichen Model M07C.SAL 52 Gemeinden des Saarlands Fehlbestände Model M02C.D Fehlbestände Model M03C.D Fehlbestände Model M06C.SAL Fehlbestände Model M07C.SAL 1.00 1.05 1.10 1.15 1.20 1.25 1.00 1.05 1.10 1.15 1.20 1.25 Klumpenvarianzen der C Modelle durch Klumpenvarianzen der entsprechenden Basismodelle Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 9 (21)
Auswahlverfahren Grundmodell Adressen sind die Auswahleinheiten. Auswahl von 550 Adressen in großen Gemeinden (mindestens 10.000 Einwohner) Anteil der Einwohner einer kleinen Gemeinde am Kreis mal 550 (unter 10.000 Einwohner) Uneingeschränkte Zufallsauswahl von Adressen in Gemeinden StrRS Geschichtete Zufallsauswahl (ADRgröße: 1.. 6, 7-9, 10, 11+) proportionale Aufteilung je Gemeinde StrRS, opt Geschichtete Zufallsauswahl mit optimaler Aufteilung bzgl. Karteileichen nach Modell M06-SAL NAT mit ADRgröße als Schichten Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 10 (21)
Monte-Carlo Simulations-Gesamtheit Synthetische Gesamtheit im Saarland und Rheinland-Pfalz (Mikrozensus 1996; DACSEIS) Zusätzliche Merkmale: Kreise und Gemeinden in den Bundesländern Adressen sind Auswahleinheiten Modellierung von Karteileichen und Fehlbeständen Zusammensetzung der Gesamtheit (M06.SAL): Nr. Y Z Y R KAL FEB 1 1 1 0 0 registriert 2 0 1 1 0 registriert, nicht existent 3 1 0 0 1 nicht registriert, existent. N. 115.309 67.083 N = 1.057.915 (Saarland) Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 11 (21)
Bisher betrachtete Schätzer Design-basierte Schätzer Horvitz-Thompson Schätzer τ = k S d k y k Designgewichte d k Schätzer separat kombiniert Small Area mit τ Yd = τ Yd + (τ Xd τ Xd ) β, ( ) 1 β = d i x i xi T d i x i y i. i s i s Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 12 (21)
Small-area Schätzer Synthetischer Schätzer, Modell A ˆȲ d,syntha = X d ˆβ y i,d = x i,d β + u d + e i,d Synthetischer Schätzer, Modell B ˆȲ d,synthb = X d ˆβ u d iid N(0; σ 2 u), e i,d iid N(0; σ 2 e) ȳ d = x d β + ξ d ; ξ d iid N(0; σu 2 + σ2 e ) n d mit ˆσ e 2 1 = (y i,d ȳ d ) 2 n n d S i d Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 13 (21)
Empirische beste lineare unverzerrte Prädiktoren µ EBLUPA Yd = γ d µ Yd +(1 γ d ) µ SYNA Yd = γ d ( µ Yd µ T β)+µ Xd T β, Xd σ mit γ d = u 2 σ u 2 + σ ε/n 2. d µ EBLUPB Yd = γ d µ Yd + (1 γ d ) µ SYNB Yd mit γ d = σ 2 u/( σ 2 u + ψ d ) Vgl. EURAREA oder DACSEIS Berichte = γ d µ Yd + (1 γ d )µ T Xd β, Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 14 (21)
Interessierende Schätzungen TotPop02 Gesamtbevölkerung Hilfsmerkmale: Registrierte Einwohner, Adressgröße TotKAL02 Gesamtzahl der Karteileichen Hilfsmerkmale: Registrierte Einwohner, Adressgröße TotFEB02 Gesamtzahl der Fehlbestände Hilfsmerkmale: Registrierte Einwohner, Adressgröße TotHEDU01 Gesamtzahl der Einwohner mit höchster Bildung (Universitätsabschluss) Hilfsmerkmale: AGE x SEX, ADR Größenklasse (NAT) Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 15 (21)
Relativer RMSE der Gesamteinwohnerzahl Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 16 (21)
Relativer Bias der Gesamteinwohnerzahl 0.02 0.00 0.02 0.02 0.00 0.02 0.02 0.00 0.02 0.02 0.00 0.02 Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 17 (21)
Relativer RMSE der Anzahl der Fehlbestände Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 18 (21)
Relativer RMSE der Anzahl der Karteileichen Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 19 (21)
Relativer RMSE der Anzahl mit höchstem Bildungsabschluss Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 20 (21)
Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)
Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)
Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)
Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)
Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)