Zensus Projekt zur methodischen Grundlagenforschung

Ähnliche Dokumente
Design der Haushaltsstichprobe für den Zensus 2011

Small Area Estimation auf Grundlage der Zensusergebnisse!?!

Praxisbeispiel. Ein komplexes Stichprobendesign

Kapitel 3 Schließende Statistik

Informationen für Auftraggeber und Nutzer der Studie Small Area-Schätzung bundesweiter Regionaldaten

Der Registergestützte Zensus 2011 in Deutschland. Zensus 2011

Der Registergestützte Zensus 2011 in Deutschland Statistisches Bundesamt, Abteilung VI

Small Area-Schätzung

Bachelorseminar: Ausgwählte Aspekte der Wirtschaft- und Sozialstatistik Sommersemester 2015 Referat: Stichprobenplan des Zensus

ML-Schätzung. Likelihood Quotienten-Test. Zusammenhang Reparametrisierung und Modell unter linearer Restriktion. Es gilt: β = Bγ + d (3.

Stochastik Praktikum Parametrische Schätztheorie

Anlage 6: Haushaltebefragung beim Zensus Erläuterungen zum Stichprobenverfahren

Der Zensus Methoden und Potenziale des Zensus 2011 Was wird beim Zensus 2011 hochgerechnet? Statistik-Tage Bamberg-Fürth

Haushaltebefragung beim Zensus 2011

Man kann also nicht erwarten, dass man immer den richtigen Wert trifft.

Inhaltsverzeichnis. Unsicherheiten der demographischen Entwicklung in Trier. Differenzierung: Szenarien / Prognosen / Projektionen / Mikrosimulationen

Zusammenfassung 11. Sara dos Reis.

Fakultät Verkehrswissenschaften Friedrich List Professur für Ökonometrie und Statistik, insb. im Verkehrswesen. Statistik II. Prof. Dr.

Übungsaufgaben zu Statistik II

Mehrdimensionale Zufallsvariablen

Workshop Komplexe Stichprobendesigns Andreas Quatember

Alternative Small Area Schätzverfahren am Beispiel des Zensus 2011 in Deutschland Dissertation

W09 p. 1. Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung

Theorie-Teil: Aufgaben 1-3: 30 Punkte Programmier-Teil: Aufgaben 4-9: 60 Punkte

Stichproben: Theorie und Verfahren

Statistik I für Betriebswirte Vorlesung 13

Stochastik Praktikum Lineare Modelle

Stichprobe versus Abschneideverfahren

Mikrozensus Datenproduktion und Datenanalyse in der amtlichen Statistik

MEHREBENENANALYSE: ANGEMESSENE MODELLIERUNG VON EVALUATIONSDATEN

Kurs Empirische Wirtschaftsforschung

Grundbegriffe der Wahrscheinlichkeitsrechnung

Multivariate Verfahren

Einführung in die Induktive Statistik: Schätzen von Parametern und Verteilungen

Vorbereitung auf 3. Übungsblatt (Präsenzübungen) - Lösungen

1 Beispiel zur Methode der kleinsten Quadrate

4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers

= 2 ( 3250,3 ( 3251,5)) = 1,1662 F(2,800) = 2,4 χ2

Analyse der durch den Zensus verursachten Abweichungen bei den Einwohnerzahlen

Statistisches Lernen

x t2 y t = 160, y = 8, y y = 3400 t=1

κ Κα π Κ α α Κ Α

Proxies, Endogenität, Instrumentvariablenschätzung

Kapitel 10. Stichproben

Statistik Klausur Sommersemester 2013 Hamburg, BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!

Das empirische VaR bzw. CVaR

Allgemeine lineare Modelle

Vorlesung: Lineare Modelle. Verschiedene Typen von Residuen. Probleme bei der Regression und Diagnose. Prof. Dr. Helmut Küchenhoff.

3.3 Methoden zur Evaluierung von Schätzern

I.V. Methoden 4: Regressionsund Pfadanalyse WiSe 02/03

Frequentisten und Bayesianer. Volker Tresp

Multivariate Verfahren

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Teekonsum in den USA (in 1000 Tonnen), Nimmt den Wert 1 an für alle Perioden, Durchschnittlicher Preis des Tees in Periode t (in Tausend $/Tonne).

Prof. Dr. Marc Gürtler WS 2015/2016. Prof. Dr. Marc Gürtler. Klausur zur 10/12 SWS-Vertiefung Empirische Finanzwirtschaft Finanzwirtschaft

Einführung in die Induktive Statistik: Regressionsanalyse

Vorlesung: Statistik II für Wirtschaftswissenschaft

Wahrscheinlichkeitsrechnung und Statistik

1 Wahrscheinlichkeitsrechnung. 2 Zufallsvariablen und ihre Verteilung. 3 Statistische Inferenz. 4 Intervallschätzung. 5 Hypothesentests.





Ergänzende Verfahren für einen künftigen registergestützten Zensus

arxiv: v1 [stat.ap] 4 Sep 2014

Grundgesamtheit und Stichprobe

Statistik II. IV. Hypothesentests. Martin Huber

Nonresponse in Bevölkerungsumfragen Österreich-Ergebnisse einer Simulationsstudie im Rahmen des EU-Projekts DACSEIS

Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/

Stichprobenverfahren. Sommersemester Einführung 1

Drittvariablenkontrolle in der linearen Regression: Trivariate Regression

Grundgesamtheit und Stichprobe

LS-Schätzer. SSE(β) = (y µ) t (y µ) = y t y 2β t X t y + β t X t Xβ. Minimiere SSE(β) bzgl. β: Minimum definiert durch

Mikrodaten-Tools. Zur Berechnung des Stichprobenfehlers im Mikrozensus. Bernhard Schimpl-Neimanns Jörg Müller. Juni 2001

Kapitel 8. Einfache Regression. Anpassen des linearen Regressionsmodells, OLS. Eigenschaften der Schätzer für das Modell

Information und Technik Nordrhein-Westfalen

Auswahlverfahren. Schnell, R. Hill, P. B. Esser, E. 1999, Methoden der empirischen Sozialforschung. München: Oldenbourg. Seiten ;

> library(nlme) > fit <- lme(y ~ 1, random = ~1 id, data = sim.y.long) > summary(fit)

9 Robuste Methoden. 9.1 Einfluss und Robustheit. i (x i x) 2 = i x iy i. c 1 = x 2 + i (x i x) 2. Einfache Regression: 9.1 Einfluss und Robustheit 205

Vortrag am Institut für Statistik an der Ludwig-Maximilian-Universität München. München,

Selbstständigkeit von Migranten in Deutschland: Die Effekte sozialer Einbettung

5. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

Bootstrap: Punktschätzung

Dr. Guido Knapp Fakultät Statistik Technische Universität Dortmund 6. Februar Klausur zur Veranstaltung Erhebungstechniken

Statistik I für Betriebswirte Vorlesung 13

Stichproben und statistische Fehler

Einführung in die Maximum Likelihood Methodik

Stochastische Trends und Unit root-tests

2.5 Lineare Regressionsmodelle

Inhalt. I Einführung. Kapitel 1 Konzept des Buches Kapitel 2 Messen in der Psychologie... 27

Hochschule RheinMain WS 2018/19 Prof. Dr. D. Lehmann. 8. Übungsblatt zur Vorlesung Ökonometrie

Übung V Lineares Regressionsmodell

Statistische Eigenschaften der OLS-Schätzer, Residuen,

Aktueller Stand des Zensus- Konzepts und Versorgung der Kommunen mit Zensusdaten

Statistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de

Transkript:

Zensus 2011 - Projekt zur methodischen Grundlagenforschung Ralf Münnich, Siegfried Gabler, Matthias Ganninger, Nicole Thees Universität Trier, Fachbereich IV, VWL Wirtschafts- und Sozialstatistik und GESIS-ZUMA, Mannheim Kiel, 26. September 2007 Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 1 (21)

Der deutsche Zensus Letzter Zensus 1987 (1981 in der früheren DDR) 11. November 2005: Koalitionsvertrag 29. August 2006: Grundsatzentscheidung des Bundeskabinetts über den registergestützten Zensus 28. März 2007: Zustimmung zum Entwurf des Zensusvorbereitungsgesetztes 11. Mai 2007: Stellungnahme des Bundesrates in seiner 833. Sitzung 20. September 2007: Zensusvorbereitungsgesetz Zensusanordnungsgesetz - bis Ende 2008 Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 2 (21)

Der registergestützte Zensus 2011 Koalitionspapier Belastungsreduktion durch moderne Verfahren Kostenreduktion Grunddatenermittlung in erforderlicher Qualität Registergestützter Zensus (Einwohnermeldeamtsregister) mit einer zusätzlichen Stichprobe (ca. 7 9%) Informationsgewinn über Registerfehler Informationsgewinn über zusätzliche interessierende Variablen Planungs- und Entscheidungsgrundlage für Verwaltung Datengrundlage für etwa 50 Gesetze Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 3 (21)

Ergebnisse des Zensustests 2001 Karteileichen: 1,8 % Fehlbestände: 1,7 % Große Differenzen zwischen den Gemeinden Karteileichen: 0,7% in Gemeinden bis 10 000 Einwohner 1,4% in Gemeinden mit 10 000-50 000 Einwohner 1,5% in Gemeinden mit 50 000-100 000 Einwohner 3,4% in Gemeinden mit 100 000 und mehr Einwohner Fehlbestände: 1,3% in Gemeinden bis 10 000 Einwohner 1,3% in Gemeinden mit 10 000-50 000 Einwohner 2,1% in Gemeinden mit 50 000-100 000 Einwohner 2,4% in Gemeinden mit 100 000 und mehr Einwohner Weitere Abhängigkeiten: z.b. Adressgröße Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 4 (21)

Entwicklung von Auswahlverfahren und Schätzmethoden für den registergestützen Zensus 2011 Ziel 1: Korrektur von Registerdaten Schätzung von Karteileichen und Fehlbestände Schätzung der Bevölkerungszahl Ziel 2: Schätzung von zusätzlichen Personenmerkmalen (z.b. Erwerbstätigkeit/Arbeitslosigkeit, höchster Bildungsabschluss...) Analyse der Wirkung des Stichprobendesigns auf die Schätzungen Entwicklung adäquater Fehlerrechnungen Entwicklung geeigneter Beurteilungskriterien Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 5 (21)

Entwicklung von Auswahlverfahren und Schätzmethoden für den registergestützen Zensus 2011 Ziel 1: Korrektur von Registerdaten Schätzung von Karteileichen und Fehlbestände Schätzung der Bevölkerungszahl Ziel 2: Schätzung von zusätzlichen Personenmerkmalen (z.b. Erwerbstätigkeit/Arbeitslosigkeit, höchster Bildungsabschluss...) Analyse der Wirkung des Stichprobendesigns auf die Schätzungen Entwicklung adäquater Fehlerrechnungen Entwicklung geeigneter Beurteilungskriterien Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 5 (21)

Fehlbestands- und Karteileichenmodelle (M01 M04) Modell 1 NAT 1+ AGK 6+ ADK 2 Modell ohne Wechselwirkungen Modell 2 SEX 1 + NAT 1 + ADK 2 + AGK 6 + SEX*AGK 6 + NAT*ADK 2 + NAT*AGK 6 + AGK*ADK 12 Reduziertes Modell mit Wechselwirkungen Modell 3 SEX 1 + NAT 1+ AGK 6 + ADK 2 Modell ohne Wechselwirkungen Modell 4 SEX 1 + NAT 1 + ADK 2 + AGK 6 + SEX*AGK 6 + SEX*NAT 1 + SEX*ADK 2 + NAT*ADK 2 + NAT*AGK 6 + AGK*ADK 12 Modell mit Wechselwirkungen Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 6 (21)

Fehlbestands- und Karteileichenmodelle (M05 M08) Zusätzliche Abhängigkeit von der Gemeindegröße Verschieben von Fehlbeständen und Karteileichen von kleinen Adressen in große Adressen Besondere Betrachtung von: M02.D, M03C.D, M06.SAL, M07C.SAL Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 7 (21)

Karteileichen und Fehlbestände nach Gemeinden und Modell 5 10 15 20 5 10 15 20 Karteileichen Model M02.D Karteileichen Model M03C.D Karteileichen Model M06.SAL Karteileichen Model M07C.SAL 52 Gemeinden des Saarlands Fehlbestände Model M02.D Fehlbestände Model M03C.D Fehlbestände Model M06.SAL Fehlbestände Model M07C.SAL 5 10 15 20 Prozent 5 10 15 20 Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 8 (21)

Klumpeneffekt 1.00 1.05 1.10 1.15 1.20 1.25 1.00 1.05 1.10 1.15 1.20 1.25 Karteileichen Model M02C.D Karteileichen Model M03C.D Karteileichen Model M06C.SAL Karteileichen Model M07C.SAL 52 Gemeinden des Saarlands Fehlbestände Model M02C.D Fehlbestände Model M03C.D Fehlbestände Model M06C.SAL Fehlbestände Model M07C.SAL 1.00 1.05 1.10 1.15 1.20 1.25 1.00 1.05 1.10 1.15 1.20 1.25 Klumpenvarianzen der C Modelle durch Klumpenvarianzen der entsprechenden Basismodelle Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 9 (21)

Auswahlverfahren Grundmodell Adressen sind die Auswahleinheiten. Auswahl von 550 Adressen in großen Gemeinden (mindestens 10.000 Einwohner) Anteil der Einwohner einer kleinen Gemeinde am Kreis mal 550 (unter 10.000 Einwohner) Uneingeschränkte Zufallsauswahl von Adressen in Gemeinden StrRS Geschichtete Zufallsauswahl (ADRgröße: 1.. 6, 7-9, 10, 11+) proportionale Aufteilung je Gemeinde StrRS, opt Geschichtete Zufallsauswahl mit optimaler Aufteilung bzgl. Karteileichen nach Modell M06-SAL NAT mit ADRgröße als Schichten Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 10 (21)

Monte-Carlo Simulations-Gesamtheit Synthetische Gesamtheit im Saarland und Rheinland-Pfalz (Mikrozensus 1996; DACSEIS) Zusätzliche Merkmale: Kreise und Gemeinden in den Bundesländern Adressen sind Auswahleinheiten Modellierung von Karteileichen und Fehlbeständen Zusammensetzung der Gesamtheit (M06.SAL): Nr. Y Z Y R KAL FEB 1 1 1 0 0 registriert 2 0 1 1 0 registriert, nicht existent 3 1 0 0 1 nicht registriert, existent. N. 115.309 67.083 N = 1.057.915 (Saarland) Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 11 (21)

Bisher betrachtete Schätzer Design-basierte Schätzer Horvitz-Thompson Schätzer τ = k S d k y k Designgewichte d k Schätzer separat kombiniert Small Area mit τ Yd = τ Yd + (τ Xd τ Xd ) β, ( ) 1 β = d i x i xi T d i x i y i. i s i s Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 12 (21)

Small-area Schätzer Synthetischer Schätzer, Modell A ˆȲ d,syntha = X d ˆβ y i,d = x i,d β + u d + e i,d Synthetischer Schätzer, Modell B ˆȲ d,synthb = X d ˆβ u d iid N(0; σ 2 u), e i,d iid N(0; σ 2 e) ȳ d = x d β + ξ d ; ξ d iid N(0; σu 2 + σ2 e ) n d mit ˆσ e 2 1 = (y i,d ȳ d ) 2 n n d S i d Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 13 (21)

Empirische beste lineare unverzerrte Prädiktoren µ EBLUPA Yd = γ d µ Yd +(1 γ d ) µ SYNA Yd = γ d ( µ Yd µ T β)+µ Xd T β, Xd σ mit γ d = u 2 σ u 2 + σ ε/n 2. d µ EBLUPB Yd = γ d µ Yd + (1 γ d ) µ SYNB Yd mit γ d = σ 2 u/( σ 2 u + ψ d ) Vgl. EURAREA oder DACSEIS Berichte = γ d µ Yd + (1 γ d )µ T Xd β, Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 14 (21)

Interessierende Schätzungen TotPop02 Gesamtbevölkerung Hilfsmerkmale: Registrierte Einwohner, Adressgröße TotKAL02 Gesamtzahl der Karteileichen Hilfsmerkmale: Registrierte Einwohner, Adressgröße TotFEB02 Gesamtzahl der Fehlbestände Hilfsmerkmale: Registrierte Einwohner, Adressgröße TotHEDU01 Gesamtzahl der Einwohner mit höchster Bildung (Universitätsabschluss) Hilfsmerkmale: AGE x SEX, ADR Größenklasse (NAT) Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 15 (21)

Relativer RMSE der Gesamteinwohnerzahl Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 16 (21)

Relativer Bias der Gesamteinwohnerzahl 0.02 0.00 0.02 0.02 0.00 0.02 0.02 0.00 0.02 0.02 0.00 0.02 Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 17 (21)

Relativer RMSE der Anzahl der Fehlbestände Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 18 (21)

Relativer RMSE der Anzahl der Karteileichen Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 19 (21)

Relativer RMSE der Anzahl mit höchstem Bildungsabschluss Große Gemeinden Kleine Gemeinden Hauptstadt Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 20 (21)

Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)

Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)

Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)

Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)

Größere Areas: Schätzer Kleinere Areas: unit-level Modellierung aber, umfangreiche Kenntnis von Modellierung wird benötigt Welche Maße sind zu betrachten? MSE basierte Maße Trade-off zwischen Verzerrung und Varianz Asymmetrische Maße Disparität von Area Schätzungen Kohärente Maße Design- versus Modell-basierte Welt Notwendigkeit zur Quantifizierung der politischen Bedürfnisse Kiel, 26. September 2007 Siegfried Gabler Zensus 2011 - Stichprobenprojekt 21 (21)