State of the art Datenaufbereitung bei der Strukturerhebung der Volkszählung

Ähnliche Dokumente
Jahrestagung SGVW Projekt PPP im Bereich Registerharmonisierung

Von der Registerharmonisierung. Volkszählung Patrick Kummer Projektleiter Registerharmonisierung 06. Mai 2010

Die neue eidgenössische Volkszählung

Erhebung zur Internetnutzung

Das schweizerische Volkszählungssystem

FAQ neue Volkszählung

Erhebung zum Zusammenleben in der Schweiz

Wenn s schnell gehen muss Pfannenfertige Grafiken von Statistikern

Volkszählung 2010 in der Schweiz

Statistikreport für Sozialabteilungen von Zürcher Gemeinden Atelierbeitrag Statistiktage 2013

THEMA: "SAS STORED PROCESSES - SCHNELL GEZAUBERT" HELENE SCHMITZ

Die Rolle von Krediten und Zahlungsrückständen bei Verschuldungssituationen

Raumgliederungen in der öffentlichen Statistik Raumnomenklaturen

7.23 Lohnstrukturerhebung

Ressourcenmanagement in Forschung und Entwicklung Grünenthal integriert SAS in sein Berechtigungs- und Mandantenkonzept 7.

Änderungen in der Burweb-Version (xml- Schnittstelle 1.2)

Verfügbarkeit von Applikationen und Failover Szenarien. Winfried Wojtenek.

HMS. Statistiken mit SAS ins Internet. HMS Analytical Software GmbH - Johannes Lang

tentoinfinity Apps 1.0 EINFÜHRUNG

DOKUMENTATION PASY. Patientendaten verwalten

Die neue Volkszählung in der Schweiz

KURZANLEITUNG CYBERDUCK MIT CLOUD OBJECT STORAGE

CADEMIA: Einrichtung Ihres Computers unter Mac OS X

SQL Server 2012 und SharePoint im Unternehmenseinsatz. Referent Daniel Caesar

RIA Architektur ermöglicht globales Garantiemanagement bei Siemens

Master Data Management

Planung für Organisation und Technik

Oracle GridControl Tuning Pack. best Open Systems Day April Unterföhring. Marco Kühn best Systeme GmbH

Messung von ServiceLeistung für SAP Service Provider Kundenevent 25. November HSR Rapperswil

Http Viewer. Integration ereview in FileNet P8/SAP via ACSAP

Powermanager Server- Client- Installation

Lexware professional und premium setzen bis einschließlich Version 2012 den Sybase SQL-Datenbankserver

Internet Explorer Version 6

GFAhnen Datensicherung und Datenaustausch

SharePoint Server 2010: Erfahrungen und praktische Beispiele für die verbesserte Zusammenarbeit mit Kunden und Partnern

3. Stored Procedures und PL/SQL

Document Management. Überblick DM

Installationsanleitung für pcvisit Server (pcvisit 15.0)

Zwei Wege zur automatisierten SW Verteilung Am Beispiel der Lösungen von Jungheinrich. Matthias Nischwitz,

OWASP Stammtisch München Sep 2014 XSS und andere Sicherheitslücken aus der Perspektive des Programmcodes

Dieses Dokument soll dem Administrator helfen, die ENiQ-Software als Client auf dem Zielrechner zu installieren und zu konfigurieren.

Wie aus Steuerungsinformation öffentliche Statistik wird

Oracle APEX Installer

Business Intelligence in NRW

COSA. Portal Client Installation JAVA J2SE / JRE Version 1.4.2_09, Stand Copyright

Anleitung Captain Logfex 2013

Bearbeitung und Download von grossen Datenmengen in STAT-TAB

Google Merchant Modul für OXID

Kurzanleitung. Einstieg in die TripleCard Profi-Software. Zeiterfassungs- Software für. TripleCard Terminal

IPA FAX Dienste. Die Alternative für Faxgeräte

.htaccess HOWTO. zum Schutz von Dateien und Verzeichnissen mittels Passwortabfrage

Unterstützung in Business Objects Anwendungen

IBM SPSS Statistics Version 22. Konfigurieren von Technologie für behindertengerechte Bedienung

Installationsanleitung für pcvisit Server (pcvisit 12.0)

Umstieg auf Microsoft Exchange in der Fakultät 02

Strafregister. Es ist vollbracht! Fazit und erste Erfahrungen mit digitalen Dokumenten

Zertifizierungsprozess

Schweizerischer Baupreisindex

VENTA KVM mit Office Schnittstelle

1. Fehlende Zugriffsrechte für die Verwendung der VR -NetWorld Software

Folgende Einstellungen sind notwendig, damit die Kommunikation zwischen Server und Client funktioniert:

CADEMIA: Einrichtung Ihres Computers unter Linux mit Oracle-Java

Service-Handbuch. SH_Checkup_Applets.doc. Version: 1.02 Aktualisiert: durch: RLo Seite 1 von 6

Anleitung zur Einrichtung einer ODBC Verbindung zu den Übungsdatenbanken

Leserdienst Leserdienst > Medien und Möglichkeiten > Übermittlung > Verarbeitung > Vorteile

Produktmanagement vom Kundenticket zum Release

Lars Priebe Senior Systemberater. ORACLE Deutschland GmbH

2. Einrichtung der ODBC-Schnittstelle aus orgamax (für 32-bit-Anwendungen)

Vereinfachte Ticketerfassung oxando GmbH

Graphen in Apex von Thomas Hernando.

Inhouse-Seminar: Informationsbewirtschaftung im Data Warehouse mit dem ETL-Tool PowerCenter -4 Tage

OP-LOG

MappingTestTool. Werkzeug für automatisierte Mappingtests auf SAP PI / PO

Bildungsmonitoring Schweiz: Gemeinsames Vorhaben von Bund und Kantonen

How-to: Webserver NAT. Securepoint Security System Version 2007nx

Dokumentenmanagement mit active.pdm

Tarif für die Einkommenssteuer 2014

novapro Open Audittrail Report

Das Compare-, Merge- und Versionierungstool für Microsoft Dynamics NAV. NAVObjectEditor RECY CLE

Kleines Handbuch zur Fotogalerie der Pixel AG

Allgemeines zu Datenbanken

Aktualisieren auf Adobe Experience Manager Forms on JEE für Websphere

BIF/SWE - Übungsbeispiel

EJB Beispiel. JEE Vorlesung 10. Ralf Gitzel


Bedienungsanleitung Control DC Supply

Kapitel 2 SAP Easy Access

Kurzanleitung Installation der Zend Studio Sprachpakete

SuFlex. (Flex)ibles. Der Käufer eines ERP Systems (oder sonstiger Software) hat kaum Eingriffsmöglichkeiten innerhalb der Software.

Familie und Studium 2009: Analysebericht zur sozialen Lage der Studierenden

Parallels Plesk Panel

Kooperationsprojekte RRZ - Universitätskolleg

Quickstep Server Update

Freigabemitteilung Nr. 39. Neue Funktionen adresse zurücksetzen / ändern Kennung ändern Anlegen von OCS (elektr. Postfach) Mailbenutzern

crm-now/ps Webforms Webdesigner Handbuch Erste Ausgabe

Migration der Abteilungslaufwerke von UKKSRVFILE011 nach FILER2. Anleitung zur Lösung verschiedener Probleme durch den Anwender selber

nessbase Projekte Über Projekte I

GuiXT und mysap ERP. Regensdorf, April 2004 Dr.Gerhard Rodé, Synactive GmbH

Haufe-Lexware GmbH & Co KG Download von lex-blog.de. Einrichtung der neuen Datenbank:

Transkript:

State of the art Datenaufbereitung bei der Strukturerhebung der Volkszählung Jean-Paul Kauthen, Eric Pearmund SAS-Forum, 15. Mai 1012

Traktanden Das BFS in Kürze Die neue Volkszählung Die Strukturerhebung der Volkszählung Der statistische Datenaufbereitungsprozess Die Systemintegration Die Validierungsprozesse Die Systemlandschaft Lessons learned 2

Das BFS in Kürze Gegründet im Jahr 1860 mit Sitz in Neuenburg seit 1998 Departement des Innern 633 FTE-Stellen (746 Mitarbeitende) (Stamm- und drittmittelfinanziertes Personal, Jahresdurchschnitt 2011) Rund 350 Publikationen pro Jahr Budget: 168 Mio. Franken ca. 400 SAS-User 3

Aufgaben des BFS Das Bundesamt für Statistik ist die zentrale Statistikstelle des Bundes. Es koordiniert die Bundesstatistik Es liefert statistische Informationen für die demokratische Entscheidungsfindung Es erstellt einheitliche Grundlagen im Interesse der nationalen und internationalen Vergleichbarkeit Beispiele von Statistiken: Güterverkehr, Kriminalität, Vornamen 4

Rechtliche Grundlagen der Volkszählung (VZ) Schweizerische Bundesverfassung (Art. 65, Abs. 2) Bundesgesetz über die Registerharmonisierung (23.6.2006) Bundesgesetz über die eidgenössische Volkszählung (22.6.2007) Bundesstatistikgesetz (9.10.1992) 5

Die Grundprinzipien der neuen VZ Die traditionelle Vollerhebung alle zehn Jahre wird durch ein rollendes jährliches VZ-Erhebungssystem abgelöst. Die neue Volkszählung stützt sich in erster Linie auf Register und Verwaltungsdaten (Kantonale und kommunale Einwohnerregister, Bundespersonenregister, eidg. Gebäude- und Wohnungsregister) ab. Zusätzlicher Informationsbedarf wird mittels ergänzender Stichprobenerhebungen abgedeckt (Strukturerhebung, thematische Erhebungen, Omnibus). Die ganze Statistikproduktion (von der Erhebung bis zum Output) wird in einem Gesamtsystem Haushalts- und Personenstatistiken integriert und koordiniert (Programm SHAPE) und im Rahmen von SIS@BFS abgewickelt. 6

Die VZ als Teil eines Gesamtsystems Neue Erhebungen im Rahmen der Volkszählung ab 2010 Registererhebungen Personenregister, Gebäude- und Wohnungsregister Strukturerhebung (jährliche grosse Stichprobe der Nichtregistermerkmale) Thematische Erhebungen Mobilität, Bildung, Gesundheit, Familien, Sprache, Religion und Kultur CH-Omnibus Heute bestehende Erhebungen Schweiz. Arbeitskräfteerhebung (SAKE) Einkommen und Lebensbedingungen (SILC) Haushaltsbudgeterhebung (HABE) 7

Das Produktionssystem umfasst verschiedenste Quellen und entsprechend viele Verarbeitungsschritte Basisstatistiken Gebäude- und Wohnungsregister Strukturstatistiken DWH Einwohnerregister Datenaufbereitung Auswertung Analyse Bundespersonenregister Inputdaten Aufbereitung Output Stichprobensystem thematische Statistiken Strukturerhebung Thematische Erhebungen und Omnibus 8

Die Statistiken können rasch aktualisiert und wiederkehrend erzeugt werden Basisstatistiken Gebäude- und Wohnungsregister Strukturstatistiken DWH Einwohnerregister Datenaufbereitung Auswertung Analyse Bundespersonenregister Inputdaten Aufbereitung Output Stichprobensystem thematische Statistiken Strukturerhebung Thematische Erhebungen und Omnibus 9

Strukturerhebung (SE) Jährliche Stichprobenerhebung bei 200 000 Personen (netto) Auskunftspflicht der Erhebung gemäss Volkszählungsgesetz (Art. 10) Gleichmässige Stichprobenverteilung, ca. 2.7% pro Gemeinde Durchführung als schriftlicher Erhebung oder per Internet Die Kantone können die Stichprobe des Bundes aufstocken, i.d.r. bis auf maximal 440 000 Personen, Bestellungen für 2011: ca. 277 000 (Nettostichprobe) Resultate: Indikatoren zu: Bevölkerung, Haushalt und Wohnung / Arbeit / Mobilität / Bildung / Sprache, Religion und Kultur / Familie 10

Personen- und Haushaltsfragebogen 11

Statistischer Datenaufbereitungsprozess (SDAP) Initialdatenaufbereitung Mikrodatenaufbereitung Makrodatenaufbereitung 12

MIA Workflow Eidgenössisches Departement des Innern EDI Initialdatenaufbereitung ETL-Prozess (Kanäle Papier und Internet) Automatische Kodierungen (Nomenklaturen und Listen) Automatische Validierungen (ca. 100 Regeln) Rollenzuteilungen Temporäre: Nachbearbeitung, Kodierung Call Center: Telefonische Rückfragen Projektteam: Spezialfälle Manuelle Nachbearbeitung, manuelle Kodierung, Behandlung von Spezialfällen, telefonische Rückfragen mit eigens hierfür entwickelter Manuellen Initialdatenaufbereitungs (MIA) - Applikation 13

14

Systemintegration Validation Scanning DSM DSMI Workflow IA MIA Mikro Makro ETL REG WAM esurvey Delivery Management IDP WAM DB sas MIA DB Initialdatenaufbereitung sas Mikro/Makro DWH externe Systeme 15

Workflow IA Validation (Workflow) sas MIA DB Der wichtigste Workflow ist der Lieferungs-Workflow für die Verarbeitung einer Lieferung vom Scanning Center oder von esurvey. Es werden vom Workflow 9 SAS Programme über SAS IOM aufgerufen: 1. Initialisierung (Anlegen der Verzeichnisse für SAS, Kopie der Files, ) 2. Technische Validierung (Prüfung der PageCodes, Identifiers, ) 3. Extract & Transformation der csv Files in eine SAS Datei 4. Load (Laden der Daten in die MIA DB) 5. Coding (Approx. Matching; Kodierungen/Abgleiche mit Nomenklaturen, Listen und Register (UPI, BUR)) 6. Sample (Abgleich mit Stichprobendatei, Laden der einzelnen Variabeln in die DB) 7. Validierungsprozess des Fragenbogens (Kontroll- und Einsetzungsregeln) 8. Rollenzuweisung (für die weitere Bearbeitung) 9. Create Call Center Report (Fehlermeldungen für die Rückfragen) 16

Validation (MIA) IA sas MIA MIA DB Die Validierung anhand von ca. 100 vordefinierten Regeln macht Konsistenz- Prüfungen auf den Dateninhalt eines Fragebogens und ist mit SAS-Macros realisiert. Die SAS-Schnittstelle Integrated Object Model (IOM) Bridge wird zur Integration für den Aufruf der Validierung aus der MIA benutzt. Anzahl concurrent User ca. 70 Der Benutzer triggert die manuelle Validierung von der Webapplikation aus: %_runruleset(questionaryinstance_oid=0123456789, RULESET_OID=ABCDEFGHIJKLMNOPQRSTUVWXYZ, RUNTRIGGER=MIA, SECTIONINSTANCE_OID=98765431); Ursprüngliche Gründe für die Validierung mit SAS: Viele BFS Mitarbeitende haben SAS Know How Flexibilität bei der selbständigen Änderung der Regeln 17

Systemlandschaft Webserver Informatica MS SQL.NET, Java Pgm Oracle SAS Mgmt console SAS 9.2 TS2M3 ODBC Ora SAS Metadata SAS Foundation SAS Access ODBC SAS Access Oracle Solaris 10 Patrol Jre 1.5 SEG 4.2 SAS Integr. Tech SPI Server ExpanDrive Entwicklung Referenz Abnahme Produktion Client Application OS & Data SAS Server 18

Nutzen des Systems, Erhebung 2011 (Stand 03.05.2012) 277 000 Fragebögen wurden validiert (Workflow) 48 000 telefonische Rückfragen 150 000 manuelle Kodierungen und Nachkontrollen 19

Kritischer Rückblick und lessons learned Sehr komplexes System Instabilitäten, Bugs Issues konnten nicht immer in nützlicher Frist gelöst werden Gute SAS-Entwickler sind rar (und teilweise kostenintensiv) Stärken von SAS im Offline/Batch-Modus, Schwächen im interaktiven/online-modus Performance Issues bei der MIA Anwendung Tuning Massnahmen wurden implementiert Gemeinsame Plattform mit beschränkten Ressourcen für mehrere Anwendungen Nutzung der Plattform wurde optimiert 20

www.statistik.admin.ch Zeichnung: Magi Wechsler für das BFS 21