Schätzung von Vollzeitäquivalenten Titel anhand der der Präsentation AHV-Lohndaten wenn nötig Jann Potteratmit und Monique Untertitel Graf Bundesamt für Statistik, Statistische Methoden METH nicht fett geschrieben Schweizer Statistiktage 24-26 Oktober 2011, Fribourg. Schätzung VZÄ anhand der AHV-Lohndaten: c BFS1
Inhalt Einleitung Titel der Präsentation Methode Machbarkeitsstudie nicht fett geschrieben Diskussion und Schlussfolgerungen Autor Literatur der Präsentation Schätzung VZÄ anhand der AHV-Lohndaten: Inhalt c BFS2
Einleitung Entscheid des BFS: Titel Die Betriebszählung der Präsentation wird durch die Auswertung von administrativen Registern ersetzt. wenn Vorteile: nötig mit Untertitel Reduktion der Belastung der Unternehmen. nicht Produktion fett von jährlichen geschrieben Resultaten, also raschere Aktualisierung als mit Betriebszählung. Herausforderung: Vollzeitäquivalente sind nicht in den Registern vorhanden. Schätzung VZÄ anhand der AHV-Lohndaten: Einleitung c BFS3
Datenquellen 1. Betriebs- und Unternehmensregister BUR Titel Erfassung der aller Präsentation Unternehmen (inkl. Mutationen). Wirtschaftsaktivität NOGA. wenn Region. nötig mit Untertitel 2. Register der AHV-Ausgleichskassen (100 Kassen) nicht Anzahl fett Beschäftigte geschrieben der Unternehmen, Geschlecht und Jahreslöhne der Mitarbeitenden. 3. Erhebungsdaten (BESTA / Profiling) Anzahl Beschäftigte und Vollzeitäquivalente (VZÄ) Schätzung VZÄ anhand der AHV-Lohndaten: Einleitung c BFS4
Methode Idee: Titel Berechnung der VZÄ durch Präsentation eine modellbasierte Imputation. Vorarbeit: Verknüpfung (record linkage) der AHV Register und BUR via Namen und Adressen. Schätzung eines Modells durch Benutzung vorhandener nicht fett geschrieben Datenquellen (BUR-, AHV- und Erhebungsdaten). Einsetzung der VZÄ für Unternehmen im Register (/ BESTA). Schätzung VZÄ anhand der AHV-Lohndaten: Methode c BFS5
Schema Schätzung VZÄ Titel der Präsentation nicht fett geschrieben Schätzung VZÄ anhand der AHV-Lohndaten: Methode c BFS6
Modellvariablen I: abhängige Variable Titel der Präsentation Pro Quartal und Geschlecht: Vorhersage des mittleren VZÄ), wobei VZÄ nicht fett MBG geschrieben = Beschäftigungsgrades (MBG) des Unternehmens (anstatt den BETOT BESTA Schätzung VZÄ anhand der AHV-Lohndaten: Methode c BFS7
Modellvariablen II: erklärende Variablen Folgende Charakteristiken der Lohnverteilung innerhalb des Titel Unternehmens der werdenpräsentation im Modell als erklärende Variablen verwendet: wenn Mean logl: Mittelwert nötig vonmit log(lohn) Untertitel nach Geschlecht Std logl: Standardabweichung von log(lohn) nach nicht fett Geschlecht geschrieben Skew logl: Schiefe (skewness) von log(lohn) nach Geschlecht Weitere erklärende Variablen: NOGA und Region. Schätzung VZÄ anhand der AHV-Lohndaten: Methode c BFS8
Schätzungen Hilfsmittel: SAS proc transreg Titel der Präsentation y = log(mbg) = α + β j f j (X j ) + ɛ nicht Regressionskoeffizienten fett geschrieben α, β j und Residuen ɛ. mit Transformationsfunktionen f j ( ), erklärenden Variablen X j, X j f j ( ) Autor Mean der logl, Präsentation Std logl, Skew logl Identity oder Spline Region, NOGA optimal scoring Schätzung VZÄ anhand der AHV-Lohndaten: Methode c BFS9
Einsetzungen Titel Anwendungder des Vorhersagemodells Präsentation auf alle Unternehmen im Register ausserhalb der BESTA. ŷ = nicht fett geschrieben log(mbg) VZÄ = exp(ŷ) BETOT AHV Schätzung VZÄ anhand der AHV-Lohndaten: Methode c BFS10
Machbarkeitsstudie Die Lohnstrukturerhebung LSE ist eine alle zwei Jahre Titel der Präsentation stattfindende Unternehmenserhebung bei 40 000 Unternehmen bzw. 1.3 Mio. Beschäftigten. Erhoben werden wenn u.a. Löhne und nötig Beschäftigungsgrad mit (Alle Untertitel Modellvariablen). Anmerkung: nicht fett geschrieben Unterschiedliche Definition der Unternehmens- resp. Beschäftigtenpopulation zwischen LSE und AHV (Primärsektor / Selbständigerwerbenden / Lehrlinge). Schätzung VZÄ anhand der AHV-Lohndaten: Machbarkeitsstudie c BFS11
LSE 2006: log(mbg) vs. Mean logl Titel der Präsentation nicht fett geschrieben Schätzung VZÄ anhand der AHV-Lohndaten: Machbarkeitsstudie c BFS12
Qualität I Zwei Modelle sollen hier präsentiert werden: Titel Modellder 1: Schätzung Präsentation separat für 4 Gruppen (2 tiefer Median-Lohnsumme); Modell 2: Ein Schätzmodell für die ganze Wirtschaft. nicht Wir zeigen die fett relativen geschrieben Abweichungen zwischen Wirtschaftssektoren x 2 NOGA Gruppen mit hoher bzw. dem TOTAL VZÄ je NOGA beobachtet in der LSE (Benchmark) und Autor demder TOTAL Präsentation VZÄ je NOGA vorhergesagt mit den Modellen. Schätzung VZÄ anhand der AHV-Lohndaten: Machbarkeitsstudie c BFS13
Qualität II Titel der Präsentation Radj wenn nötig 2 min max median (%) (%) (%) mit Untertitel Modell 1 0.72-0.84-6.0 7.6-0.32 Modell 2 0.80-4.6 4.8-0.02 nicht fett geschrieben min, max, median: relative Abweichung (%) mit Benchmark je NOGA (40 NOGA Gruppen gemäss LSE). Schätzung VZÄ anhand der AHV-Lohndaten: Machbarkeitsstudie c BFS14
Modell 2: MBG Residuen je Grossregion Titel der Präsentation nicht fett geschrieben Schätzung VZÄ anhand der AHV-Lohndaten: Machbarkeitsstudie c BFS15
Diskussion Titel Bestimmtheitsmass der Präsentation R 2 hoch, relativen Abweichungen klein mittlerer Beschäftigungsgrade kann gut modelliert werden. 2 ohne Gruppen besser Gruppenbildung bei nicht Modellfett 1 überprüfen. geschrieben Unternehmen mit VZÄ BETOT muss noch untersucht werden. Schätzung VZÄ anhand der AHV-Lohndaten: Diskussion und Schlussfolgerungen c BFS16
Schlussfolgerungen Titel Machbarkeitsstudie der Präsentation zeigte: Modellierung der VZÄ ist möglich. wenn Wegen Periodizität nötig undmit Unterschiede Untertitel in Definitionen dient LSE nur für Machbarkeitsstudie. nicht Weiterentwicklung fett geschrieben des Modells mit AHV und BESTA Daten (möglich erst ab Mitte 2012). Ziel: Publikation der Resultate 2011 bis Mitte 2013. Schätzung VZÄ anhand der AHV-Lohndaten: Diskussion und Schlussfolgerungen c BFS17
Literatur Hastie, T.J. and R.J. Tibshirani (1990). Generalized Additive Models. Chapman & Hall/CRC Mono-graphs Statistics & Applied Titel der Präsentation Probability) SAS/STAT(R) 9.3 User s Guide The TRANSREG wenn Procedure. nötig mit Untertitel http://support.sas.com/rnd/app/da/stat/procedures/transreg.html nicht Kuhfeld, W.F fett (1990). geschrieben SAS Technical Report R-108: Algorithms for PRINQUAL and TRANSREG Pro-cedures. http://support.sas.com/kb/23/addl/fusion_23806_1_r108_59040.pdf Wood, S.N. (2006). Generalized Additive Models. Introduction with R. Chapman & Hall/CRC Texts in Statistical Science Series. Schätzung VZÄ anhand der AHV-Lohndaten: Literatur c BFS18