SST 2012 24. September 2012 c BFS 1 Eidgenössisches Departement des Innern EDI Varianzschätzung bei vier Ungleichheitsindizes für Titel der Einkommensverteilungen Präsentation Schweizerische Statistiktage, Vaduz 2012 Monika Ferster Statistische Methoden / BFS 20. September 2012
Inhalt 1. Einleitung Titel der Präsentation 2. Varianzschätzung bei vier Ungleichheits-Indizes 3. Anwendung Haushaltsbudgeterhebung 4. Schlussfolgerungen Autor 5. Literatur der Präsentation SST 2012 c BFS 2
Einleitung Einkommensungleichheit wird durch staatlich geregelte Zuund Abflüsse reduziert. Titel der Präsentation + Erwerbseinkommen + Einkommen aus Vermögen und Vermietung wenn = Primäreinkommen nötig (Vortransfereinkommen) mit Untertitel + Renten und Sozialleistungen + Monetäre Transfereinkommen von anderen Haushalten = Bruttoeinkommen obligatorische Transferausgaben Monetäre Transferausgaben an andere Haushalte = Verfügbares Einkommen (Nachtransfereinkommen) Autor Das Haushaltseinkommen der Präsentation wird auf das Ein-Personen-Haushalts-Einkommen Datum (sog. Äquivalenzeinkommen) der Präsentation umgerechnet. Im Folgenden (ev. mit ist mit Anlass) Einkommen immer das monatliche Äquivalenzeinkommen gemeint. SST 2012 Einleitung c BFS 3
Geschätzte Einkommensverteilungen Haushaltsbudgeterhebung HABE 2007: n =3 379, ˆN =3 266 522 HABE07: Äquivalenzeinkommen Zoom Titel Primäreinkommen der Präsentation Bruttoeinkommen 7487 verfügbares Einkommen 4976 Äquivalenz Einkommen 0 10000 20000 30000 40000 Äquivalenz Einkommen Datum 0.0 der 0.2 0.4Präsentation 0.6 0.8 1.0 0.0 (ev. 0.2 mit 0.4 0.6Anlass) 0.8 Anteil Haushalte Anteil Haushalte 0 2000 4000 6000 8000 3295 SST 2012 Einleitung c BFS 4
Ungleichheits-Indizes Sie quantifizieren verschiedene, sich ergänzende Aspekte der Ungleichheit von Einkommensverteilungen. Titel der Präsentation Gini-Index: beschreibt den mittleren Einkommensbereich wenn Income Quintile-Share-Ratio nötig QSR: Untertitel vergleicht die hohen mit den tiefen Einkommen nicht Theil-Index: fett reagiert geschrieben eher auf hohe Einkommen Atkinson-Index: berücksichtigt besonders Veränderungen im unteren Einkommensbereich Generell: Je grösser der Indexwert, desto ungleicher die Einkommensverteilung. SST 2012 Einleitung c BFS 5
Haushaltsbudget-Erhebung 2009, 2008, 2007 Gini-Index QSR Jahr Primär- verfügbares Primär- verfügbares Titel Einkommen der Einkommen Präsentation Einkommen Einkommen 2009 0.405 0.275 24.78 4.26 2008 0.413 0.280 26.28 4.27 2007 0.428 0.297 34.74 5.00 Schwierig zu interpretieren, weil eine Genauigkeitsangabe (zb Standardabweichung oder Autor Vertrauensintervall) der Präsentation fehlt. SST 2012 Einleitung c BFS 6
Varianzschätzung bei vier Ungleichheits-Indizes Linearisierungs-Methode nach Deville U Population der Grösse N Titel M Mass mit M(i) der = 1 für alle ipräsentation U θ = T (M) Populationsparameter, Funktional von M wenn S U einfache Zufallsstichprobe nötig dermit Grösse n, gezogen Untertitel in U { ˆθ = T ( M) mit M(i) wi für i S = 0 für i / S w i Stichprobengewicht Definition der linearisierten Variablen ẑ k, k S: T ( ẑ k = lim M + tδ k ) T ( M) t 0 t δ k Dirac-Mass mit δ k (i) = 1 genau dann, wenn i = k, sonst 0. SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 7
Ableitungsregeln sind anwendbar. Varianzschätzung Sei R S die Nettostichprobe der Grösse m. Die Varianz von T ( Titel Präsentation M) kann durch diejenige der linearen Statistik i R wi ẑi approximiert werden: V (T ( M)) V ( w i ẑ i ) = N 2 (1 m N ) 1 m s2 ẑ,r, i R wobei s 2 für die Stichprobenvarianz der geschätzten linearisierten Variabeln ẑ,r ẑ k steht. Das asymptotische (1 α)-vertrauensintervall von T ( M) hat die Form ] Autor [T der ( Präsentation M) z 1 α/2 ˆV (T ( M)), T ( M) + z 1 α/2 ˆV (T ( M)), wobei z 1 α/2 das 1 α/2-quantil der Standardnormalverteilung ist. SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 8
Gini-Index Lorenzkurve: Zeigt zum Beispiel, dass die 20% höchsten Bruttoeinkommen 37% des gesamten Bruttoeinkommens ausmachen. HABE07: Äquivalenzeinkommen Titel der Präsentation Primäreinkommen Bruttoeinkommen verfügbares Einkommen 63% 56% Gesamteinkommensanteil 0.0 0.2 0.4 0.6 0.8 1.0 8% absolute Gleichheit absolute Ungleichheit 1% 0.0 0.2 0.4 0.6 0.8 1.0 Anteil Haushalte Gini-Index: zweimal Fläche zwischen Diagonale und Lorenzkurve SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 9
Für eine endliche Population lautet der Gini-Index: G = 2 i U r i y i Y 1 N Y mit Rang r Titel i = j U der 1 {y j y i } und Einkommenstotal Y = Präsentation i U y i. Für eine Stichprobe hat man: wenn nötig G( mit Untertitel M) = 2 i S ˆr i w i y i Ŷ ˆN Ŷ 1 mit ˆr i = j S w j 1 {yj y i }, ˆN = i S w i, Ŷ = i S w i y i und der Indikatorfunktion 1 {yj y i }. Mit Definition und Ableitungsregeln erhält man die linearisierte Variable ẑ k : ẑ Datum k = 1 k 2(Ŷ ˆNŶ der w Präsentation i y i + w k y k + y kˆr k ) y k (1 + G( (ev. mit M))(Ŷ Anlass) + ˆNy k ). i=1 SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 10
Income Quintile Share Ratio QSR HABE 2007 Titel der Präsentation Äquivalenz Einkommen 0 5000 10000 15000 20000 25000 30000 q+ = 6935 Primäreinkommen q+ = 5330 q = 2371 q = 1314 0.0 0.2 0.4 0.6 0.8 1.0 Anteil Haushalte Äquivalenz Einkommen 0 5000 10000 15000 20000 25000 30000 verfügbares Einkommen 0.0 0.2 0.4 0.6 0.8 1.0 Anteil Haushalte SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 11
QSR = Total der 20% höchsten Einkommen Total der 20% tiefsten Einkommen Titel der Präsentation wenn Eurostat Modifikation nötig mit Untertitel Mittelwert der 20% höchsten Einkommen QSR nicht EU = fett Mittelwert geschrieben der 20% tiefsten Einkommen Begründung: Autor Ist etwasder robuster. Präsentation Gleicht aus, dass die Anzahl geschätzter Einkommen im 1. und 5. Quintil unterschiedlich sein kann. SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 12
Für die Stichprobe S mit den Stichprobengewichten w i erhält man Titel der Präsentation i S,y i q ( M) w. iy i Das 1. Einkommensquintil q ( M) ist durch F( M, i S x) = 1 {y i x} w i = 0.2 bestimmt. Für q + ( M) gilt QSR = Ŝ80/Ŝ20 = i S w iy i i S,y i q +( M) w iy i das Analoge. i S w i Die Berechnung der linearisierten Variabeln ẑ k ist komplex. SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 13
Theil Index Theil(M) = 1 N Speziell gewichtetes Mittel der logarithmierten Titel der Präsentation Mittelwertsabweichungen. Atkinson Index wenn nötig ( mit Untertitel ) 1 ɛ > 0, ɛ 1: 1 A nicht fett ɛ (M) = 1 ( N geschrieben y 1 ɛ i Ȳ )1 ɛ i U A 1 (M) = 1 1 Ȳ i U Datum Bemerkung: der Je grösser Präsentation ɛ, desto mehr werden die (ev. kleineren mit Einkommen Anlass) i U y i Ȳ log( y i Ȳ ) Grenzwertrechnung und die Regel von Bernoulli-l Hôpital liefert ɛ = 1: ( ) 1 N y i berücksichtigt. ɛ = 1 ist der übliche ɛ-wert. SST 2012 Varianzschätzung bei vier Ungleichheits-Indizes c BFS 14
Anwendung Haushaltsbudgeterhebung Haushaltsbudgeterhebungen des BFS der Jahre 2009, 2008, 2007 Titel der Präsentation Angaben von jeweils ca. 3400 Haushalten zu Einkommen/Ausgaben eines Jahres wenn Umrechnung nötig auf monatliche mit Äquivalenzeinkommen Untertitel (Ein-Personen-Haushalte) HABE2009: n = 3317, ˆN = 3 387 041 HABE2008: n = 3438, ˆN = 3 335 357 HABE2007: n = 3379, ˆN = 3 266 522 Datum Variationskoeffizient der Präsentation CV = Standardabweichung (ev. mit Anlass) Schaetzwert SST 2012 Anwendung Haushaltsbudgeterhebung c BFS 15
Gini-Index Primäreinkommen verfügbares Einkommen Jahr Schätzung CV (in %) Schätzung CV (in %) 2009 0.405 1.58 0.275 2.40 2008 0.413 1.68 0.280 1.81 Titel 2007 der 0.428 Präsentation 1.67 0.297 2.25 Gesamthaushalte Primäreinkommen Bruttoeinkommen verfügbares Einkommen Jahr 2007 2008 2009 0.26 0.30 0.34 0.38 0.42 Gini Index SST 2012 Anwendung Haushaltsbudgeterhebung c BFS 16
Primäreinkommen verfügbares Einkommen Jahr Schätzung CV (in %) Schätzung CV (in %) 2009 24.78 11.91 4.26 5.03 2008 26.28 12.63 4.27 3.19 Titel 2007 der 34.74 Präsentation 15.77 5.00 4.86 Gesamthaushalte Primäreinkommen Bruttoeinkommen verfügbares Einkommen Jahr 2007 2008 2009 0 10 20 30 40 QSR mit Eurostat Modifikation SST 2012 Anwendung Haushaltsbudgeterhebung c BFS 17
Schlussfolgerungen Mit der Linearisierungsmethode nach Deville hat man nun: Titel Varianzschätzung der für Präsentation vier Ungleichheits-Indizes auch für Domains handlich und schnell nicht Man kann mitfett Hilfe der linearisierten geschrieben Variabeln ẑ k einen Signifikanz-Test durchführen für den Indizes-Unterschied bei: zwei verschiedenen Einkommen derselben Stichprobe zwei unabhängigen Stichproben verschiedener Jahre SST 2012 Schlussfolgerungen c BFS 18
Literatur Deville, J.C. (1999). Variance estimation for complex statistics and estimators: linearization and residual Titel techniques. der Survey Präsentation Methodology, 25, 193-203 Guillaume Osier (2009). Variance estimation for complex indicators of poverty and inequality using linearization techniques. Survey Research Methods, 3(3), 167-195 Dell F., d Haultfoeuille X., Février P., Massé E. (2002). Mise en Oeuvre du calcul de variance par linéarisation. Insee-Méthodes: Actes des Journées de Méthodologie Statistique 2002 SST 2012 Literatur c BFS 19
Anhang 1: Einkommenskurven der HABE08 Primäreinkommen Bruttoeinkommen 7573 Titel verfügbares der Einkommen Präsentation 5055 3373 Äquivalenz Einkommen 0 10000 30000 50000 HABE08: Äquivalenzeinkommen Datum 0.0 0.2 der 0.4 Präsentation 0.6 0.8 1.0 0.0(ev. 0.2 mit 0.4 Anlass) 0.6 0.8 Äquivalenz Einkommen Anteil Haushalte Anteil Haushalte 0 2000 4000 6000 8000 Zoom SST 2012 Literatur c BFS 20
Anhang 2: Einkommenskurven der HABE09 Primäreinkommen Bruttoeinkommen 7752 Titel verfügbares der Einkommen Präsentation 5274 3692 Äquivalenz Einkommen 0 10000 20000 30000 HABE09: Äquivalenzeinkommen Datum 0.0 0.2 der 0.4 Präsentation 0.6 0.8 1.0 0.0(ev. 0.2 mit 0.4 Anlass) 0.6 0.8 Äquivalenz Einkommen Anteil Haushalte Anteil Haushalte 0 2000 4000 6000 8000 Zoom SST 2012 Literatur c BFS 21
Anhang 3: Theil Index Primäreinkommen verfügbares Einkommen Jahr Schätzung CV (in %) Schätzung CV (in %) 2009 0.303 3.17 0.127 4.37 2008 0.318 4.10 0.130 4.05 Titel 2007 der 0.337 Präsentation 3.51 0.154 5.67 Gesamthaushalte Primäreinkommen Jahr 2007 2008 2009 Bruttoeinkommen verfügbares Einkommen 0.14 0.18 0.22 0.26 0.30 0.34 SST 2012 Literatur Theil Index c BFS 22
Anhang 4: Atkinson Index für ɛ = 1 Primäreinkommen verfügbares Einkommen Jahr Schätzung CV (in %) Schätzung CV (in %) 2009 0.517 2.67 0.145 6.22 2008 0.530 2.55 0.144 5.10 Titel 2007 der 0.563 Präsentation 3.13 0.206 7.38 Gesamthaushalte Primäreinkommen Jahr 2007 2008 2009 Bruttoeinkommen verfügbares Einkommen 0.10 0.14 0.18 0.22 0.26 0.30 0.34 0.38 0.42 0.46 0.50 0.54 0.58 SST 2012 Literatur Atkinson Index für Epsilon=1 c BFS 23
Anhang 5: Atkinson-Index für ɛ {0.5, 1, 1.4} Titel der Präsentation Primäreinkommen Epsilon 0.5 1.0 1.4 HABE07: Gesamthaushalte 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 Atkinson Index Bruttoeinkommen verfügbares Einkommen SST 2012 Literatur c BFS 24
Anhang 6: Beispiele zur Einflussfunktion (= ẑ k ) Beispiel 1: Einflussfunktion eines Totals ˆθ = Titel Ŷ = i S der w iy i = T ( Präsentation M) hat die Einflussfunktion in k I wenn k (T ( M)) i S = lim nötig (w i + tδ k )y i i S t 0 mit Untertitel w iy i t = lim ty k = y k. t 0 t nicht Beispiel 2: Einflussfunktion fett geschrieben eines Quotienten aus zwei Totalen Für ˆR = ŶˆX = T ( M) mit Ŷ = i S w iy i und ˆX analog hat man I k ()( Datum M)) = I k ( der ˆR) = ˆX I k (Ŷ ) Ŷ I k( ˆX) = 1ˆX (y k Präsentation ˆX 2 (ev. mit Anlass) ˆR x k ). SST 2012 Literatur c BFS 25
Beispiel 3: Anwendung auf die kumulative Einkommensverteilungsfunktion F(M, x) bzw. F( M, x) Bevölkerungsanteil mit einem Einkommen von höchstens x: Titel der i U F (M, x) = Präsentation 1 {y i x} N wenn Geschätzter Bevölkerungsanteil nötig mit einem Untertitel Einkommen von höchstens x: F( nicht fett M, i S x) = geschrieben 1 {y i x} w i i S w i Das erste Quintil q 1 ( M) ist bestimmt durch F( M, q 1 ( M)) = 0.2 und man hat Autor I k (F ( der M, q 1 ( Präsentation M) q1 ( Datum der Präsentation M)fest )) = 1 i S w (1 {yk q 1 0.2). ( M)} i (ev. mit Anlass) SST 2012 Literatur c BFS 26
Anhang 7a: Linearisierung beim QSR QSR = Ŝ80/Ŝ20 = i S w i y i i S,y i q +( M) w i y i i S,y i q ( M) w i y i = T ( M), Titel der Präsentation wobei das 1. Einkommensquintil q ( M) durch F ( wenn M, i S x) = 1 {y nötig x} w i i i S mit Untertitel w = 0.2 bestimmt ist. i Berechnung von ẑ k mit Quotientenregel. Herleitung der Linearisierung des Nenner-Funktionals S( M, q ( M)) I k (S( M, q ( M))) = I k (S( M, q ( M) q )) + ds( M, x) ( M)fest }{{} dx x=q ( M) }{{} C I k (q ( M)) }{{} B A Datum Herleitung A: der gemässpräsentation Definition (ev. mit Anlass) Herleitung B: durch Konvolutionsprodukt Herleitung C: wie B SST 2012 Literatur c BFS 27
Anhang 7b: Herleitung von B beim QSR df (M, x) x=q (M) I k (q (M)) = 0 dx I k (F (M, q (M))) = I k (F (M, q (M) q (M)fest ))+ Titel und somit I k (q der (M)) = Präsentation I k (F (M,q (M) q (M)fest )) df(m,x). dx x=q (M) Ableitung F des Nenners ist 0 oder undefiniert. Deshalb Approximation von : x F (M, x) durch Konvolutionsprodukt F K (x) = F (t) K (x, t)dt mit dem Gauss schen Kern K (x, t) = 1 h (x t)2 exp( ). 2π 2h 2 Dann gilt F K (x) = 1 h 1 2π N i U exp( (x y i )2 ) und damit 2h 2 B = I k (q ( M)) = 1ˆN (1 0.2) {y k q ( M)} 1 ĥ 1ˆN 2π i S exp( (q ( M) y i ) 2 ) Datum der Präsentation (ev. mit 2ĥ2 Anlass) mit ĥ = ˆσ ˆN 1/5 = i S w i y2 i ( i S w i y i )2 / ˆN ˆN 1 ˆN 1/5. SST 2012 Literatur c BFS 28