泰尔指数作为收入不平等程度的测度指标具备良好的可分解性质,即将样本分为多个群组时,泰尔指数可以分别衡量组内差距与组间差距对总差距的贡献。假设包含n个个体的样本被分为K个群组,每组分别为g_k, (k=1,\cdots,K) ,第k组g_k中的个体数目为n_k,则有\sum_{k=1}^K n_k =n.
用y_i表示个体 i 的收入份额(占总收入的比例), y_k 表示第k组的收入份额(占总收入的比例)
记T_b 与T_w分别为组间差距和组内差距,则可将泰尔指数分解如下:
T=T_b+T_w=\sum_{k=1}^K y_k \ln\big(\frac{y_k}{n_k /n} \big) + \sum_{k=1}^K y_k \Big(\sum_{i \in g_k} \frac{y_i}{y_k} \ln \frac{y_i / y_k}{1/n_k} \Big)
在上式中组间差距与组内差距分别有如下表达式:
T_b=\sum_{k=1}^K y_k \ln\big(\frac{y_k}{n_k /n} \big) T_w = \sum_{k=1}^K y_k \Big(\sum_{i \in g_k} \frac{y_i}{y_k} \ln \frac{y_i / y_k}{1/n_k} \Big)
其中,
T_k=\sum_{i \in g_k} \frac{y_i}{y_k} \ln \frac{y_i / y_k}{1/n_k}, \quad i \in g_k
为第k组的组内差距(k=1,...K).
进一步,可以计算第k组组内差距的贡献率和组间差距的贡献率:
D_k=y_k \cdot \frac{T_k}{T},\quad k=1,\cdots,K
D_b=\frac{T_b}{T}
另外,值得注意的是组内差距项分别由各组的组内差距之和构成,各组的组内差距的计算公式与样本总体的计算公式并无二致,只是将样本容量控制在第k组的个体数目。
例2 还是例1的数据,计算组间差距与组内差距,验证泰尔指数
function [Tb,Tw,T,z,Db,Dw]=TbTw(x,n)
%函数TbTw()计算泰尔指数分解
%返回Tb为组间差距, Tw为组内差距, z为各个组内差距,
%返回T为泰尔指数, Db为组间贡献率, Dw为各个组内贡献率
%泰尔指数T=Tb+Tw
%x为N个个体的收入向量, 依次分为K个分组, n=[n1,...,nK]为各分组的个体数向量, sum(n)=N
K=length(n);
s=[0,cumsum(n)];
for k=1:K
X{k}=x(s(k)+1:s(k+1))./sum(x); %X{k}为第k个分组的nk个个体的收入份额(占总收入的比例)
y(k)=sum(X{k}); %y(k)为第k组的收入份额(占总收入的比例)
end
Tb=sum(y.*log(y./(n./length(x)))); %组间差距
for k=1:K
z(k)=sum((X{k}./y(k)).*log(n(k)*X{k}./y(k))); %第k组的组内差距
end
Tw=sum(y.*z); %总的组内差距为各分组组内差距的加权和
T=Tb+Tw; %泰尔指数
Db=Tb/T; %组间贡献率
Dw=y.*z/T; %各分组内的组内贡献率
|