zsy0301 发表于 2011-1-13 16:19 
20# 脑残 分组进行计算的话确实会比按照0.4%人口那个要低一些。不过根据基尼系数的定义来说,应该是每个人单独进行计算的。还是应该获取更多的数据才行。
数据越详细,所计算得到的基尼系数应该越大。因为数据越详细,落伦茨曲线便越是向下凸,洛伦茨曲线与绝对平均线之间的面积便越大。当然,最详细的数据无疑是根据每个人的收入或财富数据单独进行计算。但是显然,这样话,计算量将相当大了。而且,随着人数的增加,按照每个人的数据来计算,其精确程度增加是边际递减。因此,权衡计算精确度与计算成本之后,还是将数据分组到适当组数进行计算最好。因此通常教材上才讲把数据分为五组计算。当然,已知一个财富或收入分配的数据就计算基尼系数,确实计算的精确度很小,因为这样计算出来的估计的基尼系数比真实的基尼系数可能要小很多。但是无论如何,所知数据越少,估算的基尼系数越比真实的基尼系数小,这一点是确定无疑的。因此,通过一个数据估算基尼系数,应该算是最小的近似值。
但显然,即使是一个数据,这个有关分配的数据,位于不同的位置,据其估算的基尼系数肯定也不相同。我个人猜测,人口比例越是不平衡的数据,估计的基尼系数将越小;反之,人口比例越是平衡的数据,估算的基尼系数将越大。比如说,如果我们知道穷的50%的人口占财富多少,富的50%人口占财富多少,这样估算出来的基尼系数g1,应该小于知道穷的99.6%的人口所占财富比例30%,而富的0.4%的人口所占财富为70%而估算出来的基尼系数0.696略为0.7。
但是国家统计局从来不公布中国真实的财富分配数据,因此我们也很难去计算了。