谢谢你的提问!
关于偏态数据,常见的居民收入就应该属于此类。针对你的问题1和3,需要考虑的是:偏态数据是来自何种概率分布的一个样本,这个概率分布是存在但未知的。因此一种思路是假设该偏态数据(或经某种转换后的数据)来自某一个已知的概率分布,参数未知(可通过MLE估计);另一种思路是直接通过非参数核密度方法进行估计,不需要事先假设概率分布。此外,数据本身(或数据转化后)为什么要满足正态性,我不得而知,或许是因为简单、性质好的缘故吧,你是否可以考虑为偏态分布(比如:skewed t distribution)。当然,最后你还可以做分布假设检验。一旦有了概率分布,你可以通过理论计算相应的数字特征,若无法解析求解;当然,我认为通过Bootstrap是一种比较好的方法;还有,你的样本量不是足够大的情况下,不可能直接通过样本求分位数,可能你也需要通过分布的确定然后bootstrap来考虑你的分位数等。至于问题2,对不起,我未做个关于抽样方面的研究。


雷达卡
京公网安备 11010802022788号







