大家好,楼主目前自己在整理2011CHFS数据~遇到一些疑问,希望能得到大家帮助说明:主要目的是想看家庭各种收入来源及支出渠道,因此需要比较完整的样本{即A样本中,所有与该家庭收入及支出相关的重要数据都不能缺省},删选条件比较严格,否则各个变量之间的加总也没什么意义{比如,算“家庭经营性收入”均值的时候,是包括“农业经营性收入”和“工商业经营性收入”,必须要挑选出这两个变量都不缺省的样本,以此类推,算家庭“总收入”均值的时候,也必须挑选出所有收入变量都不缺省的样本}。这在做描述性统计的时候比较重要。
疑问:但是,通过对“家庭数据库hh”和“个人数据库ind”相关缺省值进行删选,并对两个数据库进行合并后,剩余的样本只有1500左右,和原先的8000多的样本相比太少>_<
此外,看了CHFS关于“家庭收入与支出”部分的报告,感觉并没有像我这样筛选,是我的思路有问题吗?
有没有大神处理过类似问题的呀,求帮助!求指点!