不知道这个方法可不可以,就是借助stata的分组求和bys命令
首先生成一个新的变量pline_1,并全部赋值为1,命令:
gen pline_1=1
然后 以hhid分组逐步求和,得x
bys hhid: gen x = sum(pline_1)
接着,输出hhid分组内的最大值x,赋值y(家庭总人数)
bys hhid:egen y=max(x)
以上的家庭总人数计算
如果处理数据后将劳动力与否设置成虚拟变量0,1形式的话,重复以上的循环就可以得到家庭内部的劳动力人口
假设已生成劳动力虚拟变量 L(1/0)
首先以hhid分组逐级求取总数L1
bys hhid:gen L1=sum(L)
然后输出组内的最大值L2(家庭劳动力总数)
bys hhid:egen L2=max(L1)
然后求占比L3
gen L3=L2/y
就可以求出来啦!不知道能否帮到题主~


雷达卡
京公网安备 11010802022788号







