先谢过各位!
目前在研究 不同人群的潜在结婚对象问题。 例如,年龄为a的样本,其潜在对象为年龄a+-5的异性;教育程度为大学本科的样本,其潜在对象为教育程度初中—博士的异性。
假设有数据如下:_n age educ sex
1 20 3高中 1
2 25 4大学 2
3 40 4大学 1
4 30 1小学 1
5 28 4大学 1
6 25 3高中 2
7 40 3高中 2
现在要建立一个新变量 _c,表示潜在结婚对象的人数。
以样本编号为2的女性为例,在该样本中,其潜在对象为样本编号 1 和 5,其余人均因不同原因不满足要求。所以,_c=2
以样本编号为3的男性为例,在该样本中,其潜在对象为样本编号 7 ,其余人均因不同原因不满足要求。所以,_c=1
这个问题让我很困扰,不知如何下手。
我的思路是,先建立一串虚拟变量,如 for_age25 和 for_age40,用来指明从年龄上看满足要求的样本。再建立一串,如for_educ4,用来指示满足教育要求的对象。建立完成后,数据如下:
_n age educ sex for_age25 for_age40 for_educ4
1 20 3高中 1 1 0 1
2 25 2初中 2 1 0 1
3 40 4大学 1 0 1 1
4 35 2初中 1 0 1 1
5 28 4大学 1 1 0 1
6 25 2小学 2 1 0 0
7 40 3高中 2 0 1 1
于是,_c等于若干虚拟变量均为1的观测值的数量。
求一段代码求 _c
(目前在想能不能用 egen anycount 来处理)


雷达卡




京公网安备 11010802022788号







