请教连老师两个命令
householdnumber line(household下的个人) year income father mother
211 1 1991 200 . .
211 1 1993 300 . .
211 2 1993 320 1 1
212 1 1993 200 . .
212 1 1995 230 . .
212 2 1993 210 . .
如上panel data 请问如何写code得到下面两个结果
(1) drop 掉 father 和mother 同时等于缺失值的同一household的所有个人的观测值。 如上表的212应删除 , 如果在同一个household下只要出现father和mother的非缺失值 则保留该household的信息 即上表中211household中的所有个人信息
我用的语句是
gen n=1; bys householdnumber: egen size=sum(n) if father==1 | mother==1; drop if n~=. 可是如果这样211 1中的两个个人观测值也都被删了 不知code该如何写才正确呢?
(2) 在同一个household的同一个年份下 如 obs house line year inc fa mo (问题1数据的部分截取)
1。 211 1 1993 300 . .
2。 211 2 1993 200 1 1
只对fa mo为缺失值的observation进行回归 但是回归时inc需用同一household下 相同年份的父母收入替代 如observation1中的300 需用 2中的200代替 也就是说用父母的收入做小孩收入的工具变量 fa或mo为1时表示此观测值为父母的 若父母的收入均存在 则用父亲的收入替代
怕没讲明白 再具体一些的意思如下:
首先 我并不是对所有的观测值回归 而只是对fa 和 mo存在缺失值的观测值当做cross-section单独回归 如上述观测值1才满足条件 2因为fa mo 不为缺失值 所以在reg时希望将它排除在reg的命令之外
其次 在对所选的的fa mo为缺失值的回归中 income数据并不是用个体自己的 而是用同一个household下相对应的父母收入做工具变量替代 比如1中的income300 需用2中的200替代 而且他们必须是同一年份下(如上述1993)的情况才可替代 问题在于我的数据是panel 会有很多不同的年份 不知道用什么语句才能让其选出在同一个household下的相同年份的个体及其父母数据 并只对个体进行回归 且回归的自变量收入需用相对应的父母收入代替?
挺多限制条件的 希望老师明白我意思了 非常非常感谢!


雷达卡





京公网安备 11010802022788号







