我有一组数据。
变量依次为:股票代码stkcd,样本的年度accper,员工职位ocp,性别gend,年龄age,学历edu,任职开始时间start,和简历resume。
首先,我是每一个股票不同年度的数据算作不同的样本的。
现在我想做:
1.排查。在每个年度内每个股票代码的分组内,ocp gend age edu start resume这几个变量的任何一个样本值缺失,那么这个股票代码的这个年度分组内的所有数据全部剔除。
2.计算在任时间,也就是accper减去start 单位为年
3.选择满足条件的个案。resume变量里只要包含“博士研究生”或者“硕士研究生”或者“本科”就保留下来。
例如,图中000002股票2004年分组中的 第一个员工edu缺失。那么 所有000002股票2004年的数据全部剔除。(不过。。我给的数据可能有点少,可能会全都剔除了或者留下的不多。。)
然后resume里面 只要有上述条件中的一个,这个员工的信息就保留。
再次感谢!
2.4M的“样本”数据是stata数据,大家下载之后把扩展名改成.dta就可以打开了 谢谢!


雷达卡







京公网安备 11010802022788号







