自己这几天一直忙处理数据的事,以下是自己用的命令希望对大家有帮助。
定类变量设置虚拟变量,可用此命令:tab 变量名,gen(新变量名)(如男女性别设置成1 0 ,城市和农村等)
定序变量设置虚拟变量,可用以下命令,用健康状况例子说明。很不健康,比较不健康,一般,比较健康,很健康设置成1 2 3 4 5数据,可用:recode 变量名 (1 = 1) (2 = 2)(3 =3)(4=4)(5=5), generate(新变量名)。
其中健康状况也可以归类成三类不健康,一般,健康。定义为1 2 3,命令是
recode 变量名 (1 2 = 1) (3 =2)(4 5=3), generate(新变量名)
有个wx公号写的很清楚:爬虫俱乐部。虚拟变量https://stata-club.github.io/推文/20161025/
缺失值处理https://mp.weixin.qq.com/s/B6r011DCPuiszI2esqCQcQ等都有


雷达卡





京公网安备 11010802022788号







