据集credit_old中存放的是用于构建客户信用模型的数据,其中Target为被解释变量,其他变量为解释变量。由于字符变量不能用于后续的统计分析工作,因此需要将credit_old中的字符变量重编码为数值变量。由于分析时并不关心每个水平的具体编码是什么,因此按照从1到K(K为该变量水平数)编码即可,比如Res变量一共用3个水平,分别是U、R、S,编码为1、2、3即可。请编写宏,为每一个字符变量重新编码,以“变量名_cd”的命名方式保存新的编码,并添加到原数据集的后面。
|
楼主: yy~ll~mm
|
441
0
[统计软件] 有大佬会码么? |
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


