我想研究一些变量对某银行行用卡持卡人是否使用某项功能的影响情况,选用binary logistic方法,在预处理时遇到一些问题:
1、是否需要对数据进行归一化,转化为在[0,1]之间的数据
2.、logistic是否邀请将数据进行标准化呢,即均值为0,方差为1
3、为了研究方便,我把年龄和收入都进行了离散化,分为了五个档次(他们是有序的):1-5,在做回归的时候,是要将他们设置为分类变量,转化为0.1,还是直接放入协变量进行建模呢?
此外,在选择变量进入方式的时候,怎么考虑方式呢,谢谢大家了


雷达卡



京公网安备 11010802022788号







