xddlovejiao1314 发表于 2017-3-26 12:19
因变量不用处理,自变量处理为虚拟变量再纳入模型。祝好运~
高手你好,请教个问题。多个自变量,全部为离散变量,非数值的形式,且有大量缺失值。因变量为0-1二元数据。这种情况下做逻辑回归模型,要计算自变量和因变量的相关性、计算各自变量之间的共线性。我现在有两个疑问:
1.像这种自变量和因变量都是离散值的情况,做相关性就是要用卡方检验?自变量的缺失值作为新的一类?只有卡方检验一种方法,不能做相关系数吗?如果可以,该用哪个呢?2.自变量之间的多重共线性该如何做呢?还是直接简单粗暴,直接用lasso?