第一个问题你别想太多,把握住你想实现的目标是什么,方法选择正确即可。看你的描述,你其实是想做东中西部某值影响因素的差异。要实现这个,一个表示东中西部的类别变量是少不了的,比如type表示地区,可编码为1=东部,2=中部,3=西部,这种类别变量在纳入模型时是要处理为虚拟变量的。你想构建type和关注变量A的影响因素差异,直接构建一个type*A的交互项,然后纳入模型即可。
现在再回到第一个问题,回归一般分为解释型回归和预测型回归,前者的变量选取一般是基于理论来的,即使变量不显著,也想看它的系数方向(此种回归对应enter法)。而预测型回归不用管那么多变量,只管哪些变量对因变量是显著的,是能解释因变量的变异的(这种回归对应stepwise)。你要实现的目的明显是一个解释型回归,所以构建后交互项后直接Enter法即可。祝好运~


雷达卡





京公网安备 11010802022788号







