对的,按照上述赋值方法,根据cap_source的取值重新设置两个虚拟变量,加入到回归中去即可。cap_source不要再放入。虚拟变量相当于取值为1的组与在所有虚拟变量中都取值为0的组相对比。如根据前面的赋值规则,cap1=1表示cap_source=2这一组与cap_source=1这一组的对比;cap=2表示cap_source=3这一组与cap_source=1这一组的对比。
定类变量为啥不能直接回归?打个比方,因为定类变量不连续,比如说有三类,那么在坐标轴上只有3个点。这种变化无法通过回归反映。而设置虚拟变量的好处就是从上面三类中选择一类作为基准,然后跟这一基准进行比较,从而反映组与组之间的差异。虚拟变量的系数值就是虚拟变量取值为1的组与基准组之间的均值差异;t值显著的,表示这两组之间的差异是具有统计显著性的~


雷达卡



京公网安备 11010802022788号







