昨天终于搞懂了虚拟变量这个问题。当一些分类变量需要在SPSS中进行回归分析时,需要对这些变量进行处理。
如人口统计学的性别,本来收集回来的数据应该是1和2 的编码,只需要在转换—转化为不同变量中进行设置即可,把1—0,2—1就可以了。
如果是年龄的变量,有四个选项,18岁以下;19-29岁;30-49岁;50岁及以上;本来收集回来的数据应该是1,2,3,4的编码,现在需要进行3次虚拟变量的设置。第一次是把2→1,其他变量为0;第二次是把3→1,其他变量为0;第三次是把4→1,其他变量为0即可,就是说有四个选项的生成的新的虚拟变量是3个,都是n-1次操作,生成n-1个变量。(为什么第一次不把1→,其他转化为0呢?因为第一组是控制组,不需要设置)
我并非理工科专业学生,也没有学习过统计学,只是从自己的理解写的,说的不到位的地方,尽情指教。



雷达卡



京公网安备 11010802022788号







