虚拟变量、人工变量、哑变量是同一个东西。作用是给没有数值的定性变量来赋值。比如研究性别、季节、地区等变量是否会有影响,没有具体数据是无法进行回归分析的。通过设置虚拟变量,可以让这些变量拥有自己的数据。虚拟变量赋值的实质是通过01的排列来给定性变量的每个属性贴上唯一的标签(是不是很像条形码),使得软件明白这是不同的类别,从而完成定性变量不同类别间的比较。比如要对比性别是否会影响工资水平,性别有两个属性:男和女。一种虚拟变量设置就是0代表女,1代表男。由于只是类别的区分,所以虚拟变量的0和1设置方法不唯一,也可以0代表男,1代表女。
虚拟变量既可以作为被解释变量也可以作为解释变量。
在实际分析中,得到回归结论后,要把01再置换回具体的属性,分别分析不同属性类别的情况。上述例子中,我们要分别写出男性平均工资水平和女性平均工资水平对应的回归结论,比较二者的异同,从而得到性别是否会影响工资水平的结论。
|