同方差是经典回归的一个重要的假定,相对同方差而言,异方差将可能导致参数估计量不在有效(OLS),但异方差在构建模型中的作用较小,对推论影响较大,所以有必要重视之。
| x的不同取值对应y值的分布(或波动)不同,密度函数f(y)的形状——由尖峰状到缓平状——预示异方差的存在。 |
异方差类型:
如果以两变量的关系来看,异方差的存在,显示随着x值的变化,y的值的波动不相同,或呈现某种明显的形状。所以常用的检验方法以图形检验为主:
第一副图,这种对称的散点图形,主要可以描述残差的波动情况,并非常清晰的显示,不同位置数据的密度、波动等信息。
第二幅图是预测值与标准化残差的散点图,提供的信息相似。
不过这些图形不提供严格的统计检验,可能对经验非富的分析人士更有用,至于何种图形存在异方差,这里不好一言概之。当然也有常用的统计指标用来检验异方差,如怀特检验、帕克检验等等。
|
异方差的常用处理方法(SAS):
诸如变量变换的一类方法可以使用,像对数转换、取倒数、求秩等。
1.矩阵调整
proc reg data=data_anl.performance;
model gcharacteristic=jaim jhonour jpromotion /acov hccmethod=3;
run;quit;
*acov:检验异方差一致性的协方差矩阵;
*hccmethod=0适用于较大样本(大于250),一般hccmethod=1,2或3适用于小样本;
2.给残差赋予权重
实际上就是取模型残差,然后对它的倒数进行加权。通常使用未标准化的残差信息。如果结果不理想也可以尝试使用学生化残差。其工作原理认为,解释变量对被解释变量的预测中,如果某解释变量的预测效果好,那么残差就小,取倒数目的是让有个大的权重给该解释变量。这样整个模型的异方差性会稍有调整。
proc reg data=result;
model gcharacteristic=jaim jhonour jpromotion;
weight addreci_gcresid;*指定对残差倒数进行加权;
run;quit;



雷达卡





京公网安备 11010802022788号







