异方差产生可能的原因有:模型中缺少某些变量、测量误差、模型设置不正确、异常值出现。
异方差的形式有几种:残差随着变量增大而增大;残差随着变量增大而减少;与变量的变化呈复杂形式。
1. 异方差的检验
(1)相关图分析方差为随机变量的离散程度,通过观察y和x的相关图,可以观察的离散程度和解释变量之间的相关关系。若随x的增加,y的离散程度呈逐渐增加或减少的趋势则表明模型存在着递增或者递减的异方差性。黄色字体为自己填写部分。
——————————————模板————————————
Ls 被解释变量 C 解释变量
Scat resid 解释变量1
——————————————模板————————————
Ls语句首先建立回归方程。
Scat语句是制作残差与解释变量的相关图。
(2)戈德菲尔德—匡特检验(G-Q检验)
此检验的原理是:将样本按解释变量排序后分成两部分,再利用样本1和样本2分别建立回归模型,并求出各自的残差平方和RSS1和RSS2,如果误差项的离散程度相同,则RSS1与RSS2的值应该大致相同,若两者之间存在显著差异,则表明存在异方差性。为了“夸大”残差的差异性,一般取两端部分样本比较,去掉中间C个数据(通常取C=n/4),再利用F统计量判断差异的显著性。
——————————————模板————————————
Sort 解释变量
Smpl 1 n1
Ls 被解释变量 C 解释变量
Smpl n2 n
Ls 被解释变量 C 解释变量
——————————————模板————————————
Sort语句首先将样本按照解释变量排序。
第一个Smpl语句取第一部分样本,1—n1,一般取n1=n*3/8,n为样本个数。
第一个Ls语句建立回归方程,得到残差平方和RSS1
第二个smpl语句取第二部分样本,从n1+1到n2-1,是去掉的样本部分,大约有n/4个数据,因此一般通常取n2=n*5/8+1。
第二个ls语句建立回归方程,得到残差平方和RSS2。
得到F=RSS2/RSS1,查表得到F(n/2-c/2-k-1)。若F> F(n/2-c/2-k-1),说明显著,存在异方差。
注:n是样本个数,c是去掉的样本个数,一般为n/4,k为解释变量个数
(3)怀特检验
建立方程后,在菜单中点击view/residual test/white heteroskedasticity
(4)帕克检验
帕克检验是通过残差序列对解释变量的辅助回归模型,判断随机误差项的方差与解释变量之间是否存在着较强的相关关系。这种方法的好处是,不仅能检验异方差性,而且可以探测异方差的具体形式。
帕克检验的基本形式为:

或

——————————————模板————————————
Ls 被解释变量 C 解释变量
Genr lne2=log(resid^2)
Genr ln解释变量=log(解释变量)
Ls lne2 c ln解释变量
——————————————模板————————————
第一个Genr语句是产生新变量lne2= log(resid^2)
第二个Genr语句是产生新变量ln解释变量=log(解释变量)
最后一个ls语句是建立辅助回归模型,看是否显著,如果显著,则不但能说明存在异方差性,而且还能知道异方差的形式。
2. 异方差的校正—加权最小二乘法
——————————————模板————————————
Ls (w=权数变量) 被解释变量 c 解释变量
——————————————模板————————————
比如,如果方程ls y c x1 x2中,发现残差的平方与x2之间存在递增的异方差,则可以用x2作为解析权重进行加权最小二乘估计:
Ls (w=1/x2) y c x1 x2
via:数说工作室


雷达卡



京公网安备 11010802022788号







