三、数据的搜集
数据均来自中国统计年鉴,真实可靠。
四、模型的初步建立
建立多元线性回归模型
Y=
参数估计
表2:初步LOS估计
Dependent Variable: Y
Method: Least Squares
用最小二乘法估计结果模型为
2761.624+0.017302X -0.011656X -17.12222X +0.451557X -18.41215X +-398.9864X -0.027337
五、模型的检验
1. 经济意义检验:
模型初步估计结果显示,居民消费水平(Y) 受国内生产总值(X1)的正向影响,且影响较为显著,符合经济意义。而参数估计结果中, 城镇居民家庭人均可支配收入(X2), 社会保障基金支出(X7)的系数估计结果为负,不符合经济意义,并且受城镇居民家庭人均可支配收入(X2)以及城镇居民家庭恩格尔系数(X3)农村居民家庭恩格尔系数(X5),基尼系数(X6),社会保障基金支出(X7)的影响不显著,可能是多重共线影响所致,因而有待进一步分析和检验.
2. 统计检验:
从估计的结果可以看出,模型的可决系数为0.999783,模型拟合情况看起来很理想,但是很可能是由于多重共线性导致。在给定显著水平α=0.05的情况下,解释变量X1和 X4的t统计量的值分别为大于t统计量的临界值,说明X1对应变量的影响是显著的.其他变量均未通过t 检验,分析可能是由于变量之间的多重共线性所致,有待进一步分析.模型F统计量的值为2636.014非常显著,说明回归方程非常显著,整体模型效果比较好。
3. 模型修正:
多重共线性检验
表3:相关系数矩阵
X1 X2 X3 X4 X5 X6 X7
X1 1.000000 0.997469 -0.832504 0.989900 -0.883748 0.946002 0.994994
X2 0.997469 1.000000 -0.856724 0.985256 -0.905086 0.961652 0.998826
X3 -0.832504 -0.856724 1.000000 -0.838603 0.983394 -0.894998 -0.868227
X4 0.989900 0.985256 -0.838603 1.000000 -0.884644 0.916717 0.980587
X5 -0.883748 -0.905086 0.983394 -0.884644 1.000000 -0.924723 -0.913231
X6 0.946002 0.961652 -0.894998 0.916717 -0.924723 1.000000 0.968024
X7 0.994994 0.998826 -0.868227 0.980587 -0.913231 0.968024 1.000000
由表3相关系数矩阵可以看出,解释变量相互之间的相关系数较高,证实解释变量之间存在多重共线性。
多重共线性模型的修正(详见电子版)
运用OLS方法分别求Y对个解释变量X1、X2、X3、X4、X5、X6、X7进行一元回归。七个方程的回归结果详见表4—表10,再结合经济意义和统计检验拟合效果最好的一元线性回归方程。
在X2,X3 ,X4的回归模型中, 显著提高,各个参数t检验显著。在X2,X3, X4的基础上加入X1 ,X5, X6,X7后, 没有显著提高,但其他参数的t检验变得不显著,甚至符号与其经济意义完全不符合。故修正后的方程不应该包括X1,X5 ,X6, X7,保留X2,X3,X4作为修正后方程的变量。
异方差检验
对修正方程进行异方差检验结果如表27
表27 White检验结果
Dependent Variable: Y
Method: Least Squares
Date: 10/15/09 Time: 16:46
Sample: 1995 2006
Included observations: 12
Variable Coefficient Std. Error t-Statistic Prob.
C 7483.602 3225.798 2.319923 0.0681
X2 0.236822 0.325923 0.726619 0.5000
X2^2 -8.67E-06 2.51E-05 -0.346026 0.7434
X3 -282.9818 159.0298 -1.779426 0.1353
X3^2 2.890116 1.834804 1.575163 0.1760
X4 0.301321 1.169852 0.257572 0.8070
X4^2 0.000187 0.000286 0.654449 0.5417
R-squared 0.999664 Mean dependent var 3932.917
Adjusted R-squared 0.999261 S.D. dependent var 1134.153
S.E. of regression 30.83171 Akaike info criterion 9.986162
Sum squared resid 4752.972 Schwarz criterion 10.26902
Log likelihood -52.91697 F-statistic 2479.952
Durbin-Watson stat 2.812212 Prob(F-statistic) 0.000000
nR = 11.995968,在95%的水平下, (6)=12.5916,nR < (12),所以接受原假设,表明模型中随机误差不存在异方差。
自相关检验
Dependent Variable: Y
Method: Least Squares
Date: 10/15/09 Time: 16:23
Sample: 1995 2006
Included observations: 12
Variable Coefficient Std. Error t-Statistic Prob.
C 846.0674 291.7700 2.899775 0.0199
X2 0.252539 0.034318 7.358875 0.0001
X4 0.807134 0.136293 5.922043 0.0004
X3 -17.36602 5.077149 -3.420427 0.0091
R-squared 0.998910 Mean dependent var 3932.917
Adjusted R-squared 0.998502 S.D. dependent var 1134.153
S.E. of regression 43.89981 Akaike info criterion 10.66290
Sum squared resid 15417.54 Schwarz criterion 10.82453
Log likelihood -59.97739 F-statistic 2444.645
Durbin-Watson stat 1.504001 Prob(F-statistic) 0.000000
由表27可知,DW=1.504001,查表得 =0.658, =1.864 ,因为 <DW< ,所以不能判断模型是否存在自相关。为了更好的提高模型的精度,我们用科克伦—奥克特迭代法对模型进行修正。
Dependent Variable: E
Method: Least Squares
Date: 10/15/09 Time: 17:40
Sample (adjusted): 1996 2006
Included observations: 11 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
E(-1) 0.179380 0.332604 0.539319 0.6015
R-squared 0.024848 Mean dependent var -2.174135
Adjusted R-squared 0.024848 S.D. dependent var 38.45520
S.E. of regression 37.97443 Akaike info criterion 10.19821
Sum squared resid 14420.57 Schwarz criterion 10.23438
Log likelihood -55.09016 Durbin-Watson stat 1.656172
由上表可得回归方程 =0.179380 ,所以 =0.179380,对原模型进行广义差分,下表为广义差分结果。
Dependent Variable: Y-0.179380*Y(-1)
Method: Least Squares
Date: 10/15/09 Time: 17:44
Sample (adjusted): 1996 2006
Included observations: 11 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 844.4809 279.0915 3.025821 0.0192
X2-0.179380*X2(-1) 0.174421 0.064922 2.686639 0.0312
X3-0.179380*X3(-1) -26.44499 8.495334 -3.112884 0.0170
X4-0.179380*X4(-1) 1.108368 0.248345 4.463009 0.0029
R-squared 0.998586 Mean dependent var 3406.836
Adjusted R-squared 0.997980 S.D. dependent var 901.7805
S.E. of regression 40.52522 Akaike info criterion 10.51701
Sum squared resid 11496.05 Schwarz criterion 10.66170
Log likelihood -53.84357 F-statistic 1648.221
Durbin-Watson stat 1.953589 Prob(F-statistic) 0.000000
从上表可得,DW=1.953589> ,说明广义差分模型中已经无自相关。同时可决系数,t,F统计量也均达到理想水平。
844.4809 + 0.174421 X2 - 26.44499 X3 + 1.108368X4
t =(3.025821) (2.686639) (-3.112884) (4.463009)
se= (279.0915) (0.064922) (8.495334) (0.248345)
=0.998586, =0.997980, F=1648.221,df=11
对方程进行经济意义解释城镇居民家庭人均可支配收入增加一千元,居民消费水平就提高174.421元,城镇居民家庭恩格尔系数增加1%,居民消费水平就减少26.44499元, 农村居民家庭人均可支配收入增加一千元, 居民消费水平就增加1188.368元.这只是理论上的解释,现实可能与解释有出入。
六、对回归方程结果的分析以及原因探讨
--------------------------------------------------------------
这是大概部分
|