很早期的一篇小小论文,但是我发现很多图片粘贴不上,完整版的见附件
关于人均收入对地方财政的弹性的计量分析[1]
北京大学 王伟
2008年12月
摘要:笔者通过一般的回归弹性模型表明,中国地方的财政对于地方人均收入增长的弹性偏小,存在着地方财政收入与民争利的现象。笔者通过进一步的工具变量的回归模型发现中国的预算外收入的增长成为中国地方财政不良扩张的主要原因,地方财政在经济基础建设上效率及其低下,存在资金浪费和转移的现象。最后,笔者通过交互项回归模型的分析得出,中国预算外资金总体是效率低下阻碍国民平均收入的提高的,但是在中国的广大中部和西部地区,由于某些特殊的机制,预算外资金却是人均收入增长的源泉。
关键词:人均收入 地方财政 工具变量 计量分析 预算外资金
一、前言
一般的经济学理论认为,一国地方财政收入的增长和地方人均国民收入的增长应该是同步的,也就是说,一国的宏观税负是应该稳定的,不应该存在地方财政过于增长挤出个人收入正常增长的现象。中国出于经济发展的赶超阶段,地方财政的增长速度大于个人收入的增长速度是正常现象,但是也不能够超过一定的限度,财政的投入在资本相对的中国需要保证一定的效率才能使国民经济和公众的福利得到真正的提高。另外,在财政收入的内部,不同成分的财政收入对与财政收入的总体增长的作用也是不同的,其中预算外收入作为中国特有的财政来源对于总体财政收入的使用效率具有一些特有的作用。“财政内吃饭,财政外建设”,这句话表明了预算外资金在经济发展上的畸形作用。因此,笔者通过对2006年全国31个省市的界面数据进行分析,首先利用一般的多元回归的方法,,研究地方财政收入和居民收入之间的弹性关系,再通过工具变量的回归方式探究财政收入内部各种成分对于财政与收入弹性之间的影响,最后,笔者通过对变量交互作用的观察关注预算外资金这个特殊的收入来源对于收入增长的微妙作用。
二、一般模型[2]2.1因变量的选取因变量在文中的需要主要是反应地方财政收入的增长对于民众福利的作用。人民的福利是国家经济增长的目标,单纯的GDP的指标,并不能够反应人民真正的生活水平的状况。因此,笔者对于地方财政的效率的研究,选取2006年中国31个省市的人均年收入作为因变量,而不是人均GDP这个对于人民福利相关性不强的数据作为因变量。
2.2因变量形式的选择在本文的研究中,出于三个考虑,决定采用log(人均收入)作为因变量,而不是人均收入本身。一是,本文研究的重点是财政收入增长与人均收入增长的关系,利用对于变量取对数的弹性模型更能明确反应这种关系。二是,由于人均收入的单位是元,而财政收入的单位都是亿元,而且考虑到其它的自变量都是均值10左右的变量,为了保证回归方程的有效性和解释的便利性,因此采用对数的形式进行回归。三是,由于在回归统计中,变量服从正态分布是回归的假设前提之一,更加接近正态分布的因变量在回归的过程中能够使得统计量的效果表现得更好。从下面的四分位阶梯的正态图上看(见图1,上图是log形式,下图是没有采用log形式变换的),log(人均收入)比收入本身更加贴近正态分布的标准线,所以,出于回归假设要求的考虑,最终选择log(人均收入)作为回归模型的因变量。
图1 log(人均收入)与人均收入本身变量的四分位阶梯的正态拟合图
2.3自变量的选取本文研究的焦点是人均收入与地方财政收入的弹性关系,因此,一个重要的自变量就是全国2006年31省市的地方的财政收入。基于和因变量人均收入的同样的考虑,地方财政收入也采用log的变换形式。当然,地方财政收入对于地方人均收入的影响是双向的,这点之后的工具变量回归的部分再详细的论述。这里先建立一个简单的模型。
此外,一人的年收入除了和国家的基本建设和公共产品的投入相关外,还和自身的能力相关,因此,笔者引入了一个反应地方教育水平的自变量,就是得到高等专业教育学历及以上的人口数占当地6岁以上人口的比重(用gdrkbz6表示),来反映当地的教育水平。但是,很多人会认为,地方的教育水平和地方的财政的收入会有很强的相关性,这个模型会存在较大的完全共线性,从而影响回归的效率。但是笔者认为,中国各地的教育水平和地方的财政收入相关性并不强。主要理由有两个:一是中国的高等教育投入占地方财政比例的投入很少(全国31省市平均值约为3%[3]),主要由中央财政来对高等教育学校进行投入,二是高等教育和义务教育不同,很多高等教育的完成并不是在当地完成的。因此,用高等专业教育学历及以上的人口数占当地6岁以上人口的比重既可以反映个人收入依靠自身努力的部分,也不会造成在回归模型中和财政收入相关的完全共线性。[4]笔者还将各地女性比上男性的人口比值作为性别的因素加入了模型。
为了观察中东西部的差别,这里引入了虚拟变量,观察东中西部人均收入是否存在显著的差异。在本文的第四章,还重点研究了中东西部地区作为虚拟变量对于预算内收入和预算外收入的交互作用。最后,笔者将本文涉及的全部回归变量的基本状况列表如下(有些自变量是在之后的工具变量回归和交互作用时使用的,这里全部列出):
图2 本文涉及的全部回归变量的描述性统计概括
Variable | N | 平均值 | 标准差. | 最小值 | 最大值 |
Lgy地方人均收入的对数(因变量) | 31 | 9.589687 | .277087 | 9.310605 | 10.30248 |
Lgshouru地方财政收入的对数 | 31 | 5.941272 | 1.100687 | 2.678278 | 7.686832 |
Gender女性比男性人口的值 | 31 | 102.5642 | 3.400486 | 94.92 | 109.93 |
gdrkbz6高等学历对6岁以上人口比值 | 31 | .0722757 | .0559759 | .0105887 | .293558 |
Lgyswsr预算外收入的对数 | 31 | 4.734685 | 1.214887 | 1.068153 | 6.749896 |
Lgjbjs 基本建设产值的对数 | 31 | 4.348573 | .5924055 | 2.932302 | 5.980363 |
Lgzy转移支付费用的对数 | 31 | 7.975888 | .3357074 | 7.406523 | 8.803907 |
Xzrs行政人员人数 | 31 | 40.82474 | 24.39277 | 6.9215 | 100.1323 |
Place中东西部地区(后面为两个虚拟变量和四个交互项) | 31 | 1.967742 | .8360172 | 1 | 3 |
_Iplace_2中部地区 | 31 | .3225806 | .475191 | 0 | 1 |
_Iplace_3西部地区 | 31 | .3225806 | .475191 | 0 | 1 |
_IplaXlgsh~2中部交互财政收入 | 31 | 1.95921 | 2.891584 | 0 | 6.520872 |
_IplaXlgsh~3西部交互财政收入 | 31 | 1.622832 | 2.475002 | 0 | 6.4095 |
_IplaXlgys~2中部交互预算外收入 | 31 | 1.608136 | 2.378004 | 0 | 5.533113 |
_IplaXlgys~3西部交互预算外收入 | 31 | 1.23275 | 1.964685 | 0 | 5.446867 |
从上面表格可以看出,自变量数据本身不存在异常值现象,也就是说,它符合回归的条件,拥有四阶矩。
2.4一般回归模型及报告基于以上的考虑,笔者初步将2006年各省的人均收入的对数(lgy)对地方财政收入的对数(lgshouru)、男比女性别比率(gender)、高等学历对6岁以上人口比重(gdrkbz6)、以及中东西地区的虚拟变量(_Iplace_2为中部地区,_Iplace_3为西部地区)做初步的多元线性回归,为了防止异方差情况的出现影响回归效率,笔者采取了假设同方差分布的稳健方法(三明治估计,Huber、White等人)进行多元回归。结果如下:
图3 一般回归模型回归报告
Linear regression | Number of | = 31 | |
F( 5, 25) | = 33.74 | ||
Prob > F | = 0.0000 | ||
R-squared | = 0.8482 | ||
Root MSE | = .11827 | ||
变量名 系数 | 标准误 | t | P>t |
lgshouru .0756952 | .021250 | 3.56 | 0.002 |
gender -.0160463 | .005444 | -2.95 | 0.007 |
gdrkbz6 1.662683 | .41898 | 3.97 | 0.001 |
_Iplace_2 -.21465 | .058563 | -3.67 | 0.001 |
_Iplace_3 -.24126 | .069146 | -3.49 | 0.002 |
截矩 10.8126 | .593420 | 18.22 | 0.000 |
从上面回归报告看出,在异方差稳健回归的前提下,本回归F值所对应的P值为0.00,在95%的置信度下非常显著,相关系数为0.85,相关性程度很高,每个自变量的t值对应的P值都小于0.05,每个自变量在95%的置信度下的作用都是显著的。本文的后面会对回归的各种假设条件和稳健性进行诊断和检验,这里,先对回归的基本现实意义进行解释。
从回归的结果可以看出:
a中国地方财政收入每增长百分之一,人均收入才增长0.07%!!,他们的弹性才0.07,可见中国的地方财政收入和民众的收入存在着严重的冲突,地方财政收入增长的7%才用来使得人均收入的增长,地方财政利用效率低下,而且表明中国目前的宏观的财政负担较重,财政很大程度不是来提高人民的生活水平,而是出现了滥用、腐败、形象工程的大型建设上,而并没有落实于人民的福利。
b笔者还可以看出,获得高等教育学历的人口比例每提高百分之一,人均收入水平会提高1.66%,可见,教育水平的弹性是大于1的,也就是说,人口的教育水平的提高将更大程度提高人均的收入水平,因此,地方财政应该加大高等教育的投入,而不是将93%的财政投入到与人均收入增长都无关的事情上,更加可悲的是,如果此回归模型真的能够反应现实,那么甚至说现在人们的教育水平和地方的财政的规模甚至是不相关的[5],至少不是线性相关的,可见,目前的地方财政的收入是严重缺乏效率的。
C而且,从性别上看,男性的比例每增加百分之一,人均收入就会降低1.6%,反映出中国目前的性别的人口结构是不合理的。由于中国民间本来就长期存在重男轻女的思想,而计划生育政策加剧了只生一个男孩的状况,配上计划生育的政策监管不力,造成中国人口比例失调,男性的比例过大已经对社会经济层面造成了影响。
d最后,从中东西部的虚拟变量的系数来看,它们也是显著的,中部地区的人均收入的平均水平比东部地区低21%左右,而西部地区的人均收入要比东部地区平均低24%,充分体现了目前中东西部地区的经济发展的差别。在文章的最后,笔者会对中东西部不同地区与预算内和预算外收入的交互效应进行分析,得出更进一步的结论。
总体上看,从这个回归的初步分析中笔者可以得出,中国地方财政收入和人们人均收入的弹性仅仅为0.07,财政收入的增长并不能带来人民收入的提高,中国地方财政收入的使用效率过于低下。提高国民的教育水平确实可以带来良好的效果,国家应该加大高等教育的投入,中国的人口性别比例已经开始影响了经济的正常发展,中东西部地区存在着较大的收入差异,具体差异的机制在后文阐述。
三、一般回归模型的诊断3.1遗漏变量检验笔者的初步回归是一个线性的多元回归,因此要对模型的设定进行检验。遗漏变量检验(omitted variables test)本质是y对x变量以及y的预测值(标准化以后)的二次幂、三次幂和四次幂进行回归,然后对于三个关于y的幂的系数等于零的原假设进行F检验,如果笔者拒绝这个假设,那么则证明需要进一步纳入多项式来改进笔者目前的模型。当然笔者对于ovtest检验进行两次,一次是对于y和x取2-4次幂进行检验,第二次是只对右侧x的2-4次幂进行检验,因为后者是更加能够体现出模型遗漏高次变量的检验。
Ovtest检验结果如下:
. ovtest(对于y)
Ramsey RESET test using powers of the fitted values of lgy
Ho: model has no omitted variables
F(3, 22) = 1.59
Prob > F = 0.2196
. ovtest,rhs(对于x)
Ramsey RESET test using powers of the independent variables
Ho: model has no omitted variables
F(9, 16) = 0.94
Prob > F = 0.5203
可见,两次ovtest检验的p值都远远大于0.05,也就是说,在95%的置信度上,笔者不能拒绝模型不存在遗漏变量的假设。模型设定从这个角度上看,不存在错误的设定。
3.2异方差检验
正如前文所述,笔者是采用假设同方差分布的稳健方法(三明治估计,Huber、White等人)进行多元回归的,因此,避免了异方差造成的影响。这里只是试图观察一下,如果不采用异方差稳健的方法是否存在异方差的问题。
笔者采用COOK和Weisberg的异方差检验方法检验如果不采用稳健回归方法的条件下原模型是否存在异方差。
在重新进行一次非方差稳健的回归分析之后,C-w的检验结果如下:
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of lgy
chi2(1) = 5.46
Prob > chi2 = 0.0195
P值0.02,在0.01-0.05之间,如果在95%的置信度下,笔者可以拒绝同方差假设,那么笔者进行的稳健方法回归是必要的,如果在99%的置信度下,笔者不能拒绝同方差假设,那么,笔者的模型实际取得效果更加好。总体上看,笔者的模型还是应该进行方法稳健的方式的回归。
3.3 多重共线性检验3.3.1 皮尔逊积矩相关检验
首先,模型是不存在完全共线性的,因为,如果存在完全共线性,是不可能计算出自变量的系数的值的,笔者在这里研究的,就是模型是否存在很严重的多重共线性,即自变量之间是否高度地相关。
从直观上,一般出现多重共线性的症状是标准误变得很大,单变量的t值较小,相关系数很高的同时回归系数却不显著,从笔者的回归报告看,每个自变量都是高度显著的,因此,似乎从直观上不存在高度的多重共线性的现象,即自变量的相关性应该不是很强,回归是有效率的。
笔者采用皮尔逊积矩相关(Pearson product moment correlation)的方法,观察自变量之间两两的相关性,并且在0.05的显著性水平下进行Bonferroni和Sidak的检验调整。两两相关的系数和显著性如下:
图4 一般模型变量间相关性的皮尔逊积矩相关及检验
变量名 | place | gender | lgshouru | gdrkbz6 |
place | 1.0000 |
|
|
|
gender | 0.1495 | 1.0000 |
|
|
P值 | 0.9627 |
|
|
|
lgshouru | -0.6117 | -0.1595 | 1.0000 |
|
P值 | 0.0915 | 0.9492 |
|
|
gdrkbz6 | -0.4496 | -0.4678 | 0.3811 | 1.000 |
P值 | 0.0652 | 0.0468 | 0.1896 |
|
从检验的结果看(图4),除了性别比例与高等教育人口比例这两个变量的p值为0.0468稍微小于0.05外,其它任何两个自变量的相关性都是不显著的(95%置信水平下),因此,可以这样认为这么模型中基本不存在严重的多重共线性。下面用两两变量的散点图将自变量之间的相关性表达的更加直观,从图5的两两自变量的散点图也可以看出,自变量之间的线性相关性不是很强,不存杂严重的多重共线性。
图5 一般模型下自变量两两之间线性相关性的散点图
3.3.2方差膨胀因子检验
进而,笔者利用方差膨胀因子的(variance inflation factor)方法来检验多重共线性问题。方差膨胀因子的倒数【1/VIF】反应的是某个x自变量的方差独立于所有其它自变量的比例,如果比例过于小(小于0.1),那么一般会存在变量之间高度相关的问题。Chatterjee、Hadi和Price(2000)建议最大的VIF大于10,并且平均值严重大于1即表明模型存在多重共线性的问题。笔者方差膨胀因子的检验结果如下:
图6 方差膨胀因子检验结果
Variable | VIF | 1/VIF |
_Iplace_3 | 2.28 | 0.438804 |
lgshouru | 1.68 | 0.594783 |
gdrkbz6 | 1.66 | 0.601923 |
_Iplace_2 | 1.60 | 0.626513 |
gender | 1.29 | 0.774551 |
Mean VIF | 1.70 |
|
从方差膨胀因子结果看,(图6),1/VIF的值都在45%以上,一般在65%左右,也就是说一半以上的方差是独立于其它变量的,而且VIF的最大值仅为2.2,非常显著小于10,平均为1.7,也没有显著超过1,因此,笔者的模型不存在严重的多重共线性,可以很好的保证回归中统计量的效率。
3.3.3关于共线性检验的一点现实思考
从回归的有效性看,自变量之间相关性较差使得回归的有效性更加强大对于研究者是好的。但是,这对于中国的经济发展的现实却是可悲的。教育、人口的调控、中东西部的协调都是经济发展调控的基本内容,地方财政收入与这些因素的效率却是全然不相关的。那么地方财政一年复一年的巨额使用并没有给社会带来福利,并没有真正发挥其作用。一些本应促进人均收入的重要的因素地方的财政收入却没有发挥应有的作用。因此,笔者更加希望回归模型的自变量是相关的,那样,地方的财政更加能够发挥促进经济发展提高人们生活水平的作用。
3.4残差分析,特异值与稳健回归在多元回归中,OLS解比其它任何无偏估计都更有效率的前提就是误差是符合正太、独立同分布(i.i.d)。如果不符合,那么也许有其它的无偏估计比OLS做的更好。比如在存在y上较大的特异值,或者x存在较强的杠杆作用时,使用迭代再加权最小二乘法(IRLS)比OLS在对于回归的系数上更加具有效率。因此,在本文的模型中,笔者先分析模型中残差的分布以及y的特异值和x上杠杆作用(x上的特异值)的程度,最后笔者利用IRLS方法重新对回归模型进行估计,观察在进行抵抗特异值之后的回归后,各个模型因素对于人均收入影响的变化。
3.4.1残差分布正态性检验
图7 残差对于回归预测值的标绘图
首先,笔者观察了残差对于回归预测值的标绘图(如图7)。可以看出,本模型的残差(纵坐标)还是围绕在0周围按照对称地距离分布的。也就是说,本模型的残差分布与正态的误差假定相一致,并不存在明显的特异值或曲线关系。
从这个残差对于回归预测值的标绘图也可以看出,在残差正态分布的两个尾端是浙江省和辽宁省。浙江省在正方向的尾端,说明浙江省在财政收入对于人均收入 增长的利用上要远远好于全国,尤其是好于东部地区的水平。而辽宁省处在正态分布负方向的尾端,也就说辽宁省虽然属于东部地区,实际上其省财政收入对于人均收入的增长的贡献远远落后于其它东部发达地区,仅仅是因为地理原因划界到了东部地区。另外,东部省份的上海和江苏也较其他东部省份财政收入效率更好,山东省在相对在东部同水平财政效率较差。
另外,在多元回归中,尽管在自变量x本身的取值并没有什么异常,但是在数个x自变量上具有异常取值组合的一个观测案例可能具有很强的杠杆作用,可能对回归造成影响。这种影响可以通过残差的附加变量的标绘图进行观测。其表现就是观测案例在标绘图的每一个自变量的分析中都表现出在水平方向上远离其它数据的点。显然,如图8所示,本模型并不存在那样的点,也就说本模型并不存在具有强大杠杆效应的案例。
图8 一般模型的附加变量的标绘图
3.4.2 残差具体的特异值分析
笔者前文表明,本模型残差分布满足误差的正态性假定。实际上,上文进行了两个方向的残差的特异值分析。一个是在y(预测值)的方向上存在的特异值,它实际反应的是模型对于y(因变量)的拟合程度。一个是在x方向上存在的特异值(即杠杆效应),它实际反应的是一个或少些个的案例观测对于整个回归施加的影响,是否仅仅因为几个高杠杆效应的观测支配了整个模型的走向。笔者利用残差平方标绘图(如图9)来同时观测这两种作用,横坐标方向表示的杠杆作用对于残差的影响,而纵坐标则表示y(预测值)的特异值的影响。如下图:
图10 一般回归模型的残差平方标绘图
通过残差平方标绘图看出,本模型并不存在同时在y和x两个方向具有重大的影响的观测(即完全同时远离两条红线的观测)。海南、北京和西藏虽然在y的方向上的拟合性稍差,但是在x方向上却没有强的杠杆作用,并不影响整体回归的走势。辽宁和浙江省虽然在x方向上具有较大的杠杆作用,但是在y方向模型整体对它们的拟合程度却非常好,并没有和整体回归的趋势相左。而且,绝大部分观测都密密麻麻地分布在x和y的特异值作用都极其弱的红色小格子中,证明,这个模型在残差正态性分布以及特异值的控制上,是非常成功的,没有实质影响OLS估计方法的效率。
3.4.3 IRLS估计方法的结果
前文通过检验表明模型并不违法误差的独立正态同分布的假定,也不存在重大的特异值的观测,但是笔者出于比较研究和回归的稳健性需要,还是用迭代再加权最小二乘法(IRLS)对模型重新进行了一次回归估计。一般而言,IRLS方法在存在不满足误差正态性假定的时候对于回归系数的估计比OLS方法更加高效和接近无偏,但是对于截矩的估计风险较大,和OLS估计的结果要有所权衡。在本文的回归模型中,OLS和IRLS的估计方法差别极小,【如图11】只是地方财政收入的弹性值变得更加小,为0.05。如果RLS在这个模型对于回归系数的估计更加无偏的话,那么中国地方财政收入对于人均收入的贡献就愈发显得渺小。
图11 IRLS估计方法的回归模型结果[6]
Robust regression | Number of obs | = 31 |
| ||
IRLS | F( 5, 25) | = 27.01 |
| ||
Prob > F | = 0.000 |
| |||
自变量 系数. | 标准误 | t | P>t | [95% 置信区间] | |
lgshouru .059948 | .0242873 | 2.47 | 0.021 | .0099273 | .1099687 |
gender -.01619 | .006889 | -2.35 | 0.027 | -.0303812 | -.0020048 |
gdrkbz6 1.78936 | .4747354 | 3.77 | 0.001 | .8116238 | 2.767095 |
_Iplace_2 -.1816 | .0548138 | -3.31 | 0.003 | -.2945198 | -.0687377 |
_Iplace_3 -.2212 | .0654967 | -3.38 | 0.002 | -.3561384 | -.0863525 |
_cons 10.883 | .7453502 | 14.60 | 0.000 | 9.348155 | 12.41831 |
四、工具变量回归的模型(IV回归)4.1采用工具变量回归的原因
基于两个原因,笔者认为本文的核心模型是加入工具变量的IV回归模型,
首先,也是最根本最重要的原因。地方财政收入对人均收入的影响是双向的。一方面,地方财政收入的增长使得地方ZF能够更好地为地方提供公共产品和公共服务,因此对于民众收入的提高具有正向的影响。另一方面,ZF的收入来源只要是税收和各种行政性收费,地方财政过于膨胀很可疑也是对于民众人均收入水平挤出的结果。因此,地方财政收入作为一个自变量是存在问题的,它很可能与误差项相关[7]。因此,笔者需要寻找一些和地方财政收入密切相关而且与误差项(人均收入)无关的工具变量生成符合模型要求的地方财政收入的预测值(第一阶段回归),从而利用地方财政收入这个内生变量的预测值进行最初模型设定的回归(第二阶段回归)。从而对于地方财政收入对人均收入的弹性有更加有效的估计。
第二,地方财政收入内部是复杂的。各种性质的收入(如行政性经费、预算外收入等)对于财政收入政体的增长的作用是不同的。为了充分研究预算外收入、行政性收入、建设性财政支出对于财政增长的不同作用,笔者引入iv回归,而这些作用在IV回归的第一阶段回归中得到了体现。
4.2工具变量回归及报告4.2.1 工具变量的选择
根据IV回归对工具变量的相关性(与原自变量)和外生性(与误差项无关)的要求,以及笔者自身研究的需要,将预算外收入的对数(lgyswsr)、行政人员的人数(xzrs)、转移支付的对数(lgzyzf)以及基本建设的产值的对数(lgjbjs)作为估计地方财政收入对数的工具变量。这四个变量既和地方的财政收入密切相关,又对人均收入没有很强的直接相关性[8],而且还能够充分反应不同的财政成分对于财政增长以及经济增长的作用。具体三个变量的基本描述性统计的信息见文章的第一章的图1,这里不再赘述。
4.2.2 IV回归报告
图12 工具变量回归报告
First-stage regressions(第一步回归) |
| ||||
Number of obs= 31 |
| ||||
F( 8, 22)= 73.51 |
| ||||
Prob > F= 0.0000 |
| ||||
R-squared= 0.9639 |
| ||||
Adj R-square= 0.9508 |
| ||||
Root MSE= .24408 |
| ||||
自变量 系数 标准误 t值 | P>t | ||||
gender .0237154 .0166967 1.42 | 0.170 | ||||
gdrkbz6 4.398333 1.297459 3.39 | 0.003 | ||||
_Iplace_2 -.0373941 .1243877 -0.30 | 0.767 | ||||
_Iplace_3 -.1347139 .1468971 -0.92 | 0.369 | ||||
lgjbjs .3061743 .110482 2.77 | 0.011 | ||||
lgzy .2539428 .2602519 0.98 | 0.340 | ||||
xzrs .0070102 .0034008 2.06 | 0.051 | ||||
lgyswsr .5833646 .0745377 7.83 | 0.000 | ||||
_cons -3.158535 2.988848 -1.06 | 0.302 | ||||
Instrumental variables (2SLS) regression(第二步回归) |
| ||||
Number of obs= 31 |
| ||||
F( 5, 25)= 27.79 |
| ||||
Prob > F= 0.0000 |
| ||||
R-squared= 0.8482 |
| ||||
Adj R-squared= 0.8178 |
| ||||
Root MSE= .11827 |
| ||||
自变量 系数 标准误 t值 | P>t |
| |||
lgshouru .0748571 .0262459 2.85 | 0.009 |
| |||
gender -.0160531 .0072155 -2.22 | 0.035 |
| |||
gdrkbz6 1.665168 .4975942 3.35 | 0.003 |
| |||
_Iplace_2 -.2149951 .0574716 -3.74 | 0.001 |
| |||
_Iplace_3 -.2424695 .0692206 -3.50 | 0.002 |
| |||
_cons 10.81863 .782027 13.83 | 0.000 |
| |||
| |||||
4.2.3工具变量回归的假设前提的检验
在对回归结果进行任何解释前,需要检验模型是否符合工具变量回归的假设前提。工具变量的回归实质需要六个假设前提:条件期望零值、联合的独立同分布、所有自变量和u的有限四阶矩、以及外生变量不存在多重共线性,工具变量对x要具有相关性,工具变量是外生性的(与误差项不相关)。其中,前四个假设前提已经在之前一般模型的诊断中检验完毕,符合要求,这里需要进行的只是工具变量的相关性和外生性的检验。
一个工具变量与原自变量的相关性越高,生成的其估计量就越准确,在IV回归中获得的有效信息就越多,如果工具变量对于X没有什么解释力,就叫做弱工具变量。衡量工具变量是否满足相关性的高度要求,是否不是弱工具变量就是IV回归中第一步回归的F值,如果F值大于10,那么就满足相关性要求,工具回归的估计量就是无偏的。从图12 的回归报告看到,本IV回归的第一步回归的F值高达73.51远远超过相关性的要求。
工具变量的外生性实质是IV回归的必然要求。IV回归的本意就是去分离原来问题自变量和误差相关的部分,如果工具变量和误差项相关,实际这个IV回归是没有任何意义的。为了检验工具变量的外生性,经常采用的是过度识别的约束检验(J统计量,大样本服从卡方分布),该检验的原假设就是工具变量是外生的。检验结果如下:
Tests of over identifying restrictions:
Sargan N*R-sq test 5.756 Chi-sq(3) P-value = 0.1801
Basmann test 5.130 Chi-sq(3) P-value = 0.2054
结果表明,两种检验p值都大于0.05,因此在95%的置信度下不能拒绝原假设
综上,本文的IV回归模型不违反工具变量的相关性和外生性的假设前提,其估计量是无偏的。
4.3 IV回归结论的现实解释从二次回归的结果上看,地方财政收入对人均收入的弹性的估计本身并没有发生很大变化,只是显著程度提高了,这很好地证明了本文第二章一般模型的有关结论。但是,IV回归的第一次回归,给笔者对于中国地方财政问题很多有益的解释。
首先,预算外收入对于地方财政收入的弹性的是正的0.6,而且这个变量是显著的。也就是说地方的预算外收入每增长百分之一,地方的财政收入增长0.6%。反应了预算外收入成为了地方财政收入增长来源的主要部分。地方财政收入的增长不是依靠正规的税收等为主,而是以预算外的土地财政、行政乱收费为主,可见,地方财政收入的增加不是以民众收入的增加为前提的,而是以与民争利为前提的,因此,地方财政收入的增长来源非可持续,过于依赖预算外收入。
其次,基本建设产值每增长0.3%,地方的财政就要增长百分之一。地方财政主要收入的目的就是投入基础设施建设,但是投入基础设施建设的效率极其低下。投入1元钱才得到3角钱的回报,存在很大的资金流失和浪费的空间。建设的资金随意挪用,腐败、寻租现象难以杜绝。此外,行政人数以及转移支付等因素也和地方财政收入呈正相关,但是并不显著,也一定程度说明了行政机构冗员的问题。
五、交互项回归及报告为了具体观察预算内收入和预算外收入对于人均收入增长的不同作用以及在中东西部地区的差别,笔者将中东西部地区作为虚拟变量并且分别和地方财政收入的对数和预算外收入的对数做交叉项做多元回归模型。为防止异方差情况的出现,采用同反差假设稳健的方法进行回归,模型的回归结果如下:
图13 交互项回归报告
Robust regression | N | = 31 |
| ||
F( 8, 22) | = 103.91 |
| |||
Prob > F | = 0.0000 |
| |||
lgy 系数 | 标准误 | t | P>t | [95% 置信区间 | |
lgshouru .5712423 | .0309698 | 18.45 | 0.000 | .5070149 | .6354697 |
lgyswsr -.3519135 | .0257544 | -13.66 | 0.000 | -.4053248 | -.2985022 |
_Iplace_3 -1.235729 | .1716059 | -7.20 | 0.000 | .8798396 | 1.591617 |
_IplaXlgsh~2 -.5667062 | .0832673 | -6.81 | 0.000 | -.7393919 | -.3940205 |
_IplaXlgsh~3 -.476949 | .0686021 | -6.95 | 0.000 | -.6192211 | -.3346769 |
_Iplace_2 -1.493508 | .3386997 | -4.41 | 0.000 | .7910881 | 2.195928 |
_IplaXlgys~2 .3641107 | .0711506 | 5.12 | 0.000 | .2165533 | .511668 |
_IplaXlgys~3 .2847086 | .0583144 | 4.88 | 0.000 | .1637719 | .4056453 |
_cons 7.913414 | .1184455 | 66.81 | 0.000 | 7.667773 | 8.159055 |
从上面回归报告看出,在异方差稳健回归的前提下,本回归F值所对应的P值为0.00,在95%的置信度下非常显著,相关系数为0.85,相关性程度很高,每个自变量的t值对应的P值都小于0.05,每个自变量在95%的置信度下的作用都是显著的。[9]
通过这个新的交互模型我们发现很多更加有意义的现象。
首先,预算外收入对于地方人均收入的增长的弹性是负值。即地方预算外收入的增长对于地方人均收入的增长总体上看有害无益,应当将预算外收入逐步内部化。但是,如果我们真的这么做,我们就犯了错误。因为从交互项的回归系数可以看到,虽然总体上预算外资金对于国民收入的增长是负作用的,但是预算外资金与中部地区的交互项、预算外资金与西部地区的交互项却是正数。也就是说,预算外收入对于西部和中部地区的经济建设是起到积极作用的,甚至比正规的财政收入的作用还要好。(财政收入与中部地区和西部地区的交互项是负的)“财政内吃饭,财政外建设”这句话的反应不是没有道理的。它是目前中国广大西部和中部地区的真实写照。目前的中国中部和西部省份,预算内财政难以满足自身的行政、教育等等部门的需要。既要提供公共服务和社会保障,又要安置冗余的行政人员,加之腐败、寻租横行,财政内部的预算根本没有空间真正为基础建设和经济发展服务,严重依赖国家的转移支付;反而,正是征收灵活、运用便利、来源广泛的预算外收入可以用来进行经济建设。虽然预算外资金存在与民争利的因素,但是相对于中部西部稀缺的资金而言,投资的回报率还是较高的,因此,总体上看,中国广大的东部地区的预算外资金已经成为了地方财政低效的症结,但是,在中国西部和中部地区,预算外资金成为了投资基础建设、发展经济、活跃市场的重要的稀缺资金,对于目前中西部的建设还是起到了良好的作用。因此,在财政机制的改革上,要避免一刀切,在中西部的预算外资金的问题上应当先暂时保留预算外的体制,积极解决中西部建设资金的困难和行政人员冗余的现状,在中西部地区地方财政各种自己到位之后,稳定之后,再逐步取缔预算外的体制,实现财政体制的健康良性的循环。
六、全文结论笔者通过一般的回归弹性模型表明,中国地方的财政对于地方人均收入增长的弹性偏小,已经开始制约了地方人均收入的增长,存在着地方财政收入与民争利的现象,而且地方财政在一些诸如教育、人口控制事关地方经济发展的项目上缺乏对资金的注入。笔者通过进一步的工具变量的回归模型进一步验证了上述的结论,并且发现中国的预算外收入的增长成为中国地方财政不良扩张的主要原因,地方财政在经济基础建设上效率及其低下,存在资金浪费和转移的现象。最后,笔者通过交互项回归模型的分析得出,中国预算外资金总体是效率低下阻碍国民平均收入的提高的,但是在中国的广大中部和西部地区,由于某些特殊的机制,预算外资金却是人均收入增长的源泉,因此,建议不要一概全国性取消预算外资金的体制,对中西部地区做好政策的过渡工作,使得中西部地区的经济得到持续有效的资金来源。
七、参考书目1.上海财经大学公共政策研究中心,《2006中国财政发展报告》,上海财经大学出版社,上海,2006年第一版
2.林毅夫,刘志强 ,《中国的财政分权与经济增长》,北京大学中国经济研究中心讨论稿系列,NO.C2000008,2000年6月
3.平新乔,白洁,《中国财政分权与地方公共品的供给》,北京大学中国经济研究中心讨论稿系列,NO.C2005006,2005年8月
4.平新乔,《中国地方财政体制的绩效评估及指标设计》, 北京大学中国经济研究中心讨论稿系列,NO.C2006018,2006年10月
5.平新乔,《财政蛋糕的三种不同做法》,《南方周末》,2006年10月20日
6.齐云鹤,《预算外资金支出管理分析》,《财政问题研究》,第2 期(总第219 期),
2002 年2 月
[1]本文使用所有数据综合来源于:《中国统计年鉴2007》、《中国统计年鉴2006》、《中国财政年鉴2007》,以下不再一一注释数据来源。
[2] 本文所有数据分析采用Stata软件进行
[3] 数据来源:《中国统计年鉴2007》
[4] 后面有回归检验证明确实不存在多重共线性
[5] 基于回归模型的不能存在完全共线性的假设
[6] 本回归显然如表所示p值小于0.05,是在95%置信度下显著的,其它检验也符合回归条件的要求,限于篇幅,不再重新赘述。
[7] 和误差项相关并不意味一定与其它回归模型的自变量相关,这不与前文的多重共线性的检验结果相矛盾。实际上,工具变量恰恰解决的就是和其它自变量不相关但是又与误差项相关的问题自变量的情况。
[8] 外生性在后文进行检验
[9] 本交互性回归已经通过检验满足进行回归的必要假设前提条件,而且方法与基本模型相同,这里不再重复赘述


雷达卡




京公网安备 11010802022788号







