中国社会科学院世界经济与政治研究所徐奇渊发表的研究报告《统计数据和主观感受:CPI是风动还是帆动?》(以下简称《帆动》),从CPI基期、CPI结构以及居民阶层三个方面很好地解释了主观感受和统计数据不一致的原因,但媒体更为热炒的却是“CPI大约被系统的低估了7%”的推断。7%的低估,好比你原来花100块钱过生活,现在维持同样水平的生活却要花110块钱,而统计局却告诉你物价上涨了3%而不是10%。事实果真如此吗?
1.应该如何解释估计结果?
《帆动》一文所用的估计方程为:CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8 ,对得到的常数项估计值-7.53,该文中做了如下解释:“有一部分变化值(-7.53)是无法用8个分项指数及其权重解释的……因此,-7.53 可以被视为人为调整的痕迹”。但仔细观察回归结果,可以发现系数估计值加起来,其和等于108%而不是加权平均意义上的100%。显然“b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8”因权数估计问题,从而大于CPI,必然就有一个负的常数项与差额进行抵消。所以,这个常数项并非通常计量模型中“没有被包含在解释变量中的其他因素”,更不能被说成是“人为调整”,而是由于所用样本数据和估计模型产生了一个与CPI设计原理相违背的结果,至于为什么产生这种结果,下面将会进一步进行论证。
此外还要提一下,在《帆动》一文之前,很多学者都曾利用这种回归方法估计过CPI权重,但在估计中会设定回归系数之和等于1,如2008年贺力平、樊纲等曾在《经济研究》上发表的文章。用此方法,常数项会降到一个接近于0的水平,但这种做法并不好,相当于首先肯定了数据是正确的、会得到一组合理的权重。
2.回归系数异常的原因分析
按照CPI常规的编制程序,回归结果应该是和分类指数及权重相一致的。下面我们就来看看,回归系数之和超过100%,到底是模型还是数据的责任?为保持和《帆动》一致,我们同样用2006年1月-2010年5月的数据进行测试。
第一步:模型的可靠性测试
假设权数是不变,我们就可以利用实际公布的8大分类指数,根据2001年基期的CPI分类权重,可以计算出一个固定权数的CPI(这个CPI和实际公布的CPI并不相等),将固定权数CPI做为被解释变量进行回归,估计出的系数和实际赋予的权重会完全一致,常数项为0。
由此可以判断,在权数固定不变的情况下,计量模型的检验是科学的。之所以出现估计系数之和偏离100%这种违背原理的现象,有两种可能:(1)数据本身有问题;(2)CPI权数是变动的(权数的每年调整是制度规定的,如果确实是严格按照城乡居民消费支出资料计算的,就不能被视为带有贬义的人为调整;但这个权数的调整是不是这样呢,我们无法论证)。对于(1),我们无法从宏观层面检验真伪,只能依靠统计局内部的数据质量控制和评估体系;但对于(2),则完全可以通过模拟测算得到一个确定的答案。
第二步:逐年改变CPI分类权重,对回归系数影响的测试
根据国家统计局统计制度CPI“每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数。”基于此,笔者假设2006年权重和2001年权重相同,其后每年进行微调(表2),再利用这些不固定的权重和分类指数计算各月的CPI。注意:得到的非固定权重的CPI是严格按照加权平均计算出来。
不出意外。这次的回归结果(表1)和《帆动》的回归结果具有极强的相似性,即回归系数之和超过100%(106%),并出现了显著的负值(-6.9),显然,将负值解释为“人为调整”的做法是站不住脚的,负值的产生,是由于用不变系数的模型去估计变系数的事实所导致的。因此,我们只能说,《帆动》一文的计量模型估计并不适用于CPI变动权数的估计,对CPI权数进行这样的估计从一开始就是违背计量模型原理的,因此,《帆动》一文中CPI被人为低估7%的结论当然也就是错误的。
当然,我们也无法证明统计局的CPI数据完全是客观真实没有经过任何调整的。我们只能说,在目前分类权数每年调整且不公布分类权数的情况下,CPI权重是不可能依据计量模型进行估测的,更不能依据计量模型做出低估多少的判断。