楼主: fgq5910
1109 1

[财经时事] 徐奇渊:对CPI指数讨论的回顾与评述 [推广有奖]

VIP

巨擘

0%

还不是VIP/贵宾

-

威望
9
论坛币
3325480 个
通用积分
308.8275
学术水平
1035 点
热心指数
1554 点
信用等级
560 点
经验
353774 点
帖子
20314
精华
2
在线时间
4843 小时
注册时间
2009-4-15
最后登录
2021-3-5

中级学术勋章 高级热心勋章 初级信用勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
2010年12月02日 19:24:03  来源: 统计局网站 【字号 大小】【留言】【打印】【关闭】  



  摘要:2010年11月9日,笔者发布的《统计数据和主观感受:CPI是风动还是幡动?》一文,引起了各方的广泛关注和争论。其焦点集中在该文第三部分对CPI数据编制情况还原性估计的准确性上面。本文对主要争论意见进行了回顾和评述,对原文的估计方法进行了反思。这场讨论有助于研究者理解CPI编制的原理和具体细节,也将有助于推动CPI指数编制与研究的科学化。
  2010年11月9日,笔者撰写了《统计数据和主观感受:CPI是风动还是幡动?》一文,引起了各方的广泛关注,并对其内容进行了激烈的争论。焦点集中在该文第三部分对CPI数据编制情况还原性估计的准确性方面,钱军辉博士[①]、桑得博士[②]等其他多位朋友均对原文估计方法可能产生的问题进行了分析。为了把问题搞清楚,笔者与大部份争论者进行了充分的讨论,在试图理解对方批评思路的前提下,对原文的估计方法进行了反思。与此同时,笔者也对CPI编制的制度设计做了更为详实的了解,深化了在这方面的认识。现通过此文,对近期的争论做述评如下。
  一、《幡动》一文分析的简要回顾
  在每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数的情况下,CPI指数的编制与未公布权重的钉住一篮子货币做法非常相似:理论上,两者均按照分类对象进行加权计算,而且权数均为1。因此《幡动》一文,借鉴Frankeland Wei(1994)对货币钉住篮子的权重分析方法,对CPI的价格指数进行估算。当然,经过讨论,笔者发现因为汇率数据与CPI数据在频率、精确性等方面均在一些细节的差异,而这些差异将对分析结果产生不可忽视的影响,这在后文中将进行详细介绍。由于CPI指数权重存在5年一次“商品篮子”的调整问题,所以原文使用了2006年1月至2010年5月的数据进行分析,估计式为:
  其中为第i项分类价格指数,各参数的估计值对应于CPI各分项权重。在此基础上原文提出:若编制完全按照8项分类进行加权计算,则常数项应该不能被拒绝为0;而如果常数项估计值显著,且为负值,则表明CPI存在低估的可能(原文表述是“表明CPI为人为低估了”,这样表达确实不够严谨)。
  估计结果可以描述如下:(1)所有待估计参数t值均非常显著,拟合优度、DW值等都非常理想;(2)各项分类权重值均与2001年基期的参照系差异不大;(3)还存在两个问题:第一是:截距项为-7.53,第二:各项权重系数之和并不1,而是108。原文仅对截距项的含义进行了解释,并认为其来源系由于“系统性低估”。当然,原文也承认:“由于CPI编制细节尚未公开,因此相关研究(包括原文的研究)充其量也只是水中望月、镜里看花。要对CPI指数有更准确的理解,还有待于相关细节的公开和透明”。
  原文迅速引发了各方的关注和讨论,钱军辉博士、桑得博士,以及其他多位朋友均对原文估计方法可能产生的问题提供了善意的批评。下文中,我们仍将从学术探讨的角度,对原文的估计方法进行探讨和反思。

二、估计结果的准确性依赖于固定权重的假设
  有批评观点认为:“国家统计局的物价数据系经过严格蹲点调查得到的第一手数据,然后进行加权计算得到。而报告中采取回归的推导方法,试图还原历史数据,这很明显违反了统计学的基本常识”。但是,桑得博士对原文采用估计模型的可靠性进行了测试:“假设权数不变,我们利用实际公布的8大分类指数,根据2001年基期的CPI分类权重,可以计算出一个固定权数的CPI(这个CPI和实际公布的CPI并不相等),将固定权数CPI作为被解释变量进行回归,估计出的系数和实际赋予的权重会完全一致,常数项为0。”这一点是比较容易理解的,在权重完全不变的情况下,只要样本存在变异,则所有的样本点都严格落在同一条直线上,因此估计结果可以完全准确的还原权重情况。
  事实上,后文将表明,在对CPI编制方法有了完全正确理解的基础上,我们甚至使用了原文的估计式验证了CPI编制方法不存在问题。当然隐含的一个问题是,实际上8个分类权重并不是一直不变的,按国家统计局对CPI编制方法的介绍是“每年进行一次调整”的。那么,如果每年进行一次的调整是微小的,是否会对原文的估计式产生致命的影响?回答是肯定的,在下文中,我们将看到桑得博士提供了一个模拟的例子,说明了这种可能性。
  三、对钱军辉博士批评的说明[③]:
  钱博士的批评主要来自两个方面:(1)“常数项c的经济学意义是当X=0时,Y的均值(或期望),这个意义经济学家常常不感兴趣。……常数项不是误差,残差才是”。(2)“使用相同的数据,但是取基准为零,再次估计该模型。基准为零的意思是,原始数据为100,现为0,原始数据为103,现为3”。但估计结果发现:“常数项发生了显著的变化。代表可能低估程度的常数项由-7.53变为-0.11”,并由此认为原来的估计是错误的。
  这两个批评都关系到检验的零假设问题。在一个理想的情况下,CPI指数编制完全按照8类权重进行加权计算,则对应的估计式应表现为:截距项为0,各项权重之和为1。桑得博士对原文估计模型的可靠性测试,已经证明了这点是可以检验的。因此,截距项为0,各项权重之和为1,这两点均应作为零假设,而不是事先给定的条件。则此时,假如常数项不为0,虽然不是统计意义上的误差,但却是CPI编制过程所无法解释的,因此常数项数值的含义还是我们感兴趣的。这是对第一个批评的回答。
  对于第二个批评的说明:取基准为零(即所有的指数都减去100),这时的估计式和原有的估计式要等价是有个前提条件的,即“分类权重之和为1”。具体分析如下面所示:
  (1)
  (2)
  当时上述两式是等价的,即(1)表示8个同比指数加权平均等于CPI总指数;而(2)式表示8个同比通胀率加权平均等于总体通胀率。但是当 时,上述两式就不可能同时成立。此时,用(2)式来进行估计,其结果和(1)式是不等价的。
  因此,如果“分类权重之和为1”这个前提条件并不成立,则取基准为零的回归,与原文的回归得到不同的截距项是必然的。但是另一方面,“分类权重之和为1”仍然是有待检验的零假设,我们不能事先接受这个假设。所以,取基准进行回归的做法就不具有可行性。而原文采用CPI计算的定义式进行估计,则是有CPI编制制度作为依据的。
  四、与桑得博士讨论的回顾:
  如前所述,桑得博士[④]对模型的可靠性进行了测试之后发现:在权数固定不变的情况下,计量模型的检验是科学的。并由此认为:原文估计的分类权重总和偏离100%有两种可能(1)数据本身有问题;(2)CPI权数是变动的(包括制度性的变动)。然后,桑得博士使用了一个模拟测算对(2)对估计结果可能产生的影响进行了分析。她假设2006年权重和2001年权重相同,其后每年进行微调(如表1所示),再利用这些不固定的权重和分类指数计算各月的CPI(得到的非固定权重的CPI是严格按照加权平均计算出来)。
  表1:假设的分类权重调整表

表1:假设的分类权重调整表
  在此基础上,按照完全相同方式对53个月度数据进行估计,结果回归与原文的回归结果具有极强的相似性,即回归系数之和超过100%(106%),并出现了显著的负值(-6.9)。在此我们可以发现:负值的产生,是由于用不变系数的模型去估计变系数的事实所导致;而且权数的微小调整确实将导致截距的估计出现严重的问题。而基于此得出的结论是错误的。同时,桑德博士也认为:在目前分类权数每年调整且不公布分类权数的情况下,CPI权重是不可能依据计量模型进行估测的,而我们也无法验证其完全客观真实性。
  笔者对桑得博士的模拟测算结果表示认同,并认为:《幡动》一文直接根据结果做出了“人为低估”的判断不一定正确,因为无法排除模拟测算情况导致对截距项产生的影响。并且,基于桑博士对模型可靠性的测试,以及CPI编制方法的细节,我们可以根据以下三条信息进一步提出矛盾:
  命题1:在权数固定不变的情况下,计量模型的检验是科学的(基于桑得博士对估计模型的可靠性测试)
  命题2:根据CPI编制制度:“每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数”。
  命题3:CPI及其分类数据完全真实、准确。
 为了进一步对前面钱博士的批评进行解释,这里同样对所有变量取了基准期为0的处理,然后进行回归得到表3的结果。由于此时两个权重系数之和几乎为1,因此表2和表3估计得到的截距项结果也基本相同。这进一步验证了前文的说明。
  表2:全国CPI指数对城市(X1)和农村(X2)的CPI指数进行回归
  
变量 系数 标准误 t统计量 P值
X1 0.707 0.031 22.691 0.000
X2 0.293 0.033 8.884 0.000
C -0.010 0.790 -0.013 0.990
R2值 0.997 DW值 2.488330
调整的R2值 0.997 F值 8717.567
  注:样本期为2006年1月至2010年5月的53个月度同比数据。表中数据均为四舍五入值。
  表3:(全国CPI指数-100)对(城市指数X1-100)和(农村指数X2-100)进行回归
  
变量 系数 标准误 t统计量 P值
X1-100 0.707412 0.031176 22.69105 0.0000
X2-100 0.292680 0.032945 8.883895 0.0000
C -0.001172 0.005724 -0.204791 0.8386
R2值 0.997140 DW值 2.488330
调整的R2值 0.997026 F值 8717.567
  注:样本期为2006年1月至2010年5月的53个月度同比数据。表中数据均为四舍五入值。其中,被解释变量为(CPI-100)。
  六、对上述讨论的总结
  第一,《幡动》一文所使用的估计方法,在以下方面存在问题:(1)在样本期较长的情况下,权重的年度调整可能导致变系数的问题,桑得博士的模拟测试表明,微小的权重调整将导致对截距项估计产生重要影响;(2)在12个月的样本期内,虽然避免了权重的制度性调整问题,但由于在短期中解释变量变异性相当小,数据的微缺性将使估计结果表现出严重的多重共线性性,从而使估计结果对公布数据的误差异常敏感。这些原因,均对截距项的估计结果产生了不可忽视的影响,而基于此做出的推断则缺乏依据的。
  第二,采用按照“城市和农村消费支出金额”加权计算的方法,对全国CPI,城市CPI和农村CPI进行回归估计,得到了非常理想的结果。该估计结果表明:常数项为0和分类权重之和为1的假设均不能被拒绝;而且,分类权重应该是相当稳定的。这一估计结果验证了全国CPI数据确系基于城市和农村CPI的准确计算得到。
  第三,原文的分析起到了抛砖引玉的作用,引起了这方面的一些争论,不过有关讨论还有待进一步深化。而本次讨论的最重要意义,还在于推动统计制度的规范化、透明化,从而增强统计数据的“真实可信”性。
  (作者单位:中国社会科学院世界经济与政治研究所国际金融研究中心)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CPI 徐奇渊 中国社会科学院 世界经济与政治 frankel 讨论 指数 评述 CPI 徐奇渊

沙发
大可水米 发表于 2010-12-3 00:47:30 |只看作者 |坛友微信交流群
为CPI的争论画上句号,还需要很多个逗号

要真正给CPI的争论画上个“句号”,恐怕还需要给出很多“逗号”,来揭示过程的透明程度,比如公布CPI权重设定、调整的具体数据。否则,一个接一个的叹号也是难以避免的。当然,也有很多人愿意选择做一个省略号……

完全的相信,有两个极端:一种是出于完全的不了解,比如相信鬼神;另一种是出于完全的了解,比如你的好朋友。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-10-7 00:56