楼主: addreamer
4101 22

我也说一下,CPI被低估了吗? [推广有奖]

  • 1关注
  • 4粉丝

已卖:53份资源

副教授

73%

还不是VIP/贵宾

-

威望
0
论坛币
5984 个
通用积分
306.2157
学术水平
20 点
热心指数
26 点
信用等级
11 点
经验
24774 点
帖子
545
精华
0
在线时间
1298 小时
注册时间
2010-4-23
最后登录
2025-7-9

楼主
addreamer 在职认证  发表于 2010-11-17 13:38:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
背景:

中国社会科学院世界经济与政治研究所徐奇渊发表的研究报告《统计数据和主观感受:CPI是风动还是帆动?》利用CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8 ,对得到的常数项估计值-7.53,该文中做了如下解释:“有一部分变化值(-7.53)是无法用8个分项指数及其权重解释的……因此,-7.53 可以被视为人为调整的痕迹”。

然后thunders 在论坛中用一篇 cpi真的被低估了7%吗? 进行了反驳。我个人思考了一下,然后用数据进行了计算。和大家共同讨论。

思考:

1.由于统计调查制度是制度性的东西,是死的。cpi计算就是一个固定的东西,输入现期各种商品价格,与历史数据比较,算出各种商品cpi,然后加权算出总cpi。虽然复杂的多,但大体是这样。如果统计数据按照徐奇渊的说法,认为调低,也应该从基础数据上改,哪能连分类cpi都不改,直接改总cpi的道理。真是这样的话,这假造的也太没水平了,拿全国人民当傻子啊,统计系统也太没技术含量了吧。

2.公式CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8本身就是错误的。

从纯数学角度讲应该是个固定函数关系,a=0,Ebi=1。谁家用GDP一二三产去回归GDP呀,当然,举得这个例子不恰当,但是数学逻辑是一样,不过一二三产的加权系数固定为1罢了。解8个权重,只要有8个方程组成的8元1次方程组cpi=CPI*B(cpi为总cpi历史数据向量,CPI为分类cpi历史数据矩阵,B为权数向量)就可以搞定了。(前提是方程系数矩阵的秩=8,即不存在多重共线性)

从技术角度看,如果限定了a=0,Ebi=1,这样回归也没有错,因为加权系数未知,而因为发布的cpi数据小数位数较少,四舍五入的原因,加权结果必然存在误差。再加上权重是变化的,一年一小调整,几年一大调整。所以估计出准确值有困难。用ols是一个可行的办法。

虽然一年内权重没变化,一年12个月数据确实完全可以满足解方程组需要,但是由于商品价格变化同步性很强,各分类指数间存在很强的相关性,方程组共线性很强,共线性太过明显就会导致有效数据量不足,求出的解是一个解空间,而不是一个唯一解。ols回归后只能求出残差平方和最小的那一个。ols算出来的数据很多情况下有负数存在,就说明了这一点。

3.“近5年CPI或低估逾7%”报道很热门,但是我没想到是用CPI=a+b1PI1+ b2PI2+ b3PI3+ b4PI4+ b5PI5+ b6PI6+ b7PI7+ b8PI8这样的公式算出来的。如果是真的,中国社会科学院世界经济与政治研究所国际金融研究中心的牌子是让徐给砸了。水平也太差了点,技术上本科生的水平绰绰有余,理论上逻辑上连多重共线性原理也没有搞清楚。多重共线性下最小二乘回归的结果很难是正确的。就好比是3x+y=4,他只求出x=y=1,结论很明显太偏颇了。

计算:

经过我的计算,2009年、2010年分别用ols计算出来的八大类商品价格指数权重确实存在负数,但是这并不能说明数据造假。只能说明数据存在明显的共线性。

我用2009.1-2010.9这21个月份的全国cpi数据进行计算,由于这21个月序列权重应该只存在一次小调整,对结果的影响应该不是很大

计算方式:cpi=CPI*B,推导出B=CPI\cpi,直接用matlab输入数据,直接输入上面公式就ok了,计算结果同统计软件ols结果相同,但数学关系更明确。大家也可以试试各种软件,那样傻瓜式的操作还可以得到更多的检验统计量。我的计算结果如下:

0.349277385648786
0.0303957192994561
0.0999135676656420
0.0559304422417549
0.0755870037999842
0.118268753644819
0.131066042061086
0.139285350627462

sum=0.999724264988990约等于1。我个人感觉这个数据可以接受,而我并没有使用权重和等于1这个前提,sum=0.9997算是结果后验了权重和=1的存在,反过来证明了结果的正确性。
并且与http://zhidao.baidu.com/question/48244870.html上面提供的大概权重:食品34%,日用品5%,衣着9%,家庭设备及维修4%,医疗保健11%,交通通信9%,娱乐教育文化15%,居住14%虽有一定差距,但也很接近,说明数据存在一定的可信度。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CPI question 中国社会科学院 世界经济与政治 thunder CPI 低估

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
winston1986 + 4 + 2 + 2 精彩帖子

总评分: 学术水平 + 4  热心指数 + 2  信用等级 + 2   查看全部评分

沙发
addreamer 在职认证  发表于 2010-11-17 13:41:01

补充所用数据,来自国家统计局官方网站

藤椅
zj35777940 发表于 2010-11-17 13:44:18
样本太少啊。。可信度不大。。。

板凳
addreamer 在职认证  发表于 2010-11-17 14:03:10
对于确定的八元一次函数关系,又不是仅仅存在数据上的的回归关系,有效样本数只要达到八个,组成八元一次方程组,就可以解方程了。再考虑到sum=1,七个有效样本就ok!

比如二元一次方程,只需两个且有效,比如
     3x+y=4
          x+y=2
(2x+2y=4, x+y=2就不算是两个有效样本)
就可以直接解出x=1,y=1来了,还用的着多大样本???

报纸
sharong183 发表于 2010-11-17 15:37:57
数据的真实性,我持怀疑态度

地板
大可水米 发表于 2010-11-17 16:29:32
楼主,你看看八个变量有没有多重共线性?

下结论要慎重一些(这八个是同比指标,类似于差分的口径,没有明显的趋势性)

再者你看看原文:回归结果各项系数t检验值全部都异常显著,何来多重共线性的症状?因此你这个批评是站不住的。

下面是八个指标的相关系数矩阵:

0000无标题.png (202.61 KB)

0000无标题.png

7
大可水米 发表于 2010-11-17 16:47:46
不过根据新了解到的情况来说,CPI的八类权重和指数,在总局层面没有问题。这个我接受了。

8
addreamer 在职认证  发表于 2010-11-18 10:54:58
谢谢大可水米的讨论发言。目的是从讨论中进步,不存在其他想法。

我想说的是,统计数据也许存在不准的地方,但是从cpi上,而且是从分类cpi推导出总的cpi错误,我觉得是没有道理。不能先戴上有色眼镜,然后说统计数据全是假的,然后从哪个地方也可以找出证据来。

楼上新了解的情况,在总局层面没问题,你接受。那请问计算出八大类权重中存在负值是什么原因?除了共线性解释还有什么其他解释。你所说的T值检验,多重共线性下,T值检验的可靠性会下降,但不表示,T值检验都显著,就说明不存在共线性。这属于必要非充分条件,甚至连必要条件也算不上(T值不显著也不一定是共线性导致的)。

而“八个是同比指标,类似于差分的口径,没有明显的趋势性”这句话也值得商榷,同比、查分没问题,大家都知道,一般情况下,涨价时大多数商品都会涨,跌价时都在跌,商品之间的价格波动本来就存在一致性,只不多幅度大小不同。我只是用共线性说明八类商品价格变动趋势存在一致性或者说是相似性,并没有说各自有明显趋势性。讨论的问题南辕北辙,没说到点子上嘛

用相关系数矩阵可以说明一下,但是也只是说明两两变量之间的线性关系,并不能说明整体的多重共线性。最严谨的办法是建立 每个分类cpi用其他7类cpi的线性回归方程。这样建立八个,看有没有存在哪个分类cpi可以由其他7类cpi线性表示。我的原始数据没了,有兴趣的可以试试,把结果附上。

如果谁确实证明了确实不存在多重共线性,这说明我的理解出发点有错误。欢迎大家找出来!

9
大可水米 发表于 2010-11-18 15:09:50

()

你好,我不是研究员呵呵,叫我奇渊就行。

通常检验多重共线性是不是一个严重的问题(一般这个多问题多少都存在一些,只不过看有多严重,是不是影响分析),我们有这样几个常用的办法:(也有可能不够严谨)

  (1)初步观察。当模型的拟合优度(R 2)很高,F值很高,而每个回归参数估计值的方差Var(j) 又非常大(即t值很低)时,说明解释变量间可能存在多重共线性。
  (2)Klein判别法。计算多重可决系数R2及解释变量间的简单相关系数rxi xj。若有某个
 rxi xj  > R2,则xi,xj间的多重共线性是有害的。
  (3)回归参数估计值的符号如果不符合经济理论,模型有可能存在多重共线性。

就第(1)个方法而言:
我们看原文的回归结果:R2=0.99977,F值23000多,各项t值,最小的也有2.12,3.57,最大的有115.
就第(2)个方法而言:
你看相关系数矩阵,有哪个相关系数是大于0.99977?
就第(3)个方法而言:
你我的估计结果,权重基本也是符合直觉的。特别是你的估计。


我原文的估计有一个隐含了假设:权重变化很小,或者说是变化不大。因此才使用了这样的回归方式。
这是因为原来我对CPI编制有误解,原来是以为“权重五年一大调,每年一微调”;但实际上,年与年之间的调整也并不小;而且thunders也证明了,即使较小的调整,对估计的影响也是比较大的。这是理论上的问题。

最后,我已经跟统计局相关部门做了详细的了解,总局层面确实不存在数据的人为调整问题。所以,就这个争论,我想本身已经没有什么意义了。因为答案已经有了,就是我的方法错了,统计局没有人为调整(至少是没有证据表明,但我现在相信就是没有——在一级分类权重下)。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
winston1986 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

10
大可水米 发表于 2010-11-18 15:15:15
101.9        103.6        100.2        98.4        100.6        100.3        99.5        100.9        105.2
100.9        101.2        100.2        98.6        100.6        100.5        99        99.5        105.2
100.8        100.8        100.2        99.2        100.6        100.7        99.3        99.8        104.6
101.2        101.8        100.4        99.5        100.7        101        99.4        99.9        104.3
101.4        101.9        100.4        99.6        100.8        101.3        99.8        99.9        104.5
101.5        102.1        100.5        99.5        101.2        101.5        100.4        100        104.3
101        100.6        100.5        99.4        101.4        101.4        100.3        100        104.5
101.3        101.4        100.6        99.5        101.5        101.5        100.1        99.9        104.8
101.5        102.4        100.8        99.5        101.7        101.3        100.2        98.6        105
101.4        102.2        100.8        99.8        101.7        101.3        100.1        98.7        104.6
101.9        103.7        101        100.1        101.8        101.3        100.3        98.5        104.2
102.8        106.3        101.5        100.1        101.9        101.2        100.4        98.4        104.6
102.2        105        101.5        100.5        102        101.3        99.7        97.7        103.8
102.7        106        101.8        100.2        102.2        101.4        99.6        99.2        103.7
103.3        107.7        101.8        99.8        102.2        101.4        100.1        99        104
103        107.1        101.7        99.8        102.2        101.5        99.8        98.8        104.2
103.4        108.3        101.7        99.9        102.2        101.6        99.5        98.8        104
104.4        111.3        101.7        99.7        101.8        101.9        98.9        98.8        104.4
105.6        115.4        101.8        99.4        101.7        102.2        98.7        98.8        104.4
106.5        118.2        101.7        99.1        101.7        102.3        98.7        98.9        104.3
106.2        116.9        101.7        99        101.8        102.6        98.6        99.6        104.2
106.5        117.6        101.7        98.7        101.8        102.9        98.3        99.5        104.8
106.9        118.2        101.8        98.6        101.9        103.1        98.6        99.5        106
106.5        116.7        101.7        98.3        101.9        103.2        98.6        99.5        105.9
107.1        118.2        102.1        98.1        102.1        103.2        98.9        99.7        106.1
108.7        123.3        102.4        98.6        102.1        103.2        98.6        99.1        106.6
108.3        121.4        102.5        98.8        102.5        103.7        98.3        99.3        107
108.5        122.1        102.6        98.6        102.7        103.6        98.3        99.3        106.8
107.7        119.9        102.8        98.5        102.8        103.3        98.4        98.8        107.1
107.1        117.3        103.1        98.5        102.9        103.1        98.9        99        107.7
106.3        114.4        103.1        98.6        103.1        103.1        99.7        99.1        107.7
104.9        110.3        103.3        98.9        103.2        102.9        99.8        99.2        107.1
104.6        109.7        103.4        98.8        103.2        102.6        99.8        99.6        106.5
104        108.5        103.4        98.7        103.4        102.4        100        99.7        104.6
102.4        105.9        103.2        98.3        103.1        102        99.3        99.7        101.1
101.2        104.2        102.9        97.8        102.9        101.7        98.6        99.4        98.6
101        104.2        102.4        97.3        102.6        101.6        97.5        100.3        97.7
98.4        98.1        102        97.7        102.1        101.3        97        98.9        97.1
98.8        99.3        101.8        97.7        101.5        101        97.5        99.3        96.5
98.5        98.7        101.6        97.7        100.9        100.9        97.8        99        96
98.6        99.4        101.4        97.7        100.5        100.9        97.7        99.2        95.2
98.3        98.9        101.2        97.7        100.1        100.9        97.6        99.3        94.3
98.2        98.8        101.2        97.6        99.6        100.7        97.3        99.3        94.2
98.8        100.5        101.3        97.8        99.3        100.9        97.1        99.1        94.6
99.2        101.5        101.3        98.2        99.1        101.1        97.4        99.1        95
99.5        101.6        101.3        98.4        98.8        101.2        97.3        99.3        96.2
100.6        103.2        101.3        98.8        98.9        101.6        97.8        99.4        98.8
101.9        105.3        101.4        99.2        98.9        102.2        98.5        99.7        101.5
101.5        103.7        101.5        99.6        98.9        102.3        99.5        98.8        102.5
102.7        106.2        101.6        98.7        99.2        102.4        100.1        100.8        103
102.4        105.2        101.7        98.9        99.3        102.5        100        100.3        103.3
102.8        105.9        101.7        98.7        99.5        102.8        100        100.4        104.5
103.1        106.1        101.7        98.8        99.7        103.2        100.1        100.6        105


上面是原始数据,同比口径,2006年1月到2010年5月,第一列是总体CPI,后面是八个分类指数。

最后再说明一下:原来的报告也提到了,在权重等数据公布之前,所有的研究都只是雾里看花、水中望月,
也就是说,我承认自己的研究也是这种性质的,只是想引发大家对这个问题的讨论和关注,更重要的是讨论应该如何改进数据编制的方法,提高数据质量(我之后又发布了第二篇研究报告《CPI数据还有哪些改进之处》,可以到世经政所首页下载),但是却鲜有人关心这个报告,一直停留在低估了多少层面的争论。
我对此表示遗憾。希望大家一起来努力,对统计工作提出有建设性的意见,把事情做好。而不是单纯的抱怨、愤怒,或者是简单的数字游戏(当然技术讨论和批评也可以继续进行,但仍然希望把更多的注意力放到建设性的努力上来)。

欢迎大家继续拍

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 15:56