诺奖陪跑保罗·罗默:主流宏观经济学的困境
在 30 余年的时间里,宏观经济学已经开始倒退了。目前,对于识别问题的处理并没有比 20 世纪 70 年代早期有所进步,(经济学家们)因其晦涩难懂而逃避这个问题的挑战。宏观经济理论大家们装作不知道“货币政策收紧可能会导致经济衰退”这样简单的论断而无视不争的事实。他们构建的模型将宏观经济总体变量的波动归因于假想出来的因果力量,而那些因素并不会被人们的行为所影响。类比于物理学中的弦理论,我们知道当对权威人士的尊敬演变为盲从而不再以客观事实作为研究科学真相的决定因素时便会导致科学研究模式的普遍失败。
李·斯莫林在《物理学的困境》(2007)一文开篇写道,他的职业生涯仅跨越了物理学历史的 25 个年头,但期间该领域在的核心问题上并没有任何进展。这一问题在宏观经济领域更加严重,我已经见证了 30 余年的倒退。
在 20 世纪 60 年代和 70 年代早期,很多的宏观经济学并不关心识别问题。他们没有意识到通过对联立方程变量的观察来得到对因果关系的可靠推断是很困难的。直到 20 世纪 70 年代末,他们才意识到这一问题的重要性,但正如 Canova和 Sala 在最近一篇论文标题中所标示的那样,我们又重新“退回到了起点”。目前的宏观经济模型使用不可思议的确定性假设来得到那些令人困惑的结论。为了更真切地体会这些奇怪的结论,我们来看 2010 年一位顶级宏观经济学家所发表的论文中写到的内容:
从信息公开的角度来讲,我必须承认,我自己都不是完全确信货币除了会导致通货膨胀之外还有什么重要的。
1事实
如果你想要检验货币政策是否真的无关紧要,可以考虑观察沃尔克通货紧缩(Volcker Deflation,小编注:Paul Volcker是第十二届美联储主席,以降低通货膨胀率和维持物价稳定出名)。回想一下,美联储可以通过买卖债券来直接控制基础货币,它等于通货加上银行准备金。
下图 1 的上半部分描绘了大约 20 年内基础货币与 CPI 指数的年度数据,下半部分则是沃尔克通货紧缩。在上半部分中实线是基础货币,位于实线下方的虚线是CPI 指数,两者都选定 1960 年为基年,数值标准化为 1,且每向上移动一个单表示数值增减 1 倍。图中,CPI 指数的斜率即为通货膨胀率。
在下半部分图中,长虚线所表示的数值可以帮助我们对每年的通货膨胀率变化有更细致的了解。短虚线刻画了沃尔克通货紧缩前后通货膨胀率的线性趋势。我在上下两部分图中用阴影区域表示 NBER 的经济周期紧缩,并用深色来突出这两次萧条——沃尔克紧缩。很明显,在上下两幅图中,沃尔克紧缩前后通货膨胀率的数值与变化趋势都发生了剧烈的改变。当一家银行向另一家借入准备金时,它需要支付名义的联邦基金利率。如果美联储的准备金紧缺,那么利率就会上升,而货币政策最好的指标是实际利率,它等于名义利率减去通货膨胀率。沃尔克担任美联储主席期间的实际利率比战后任一时期都要高。
在沃尔克任期内的两个月中,沃尔克采取非常措施,公开宣布美联储将改变它的操作流程。本次改变正是Romer 夫妇于 1989 年总结美联储内部讨论后引致的。美联储的官员们寄希望于本次改变能够抬升联邦基金利率并抑制经济中的通胀压力。
图1:1960-2000年的货币、价格变动
下图2刻画了以1979年8月(沃尔克开始就职美联储主席)为0点的各项经济数据。实线代表的真实利率从0附近上升至5%,之后保持相对稳定。将实际利率从名义利率中减去后得到的通货膨胀率用红色的点线表示。黑色的虚线代表失业率,与GDP相同,均采用月度数据。(深色区域同样为两次衰退。)在第一次萧条中,产出下降了2.2%,失业率从6.3%上升至7.8%;第二次萧条中,产出下降了2.9%,失业从7.2%上升至10.8%。
正如美联储的官员们所希望的那样,图2中的数据为这两次萧条提供了一个简明的解释:
美联储以名义利率为目标,除第一次萧条外,名义利率比普遍的通货膨胀率要高大约500个BP。
实际利率升高会抬高失业率,降低产出。
通货膨胀率下降可能是因为高失业率伴随着巨大的产出下降缺口,或者是因为美联储的行为改变了预期。
图2:沃尔克通货紧缩
如果美联储可以改变利率达500个BP,货币政策是否重要就无需赘言了。当然,对于图2中的数据,唯一能够使人继续坚信货币政策是不重要的就是认为无论美联储的官员们怎么想,他们都不会影响到利率水平,利率之所以会变化是因为恰巧在这一时刻受到了某一外部冲击,使得美联储误以为是他们自己带来的改变。
据我所知,没有任何一个经济学家认为是某个假想的外部力量导致了沃尔克任职期间实际利率的上升,但有很多的模型在为这一观点背书。
2后现实模型
在基德兰德(Kydland)和普莱斯考特(Prescott)提出真实经济周期(RBC)模型后,宏观经济学家们不加怀疑地认为宏观经济总量的波动是由某个假想的冲击导致的,而非人们采取的行为。RBC模型依赖于两个恒等式。第一个等式将增长核算指标定义为产出(Y)的增长与投入(X)增长的差值:
阿布拉莫维茨(Abromovitz)在1956年创造性地提出了这一指标,为表示对他的敬意,我们称变量A为“燃素”。
第二个恒等式是货币数量方程,定义货币的流通速度v为名义产出(实际产出Y与价格水平P的乘积)和货币数量M的比值:
真实经济周期模型将衰退归因于为“燃素”外生性地减少。给定产出Y,货币总量M变化的唯一影响就是价格水平P的同比例变化。在这一模型中,正如Prescott在明尼苏达大学教授研究生课程时讲到的“邮政经济学要比货币主义经济学更接近理解经济的本质”,货币政策的作用微乎其微。
RBC模型的支持者们将这一模型的微观基础作为其主要优势。但这也提出了一个问题,因为并没有确切的微观证据表明这一模型引入了负向的燃素冲击或者是它所带来的理论影响。
在一封私人信件中,有人与Prescott相同,寄给了我一份明细账户帮我理解“负向的技术冲击”:
EdPrescott邀请我作他学生口试的第二考官......我虽没有见过但不怀疑他在校准练习等这些方面做的工作。我认为它没有太大意义表现在很多方面,比如说科学价值。于是,随着学生展示的进行,我试图将它们都整理出来。当轮到我来问问题的时候,我问道‘这些技术冲击是什么’。
EdPrescott十分紧张就像是当了一颗子弹。尴尬的4,5秒之后,他大声喊道‘他们就像是交通拥堵一样’(当天下午我们在房间里看到桥上发生了交通拥堵,这座桥在几十年后倒塌了)显然,如果他能够对他所提出的概念有一个更加合理的解释,我会认真去听......
我通过引用这段话想真正说明的是如果有人能够认真地为宏观研究加入微观基础,那将势必改善这一几近停滞的理论研究。设想一下一个经济学家只能将宏观经济的波动比喻为交通拥堵或其它一些字面上的原因。显然,继续发展的方向便是观察司机决定何时以及怎样驾车前进。通过做出这些决定就会产生总体交通量的波动。这与那些过去的理论是完全不同的,之前的理论只是假象某个外部冲击的存在,而事实上这些冲击并不是人们采取某种行为所导致的。
为了响应“外部冲击只是假象出来的”的这一观点,一位不知名的权威人士引用米尔顿·弗里德曼(1953)关于方法论的断言来予以反驳“理论越有意义,前提假设就会越不切实际”。近来,“所有的模型都是错的”似乎成为了一种潮流,它们忽略掉一切与模型不一致的事实。
一旦宏观经济学家得出结论说调用一个假想的强制变量是合理的,他们就会增加更多。我给了一些变量名字,列举如下:
普通的phlogiston(燃素),会增加在给定的投入下消费品的数量
特定投资的phlogiston(燃素),会增加在给定的投入下资本品的数量
troll(巨魔),可以随机改变支付给所有工人的薪水
gremlin(小鬼),可以随机改变产出的价格
arther(以太),能增加投资者的风险偏好
caloric(热量),能让人们想要更少的闲暇
因为phlogiston可能会有特例,建模人员假定没有办法直接测定他们。phlogiston可以通过增长核算,至少在原则上如此。在实践中,计算的残差对投入利用率的误测非常敏感,所以即使在这种情况下,直接测量也是经常被忽略的。
3.2价格粘性
为了使货币政策产生作用的可能性存在,实证的DSGE模型将价格粘性运用到RBC中。价格粘性扩展开来,允许货币政策影响产出,但是模型报告的结果从来没有从RBC教条走远。如果货币政策有影响,它的影响也是非常小的。
正如我稍后会展示的,当模型中变量的数量增加时,识别问题会变得更糟糕。在实践中,这意味着在估计模型时,计量经济学家在决定可能出现的结果时更加灵活。
识别问题意味着为了得到结果,计量经济学家需要在同步系统变量数据以外的事情上下功夫。我将参考FWUTV(facts with unknown truth value,事实未知真实值)来强调,尽管估计过程把FWUTV看做是已知正确的事实,模型估计的过程仍然没有揭示关于真实值的任何事情。目前在DSGE的计量实践中,一些做法是通过“校准”某些参数的值以及贝叶斯先验得到FWUTV。正如Olivier Blanchard(2016)在他经典保守的陈述中所说的:“在很多情况下,对严格先验的辩解在最佳估计中也是很弱的,所估计出的结果更多的反映的是研究者的先验而不是似然函数。”
这比听起来问题更多。对一个参数的事先指定,能够对其他的参数的结果产生决定性的影响。这意味着计量经济学家可以从那些看起来不那么重要的参数中,找到一些参数,使他们感兴趣的参数产生期望的结果。