相似文件
换一批
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
不久前,Stata公司发布了最新的Stata 15,包含了许多令人激动的重大升级,包括非参数回归、空间计量、门槛回归、面板协整、DSGE模型等。本公众号将陆续为你介绍,与计量经济学最为相关的几个全新模块。
并非所有个体的经济规律都一样
如果你做过跨国回归(cross-country regression),或许曾想过,难道发展中国家与发达国家的经济规律真的一样吗?也许,二者的经济规律(回归系数)并不相同呢?此时,传统的做法是,根据某个指标(比如人均GDP),主观设定一个门槛值,将样本一分为二,然后分别进行估计。
又比如,当你用企业数据做回归时,可能想过小企业与大企业的经济规律或许并不完全相同,但应该如何根据企业规模(firm size)来区分小企业与大企业呢?在这两个例子中,人均GDP与企业规模都是连续变量,而我们需要确定一个合理的门槛值。
门槛回归模型
为此,Hansen (2000) 提出使用样本数据来估计此门槛值,并对于门槛效应(threshold effect)进行严格的统计推断。考虑以下的门槛回归模型(threshold regression,也称门限回归):
其中,
为用来划分样本的 “门槛变量” (threshold variable),可以是解释变量
的一部分;而
为待估计的 “门槛值”(threshold level)。这意味着,当世界处于第 1 种区制(regime),即门槛变量 小于或等于门槛值 时,回归系数为
;而当世界处于第 2 种区制,即 大于门槛值 时,回归系数则变为
。
显然,如果
,这两个区制的回归系数完全相同,则不存在门槛效应。因此,可通过检验原假设
,来考察究竟是否存在门槛效应。如果原假设 的约束条件成立,则门槛回归模型简化为一般的线性回归模型。为此,Hansen (2000) 提出基于有约束模型的 LM 检验来检验是否存在门槛效应。
条件 OLS
上述门槛回归的方程为分段函数,不易操作。为此,引入示性函数(indicator function),将其写为统一的方程:
其中,示性函数
取值为1,如果其括弧中的表达式为真;反之,则取值为0。显然,如果给定 (假设 已知),则可将上式的
与
均作为已知的解释变量,直接进行 OLS 估计即可。这被称为 “条件OLS”(conditional OLS),可将其残差平方和记为
。
其次,我们只要选择 ,使得 最小化 即可。注意到,虽然门槛变量 为连续的,但给定有限的样本容量
,则门槛值 也最多只能取 个值(若取其他值,不影响模型的估计结果),故不难找到最优的
,使得
最小。
门槛回归的Stata命令
在Stata 15中,进行门槛回归的命令为
threshold y x1 x2, threshvar(q) regionvars(x3 x4) nthresholds(#) optthreh(#)
其中,y 为被解释变量,x1 与 x2 为回归系数不随区制(regime)而变的解释变量(也可以不设)。必选项 threshvar(q) 表示变量 q 为门槛变量,选择项 regionvars(x3 x4) 表示,x3 与 x4 为回归系数随区制(regime)而变的解释变量。此处的 region,其实就是文献中的 regime(区制)。
这个命令默认只有一个门槛值。也可以通过选择项 nthresholds(#) 来指定多个门槛值,比如 nthresholds(2) 表示有 2 个门槛值,即将世界分为 3 个区制。
更一般地,也可以通过选择项 optthreh(#) 来计算最优的门槛个数(默认使用BIC信息准则进行选择);比如,optthreh(5),表示最多允许有5个门槛值。
门槛回归的案例
参照Stata manual,下面以美联储如何制定联邦基金利率的季度数据集为例(类似于宏观经济学中著名的泰勒规则)。
. use http://www.stata-press.com/data/r15/usmacro (Federal Reserve Economic Data - St. Louis Fed)
不妨先看一下联邦基金利率的时间趋势图。
. tsline fedfunds
下面进行门槛回归。
. threshold fedfunds, regionvars(l.fedfunds inflation ogap) threshvar(l.fedfunds)
此命令表示,门槛回归的被解释变量为 fedfunds(联邦基金利率),门槛变量为 l.fedfunds(联邦基金利率的滞后),而 l.fedfunds,inflation(通胀率)与 ogap(产出缺口)为回归系数随区制而变的解释变量。
上表显示,联邦基金利率滞后的门槛估计值为 9.35%,其对应的残差平方和(SSR)为 155.43。遗憾的是,此命令没有汇报门槛值的置信区间。
回归结果中的 Region1 与 Region2,在文献中通常称为 Regime 1 与 Regime 2。结果显示,当联邦基金利率滞后(l.fedfunds)小于或等于 9.35%,即处于 Region1 时,联邦基金利率高度依赖于其滞后(自回归系数为 0.93,且在 1% 水平上显著),而对于通胀水平(inflation)不敏感(p 值为 0.133),但产出缺口(ogap)的作用显著为正。
另一方面,当联邦基金利率滞后(l.fedfunds)大于 9.35%,即处于 Region2 时,联邦基金利率对于其滞后的依赖性减弱(自回归系数降为 0.70,仍在 1% 水平上显著),而对于通胀水平(inflation)变得敏感(p 值为0.002),但产出缺口(ogap)的作用则变得不显著。
Stata 15 门槛回归的局限与应对
虽然 Stata 15 的官方命令 threshold 可进行门槛回归的估计,并以漂亮的表格汇报回归结果,但在统计推断方面依然有所欠缺。比如,它既不提供门槛值的置信区间,也不检验究竟是否存在门槛效应(即检验
)。根据 Hansen (2000) 的逻辑,应先检验是否存在门槛效应(此检验也有助于选择门槛变量);如果发现确实有门槛效应,再进行门槛模型的估计。
另外,命令 threshold 默认数据为时间序列,并不适用于横截面与面板数据,故首先需要 tsset 数据,才能使用 threshold 命令。
因此,如需对横截面数据进行门槛回归,或进行深入的统计推断,仍建议辅助使用门槛回归创始人 Bruce Hansen 在其个人网页所提供的非官方 Stata 命令 (thresholdreg 与 thresholdtest)。下载地址为:
http://www.ssc.wisc.edu/~bhansen/progs/progs_threshold.html
从该网页下载 zip 文件并解压,将所有文件放置于当前工作路径(current working directory)之后(在 Stata 页面的左下方会显示当前工作路径),输入命令 “do Hansen2000” 即可自动运行。
如果使用面板数据进行门槛回归,则建议使用南开大学王群勇教授的非官方 Stata 命令 xthreg(Wang, 2015),在 Stata 中可输入命令 findit xthreg 来搜索下载。
备注:本公众号不提供 Stata 15。如需正版 Stata 15,可咨询 crystal@uone-tech.cn。进一步学习 Stata,可关注即将召开的第一届 Stata 用户大会,详情参见 www.uone-tech.cn。
参考文献
Hansen, Bruce E., 2000. "Sample Splitting and Threshold Estimation," Econometrica, 68, 575-603.
Wang, Qunyong, 2015. "Fixed-effect Panel Threshold Model Using Stata," The Stata Journal, 15(1), 121-134.
陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。
陈强,《计量经济学及Stata应用》,高等教育出版社,2015年。
微信公众号:https://mp.weixin.qq.com/s/XX9mzzYyrl5YPXoS7rTTMw
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|