请选择 进入手机版 | 继续访问电脑版
12876 10

Stata 15的新模块(三):门槛回归 [推广有奖]

教授

21%

还不是VIP/贵宾

-

威望
1
论坛币
-518870 个
通用积分
63.6035
学术水平
293 点
热心指数
303 点
信用等级
237 点
经验
22984 点
帖子
286
精华
8
在线时间
487 小时
注册时间
2018-5-17
最后登录
2020-4-10

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

不久前,Stata公司发布了最新的Stata 15,包含了许多令人激动的重大升级,包括非参数回归、空间计量、门槛回归、面板协整、DSGE模型等。本公众号将陆续为你介绍,与计量经济学最为相关的几个全新模块。


并非所有个体的经济规律都一样


如果你做过跨国回归(cross-country regression),或许曾想过,难道发展中国家与发达国家的经济规律真的一样吗?也许,二者的经济规律(回归系数)并不相同呢?此时,传统的做法是,根据某个指标(比如人均GDP),主观设定一个门槛值,将样本一分为二,然后分别进行估计。


又比如,当你用企业数据做回归时,可能想过小企业与大企业的经济规律或许并不完全相同,但应该如何根据企业规模(firm size)来区分小企业与大企业呢?在这两个例子中,人均GDP与企业规模都是连续变量,而我们需要确定一个合理的门槛值。


门槛回归模型


为此,Hansen (2000) 提出使用样本数据来估计此门槛值,并对于门槛效应(threshold effect)进行严格的统计推断。考虑以下的门槛回归模型(threshold regression,也称门限回归):


1.webp.jpg


其中, 3.webp (1).jpg

为用来划分样本的 “门槛变量” (threshold variable),可以是解释变量 2.webp.jpg
的一部分;而 3.webp.jpg
为待估计的 “门槛值”(threshold level)。这意味着,当世界处于第 1 种区制(regime),即门槛变量 小于或等于门槛值 时,回归系数为 4.webp.jpg
;而当世界处于第 2 种区制,即 大于门槛值 时,回归系数则变为

5.webp.jpg


显然,如果 6.webp.jpg

,这两个区制的回归系数完全相同,则不存在门槛效应。因此,可通过检验原假设 8.webp.jpg
,来考察究竟是否存在门槛效应。如果原假设 的约束条件成立,则门槛回归模型简化为一般的线性回归模型。为此,Hansen (2000) 提出基于有约束模型的 LM 检验来检验是否存在门槛效应。


条件 OLS


上述门槛回归的方程为分段函数,不易操作。为此,引入示性函数(indicator function),将其写为统一的方程:


10.webp.jpg


其中,示性函数 11.webp.jpg

取值为1,如果其括弧中的表达式为真;反之,则取值为0。显然,如果给定 (假设 已知),则可将上式的 12.webp.jpg
0.webp.jpg
均作为已知的解释变量,直接进行 OLS 估计即可。这被称为 “条件OLS”(conditional OLS),可将其残差平方和记为 13.webp.jpg


其次,我们只要选择 ,使得 最小化 即可。注意到,虽然门槛变量 为连续的,但给定有限的样本容量 17.webp.jpg

,则门槛值 也最多只能取 个值(若取其他值,不影响模型的估计结果),故不难找到最优的 14.webp.jpg
,使得 15.webp.jpg
最小。


门槛回归的Stata命令


在Stata 15中,进行门槛回归的命令为


threshold y x1 x2, threshvar(q) regionvars(x3 x4) nthresholds(#) optthreh(#)


其中,y 为被解释变量,x1 x2 为回归系数不随区制(regime)而变的解释变量(也可以不设)。必选项 threshvar(q) 表示变量 q 为门槛变量,选择项 regionvars(x3 x4) 表示,x3 x4 为回归系数随区制(regime)而变的解释变量。此处的 region,其实就是文献中的 regime(区制)。


这个命令默认只有一个门槛值。也可以通过选择项 nthresholds(#) 来指定多个门槛值,比如 nthresholds(2) 表示有 2 个门槛值,即将世界分为 3 个区制。


更一般地,也可以通过选择项 optthreh(#) 来计算最优的门槛个数(默认使用BIC信息准则进行选择);比如,optthreh(5),表示最多允许有5个门槛值。


门槛回归的案例


参照Stata manual,下面以美联储如何制定联邦基金利率的季度数据集为例(类似于宏观经济学中著名的泰勒规则)。


. use http://www.stata-press.com/data/r15/usmacro

(Federal Reserve Economic Data - St. Louis Fed)


不妨先看一下联邦基金利率的时间趋势图。


. tsline fedfunds


22.webp.jpg


下面进行门槛回归。


. threshold fedfunds, regionvars(l.fedfunds inflation ogap) threshvar(l.fedfunds)


此命令表示,门槛回归的被解释变量为 fedfunds(联邦基金利率),门槛变量为 l.fedfunds(联邦基金利率的滞后),而 l.fedfunds,inflation(通胀率)与 ogap(产出缺口)为回归系数随区制而变的解释变量。


23.webp.jpg


上表显示,联邦基金利率滞后的门槛估计值为 9.35%,其对应的残差平方和(SSR)为 155.43。遗憾的是,此命令没有汇报门槛值的置信区间。


回归结果中的 Region1 与 Region2,在文献中通常称为 Regime 1 与 Regime 2。结果显示,当联邦基金利率滞后(l.fedfunds)小于或等于 9.35%,即处于 Region1 时,联邦基金利率高度依赖于其滞后(自回归系数为 0.93,且在 1% 水平上显著),而对于通胀水平(inflation)不敏感(p 值为 0.133),但产出缺口(ogap)的作用显著为正。


另一方面,当联邦基金利率滞后(l.fedfunds)大于 9.35%,即处于 Region2 时,联邦基金利率对于其滞后的依赖性减弱(自回归系数降为 0.70,仍在 1% 水平上显著),而对于通胀水平(inflation)变得敏感(p 值为0.002),但产出缺口(ogap)的作用则变得不显著。


Stata 15 门槛回归的局限与应对


虽然 Stata 15 的官方命令 threshold 可进行门槛回归的估计,并以漂亮的表格汇报回归结果,但在统计推断方面依然有所欠缺。比如,它既不提供门槛值的置信区间,也不检验究竟是否存在门槛效应(即检验 7.webp.jpg

)。根据 Hansen (2000) 的逻辑,应先检验是否存在门槛效应(此检验也有助于选择门槛变量);如果发现确实有门槛效应,再进行门槛模型的估计。


另外,命令 threshold 默认数据为时间序列,并不适用于横截面与面板数据,故首先需要 tsset 数据,才能使用 threshold 命令。


因此,如需对横截面数据进行门槛回归,或进行深入的统计推断,仍建议辅助使用门槛回归创始人 Bruce Hansen 在其个人网页所提供的非官方 Stata 命令 (thresholdreg 与 thresholdtest)。下载地址为:


http://www.ssc.wisc.edu/~bhansen/progs/progs_threshold.html


从该网页下载 zip 文件并解压,将所有文件放置于当前工作路径(current working directory)之后(在 Stata 页面的左下方会显示当前工作路径),输入命令 “do Hansen2000” 即可自动运行。


如果使用面板数据进行门槛回归,则建议使用南开大学王群勇教授的非官方 Stata 命令 xthreg(Wang, 2015),在 Stata 中可输入命令 findit xthreg 来搜索下载。


备注:本公众号不提供 Stata 15。如需正版 Stata 15,可咨询 crystal@uone-tech.cn。进一步学习 Stata,可关注即将召开的第一届 Stata 用户大会,详情参见 www.uone-tech.cn。


参考文献


Hansen, Bruce E., 2000. "Sample Splitting and Threshold Estimation," Econometrica, 68, 575-603.


Wang, Qunyong, 2015. "Fixed-effect Panel Threshold Model Using Stata," The Stata Journal, 15(1), 121-134.


陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。


陈强,《计量经济学及Stata应用》,高等教育出版社,2015年。


微信公众号:https://mp.weixin.qq.com/s/XX9mzzYyrl5YPXoS7rTTMw


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分学术水平 热心指数 信用等级 收起 理由
txje + 2 + 2 + 2 精彩帖子

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

钱学森64 发表于 2018-9-26 18:49:16 |显示全部楼层 |坛友微信交流群
谢谢分享

使用道具

wq37 发表于 2018-10-5 10:06:28 |显示全部楼层 |坛友微信交流群
谢谢分享

使用道具

lukesran 发表于 2018-11-9 13:03:08 |显示全部楼层 |坛友微信交流群
很好!

使用道具

楚天江南客 学生认证  发表于 2019-1-5 11:02:10 |显示全部楼层 |坛友微信交流群
对这个原理有了一定的认识,谢谢!

使用道具

cjzmn 发表于 2019-2-14 19:30:33 来自手机 |显示全部楼层 |坛友微信交流群
谢谢分享!

使用道具

fillshun 发表于 2020-4-7 22:04:42 |显示全部楼层 |坛友微信交流群

谢谢分享!

使用道具

谢谢楼主的热心分享!

使用道具

开始了 发表于 2020-8-23 23:54:56 |显示全部楼层 |坛友微信交流群
认真学习,谢谢

使用道具

snowdeer 发表于 2020-11-22 21:02:42 |显示全部楼层 |坛友微信交流群
请问回归结果中的order是什么意思呢?比如当有3个门限值时,我发现order的排序不是1 2 3,而有可能是2 3 1这种形式,这是什么意思呢?。谢谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-28 20:18