tag 标签: 面板数据经管大学堂:名校名师名课

相关帖子

版块 作者 回复/查看 最后发表
面板数据熵值法(熵权法)STATA操作代码及样本数据 attachment 经管文库(原现金交易版) jessi1029 2022-3-11 33 10883 NNNYYYNNN 2024-3-18 21:39:26
城镇化率、省级(2003-2021)、地级市(2000-2021)、县级层面(2000-2021),整理好 attach_img 经管文库(原现金交易版) 15056401120 2023-7-4 1 1020 20190501225 2024-3-18 10:54:51
请问Stata怎么补(填充)缺失值 Stata专版 magej1 2023-10-27 2 431 magej1 2023-10-28 13:40:24
面板数据非线性回归模型建模方法及其应用 attachment 计量经济学与统计软件 yudai2006 2013-8-10 54 32619 wzr_2011 2023-7-14 10:06:15
stata问题求解 attach_img Stata专版 WINDong617 2022-7-20 0 335 WINDong617 2022-7-20 06:44:26
关于计量如何入门这件事~ 学术道德监督 RozenCheng 2021-7-26 0 1204 RozenCheng 2021-7-26 23:11:40
stata中数据如何转换为面板数据 爱问频道 252796187 2013-2-26 6 16622 sulight 2018-2-8 17:45:45
关于DID(双重差分、倍差法)模型的面板数据生成 attachment Stata专版 priness3 2013-8-31 28 37368 欧阳峰少 2017-8-13 18:33:59
金禾经济研究中心STATA讲义 attachment 计量经济学与统计软件 zdq198654 2009-11-16 47 12531 rwrew 2017-5-30 18:25:31
【论坛首发】用面板数据做因果分析(史蒂芬.E.芬克尔)PDF版本 attachment 计量经济学与统计软件 krisdiano 2013-6-10 300 23856 施海岩 2017-1-6 02:11:45
单位根(单序列,面板数据)检验操作步骤 attachment EViews专版 19721016 2009-10-27 64 16552 zljzcl 2015-1-27 14:28:56
横截面与面板数据的经济计量分析 伍德里奇 中文版 attach_img 版权审核区(不对外开放) kerryshaw 2013-1-12 19 5164 ⑦gê⑦ 2014-12-1 17:25:55
张晓峒课件-面板数据模型与应用 attachment EViews专版 horacexu615 2009-7-29 76 16555 Edwin_Leé 2014-1-3 19:30:12
面板数据能不能做因子分析? 计量经济学与统计软件 jingguanren 2013-5-27 1 2473 军少 2013-5-28 09:41:44
教会你进行:数据频率转换 面板数据录入 attachment EViews专版 19721016 2009-9-8 20 10467 水云文 2012-12-23 13:02:27
面板数据Panel Data Econometrics及note 原版英文著作(老师推荐) 买原著送note attachment 计量经济学与统计软件 kaixinice 2009-8-6 17 7919 wbzdwss 2012-12-20 16:04:02
面板数据模型选择 EViews专版 fengyun1369 2010-7-15 3 2665 吴家店 2010-7-30 00:21:26
应用面板数据分析的一些论文 attachment EViews专版 之乎者也 2009-7-7 6 3708 lizihy1981tom 2009-12-5 14:44:29
eviews中做极大似然回归遇到问题,求助各位大侠 EViews专版 moshucq 2009-8-5 5 3818 moshucq 2009-8-6 17:41:55

相关日志

分享 Stata: 面板数据模型-一文读懂
arlionn 2019-8-7 22:02
作者:游万海 || 连玉君 || ( 知乎 | 简书 | 码云 )   连享会计量方法专题…… Stata连享会 计量专题 || 精品课程 || 推文集锦 点击查看完整推文列表   导言: 如下是连玉君老师上课的板书。你可以看出什么是 「固定效应」 ,什么是 「双向固定效应模型」 ,什么是 「POLS」 v.s. 「FE」 以及二者的差别。 所以,面板数据模型其实没有你想象的那么复杂! 常见的数据形式有时间序列数据( Time series data ),截面数据( Cross-sectional data )和面板数据( Panel data )。 从维度来看,时间序列数据和截面数据均为一维。面板数据可以看做为时间序列与截面混合数据,因此它是二维数据。数据形式如下: image 世界是复杂的,所表现出来的行为特征也是复杂的,我们需要面板数据。 例如,欲研究影响企业利润的决定因素,我们认为企业规模 (截面维度)和技术进步(时间维度)是两个重要的因素。截面数据仅能研究企业规模对企业利润的影响程度,时间序列数据仅能研究技术进步对企业利润的影响,而面板数据同时考虑了截面和时间两个维度 (从哪个维度看都好看),可以同时研究企业规模和技术进步对企业利润的影响。 正因为面板数据所具有的独特优势,许多模型从截面数据扩展到面板数据框架下。通过 findit panel data 命令可以发现目前Stata已有许多相关面板数据模型命令,包括(不限于):   xtreg :普通面板数据模型,包括固定效应与随机效应   xtabond/xtdpdsys/xtabond2/xtdpdqml/xtlsdvc :动态面板数据模型   spxtregress/xsmle : 空间面板数据模型   xthreg :面板门限模型   xtqreg/qregpd/xtrifreg : 面板分位数模型   xtunitroot : 面板单位根检验   xtcointtest/ xtpedroni/xtwest : 面板协整检验   sfpanel : 面板随机前沿模型   xtpmg/xtmg :非平稳异质面板模型 本文主要就普通静态面板数据模型进行介绍,包括模型形式设定、模型分类与选择及 Stata 程序实现等。 一. 模型形式设定 面板数据模型同时包含了截面和时间两个维度,设 ( =1, , ) 表示截面 (个体), ( ) 表示时间,设定如下线性模型: 其中, 为 因变量, 为 自变量, 为模型误差项, 是待估计参数,表示 对 的边际影响。 表示个体效应,表示那些不随时间改变的影响因素,如个人的消费习惯、企业文化和经营风格等; 表示时间效应,用于控制随时间改变因素的影响 (时间虚拟变量包括时间趋势项,时间趋势主要用于控制技术进步),如广告的投放 (往往通过电视或广播,我们可以认为在特定的年份所有个体所接受的广告投放量相同)。 显然, 和 在多数情况下都是无法直接观测或难以量化的,因此也就无法进入模型。在截面分析中往往会引起遗漏变量的问题。 面板数据模型的主要用途之一就在于处理这些不可观测的个体效应或时间效应。当对所有的 , 均相等时,模型退化为混合数据模型 ( Pooled OLS ),可直接用 reg y x 命令进行参数估计。 根据个体数 和时期数 的大小,通常可以将面板数据分为 宏观面板 和 微观面板 :宏观面板一般为 「大 小 」,微观面板一般为「小 大 」。依据 、 大小不同,所采用的参数估计方法和分析中关注的重点也不尽相同。 二. 模型分类与选择 面板数据模型可以分为固定效应( Fixed effect model )和随机效应模型( Random effect model )。当 和 相关,即 ,则该模型为固定效应模型;反之为随机效应模型。 两种模型的差异主要反映在对 “个体效应” 的处理上。 固定效应模型假设个体效应在组内是固定不变的,个体间的差异反映在每个个体都有一个特定的截距项上; 随机效应模型则假设所有的个体具有相同的截距项, 个体间的差异是随机的,这些差异主要反应在随机干扰项的设定上。 基于此,一种常见的观点认为, 当我们的样本来自一个较小的母体时,我们应该使用固定效应模型,而当样本来自一个很大的母体时, 应当采用随机效应模型。 然而,在具体的实例应用中,大母体和小母体并没有一个严格的界限,我们并不能明确地区分我们的样本来自一个较大母体还是较小的母体。因此,有些学者认为,区分固定效应模型和随机效应模型应当通过检验使用二者的假设条件是否满足。 下面我们讨论混合数据模型、固定效应模型和随机效应模型的选择。 2.1、固定效应的检验 固定效应的检验本质即检验个体间截距项的差异是否显著,即 = = = =0。根据假设检验原理,设定如下原假设 若结果拒绝原假设,则表明个体间截距项存在显著差异,模型中需要考虑固定效应。反之,混合 OLS 模型更为合适。通常可以利用 统计量来检验上述假设是否成立: 其中: 为固定效应模型的拟合优度系数(不受约束模型), 为混合数据模型的拟合优度系数(受约束模型); 和 分别为截面与时期数; 为解释变量个数。若原假设被拒绝,则说明个体效应显著,固定效应模型比混合数据模型更优。同理,可以构造相似的 统计量检验时期效应是否显著。 2.2、随机效应的检验 Breusch and Pagan (1980) 提出了基于面板随机效应模型残差的 LM 统计量,构造如下原假设来检验随机效应: 相应的检验统计量 LM 为: 在原假设下,该统计量服从自由度为1的卡方分布。若拒绝原假设则表明存在随机效应。 2.3、固定效应还是随机效应? 通过检验说明个体效应 ( ) 需要被纳入到模型中后,应该将 看成随机干扰项的一部分(随机效应模型)还是待估计参数 (固定效应模型),下面介绍一些基本方法。 (1) Hausman 检验 从基本定义出发,可以通过通过检验个体效应 与其它解释变量是否相关作为进行固定效应和随机效应模型筛选的依据。此时,我们可以采用 Hausman 检验。其基本思想是:在 和其他解释变量不相关假定下,采用组内变换法估计固定效应模型和采用GLS法随机效应模型得到的参数估计都是无偏且一致的,只是前者不具有效性。若原假设不成立,则固定效应模型的参数估计仍然是一致的,但随机效应模型不一致。因此,在原假设下,二者的参数估计应该不会有显著的差异, 可以基于二者参数估计的差异构造统计检验量。 假设 为固定效应模型的组合估计, 为随机效应模型的 GLS 估计。在原假设成立下,有 根据方差公式 又因为 ,因此有 Hausman 检验基于如下 Wald 统计量 若拒绝原假设,表明个体效应 与解释变量相关,此时随机效应模型的结果不一致,应选择固定效应模型。 (2) 稳健 Hausman 检验Wooldridge (2002) 当不服从同方差假设时,传统的 Hausman 检验方法失效。Wooldridge (2002) 提出了一种稳健版的 Hausman 检验方法。建立如下辅助模型: 其中: 为时变解释变量。当 RE 估计为完全有效估计时,利用 Wald 统计量做 检验所得结果应该渐近相等于标准的检验。当RE 估计为不是完全有效估计时,Wooldridge (2002) 提出在cluster-robust 标准误下做上述检验。 (3) 修正的 Hausman 统计量 在固定效应模型与随机效应模型选择上, Hausman 统计量被广泛地应用于实证研究中。从上述看,该检验统计量渐近服从卡方分布,值应该为正数。然而,实际问题中计算出的统计值常出现负值的情况。针对出现负值这一现象,许多学者进行了研究,但并未形成一致的观点。 一种观点认为出现这样的情况主要是由小样本偏误引起,并建议此时应该解释为不能拒绝原假设,应选择随机效应模型 (如,Baltagi, 2008; Hsiao, 2003;Statacrop, 2009)。 另一种观点认为该统计量出现负值恰恰表明原假设不合理,此时应该选择固定效应模型。这些研究表明这种状况不仅仅出现在小样本情况下,在大样本情况下也时有发生 (Schreiber, 2008; Magazzini and Calzolarr, 2010)。如沈根祥 (2010) 在利用高频数据时也出现统计量为负值的情形。 连玉君等 (2014) 利用蒙特卡洛模拟方法得到内生性问题 (即解释变量与个体效应相关) 是导致统计量出现负值的主要原因。模拟分析表明,修正的 Hausman 统计量,以及过度识别检验方法能够很好地克服上述缺陷。 修正的 Hausman 统计量主要是对 或 进行调整。调整后的统计量为 或者为 其中: 和 分别为固定效应模型和随机效应模型下的均方根误差。 (4) 基于过度识别检验的 Wald 统计量 基于通常的 Hausman 统计量在存在异方差 (heteroskedastic) 情况下失效且当定义 cluster-robust 标准误时不再适用问题,Arellano (1993) 基于过度识别检验提出了 Wald 检验统计量解决这一问题。在条件同方差情况下,该检验统计量与通常的 Hausman 统计量渐近相等。此外,该统计量始终为正数。 如前所述,FE 估计和 RE 估计都需要满足一般意义上的外生性假设条件,即 ,而 RE 估计还要进一步满足面板特定的外生性假设条件,即 。 我们可以将这个新增加的正交条件视为一个过度识别约束,以此来区分 RE 估计的前提假设是否合理。我们可以通过估计如下模型来构造 Wald 统计量 其中: , 。 和 具有相似的定义。显然,在上式中, 的 OLS 估计即为 RE 估计量 ,而 的 OLS 估计即为 之间的差异,即 利用 Wald 检验假设 ,所得统计量即为过度识别检验的 Wald 统计量 。 (5) Mundlak’s (1978) 方法 在原假设成立情况下,估计量的有效性假设 (存在最小渐近方差) 是运用 Hausman 检验的前提条件。然而,当误差项存在异方差或者序列相关时,这个条件往往不能够被满足。即使在这个条件满足情况下,该方法也可能存在小样本问题。 这里介绍另外一种方法,即 Mundlak’s(1978) 提出的一种检验方法。与通常的 Hausman 检验不同,该方法在误差项不满足同方差和序列不相关情况下也是有效的。 设定如下线性模型: Mundlak 方法的思想为检验 和解释变量 是否存在相关。因此,建立如下关系式: 其中: 是 的组内平均, 是非时变的,且与自变量不相关的。 要保证 和解释变量 不相关,只需 =0。根据以上式子,可以转化为检验如下方程的系数 因此,只需要回归这个方程,并检验 是否成立。若拒绝原假设,则 和解释变量 存在相关,应选择固定效应模型。 (6) Bootstrap Hausman 检验 传统的 Hausman 检验统计量可定义为 传统 Hausman 检验有效的前提条件是,在原假设为真的情况下,其中一个估计量为完全有效的。然而,实际应用中这个假设通常不被满足。特别地,当利用稳健标准误时,估计量通常非有效。 Bootstrap 方法可以在估计量非有效的情况估计 。假设重复进行 B 次抽样,可以得到 B 个 和 估计值,进而可得到 B 个 估计值。 可以利用下面式子进行估计 其中: 。 三. Stata 实现 本部分以 Kleiber 和 Zeileis (2008) 的 Grunfeld.dta 数据集为例,说明运用面板数据模型的一般步骤。 3.1. 读取数据与面板数据设定 . webuse grunfeld, clear //利用webuse从网络读取数据 . list in 1/10 // 显示该数据集的前10行 image xtset company year,yearly //设置面板数据格式,利用 Stata 中`xt`开头的命令,必须用该命令进行设置。yearly表示年度数据,详细参考 `help xtset` image 3.2. 模型检验与模型选择 本部分内容安排如下: (1)个体效应和随机效应的联合显著性检验,以判别是否需要利用面板数据模型; (2)若表明需用面板数据模型,利用 Hausman 统计量选择固定效应模型或随机效应模型更优; (3)考虑到一般的 Hausman 检验在异方差和自相关情况下失效风险问题,对异方差,序列相关进行检验,以说明是否需要利用其它方法进行选择; (4)针对一般的 Hausman 检验统计量可能为负值且对在异方差和序列相关情况不稳健问题,对 稳健 Hausman 检验 ,修正的 Hausman 统计量, 基于过度识别检验的Wald统计量法 , Mundlak’s (1978)法 , 基于 bootstrap法的hausman检验 等方法的 Stata 实现进行讲解。 (5)在选定固定效应模型或随机效应模型后,依据误差项结构(异方差,序列相关,截面相依)以及不同面板结构(「大 小 」,「大 小 」), 介绍相应的参数估计命令。 (1)个体效应和随机效应的联合显著性检验 以 invest 为因变量, mvalue kstock 为自变量,建立如下模型: 其中: 和 为待估系数。 利用 Stata 中 xtreg 可以方便实现面板固定效应模型与面板随机效应模型的估计。 xtreg 命令的语法如下: image xtreg invest mvalue kstock,fe //fe表示固定效应;若同时包括时期虚拟变量,xtreg invest mvalue kstock i.year,fe,利用 testparm 检验 image xtreg invest mvalue kstock,re //re表示随机效应 image xttest0 //检验随机效应是否显著,需要运行随机效应模型后使用 image (2)Hausman检验 上述结果说明了有必要考虑个体效应和随机效应,接下来利用 hausman 命令进行固定效应模型和随机效应模型的选择,主要步骤为: 步骤一 :估计固定效应模型,存储估计结果; 步骤二 :估计随机效应模型,存储估计结果; 步骤三 :进行 Hausman 检验; 利用 hausman 命令之前,有必要对其语法进行说明: . hausman name-consistent image 接下来进行 hausman 检验, xtreg invest mvalue kstock,fe est store fe_result xtreg invest mvalue kstock,re est store re_result hausman fe_result re_result image (3)异方差和序列相关检验 前文已经说明,当模型误差项存在序列相关或异方差时,此时经典的Hausman 检验不在适用,下面我们进行序列相关和异方差检验。 序列相关检验 先进行序列相关检验,在固定效应模型时可以利用命令 xtserial ,原假设为不存在序列相关。 xtserial invest mvalue kstock image 同样地,在随机效应时可以利用命令 xttest1 ,原假设为不存在序列相关。 image 异方差检验 Greene (2000, p598) 提出一种修正的Wald统计量检验异方差,与标准的Wald统计量、LR和LM统计量不同,修正Wald检验同样适用于模型残差不服从 正态分布情况下。值得一提的是,在大 小 情况下,该方法的检验功效较低。该检验的原假设为同方差。 xtreg invest mvalue kstock,fe xttest3 image (4)模型选择其它方法 第一种: 稳健 Hausman 检验** 目前 Stata 中没有相应的命令进行稳健 Hausman检验, 根据 2.3 中 (2) 部分公式,可以编写如下代码进行检验 webuse grunfeld, clear xtset company year quiet xtreg invest mvalue kstock,re scalar theta = e (theta) global xlist2 invest mvalue kstock sort company foreach x of varlist $xlist2 { by company: egen mean `x' = mean ( `x' ) generate md `x' = `x' - mean `x' generate red `x' = `x' - theta* mean `x' } quiet reg redinvest redmvalue redkstock mdmvalue mdkstock, vce ( cluster company) test mdmvalue mdkstock image 第二种: 修正的 Hausman 统计量 xtreg invest mvalue kstock,fe est store fe_result xtreg invest mvalue kstock,re est store re_result hausman fe_result re_result,sigmamore 输入图片说明 hausman fe_result re_result,sigmaless 输入图片说明 第三种:基于过度识别检验的Wald统计量 xtreg invest mvalue kstock, re cluster (company) xtoverid image 运行后提示需要更高版本的 ivreg2 等命令,可以通过 net install ivreg2,from("http://fmwww.bc.edu/RePEc/bocode/i") 进行更新。然后再运行 image 上述结果表明拒绝 假设,应该选择固定效应模型。 第四种:Mundlak’s (1978)法 根据上文所述原理,可通过如下三个步骤实现该方法: 第一 :计算解释变量 均值 local xlist "mvalue kstock" foreach f of local xlist{ bysort company: egen mean_ `f' = mean ( `f' ) } 第二步 :估计包含均值的回归方程: xtreg invest mvalue kstock mean_mvalue mean_kstock,re vce (robust) est store Mundlak_result 第三步 :利用 test 进行假设检验 test mean_mvalue mean_kstock 结果如下 image 此外,也可以通过外部命令 mundlak 实现相同的系数估计,不过应该注意的是由于 mundlak 不能得到稳健的标准误,得到的标准误和上述 手动运行方法不一致,所以 test 结果也就不一致。 mundlak invest mvalue kstock,full test mean__mvalue mean__kstock image 第五种:基于 bootstrap法的hausman检验 由于存在序列相关和异方差,经典的 hausman 命令不再适用,下面使用基于 bootstrap 的 hausman 检验命令 rhausman 进行检验。 xtreg invest mvalue kstock,fe est store fe_result xtreg invest mvalue kstock,re est store re_result rhausman fe_result re_result,reps(200) cluster image 从检验结果可以发现,利用经典的 hausman 和 bootstrap hausman 均显示应该选择随机效应模型,而利用其他方法结果显示选择固定效应模型。 除了序列相关和异方差检验之外,截面相依检验也尤为重要。在固定效应模型中,可以利用命令 xttest2 进行检验,该方法是基于似不相关回归(SUR)进行 估计,所以一般要求截面数 比时期数 小;在随机效应模型中利用 xtcsd 进行检验,当然该命令也适用于固定效应模型。 (5)相关 Stata 命令推荐 依据误差项结构(异方差,序列相关,截面相依)以及不同面板结构(「大TT小NN」,「大NN小TT」), 下文介绍相应的参数估计命令。 截面相依检验 qui xtreg invest mvalue kstock, fe xttest2 image qui xtreg invest mvalue kstock, re xtcsd, pesaran image 当误差项存在序列相关,异方差或截面相依时,依据形式不同,可以利用不同的方法和命令进行估计,详细可以参考 Hoechle (2007)。 image 几点说明 vce(robust) 和 vce(cluster) : 前者适用于异方差且观测值之间独立情况(heteroscedasticity-consistent standard errors);后者 适用于异方差且允许观测值组内相关。例如 cluster(group) 的含义是:假设干扰项在 group 之间不相关,而在 group 内部存在相关性。 若 group 代表行业类别,则表示行业间的公司所面临的随机干扰不相关,而行业内部不同公司间的干扰项存在相关性,或者是说,行业内的公司受到了一些共同的干扰因素。这部分内容将在后续的推文中详细介绍。 固定效应模型与随机效应模型选择,学者们存在不同的观点。一些学者检验利用严格的统计检验选择,有些学者认为应该根据实际分析的需要进行选择,比如主要变量为不随时变的,那则必须采用随机效应模型。 面板固定效应模型的估计除了可利用 xtreg,fe 进行估计外,也可以利用 areg 或者 reg + dummy variables 进行估计,注意这些方法的差异。 上文中涉及到的一些命令,如 xttest0 , xttest1 , xttest2 , xttest3 , xtserial , xtcsd , rhausman 等需要下载安装。   4. 总结 虽然本文系统地介绍了静态面板数据模型的各种检验方法,但从现有的文献来看,实操层面的做法往往是单刀直入,甚至多少有些粗暴。 具体而言: 多数情况下 (90% 以上),学者们都直接使用 FE,而 RE 则鲜有使用 (至少在公司金融和会计领域是如此)。 如果一定要在 FE 和 RE 之间进行筛选 (通常是为了应对审稿人),建议采用假设较为宽松的 稳健 Hausman 检验 ( help xtoverid ) 或 bootstrap hausman 检验法 ( help rhausman )。 在估计 FE 时,主流的做法是使用 「双向固定效应模型+聚类标准误」 ,即同时包含个体效应与时间效应的面板固定效应模型。对应的 Stata 命令为: xtreg y x1 x2 i.year, fe robust 。注意:若仅关注系数估计值和其标准误,该命令等价于 xtreg y x1 x2 i.year, vce(cluster id) 以及 reg y x1 x2 i.id i.year, vce(cluster id) 。换言之, xtreg, fe robust 中的 robust 选项本身就是在公司层面上聚类调整后的异方差稳健性标准误。   附录:文中所用 Stata dofiles clear webuse grunfeld, clear //利用webuse从网络读取数据 list in 1/10 // 显示该数据集的前10行 xtset company year,yearly //设置面板数据格式 xtreg invest mvalue kstock,fe //fe表示固定效应;若同时包括时期虚拟变量,xtreg invest mvalue kstock i.year,fe,利用 testparm 检验 xtreg invest mvalue kstock,re //re表示随机效应 xttest0 //检验随机效应是否显著,需要运行随机效应模型后使用 ** 传统 hausman 检验 xtreg invest mvalue kstock,fe est store fe_result xtreg invest mvalue kstock,re est store re_result hausman fe_result re_result xtserial invest mvalue kstock //序列相关检验,随机效应可以使用xttest1 xtreg invest mvalue kstock,fe xttest3 //异方差检验 ** 稳健 hausman 检验方法 quiet xtreg invest mvalue kstock,re scalar theta = e (theta) global xlist2 invest mvalue kstock sort company foreach x of varlist $xlist2 { by company: egen mean `x' = mean ( `x' ) generate md `x' = `x' - mean `x' generate red `x' = `x' - theta* mean `x' } quiet reg redinvest redmvalue redkstock mdmvalue mdkstock, vce ( cluster company) test mdmvalue mdkstock **修正hausman检验方法 xtreg invest mvalue kstock,fe est store fe_result xtreg invest mvalue kstock,re est store re_result hausman fe_result re_result,sigmamore hausman fe_result re_result,sigmaless ** 基于过度识别检验法 xtreg invest mvalue kstock, re cluster (company) xtoverid ** Mundlak’s (1978)法 local xlist "mvalue kstock" foreach f of local xlist{ bysort company: egen mean_ `f' = mean ( `f' ) } xtreg invest mvalue kstock mean_mvalue mean_kstock,re vce (robust) est store Mundlak_result test mean_mvalue mean_kstock ** 基于 bootstrap 法的 hausman 检验 xtreg invest mvalue kstock,fe est store fe_result xtreg invest mvalue kstock,re est store re_result rhausman fe_result re_result,reps(200) cluster ** 截面相依检验 qui xtreg invest mvalue kstock, fe xttest2 qui xtreg invest mvalue kstock, re xtcsd, pesaran   参考文献 钟经樊和连玉君.计量分析与 STATA 应用,2010. Hoechle D. Robust standard errors for panel regressions with cross–sectional dependence . Stata Journal, 2007, 7(3):281- Breusch T S, Pagan A R. The Lagrange Multiplier Test and its Applications to Model Specification in Econometrics . Review of Economic Studies, 1980, 47(1):239-253. Mundlak, Y. On the pooling of time series and cross section data. Econometrica, 1978, 46:69-85. Greene, W. 2000. Econometric Analysis. Upper Saddle River, NJ: Prentice--Hall. How can the standard errors with the vce(cluster clustvar) option be smaller than those without the vce(cluster clustvar) option? https://www.stata.com/support/faqs/statistics/standard-errors-and-vce-cluster-option/ https://blog.stata.com/2015/10/29/fixed-effects-or-random-effects-the-mundlak-approach/ Kleiber C, Zeileis A (2008). Applied Econometrics with R. Springer-Verlag, New York. ISBN978-0-387-77316-2, URL https://cran.r-project.org/package=AER . Arellano, M. 1993. On the testing of correlated effects with panel data. Journal of Econometrics, Vol. 59, Nos. 1-2, pp. 87-97. 10.Wooldridge, J.M. 2002. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press. 关于我们 【 Stata 连享会(公众号:StataChina) 】由中山大学连玉君老师团队创办,旨在定期与大家分享 Stata 应用的各种经验和技巧。 公众号推文同步发布于 CSDN-Stata连享会 、 简书-Stata连享会 和 知乎-连玉君Stata专栏 。可以在上述网站中搜索关键词 Stata 或 Stata连享会 后关注我们。 点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。 Stata连享会 精彩推文1 || 精彩推文2 联系我们 欢迎赐稿: 欢迎将您的文章或笔记投稿至 Stata连享会(公众号: StataChina) ,我们会保留您的署名;录用稿件达 五篇 以上,即可 免费 获得 Stata 现场培训 (初级或高级选其一) 资格。 意见和资料: 欢迎您的宝贵意见,您也可以来信索取推文中提及的程序和数据。 招募英才: 欢迎加入我们的团队,一起学习 Stata。合作编辑或撰写稿件五篇以上,即可 免费 获得 Stata 现场培训 (初级或高级选其一) 资格。 联系邮件: StataChina@163.com 往期精彩推文 Stata连享会 计量专题 || 精品课程 || 推文集锦 点击查看完整推文列表 欢迎加入Stata连享会(公众号: StataChina)
个人分类: 面板数据|505 次阅读|0 个评论
分享 reghdfe:多维面板固定效应估计
arlionn 2019-8-7 21:50
  作者:胡雨霄 (伦敦政治经济学院)   Stata 连享会: 知乎 | 简书 | 码云 | CSDN   Stata连享会 计量专题 || 精品课程 || 推文集锦 点击查看完整推文列表   连享会计量方法专题……   实证分析中,我们经常需要控制各个维度的个体效应,以便尽可能减轻 遗漏变量 导致的偏误。在最常用的二维面板数据中,我们通常会采用 xtreg y x i.year, fe 的形式来控制 公司个体效应 和 年度效应 。然而,在有些情况下,我们需要对三维甚至更高维度的数据进行分析 (例如, 公司-年度-高管 , 省份-城市-行业-年度 ),此时,一方面要考虑估计的可行性,另一方面还需兼顾计算速度问题。 本文介绍的 reghdfe 命令可以很好地达成上述目的。 reghdfe 主要用于实现多维固定效应线性回归。该命令类似于 areg 及 xtreg,fe ,但允许引入多维固定效应。此外,该命令在运行速度方面远远优于 areg 及 xtreg , 因此倍受研究者青睐。 本文对该命令的介绍基于 A Feasible Estimator for Linear Models with Multi-Way Fixed Effects (Correia, 2016 ) 。 1. 命令的安装 ssc install reghdfe, replace ///安装命令 2. 命令的语法 该命令的具体语法如下: reghdfe depvar , absorb(absvars) 其中, depvar : 因变量 indepvars : 解释变量 absorb(absvars) :引入固定效应 可以包含多维固定效应,即 absorb (var1,var2,var3,...) 。若想保存对某变量的固定效应,则运行命令 absorb (var1,var2,FE3=var3) , 变量 FE3 将保存对 var3 的固定效应估计结果。 可以包含不同效应间的交互影响,即 absorb(var1#var2) 。 值得注意的是, reghdfe 允许定类变量 (categorical variable) 与连续性变量 (continuous variable) 进行交互,即 absorb(i.var1#c.var2) 。实证中很少引入这样的交互项。但如果对该问题感兴趣,可参考 Duflo (2014) 。 3. 命令的操作 这一部分用两个实证的例子介绍如何运用 reghdfe 。 3.1 估计双重差分的固定效应模型(DID) 该命令可用于估计双重差分的固定效应模型(DID)。过去推文 Stata: 双重差分的固定效益模型 列举了用于估计 DID 模型的三个命令: reg , areg , 以及 xtreg 。 reghdfe 也可实现同样的估计结果,而且运行速度优于其他命令。 使用的数据请参考之前推文 Stata: 双重差分的固定效应模型 。该数据模拟的情况为,政策冲击发生在 时,对照组为 ,控制组为 。模型为 。 . set obs 400 . gen firm=_n ///生成企业数量 . expand 24 . bysort firm: gen t=_n ///时间跨度设定为24个季度(6年) . gen d=(t= 14 ) . label var d "=1 if post-treatment" ///设定事件冲击发生在第14期 . gen r=rnormal() . qui sum r, d . bysort firm: gen i=(r=r(p50)) if _n== 1 . bysort firm: replace i=i if i==. _n!= 1 ///设定处理组和对照组 . drop r . label var i "=1 if treated group, =0 if untreated group" . gen e = rnormal() ///设定随机变量 . label var e "normal random variable" . gen y = 0.3 + 0.19 *i + 1.67 *d + 0.56 *i*d + e ///模型设置 首先,回顾双重差分模型的设定形式, 其中, 为分组虚拟变量(处理组=1,控制组=0); 为分期虚拟变量(政策实施后=1,政策实施前=0);交互项 表示处理组在政策实施后的效应。 与 分别为个体固定效应和时间固定效应。 具体用于估计政策冲击对公司的影响的命令如下。 gen did = i* d ///生成交互项 reghdfe y did, absorb(firm t) vce ( cluster firm) 变量 did 即为交互项,其系数为双重差分模型重点考察的处理效应。命令 absorb(firm t) 同时引入了公司固定效应以及时间固定效应。结果如下。 . reghdfe y did, absorb(firm t) vce(cluster firm) (MWFE estimator converged in 2 iterations) HDFE Linear regression Number of obs = 9 , 600 Absorbing 2 HDFE groups F( 1 , 399 ) = 175.80 Statistics robust to heteroskedasticity Prob F = 0.0000 R-squared = 0.5102 Adj R-squared = 0.4875 Within R-sq. = 0.0198 Number of clusters (firm) = 400 Root MSE = 1.0043 (Std. Err. adjusted for 400 clusters in firm) ------------------------------------------------------------------------------ | Robust y | Coef. Std. Err. t P|t| -------------+---------------------------------------------------------------- did | .5656247 .0426601 13.26 0.000 .4817581 .6494914 _cons | 1.143579 .0084565 135.23 0.000 1.126954 1.160204 ------------------------------------------------------------------------------ Absorbed degrees of freedom: -----------------------------------------------------+ Absorbed FE | Categories - Redundant = Num. Coefs | -------------+---------------------------------------| firm | 400 400 0 *| t | 24 0 24 | -----------------------------------------------------+ * = FE nested within cluster; treated as redundant for DoF computation 3.2 估计多维固定效应的线性模型(复制一篇 AER 论文) 这一小节将介绍如何运用 reghdfe 估计多维固定效应的线性模型。American Economic Review一篇文章,The Costs of Patronage: Evidence from the British Empire (Xu, 2018), 提供的可供复制的 代码 中出现了大量 reghdfe 命令。本小节介绍该作者如何用 reghdfe 命令输出其文章Table 2第六列的结果。 Source: Xu, G. (2018). The Costs of Patronage: Evidence from the British Empire. American Economic Review, 108 (11): 3170-98. 作者在这篇文章中想要探究 任命制 (patronage) 对英国 政治体系 的影响。具体于 Table2,作者意图研究社会联系(social connections) 是否会影响政府官员的工资水平。Table 2中,第六列所估计的回归为: 其中, 为政府官员 于时间 在 州执政时的对数工资水平。Stata 命令中,该变量名为 log_salary_governor_gbp 为虚拟变量(Dummy Variable),当政府官员与其上任官员存在社会联系时,该变量取1。如若不然,则取0。社会联系包括:共同祖先,贵族身份以及教育背景。Stata 命令中,该变量名为 connected 为政府官员固定效应。该部分的设置为了解决政府官员的异质性 (heterogeneity) 问题。例如,具有较强能力的政府官员更有可能建立更多的社会关系。Stata 命令中, aid 为不同官员的 unique ID 变量。 为政府官员执政时长固定效应。设置该部分是因为,执政时间的长短可能也会对社会关系产生影响。Stata 命令中, duration 为官员执政时长变量。 为控制变量。作者选用了执政者在历史上执政过的州的数目。Stata 命令中,该变量名为 no_colonies 。 为年份固定效应。该部分的设置是为了吸收执政者们在不同时期受到的共同时间冲击。Stata 命令中, year 为年份变量。 为残差。作者使用了聚类标准误的方法。 该回归的原假设为, : 社会联系 ( connected ) 与政府官员的工资水平 ( log_salary_governor_gbp ) 无关。若 connected 的系数 不显著,则不拒绝原假设。若 显著,则拒绝原假设,并可以判定社会联系对政府官员的工资水平显著相关。 用 Stata 实现该回归的命令如下。 reghdfe log_salary_governor_gbp no_colonies connected, /// absorb(aid year duration) vce ( cluster bilateral) 其中, absorb(aid year duration) 同时引入了官员固定效应、时间固定效应以及执政时长固定效应。 命令运行后的结果如下所示。数据请于AER 下载 。 . quietly use "analysis.dta" , replace . reghdfe log_salary_governor_gbp no_colonies connected, /// absorb(aid year duration) vce ( cluster bilateral) (MWFE estimator converged in 26 iterations) HDFE Linear regression Number of obs = 3,510 Absorbing 3 HDFE groups F ( 2, 1517) = 25.45 Statistics robust to heteroskedasticity Prob F = 0.0000 R-squared = 0.9255 Adj R-squared = 0.9109 Within R-sq. = 0.0978 Number of clusters (bilateral) = 1,518 Root MSE = 0.2374 (Std. Err . adjusted for 1,518 clusters in bilateral) ------------------------------------------------------------------------------ | Robust log_salary~p | Coef. Std. Err . t P|t| -------------+---------------------------------------------------------------- no_colonies | .2234767 .0347473 6.43 0.000 .1553189 .2916346 connected | .0972969 .0355508 2.74 0.006 .0275628 .1670309 _cons | 7.485619 .065766 113.82 0.000 7.356617 7.614621 ------------------------------------------------------------------------------ Absorbed degrees of freedom: -----------------------------------------------------+ Absorbed FE | Categories - Redundant = Num. Coefs | -------------+---------------------------------------| aid | 456 0 456 | year | 110 1 109 | duration | 7 1 6 ?| -----------------------------------------------------+ ? = number of redundant parameters may be higher 上述结果表明,变量 connected 的系数为 0.097, 标准误为 0.036。这说明该变量在 1% 的水平上显著大于 0 。其经济学含义为,与上一任官员存在社会联系的官员,相较于无社会联系的官员,工资水平要高出 9.7%。也就是说,官员的工资水平和其社会关系显著相关。 4.结语 这篇推文主要介绍了如何在实证中运用 reghdfe .具体而言,本推文列举了两个例子。其一,为运用该命令对 DID 模型进行估计。其二,为运用该命令进行多维固定效应线性模型的估计。 文献来源 Correia, S. (2016). Linear Models with High-Dimensional Fixed Effects: An Efficient and Feasible Estimator, Working Paper. Duflo, E. (2004). The medium run effects of educational expansion: Evidence from a large school construction program in Indonesia. Journal of Development Economics , 74(1), 163-197. Xu, G. (2018). The Costs of Patronage: Evidence from the British Empire. American Economic Review , 108 (11): 3170-98.   连享会计量方法专题……   关于我们 【 Stata 连享会(公众号:StataChina) 】由中山大学连玉君老师团队创办,旨在定期与大家分享 Stata 应用的各种经验和技巧。 公众号推文同步发布于 CSDN-Stata连享会 、 简书-Stata连享会 和 知乎-连玉君Stata专栏 。可以在上述网站中搜索关键词 Stata 或 Stata连享会 后关注我们。 点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。 Stata连享会 精品专题 || 精彩推文 联系我们 欢迎赐稿: 欢迎将您的文章或笔记投稿至 Stata连享会(公众号: StataChina) ,我们会保留您的署名;录用稿件达 五篇 以上,即可 免费 获得 Stata 现场培训 (初级或高级选其一) 资格。您也可以从 连享会选题平台 → 中选择感兴趣的题目来撰写推文。 意见和资料: 欢迎您的宝贵意见,您也可以来信索取推文中提及的程序和数据。 招募英才: 欢迎加入我们的团队,一起学习 Stata。合作编辑或撰写稿件五篇以上,即可 免费 获得 Stata 现场培训 (初级或高级选其一) 资格。 联系邮件: StataChina@163.com 往期精彩推文 Stata连享会 计量专题 || 精品课程 || 推文集锦 点击查看完整推文列表 欢迎加入Stata连享会(公众号: StataChina)
个人分类: 面板数据|178 次阅读|0 个评论
分享 Stata: 面板 Granger 因果检验
arlionn 2019-8-7 08:37
作者:李珍 (厦门大学) Stata 连享会: 知乎 | 简书 | 码云 | CSDN Source: Luciano Lopez, Sylvain Weber, 2017, Testing for Granger Causality in Panel Data, Stata Journal, 17(4): 972–984. Stata连享会 计量专题 || 精品课程 || 推文集锦 点击查看完整推文列表   随着面板数据库规模的扩大,围绕面板数据因果关系的理论也迅速发展。面板数据正从具有大样本量( N )和较短时间维度( T )的微观面板数据转变为到具有大样本量( N )和长的时间维度(T)的宏观面板数据。在这种情况下,就需要注意时间序列计量经济学的经典问题,即(非)平稳性和(非)因果关系。 在本文中,我们介绍了社区贡献的外部命令 xtgcause ,它实现了 Dumitrescu 和 Hurlin (2012) 提出的面板数据中 Granger 因果关系的检验过程。 xtgcause 通过最小化 Akaike 信息准则 ( AIC )、贝叶斯信息准则 ( BIC ) 和 Hannan-Quinn 信息准则 ( HQIC ) 来选择模型中的滞后阶数,同时,它提供了 bootstrap 方法来计算 p 值和临界值。   1. Dumitrescu-Hurlin 检验 (DH 检验) 1.1 Granger 因果检验的基本思想 Granger (1969) 开创性地提出一种分析时间序列数据因果关系的方法。 假设 和 是两个平稳的序列,我们可以用如下模型来检验 是不是导致 变动的原因: 其基本思想在于,在控制 的滞后项 (过去值) 的情况下,如果 的滞后项仍然有助于解释 的当期值的变动,则认为 对 产生因果影响。 检验的原假设为: 这可以通过构造 F 统计量进行检验。如果 F 检验拒绝 ,则认为存在因果关系,即 是 的 Granger 因。显然,我们可以互换 和 的位置,以便检验 是否为 的 Granger 因。在很多情况下都会出现模型中所有变量之间都存在双向因果关系。 1.2 Dumitrescu-Hurlin 的拓展 Dumitrescu-Hurlin (2012) 在此基础上进行了拓展,提供了一个检验面板数据因果关系的方法。潜在的回归模型是: 其中, ; 。 和 是两个平稳序列在个体 和时间 上的观测值。 DH 的面板因果检验允许每个截面单元的回归系数是可变的(即在同一时间上,系数在个体之间不同)。假设滞后阶数 对于所有个体是相同的,并且面板必须是平稳的。 类似于 Granger 因果检验,DH 检验也是通过 的过去值对 的现值的影响来判断因果关系。 检验统计量 原假设认为面板中的所有个体都不存在因果关系,即: 备择假设为部分(不是所有的)个体存在因果关系: 其中, 是未知的。 如果 ,则面板中的所有个体都存在因果关系。 必须严格小于 。 实现方法 在实际操作方面,DH 提出运行包含在 (1) 式中的 N 个独立回归,执行 个线性假设的 F 检验来获得 Wald 统计量 ,最后计算 Wald 统计量的平均值 DH 检验的目的在探索面板数据的因果关系,拒绝 并不排除一些个体的非因果关系。使用蒙特卡罗模拟(Monte Carlo Simulation), DH 发现 的渐进表现良好,可以用来检测面板因果关系。 在 Wald 统计量 是独立同分布的假设下,当 和 ,标准化的统计 服从下面的正态分布: 而且,对一个 的固定的 维度来说,最大标准统计量 服从以下正态分布: 原假设 (3) 的检验也是基于 和 。如果这些值大于标准化值,则拒绝原假设 ,认为 Granger 因果存在。对 和 足够大的面板数据来说,使用 统计量是合理的。对 足够大但 相对较小的面板数据而言,也可以使用 统计量。对于 和 都很小的样本数据而言, DH 用蒙特卡洛推断说明了检验具有良好的样本性。 滞后阶数的选取 滞后阶数 的选择是一个经验问题,但是 Dumitrescu 和 Hurlin ( 2012 ) 并没有说明。解决这个问题的一个方法就是根据信息准则( AIC / BIC / HQIC )选择滞后阶数。在这个过程中,所有估计都要被嵌套在公共样本中执行、进而可以进行比较。事实上,这意味着 时间序列在整个滞后选择过程中被忽略掉了。另一个需要考虑的现实问题是面板数据中的横截面依赖性。为此,在 Dumitrescu 和 Hurlin ( 2012 ) 在 6.2 节中提出了一个计算 bootstrapped 临界值而不是渐进临界值:具体步骤为: 拟合模型 (2),根据(4)和(5)中的定义获得 和 ; 在 假设下拟合模型,得到残差矩阵 ; 重新抽取矩阵 ,形成 ; 随机抽取 , 令 ,其中 为可重复的连续时间序列 ; 根据 期随机抽取,构建 重抽样序列; 拟合模型 ,计算 和 ; 重复步骤 3-6 ; 根据 和 的分布,计算 P 值、和 和 的标准值。 DH 的面板因果是允许每个截面单元的回归系数可变的,因此 统计量也是多个 的平均值,叫做 统计量。检验结果主要看最后一列相伴概率,可知所有变量都是双向因果的。 Stata连享会 计量专题 || 公众号合集 || 推文集锦 点击查看完整推文列表   2. xtgcasue 命令 2.1 语法结构 xtgcause depvar indepvar /// | | hqic ) /// regress bootstrap breps (#) /// blevel(#) blength (#) seed(#) nodot ] 2.2 选项 lags(#laic | bic | hqic ) 指出之后结构以执行回归计算统计量。默认滞后一阶,即 lags(1) 。 lags(#) 指定序列滞后阶数 # 需要在回归中应用。最大滞后阶数为 T5+3*# 。 lags(#laic | bic | hqic ) 要求序列滞后阶数选择应根据回归设定最小的 AIC / BIC / HQIC 的平均。执行 1 阶至 # 阶滞后回归,将所有估计样本量限制为 T-#,使模型具有嵌套并具有可比性。显示的统计量来源于 AIC / BIC/ HQIC 平均值最小回归集。 regress 可用于显示基于的 N 个的回归的检验的结果。此选项有助于查看单个回归的系数。当面板中的样本数量足够大时,此选项的输出非常长。 bootstrap 按照 Dumitrescu 和 Hurlin(2012,sec.6.2) 的方法计算 P 值和临界值。 使用 bootstrap 能够克服数据中横截面存在依赖性。 breps (#) 表示 bootstrap 重复的次数,默认为 breps(1000)。 blevel (#) 表示 bootstrap 计算的临界值的显著性水平,默认为 blevel(95) 。 blength(#) 表示 bootstrap 的模块长度大小。默认每一时间段抽样独立且替代 blength(1) 。 blength() 允许将样本划分为 # 时间段的重复块,并从中非替代独立抽样来完成 bootstrap 。如果怀疑存在自相关,则使用超过一个时间段是有用的。 seed(#) 用来设定随机数种子,默认为不设置。 nodots 抑制重复点,默认为每次重复就打印一个点,以指示 bootstrap 的演变。 breps () , blevel () , blength () , seed () 以及 nodots 都是 bootstrap 的子选项。只有在 bootstrap 设定的情况下才能使用。 2.3 结果的存储 xtgcause 存储在下述的 r() 标量中 r(wbar) 表示 Wald 统计量的平均值 r(zbart) 表示 Z-bar tilde 统计量 r(lags) 表示 检验的滞后阶数 z(bart_pv) 表示 Z-bar tilde 统计量的 P 值 r(zbar) 表示 Z-bar统计量 r(zbart_pv) 表示 Z-bar tilde 的 P 值 Matrices r(Wi) 表示个体的 Wald 统计量, r(PVi) 表示个体的 Wald 统计量对应的 P 值 使用 bootstrap 的 xtgcause 也存储在下列 r() 标量中 r(zbarb_cv) 表示 Z-bar 统计量的临界值 r(blevel) 表示 bootstrap 临界值的显著性水平 r (zbartb_cv) 表示 Z-bar tilde 统计量的临界值 r(blength) 表示 block 长度的大小 r(breps) 表示 bootstrap的重复次数 r(ZBARb) 表示 bootstrap 产生的 Z-bar 统计量 r(ZBARTb) 表示 bootstrap 产生的 Z-bar tilde 统计量   3. Stata 范例 xtgcause 命令假定所有的变量都是平稳的。用 xtunitroot ,可以提供多种面板稳定性检验。我们也可以用来进行二代单位根检验,例如 Pesaran 提出的控制横断面非独立性。 3.1 基于模拟数据的例子 为了解释说明 xtgcause ,首先使用 Dumitrescu 和 Hurlin (2012) 提供的 。可以直接从网站将数据导入 Stata。在原始 CSV 表格中,数据是矩阵形式,每一个样本的所有观测值都在同一个单元格中。在这个单元格中,变量 x 的 10 个值之间用空格分开, x 的最后一个值和 y 的第一个值用逗号隔开,然后变量 y 的 10 个值之间仍旧使用空格间隔。因此,下面几行命令以让 Stata 的了解数据结构,以进行转换。 . insheet using "http://www.execandshare.org/execandshare/htdocs/data/MetaSite/upload/companionSite51/data/data-demo.csv" , /// delimiter( "," ) clear //导入数据,生成 x 和 y ,每一个变量各包括 10 个值。 **注意:对于 Stata 13.0 以上版本运行,还可以使用 import delimited . split x, parse (`= char (9)') destring . split y, parse (`= char (9)') destring . drop x y . gen t = _n . reshape long x y, i (t) j (id) . xtset id t //设定为面板数据 . list id t x y in 2/7 +----------------------------------+ | id t x y | |----------------------------------| 2. | 2 1 -1.4703536 1.2586422 | 3. | 3 1 -.38944513 -.90265296 | 4. | 4 1 1.5032091 .09225216 | 5. | 5 1 -1.2006193 .12203134 | 6. | 6 1 -2.0245606 .93400482 | |----------------------------------| 7. | 7 1 -.5433985 -.22942822 | +----------------------------------+ xtgcause 的基本语法 首先,我们使用 xtgcause 的默认情况进行操作(即使用滞后一阶,不设定更长的滞后阶数),在这种情况下,检验的结果为接受原假设。结果包括 w(w-bar) , z(z-bar tilde) 。对后两个统计量来说,还提供了就标准正态分布的 P 值。 . xtgcause y x //检验 x 是否导致了 y Dumitrescu Hurlin (2012) Granger non-causality test results: -------------------------------------------------------------- Lag order : 1 W-bar = 1.2909 Z-bar = 0.6504 (p-value = 0.5155) Z-bar tilde = 0.2590 (p-value = 0.7956) -------------------------------------------------------------- H0: x does not Granger-cause y. H1: x does Granger-cause y for at least one panelvar (id). Wald 统计量 也可以使用 Stata 的返回值 r(Wi) 和 r(PVi) 展示 Wald 统计量和相关值(首先将其整合成一个简单矩阵以节省空间): matrix Wi_PVi = r(Wi), r(PVi) matrix list Wi_PVi Wi_PVi Wi PVi id1 .56655945 .46256089 id2 .11648998 .73731411 id3 .09081952 .76701924 id4 8.1263612 .01156476 id5 .18687517 .67129995 id6 .80060395 .38417583 id7 .53075859 .47681675 id8 .00158371 .96874825 id9 .43635413 .5182858 id10 2.0521113 .17124367 设定滞后阶数 使用 lags() 选项,可以进行 x 和 y 的二阶滞后检验,检验结果和之前类似。 . xtgcause y x, lags(2) Dumitrescu Hurlin (2012) Granger non-causality test results: -------------------------------------------------------------- Lag order : 2 W-bar = 1.7302 Z-bar = -0.4266 (p-value = 0.6696) Z-bar tilde = -0.7052 (p-value = 0.4807) -------------------------------------------------------------- H0: x does not Granger-cause y. H1: x does Granger-cause y for at least one panelvar (id). 基于 Bootstrap 的标准误 我们也可以使用 bootstrapped 计算 P 值和临界值,在这种情况下, bootstrapped 的 P 值和第一次检验中的渐进 P 值相近。 . xtgcause y x, bootstrap lags(1) breps(100) seed(20190802) ---------------------------- Bootstrap replications (100) ---------------------------- .................................................. 50 .................................................. 100 Dumitrescu Hurlin (2012) Granger non-causality test results: -------------------------------------------------------------- Lag order : 1 W-bar = 1.2909 Z-bar = 0.6504 (p-value* = 0.5800, 95% critical value = 2.7526) Z-bar tilde = 0.2590 (p-value* = 0.8400, 95% critical value = 1.9042) -------------------------------------------------------------- H0: x does not Granger-cause y. H1: x does Granger-cause y for at least one panelvar (id). *p-values computed using 100 bootstrap replications. 3.2 现实数据的例子 以 Paramati, Ummalla 和 Apergis (2016) 论文中使用的 清洁能源的外国直接投资和股票市场增长率数据 为例,重现文章的结果分析。 首先,将网站的数据下载,并导入Stata ,进行设定。需要说明的是,在使用 import excel 命令时, 还可以增加 "case(preserve|lower|upper)" 选项来设置变量名的大小写。 . import excel "Data.xlsx" , clear first /// cellrange(A1:J461) sheet(LN-EU) . xtset ID Year panel variable: ID (strongly balanced) time variable: Year, 1993 to 2012 delta: 1 unit 使用 xtgcause 来检验因果关系,和文中表 8 的结果一致。我们使用滞后 2 阶的数据和 Paramati, Ummalla 和 Apergis ( 2016 ) 中附录的数据匹配。和他们的结果相比,Eviews 中 Zbar-Stat 和 Z-bar tilde 统计量是一致的( Eviews 中不提供 Zbar ) 此外, xtgcause 可以自行设置滞后阶数,同时保证 AIC , BI , HQIC 最小化。Dumitrescu 和 Hurlin ( 2012 ) 并没有提供滞后阶数的选择,这就需要根据使用者经验判断。举例来说,我们可以通过 output fdi 设定滞后选项 lags(bic) 事实上, xtgcause 可以进行滞后 1 阶至最高阶 T5+3K 或者使用者自行设定限制值以下的回归。此外,如果 5 阶滞后都被考虑,面板中最初的 5 个观测值就不在估计中,即使滞后阶数可以比 5 少。 这确保了嵌套模型,然后可以使用 AIC ,BIC 或 HQIC 对其进行适当比较。 在这一系列估计之后, xtgcause 选择最佳结果(即,使得 N 个个体估计的平均 AIC / BIC / HQIC 最低)并且使用最佳滞后数并使用所有可用观察值重新运行所有估计。 对后者的统计数据报告为输出。 在上面的例子中,使用 BIC 的最优滞后阶数 1 ,这与 Paramati , Ummalla 和 Apergis ( 2016 ) 为此检验选择的滞后顺序不同。这种差异可能会造成检验的结果是相反的。更确切地说,原假设不会因为最佳选择的单一滞后所拒绝,但 Paramati , Ummalla 和 Apergis ( 2016 ) 使用了两个滞后,因此拒绝零假设。 考虑到经济学中的实证研究被用于制定政策建议,这种不准确的结论可能是有害的。 因此,我们考虑使用 xtgcause 的选项,允许用户根据 AIC / BIC / HQIC 选择滞后数。 它将允许研究人员依赖这些广泛接受的标准清楚地选择。 最后, xtgcause 通过 bootstrap 过程使得计算与 z-bar 和 z-bar tilde 相关的 P 值和临界值。计算 bootstrapped 临界值(而不是相似估计)可以非常有用当面板非独立。基于 Paramati, Ummalla 和 Apergis ( 2016 ) 数据,我们检验了因果关系从 output 到 fdi ,通过添加 bootstrap 选项(我们也为了replicability 使用 seed,节省空间使用nodots)。 这里 xtgcause 首先使用前一系列估计中的最优滞后数来计算 Z-bar 和 Z-bar tilde 统计量; 然后,它计算了 bootstrapped 的 P 值和临界值。 默认情况下,每次形成 1000 次 bootstrap 重复。 我们观察到,与之前获得的渐近 P 值(从 0.34 到 0.45 )相比, Z-bar 的 bootstrapped的 P 值显着增加,而 Z-bar tilde的 P 值保持更接近。 这应该被解释为估计遭受小样本偏差的信号,因此低估了渐近 P 值。 Bootstrapped P 值表明零假设远未被拒绝,这加强了对 Paramati , Ummalla 和 Apergis ( 2016 ) 基于渐近 P 值并以两个滞后获得的结论的担忧。   4. 结论 在本文中,我们介绍了社区贡献的外部命令 xtgcause ,该命令实现了 Dumitrescu 和 Hurlin(2012) 提出的面板数据 Granger 因果关系的检验。 xtgcause 命令的一个重要贡献是允许用户根据 AIC ,BIC 或 HQIC 选择滞后阶数。 xtgcause 还可以计算 bootstrapped 临界值,以克服横截面的非独立。 5. 参考文献 Berkowitz, J., and L. Kilian. 2000. Recent developments in bootstrapping time series. Econometric Reviews 19: 1- 48. Breitung, J. 2000. The local power of some unit root tests for panel data. In Advances in Econometrics: Vol. 15——Nonstationary Panels, Panel Cointegration, and Dynamic Panels , ed. B. H. Baltagi, 161-178. New York: Elsevier. Dumitrescu, E.-I., and C. Hurlin. 2012. Testing for Granger non-causality in heteroge- neous panels. Economic Modelling 29: 1450-1460. Granger, C. W. J. 1969. Investigating causal relations by econometric models and cross-spectral methods. Econometrica 37: 424-438. Hadri, K. 2000. Testing for stationarity in heterogeneous panel data. Econometrics Journal 3: 148-161. Harris, R. D. F., and E. Tzavalis. 1999. Inference for unit roots in dynamic panels where the time dimension is fixed. Journal of Econometrics 91: 201-226. Im, K. S., M. H. Pesaran, and Y. Shin. 2003. Testing for unit roots in heterogeneous panels. Journal of Econometrics 115: 53-74. Levin, A., C.-F. Lin, and C.-S. J. Chu. 2002. Unit root tests in panel data: Asymptotic and finite-sample properties. Journal of Econometrics 108: 1- 24. Luciano Lopez, Sylvain Weber, 2017, Testing for Granger Causality in Panel Data, Stata Journal, 17(4): 972–984. Paramati, S. R., N. Apergis, and M. Ummalla. 2017. Financing clean energy projects through domestic and foreign capital: The role of political cooperation among the EU, the G20 and OECD countries. Energy Economics 61: 62- 71. Paramati, S. R., M. Ummalla, and N. Apergis. 2016. The effect of foreign direct invest- ment and stock market growth on clean energy use across a panel of emerging market economies. Energy Economics 56: 29- 41. Pesaran, M. H. 2007. A simple panel unit root test in the presence of cross-section dependence. Journal of Applied Econometrics 22: 265- 312. Salahuddin, M., K. Alam , and I. Ozturk. 2016. The effects of Internet usage and eco- nomic growth on CO2 emissions in OECD countries: A panel investigation. Renewable and Sustainable Energy Reviews 62: 1226-1235. Stine, R. A. 1987. Estimating properties of autoregressive forecasts. Journal of the American Statistical Association 82: 1072-1078.   连享会计量方法专题…… 关于我们 【 Stata 连享会(公众号:StataChina) 】由中山大学连玉君老师团队创办,旨在定期与大家分享 Stata 应用的各种经验和技巧。 公众号推文同步发布于 CSDN-Stata连享会 、 简书-Stata连享会 和 知乎-连玉君Stata专栏 。可以在上述网站中搜索关键词 Stata 或 Stata连享会 后关注我们。 点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。 Stata连享会 精品专题 || 精彩推文 联系我们 欢迎赐稿: 欢迎将您的文章或笔记投稿至 Stata连享会(公众号: StataChina) ,我们会保留您的署名;录用稿件达 五篇 以上,即可 免费 获得 Stata 现场培训 (初级或高级选其一) 资格。您也可以从 连享会选题平台 → 中选择感兴趣的题目来撰写推文。 意见和资料: 欢迎您的宝贵意见,您也可以来信索取推文中提及的程序和数据。 招募英才: 欢迎加入我们的团队,一起学习 Stata。合作编辑或撰写稿件五篇以上,即可 免费 获得 Stata 现场培训 (初级或高级选其一) 资格。 联系邮件: StataChina@163.com 往期精彩推文 Stata连享会推文列表 Stata连享会 计量专题 || 精品课程 || 推文集锦 点击查看完整推文列表 欢迎加入Stata连享会(公众号: StataChina)
个人分类: 面板数据|254 次阅读|0 个评论

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 04:35