楼主: 财经节析
149406 179

[学习心得] 面板数据模型中Stata如何控制行业、产业、区域、企业性质、规模、所有制、省域等   [推广有奖]

编辑

讲师

98%

还不是VIP/贵宾

-

威望
0
论坛币
4215 个
通用积分
243.3441
学术水平
146 点
热心指数
157 点
信用等级
116 点
经验
8978 点
帖子
776
精华
3
在线时间
166 小时
注册时间
2017-8-25
最后登录
2022-7-7

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近,在课堂上和论坛上都看到了一些关于在面板数据模型中,如何控制行业、产业、区域、企业性质、规模、所有制、省域不随时间变化的因素的影响,尤其是Stata软件中如何操作,在个体固定效应模型中,若加入行业等不随时点变化的变量时,为什么会出现omitted的情形,尽管有人建议使用reghdfe命令,其实还是会出现类似情况(即reghdfe命令失效)
下面看一个例子。下面也是一些心得与体会,希望能与大家一起讨论。

下图是在个体固定效应下,试图控制区域和行业两个不随时点变化的因素:
092534g714gu454zkx746f.png


下图是用reghdfe命令试图控制区域和行业两个不随时点变化的因素,Absorbed  degree of freedom一栏已经表明reghdfe命令同样失效。因为其在模型中的虚拟变量个数全部为0。见下图最下面的表格:
111413f8plcgw2lnncwpj2.png

那就是最下面关于Absorbed degree of freedom里信息,由于reghdfe它没有截距项,所以number是1749个属性,设置了1749个虚拟变量(即估计了1749个系数),然而,由于region1和industry1是不随时间变化的量,所以在设置虚拟变量时,他们对应的虚拟变量的个数都是0,即他们是多余的,在reghdfe的回归中压根就没有使用它们。


也就是说,这个做法reghdfe tobinq fem numexe lev size age ls, a(number region1 industry1) vce(robust)与xtreg tobinq fem numexe lev size age ls , fe 的系数之所以是一样的,就是因为reghdfe回归中压根就没有使用region1和industry1的信息,当然xtreg tobinq fem numexe lev size age ls , fe 里面也没有这两个变量。


当然,若使用 xtreg tobinq fem numexe lev size age ls  i.region1  i.industry1 ,fe  r 那么  region1 和industry1的虚拟变量将会omitted  。或者使用reg tobinq fem numexe lev size age ls  i.number  i.region1   i.industry1 , r也就是LSDV估计法时,会出现类似的情况,一定会有7+16=23个虚拟变量会omitted (这个跟 i.number i.region1  i.industry1 在reg里的顺序有关的,在这个排序里i.region1  i.industry1将会omitted ;若排序是这样的reg tobinq fem numexe lev size age ls   i.region1  i.industry1  i.number , r  那么i.number里将有23个虚拟变量会omitted )

当然,若使用reg tobinq fem numexe lev size age ls  i.number i.region1 i.industry1 , r  或者使用xtreg tobinq fem numexe lev size age ls  i.region1 i.industry1 ,fe  r  或者使用 xtreg tobinq fem numexe lev size age ls , fe  r  或者使用reghdfe tobinq fem numexe lev size age ls, a(number region1 industry1) vce(r) 回归后,会发现他们的系数估计值是一样的,但估计值标准误可能会有少许不同。

回到前面,即表面上,reghdfe函数好像控制了region1 和industry1,然而,实际情况就同上面的分析一样,reghdfe根本就有做到这一点,它把多余的虚拟变量全删掉了,只是,我们没发现而已。


那为什么会这样呢?

其实原因很简单,那就是number是随个体变化,不随时间变化的,所以,当你考虑其他不随时间变量的因素(行业、省份、区域、企业性质、银行所有制性质等)时,其实他们的信息都在number里反应出来了,所以再设置不随时间变化的变量时,就是多余的了。(这里的主要原因是:若个体固定效应模型是采用Within回归(xtreg    , fe),它会将不随时点变化的量都减去了,所以,如果模型中不随时点变化的虚拟变量(包括个体固定效应项)的属个数如果大于N(无截距项情形;有截距项就是N-1个),它只能估计出前N个,其他的都不在模型中;若是采用LSDV法估计个体固定效应模型(reg     i.number),是设置了N-1个虚拟变量实现的,如果再往模型里加不随时点变化的虚拟变量(如行业、区域等),模型是会将它们排除在模型里面的。)

所以,一些文献关于,在有个体固定效应的基础上,考虑控制(行业、省份、区域、企业性质、银行所有制性质等)这类不随时间变化的因素的影响时,不知道他们是如何控制的。


【情形1如果(行业、省份、区域、企业性质、银行所有制性质等)这类不随时间变化的因素设置为虚拟变量,至少目前的软件操作已经告诉了我们这一点,行不通。

【情形2如果(行业、省份、区域、企业性质、银行所有制性质等)这类不随时间变化的因素不是设置为虚拟变量,而是用其他数字替代,并以定量变量放置模型,就有两个问题:
(1)如果这些数字是人为赋值的,那就不合适,因为每个人赋予它们的值可能不同,即便是同一个问题,样本、变量等都相同,仅仅赋值不同也会得到不同的估计结果,那谁的赋值是真实的,无人知晓。
(2)若industry1、region1不是人为赋值的量,它们本身就有一个数字(客观、公正的数字)表示它们,只是它们比较特殊不随时间变化而已,那就是一个普通的定量变量,reg回归可以运行,或者随机效应模型里也可以,但个体固定效应回归,xtreg y x1 x2 …… xk i.year  region1 industry1, fe r  仍然无法估计。

0925463fjd3gv7bbbvjmaj.png

当然,如果是在时点效应的基础上或随机效应的基础(或者其他非个体固定效应模型)上,考虑(行业、省份、区域、企业性质、银行所有制性质等)这类不随时间变化的因素的影响,reghdfe、reg、xtreg都是可以做到的;


但是也要注意:不随时间变化的虚拟变量(你想在非个体固定效应模型中控制的变量)的个数之和要小于等于个体数N(无截距项情形;有截距项就是N-1个),否则,会出现在个体固定效应模型中一样的问题。


上面是一些心得与体会,希望能与大家一起交流、学习、讨论。

更多计量经济学、时间序列分析、面板数据模型Stata、EViews视频操作内容、数据,请见(里面有百度云盘地址):https://bbs.pinggu.org/thread-6211334-1-1.html


或者,经管之家官方置顶帖:https://bbs.pinggu.org/thread-6681760-1-1.html


Stata软件、EViews软件下载地址:https://bbs.pinggu.org/thread-6629658-1-1.html


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 4 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
糖萌萌 + 1 + 1 + 1 + 1 精彩帖子
iRolly + 66 + 5 精彩帖子
np84 + 100 精彩帖子
日新少年 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 166  论坛币 + 1  学术水平 + 7  热心指数 + 2  信用等级 + 2   查看全部评分

本帖被以下文库推荐

180
季初初 发表于 2024-4-30 14:41:13 |只看作者 |坛友微信交流群
lx0102lkf 发表于 2018-6-12 11:53
我估计是因为有企业改行或者迁移了,工业库什么的样本量比较大的数据库有一些这种情况,固定效应不会全ommi ...
同意这位朋友的说法,用了的文章可能就是属于这种情况,并不完全都是被共线性省略的错误回归。

使用道具

179
qxdzhy 发表于 2024-2-9 18:21:35 |只看作者 |坛友微信交流群
也是晴天 发表于 2018-6-11 18:13
所以说那些用固定效应模型的文章说控制了行业等不随时间变化的因素,都有可能是被omitted了,但还是视为已经 ...
我觉得您说的对。视同已经控制。

使用道具

178
li2254 学生认证  发表于 2023-4-11 14:55:25 |只看作者 |坛友微信交流群
那请问一下,在使用这个命令的时候还是会有这个 问号,是报错吗?应该怎么解决这个问题呢

使用道具

177
Nuliguan 在职认证  发表于 2022-10-12 23:06:42 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-5-19 15:56
1. 你说 (即reghdfe命令失效) 是不正确的,你的结果中区间与行业 (region and industry) 是因为与你的个体 ...
两位老师好 大家好 如果我在面板数据用交互项形式 比如 var##b1.东部 这样时,那么用什么命令做固定相应呢?
reg .........var##b1.dongbu  i.year ,r  还是 xtreg..........var##b1.dongbu i.year ,r 。这两个命令分析的系数结果不一样。这两个命令的结果改如何说明?有何差异?不知选择哪一组正确?(补充,我的数据30 个省直辖市。可能书数据太少,如果分组回归分析的话,系数都不显著。所以我采用这种交互项的方法。)

使用道具

176
三江鸿 发表于 2022-9-26 13:34:57 |只看作者 |坛友微信交流群
点赞支持
我为人人 人人为我

使用道具

175
黃河泉 在职认证  发表于 2022-8-17 18:48:54 |只看作者 |坛友微信交流群
无无无12 发表于 2022-8-17 11:17
老师,请问xtreg y x1 x2 x3 i.industry i.year,fe 这种格式是对的吗?我做出来有三分之一的行业显示omit ...
这取决于的你的企业 (firm) 是否会随著时间而改变产业 (industry),看起来你的资料是会的,所以这样做应该是可以的 (否则,不止 1/3,而是全部的产业虚拟变量都会显示 omitted)。

使用道具

174
无无无12 发表于 2022-8-17 11:18:28 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-5-20 08:15
http://scorreia.com/software/reghdfe/install.html。
黄老师,请问xtreg y x1 x2 x3 i.industry i.year,fe 这种格式是对的吗?我做出来有三分之一的行业显示omitted,请问这样做是可以的嘛

使用道具

173
无无无12 发表于 2022-8-17 11:17:11 |只看作者 |坛友微信交流群
财经节析 发表于 2018-5-19 16:46
首先,我说的就是在个体固定效应变截距面板数据模型下的结论(即我说的失效,是指reghdfe不能控制那些像行 ...
老师,请问xtreg y x1 x2 x3 i.industry i.year,fe 这种格式是对的吗?我做出来有三分之一的行业显示omitted,请问这样做是可以的嘛

使用道具

172
LazySeb 发表于 2022-6-21 16:34:04 |只看作者 |坛友微信交流群
老师请问研究样本中囊括了国家、产业、年份三个层面的数据,回归时如何界定个体?
如果将国家和产业联合起来视作一个个体,例如中国a部门视作个体1、中国b部门视作个体2...越南a部门视作个体3...请问这样的处理方法可行吗?会对回归结果造成什么影响嘛?有没有文献可供参考呀?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-11 10:11