人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › 面板数据模型中Stata如何控制行业、产业、区域、企业性质 ...

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 3 4 5 6 7 8 9 10 ... 19 下一页

发帖

楼主: 财经节析

155010 180

[学习心得] 面板数据模型中Stata如何控制行业、产业、区域、企业性质、规模、所有制、省域等 [推广有奖]

0关注
387
粉丝

编辑

讲师

98%

还不是VIP/贵宾

威望: 0 级
论坛币: 4215 个
通用积分: 243.3767
学术水平: 146 点
热心指数: 157 点
信用等级: 116 点
经验: 8978 点
帖子: 776
精华: 3
在线时间: 166 小时
注册时间: 2017-8-25
最后登录: 2022-7-7

楼主

财经节析 发表于 2018-5-19 12:15:19 |只看作者 |坛友微信交流群|正序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

最近，在课堂上和论坛上都看到了一些关于在面板数据模型中，如何控制行业、产业、区域、企业性质、规模、所有制、省域等不随时间变化的因素的影响，尤其是Stata软件中如何操作，在个体固定效应模型中，若加入行业等不随时点变化的变量时，为什么会出现omitted的情形，尽管有人建议使用reghdfe命令，其实还是会出现类似情况（即reghdfe命令失效）。
下面看一个例子。下面也是一些心得与体会，希望能与大家一起讨论。

下图是在个体固定效应下，试图控制区域和行业两个不随时点变化的因素：

下图是用reghdfe命令试图控制区域和行业两个不随时点变化的因素，Absorbed degree of freedom一栏已经表明reghdfe命令同样失效。因为其在模型中的虚拟变量个数全部为0。见下图最下面的表格：

那就是最下面关于Absorbed degree of freedom里信息，由于reghdfe它没有截距项，所以number是1749个属性，设置了1749个虚拟变量（即估计了1749个系数），然而，由于region1和industry1是不随时间变化的量，所以在设置虚拟变量时，他们对应的虚拟变量的个数都是0，即他们是多余的，在reghdfe的回归中压根就没有使用它们。

也就是说，这个做法reghdfe tobinq fem numexe lev size age ls, a(number region1 industry1) vce(robust)与xtreg tobinq fem numexe lev size age ls , fe 的系数之所以是一样的，就是因为reghdfe回归中压根就没有使用region1和industry1的信息，当然xtreg tobinq fem numexe lev size age ls , fe 里面也没有这两个变量。

当然，若使用 xtreg tobinq fem numexe lev size age ls  i.region1  i.industry1 ,fe  r 那么  region1 和industry1的虚拟变量将会omitted  。或者使用reg tobinq fem numexe lev size age ls  i.number  i.region1 i.industry1 , r也就是LSDV估计法时，会出现类似的情况，一定会有7+16=23个虚拟变量会omitted （这个跟 i.number i.region1  i.industry1 在reg里的顺序有关的，在这个排序里i.region1  i.industry1将会omitted ；若排序是这样的reg tobinq fem numexe lev size age ls i.region1  i.industry1  i.number , r  那么i.number里将有23个虚拟变量会omitted ）。

当然，若使用reg tobinq fem numexe lev size age ls  i.number i.region1 i.industry1 , r  或者使用xtreg tobinq fem numexe lev size age ls  i.region1 i.industry1 ,fe  r  或者使用 xtreg tobinq fem numexe lev size age ls , fe  r  或者使用reghdfe tobinq fem numexe lev size age ls, a(number region1 industry1) vce(r) 回归后，会发现他们的系数估计值是一样的，但估计值标准误可能会有少许不同。

回到前面，即表面上，reghdfe函数好像控制了region1 和industry1，然而，实际情况就同上面的分析一样，reghdfe根本就有做到这一点，它把多余的虚拟变量全删掉了，只是，我们没发现而已。

那为什么会这样呢？

其实原因很简单，那就是number是随个体变化，不随时间变化的，所以，当你考虑其他不随时间变量的因素（行业、省份、区域、企业性质、银行所有制性质等）时，其实他们的信息都在number里反应出来了，所以再设置不随时间变化的变量时，就是多余的了。（这里的主要原因是：若个体固定效应模型是采用Within回归（xtreg , fe），它会将不随时点变化的量都减去了，所以，如果模型中不随时点变化的虚拟变量（包括个体固定效应项）的属个数如果大于N（无截距项情形；有截距项就是N-1个），它只能估计出前N个，其他的都不在模型中；若是采用LSDV法估计个体固定效应模型（reg    i.number），是设置了N-1个虚拟变量实现的，如果再往模型里加不随时点变化的虚拟变量（如行业、区域等），模型是会将它们排除在模型里面的。）

所以，一些文献关于，在有个体固定效应的基础上，考虑控制（行业、省份、区域、企业性质、银行所有制性质等）这类不随时间变化的因素的影响时，不知道他们是如何控制的。

【情形1】如果（行业、省份、区域、企业性质、银行所有制性质等）这类不随时间变化的因素设置为虚拟变量，至少目前的软件操作已经告诉了我们这一点，行不通。

【情形2】（如果（行业、省份、区域、企业性质、银行所有制性质等）这类不随时间变化的因素不是设置为虚拟变量，而是用其他数字替代，并以定量变量放置模型，就有两个问题：
（1）如果这些数字是人为赋值的，那就不合适，因为每个人赋予它们的值可能不同，即便是同一个问题，样本、变量等都相同，仅仅赋值不同也会得到不同的估计结果，那谁的赋值是真实的，无人知晓。
（2）若industry1、region1不是人为赋值的量，它们本身就有一个数字（客观、公正的数字）表示它们，只是它们比较特殊不随时间变化而已，那就是一个普通的定量变量，reg回归可以运行，或者随机效应模型里也可以，但个体固定效应回归，xtreg y x1 x2 …… xk i.year  region1 industry1, fe r  仍然无法估计。）

当然，如果是在时点效应的基础上或随机效应的基础（或者其他非个体固定效应模型）上，考虑（行业、省份、区域、企业性质、银行所有制性质等）这类不随时间变化的因素的影响，reghdfe、reg、xtreg都是可以做到的；

但是也要注意：不随时间变化的虚拟变量（你想在非个体固定效应模型中控制的变量）的个数之和要小于等于个体数N（无截距项情形；有截距项就是N-1个），否则，会出现在个体固定效应模型中一样的问题。

上面是一些心得与体会，希望能与大家一起交流、学习、讨论。

更多计量经济学、时间序列分析、面板数据模型Stata、EViews视频操作内容、数据，请见（里面有百度云盘地址）：https://bbs.pinggu.org/thread-6211334-1-1.html

或者，经管之家官方置顶帖：https://bbs.pinggu.org/thread-6681760-1-1.html

Stata软件、EViews软件下载地址：https://bbs.pinggu.org/thread-6629658-1-1.html

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享1 收藏697 回帖

本帖被以下文库推荐

· 精华热门帖子|主题: 1618, 订阅: 45
· 计量经济|主题: 207, 订阅: 49
· stata技巧|主题: 305, 订阅: 30
· Stata小问题|主题: 68, 订阅: 15
· 日新文库：Stata入门及进阶|主题: 1226, 订阅: 458

使用道具举报

181楼

tubieju7 发表于 2024-5-13 19:50:16 |只看作者 |坛友微信交流群

财经节析发表于 2018-8-16 11:28
首先，你的变量公司产权性质在你的样本期间是有随时间变化的，尽管可能很少，但毕竟有，所以，严格上来说 ...

老师好~请问怎样检验或判断是否需要加入时点固定效应呢

使用道具举报

180楼

季初初 发表于 2024-4-30 14:41:13 |只看作者 |坛友微信交流群

lx0102lkf 发表于 2018-6-12 11:53
我估计是因为有企业改行或者迁移了，工业库什么的样本量比较大的数据库有一些这种情况，固定效应不会全ommi ...

同意这位朋友的说法，用了的文章可能就是属于这种情况，并不完全都是被共线性省略的错误回归。

使用道具举报

179楼

qxdzhy 发表于 2024-2-9 18:21:35 |只看作者 |坛友微信交流群

也是晴天发表于 2018-6-11 18:13
所以说那些用固定效应模型的文章说控制了行业等不随时间变化的因素，都有可能是被omitted了，但还是视为已经 ...

我觉得您说的对。视同已经控制。

使用道具举报

178楼

li2254

发表于 2023-4-11 14:55:25 |只看作者 |坛友微信交流群

那请问一下，在使用这个命令的时候还是会有这个问号，是报错吗？应该怎么解决这个问题呢

使用道具举报

177楼

Nuliguan

发表于 2022-10-12 23:06:42 |只看作者 |坛友微信交流群

黃河泉发表于 2018-5-19 15:56
1. 你说 (即reghdfe命令失效）是不正确的，你的结果中区间与行业 (region and industry) 是因为与你的个体 ...

两位老师好大家好如果我在面板数据用交互项形式比如 var##b1.东部这样时，那么用什么命令做固定相应呢？
reg .........var##b1.dongbu i.year ，r 还是 xtreg..........var##b1.dongbu i.year ，r 。这两个命令分析的系数结果不一样。这两个命令的结果改如何说明？有何差异？不知选择哪一组正确？（补充，我的数据30 个省直辖市。可能书数据太少，如果分组回归分析的话，系数都不显著。所以我采用这种交互项的方法。）

使用道具举报