楼主: 15927279374
10193 11

[回归分析求助] 随机效应VS固定效应VS混合回归的选择,以及个体效应和时间效应的确定,模型的选择 [推广有奖]

  • 3关注
  • 0粉丝

本科生

5%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
29.8020
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1304 点
帖子
53
精华
0
在线时间
53 小时
注册时间
2020-5-6
最后登录
2023-3-9

楼主
15927279374 发表于 2021-10-19 21:43:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求助各位老师和同学们:我的数据类型和变量是这样的:
数据:平衡面板数据
变量:因变量:数值型变量,整数型,范围(0,468)
自变量有两种数据类型(主要是为了研究考虑,看哪种效果更显著,最后就决定用哪种,如果都显著就可以分别回归,进行两次回归即可)一种是根据数值型数据生成的0-1的二值分类变量X1,有的话取1,无的话取0,为某机器设备的使用情况;另一种是数值型变量X2数值型变量,整数型,范围(0,9),为企业某设备的具体使用数量统计情况

控制变量
企业性质,二分类变量,0-1变量,取值为0或1
资产负债率,比例型,范围(0,1)
企业资产,数值比较大,单位:万,取对数之后得到的相应取值(ln企业资产)
如下表
具体数据见下表
id name    t   自变量X1(0-1)  X2(0,9)  因变量X(0,468) 控制V1企业性质(0-1二分类)  控制V2资产负债率(1,0)  ln企业资产(18,29)
1  A公司  11年      0                   0              0                       0                                      0.01                       20.69
1  A公司  12年      0                   0              0                       0                                      0.07                       21.06      
1  A公司  13年      0                   0              0                       0                                      0.08                      22.79
1  A公司  14年      0                   0              0                       0                                      0.1                        23.26
1  A公司  15年      1                   0              0                       0                                      0.07                      25.46
2  B公司  11年      0                   0              16                     1                                       0.66                      18.56
2  B公司  12年      0                   0              54                     1                                       0.48                      19.06
2  B公司  13年      0                   1              104                   1                                       0.54                      19.54
2  B公司  14年      0                   2              222                   1                                       0.65                      25.48
2  B公司  15年      0                   5              468                   1                                       0.97                      28.94
3

3
3   ....                     ....         ....                     ....                         ....                                        ....                                 
3
3
...
200 Z公司 11年     0                 0                0                           0                                       0.1                      20.06
200 Z公司 12年     0                 0                7                           0                                       0.11                    20.70
200 Z公司 13年     0                 0                8                           0                                       0.17                    21.05
200 Z公司 14年     0                 0               10                          0                                       0.26                    21.34
200 Z公司 15年     0                 0               17                          0                                       0.32                    22.35
notice:0-1二分类的自变量数据中,0值较多;取值(0,9)的数值型自变量数据中,0值也较多,我在想这样会不会影响到研究的显著性,其实我实际跑回归的过程中,直接进行如下命令xtreg Y X 控制变量,fe是显著的
但是一旦加入聚类的标准误r
xtreg Y X 控制变量,fe r就会变得不显著
Q:所以请各位老师和同学们帮忙看看是不是我的数据本身这个版本就有问题,因为我有的是0-1二值分类,有的是(0,1)的比例变量,有的是整数型变量(0,468),我在想是不是数据的量纲会对回归造成影响,如果我要修改成统一量纲的话,我又该如何操作比较好?
1.我对所有的自变量和控制变量对因变量进行求相关系数的cor命令时,显示的cor系数均小于0.35,也求了相关的方差膨胀因子vif,对应所有变量vif的值也小于10,具体命令是这么输入的
cor Y X 控制变量
reg Y X 控制变量,r
estat vif

但是在进行双向固定效应回归时,却告诉我存在多重共线性,请问怎么解决?
我在剔除了一些异常值之后,双向固定效应的具体命令是这么输入的导入数据后输入
xtset id year
xtreg Y X 控制变量 i.id,fe r
xtreg Y X 控制变量 i.id i.year,fe r
我具体的思路是这样的:我是想先各自做考虑id聚类标准误的情况下,分别进行混合回归,固定效应的回归和随机效应的回归,得出结果之后选择显著性效果最好的模型,然后根据所选的最优模型的前提下,确定最后使用什么模型,预期是是使用双向的固定效应模型

具体的操作思路是这样的:
一、先回归看哪个显著性更好
1进行混合回归
2进行随机效应回归
3进行固定效应回归
二、模型的比较与选择
1混合回归VS随机效应(使用LM检验)
2随机效应VS固定效应(使用豪斯曼检验)
3检验是否存在固定效应(LSDV法)
???疑问如下:
Q1:加入时间趋势项t,我想问的是这里的时间趋势项t是不是对应我的数据里的year,那这个时间趋势项t检测的是不是固定效应里对应的年份11,12,13,14,15,这五个年份的是否存在时间趋势效应,还是说对于模型整体来看,是否存在年份上的累积效应,我不明白这里的时间趋势项是对于我的观测值的年份来看,还是对于我的整个模型的整体来看,这里可能比较混乱,我举个例子(比如A公司,他在11,12,13,14,15年这五年内,由于使用了某机器设备,所以使得他的产品数大大增多,那么这个时间趋势t,是检测这11,12,13,14,15年这五年内是否存在着随时间变化而带来的对企业的影响,还是检测使用了设备之后,累积使用一年,两年,三年,四年,五年的时间变化对企业的影响,我想知道这个时间趋势t针对的是检测前者这种笼统的时间影响,还是后者累积的时间影响
Q2:假设我在模型的筛选过程中,固定效应的显著性结果更好,选定了固定效应模型
那么我要怎么检测含有个体效应的回归是否应该包含或不包含时间效应?这和我们前面所说的那个时间趋势项又有何关系?
Q3:我想问一下具体的代码操作,我这样是不是正确的,如果不正确,该如何改正?
1)首先进行固定效应的回归
xtreg Y X 控制变量,fe r
2)再1的基础上,生成企业id的虚拟变量,在企业层面进行id聚类标准误的回归
xtreg Y X 控制变量 i.id,fe r
3) 再2的基础上,生成时间年份的虚拟变量,在企业层面和年份层面进行id和year聚类标准误的回归
xtreg Y X 控制变量 i.id i.year,fe r
Q4:我想知道,面板数据在进行双向固定效应回归之前,是不是要先设定虚拟变量?那么是只需要设定一个虚拟变量i.id,还是虚拟变量i.year,还是说两个都需要设定虚拟变量i.id和i.year
进行xtreg Y X 控制变量 i.id i.year,fe r 的回归
Q5:我想知道
xtreg Y X 控制变量 i.id i.year,fe r
xtreg Y X 控制变量 i.year i.id,fe r
这两个命令有何区别?i.id和i.year前后位置的摆放是否会对回归造成影响?

Q6:混合回归和固定效应以及随机效应的回归是不是都要加上聚类的标准误比较好?
以下回归代码是否正确?

混合回归
reg patent quantity_robot lnsize lev edu,vce(cluster id)
固定效应的回归
xtreg patent quantity_robot lnsize lev edu,fe r
随机效应的回归
xtreg patent quantity_robot lnsize lev edu,re r theta





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:个体效应 随机效应 时间效应 固定效应 混合回归

沙发
G911005 在职认证  发表于 2021-10-20 10:19:26
。。。。。。。。。。。。。。。。。。。。。。。。

藤椅
15927279374 发表于 2021-10-20 15:15:57
G911005 发表于 2021-10-20 10:19
。。。。。。。。。。。。。。。。。。。。。。。。
您好!请问您可以提供相关见解和建议吗?

板凳
你是一头猪母 发表于 2021-10-20 22:48:11
xtreg y x .. ,fe r 固定
xtreg y x .. ,re r或者xtreg y x .. i.year, r  随机
xtreg y x .. i.year,fe r 双向
你选择r和vce(cluster id)在面板回归中的结果是一样的。(一般都采用双向)面板数据直接用这个,不需要设定虚拟变量。
都是要加标准误估计,这是基本原则。
面板多重共线会直接OMIT,你自己考虑一下变量的设计。
t不是year,就是你的控制变量

报纸
15927279374 发表于 2021-10-21 15:35:06
你是一头猪母 发表于 2021-10-20 22:48
xtreg y x .. ,fe r 固定
xtreg y x .. ,re r或者xtreg y x .. i.year, r  随机
xtreg y x .. i.year,fe ...
好的,我再捋一捋,非常感谢你的耐心解答

地板
15927279374 发表于 2021-10-21 16:06:49
你是一头猪母 发表于 2021-10-20 22:48
xtreg y x .. ,fe r 固定
xtreg y x .. ,re r或者xtreg y x .. i.year, r  随机
xtreg y x .. i.year,fe ...
我还想请问一下,我如果直接跑固定效应是显著的,是以下这个命令
xtreg Y X 控制变量,fe
但是我加上聚类的标准误就变得不显著了,是以下这个命令,那说明什么呢?
xtreg Y X 控制变量,fe r
会不会是数据的量纲维度不统一也会对数据的显著性造成影响?这是我的具体的变量范围
因变量:数值整数型,范围(0,468)
自变量:1根据数值型数据生成的0-1的二值分类变量X1,有的话取1,无的话取0,数值型变量X2:数值型变量,整数型,范围(0,9),为企业某设备的具体使用数量统计情况

控制变量
企业性质,二分类变量,0-1变量,取值为0或1
资产负债率,比例型,范围(0,1)
企业资产,数值比较大,单位:万,取对数之后得到的相应取值(ln企业资产)

7
15927279374 发表于 2021-10-21 16:12:42
你是一头猪母 发表于 2021-10-20 22:48
xtreg y x .. ,fe r 固定
xtreg y x .. ,re r或者xtreg y x .. i.year, r  随机
xtreg y x .. i.year,fe ...
我看了一下其他论坛上的回答,好像是说面板数据是使用

8
15927279374 发表于 2021-10-21 16:14:54
15927279374 发表于 2021-10-21 16:12
我看了一下其他论坛上的回答,好像是说面板数据是使用
我看了一下论坛上的其他回答,好像是说面板数据是使用这个命令来检验多重共线性,但是检验的结果是都通过检验的,vif的值都小于10
newey2 Y X, lag(0)
neweyvif

9
你是一头猪母 发表于 2021-10-22 09:03:11
15927279374 发表于 2021-10-21 16:14
我看了一下论坛上的其他回答,好像是说面板数据是使用这个命令来检验多重共线性,但是检验的结果是都通过 ...
你才几个变量,哪有那么多重共线问题的存在(很少讨论多重共线,不知道你是在那个阶段,本科?),即使有可能是你虚拟变量之间存在共线,如果严重共线,结果会直接删除,说了那就看你变量是否选择有问题。你加了r不显著(要加r,不加别人怎么相信结果,即使显著),那就是不显著,那就是你研究设计的问题,或者数据处理(缩尾处理一下),添加和或减少控制变量。还有就是存在二分类你采用Logit或者probit其实是比较符合原理的,你用OLS也可以,不然越讲越多(提一下)。

10
你是一头猪母 发表于 2021-10-22 09:04:27
15927279374 发表于 2021-10-21 16:14
我看了一下论坛上的其他回答,好像是说面板数据是使用这个命令来检验多重共线性,但是检验的结果是都通过 ...
绝对数你都对数化处理一下再试试

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-6 07:41