楼主: Carrieme
29406 39

[面板数据求助] 分组回归和交叉项的研究意义区别 [推广有奖]

11
Carrieme 发表于 2015-4-26 16:17:59
auirzxp 发表于 2015-4-26 16:03
检查A/B/SOE/MARKET之间的相关性,看看是不是比较高。
不高  还需要控制吗

pwcorr nrmdegree lnoverlap soe market

             | A  B    soe   market
-------------+------------------------------------
   A |   1.0000
   B |  -0.0033   1.0000
         soe |   0.2340  -0.0104   1.0000
      market |   0.0201   0.0034  -0.2011   1.0000

12
Carrieme 发表于 2015-4-26 16:19:16
auirzxp 发表于 2015-4-26 16:00
检查SOE和MARKET的数据,看看二者之间的相关性是否很高。
抱歉  刚才我说ommit 是我搞错了  没有ommit

13
auirzxp 学生认证  发表于 2015-4-26 16:42:11
提示: 作者被禁止或删除 内容自动屏蔽

14
auirzxp 学生认证  发表于 2015-4-26 16:43:00
提示: 作者被禁止或删除 内容自动屏蔽

15
Carrieme 发表于 2015-4-26 22:17:49
auirzxp 发表于 2015-4-26 16:43
这样就是还是要control的
抱歉,再追问下。  
我明白分组回归中需要分别control SOE和market
模型回归有这几步
1. 全部control variable回归的baseline model  Y=C+D+E+F....
2. 加上主要解释变量回归的model  Y=A+B+C+D+E+F....
3. 对SOE分组,控制Market; 对market分组,控制SOE

我的问题是,在第1和第2步的回归中,还需要控制 SOE 和market吗? 如果控制的话,怎么感觉看起来没有必要,因为后面专门分组去回归了呀

16
heric221 在职认证  发表于 2015-4-26 23:27:05
SOE组:A+**, B-不显著。说明B对SOE组有负的影响,但不显著。
非SOE组:A+不显著, B-*。说明B对非SOE组有负的影响,且在10%的显著性水平上显著。
上述结果,只能说明A、B在SOE/非SOE组之间存在差异,但不能据此在统计学意义上判断是否存在显著差异。
同理根据:
市场化较高地区组:A+不显著 , B-***。
市场化较低地区组: A+不显著, B-不显著

也只能说明A、B在市场化程度高/市场化程度低的地区之间存在差异,不能据此在统计学意义上判断是否存在显著。判断是否存在显著差异还得从交叉项入手。

17
Carrieme 发表于 2015-4-27 00:06:51
heric221 发表于 2015-4-26 23:27
SOE组:A+**, B-不显著。说明B对SOE组有负的影响,但不显著。
非SOE组:A+不显著, B-*。说明B对非SOE组有 ...
嗯 是的,您说的我都认同。 理论上讲的确最好应该用交叉项,可是加入交叉项后效果实在不太好,所以才想用分组回归说明一下问题。
不知道您有没有注意,我这些分组结果都是基于全样本  A+显著,B-显著。然后才有A、B在分组中的区别。 这样难道不可以说明区别吗?  我看一些国内算比较好期刊的文章也是这样做,所以想这样试试。 您是觉得这样很容易被argue 吗?

谢谢指教!

18
auirzxp 学生认证  发表于 2015-4-27 00:48:34
提示: 作者被禁止或删除 内容自动屏蔽

19
heric221 在职认证  发表于 2015-4-27 07:29:48
Carrieme 发表于 2015-4-27 00:06
嗯 是的,您说的我都认同。 理论上讲的确最好应该用交叉项,可是加入交叉项后效果实在不太好,所以才想 ...
SOE组:A+**, B-不显著;非SOE组:A+不显著, B-*
这样的结果是基于全样本回归一次性获得还是基于两次回归获得的?如果是先将全样本分为两组,再分别对每一组进行回归,这样回归的样本已经发生改变。
你考虑试试第一层坛友“auizxp”给的第(4)式,再看看是不是存在内生性等问题,如果都不存在,你得考虑结果是否一定得显著。

20
binggol 发表于 2015-4-27 10:13:08
你可以看谢宇的回归分析 在总样本中构造完全的交互项 也就是与模型中所有自变量都交互 这个时候跟分组回归系数是一样的 只是标准误有一定差别 由于完全交互项是用总体样本信息 估计应该更有效 而且不同组别差异是否显著也可以从交互项的系数t检验判断出来 只是如果原模型自变量比较多的话 完全交互也就比较多 可能存在多重共线性

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-19 05:48