楼主: hustchen2012
117568 94

[学习心得] 交互项回归VS分组回归:讨论   [推广有奖]

贵宾

学科带头人

82%

还不是VIP/贵宾

-

威望
2
论坛币
114492 个
通用积分
1111.1441
学术水平
342 点
热心指数
413 点
信用等级
254 点
经验
43999 点
帖子
892
精华
3
在线时间
2868 小时
注册时间
2012-1-2
最后登录
2024-4-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
实证研究中对于主效应(因果效应)的验证是一篇大作的灵魂,这是大多数研究者挖空心思找外生事件做DID、RDD等的根本原因所在。但除此之外,进一步分析中,无论是好的调节效应还是异质性的考察,都能使文章大放异彩,使得结论更加可信,使内在机制的理解更容易直达人心,使政策建议更好地落地。但是,其实很多初学者对于使用交乘项回归or分组回归都不是很清楚,对于这一问题的系统讨论和辨明有利于我们有理有据的选择进一步分析的方法,使得这部分研究不至于看起来牵强附会。
     根据个人的一些浅薄认识,交互项在管理学中更加常用,传统的工商管理研究重故事性(尤其是调查数据的研究),比如,以心理因素、个人偏好、性别等因素作为调节变量,对于内生性的检验受制于样本问题并不太充分,这种考察一般称之为调节效应的考察。
     而对于偏经济类的研究者,一般会选择比较外生的标准分组进行回归,以检验不同分组的主要解释变量系数的显著性差异,以期发现有利于解释内在机制或者渠道的有意思的实证结果,称之为异质性的考察。例如考察企业层面因果关系时对区域市场化进程,金融市场发展程度等因素的带给微观企业层面的异质性,这种异质性更是一种系统性的差异,从统计学上等同于将所有的解释变量进行交互然后回归,能全面影响企业特征。
    但在现实的实证研究中,交互项和异质性考察并没有清晰的界限,并存在严重混用的情形(本校一名年轻的活跃的实证研究教授指出,90%的国内已经发表的实证研究文献对交互项的处理都是错误的)。以企业性质为例,许多学者进行以企业性质做分组回归的同时,另外一些学者以企业性质和主要解释变量的交互项视图解释因果效应的差异。导致研究方法分化的深层次的原因,我询问过很多实证研究的学者,几乎没有很清楚讲明白。于是,趁各位坛友暑假较为空闲的机会,向各位请教并讨论交互项以及分组回归方法的异同、试用场景,共同进步、共同提高。为鼓励积极发言,您发表看法,我送您论坛币
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分组回归 交互项 解释变量系数 实证研究 企业性质 工商管理 管理学 初学者 文章 样本

回帖推荐

grantqin 发表于23楼  查看完整内容

分组存在2个严重的问题: 1不同组回归系数不相等,但是否具有统计显著性,还需要检验,这个检验至少在STATA中没现成的. 2分组可能使某组样本量较少,影响统计功效. 能用交叉项,尽量别分组.
已有 4 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
yoyowyf + 1 + 1 鼓励积极发帖讨论
happy_287422301 + 100 + 3 + 2 精彩帖子
日新少年 + 2 + 2 + 2 精彩帖子
LIXUANHANK + 5 + 5 + 5 精彩帖子

总评分: 论坛币 + 100  学术水平 + 11  热心指数 + 10  信用等级 + 7   查看全部评分

本帖被以下文库推荐

沙发
LIXUANHANK 学生认证  发表于 2015-7-11 16:37:41 |只看作者 |坛友微信交流群
这个问题确实很难也很有意义,我目前也没大搞明白==
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
hustchen2012 + 10 + 10 + 2 + 2 + 2 鼓励积极发帖讨论

总评分: 经验 + 10  论坛币 + 10  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

藤椅
xddlovejiao1314 学生认证  发表于 2015-7-11 17:12:44 来自手机 |只看作者 |坛友微信交流群
hustchen2012 发表于 2015-7-11 16:30
实证研究中对于主效应(因果效应)的验证是一篇大作的灵魂,这是大多数研究者挖空心思找外生事件做DID ...
这个问题可能要结合具体的学科背景来谈吧。我看过的专门讨论交互项或调节效应的书籍有两本,一本是谢宇老师《回归分析》,一本是邱皓政老师《量化分析研究》~里面有专门一章对这个问题进行讨论,可能对理解这个问题有所帮助~
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
咯咯1234 + 1 + 1 + 1 精彩帖子
hustchen2012 + 20 精彩帖子

总评分: 论坛币 + 20  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

板凳
hustchen2012 在职认证  发表于 2015-7-11 17:25:39 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-7-11 17:12
这个问题可能要结合具体的学科背景来谈吧。我看过的专门讨论交互项或调节效应的书籍有两本,一本是谢宇老 ...
谢宇老师的这部分我也看了,对分组回归讨论的比较充分,我再巩固一遍

使用道具

报纸
chonghuihedong 发表于 2015-7-11 18:50:38 |只看作者 |坛友微信交流群
交叉项的加入,使得在实证分析仲可以考察替代或互补效应,在分析两个解释变量的关系时运用交叉项就比较有优势。
已有 1 人评分论坛币 收起 理由
hustchen2012 + 20 精彩帖子

总评分: 论坛币 + 20   查看全部评分

使用道具

地板
hustwjp 学生认证  发表于 2015-7-11 22:02:39 |只看作者 |坛友微信交流群
在比较关键变量在 两个子群体的不同影响时,个人认为交乘项和分样本回归作用是一样的。 这个一样建立在 两个子群体的分布是一致的假设之下。如果子群体A和子群体B 的分布不一样,那么用交乘项更合适。 当子群体多于两个时候时,自然分组回归的优势就体现出来了。
已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Evita613 + 1 + 1 + 1 观点有启发
这个是陌陌 + 1 + 1 精彩帖子
hustchen2012 + 40 观点有启发

总评分: 论坛币 + 40  学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

使用道具

7
hustwjp 学生认证  发表于 2015-7-11 22:11:20 |只看作者 |坛友微信交流群
用stata的auto数据,用price对mpg 按照foreign分组做两个回归,mpg在两个回归中系数的差值  就是 price=mpg+price+mpg*price中 交乘项的系数值
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
campbell0912 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

8
夏目贵志 发表于 2015-7-12 01:40:47 |只看作者 |坛友微信交流群
分组或者用交叉项时模型的假定是根本而且明显不同的。。。按道理来说应该很容易区别的。
例1:体重和热量消耗如果同为解释变量,那么因为消耗同样的热量对于50kg的人和100kg的人来说明显会有不一样的效果,应用交叉项,即,热量的边际效应取决于体重。
例2:两类基金,一类投资股市,一类投资外汇,基金类型和基金的资本量作为解释变量解释基金收益。1元钱投资股市和外汇市场通常来说得到的收益不同,那么可按基金类型分类回归。
不过例2当中,如果没有其他解释变量,用基金类型和资本量的交叉项也可以。但是如果有其他解释变量,比如往期收益,那么如果用交叉项的话,模型就包含了这样一个假定,即往期收益对当期收益的影响相同——无论基金类型。如果你觉得这个假定有问题,不能成立,那么就不能使用交叉项,而需使用分类的回归。
类似的情况还有很多,比如收益的分布(如果不分类回归,模型包含的假定之一就是无论基金类型收益的条件分布相同)等等。
总之,何时使用交叉项并不是(或者不该是)一个很难的问题。
已有 6 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
墟中月 + 1 + 1 + 1 观点有启发
clarissaelva + 1 + 1 + 1 精彩帖子
笑眯眯眯眯笑 + 1 + 1 + 1 精彩帖子
gyj00 + 1 + 1 + 1 精彩帖子
Starkly + 2 + 1 + 1 + 1 观点有启发
hustchen2012 + 10 + 40 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 10  论坛币 + 42  学术水平 + 7  热心指数 + 7  信用等级 + 7   查看全部评分

使用道具

9
夏目贵志 发表于 2015-7-12 01:50:50 |只看作者 |坛友微信交流群
夏目贵志 发表于 2015-7-12 01:40
分组或者用交叉项时模型的假定是根本而且明显不同的。。。按道理来说应该很容易区别的。
例1:体重和热量消 ...
补充一下:至于例1里为什么不按体重分组回归。第一是体重是连续变量,分组不是很容易,而且不一定每一组都有足够的观测值。另外是如果模型里同时有例如睡眠时间这样的解释变量,因为我们一般可以假定睡眠时间的效果不因体重而变化,所以不分组回归可以得到这些参数更有效的估计值(因为不分组比分组样本更大了)。当然,如果每组的观测值足够多,分组也不能说是错误,但是分组时需要的假定很可能缺乏理论依据(比如,是每10公斤体重分一组还是每20公斤分一组?)。

使用道具

10
hustchen2012 在职认证  发表于 2015-7-12 10:56:51 |只看作者 |坛友微信交流群
chonghuihedong 发表于 2015-7-11 18:50
交叉项的加入,使得在实证分析仲可以考察替代或互补效应,在分析两个解释变量的关系时运用交叉项就比较有优 ...
很好的应用场景:替代效应或互补效应

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 21:52