请选择 进入手机版 | 继续访问电脑版
楼主: terryhuxm
15742 15

[统计软件与数据分析] 实证研究模型为什么要先进行单变量回归? [推广有奖]

  • 0关注
  • 0粉丝

博士生

13%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1149 点
帖子
229
精华
0
在线时间
37 小时
注册时间
2007-4-11
最后登录
2021-10-8

terryhuxm 发表于 2014-4-8 13:37:37 |显示全部楼层
1论坛币
看了很多期刊论文,一般的范式都是进行多元线性回归,我注意到很多文章都会先进行单变量回归分析,如果一个模型需要考虑很多变量,或者说控制很多变量,那么进行单变量分析的意义和目的是什么,看了伍德里奇的计量经济学,在需要控制很多变量的情况下,如果仅仅进行单变量回归,其系数符号都有可能是错误的,那么为什么要进行单变量分析呢?

最佳答案

allenliu27 查看完整内容

首先,我们对单变量回归定义的理解是不同的.我觉得控制变量也是自变量,只是它们不是你研究的对象而已.所以因变量对一个自变量加控制变量的回归也应该叫多元回归. 其次,R^2的大小是用来表示有多少因变量的变化可以归因于自变量.至于相关性要看回归后系数的t值. 再次,我觉得做回归的目的就是要找因果关系.如果你的回归模型有问题,导致你找不到想要的因果关系,那这样的回归是没有意义的. 最后,遗漏变量和内生性没有 ...
关键词:实证研究 单变量 多元线性回归 计量经济学 期刊论文 回归分析 经济学 文章 模型 论文

回帖推荐

allenliu27 发表于11楼  查看完整内容

不客气.简单的看这个模型:y=x1+x2+e.在x2和x1相关的情况下,如果吧x2遗漏到误差项e中,那e就和x1相关并带来内生性(这是你所强调的).如果x2和e相关,而x2和x1不相关,e和x1也不相关,那这个模型本来就有内生性.在这种情况下,把x2遗漏到误差项里反而会消除这个模型的内生性.所以是否应该遗漏一个变量要看具体问题.个人认为如果把那本书上一致性的证明弄明白,对这些问题就可以做到举一反三了.我觉得残差的分布应该只对 ...
stata SPSS
allenliu27 发表于 2014-4-28 07:18:43 |显示全部楼层
terryhuxm 发表于 2014-4-27 22:06
1: 我说的单变量回归,是因变量对一个自变量回归+控制变量。当然,我也有看到有的博士论文也有不加控制变量 ...
首先,我们对单变量回归定义的理解是不同的.我觉得控制变量也是自变量,只是它们不是你研究的对象而已.所以因变量对一个自变量加控制变量的回归也应该叫多元回归.
其次,R^2的大小是用来表示有多少因变量的变化可以归因于自变量.至于相关性要看回归后系数的t值.
再次,我觉得做回归的目的就是要找因果关系.如果你的回归模型有问题,导致你找不到想要的因果关系,那这样的回归是没有意义的.
最后,遗漏变量和内生性没有必然的联系.在一个回归中,只有包括遗漏变量的误差项跟自变量相关才会引起内生性.同理,当越多的自变量被加入到这个回归中,误差项与这些自变量相关的可能性就越大,进而就越有可能带来内生性.(不知道我这么说你能不能理解.)

使用道具

zyyshadow0911 发表于 2014-4-8 13:41:53 |显示全部楼层
我也有这样的疑问,期待大神解答

使用道具

李攀 发表于 2014-4-8 13:45:38 |显示全部楼层
我也是,大师where?

使用道具

terryhuxm 发表于 2014-4-9 15:50:31 |显示全部楼层
大神在哪里,来解答下啊

使用道具

杨梅吐气 发表于 2014-4-25 23:40:16 |显示全部楼层
你好,原因是这样的,如果直接把一大堆变量放进去,当然会做出多元模型,但是如果各个变量的t检验都很差呢?这个时候你就不知道到底是因为各个x之间存在多重共线性还是因为这些x本身就和y的线性相关程度不高,所以先做各个单变量与y的回归,去掉相关程度不高的,接下来就可以进行多元了,如果这个时候t检验未通过,说明存在多重共线性,可以用逐步回归,岭回归等。
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

使用道具

allenliu27 发表于 2014-4-26 08:31:10 |显示全部楼层
首先,我没见过单变量回归的文章(可能是我孤陋寡闻).你说的单变量回归是因变量(y)只对自变量(x)回归,还是y对x和所有的控制变量分别进行单独回归呢?如果是后者,我就不太理解了.那如果是前者,那其实是在找自变量(x)和因变量(y)之间的相关系数,看这两个变量之间的相关关系大不大.然后再做多变量回归(加入必要的控制变量)来看这个相关关系是由控制变量引起的,还是由自变量对因变量的因果关系造成的.[纯属个人理解]

使用道具

terryhuxm 发表于 2014-4-27 22:04:36 |显示全部楼层
1: 我说的单变量回归,是因变量对一个自变量回归+控制变量。当然,我也有看到有的博士论文也有不加控制变量的对单变量的回归
2: 接着对你的回答追问:“那如果是前者,那其实是在找自变量(x)和因变量(y)之间的相关系数,看这两个变量之间的相关关系大不大” 你如何看因变量与自变量的相关关系? 是看回归出来的R2吗?

3:“然后再做多变量回归(加入必要的控制变量)来看这个相关关系是由控制变量引起的,还是由自变量对因变量的因果关系造成的” ,我的理解是,回归没有办法判定因果关系

4: 我的假设是: 假设正确的模型是几个自变量+控制变量对因变量的回归,这时,你只放了一个自变量+控制变量对因变量回归,这时,就有遗漏变量的问题,如果有遗漏变量,就存在内生性的问题,存在内生性的问题,回归系数的估计就存在一致性的问题,这样问题就很大,那么做一个自变量+控制变量对于因变量的回归的意义在哪里?如果是错的,为什么那么多论文都是这么做的,问了很多同学,他们答,别人这么做,所以我也这么做,对这个答案很不满意,希望牛人出来解答一下

使用道具

terryhuxm 发表于 2014-4-27 22:06:11 |显示全部楼层
1: 我说的单变量回归,是因变量对一个自变量回归+控制变量。当然,我也有看到有的博士论文也有不加控制变量的对单变量的回归
2: 接着对你的回答追问:“那如果是前者,那其实是在找自变量(x)和因变量(y)之间的相关系数,看这两个变量之间的相关关系大不大” 你如何看因变量与自变量的相关关系? 是看回归出来的R2吗?

3:“然后再做多变量回归(加入必要的控制变量)来看这个相关关系是由控制变量引起的,还是由自变量对因变量的因果关系造成的” ,我的理解是,回归没有办法判定因果关系

4: 我的假设是: 假设正确的模型是几个自变量+控制变量对因变量的回归,这时,你只放了一个自变量+控制变量对因变量回归,这时,就有遗漏变量的问题,如果有遗漏变量,就存在内生性的问题,存在内生性的问题,回归系数的估计就存在一致性的问题,这样问题就很大,那么做一个自变量+控制变量对于因变量的回归的意义在哪里?如果是错的,为什么那么多论文都是这么做的,问了很多同学,他们答,别人这么做,所以我也这么做,对这个答案很不满意,希望牛人出来解答一下

使用道具

terryhuxm 发表于 2014-4-28 20:03:35 |显示全部楼层
谢谢!今天看了伍德里奇的书的第六章,问题明白了大半,谢谢Allenliu兄。

另外,追问:
如果“同理,当越多的自变量被加入到这个回归中,误差项与这些自变量相关的可能性就越大,进而就越有可能带来内生性.”
问: 如果越多的自变量被加入到回归当中,不是把这些因素从误差项中剔除出来吗,如此,使得这些因素不存在误差项当中了,就不会存在误差项同自变量相关的问题,不是减少了内生性了么? 望帮忙解惑。

“如果是前者,那其实是在找自变量(x)和因变量(y)之间的相关系数,看这两个变量之间的相关关系大不大”

问:如果仅是因变量对于单一自变量的回归,来寻求两个变量之间的相关关系,会不会太不严谨了。因为,有可能该控制的控制变量都没有加进去,估计出来的相关关系会不会有偏误?在这样的做法下,遗漏的变量都归入误差项,如果,遗漏变量恰好同自变量相关,是会产生内生性的,这样理解对吗?
另外,如果要通过这种方式寻求两个变量的相关关系,有什么前提条件? 做单变量回归后 ,需要再看看残差图吗?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2021-10-18 12:16