楼主: xulc432
37087 10

[回归分析求助] 怎样加控制变量 [推广有奖]

  • 1关注
  • 1粉丝

硕士生

92%

还不是VIP/贵宾

-

威望
0
论坛币
826 个
通用积分
7.8561
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
12095 点
帖子
168
精华
0
在线时间
165 小时
注册时间
2010-11-20
最后登录
2024-11-13

楼主
xulc432 发表于 2014-12-22 20:13:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我的数据时面板数据,数量很大。Y是被解释变量,X是解释变量
做回归的时候发现,x对Y回归时,p值为0,是显著的


我是一个一个加的控制变量,有的控制变量加上后X的p值增大,变的不显著,这个控制变量是不是就不用加了呢?

请大侠们给予指点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:控制变量 解释变量 面板数据

回帖推荐

Sat丶殇 发表于6楼  查看完整内容

逐步回归有个很大的弊端就是删除变量,其实有些变量单独解释时是不显著的,但是两个变量放在一起解释,他们是联合显著的,这时候即使单独变量不显著,模型也应该包含这两个变量。 例如:reg y x1 x2 x3 x4 回归后x3和x4都是不显著的,test x3 x4 后,这两个变量存在联合显著,那模型就应该包含这两个解释变量。 关于变量的刷选,是一件很麻烦的事情,要结合考虑单独显著性,联合显著,可觉系数(R平方,越大越好),模型F值(越大 ...

Sat丶殇 发表于7楼  查看完整内容

你刚说的,加入变量后,P值会变大,这就是联合显著范畴的,说明加入的变量没有起到好的作用,应该舍去,逐步回归就是按这个原理挑选变量的,至于联合显著的变量,需要自己一步步验证,过程比较繁琐。 另外,变量选择要遵循一个越少越好的原则,变量太多极有可能出现共线性,能用最少的变量解释最多的信息就是最好的模型。(也就是AIC准则)

沙发
Sat丶殇 发表于 2014-12-22 23:33:57 来自手机
楼主可以尝试一下逐步回归 sw reg,将所有自变量都扔进去。
例如sw reg y x1 x2 x3…xn,pr(显著性)
pr表示从最不显著的变量开始剔除,也可以用pe,表示从最显著的变量开始纳入。而显著性则决定哪些变量是会被最终模型采用的。希望能帮到楼主~
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
SpencerMeng + 12 + 1 + 1 观点有启发

总评分: 论坛币 + 12  学术水平 + 1  热心指数 + 1   查看全部评分

藤椅
xulc432 发表于 2014-12-23 09:06:48
Sat丶殇 发表于 2014-12-22 23:33
楼主可以尝试一下逐步回归 sw reg,将所有自变量都扔进去。
例如sw reg y x1 x2 x3…xn,pr(显著性)
pr表 ...
谢谢你的回答,但这样做有一个问题是容易把我的解释变量删了,很苦恼啊

板凳
xulc432 发表于 2014-12-23 09:15:12
Sat丶殇 发表于 2014-12-22 23:33
楼主可以尝试一下逐步回归 sw reg,将所有自变量都扔进去。
例如sw reg y x1 x2 x3…xn,pr(显著性)
pr表 ...
有没有办法在保障我的解释变量X是显著性的基础上加控制变量呢。我的意思是本来X是显著的,加了某个控制变量以后p值突然变得很大

报纸
xulc432 发表于 2014-12-23 09:17:51
Sat丶殇 发表于 2014-12-22 23:33
楼主可以尝试一下逐步回归 sw reg,将所有自变量都扔进去。
例如sw reg y x1 x2 x3…xn,pr(显著性)
pr表 ...
有没有办法在保障我的解释变量X是显著性的基础上加控制变量呢。我的意思是本来X是显著的,加了某个控制变量以后p值突然变得很大

地板
Sat丶殇 发表于 2014-12-23 09:22:58
逐步回归有个很大的弊端就是删除变量,其实有些变量单独解释时是不显著的,但是两个变量放在一起解释,他们是联合显著的,这时候即使单独变量不显著,模型也应该包含这两个变量。
例如:reg y x1 x2 x3 x4 回归后x3和x4都是不显著的,test x3 x4 后,这两个变量存在联合显著,那模型就应该包含这两个解释变量。
关于变量的刷选,是一件很麻烦的事情,要结合考虑单独显著性,联合显著,可觉系数(R平方,越大越好),模型F值(越大越好),AIC系数(越小越好)等等。所以不可能一两条代码就把变量确定下来了,楼主多尝试一下吧,我也是一步一步摸索出来的。

7
Sat丶殇 发表于 2014-12-23 09:27:56
你刚说的,加入变量后,P值会变大,这就是联合显著范畴的,说明加入的变量没有起到好的作用,应该舍去,逐步回归就是按这个原理挑选变量的,至于联合显著的变量,需要自己一步步验证,过程比较繁琐。
另外,变量选择要遵循一个越少越好的原则,变量太多极有可能出现共线性,能用最少的变量解释最多的信息就是最好的模型。(也就是AIC准则)

8
xulc432 发表于 2014-12-23 09:39:51
Sat丶殇 发表于 2014-12-23 09:27
你刚说的,加入变量后,P值会变大,这就是联合显著范畴的,说明加入的变量没有起到好的作用,应该舍去,逐步 ...
非常感谢你的回答,我不怕麻烦,就是不知道怎么做。
就是说我一个一个的往里面加变量,哪个p值小,或对r方,f值和aic有贡献,就保留哪个变量,否则就剔除,是这个意思吗?

9
Sat丶殇 发表于 2014-12-23 19:02:43
xulc432 发表于 2014-12-23 09:39
非常感谢你的回答,我不怕麻烦,就是不知道怎么做。
就是说我一个一个的往里面加变量,哪个p值小,或对r ...
先用单独变量做回归,选择显著性最强且R平方最大的,然后加入第二个变量,显著并且R平方提高了就留下这个变量,不然就舍去,同时还要比较哪个变量的R平方最大。之后加入第三个变量,以此类推。以上的过程可以用sw reg 直接得到,这个的弊端就是会舍去单独不显著,但是联合显著的变量组合,就需要一步步用test 来检验,检验的过程工程量是很浩大的,以5个变量为假设,两两检验就有10种,三三检验是10种,四四检验是5种,还有就是联合显著1种,5个变量就要检验26种,可想而知要是变量太多,这个过程就很耗时间。所以一般情况下以经济意义为主,考虑一些主要是联合显著性,还是以单独显著性作为最主要的依据。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
201432006 + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

10
xulc432 发表于 2014-12-24 10:41:09
Sat丶殇 发表于 2014-12-23 19:02
先用单独变量做回归,选择显著性最强且R平方最大的,然后加入第二个变量,显著并且R平方提高了就留下这个 ...
知道了,这下做的时候心里就有底了,太感谢了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 07:57