楼主: ybylancet
20127 6

[问答] 请问回归方程的自变量如何选择? [推广有奖]

  • 0关注
  • 0粉丝

小学生

7%

还不是VIP/贵宾

-

威望
0
论坛币
14 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
83 点
帖子
5
精华
0
在线时间
0 小时
注册时间
2009-5-29
最后登录
2009-6-12

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

书到用时方恨少啊!

当年学统计的时候草草应付考试了事,导致现在写论文分析数据相当抓瞎~~~~(>_<)~~~~

请问各位大侠:回归方程的自变量怎么选择?两个自变量是不是需要是独立互不影响的?但是医学上很多指标牵一发而动全身,请问怎么选择这些看起来可能有关系的自变量呢?

请解答科普+学术一点,偶需要浅显一点,也会尝试努力啃啃艰深的东东。

谢谢了!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归方程 自变量 书到用时方恨少 论文分析 写论文 方程 选择 变量

回帖推荐

helenhht 发表于4楼  查看完整内容

在多元回归模型参数b求解的过程中,要求各自变量互相独立,只有如此,才能求出b的惟一解,如果自变量之间有线性相关(不包括非线性相关),就会互相削弱各自的边际影响,使回归系数变小,出现回归方程整体显著而各个自变量不显著的现象,叫做多重共线性。            这种线性相关性的影响会使回归系数不能很好反映自变量的独立作用;使新增自变量的边际作用下降;使回归系 ...

cxlong 发表于2楼  查看完整内容

自变量的选择应该主要由研究的问题和依据的理论来定,也就是说有哪些变量会对你所要解释的因变量产生影响,那么你的回归中就应该考虑包括这些变量。具体的选择中有下面几个考虑:(1)这些自变量是独立地决定于你所要解释的因变量之外的吗?答案如果是否,那么你就需要担心内生性(endogeneity)的问题,也即谁是自变量谁是因变量的问题。多元回归的计量经济学理论依据,要求自变量是外生变量,也即不为因变量所影响。(2)各个自变量 ...

本帖被以下文库推荐

沙发
cxlong 发表于 2009-6-2 02:48:00 |只看作者 |坛友微信交流群

自变量的选择应该主要由研究的问题和依据的理论来定,也就是说有哪些变量会对你所要解释的因变量产生影响,那么你的回归中就应该考虑包括这些变量。

具体的选择中有下面几个考虑:

(1)这些自变量是独立地决定于你所要解释的因变量之外的吗?答案如果是否,那么你就需要担心内生性(endogeneity)的问题,也即谁是自变量谁是因变量的问题。多元回归的计量经济学理论依据,要求自变量是外生变量,也即不为因变量所影响。

(2)各个自变量之间可以是相互影响的,但是有一个限度。如果它们的变化是完全同步的,那么就无法测算它们各自对因变量的独立影响。即使变化不完全同步,如果相关性太高,也会使各自影响系数的标准误增大,也即影响系数的测算值不精确,此为多元共线性(multicollinearity)。这时的做法通常是去掉其中的一个,也可以将几个相关的因变量用某种方法合并成一个,比如某种形式的加权平均。


pxg_1981  金币 +1  奖励回答问题 2009-6-2 7:01:22
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

藤椅
chenxiaoliang22 在职认证  发表于 2009-6-2 15:34:00 |只看作者 |坛友微信交流群

自变量个数太少则会造成遗漏变量偏差;

过多则会造成多重共线性,变量之间相关性高,回归结果也不一致;

实际操作采取折中,一般4-5个为宜。

对于时间序列,可以用AIC,BIC信息准则来确定滞后阶数。

祝好

坚持下去!

使用道具

板凳
helenhht 发表于 2009-6-2 16:39:00 |只看作者 |坛友微信交流群

在多元回归模型参数b求解的过程中,要求各自变量互相独立,只有如此,才能求出b的惟一解,如果自变量之间有线性相关(不包括非线性相关),就会互相削弱各自的边际影响,使回归系数变小,出现回归方程整体显著而各个自变量不显著的现象,叫做多重共线性。

            这种线性相关性的影响会使回归系数不能很好反映自变量的独立作用;使新增自变量的边际作用下降;使回归系数估计的置信区间变宽。

          

怎么办呢?

    你可以先通过以下方式来对多重共线性的检验

   1)方程确定系数很高,且与各自变量的相关系数也很高,但自变量的回归系数均不显著。

   2)方程的确定系数很高,但每一个自变量的偏确定系数很小。

   3)某一个自变量可被其他自变量线性表出;.

   4)分别构造不含某一自变量的K-1个自变量的回归模型,将它与包含所有自变量的回归模型比较,发现二者的确定系数很接近。

    

      还可以通过以下方法补救多重共线影响

 (1)去掉与y相关程度较低的,而又与其他自变量高度相关的变量;

         2)去掉可以被其他自变量线性表出的变量;

         3)增加样本规模;

         4)采用新的样本数据。

已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

报纸
ybylancet 发表于 2009-6-7 01:54:00 |只看作者 |坛友微信交流群

非常感谢大家的热心解答,非常感谢楼上的三位!

啊,真是个温暖的坛子啊,相对某些只装纯净水的坛子来说,真是让人感动~~~~~~

使用道具

非常好非常好

使用道具

7
爱苇眉子 发表于 2016-1-13 10:53:12 |只看作者 |坛友微信交流群
好厉害,言简意赅

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 18:46