楼主: jdshy
20010 17

[学习资料] 相关性与回归系数相反?跪求高人!!! [推广有奖]

11
zhang19901211 发表于 2016-1-20 19:52:54
我也遇到了这个问题,刚问了一下别人,好像是,相关系数是单独的自变量和因变量的关系,而多元回归的回归系数是因变量剔除了其他自变量的影响后与某个自变量的关系,二者也就是说相关系数和多元回归的回归系数表示的不是同一个统计量。。。希望能帮到你!!!

12
zhang19901211 发表于 2016-1-20 20:32:31
伍德里奇课本上的经典案例:在一个研究犯罪率的研究里,研究者让犯罪率和失业率进行回归,一般正常来说,失业率越高犯罪率应该越高,因为失去工作的人更可能参与抢劫、偷窃等犯罪活动,但是这个研究的一元回归发现,失业率前面的系数是负的!后来这个研究者加入了一个控制变量——五年前相应地区的失业率(这是一种计量控制方法,相当于控制了很多没有加入的变量,你可以理解为是加入了一个”文化传统、社会结构“这样类型的变量),控制了其他因素后,系数变成正的了.
这个例子是说,你可能是在一元回归里忽略了很多重要变量.一元回归的结果是可能是错误的.
为什么会有这样的效应呢?这是因为如果遗漏了重要变量,回归的结果会有偏误:真正的X1的系数B1会偏误为(如果我们假设X2是被遗漏的变量),B1(有偏)=B1(无偏)+B2*L12 .其中L12是X1、X2的相关系数,B2是X2的无偏系数,如果B2*L12很大的话,可能会改变B1(有偏)的方向.例如例子1里,B1(无偏)是正的(女性记忆力好),B2是正的(教育多,记忆力好),L12是负的(女性教育相对男性少),由于B2*L12的绝对值很大,导致了B1(有偏)变成负的了.
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
huixuejingji + 1 + 1 精彩帖子
mzdg + 5 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1   查看全部评分

13
mzdg 在职认证  学生认证  发表于 2016-12-8 19:54:21
zhang19901211 发表于 2016-1-20 20:32
伍德里奇课本上的经典案例:在一个研究犯罪率的研究里,研究者让犯罪率和失业率进行回归,一般正常来说,失业率 ...
请问这部分内容是在那本书的具体哪一块呢,我找了半天没找到

14
abcabc123 发表于 2017-2-18 11:36:11
zhang19901211 发表于 2016-1-20 20:32
伍德里奇课本上的经典案例:在一个研究犯罪率的研究里,研究者让犯罪率和失业率进行回归,一般正常来说,失业率 ...
案例很有道理!

15
lzd1314 学生认证  发表于 2018-12-28 10:06:33
法鼓山 发表于 2012-10-30 22:46
楼主的回归显然是个多元回归,如果是一元回归,则不可能出现这种情况。如果是多元回归,则结果很正常
你好,那这样的情况报告的时候怎么解释呢

16
lzd1314 学生认证  发表于 2019-2-14 14:08:36
zhang19901211 发表于 2016-1-20 19:52
我也遇到了这个问题,刚问了一下别人,好像是,相关系数是单独的自变量和因变量的关系,而多元回归的回归系 ...
你好,请问论文中怎么解释呢,报告的话会不会被问

17
cmye123 发表于 2023-7-12 13:12:27 来自手机
lzd1314 发表于 2019-2-14 14:08
你好,请问论文中怎么解释呢,报告的话会不会被问
您还,请问您现在知道了吗

18
赵安豆 发表于 2024-12-8 09:48:28
在统计分析中,确实存在一些情况使得直观上相关性和回归系数的符号(正或负)看起来不一致。不过,这种情况通常发生在包含多个自变量的多元回归模型中,并且可能由以下几个原因造成:

1. **其他变量的影响**:在多元线性回归中,每个自变量的系数是在控制了其他所有自变量的情况下估计的。这意味着一个自变量与因变量之间的关系可能受到第三个(或更多)变量的存在和影响而被“反转”。这被称为“中介效应”、“调节作用”或“混杂因素”的效果。

2. **多重共线性**:尽管您提到VIF值在可接受范围内,但在某些情况下,轻微的多重共线性也可能导致回归系数的符号与预期不符。这是因为即使变量之间相关性不高,它们共同对因变量的影响方式也可能复杂且非直观。

3. **样本和数据结构**:有时候,特定的数据集或样本的选择可能导致看似矛盾的结果。例如,在一个小样本或不具代表性的样本中进行分析可能会产生异常结果。

4. **模型设定问题**:如果回归模型的假设没有满足(如线性关系、同方差等),或者模型中遗漏了重要变量,这都可能影响系数估计值的准确性和符号方向。

在处理这种情况时,建议重新审视您的数据和模型:

- 检查是否存在显著但未包含在内的混杂因素。
- 确保模型中的假设(如线性、同方差)得到满足。
- 通过增加其他相关变量或进行敏感度分析来测试结果的稳定性。

如果问题仍然存在,可能需要深入研究数据的具体结构和潜在机制,或者考虑使用更复杂的统计方法(例如分层回归、贝叶斯模型等)。在某些情况下,与领域的专家合作也可能有助于理解这种不一致背后的原因。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 04:02