楼主: 凡汀啦
7900 8

[回归分析求助] 调节效应为什么要中心化 [推广有奖]

  • 0关注
  • 0粉丝

本科生

69%

还不是VIP/贵宾

-

威望
0
论坛币
116 个
通用积分
23.7072
学术水平
11 点
热心指数
11 点
信用等级
11 点
经验
889 点
帖子
44
精华
0
在线时间
148 小时
注册时间
2020-5-3
最后登录
2023-6-9

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
调节效应步骤 M为调节变量①Y=aX+控制变量
②Y=aX+bM+cXM+控制变量

看文献在②的时候自变量X和调节变量M都要中心化,参考《基于多元回归的调节效应分析》是为了减少非本质的多重共线性和更好地解释系数,那么在①的时候,自变量X需要中心化吗?是否中心化对a的显著性产生影响吗?

111.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:调节效应 中心化 多重共线性 调节变量 控制变量

回帖推荐

邱宗满 发表于7楼  查看完整内容

在进行调节效应分析时,如果准备对数据进行中心化(自变量与调节变量),或者标准化(一般对所有变量),则数据的转换应当在分析前进行。在之后的分析中,全部采用转换后的数据进行分析,才能保证前后结果一致。 因此,如果你已经对数据进行转换,则在①中应当使用中心化的自变量。并且,②中的X、M也应当是中心化变量,并且XM需要是中心化的X与M相乘得到的调节项。 (①中是否使用中心化变量不会影响变量自身的显著性,但会影 ...
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
拾柒17 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

沙发
哥哥海哥哥 在职认证  学生认证  发表于 2022-10-16 14:38:28 |只看作者 |坛友微信交流群
看来你确实去看文献了。关于调节效应要中心化的原因,其实在于对模型②中X和M的回归系数的解释。一般来说,在②这样一个交互项回归中,我们主要关注交互项XM的系数,而不过分解读X和M。其原因在于,若要解读X的系数,相当于是解读当M=0时X对Y的影响。而一般我们很少观察到M为0(或者说M为0时意义不大)。这个时候若要解读X,则应对其进行中心化。中心化之后再解读X的系数,就变成了解读当M在其平均水平时X对Y的影响。

使用道具

藤椅
凡汀啦 学生认证  发表于 2022-10-16 15:24:04 |只看作者 |坛友微信交流群
哥哥海哥哥 发表于 2022-10-16 14:38
看来你确实去看文献了。关于调节效应要中心化的原因,其实在于对模型②中X和M的回归系数的解释。一般来说, ...
大概能理解中心化是为了方便系数解释,X的系数a在调节变量M取平均的时候有意义,但是具体到方程的操作上,在①式的时候需要将X中心化,和后面的方程②保持一致吗?还是说①的时候直接按正常操作,不用中心化呢?

使用道具

板凳
shuangshuangle 在职认证  发表于 2022-10-16 15:51:14 |只看作者 |坛友微信交流群
quite great to find it

使用道具

报纸
哥哥海哥哥 在职认证  学生认证  发表于 2022-10-16 19:43:35 |只看作者 |坛友微信交流群
凡汀啦 发表于 2022-10-16 15:24
大概能理解中心化是为了方便系数解释,X的系数a在调节变量M取平均的时候有意义,但是具体到方程的操作上, ...
①不需要。直接解读就可以了。不会影响显著性的

使用道具

地板
Raymond.K 学生认证  发表于 2022-10-17 15:27:44 |只看作者 |坛友微信交流群

使用道具

7
邱宗满 学生认证  发表于 2022-10-17 16:34:25 |只看作者 |坛友微信交流群
在进行调节效应分析时,如果准备对数据进行中心化(自变量与调节变量),或者标准化(一般对所有变量),则数据的转换应当在分析前进行。在之后的分析中,全部采用转换后的数据进行分析,才能保证前后结果一致
因此,如果你已经对数据进行转换,则在①中应当使用中心化的自变量。并且,②中的X、M也应当是中心化变量,并且XM需要是中心化的X与M相乘得到的调节项。

(①中是否使用中心化变量不会影响变量自身的显著性,但会影响截距。尽管截距经常被忽视,但其结果仍需要保持前后一致。)


中心化或标准化的作用:

1.减少非本质的多重共线性

当构成多项式的基础变量,如描述中的X或M,其均值远大于标准差时,会导致多项式与原始变量具有高度的相关,从而造成多重共线性,并可能进一步导致模型无法分析。对于这一点,你可以自己尝试:对X与M加上1000000的常数,计算调节项,并将这些数据进行相关分析。

2.改变低阶变量系数及其显著性

对于Y=aX+bM+cXM+...+e,最高阶多项式(使用变量相乘得到的新变量)是XM,无论X和M如何进行平移与缩放(中心化与标准化),其系数c也只会因为X和M的尺度缩放而跟随着缩放,XM的显著性无论如何都不会改变

因为此时对XM求偏导,其系数为Y'(xm)=c,其斜率是一个常数c。
而此时低阶变量系数受到高阶变量影响。若以X为视角,求X偏导,则Y'(x)=a+cM,此时X的斜率是与常数a、c以及变量M有关的函数,也就是说,M数值变大或者变小都会影响X的斜率,自然,也会影响X斜率的显著性

根据上述内容,进行多项式分析时,低阶变量的斜率和显著性永远是受影响的,所以直接解读低阶变量系数基本是没有意义的,除了某些特定的情况

也即截图论文中描述的“改变回归系数a、b的大小和显著性检验结果”


3.调节效应的解释:能直接解读低阶变量系数的特定情况
调节效应的大白话版本是“条件效应”,即X→Y的关系是有条件的,而第三者M就是这个条件。随着M数值的变化,X→Y的系数可能变大或变小,这就是调节效应。

因此,对调节效应的解释需要结合调节变量M的水平,所以在回归分析中,调节项XM显著后,还需要进一步做简单斜率(Simple slope)分析来对调节效应进行解释

而调节变量如果是具有特定实际意义的变量,例如年龄,则调节变量水平可以选择20岁或30岁。但实际分析中的调节变量往往较难选出一个具有实际意义的水平,所以一般会选择当前数据里调节变量的高、中、低等水平作为具有特定意义的水平,最常用的是正负1个标准差以及均值

进行中心化或者标准化时,都涉及将数据减去数据自身平均值的平移过程,也就是说,此时数据已经转换为自身的“均值”水平,进一步说,此时的调节变量已经是均值水平。因此,此时的自变量X的系数是调节变量平均水平下的系数,也可以认为普遍情况下(假装不考虑调节效应)的X→Y系数,或者做两因素方差分析的研究者喜欢用的术语“主效应”。

此时X的系数可以直接进行解读,也即截图中描述的“改善对回归系数a和b的理解”



已有 2 人评分学术水平 热心指数 信用等级 收起 理由
xqy1454171344 + 1 + 1 + 1 精彩帖子
凡汀啦 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

已销号

使用道具

8
凡汀啦 学生认证  发表于 2022-10-23 15:40:48 |只看作者 |坛友微信交流群
哥哥海哥哥 发表于 2022-10-16 19:43
①不需要。直接解读就可以了。不会影响显著性的
好的,感谢感谢~

使用道具

9
毛茸茸的光头 发表于 2022-10-24 09:20:51 |只看作者 |坛友微信交流群
大佬出现了!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-14 07:01