调节效应为什么要中心化 - Stata专版 - 经管之家(原人大经济论坛)

0关注
0粉丝

本科生

69%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 116 个
通用积分: 23.7072
学术水平: 11 点
热心指数: 11 点
信用等级: 11 点
经验: 889 点
帖子: 44
精华: 0
在线时间: 148 小时
注册时间: 2020-5-3
最后登录: 2023-6-9

楼主

凡汀啦

发表于 2022-10-16 11:34:28 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

调节效应步骤 M为调节变量①Y=aX+控制变量
②Y=aX+bM+cXM+控制变量

看文献在②的时候自变量X和调节变量M都要中心化，参考《基于多元回归的调节效应分析》是为了减少非本质的多重共线性和更好地解释系数，那么在①的时候，自变量X需要中心化吗？是否中心化对a的显著性产生影响吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏14 回帖

关键词：调节效应中心化多重共线性调节变量控制变量

回帖推荐

邱宗满发表于7楼查看完整内容

在进行调节效应分析时，如果准备对数据进行中心化（自变量与调节变量），或者标准化（一般对所有变量），则数据的转换应当在分析前进行。在之后的分析中，全部采用转换后的数据进行分析，才能保证前后结果一致。因此，如果你已经对数据进行转换，则在①中应当使用中心化的自变量。并且，②中的X、M也应当是中心化变量，并且XM需要是中心化的X与M相乘得到的调节项。（①中是否使用中心化变量不会影响变量自身的显著性，但会影 ...

已有 1 人评分	学术水平	热心指数	信用等级	收起理由
拾柒17	+ 1	+ 1	+ 1	精彩帖子

总评分: 学术水平 + 1 热心指数 + 1 信用等级 + 1 查看全部评分

使用道具举报

沙发

哥哥海哥哥

发表于 2022-10-16 14:38:28 |只看作者 |坛友微信交流群

看来你确实去看文献了。关于调节效应要中心化的原因，其实在于对模型②中X和M的回归系数的解释。一般来说，在②这样一个交互项回归中，我们主要关注交互项XM的系数，而不过分解读X和M。其原因在于，若要解读X的系数，相当于是解读当M=0时X对Y的影响。而一般我们很少观察到M为0（或者说M为0时意义不大）。这个时候若要解读X，则应对其进行中心化。中心化之后再解读X的系数，就变成了解读当M在其平均水平时X对Y的影响。

使用道具举报

藤椅

凡汀啦

发表于 2022-10-16 15:24:04 |只看作者 |坛友微信交流群

哥哥海哥哥发表于 2022-10-16 14:38
看来你确实去看文献了。关于调节效应要中心化的原因，其实在于对模型②中X和M的回归系数的解释。一般来说， ...

大概能理解中心化是为了方便系数解释，X的系数a在调节变量M取平均的时候有意义，但是具体到方程的操作上，在①式的时候需要将X中心化，和后面的方程②保持一致吗？还是说①的时候直接按正常操作，不用中心化呢？

使用道具举报

板凳

shuangshuangle

发表于 2022-10-16 15:51:14 |只看作者 |坛友微信交流群

quite great to find it

使用道具举报

报纸

哥哥海哥哥

发表于 2022-10-16 19:43:35 |只看作者 |坛友微信交流群

凡汀啦发表于 2022-10-16 15:24
大概能理解中心化是为了方便系数解释，X的系数a在调节变量M取平均的时候有意义，但是具体到方程的操作上， ...

①不需要。直接解读就可以了。不会影响显著性的

使用道具举报

地板

Raymond.K

发表于 2022-10-17 15:27:44 |只看作者 |坛友微信交流群

https://www.lianxh.cn/news/454644a5b7e3b.html

使用道具举报

7楼

邱宗满

发表于 2022-10-17 16:34:25 |只看作者 |坛友微信交流群

在进行调节效应分析时，如果准备对数据进行中心化（自变量与调节变量），或者标准化（一般对所有变量），则数据的转换应当在分析前进行。在之后的分析中，全部采用转换后的数据进行分析，才能保证前后结果一致。
因此，如果你已经对数据进行转换，则在①中应当使用中心化的自变量。并且，②中的X、M也应当是中心化变量，并且XM需要是中心化的X与M相乘得到的调节项。

（①中是否使用中心化变量不会影响变量自身的显著性，但会影响截距。尽管截距经常被忽视，但其结果仍需要保持前后一致。）

中心化或标准化的作用：

1.减少非本质的多重共线性

当构成多项式的基础变量，如描述中的X或M，其均值远大于标准差时，会导致多项式与原始变量具有高度的相关，从而造成多重共线性，并可能进一步导致模型无法分析。对于这一点，你可以自己尝试：对X与M加上1000000的常数，计算调节项，并将这些数据进行相关分析。

2.改变低阶变量系数及其显著性

对于Y=aX+bM+cXM+...+e，最高阶多项式（使用变量相乘得到的新变量）是XM，无论X和M如何进行平移与缩放（中心化与标准化），其系数c也只会因为X和M的尺度缩放而跟随着缩放，XM的显著性无论如何都不会改变。

因为此时对XM求偏导，其系数为Y'(xm)=c，其斜率是一个常数c。
而此时低阶变量系数受到高阶变量影响。若以X为视角，求X偏导，则Y'(x)=a+cM，此时X的斜率是与常数a、c以及变量M有关的函数，也就是说，M数值变大或者变小都会影响X的斜率，自然，也会影响X斜率的显著性。

根据上述内容，进行多项式分析时，低阶变量的斜率和显著性永远是受影响的，所以直接解读低阶变量系数基本是没有意义的，除了某些特定的情况。

也即截图论文中描述的“改变回归系数a、b的大小和显著性检验结果”

3.调节效应的解释：能直接解读低阶变量系数的特定情况
调节效应的大白话版本是“条件效应”，即X→Y的关系是有条件的，而第三者M就是这个条件。随着M数值的变化，X→Y的系数可能变大或变小，这就是调节效应。

因此，对调节效应的解释需要结合调节变量M的水平，所以在回归分析中，调节项XM显著后，还需要进一步做简单斜率（Simple slope）分析来对调节效应进行解释。

而调节变量如果是具有特定实际意义的变量，例如年龄，则调节变量水平可以选择20岁或30岁。但实际分析中的调节变量往往较难选出一个具有实际意义的水平，所以一般会选择当前数据里调节变量的高、中、低等水平作为具有特定意义的水平，最常用的是正负1个标准差以及均值。

进行中心化或者标准化时，都涉及将数据减去数据自身平均值的平移过程，也就是说，此时数据已经转换为自身的“均值”水平，进一步说，此时的调节变量已经是均值水平。因此，此时的自变量X的系数是调节变量平均水平下的系数，也可以认为普遍情况下（假装不考虑调节效应）的X→Y系数，或者做两因素方差分析的研究者喜欢用的术语“主效应”。

此时X的系数可以直接进行解读，也即截图中描述的“改善对回归系数a和b的理解”