楼主: 我是谁2005
8955 10

包含交互项的方程,各变量的系数大小应该怎么计算呀,请大家帮助 [推广有奖]

  • 0关注
  • 18粉丝

VIP

浙江工业大学经贸学院

已卖:2471份资源

院士

34%

还不是VIP/贵宾

-

威望
6
论坛币
12093747 个
通用积分
11529.1946
学术水平
24 点
热心指数
38 点
信用等级
18 点
经验
56441 点
帖子
1728
精华
0
在线时间
1729 小时
注册时间
2005-12-8
最后登录
2025-12-24

楼主
我是谁2005 发表于 2014-11-14 13:52:26 |AI写论文
50论坛币
我现在的论文中,比如我的回归模型为:y=a1*x1+a2*x2+a3(x1*x2),现在前两个解释变量与交叉相有共线性,书上说应该减去均值,我现在想问这么几个问题:
    问题1:减去均值后,方程是变为:y=b1(x1-均值)+b2(X2-均值)+b3(X1-均值)*(X2-均值),这样对吗,还是有其他的表达式。

    问题2:如果上面的表达式是对的,如果得出b1=0.1,b2=0.2,b3=0.3,a1=0.4,a2=0.5,a3=0.6,X1的均值=0.1,X2的均值=0.2,那么X1、X2和X1*X2的系数到底是多少呀,我不会解释,请高手帮助下。

在最后的估计结果中,我可以直接认为X1的系数为b1,X2的系数为b2,交叉相的系数为b3,还是需要重新将表达式写出来,进行重新结合呀,请大家帮助




关键词:交互项 估计结果 回归模型 解释变量 表达式 表达式 论文 模型

回帖推荐

tzhdingli 发表于2楼  查看完整内容

版上有类似问题, 可见他们的讨论:https://bbs.pinggu.org/thread-2434173-1-1.html 以及 https://bbs.pinggu.org/thread-1531216-1-1.html 对你的问题: 1. 这么处理是对的,更复杂的方法是中心化之后再除一个标准差,这样系数更有意义;中心化之后,三个regressor之前没有correlate,因为Cov[x1-均值, (x1-均值)(x2-均值)]=E[(x1-均值)^2(x2-均值)]-E(x1-均值)E[(x1-均值)(x2-均值)]=0 {如果x1,x2 独立} 2.减去均值后,如 ...

本帖被以下文库推荐

沙发
tzhdingli 在职认证  发表于 2014-11-14 17:24:08
版上有类似问题, 可见他们的讨论:https://bbs.pinggu.org/thread-2434173-1-1.html 以及 https://bbs.pinggu.org/thread-1531216-1-1.html

对你的问题:
1. 这么处理是对的,更复杂的方法是中心化之后再除一个标准差,这样系数更有意义;中心化之后,三个regressor之前没有correlate,因为Cov[x1-均值, (x1-均值)(x2-均值)]=E[(x1-均值)^2(x2-均值)]-E(x1-均值)E[(x1-均值)(x2-均值)]=0   {如果x1,x2 独立}
2.减去均值后,如果原模型有常数项,则其他系数并不变,常数项系数变化(加上均值);如果没有常数项,则系数有变化; 你这个例子我没有看到常数项,那么系数确实有变化了,其含义很难解释,但我想一般情况下是有常数项的,尤其是在有dummy的时候
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 2 + 2 + 2 精彩帖子
admin_kefu + 60 根据规定进行奖励

总评分: 经验 + 100  论坛币 + 60  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

藤椅
我是谁2005 发表于 2014-11-14 18:09:58
tzhdingli 发表于 2014-11-14 17:24
版上有类似问题, 可见他们的讨论:https://bbs.pinggu.org/thread-2434173-1-1.html 以及 http://bbs.pingg ...
你好,我还想问一下,进行减去均值后的回归后,减去均值方程的每一项都会得出它们各自的系数,然后我需要把这个表达式写出来,并且重新把括号中的乘开,形成没有减去均值时候变量的形式,然后每个考察变量前面的系数就是我需要的系数,这样对吗。还是我考察的变量只用以减去均值的方程每一项前的系数就可以了

板凳
Yue俊 发表于 2014-11-14 18:33:23
减去均值是对交叉项做处理,对原来项并不做变化,回归后改变的其实只是参数b1、b2(以及截距项(因为你在这对两个交互项都做了均值处理,所以也改变了截距项)),参数b3并不受影响。因为b3对应的变量x1*x3并不改变,只是多了b3*(x1bar)和b3*(x2bar)以及(x1bar)*(x2bar)这三项,加到原来方程中就变回原来的模型啦。但现实中我们常做的只是减去其中一个的均值以考察另一个变量在均值处的偏效应。y=a1*x1+a2*x2+a3(x1*x2)中,要考察在均值处x1的偏效应,则变为y=a1*x1+a2*x2+a3(x1*(x2-均值))
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 100  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

报纸
我是谁2005 发表于 2014-11-14 20:48:32
Yue俊 发表于 2014-11-14 18:33
减去均值是对交叉项做处理,对原来项并不做变化,回归后改变的其实只是参数b1、b2(以及截距项(因为你在这 ...
感谢回复,不过我还是不太懂,按你最后的公式的话,X1不是又与交叉项有多重共线性了吗,这里是不需要考虑共线性吗。
还有,我的意思是除了得到交叉相的系数外,还想得到X1变量和X2变量的系数,它们的系数应该是多少呀,是用减去均值后的方程前两项的系数,还是把减去均值的方程重新进行组合变回原来没有减去均值的方程形成,然后再取前两项的系数作为X1和X2的系数呀

地板
statax 发表于 2014-11-14 21:27:13
你的方法是有问题的,x1和x2相乘得到的新变量,姑且叫x3吧,回归应该是y, x1, x2, x3都减去均值。其实,回归方程有下标i的,把所有i累加再除样本数就是一个均值方程,然后所有有i的方程左右两边都减去均值方程,是恒等变换,所有参数都不变。你交叉项分别减均值则参数改变了。
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 100  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

7
Yue俊 发表于 2014-11-14 23:32:41
我是谁2005 发表于 2014-11-14 20:48
感谢回复,不过我还是不太懂,按你最后的公式的话,X1不是又与交叉项有多重共线性了吗,这里是不需要考虑 ...
我觉得交互项和原来项是不存在共线性的因为交互项是两个变量相乘后而变成了一个新的变量,而不是共线性(只是相关)。如果这两个在这是多重共线性那你原来方程里也就存在了这个问题了~!另外我上面的做法就是为了求x1、x2的偏效应系数(进而把交叉项的变量均值化以消掉交叉项!)
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 100  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

8
tzhdingli 在职认证  发表于 2014-11-15 04:37:10
我是谁2005 发表于 2014-11-14 20:48
感谢回复,不过我还是不太懂,按你最后的公式的话,X1不是又与交叉项有多重共线性了吗,这里是不需要考虑 ...
注意:
1. 若有常数项,则dummy的系数不会变
2.所谓多重共线性,指的是两个或多个变量组成的矩阵不是full column rank,  一列X1,一列X2,一列X1X2,是没有多重共线性的,只是correlation比较强,在估计时参数的standard error会比较大而已(因为correlation模糊了每个变量单独的影响)
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 100  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

9
我是谁2005 发表于 2014-11-16 08:46:25
Yue俊 发表于 2014-11-14 23:32
我觉得交互项和原来项是不存在共线性的因为交互项是两个变量相乘后而变成了一个新的变量,而不是共线性( ...
你好,感谢回复,我想把我的问题说清楚一点,就是,我的原模型是y=c+a1*x1+a2*x2+a3(x1*x2),称为方程(1),我论文的目的是想得到x1、x2和x1*x2的系数,即a1、a2和a3,但由于可能的严重相关性问题,我就只能估计减去均值的方程,即y=c+b1*(x1-均值)+b2*(x2-均值)+b3(x1-均值)*(x2-均值),称为方程(2),由于只估计了方程(2),得到了系数b1、b2和b3。那现在我想得到的x1、x2和x1*x2的系数是哪个,是可以把系数b1、b2和b3直接拿来当作他们的系数拿来用,还是需要把估计后的方程(2)进行重新合并,组合成方程(1)的形式,然后取新的方程(1)中的x1、x2和x1*x2的系数呢?,还望解答下

10
Yue俊 发表于 2014-11-16 13:50:40
我是谁2005 发表于 2014-11-16 08:46
你好,感谢回复,我想把我的问题说清楚一点,就是,我的原模型是y=c+a1*x1+a2*x2+a3(x1*x2),称为方程(1 ...
我明白了,但是你这样子做的话你的模型改变了,1和2的模型不是同一个,会影响你的参数的估计结果!
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
我是谁2005 + 100 + 2 + 2 + 2 精彩帖子

总评分: 经验 + 100  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 16:23