楼主: jingke123
30474 13

(求助)虚拟变量的交互作用 [推广有奖]

  • 0关注
  • 0粉丝

大专生

5%

还不是VIP/贵宾

-

威望
0
论坛币
822 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
195 点
帖子
9
精华
0
在线时间
67 小时
注册时间
2014-4-27
最后登录
2017-5-13

楼主
jingke123 发表于 2015-10-23 22:24:40 |AI写论文
20论坛币
模型:log(wage)=b0+b1female+b2married+b3female*married+.....+u                                                                                                            
      b3表达的含义是结婚女性与单身男性之间工资的差距么?
还是b1+b2+b3表达的是结婚女性与单身男性之间收入的差距?如果是b1+b2+b3的话那单个的b3又表示什么呢?
谢谢

最佳答案

crystal8832 查看完整内容

看下伍德里奇书中186页含有交互项的模型或许对你有帮助。
关键词:交互作用 虚拟变量 Married Female Male 女性 单身 模型

回帖推荐

statax 发表于6楼  查看完整内容

建议楼主看看《基本无害的计量经济学》中文版第36-37页,对你理解应该会有所帮助。

本帖被以下文库推荐

沙发
crystal8832 学生认证  发表于 2015-10-23 22:24:41
jingke123 发表于 2015-10-23 23:15
看的就是伍德里奇那本书。
你说的明我没太理解。我拿个书上例子再稍微问明白点好了。如上传附件,家里和工 ...
看下伍德里奇书中186页含有交互项的模型或许对你有帮助。
已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
nuomin + 100 + 1 + 1 + 1 观点有启发

总评分: 经验 + 100  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
crystal8832 学生认证  发表于 2015-10-23 22:43:20
楼主看的应该是伍德里奇中关于虚拟变量的交互项吧?其实虚拟变量的交互项的目的无非是将四种情况分别考虑,一般b3的参数我们很少单独考虑,就像交互项里的求偏效应,结果必然是b3加上另外一个参数

板凳
jingke123 发表于 2015-10-23 23:15:26
看的就是伍德里奇那本书。
你说的明我没太理解。我拿个书上例子再稍微问明白点好了。 屏幕快照 2015-10-23 23.52.31.png 如上传附件,家里和工作都不使用电脑的人的工资与在在家和在工作中都使用电脑人的工资的差距是b1+b2+b3。基础组是都不使用电脑的的人,那么b1+b2+b3的话我的理解会包含3种情况。b1在家用电脑,b2在工作中用电脑,b3家和工作中都用电脑。这样这3加起来说不通啊。这跟之前的例子也差不多。b1和b2给我解释我能理解,如果b1+b2+b3是以上那么解释的话,你要是能帮我讲解b3的表达的意思整个方程我就能理解了。谢谢

报纸
crystal8832 学生认证  发表于 2015-10-23 23:46:33
一般不直接去解释b3的系数

地板
statax 发表于 2015-10-24 11:54:21
建议楼主看看《基本无害的计量经济学》中文版第36-37页,对你理解应该会有所帮助。
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
nuomin + 20 + 20 + 1 + 1 + 1 观点有启发

总评分: 经验 + 20  论坛币 + 20  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

7
jingke123 发表于 2015-10-24 23:00:33
两本书我都看了一下。
的确很少单独讨论b3。对b1或者b2进行偏微分之后b3会出现两种意思。
(1)结婚与否对女性工资的影响
(2)已婚的人,男性与女性之间的差距是多少。
这样理解没有问题吧?
两位多次回答我的问题非常感谢,还帮我找到在教科书上什么位置。
已有 1 人评分经验 收起 理由
crystal8832 + 10 精彩帖子

总评分: 经验 + 10   查看全部评分

8
七月流水 发表于 2016-8-11 10:01:09
jingke123 发表于 2015-10-24 23:00
两本书我都看了一下。
的确很少单独讨论b3。对b1或者b2进行偏微分之后b3会出现两种意思。
(1)结婚与否对女 ...
在家使用电脑或者在工作中使用电脑,其中的系数只有1个为1;
在家和工作中都是用电脑,其中的系数三个都为1;
在家和工作中都不使用电脑的,其系数都为0;
交互项是要考察两者之间有没有关系?

9
xxlxxlxxl 发表于 2016-12-9 16:07:22

若有错误或不妥处,还请多指教!!


虚拟编码用于类别变量,故数值不具有量化的意义,只是为了分组。

2*2平衡设计的虚拟编码有四取值,

便有二维向量(x1,x2)


表1  二维向量的维度及意义

————————————————————

维度      取值      意义

————————————————————  

x1         0,1      区分A变量上的类别

x2         0,1      区分B变量上的类别

————————————————————  



表2  自变量的取值及其意义

——————————————————

  取值       意义           备注

——————————————————

(0,0)    A0B0组       基线组  

(1,0)    A1B0组

(0,1)    A0B1组

(1,1)    A1B1组       交互作用组

——————————————————


表3 回归方程的系数及意义

—————————————————————————————————

系数             意义

—————————————————————————————————

b0                 基线组(A0B0)均值

b1                 A1B0组与基线组的差异

b2                 A0B1组与基线组的差异

b3               交互作用项系数,但可用于检验交互作用

b1+b2+b3   交互作用组(A1B1)和基线组(A0B0)的差异

—————————————————————————————————

注:系数是可正可负的


举例来说

表4  无交互作用情况

——————————————

                x1=0                x1=1

——————————————

x2=0        2                4


x2=1        3                5

——————————————

有回归方程

Y‘ = 2+(2)x1+(1)x2+(0)x1x2



表5  有交互作用情况

——————————————

                x1=0                x1=1

——————————————

x2=0        2                4


x2=1        3                7

——————————————

有回归方程

Y‘ = 2+(2)x1+(1)x2+(2)x1x2


表6 交互作用单元均数

——————————————

                x1=0                x1=1

——————————————

x2=0        a                b


x2=1        c                d

——————————————


表7 虚拟变量系数和单元均数对应关系

—————————————————————————————————

系数          对应表6中的值

—————————————————————————————————

b0               a

b1               b-a

b2               c-a

b3               (a+d)-(c+b)=(a-c)-(b-d)=(a-b)-(c-d)

b1+b2+b3   d-a

—————————————————————————————————

10
wytzqz 发表于 2017-6-30 21:44:03
虚拟变量交互项的作用解释对于初学者还是有点难理解,我在这借楼主的问题再阐述下自己的想法,供批判借鉴:
1. 婚姻和性别为什么会加交互项?
    原来考虑婚姻和性别的影响时,如果只加入婚姻和性别两个虚拟变量,即female=1(女性),female=0(男性);married=1(已婚),married=0(单身);那么,模型为:
log(wage)=b0+b1female+b2married+.....+u
即没有female*married这一交互项。
那么问题是:对于婚姻项而言,对于男性女性的作用强度是相同的,或者反过来,对于性别项而言,对于结婚和未结婚的作用强度也是相同的。比如以female为例,不管是1还是0(即不管是男是女),只要是结婚的,那就婚姻的影响都是b2(b1只是性别的影响),但实际上是,结婚对男女强度是不一样的。
     所以,就需要考虑婚姻和性别是相关的。那么一种办法就是分类四类:单身男性、单身女性、已婚男性、已婚女性,比如以单身男性为基准比较组,那么模型中用三个虚拟变量就可以解决这个问题。
     另一种办法就考虑交互项,可以得到类似的结果。具体如下:
2. 交互项的结果
  模型如楼主给出:log(wage)=b0+b1female+b2married+b3*female*married.....+u
首先,因为:
          female   married        female*married
单身男性        0        0         0
已婚男性        0        1         0
单身女性        1        0         0
已婚女性        1        1         1
所以,估计系数的意义如下(假设其他自变量不变):
(1)单身男性-平均工资:b0
(2)已婚男性-平均工资:b0+b2:
(3)单身女性-平均工资:b0+b1
(4)已婚女性-平均工资:b0+b1+b2+b3
    从而,把婚姻对男女的影响差别开来,结婚对男性的影响强度是b2,但对于女性的影响强度就是b2+b3(结婚时本身married=1,如果还是女性female=1,所以就增加了b3项。注意这里只考虑结婚的影响而不要考虑纯粹性别的影响b1);反过来,性别对已婚和未婚的影响也是类似的,即对于女性(female=1),未婚对女性工资影响程度是b1,已婚对女性工资影响程度是b1+b3(类似地,这里只考虑性别的影响而不要考虑纯粹结婚的影响b2)。  

    那么,交互项系数如果一定要解释,我觉得可以这么理解:方向上如果系统为负(b3<0),说明结婚对女性工资的影响相对男性是负的,即b2+b3<b2; 或者对于女性来讲,已婚相对未婚工资的影响也是负的,即b1+b3<b1。系数大小表示影响程度大小,b3越大说明结婚对不同性别工人的影响程度更大(或者性别对是否结婚的工人的影响程度更大)。
已有 6 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
十一子 + 1 + 1 + 1 精彩帖子
rvf739186 + 5 精彩帖子
寻找生活乐趣 + 1 + 1 + 1 精彩帖子
旧瓶新酒 + 1 观点有启发
enhancezhang + 1 + 1 + 1 + 1 精彩帖子
nuomin + 20 + 2 + 1 + 1 热心帮助其他会员

总评分: 经验 + 20  论坛币 + 6  学术水平 + 6  热心指数 + 4  信用等级 + 4   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 19:43