楼主: cscwang
17318 21

[学科前沿] 关于控制变量 [推广有奖]

11
zhangader 在职认证  发表于 2005-6-16 18:33:00

强烈抗议stattoeco言行

不要动不动就叫人家去看书,这是中国人的恶习,同学有问题,你能解救就解救,要去看书用不着你说。

你很能的话,就用最简单、最明了的语言说出来,这对你也是一种提高,不要故作高声看书看书。自己也不知

动了多少。学霸,恶心!!!有些人以为懂了,其实他懂得的仅仅是皮毛皮毛而已。赞同我得的请强烈支持。

12
jerry 发表于 2005-6-17 02:25:00
Dummy variables are not necessary to be boolean variables(0/1), theycould be 1,2,3,4,....Application....ie : cross-section data analysis.
家穷人丑,小学文化,农村户口。

13
yinhezhiwang 发表于 2010-6-28 23:06:13
设置控制变量,目的是消除外生变异对因变量的影响。因为,当我们假设自变量x对因变量y有影响时,可能还有其他变量也是影响y的自变量,此时,如果我们只检验x对y的影响,可能无法正确判断是否x与y之间显性的影响系数真正是由x唯一对y发生作用的,即有可能高估x对y的影响,为了消除这种猜疑,需要把一些可能对y产生影响的其他变量与我们关注的自变量x同时考虑,但这些变量并不是我们关注的重点,即我们对这些变量与因变量y之间的关系是否显著,并不在意,我们关注的焦点依然是x对y的影响,这些被同时作为自变量与x一起用作对y变量进行回归的变量就是我们所说的控制变量,可以这样理解:控制这些变量,再观察x对y 的影响,此时得到的结果更真实可信。在回归模型中的具体操作有两种做法:(1)纳入法,类似交互效应的检验,需要将控制变量、自变量x以及二者的标准化后值乘积项同时对y进行回归;(2)统计控制,就是把控制变量与x都用作自变量对y进行回归。详细论述建议参考:陈晓萍、徐淑英 编著的《组织与管理研究的实证方法》2008版的第123和124页。至于虚拟变量,并不是所有控制变量都有必要搞成虚拟变量的,比如在研究战略对企业绩效的影响时,企业规模(员工人数或资本额)变量也需要作为控制变量纳入回归模型中,但企业规模就没必要搞成虚拟变量了。但像企业行业、所有制类型就必须搞成虚拟变量才能纳入回归模型中,如果只有两个行业则设置一个虚拟变量,第一个行业的虚拟变量值为0,第二个行业的虚拟变量值为1;如果有3个行业则需要设置两个虚拟变量,第一个虚拟变量的值是这样设置的,当企业为第2个行业时,则虚拟变量值设为1,其他值全部设为0,第二个虚拟变量的值这样设置,当企业为第3个行业时,则虚拟变量值设为1,其他值全部设为0,同理4行业需要设置3个虚拟变量,依次类推。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
yearslake + 5 + 5 + 5 精彩帖子

总评分: 学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

14
yanyan040103 发表于 2010-8-18 20:08:49
感谢版主,受教了!!

15
yuanlicun 发表于 2010-10-11 13:33:59
yinhezhiwang 发表于 2010-6-28 23:06
设置控制变量,目的是消除外生变异对因变量的影响。因为,当我们假设自变量x对因变量y有影响时,可能还有其他变量也是影响y的自变量,此时,如果我们只检验x对y的影响,可能无法正确判断是否x与y之间显性的影响系数真正是由x唯一对y发生作用的,即有可能高估x对y的影响,为了消除这种猜疑,需要把一些可能对y产生影响的其他变量与我们关注的自变量x同时考虑,但这些变量并不是我们关注的重点,即我们对这些变量与因变量y之间的关系是否显著,并不在意,我们关注的焦点依然是x对y的影响,这些被同时作为自变量与x一起用作对y变量进行回归的变量就是我们所说的控制变量,可以这样理解:控制这些变量,再观察x对y 的影响,此时得到的结果更真实可信。在回归模型中的具体操作有两种做法:(1)纳入法,类似交互效应的检验,需要将控制变量、自变量x以及二者的标准化后值乘积项同时对y进行回归;(2)统计控制,就是把控制变量与x都用作自变量对y进行回归。详细论述建议参考:陈晓萍、徐淑英 编著的《组织与管理研究的实证方法》2008版的第123和124页。至于虚拟变量,并不是所有控制变量都有必要搞成虚拟变量的,比如在研究战略对企业绩效的影响时,企业规模(员工人数或资本额)变量也需要作为控制变量纳入回归模型中,但企业规模就没必要搞成虚拟变量了。但像企业行业、所有制类型就必须搞成虚拟变量才能纳入回归模型中,如果只有两个行业则设置一个虚拟变量,第一个行业的虚拟变量值为0,第二个行业的虚拟变量值为1;如果有3个行业则需要设置两个虚拟变量,第一个虚拟变量的值是这样设置的,当企业为第2个行业时,则虚拟变量值设为1,其他值全部设为0,第二个虚拟变量的值这样设置,当企业为第3个行业时,则虚拟变量值设为1,其他值全部设为0,同理4行业需要设置3个虚拟变量,依次类推。
控制变量未必是虚拟变量。很多控制变量是一个独立的自变量。
虚拟变量,其实是一种调节变量,或调节截距,或调节斜率。调节截距时,以独立变量进行回归;调节斜率时,为交互效应,故以与被调节自变量的乘积进入回归。

自己的理解,可能有误。

16
sinopart 发表于 2010-12-9 21:28:54
收益好多,谢谢大家
我并非天生璀璨的钻石,但我希望时间和磨砺令我焕发别样光芒

17
liuli12345 发表于 2011-6-10 08:40:35
yinhezhiwang 发表于 2010-6-28 23:06
设置控制变量,目的是消除外生变异对因变量的影响。因为,当我们假设自变量x对因变量y有影响时,可能还有其他变量也是影响y的自变量,此时,如果我们只检验x对y的影响,可能无法正确判断是否x与y之间显性的影响系数真正是由x唯一对y发生作用的,即有可能高估x对y的影响,为了消除这种猜疑,需要把一些可能对y产生影响的其他变量与我们关注的自变量x同时考虑,但这些变量并不是我们关注的重点,即我们对这些变量与因变量y之间的关系是否显著,并不在意,我们关注的焦点依然是x对y的影响,这些被同时作为自变量与x一起用作对y变量进行回归的变量就是我们所说的控制变量,可以这样理解:控制这些变量,再观察x对y 的影响,此时得到的结果更真实可信。在回归模型中的具体操作有两种做法:(1)纳入法,类似交互效应的检验,需要将控制变量、自变量x以及二者的标准化后值乘积项同时对y进行回归;(2)统计控制,就是把控制变量与x都用作自变量对y进行回归。详细论述建议参考:陈晓萍、徐淑英 编著的《组织与管理研究的实证方法》2008版的第123和124页。至于虚拟变量,并不是所有控制变量都有必要搞成虚拟变量的,比如在研究战略对企业绩效的影响时,企业规模(员工人数或资本额)变量也需要作为控制变量纳入回归模型中,但企业规模就没必要搞成虚拟变量了。但像企业行业、所有制类型就必须搞成虚拟变量才能纳入回归模型中,如果只有两个行业则设置一个虚拟变量,第一个行业的虚拟变量值为0,第二个行业的虚拟变量值为1;如果有3个行业则需要设置两个虚拟变量,第一个虚拟变量的值是这样设置的,当企业为第2个行业时,则虚拟变量值设为1,其他值全部设为0,第二个虚拟变量的值这样设置,当企业为第3个行业时,则虚拟变量值设为1,其他值全部设为0,同理4行业需要设置3个虚拟变量,依次类推。
非常透彻的讲解!受教了!

18
cocozhong42 发表于 2011-7-27 15:07:28
有點明白。
我追求的是彼岸的花朵。

19
pengyuannadi 发表于 2012-8-8 09:14:53
学习不少,谢谢。。

20
qingbo0221 发表于 2012-8-31 16:31:59
很受益,谢谢~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-24 20:40