楼主: okokok_cj
20684 12

stata 虚拟变量 回归分析 [推广有奖]

  • 5关注
  • 1粉丝

大专生

81%

还不是VIP/贵宾

-

威望
0
论坛币
1004 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
470 点
帖子
60
精华
0
在线时间
41 小时
注册时间
2012-9-5
最后登录
2020-9-28

楼主
okokok_cj 发表于 2013-2-3 17:44:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教师兄师姐们,我正在做一个收入做被解释变量,三分类职业做解释变量的OLS回归分析,职业是分类变量,所以将职业变为虚拟变量,但发现将职业放入ols分析的不同方式会导致估计值发生变化。比如,reg lnwage occupa 其他控制变量-----------occupa只显示它的参数,得出参数是0.120;若reg lnwage occupa* 控制变量--------除了由于共线性自动剔除occupa1和occupa3后一共显示了occupa和occupa2的值分别是0.128和0.006,;若reg lnwage occupa1 occupa2 occupa3 控制变量----------剔除occupa1的共线性后显示了occupa2和occupa3的值分别是0.023和-0.001。
我的目的是想看,不同职业对收入的影响。
此外,模型中还有其他控制变量也是虚拟变量,会不会是由于收到其他变量影响?比如行业(六分类)。
想请教一下,究竟应该如何做,谢谢慷慨相助!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 回归分析 tata 虚拟变量 控制变量 职业 收入 回归分析

回帖推荐

frankyzj 发表于6楼  查看完整内容

模型中如果有常数项的话,设定虚拟变量的个数一定是类别数减一,比如性别有两个类别,同时四个季度有四个类别,这时应当设定一个性别虚变量,三个季节虚变量;还有一种情况要注意的是在模型中有多个类别变量时设定的虚变量有可能出现取值完全相同的情况:比如模型中有性别,和学历(学历只包含两种类别:大学毕业和非大学毕业),此时设定了一个性别虚变量比如男性,一个学历虚变量,比如大学毕业,如果你的样本中出现了所有的男性 ...

本帖被以下文库推荐

沙发
改革同步 发表于 2013-2-3 22:23:30
你把生成的三个虚拟变量都放进去了,当然要自动删掉一个了。三个一起放进去产生了虚拟变量陷阱了。
你应该找个对照组,对照组不同,结果当然也不一样了。

藤椅
rosen123 发表于 2013-2-4 08:59:20
三个变量2个自由度,就是2个虚拟变量

板凳
okokok_cj 发表于 2013-2-5 17:17:48
明白您的意思了,谢谢!

报纸
okokok_cj 发表于 2013-2-5 17:20:10
rosen123 发表于 2013-2-4 08:59
三个变量2个自由度,就是2个虚拟变量
一开始我以为已经设定了一个对照变量,stata会自动删除那个对照变量,后来才发现它还是会不停地变化。除了对照变量,直接放入两个虚拟变量就可以了,是吧?

地板
frankyzj 发表于 2013-2-5 17:26:48
模型中如果有常数项的话,设定虚拟变量的个数一定是类别数减一,比如性别有两个类别,同时四个季度有四个类别,这时应当设定一个性别虚变量,三个季节虚变量;还有一种情况要注意的是在模型中有多个类别变量时设定的虚变量有可能出现取值完全相同的情况:比如模型中有性别,和学历(学历只包含两种类别:大学毕业和非大学毕业),此时设定了一个性别虚变量比如男性,一个学历虚变量,比如大学毕业,如果你的样本中出现了所有的男性样本都是大学毕业,女性都是非大学毕业,就是说:所有大学毕业的样本都是男性,非大学毕业的样本都是女性,这种情况下回归的结果也会产生偏差。
已有 1 人评分经验 论坛币 收起 理由
胖胖小龟宝 + 10 + 10 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 10   查看全部评分

7
okokok_cj 发表于 2013-2-5 18:12:26
frankyzj 发表于 2013-2-5 17:26
模型中如果有常数项的话,设定虚拟变量的个数一定是类别数减一,比如性别有两个类别,同时四个季度有四个类 ...
您提醒的很及时,谢谢!
我的模型中确实存在者多个多分虚拟变量,可能存在取值相同的情况,那样如何避免这样情况的发生呢?或者说,如何对有偏差的结果进行检验和处理?

8
okokok_cj 发表于 2013-2-5 18:59:57
frankyzj 发表于 2013-2-5 17:26
模型中如果有常数项的话,设定虚拟变量的个数一定是类别数减一,比如性别有两个类别,同时四个季度有四个类 ...
举个例子,比如除了职业是三分类的,还有6个行业变量做了5个虚拟,三分教育水平2个虚拟,等等,取值都是0和1,肯定有取值相同的情况吧?都放进模型后,我该如何判断您所提到的取值完全相同的情况呢?
非常感谢!

9
frankyzj 发表于 2013-2-5 20:06:47
我说的后面的问题是样本的问题,与模型无光
已有 1 人评分热心指数 收起 理由
okokok_cj + 1 谢谢帮助

总评分: 热心指数 + 1   查看全部评分

10
okokok_cj 发表于 2013-2-11 13:14:43
frankyzj 发表于 2013-2-5 20:06
我说的后面的问题是样本的问题,与模型无光
那我明白了,我检查了一下,貌似暂时没有这样情况。谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 01:52