楼主: annannie
4116 4

虚拟变量陷阱 [推广有奖]

  • 0关注
  • 1粉丝

等待验证会员

大专生

85%

还不是VIP/贵宾

-

威望
0
论坛币
567 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
239 点
帖子
27
精华
0
在线时间
98 小时
注册时间
2012-2-10
最后登录
2021-1-27

楼主
annannie 发表于 2012-2-22 16:45:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位,请教一下,我的数据分为五类:小学及以下,初中,高中,中专技校,以及大专及以上。我为此建立了以小学及以下为基准的四个虚拟变量,做probit回归时,提示出现共线性,这是怎么回事呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:虚拟变量 Probit回归 Probit bit 共线性 初中 大专

沙发
jannsz06 发表于 2012-2-22 17:35:57
一|作为连续变量处理,解释为教育
二、如果要关注处理效应,则匪类为小学,初中、大学三类,使用recode

藤椅
annannie 发表于 2012-2-22 19:17:30
已经处理为分类变量了。变量edu是小学及以下为1,其他分别为2,3,4,5.于是比如对2,我的命令是:gen edu2=1 if edu==2,replace edu2=0 if edu==1,其他都是这么处理,建立四个虚拟变量,请问我是哪里出了问题?谢谢

板凳
h3327156 发表于 2012-2-22 21:17:10
这个问题我也曾经遇过! 经验是这要看您的资料,您说的五类里,
肯定有的教育层级的比例特别特别少,或者两教育层级的比例很类似很类似。

我个人认为jannsz06提供处里的方式很好,您应当可以试试看

他的第一个建议,意思是建议您教育变数当作连续变量处理,或许您可以使用"受教育年数"这样的变量,
不过这有缺点,因为基于这个变量求出的边际效果意思增加一年教育,造成就业可能的力量有多少。
【假设您做的是就业与否的probit回归】
但比较无法明显看出大学相对小学及其以下的效果…

他的第二个建议是,您再重新分类啦!
五类变三类,说不定您的共线问题就不存在!

最后,我看不太懂您用的命令,一般我们不习惯您那样的作法,一些方法请参见
https://bbs.pinggu.org/thread-1355897-1-1.html

特别是sungmoo大大的做法很值得学习,他已对诸多命令炉火纯青!堪称艺术 ∧∧

报纸
annannie 发表于 2012-2-22 21:28:00
十分感谢,我再看看

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-2 06:11