楼主: myprovoke
35091 14

[编程问题求助] STATA怎么处理多类别虚拟变量 [推广有奖]

  • 1关注
  • 0粉丝

硕士生

57%

还不是VIP/贵宾

-

威望
0
论坛币
390 个
通用积分
2.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
16910 点
帖子
117
精华
0
在线时间
223 小时
注册时间
2010-6-15
最后登录
2021-8-9

楼主
myprovoke 在职认证  发表于 2013-7-5 13:53:10 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
自己不太会用。就先做个最简单的收入与性别的分位数回归。有个收入变量tincome,gender变量:女为2,男为1.。我生成gen female = 0
replace female = 1 if gender ==2.
然后代入建立模型。sqreg tincome female,q(.25 .5 .75 .95)
    请问各位,是不是这样做的只是分析的女性和收入的分位数关系,要做男性的是不是还要类似生成男性gen male = 0 rep male =1 if gender ==1?或者sqreg ticome female gender?。这只是一个虚拟变量,后面我要加一个多类别虚拟变量,那应该是怎么处理呢?谢谢啦~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 怎么处理 虚拟变量 tata replace replace female 女性 模型

回帖推荐

h3327156 发表于2楼  查看完整内容

您如果不要自行建立一些Dummy变量,比较快的方式是直接运用xi 一般做完女性,不会对男兴再反著做。 而且,现代,一般是比较好奇女性对于收入影响是比较关心的, 当然怎样的女性,这跟跟收入有啥连接,也是挺关心的。 ********以下是演练参考*****请自行copy到Stata的command窗口下执行 sysuse auto g id=_n xtset id *因为我不知道您的资料形态,是panel 还是只是cross sectional *如果只是横截面数据那就像上面那样设 ...

h3327156 发表于8楼  查看完整内容

不是那样设定啦, 如果您要 i.area的话, 请创造一个变量叫 area 【而area的值为1或2或3 ,而1为东 2为西 3为中这样】 您那样的设定,是自行创立三个dummy变量 【darea xarea zarea】 您三个都摆,这样铁定共线,连想都不用想。 如果您真要自行创立三个dummy变量【回归中请自己挑两个摆】 譬如 xi: sqreg tincome i.gender darea zarea,q(.25 .5 .75 .95) 注意 darea 与 zarea 前面没有 i.

h3327156 发表于5楼  查看完整内容

是的,这个没办法,九个不同代码的省份【假设您有个变量叫prov】 只好先整理成三个代码的地区变量【假设叫area】

沙发
h3327156 发表于 2013-7-5 14:23:52
您如果不要自行建立一些Dummy变量,比较快的方式是直接运用xi

一般做完女性,不会对男兴再反著做。 而且,现代,一般是比较好奇女性对于收入影响是比较关心的,
当然怎样的女性,这跟跟收入有啥连接,也是挺关心的。

********以下是演练参考*****请自行copy到Stata的command窗口下执行
sysuse auto
g id=_n
xtset id
*因为我不知道您的资料形态,是panel 还是只是cross sectional
*如果只是横截面数据那就像上面那样设定

*您可以不用另行建立虚拟变量
*price就像您的收入变量,而 foreign就像您的性别变量
*rep78就像您的类别变量

xi: sqreg price i.foreign,q(.25 .5 .75 .95)
xi: sqreg price i.foreign i.rep78,q(.25 .5 .75 .95)
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
yiruodongchuan + 1 + 1 + 1 + 1 观点有启发
myprovoke + 1 + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 1  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

藤椅
myprovoke 在职认证  发表于 2013-7-5 14:46:42
h3327156 发表于 2013-7-5 14:23
您如果不要自行建立一些Dummy变量,比较快的方式是直接运用xi

一般做完女性,不会对男兴再反著做。 而且 ...
wahaha.太感谢啦,我先去操作操作试试。

板凳
myprovoke 在职认证  发表于 2013-7-5 22:53:20
h3327156 发表于 2013-7-5 14:23
您如果不要自行建立一些Dummy变量,比较快的方式是直接运用xi

一般做完女性,不会对男兴再反著做。 而且 ...
嗯发现这个xi变量果然好用。不过我还有疑问,这里要设置个地区变量,分为东中西三个虚拟变量。但是数据里面有9个不同代码的省份,怎么处理这种情况呢?先生成三个地区变量,还是怎么处理呢。

报纸
h3327156 发表于 2013-7-6 00:46:23
myprovoke 发表于 2013-7-5 22:53
嗯发现这个xi变量果然好用。不过我还有疑问,这里要设置个地区变量,分为东中西三个虚拟变量。但是数据里 ...
是的,这个没办法,九个不同代码的省份【假设您有个变量叫prov】
只好先整理成三个代码的地区变量【假设叫area】

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
myprovoke + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

地板
myprovoke 在职认证  发表于 2013-7-6 08:38:34
h3327156 发表于 2013-7-6 00:46
是的,这个没办法,九个不同代码的省份【假设您有个变量叫prov】
只好先整理成三个代码的地区变量【假设 ...
哇哈哈晓得了,您太客气了,学识渊博又耐心帮助别人答疑解惑。太感谢您啦。

7
myprovoke 在职认证  发表于 2013-7-6 14:10:47
h3327156 发表于 2013-7-5 14:23
您如果不要自行建立一些Dummy变量,比较快的方式是直接运用xi

一般做完女性,不会对男兴再反著做。 而且 ...
8个省份变量(t1)现在我建立了3个地区变量。东部(darea),西部(xarea)和中部(zarea)
gen darea = 0
replace darea = 1 if t1== 32|37
gen zarea = 0
replace zarea = 1if t1 == 21|23| 41| 42
gen xarea = 0
replace xarea = 1 if t1 == 45|52
现在代入:
xi: sqreg tincome i.gender i.darea i.zarea i.xarea,q(.25 .5 .75 .95)。tincome是收入 gender是性别
怎么后面显示没有这三个地区变量呢,难道是所谓的共线性吗?又应该怎么处理呢?

8
h3327156 发表于 2013-7-6 20:05:46
myprovoke 发表于 2013-7-6 14:10
8个省份变量(t1)现在我建立了3个地区变量。东部(darea),西部(xarea)和中部(zarea)
gen darea = 0
r ...
不是那样设定啦,
如果您要 i.area的话, 请创造一个变量叫 area
【而area的值为1或2或3     ,而1为东 2为西 3为中这样】

您那样的设定,是自行创立三个dummy变量 【darea xarea zarea】
您三个都摆,这样铁定共线,连想都不用想。
如果您真要自行创立三个dummy变量【回归中请自己挑两个摆】
譬如

xi: sqreg tincome i.gender darea zarea,q(.25 .5 .75 .95)

注意 darea 与  zarea 前面没有 i.

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
myprovoke + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

9
xingchengbin 发表于 2013-7-6 22:19:49
解答的确实精妙,学习了

10
myprovoke 在职认证  发表于 2013-7-11 21:18:44
h3327156 发表于 2013-7-6 00:46
是的,这个没办法,九个不同代码的省份【假设您有个变量叫prov】
只好先整理成三个代码的地区变量【假设 ...
额额,这里出现了这个情况,我不太懂,大大可以看看吗?xi: sqreg ln(c8) i.area a12 i.jobcharacter jobtime me,q(.25 .5 .75 .95)
这里c8是收入变量,a12是教育年限。jobcharacter是我定义的一个工作单位虚拟变量,设了4个虚拟变量。jobtime是工作年限。me是工作经验的边际效率。
我这里输入之后,STATA返回:factor variables and time-series operators not allowed。请问这是怎么回事呢?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-5 16:18