楼主: cherrypie
8024 13

[其他] 想对收入分组,但不想按频数来分,请问如何操作 [推广有奖]

  • 0关注
  • 0粉丝

小学生

85%

还不是VIP/贵宾

-

威望
0
论坛币
58 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
102 点
帖子
8
精华
0
在线时间
8 小时
注册时间
2006-3-4
最后登录
2022-6-16

楼主
cherrypie 发表于 2010-1-10 23:25:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在变量income下有几千条数据,每一收入数据出现的频数不一定为1,比如
income
800
800
960
980
1020
1020
1020
2000
2400
2400
......
2400
2700
2800
3000
3000
......
如果想对收入按照从低到高排列分为5组,但不想通过频数来分(我的意思是想把每一收入出现的次数视为1),请问如何操作,如何才能找出排在20%、40%、60%、80%的收入数值?

ps:我之前试过用group(5)处理,但由于有些收入数值对应的样本很多,因此出现了同一收入出现在不同的组的情况,这就不是我想要的结果。。。

请大虾们赐教啊!~~谢谢~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何操作 Income Group Come 收入数

回帖推荐

sungmoo 发表于9楼  查看完整内容

若存在ties,且ties归入同一组,则分组未必是五等分的。

sungmoo 发表于7楼  查看完整内容

这里的关键是,当观测值数不能被5整除且存在ties(重复值)时,你的分组原则是什么?

sungmoo 发表于4楼  查看完整内容

cumul income, g(s) eq *你看s最接近0.2、0.4、0.6、0.8的观测值。

eblog 发表于2楼  查看完整内容

sort income bys income: gen id=_n keep if id==1 gen group=group(5) _pctile income, p(20,40,60,80) return list

本帖被以下文库推荐

沙发
eblog 发表于 2010-1-11 08:59:40
cherrypie 发表于 2010-1-10 23:25

如果想对收入按照从低到高排列分为5组,但不想通过频数来分(我的意思是想把每一收入出现的次数视为1),请问如何操作,如何才能找出排在20%、40%、60%、80%的收入数值?

ps:我之前试过用group(5)处理,但由于有些收入数值对应的样本很多,因此出现了同一收入出现在不同的组的情况,这就不是我想要的结果。。。

请大虾们赐教啊!~~谢谢~~
sort income
bys income: gen id=_n
keep if id==1
gen group=group(5)
_pctile income, p(20,40,60,80)
return list

藤椅
cherrypie 发表于 2010-1-11 10:09:36
明白啦~这种方法就是将所有不同的收入数值抽出来进行排列然后计算百分位数吧,我已经试过了,确实很好,感谢啊!

有个小疑问,以前我曾试着拿一组数(有些数值多次出现)直接计算其p20、p40,但没有成功,p25、p50、p75倒是可以直接计算出,请问是不是因为排列中的某些数值其频数不唯一的缘故呢?

板凳
sungmoo 发表于 2010-1-11 22:31:32
cherrypie 发表于 2010-1-10 23:25 如果想对收入按照从低到高排列分为5组,但不想通过频数来分(我的意思是想把每一收入出现的次数视为1),请问如何操作,如何才能找出排在20%、40%、60%、80%的收入数值?ps:我之前试过用group(5)处理,但由于有些收入数值对应的样本很多,因此出现了同一收入出现在不同的组的情况,这就不是我想要的结果。。。
cumul income, g(s) eq

*你看s最接近0.2、0.4、0.6、0.8的观测值。

报纸
金黄 发表于 2010-1-12 12:08:05
sungmoo 发表于 2010-1-11 22:31
cumul income, g(s) eq

*你看s最接近0.2、0.4、0.6、0.8的观测值。
找到以后用怎么把数据分成五组呢? 用什么命令?

地板
chinhsi 发表于 2010-1-12 12:36:00
xtile dincome=income, nq(5)
应该就可以解决你的问题

7
sungmoo 发表于 2010-1-12 16:37:20
金黄 发表于 2010-1-12 12:08 找到以后用怎么把数据分成五组呢? 用什么命令?
这里的关键是,当观测值数不能被5整除且存在ties(重复值)时,你的分组原则是什么?

8
金黄 发表于 2010-1-12 21:42:08
分组原则就是把收入按大小排序后五等分:最低收入组、较低收入组和中等收入组、较高收入组、最高收入组。应该不必考虑重复值的问题。

9
sungmoo 发表于 2010-1-12 21:43:54
金黄 发表于 2010-1-12 21:42 分组原则就是把收入按大小排序后五等分:最低收入组、较低收入组和中等收入组、较高收入组、最高收入组。应该不必考虑重复值的问题。
若存在ties,且ties归入同一组,则分组未必是五等分的。

10
金黄 发表于 2010-1-13 21:26:48
金黄 发表于 2010-1-12 21:42
分组原则就是把收入按大小排序后五等分:最低收入组、较低收入组和中等收入组、较高收入组、最高收入组。应该不必考虑重复值的问题。
我没有处理这种问题的经验,我只是觉得应该这样。
在我的个人文件中,有些人是来自同一家庭的,所以他们的“家庭收入”这一变量的值相同。我是想把所有人按照家庭收入多少分成五组。那么应该怎么操作才合适呢?请指点。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-21 15:55