人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › 想对收入分组，但不想按频数来分，请问如何操作

发帖

楼主: cherrypie

8343 13

[其他] 想对收入分组，但不想按频数来分，请问如何操作 [推广有奖]

0关注
0粉丝

小学生

85%

还不是VIP/贵宾

威望: 0 级
论坛币: 58 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 102 点
帖子: 8
精华: 0
在线时间: 8 小时
注册时间: 2006-3-4
最后登录: 2022-6-16

楼主

cherrypie 发表于 2010-1-10 23:25:33 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

在变量income下有几千条数据，每一收入数据出现的频数不一定为1，比如
income
800
800
960
980
1020
1020
1020
2000
2400
2400
......
2400
2700
2800
3000
3000
......
如果想对收入按照从低到高排列分为5组，但不想通过频数来分（我的意思是想把每一收入出现的次数视为1），请问如何操作，如何才能找出排在20%、40%、60%、80%的收入数值？

ps：我之前试过用group（5）处理，但由于有些收入数值对应的样本很多，因此出现了同一收入出现在不同的组的情况，这就不是我想要的结果。。。

请大虾们赐教啊！~~谢谢~~

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏3 回帖

关键词：如何操作 Income Group Come 收入数

回帖推荐

sungmoo 发表于9楼查看完整内容

若存在ties，且ties归入同一组，则分组未必是五等分的。

sungmoo 发表于7楼查看完整内容

这里的关键是，当观测值数不能被5整除且存在ties（重复值）时，你的分组原则是什么？

sungmoo 发表于4楼查看完整内容

cumul income, g(s) eq *你看s最接近0.2、0.4、0.6、0.8的观测值。

eblog 发表于2楼查看完整内容

sort income bys income: gen id=_n keep if id==1 gen group=group(5) _pctile income, p(20,40,60,80) return list

本帖被以下文库推荐

· Stata精彩问答|主题: 898, 订阅: 25

沙发

eblog 发表于 2010-1-11 08:59:40

cherrypie 发表于 2010-1-10 23:25

如果想对收入按照从低到高排列分为5组，但不想通过频数来分（我的意思是想把每一收入出现的次数视为1），请问如何操作，如何才能找出排在20%、40%、60%、80%的收入数值？

ps：我之前试过用group（5）处理，但由于有些收入数值对应的样本很多，因此出现了同一收入出现在不同的组的情况，这就不是我想要的结果。。。

请大虾们赐教啊！~~谢谢~~

sort income
bys income: gen id=_n
keep if id==1
gen group=group(5)
_pctile income, p(20,40,60,80)
return list

藤椅

cherrypie 发表于 2010-1-11 10:09:36

明白啦~这种方法就是将所有不同的收入数值抽出来进行排列然后计算百分位数吧，我已经试过了，确实很好，感谢啊！

有个小疑问，以前我曾试着拿一组数（有些数值多次出现）直接计算其p20、p40，但没有成功，p25、p50、p75倒是可以直接计算出，请问是不是因为排列中的某些数值其频数不唯一的缘故呢？

板凳

sungmoo 发表于 2010-1-11 22:31:32

cherrypie 发表于 2010-1-10 23:25 如果想对收入按照从低到高排列分为5组，但不想通过频数来分（我的意思是想把每一收入出现的次数视为1），请问如何操作，如何才能找出排在20%、40%、60%、80%的收入数值？ps：我之前试过用group（5）处理，但由于有些收入数值对应的样本很多，因此出现了同一收入出现在不同的组的情况，这就不是我想要的结果。。。

cumul income, g(s) eq

*你看s最接近0.2、0.4、0.6、0.8的观测值。

报纸

金黄 发表于 2010-1-12 12:08:05

sungmoo 发表于 2010-1-11 22:31
cumul income, g(s) eq

*你看s最接近0.2、0.4、0.6、0.8的观测值。

找到以后用怎么把数据分成五组呢？用什么命令？

地板

chinhsi 发表于 2010-1-12 12:36:00

xtile dincome=income, nq(5)
应该就可以解决你的问题

7楼

sungmoo 发表于 2010-1-12 16:37:20

金黄发表于 2010-1-12 12:08 找到以后用怎么把数据分成五组呢？用什么命令？

这里的关键是，当观测值数不能被5整除且存在ties（重复值）时，你的分组原则是什么？

8楼

金黄 发表于 2010-1-12 21:42:08

分组原则就是把收入按大小排序后五等分：最低收入组、较低收入组和中等收入组、较高收入组、最高收入组。应该不必考虑重复值的问题。

9楼

sungmoo 发表于 2010-1-12 21:43:54

金黄发表于 2010-1-12 21:42 分组原则就是把收入按大小排序后五等分：最低收入组、较低收入组和中等收入组、较高收入组、最高收入组。应该不必考虑重复值的问题。

若存在ties，且ties归入同一组，则分组未必是五等分的。

10楼

金黄 发表于 2010-1-13 21:26:48

金黄发表于 2010-1-12 21:42
分组原则就是把收入按大小排序后五等分：最低收入组、较低收入组和中等收入组、较高收入组、最高收入组。应该不必考虑重复值的问题。

我没有处理这种问题的经验，我只是觉得应该这样。
在我的个人文件中，有些人是来自同一家庭的，所以他们的“家庭收入”这一变量的值相同。我是想把所有人按照家庭收入多少分成五组。那么应该怎么操作才合适呢？请指点。

返回列表

12 下一页

发帖

本版微信群

加好友,备注jltj
拉您入交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[其他] 想对收入分组，但不想按频数来分，请问如何操作 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

回帖推荐

本帖被以下文库推荐

浏览过的帖子

浏览过的版块

本版微信群

[其他] 想对收入分组，但不想按频数来分，请问如何操作 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

回帖推荐

本帖被以下文库推荐

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群