楼主: stataxsd
5960 2

[数据管理求助] 如何将数据分组 [推广有奖]

  • 1关注
  • 0粉丝

本科生

71%

还不是VIP/贵宾

-

威望
0
论坛币
20579 个
通用积分
6.0980
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1169 点
帖子
74
精华
0
在线时间
60 小时
注册时间
2019-6-23
最后登录
2023-1-2

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
需要1将收入数据finca从高到低分为五组,在此基础上,2各组内依稳定性高收入占比highstable的四分位数,3进一步将样本细分为四组。以收入高低需要画出四张散点图:左纵轴为稳定性高收入占比的频数,右纵轴稳定性高收入占比的频率,下横轴为教育支出倾向1edu1,上横轴为教育支出倾向2edu2
---------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input float(finca highstable edu1 edu2)
  4. 180001     .07222737 .000012499844   .012524843
  5. 200001      .7200014     .25000536     .2571553
  6. 80001             1   .0000499975   .025098745
  7. 20001       .300035        .20008       .30017
  8. 72001             1      .2400152     .2400352
  9. 80001     .07501156   .0000499975   .015099245
  10. 40001             1  .00003030211 .00006060422
  11. 50001       .800004  .00003333222   .033398885
  12. 400001             1     .05000475    .05500973
  13. 80001      .6250047       .500025      .700065
  14. 108001             1       .100015    .10836486
  15. 60001 .000016666389       .100018    .10203796
  16. 130001     .23077515        .10003    .13339555
  17. 120001     .31000575   .0000199996   .006039879
  18. 300001  3.333322e-06     .06251172    .10002375
  19. 60001      .4166764   .0000199996     .0400392
  20. 160001      .4425035     .07693018    .07924554
  21. 70001             1      .2500125    .25502908
  22. 110001      .4090963    .028585305     .0428851
  23. 132001      .4545496 .000011110988    .01113321
  24. 83281  .00001200754 .000012499844   .006274921
  25. 100001       .500005 .000012499844  .0025249685
  26. 190001      .8778954      .1928629    .19287005
  27. 100001      .2500075     .14286938    .14574078
  28. 100001             1      .2500094     .2625217
  29. 800001      .5000006     .08000184    .09000382
  30. 200001             1      .3750078     .4050199
  31. 76001             1     .33335555     .3533882
  32. 35001             1       .500025    .51507425
  33. 113001      .8849568   .0008499858   .017533042
  34. end
复制代码

------------------ copy up to and including the previous line ------------------

Listed 30 out of 1770 observations

.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分组 observations observation generated including

沙发
stataxsd 发表于 2019-9-1 15:29:24 |只看作者 |坛友微信交流群
可以分很多步搞定,不求简洁,跪求大神

使用道具

藤椅
zhaowill 发表于 2019-9-1 17:13:45 |只看作者 |坛友微信交流群
*分组是不是这样?
*将收入数据finca从高到低分为五组
gsort -finca
gen  g_finca = group(5)     // 等分为五组

*上述分组各组内依稳定性高收入占比highstable的分位数,进一步将样本细分为四组。
*使用by前缀和分位数进行分组
*直接使用xtile命令的话,不能用by,需编写循环,egenmore命令集中的xtile()更简单
*ssc install egenmore,replace
egen g2 = xtile(highstable), by(g_finca) n(5)
*或者用gtools命令集中的gquantiles,得到完全相同的结果
*ssc install gtools,replace //有些耗时
gquantiles g3 = highstable, xtile nquantiles(5) by(g_finca)
sort g_finca g2

*绘图要求没看懂是什么意思

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 23:42