楼主: yoyowu80
2268 7

[数据管理求助] 如何按某个变量统计另一个变量的各个分位数占比多少人 [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

硕士生

38%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
1.0146
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
7013 点
帖子
63
精华
0
在线时间
175 小时
注册时间
2008-8-19
最后登录
2022-5-6

楼主
yoyowu80 发表于 2020-8-9 15:36:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
8138e023ed98294e00f2c5bd0b42c9b.png
我用的命令:bys edu: sum fl,detail     
(fl是金融素养),好像不对,类似这种表格请问应该怎么用命令啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分位数 detail Etail tail Sum

回帖推荐

DΘstinyじò 发表于2楼  查看完整内容

假设有变量:id-户主、 edu-教育程度、gender-性别、age-年龄、fl-金融素养。 统计可能要分两部分:靠左的部分按照金融素养分位数统计和右边的均值及样本数。每部分需要对 edu、gender、age分别分组统计。 先给出金融素养的一个分组:以edu为例,其他类似,要手动汇总到一张表格:做了一个简单样本的结果显示:

沙发
DΘstinyじò 发表于 2020-8-10 14:45:00
假设有变量:id-户主、 edu-教育程度、gender-性别、age-年龄、fl-金融素养。
统计可能要分两部分:靠左的部分按照金融素养分位数统计和右边的均值及样本数。每部分需要对 edu、gender、age分别分组统计。
先给出金融素养的一个分组:
  1. xtile g_fl = fl, nq(4)
复制代码
以edu为例,其他类似,要手动汇总到一张表格:
  1. tabulate edu g_fl,row nof
  2. table edu ,c(mean fl n id)
复制代码
做了一个简单样本的结果显示:
  1. . tabulate edu g_fl,row nof

  2.                    |                    g_fl
  3.                edu |         1          2          3          4 |     Total
  4. -------------------+--------------------------------------------+----------
  5.            college |     12.50      18.75      37.50      31.25 |    100.00
  6.               high |     12.50      31.25      25.00      31.25 |    100.00
  7.             second |     43.75      18.75      25.00      12.50 |    100.00
  8.                 ug |     31.25      31.25      12.50      25.00 |    100.00
  9. -------------------+--------------------------------------------+----------
  10.              Total |     25.00      25.00      25.00      25.00 |    100.00

  11. . table edu ,c(mean fl n id)

  12. ----------------------------------
  13.       edu |   mean(fl)       N(id)
  14. ----------+-----------------------
  15.   college |  106.15125          16
  16.      high |  105.43125          16
  17.    second |  104.07563          16
  18.        ug |  104.64187          16
  19. ----------------------------------
复制代码

藤椅
yoyowu80 发表于 2020-8-11 14:39:06
DΘstinyじò 发表于 2020-8-10 14:45
假设有变量:id-户主、 edu-教育程度、gender-性别、age-年龄、fl-金融素养。
统计可能要分两部分:靠左的 ...
太感谢了,谢谢大神

板凳
yoyowu80 发表于 2020-8-11 15:26:45
DΘstinyじò 发表于 2020-8-10 14:45
假设有变量:id-户主、 edu-教育程度、gender-性别、age-年龄、fl-金融素养。
统计可能要分两部分:靠左的 ...
请问大神这样是按照分位数分的类么,不需要xtile或者pctile命令吗

报纸
DΘstinyじò 发表于 2020-8-11 17:44:04
yoyowu80 发表于 2020-8-11 15:26
请问大神这样是按照分位数分的类么,不需要xtile或者pctile命令吗
先把金融素养从小到大排序,等分四组,也是一种分法,但是不是很准确,我自己做的示例数据简单,想法简单了,有值相同的时候在分位点上的分组会有差异,已经修改了代码。

地板
yoyowu80 发表于 2020-8-12 15:08:50
DΘstinyじò 发表于 2020-8-11 17:44
先把金融素养从小到大排序,等分四组,也是一种分法,但是不是很准确,我自己做的示例数据简单,想法简 ...
谢谢!

7
yoyowu80 发表于 2020-8-12 15:21:04
DΘstinyじò 发表于 2020-8-11 17:44
先把金融素养从小到大排序,等分四组,也是一种分法,但是不是很准确,我自己做的示例数据简单,想法简 ...
请问有办法显示出四个分位值,不要基准组吗,我试了_pctile,可是只能显示分位值,无法显示分类

8
DΘstinyじò 发表于 2020-8-13 00:06:58
yoyowu80 发表于 2020-8-12 15:21
请问有办法显示出四个分位值,不要基准组吗,我试了_pctile,可是只能显示分位值,无法显示分类
没有太理解你的意思,不要基准组是什么意思?g_fl变量不想要1,2,3,4这样的表示?用分位数值表示,比如用Q1(下四分位数)的数值代替1...?但是四分位数只有3个分割点,怎么对应赋值到4个组别?
你不是想显示出四个分位值(应该是3个吧),但你又说试了_pctile,显示出了分位值
如果只是要看这几个值,试一下:
  1. _pctile fl,n(4)
  2. return list
  3. ///或者
  4. pctile pfl=fl,n(4)
复制代码
如果想用组别标签的显示:
  1. //标签内容自己可以定义,也可以写小于Q1、Q1-Q2、Q2-Q3、Q3以上
  2. label de g_fl_label 1 "25%以下" 2 "25%-50%" 3"50%-75%"  4"75%以上"
  3. label val g_fl g_fl_label
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-21 07:17