楼主: 京JM
4919 7

[数据管理求助] stata中如何按照行业代码分组求均值,并且删除各组指标小于均值的样本 [推广有奖]

  • 1关注
  • 0粉丝

已卖:3份资源

本科生

86%

还不是VIP/贵宾

-

威望
0
论坛币
322 个
通用积分
10.7505
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
366 点
帖子
25
精华
0
在线时间
180 小时
注册时间
2017-8-5
最后登录
2024-3-7

楼主
京JM 发表于 2019-3-16 16:37:40 |AI写论文
10论坛币
求助:

stata中如何按照行业代码分组求均值,并且删除各组负债利息率(fzlxl)大于均值的样本,以下是部分指标和数据。


dwxxmc                                            hydm               fzlxl
"沈阳水泵厂部件制造公司配件制造厂"     3441              0
"沈阳鹭岛资讯科技有限公司"                 3990               0
"沈阳东开电力有限公司"                        3829               0

"肇源县电业局"                                    4420              .03779554
"泌阳县华泰石材厂"                             3033               .243
"重庆市长桥机械制造有限责任公司"       3752              .02373241
"重庆市群利汽车零部件有限责任公司"   3660               .
"陕西彬长胡家河矿业有限公司"             610                .04350369
"宜昌瑞克纺织品有限公司"                   1783               .03724138
"大悟新兴建材有限责任公司"                3021               .0010309279





关键词:Stata tata 有限责任公司 科技有限公司 汽车零部件

沙发
黃河泉 在职认证  发表于 2019-3-16 16:37:41
  1. bys hydm: egen m = mean(fzlxl)
  2. drop if fzlxl > m
复制代码

藤椅
黃河泉 在职认证  发表于 2019-3-16 17:32:57
I. hydm 是产业分类吗? II. 你若问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        请参考说明https://bbs.pinggu.org/thread-5048204-1-1.html

板凳
京JM 发表于 2019-3-16 17:38:48
是的,hydm是产业分类的四位数行业代码

报纸
黃河泉 在职认证  发表于 2019-3-16 17:58:20
京JM 发表于 2019-3-16 17:38
是的,hydm是产业分类的四位数行业代码
1. 尔后请用回复。 2. 尔后你若问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        请参考说明https://bbs.pinggu.org/thread-5048204-1-1.html。3. 试试

地板
京JM 发表于 2019-3-16 18:03:52
黃河泉 发表于 2019-3-16 17:59
好的,谢谢老师,我去试试

7
京JM 发表于 2019-3-16 20:47:03
黃河泉 发表于 2019-3-16 17:59
老师您的代码是可以的,但是我如果需要按照hydm分组,求各组内sfwzx==3的fzlxlz的均值,然后再删除fzlxl大于均值的样本,需要怎么做呢
copy starting from the next line        ------        ----------------
  1. * Example generated by -dataex-. To install: ssc install        dataex
  2. clear
  3. input str60 dwxxmc int hydm byte sfwzx float fzlxl
  4. "杭州亿万饲料科技有限公司"   1320 3          .
  5. "杭州昌兴饲料有限公司"       1320   1   .0553824
  6. "杭州八鲜禽业有限公司"       1320   1  .03914649
  7. "浙江恒辉水产饲料有限公司" 1320  1   .017968317
  8. "浙江国茂饲料有限公司"       1320  1    .04656504
  9. "杭州科皇饲料有限公司"       1320  1    .03029735
  10. "杭州后秀饲料有限公司"       1320   1   .033720125
  11. "浙江明珠动物保健品有限公司" 1320  3          .
  12. "临安文华饲料有限公司"       1320    1    .04140253
  13. "杭州希望饲料厂"             1320         1          .
  14. end
  15. label values sfwzx _merge
  16. label def _merge 1 "master only (1)", modify
  17. label def _merge 3 "matched (3)", modify
复制代码
copy up to and including the previous        line -        ----------------

8
京JM 发表于 2019-3-16 21:10:22
黃河泉 发表于 2019-3-16 17:59
老师求助,您的代码是可以的,但是现在我需要按照hydm分组,求各组内sfwzx==3的fzlxlz的均值,然后再删除fzlxl大于均值的样本,需要怎么做?
----------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str60 dwxxmc int hydm byte sfwzx float fzlxl
  4. "杭州亿万饲料科技有限公司"   1320  3          .
  5. "杭州昌兴饲料有限公司"       1320   1     .0553824
  6. "杭州八鲜禽业有限公司"       1320    1    .03914649
  7. "浙江恒辉水产饲料有限公司"   1320  1    .017968317
  8. "浙江国茂饲料有限公司"       1320    1    .04656504
  9. "杭州科皇饲料有限公司"       1320    1     .03029735
  10. "杭州后秀饲料有限公司"       1320    1      .033720125
  11. "浙江明珠动物保健品有限公司" 1320   3          .
  12. "临安文华饲料有限公司"       1320     1    .04140253
  13. "杭州希望饲料厂"             1320       1          .
  14. end
  15. label values sfwzx _merge
  16. label def _merge 1 "master only (1)", modify
  17. label def _merge 3 "matched (3)", modify
复制代码
------------------ copy up to and including the previous line ------------------

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-24 17:41