619 0

[面板数据求助] stata如何在组内保留重复值最多的样本 [推广有奖]

  • 0关注
  • 0粉丝

高中生

12%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
60 点
帖子
1
精华
0
在线时间
46 小时
注册时间
2020-4-16
最后登录
2023-8-6

楼主
一杯淡水1998 发表于 2023-2-22 12:09:15 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问如何在同一组内保留重复值最多的样本?
数据如下(附件截图和代码内容是一样的):
例如前6条样本有着相同的组织机构代码“1”,但企业名称对应着“人寿保险”,“宏远酒店”“恩施国税局”三家企业。三家企业名称在同一组织机构代码“1”这一组内出现的次数分别为4次,1次,1次。现在需要保留出现次数最多的企业名称,例如”人寿保险“出现了4次次数最多,请问用什么命令能使得在组织代码”1“里只保留前四条样本?
样本数据量五百万条,按照组织机构代码分组也有几百万组,所以请问什么命令能批量操作?
  1. * Example generated by -dataex-. For more info, type help dataex
复制代码








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 重复值 generated generate

1234.png (60.4 KB)

1234.png

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-8 01:17