楼主: 520wujing
2430 8

[数据管理求助] 以id为类别变量,删除其他多个变量中的重复值 [推广有奖]

  • 7关注
  • 1粉丝

博士生

62%

还不是VIP/贵宾

-

威望
0
论坛币
172 个
通用积分
7.1705
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5271 点
帖子
385
精华
0
在线时间
230 小时
注册时间
2017-5-9
最后登录
2024-6-25

楼主
520wujing 发表于 2021-6-25 13:09:58 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
以id为类别变量,删除其他多个变量中的重复值。具体如图片所示,例如当id=1时,删除申请人1、申请人2、申请人3中所有重复的公司。在stata中如何操作呢?
duplicates drop 是删除重复的样本组合,无法满足上述要求。希望懂的大神能指点一二。 图片1.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多个变量 重复值 duplicates duplicate Stata

沙发
wdlbcj 学生认证  发表于 2021-6-25 14:31:01
是否可以加一个if id==1 呢?

藤椅
520wujing 发表于 2021-6-25 14:59:28
wdlbcj 发表于 2021-6-25 14:31
是否可以加一个if id==1 呢?
嗯嗯,操作过程是需要加if id ==1. duplicates drop  申请人1  申请人2  if id ==1,force。会把第4列的申请人3也顺带一起删掉了。

板凳
917968079 发表于 2021-6-25 18:08:17 来自手机
520wujing 发表于 2021-6-25 13:09
以id为类别变量,删除其他多个变量中的重复值。具体如图片所示,例如当id=1时,删除申请人1、申请人2、申请 ...
你想得到的是什么样的结果,因为你问题描述的似乎不是很清楚

报纸
520wujing 发表于 2021-6-25 20:16:23
917968079 发表于 2021-6-25 18:08
你想得到的是什么样的结果,因为你问题描述的似乎不是很清楚
就是当id=1时,申请人1、申请人2、申请人3这三个变量中的重复公司名;依次当id=2时,删除这三个变量中的重复公司名。。

地板
520wujing 发表于 2021-6-25 20:26:24
917968079 发表于 2021-6-25 18:08
你想得到的是什么样的结果,因为你问题描述的似乎不是很清楚
想要得到的结果就是每一个id一共有多少个唯一的申请人。

7
wdlbcj 学生认证  发表于 2021-6-25 21:04:37
我觉得可以先删除所有的重复值,
然后把一些缺失值删除,就能得到你想要的了

比如id=1 中 实际对应的申请人有三个  但是如果仅删除重复组的话  也会包含两个申请人的情况

这时可以做一个横向的计数,最大的计数单位对应的是完全的情况

8
520wujing 发表于 2021-6-26 14:44:10
wdlbcj 发表于 2021-6-25 21:04
我觉得可以先删除所有的重复值,
然后把一些缺失值删除,就能得到你想要的了
感谢您的解答,直接删除重复值,无法以id为类别来删除。后面我采用reshape命令进行数据的纵向追加,然后采用duplicates drop解决了。

9
鲜花满楼2009 发表于 2021-7-22 13:55:28
谢谢邀请

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-10 05:00