楼主: wxmouse
1660 2

主数据集的by变量有重复值 怎么批量删除? [推广有奖]

  • 0关注
  • 1粉丝

本科生

93%

还不是VIP/贵宾

-

威望
0
论坛币
416 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1011 点
帖子
54
精华
0
在线时间
130 小时
注册时间
2011-7-20
最后登录
2021-12-7

楼主
wxmouse 发表于 2015-4-21 14:57:10 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我的问题是 :
A数据集很大,我想用B数据集对A进行删除操作,共同的by变量是x,即把A中含有B的观测全删掉。但是A有重复值,A的主键是x+y,而B数据集只有x字段。由于A数据量大,排序很慢,所以用merge虽然可以达到目的,但是效率低。我想用modify,但是modify只能更新重复值的第一个,请教还有其他什么办法吗?谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 重复值 modify Merge 我的问题 modify

沙发
何必不淡定。 发表于 2015-4-21 15:46:40
you may try hash

藤椅
yz7891 发表于 2015-4-21 18:37:21
试试 format

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 14:53