楼主: firefox29
1780 5

如何删去基于某个变量删去重复值 [推广有奖]

  • 11关注
  • 1粉丝

博士生

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.2251
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
3694 点
帖子
131
精华
0
在线时间
305 小时
注册时间
2012-1-23
最后登录
2023-6-20

楼主
firefox29 发表于 2014-2-10 11:40:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
问题:1.例如对于某客户信息数据集,同一个ID的客户的APRD只可能是0或1,可能有多个0,至多一个1;
我希望对同一ID的客户仅保留一条观测,若有1则保存1,若只有多个0,则删除重复仅保存一条(这里隐含假定所有APRD取0的观测完全相同),注意,其他所有变量也要保存;
样例如下:
[td]
申请人身份证号  aprv
110108196302052017 0
110223197508121077 0
110223197508121077 1
120105197007012415 0
120105197007012415 0
120105197007012415 0
120105197007012415 0
13010319840608302X 0
13010319840608302X 0
13010319840608302X 0

请问如何实现?




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重复值 如何实现 客户信息 身份证号 Apr 身份证号 申请人 如何 信息

沙发
soporaeternus 发表于 2014-2-10 16:49:45
sum(aprv)>0 as aprv ...group by id
Let them be hard, but never unjust

藤椅
firefox29 发表于 2014-2-10 17:13:35
soporaeternus 发表于 2014-2-10 16:49
sum(aprv)>0 as aprv ...group by id
我的意思是基于aprv挑选,但需要保存其他所有变量

板凳
firefox29 发表于 2014-2-10 17:14:43
soporaeternus 发表于 2014-2-10 16:49
sum(aprv)>0 as aprv ...group by id
貌似对于多个0的ID组无法挑选,我这个问题好像问的不对

报纸
hsaotsud 发表于 2014-2-10 19:45:41
不知能排序吗,先id升序aprv降序,再按id分组去第一个,只考虑这两个变量
好笨的方法

地板
playmore 发表于 2014-2-11 09:47:03
先按APRV倒序排列,这样如果有1,则1一定在该组第一行
proc sort data=have;
by ID APRV descending;
run;

然后每个ID组就保留第一行数据就行了

-------------------------------------------------------------

发完贴发现和ls的办法一样,呵呵
playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 14:27