人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › 如何用SAS删掉全部重复的观测值，不保留第一个相同观测值 ...

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

返回列表

12 下一页

发帖

楼主: gogoqing

7014 10

[问答] 如何用SAS删掉全部重复的观测值，不保留第一个相同观测值？ [推广有奖]

1关注
0粉丝

硕士生

45%

还不是VIP/贵宾

威望: 0 级
论坛币: 86 个
通用积分: 1.1063
学术水平: 0 点
热心指数: 1 点
信用等级: 0 点
经验: 6575 点
帖子: 148
精华: 0
在线时间: 100 小时
注册时间: 2012-11-2
最后登录: 2021-5-29

楼主

gogoqing 发表于 2018-2-11 22:28:14 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

正在整理数据库，想要把某个变量有重复值的观测值全部删除。但是我用proc sort nodupkey，结果总是保留重复值的第一个。因为数据量很大，没办法手工删除。所以我的问题是如何删掉全部重复的观测值，不保留第一个相同观测值？请各位大大指教，谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：观测值如何用 NODUPKEY 整理数据我的问题

回帖推荐

逍遥梦蝶发表于8楼查看完整内容

可以尝试 PROC SORT 中的 NOUNIQUEKEY 和 UNIQUEOUT= 两个选项，UNIQUEOUT= 指定的数据集应该就是剔除了所有有重复 identifier 的观测。

舍身卫道发表于4楼查看完整内容

已有 1 人评分	热心指数	收起理由
eijuhz	+ 1	精彩帖子

总评分: 热心指数 + 1 查看全部评分

使用道具举报

沙发

popodan

发表于 2018-2-12 06:58:35 |只看作者 |坛友微信交流群

先count 你的key，然后在delete count值大于1的observation不就好了

使用道具举报

藤椅

l1i2n3i4n5g

发表于 2018-2-12 08:40:57 |只看作者 |坛友微信交流群

data test;
input x;
cards;
1
1
1
2
2
3
;
run;
proc sort data=test out=_null_ dupout=want nodupkey;
by x;
run;

复制代码

使用道具举报

板凳

舍身卫道 发表于 2018-2-12 09:46:54 |只看作者 |坛友微信交流群

*假如你数据中有重复值的变量为flag,下面以该字段作为例子;
data test1;
input flag $ x y;
cards;
a 1 2
a 9 10
a 334 21
a 3 21
b 12 32
b 31 43
c 21 2
d 90 3
e 31 54
;
run;
proc sql noprint;
create table test2(where=(sum=1)) as
select count(flag) as sum,flag,x,y from test1
group by flag;
quit;

复制代码

使用道具举报

报纸

gogoqing 发表于 2018-2-12 20:57:45 |只看作者 |坛友微信交流群

舍身卫道发表于 2018-2-12 09:46

非常感谢！！把程序运行了一下，得到这样的结果。所有的重复值都删掉了！

0012.jpg (107.12 KB)

运行结果

运行结果

0012.jpg (107.12 KB)

使用道具举报

地板

gogoqing 发表于 2018-2-12 21:07:56 |只看作者 |坛友微信交流群

l1i2n3i4n5g 发表于 2018-2-12 08:40

这是运行结果，1这个重复值在结果里面还有。

221.jpg (6.97 KB)

使用道具举报

7楼

gogoqing 发表于 2018-2-12 21:19:08 |只看作者 |坛友微信交流群

popodan 发表于 2018-2-12 06:58
先count 你的key，然后在delete count值大于1的observation不就好了

谢谢回复，刚刚开始学着用sas，你说的程序我编写不出来。

使用道具举报

8楼

逍遥梦蝶 发表于 2018-2-12 21:36:22 |只看作者 |坛友微信交流群

可以尝试 PROC SORT 中的 NOUNIQUEKEY 和 UNIQUEOUT= 两个选项，UNIQUEOUT= 指定的数据集应该就是剔除了所有有重复 identifier 的观测。

使用道具举报

9楼

gogoqing 发表于 2018-2-12 22:01:52 |只看作者 |坛友微信交流群

逍遥梦蝶发表于 2018-2-12 21:36
可以尝试 PROC SORT 中的 NOUNIQUEKEY 和 UNIQUEOUT= 两个选项，UNIQUEOUT= 指定的数据集应该就是剔除了所有 ...

是的，这样运行得到的就是想要的结果。nouniquekey的作用是输出重复值，加上uniqueout=为什么就把所有的重复值都删了呢？uniqueout是什么意思？谢谢！

使用道具举报

10楼

sas9.4 发表于 2018-3-14 01:24:03 来自手机 |只看作者 |坛友微信交流群

都这么具体了自己Google了

使用道具举报

返回列表

12 下一页

发帖

本版微信群

加好友,备注cda
拉您进交流群

手机版 |

意见反馈 |

帮助 |

新手入门 |

用户手册 |

友情链接 |

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[问答] 如何用SAS删掉全部重复的观测值，不保留第一个相同观测值？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

回帖推荐

本版微信群

扫码加我拉你入群