人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › 删除数据集中重复的观测，如何编程

发帖

楼主: shi123_tian

2535 5

删除数据集中重复的观测，如何编程 [推广有奖]

0关注
1粉丝

博士生

82%

还不是VIP/贵宾

威望: 0 级
论坛币: 153 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 24038 点
帖子: 148
精华: 0
在线时间: 301 小时
注册时间: 2008-2-18
最后登录: 2020-5-18

楼主

shi123_tian 发表于 2012-2-2 15:56:13 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

如何删除数据集中重复的观测？

谢谢各位！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：数据集编程如何

相关帖子

沙发

zhangzachary 发表于 2012-2-2 17:18:04

proc sort data= out= nodupkey;
by ;
run;
空的地方请自行填满。

寒冰凤凰 My blog: http://blog.sina.com.cn/u/1058955485

藤椅

hwb5258289 发表于 2012-2-3 17:55:23

data first;
set repeatid;
by id;
if first.id;
run;

复制代码

板凳

hwb5258289 发表于 2012-2-3 17:56:29

data result;
set hwb;
by id;
y=ifn( first.id and last.id,0,1);
run;
data re;
set result;
if y=1;
run;

复制代码

报纸

shi123_tian 发表于 2012-2-7 15:19:38

如何显示那些重复的观测？

地板

maidenhan 发表于 2012-2-7 15:50:08

If the observations in your data set is no more than 10000, the following code works well. Otherwise, u have to try in HUSH.

proc sql;
create table test02 as
select target_key as dupkey
from test01
group by target_key
having count(*) > 1.5;
quit;

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明