楼主: dkyyy
53464 18

[学习分享] SAS删除重复观测值的几种方法 [推广有奖]

  • 2关注
  • 0粉丝

本科生

82%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0243
学术水平
6 点
热心指数
7 点
信用等级
6 点
经验
977 点
帖子
42
精华
0
在线时间
159 小时
注册时间
2014-9-16
最后登录
2016-3-9

楼主
dkyyy 在职认证  发表于 2014-9-18 14:31:59 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
不知道论坛上有没有相关的帖子,今天刚刚学习的,拿出来跟大家分享。
如果注释部分有理解错误的欢迎大家纠正哦~

*1、用first,last语句删除重复值;
data clasdata;
  input id name $ class $ ;
datalines;
3456 Amber Chem101
3456 Amber Math102
3456 Amber Math102
4567 Denise ENGL201
4567 Denise ENGL201
2345 Ginny CHEM101
2345 Ginny ENGL201
2345 Ginny MATH102
1234 Lynn CHEM101
1234 Lynn CHEM101
1234 Lynn MATH102
5678 Rick CHEM101
5678 Rick HIST300
5678 Rick HIST300
;
run;
proc sort data=clasdata;
  by name class;
run;
data dups nodups ;
*定义两个数据集,按下面的if条件输出到不同数据集;
  set clasdata ;
  by name class ;
  *first.var和last.var是SAS的两个临时变量,表示组内的第一个和最后一个变量。一般要跟在proc sort后,根据by后的变量使用;
  if first.class and last.class then output nodups;
  else output dups ;
run;
data nodups2;
  set clasdata ;
  by name class ;
  if first.class then output;
run;


*2、输出重复的观测值,使用nodupkey选项,注意:使用该选项后直接将原数据集中的重复值删除。注意dupout和out的区别;
proc sort data=clasdata dupout=dups3 nodupkey;
  by name class;
run;
*输出不重复重复的观测值。;
proc sort data=clasdata out=nodups4 nodupkey;
  by name class;
run;


*3、去掉重复的观测值使用nodup选项。;
proc sort data =Clasdata out =NODUPS5 nodup;
    by  name class;
run ;


*4、用freq统计某变量的值重复的情况;
proc freq data = Clasdata noprint ;
    table ID / out =Nodups6 (keep = ID Count where = (Count > 1)) ;
run ;
*如果要测试两个变量,则用到by选项;
proc sort data =Clasdata;
    by name class;
run ;
proc freq data =Clasdata noprint ;
    by name ;
    table class / out = DUPS7 (keep = name class Count) ;
run ;



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重复观测 观测值 NODUPKEY output First

已有 3 人评分经验 学术水平 热心指数 信用等级 收起 理由
eijuhz + 1 精彩帖子
李会超 + 80 精彩帖子
leyiha + 1 + 1 + 1 精彩帖子

总评分: 经验 + 80  学术水平 + 1  热心指数 + 2  信用等级 + 1   查看全部评分

沙发
dkyyy 在职认证  发表于 2014-9-18 14:33:30
顺便问大家一下,SAS程序如何美化?如自动缩进什么的

藤椅
bakoll 发表于 2015-1-2 16:35:19
可以通过如下操作来实现编辑窗口的“排版”:
用鼠标选中你要编辑的代码段,使用TAB/(Shift+TAB)来推进或者缩进这些代码。

板凳
dkyyy 在职认证  发表于 2015-1-4 09:42:26
bakoll 发表于 2015-1-2 16:35
可以通过如下操作来实现编辑窗口的“排版”:
用鼠标选中你要编辑的代码段,使用TAB/(Shift+TAB)来推进或者 ...
谢谢~

你说的这种方式还得自己看逻辑然后再排版吧?

SAS可以按照逻辑自动缩进吗?就像oracle里有个beautify,写完sql后一键就可以了。

报纸
teqel 发表于 2015-1-4 10:03:11
dkyyy 发表于 2015-1-4 09:42
谢谢~

你说的这种方式还得自己看逻辑然后再排版吧?
用EG~~~

地板
dkyyy 在职认证  发表于 2015-1-4 10:58:47
teqel 发表于 2015-1-4 10:03
用EG~~~
试了一下,EG的确可以,SAS BASE貌似没这个功能了

7
sasjunior 发表于 2015-10-22 13:49:30
您好,能解释下方法1么?不太明白nodups2?还有就是方法3我试了不管用,不知道为什么

8
sasjunior 发表于 2015-10-22 14:26:09
还有一个办法不知道行不行,就是用SQL中的DISTINCT?
proc sql;
create table test as
select distinct *
from clasdata

9
lpclimber 发表于 2016-5-9 09:50:57
谢谢楼主分享!!

10
非非菜 发表于 2016-11-29 11:08:47
留个脚印

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 14:51