楼主: zuncle_aha
5362 19

[原创博文] 求删除sas数据集中重复值的方法 [推广有奖]

  • 0关注
  • 0粉丝

初中生

23%

还不是VIP/贵宾

-

威望
0
论坛币
936 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
96 点
帖子
6
精华
0
在线时间
17 小时
注册时间
2009-4-11
最后登录
2014-5-5

楼主
zuncle_aha 发表于 2011-12-28 20:41:10 |AI写论文
1论坛币

如果某一变量有重复值,就把含有重复值的观测值全部删除,程序应该怎么写呢?

关键词:sas数据集 数据集 重复值 观测值 程序

回帖推荐

chai_prime 发表于8楼  查看完整内容

这样应该可以把重复的部分“全部删除”

本帖被以下文库推荐

沙发
suzhzh 发表于 2011-12-28 20:54:41
用proc sort nodupkey就可以实现了。

藤椅
suzhzh 发表于 2011-12-28 20:55:49
比如你的变量x有重复值:
proc sort data=a nodupkey;
by x;
run;
就可以了

板凳
tiaotiaotang 发表于 2011-12-28 21:03:13
同意楼上

报纸
荷乃小隹 在职认证  发表于 2011-12-28 21:03:46
哦。原来如此。

地板
zuncle_aha 发表于 2011-12-28 21:16:49
to :suzhzh

可是这样保留了含有重复值的第一个观测值,那如果这个值也不保留怎么办呢?

7
zuncle_aha 发表于 2011-12-28 21:17:18
suzhzh 发表于 2011-12-28 20:55
比如你的变量x有重复值:
proc sort data=a nodupkey;
by x;
可是这样保留了含有重复值的第一个观测值,那如果这个值也不保留怎么办呢?

8
chai_prime 发表于 2011-12-28 22:31:55
  1. proc sql;
  2. create table temp as
  3.   select *,count(key) as cnt from data_have
  4.    group by key;
  5. quit;

  6. data want(drop = cnt);
  7. set temp;
  8. where cnt = 1;
  9. run;
复制代码
这样应该可以把重复的部分“全部删除”
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

9
jintianxiu 发表于 2011-12-28 22:49:11
chai_prime 发表于 2011-12-28 22:31
这样应该可以把重复的部分“全部删除”
同意楼上

10
suzhzh 发表于 2011-12-29 09:03:36
Thanks, that is the way to do this job

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-21 02:18