楼主: shi123_tian
2516 5

删除数据集中重复的观测,如何编程 [推广有奖]

  • 0关注
  • 1粉丝

博士生

82%

还不是VIP/贵宾

-

威望
0
论坛币
153 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24038 点
帖子
148
精华
0
在线时间
301 小时
注册时间
2008-2-18
最后登录
2020-5-18

楼主
shi123_tian 发表于 2012-2-2 15:56:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如何删除数据集中重复的观测?

谢谢各位!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 编程 如何

沙发
zhangzachary 发表于 2012-2-2 17:18:04
proc sort data= out= nodupkey;
by ;
run;
空的地方请自行填满。
寒冰凤凰 My blog: http://blog.sina.com.cn/u/1058955485

藤椅
hwb5258289 发表于 2012-2-3 17:55:23
  1. data first;
  2. set repeatid;
  3. by id;
  4. if first.id;
  5. run;
复制代码

板凳
hwb5258289 发表于 2012-2-3 17:56:29
  1. data result;
  2.    set hwb;
  3.    by id;
  4.    y=ifn( first.id and last.id,0,1);
  5. run;

  6. data re;
  7. set result;
  8. if y=1;
  9. run;
复制代码

报纸
shi123_tian 发表于 2012-2-7 15:19:38
如何显示那些重复的观测?

地板
maidenhan 发表于 2012-2-7 15:50:08
If the observations in your data set is no more than 10000, the following code works well. Otherwise, u have to try in HUSH.

proc sql;
        create table test02 as
        select target_key as dupkey
                from test01
                group by target_key
                having count(*) > 1.5;
quit;

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 09:46