楼主: wxmouse
3537 2

请教如何筛选某个字段相同的记录? [推广有奖]

  • 0关注
  • 1粉丝

本科生

93%

还不是VIP/贵宾

-

威望
0
论坛币
416 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1011 点
帖子
54
精华
0
在线时间
130 小时
注册时间
2011-7-20
最后登录
2021-12-7

楼主
wxmouse 发表于 2013-8-1 21:45:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
比如,有这个数据集:
姓名    年龄   性别
王三     18      男
李四     15      男
赵五      32     女
王三     11      女
李四      21     女

比如我想筛选出姓名相同的数据记录,期望的运行结果是:
姓名    年龄   性别
王三     18      男
王三     11      女
李四     15      男
李四      21     女

顺序打乱也没关系,只是要某个字段值是相同的,也就是说某个姓名至少有2个以上记录
应该怎么写程序啊?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相同的数据 数据记录 筛选出 数据集 记录 如何

沙发
boe 发表于 2013-8-2 02:36:00
  1. proc sort data=t out=tt nouniquekey;by 姓名;run;
复制代码
Gorgeous girl , I love !

藤椅
yongyitian 发表于 2013-8-2 22:02:42
  1. data a;
  2.    input name $ age gender $;
  3. datalines;
  4. wangsan 18 M
  5. lisi 15 M
  6. zhaowu 32 F
  7. wangsan 11 F
  8. lisi 21 F
  9. ;

  10. proc sql;
  11.    create table b (drop=count) as
  12.    select count(a.name) as count, a.*
  13.    from a
  14.    group by name
  15.    having calculated count>=2;
  16. quit;

  17. proc sort data=a; by name; run;
  18. data c;
  19.     set a;
  20.     by name;
  21.     if first.name and last.name then delete;
  22. run;

  23. proc sort data=a nodupkey dupout=d;
  24.     by name;
  25. run;
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 00:09