楼主: cynthiazxm
4028 3

新手求助:如何在SAS中查找重复输入的样本 [推广有奖]

  • 0关注
  • 0粉丝

初中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
104 点
帖子
18
精华
0
在线时间
6 小时
注册时间
2008-9-8
最后登录
2014-1-27

楼主
cynthiazxm 发表于 2010-10-16 02:24:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
就是duplicate record
key variable是mother‘s date of birth,race
怎么写程序呢?
谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:新手求助 duplicate Variable Record mother 样本 SAS 新手 输入

沙发
pobel 在职认证  发表于 2010-10-16 07:57:49
data test;
    input dob : yymmdd8. race $;
        format dob yymmdd10.;
    datalines;
19550101 a
19560102 b
19560102 b
19570103 c
19570103 d
19580104 e
19590105 f
19600106 g
19600106 g
;

*** Solution 1;
proc sort data=test out=aaa dupout=bbb nodupkey ;
     by dob race;
run;

*** Solution 2;
proc sql;
     create table ccc as
            select distinct dob,race
                  from test
                  group by dob,race
                  having count(*)>1;
quit;

*** Solution 3;
data ddd;
     set test;
         by dob race;
         if not first.race;
run;
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
crackman + 100 + 60 + 1 + 1 精彩帖子
hopewell + 1 + 1 + 1 好的意见建议

总评分: 经验 + 100  论坛币 + 60  学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

和谐拯救危机

藤椅
vieri32 发表于 2010-10-16 20:31:01
Ron Cody 的Data.Cleaning.Techniques.Using.SAS有詳細講解

板凳
Bridgenc 发表于 2010-10-16 22:39:37
use DUPOUT

PROC SORT DATA=dedupe_demo NODUPKEY DUPOUT=nodup_by_key  OUT=nodup_by_key ;
  BY date_of_birth race;
RUN;
已有 1 人评分经验 热心指数 收起 理由
crackman + 100 + 1 我很赞同

总评分: 经验 + 100  热心指数 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 08:32