菜鸟问两个简单的SAS编程问题，涉及dataset转换，多谢指教！

0关注
0粉丝

小学生

35%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 5 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 55 点
帖子: 7
精华: 0
在线时间: 2 小时
注册时间: 2013-7-31
最后登录: 2015-7-25

楼主

noyazz 发表于 2014-9-30 08:33:08 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

1. 现有dataset如下，假设已经按照id和code排好序而且去除了code的重复值（其实去不去重是不是无所谓？）

id	code
101	1
101	3
101	6
102	2
102	4
103	2
103	3
103	5
103	8

希望转换成如下格式，新dataset对于id是unique的，新建变量a1到a8，如果对于同一个id，变量code的value中出现了某个数值n，则对应an=1，否则为0.

id	a1	a2	a3	a4	a5	a6	a7	a8
101	1	0	1	0	0	1	0	0
102	0	1	0	1	0	0	0	0
103	0	1	1	0	1	0	0	1

2. 现有dataset如下，code1-code5全部是字符型变量

id	code1	code2	code3	code4	code5
101	101	a235	0	0	0
101	49	v86	0	0	0
101	663	0	0	0	0
102	v86	237	0	0	0
102	v86	aaa	bbb	0	0
103	c63	9	0	0	0
103	45	0	0	0	0
103	666	0	0	0	0
103	a72	0	0	0	0

希望建立一个unique id的dataset，新建变量flag_v86，对于同一个id，如果v86在code1-code5中出现至少一次，则flag_v86=1，否则为0。

	flag_v86
101	1
102	1
103	0

我想任务并不难，可能是用retain和if.first, if.last语句，但我自己写不出来。恳请大家指教，多谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：dataset sas编程问题 SAS编程 DataS Data 而且新建最好

相关帖子

沙发

crazygoing 发表于 2014-9-30 10:04:00

第一个问题

data a;
input id code @@;
cards;
101 1
101 3
101 6
102 2
102 4
103 2
103 3
103 5
103 8
;
run;
proc freq data=a;
table id*code/nopct norow nocol out=b;
run;
proc transpose data=b out=c prefix=s ;
var count;
by id ;
id code;
run;
data c;set c;drop _name_ _label_; run;

复制代码

藤椅

noyazz 发表于 2014-9-30 10:17:23

crazygoing 发表于 2014-9-30 10:04
第一个问题

多谢解答！能否不用proc步，仅用data步完成？

板凳

eflucy 发表于 2014-9-30 10:28:24

merge a(where=( a1=1) rename=(code=a1))
   a(where=( a2=2) rename=(code=a2))
   ... ...
   a(where=( a8=8) rename=(code=a8));
  by id;
run;
???
我用不好transpose  一直写data步。。。

update:还得把.改成0；非.改成1...

报纸

crazygoing 发表于 2014-9-30 10:29:33

第二个问题

data a;
input id code1 $ code2$ code3 $ code4 $ code5 $ @@;
cards;
101 101 a235 0 0 0
101 49 v86 v86 0 0
101 663 0 0 0 0
102 v86 237 0 0 0
102 v86 aaa bbb 0 0
103 c63 9 0 0 0
103 45 0 0 0 0
103 666 0 0 0 0
103 a72 0 0 0 0
;
run;
data b;set a;
count=0;
array ss{5} code1-code5;
do i=1 to 5;
if ss[i]="v86" then count=count+1;
end;
keep id count;
if count>1 then count=1;
run;
proc sort data=b out=c ;
by id descending count ;
run;
proc sort data=c out=c nodupkey;
by id ;
run;

复制代码

地板

crazygoing 发表于 2014-9-30 10:31:59

noyazz 发表于 2014-9-30 10:17
多谢解答！能否不用proc步，仅用data步完成？

只用data步我不会，不过根据三楼的思路，可以利用macro建立循环data步，省点代码。

7楼

苹果叶

发表于 2014-9-30 10:56:42

proc transpose data=a out=t_a;
var code;
by id;
id code;
run;
data final;
set t_a;
array _ _1-_8 ;
array n n1-n8;
do over n;
if _=. then n=0;
else n=1;
end;
drop _:;
run;

复制代码

8楼

小迷彩魂 发表于 2014-9-30 11:13:33

感谢分享

9楼

苹果叶

发表于 2014-9-30 11:39:16

Question 2:

data a1;
set a;
array code code1-code5;
do over code;
if code='v86' then flag_v86=1;
else if flag_v86 ne 1 then flag_v86=0;
end;
drop code:;
run;
proc sort data=a1;
by id flag_v86;
run;
data final;
set a1;
by id flag_v86;
if last.id;
run;

复制代码

10楼

noyazz 发表于 2014-9-30 12:06:42

谢谢大家的解答！求用array retain和if first/if last相结合的方法，同事不喜欢用proc transpose，我得配合...

菜鸟问两个简单的SAS编程问题，涉及dataset转换，多谢指教！ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

菜鸟问两个简单的SAS编程问题，涉及dataset转换，多谢指教！ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群