id | code |
101 | 1 |
101 | 3 |
101 | 6 |
102 | 2 |
102 | 4 |
103 | 2 |
103 | 3 |
103 | 5 |
103 | 8 |
希望转换成如下格式,新dataset对于id是unique的,新建变量a1到a8,如果对于同一个id,变量code的value中出现了某个数值n,则对应an=1,否则为0.
id | a1 | a2 | a3 | a4 | a5 | a6 | a7 | a8 |
101 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 |
102 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 |
103 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 1 |
2. 现有dataset如下,code1-code5全部是字符型变量
id | code1 | code2 | code3 | code4 | code5 |
101 | 101 | a235 | 0 | 0 | 0 |
101 | 49 | v86 | 0 | 0 | 0 |
101 | 663 | 0 | 0 | 0 | 0 |
102 | v86 | 237 | 0 | 0 | 0 |
102 | v86 | aaa | bbb | 0 | 0 |
103 | c63 | 9 | 0 | 0 | 0 |
103 | 45 | 0 | 0 | 0 | 0 |
103 | 666 | 0 | 0 | 0 | 0 |
103 | a72 | 0 | 0 | 0 | 0 |
希望建立一个unique id的dataset,新建变量flag_v86,对于同一个id,如果v86在code1-code5中出现至少一次,则flag_v86=1,否则为0。
flag_v86 | |
101 | 1 |
102 | 1 |
103 | 0 |
我想任务并不难,可能是用retain和if.first, if.last语句,但我自己写不出来。恳请大家指教,多谢!