楼主: chai_prime
3329 9

[问答] 如何对数据集中的缺失值进行说明(加一列) [推广有奖]

  • 0关注
  • 1粉丝

硕士生

67%

还不是VIP/贵宾

-

威望
0
论坛币
186 个
通用积分
195.0452
学术水平
10 点
热心指数
9 点
信用等级
8 点
经验
1480 点
帖子
154
精华
0
在线时间
187 小时
注册时间
2011-8-1
最后登录
2021-1-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
比如
data test;
x=1;
y=2;
z=.;
run;

对这个数据集,再加一列m,里面列出这一行里缺失的变量的列名~

这里即是m='z';

问题是,给定的数据集,我怎么把每列的列名自动放到missing函数里进行判断?

主要不知道有没有更好的方法?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:缺失值 数据集 missing Data SSIN 如何

回帖推荐

hopewell 发表于4楼  查看完整内容

本帖被以下文库推荐

沙发
jingju11 发表于 2011-9-16 23:09:59 |只看作者 |坛友微信交流群
问题是如果一行里不止一个missing,如何给出m的值呢?京剧

使用道具

藤椅
chai_prime 发表于 2011-9-16 23:40:42 |只看作者 |坛友微信交流群
jingju11 发表于 2011-9-16 23:09
问题是如果一行里不止一个missing,如何给出m的值呢?京剧
把他们全列在m里~~
这个用

m = cat(m,&m1.);

大概可以实现了~

使用道具

板凳
hopewell 发表于 2011-9-17 11:58:45 |只看作者 |坛友微信交流群
  1. data test;
  2.     x=''; y=2; z=.;
  3.     output;
  4.     x='A'; y=.; z=3;
  5.     output;
  6. run;
  7. proc sql noprint;
  8.     select quote(strip(name)) into :varlist separated by ','
  9.         from dictionary.columns
  10.             where libname='WORK' and memname='TEST'
  11.             order by varnum;
  12. quit;
  13. data test2(drop=i);
  14.     length i $32 m $200;
  15.     set test;
  16.     do i=&varlist;
  17.         m=catx('/',m,ifc(strip(vvaluex(i)) in ('','.'),i,''));
  18.     end;
  19. run;
复制代码
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
bakoll + 3 + 3 精彩帖子
jingju11 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 3  论坛币 + 3  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

观钓颇逾垂钓趣 种花何问看花谁

使用道具

报纸
webgu 发表于 2011-9-17 14:20:28 |只看作者 |坛友微信交流群
hopewell 发表于 2011-9-17 11:58
呵呵,hopewell出手了。我就借用您的data test,写个简单的吧。
  1. data test3(drop=i j);
  2. length  m $200.;
  3.   m='Missinglist:';
  4.   set test;
  5. array char[*]$ _character_ ;
  6. array num[*] _numeric_;
  7.   do i=1 to dim(char);
  8.      if missing(char[i]) then m=trim(m)||vname(char[i])||',';
  9.   end;  
  10.   do j=1 to dim(num);
  11.     if missing(num[j]) then  m=trim(m)||vname(num[j])||',';
  12.   end;
  13. run;
复制代码
SAS资源
1. SAS 微信:StatsThinking
2. SAS QQ群:348941365

使用道具

地板
chai_prime 发表于 2011-9-17 21:50:45 |只看作者 |坛友微信交流群
hopewell 发表于 2011-9-17 11:58
可以实现 test的标记,但我换个库里的数据集,标记出现一些问题~~

sql选出列名好像   对其它数据集失效...,不会只能xyz有用吧...

另外,用到dictionary.columns,是不是受环境限制了?影响移植性?

使用道具

7
chai_prime 发表于 2011-9-17 21:51:24 |只看作者 |坛友微信交流群
hopewell 发表于 2011-9-17 11:58
不过这段代码也让我感觉sas的强大了...

使用道具

8
chai_prime 发表于 2011-9-17 21:55:33 |只看作者 |坛友微信交流群
webgu 发表于 2011-9-17 14:20
呵呵,hopewell出手了。我就借用您的data test,写个简单的吧。
这个基本实现了需求~~~多谢多谢...

使用道具

9
webgu 发表于 2011-9-17 22:41:14 |只看作者 |坛友微信交流群
chai_prime 发表于 2011-9-17 21:50
可以实现 test的标记,但我换个库里的数据集,标记出现一些问题~~

sql选出列名好像   对其它数据集失效 ...
dictionary 通用的,应该不会的。
SAS资源
1. SAS 微信:StatsThinking
2. SAS QQ群:348941365

使用道具

10
chai_prime 发表于 2011-9-17 23:25:20 |只看作者 |坛友微信交流群
webgu 发表于 2011-9-17 22:41
dictionary 通用的,应该不会的。
那在其它库名下报错又是什么情况呢?

查到的列名不太对?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 01:29