楼主: yzzhang
5464 20

[原创博文] 请教:如何将一个数据集的所有变量置为缺失? [推广有奖]

  • 1关注
  • 0粉丝

已卖:93份资源

博士生

52%

还不是VIP/贵宾

-

威望
0
论坛币
1979 个
通用积分
2.9500
学术水平
2 点
热心指数
1 点
信用等级
0 点
经验
569 点
帖子
116
精华
0
在线时间
459 小时
注册时间
2009-2-17
最后登录
2025-12-1

楼主
yzzhang 发表于 2010-9-29 14:18:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有数据集a,里面有很多变量,比如100个,想在满足一定条件下,将所有变量都置为空,如果一个一个变量写太麻烦了,有没有简单的方法?多谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 多变量 有没有 麻烦了 如何

沙发
michaelnlitta 发表于 2010-9-29 14:26:18
没有明白你的意思。是在一定条件下,把变量值变为缺失值,还是去除掉变量?举一个例子吧。

藤椅
hopewell 发表于 2010-9-29 14:27:24
行是行,可什么场合下会用到呢?
  1. data raw;
  2.     input x @@;
  3.     y=x;
  4.     z=put(x,best8. -l);
  5. datalines;
  6. 1 2 . 0 5
  7. ;
  8. data out;
  9.     set raw;
  10.     call missing(of _all_);
  11. run;
复制代码
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
crackman + 20 + 1 + 1

总评分: 论坛币 + 20  学术水平 + 1  热心指数 + 1   查看全部评分

板凳
yzzhang 发表于 2010-9-29 14:33:33
三楼的理解那样!
2# michaelnlitta

报纸
yzzhang 发表于 2010-9-29 14:35:14
太感谢了!!
真是太强大了,主要是当一个变量满足值时,认为该条记录其他字段无效,想把它们置为缺失!

3# hopewell

地板
zhangyingjie 发表于 2010-9-29 14:38:22
没有看明白楼主所表达的意思。只好沉默了。

7
yzzhang 发表于 2010-9-29 14:59:47
请教:如何将一个数据集的所有变量置为缺失?
看了3楼的程序感觉很有启发,不过又遇到一个问题,想接着请教下大家!
比如:a,b都按一个变量排了序,记录数和主键都一一对应。
data test;
     set a;
     set b;
     此处:想当b的一个变量比如x=1时,把b的所有变量置缺失,而a的变量值不变,应该怎么做?
run;

8
soporaeternus 发表于 2010-9-29 15:12:46
不明白a和b之间的连接关系
Let them be hard, but never unjust

9
hopewell 发表于 2010-9-29 15:13:18
不忒理解,大概这样?
  1. data a;
  2.     input id a b;
  3. datalines;
  4. 1 11 12
  5. 2 21 22
  6. 3 31 32
  7. ;
  8. data b;
  9.     input id x y;
  10. datalines;
  11. 1 13 14
  12. 2 23 24
  13. 3 33 34
  14. ;
  15. proc sql;
  16.     create table c as
  17.         select a.*, b.x, b.y
  18.             from a a left join (select * from b where id ne 2) b
  19.                 on a.id=b.id
  20.             order by id;
  21. quit;
复制代码

10
yzzhang 发表于 2010-9-29 15:19:36
data a;
     input x  a b;
     datalines;
     1 a1 b1
     2 a2 b2
;
run;

data b;
     input y  m n;
     datalines;
     1 m1 n1
     2 m2 n2
;
run;

data c;
   set a;
   set b;/*相当于按记录号连接*/
   if sum(x,y)>2 then do; m='';n=''; end;
         /*此处数据集b除变量y只有两个变量可以直接写出m=''; n='',可是数据集b变量很多时,一个一个写出来比较麻烦,能不能有简便的写法?*/注:不用sql的左连接,也即,可以理解为用data步实现左连接结果。
run;

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 16:48