楼主: 秋以为期99
1558 3

[问答] sas批量清洗异常值 [推广有奖]

  • 0关注
  • 0粉丝

大专生

23%

还不是VIP/贵宾

-

威望
0
论坛币
2658 个
通用积分
3.4606
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
98 点
帖子
7
精华
0
在线时间
89 小时
注册时间
2019-4-27
最后登录
2023-4-27

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有两个问题:
1. 我想对所有的数值型变量用标准差的方法筛选异常值,但是看了很多例子都是只对某一个变量进行筛选,我这里变量太多,没办法一个个手动输入。

用均值标准差的方法

proc means data=pmlr.Developnoprint;

   var _numeric_;(对所有数值型变量进行)

   output out=means(drop=_type_ _freq_)

          mean=M_DDABal(这个地方不知道怎么改,原文是这样的DDABal变量,但是我想把这个位置换位所有的数值型变量mean=M_ _numeric_???)

          std=S_DDABal;(同上)

run;

data _null_;

   file print;

   set pmlr.Develop(keep=DDABal);

   if _n_ = 1 then set means;

   if DDABal lt M_DDABal - 2*S_DDABal and not missing(DDABal) or

      DDABal gt M_DDABal + 2*S_DDABal then put  DDABal=;

run;(第二段程序也是这个变量引入的问题)




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分经验 收起 理由
eijuhz + 20 精彩帖子

总评分: 经验 + 20   查看全部评分

沙发
秋以为期99 发表于 2019-11-6 09:35:54 |只看作者 |坛友微信交流群
2。同样是异常值处理。

我对每个变量用了

proc univariate data=total;
var _numeric_;
run;

得到分位数图,想把类似于这样的变量删去,如何做到呢?就是只有99%和100%才会出现。

使用道具

藤椅
秋以为期99 发表于 2019-11-6 09:35:55 |只看作者 |坛友微信交流群
3OC$FJ}T618%O)SZPAR@8.jpg 0C[{NI@FD2OZ_IL{V`7YS23.png

使用道具

板凳
yurongdizzy 发表于 2021-8-23 15:37:34 |只看作者 |坛友微信交流群
请问楼主是怎么解决第一个问题的

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 21:31