楼主: nkmaxwell
6507 4

[求助]怎样在sas数据集中删除异常点? [推广有奖]

  • 2关注
  • 0粉丝

VIP

讲师

27%

还不是VIP/贵宾

-

威望
0
论坛币
499 个
通用积分
30.9586
学术水平
5 点
热心指数
0 点
信用等级
0 点
经验
104 点
帖子
225
精华
0
在线时间
560 小时
注册时间
2005-4-14
最后登录
2024-4-20

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

菜鸟求助!

谢谢。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:sas数据集 异常点 数据集 数据 SAS 删除

回帖推荐

bakoll 发表于2楼  查看完整内容

一个参考 proc means data=train nopoint; var variable; output out=outlier p25=p25 p75=p75; /*p25,p75分别是上四分位数,下四分位数*,outlier为离群值即异常值/ run; data a; set outlier; IQR3=3*(p75-p25);/*四分位数差的三倍,即离群值的范围*/ call symputx('IQR3',IQR3); /*将变量变成宏*/ call symputx('p75',p75); call symputx('p25',p25); run; data outlier1; set trai ...

本帖被以下文库推荐

沙发
bakoll 发表于 2015-6-29 09:12:23 |只看作者 |坛友微信交流群
一个参考
proc means data=train nopoint;

var variable;

output out=outlier p25=p25 p75=p75;  /*p25,p75分别是上四分位数,下四分位数*,outlier为离群值即异常值/

run;


data a;

set outlier;

IQR3=3*(p75-p25);/*四分位数差的三倍,即离群值的范围*/

call symputx('IQR3',IQR3);  /*将变量变成宏*/

call symputx('p75',p75);

call symputx('p25',p25);

run;


data outlier1;

set train;

if(&p25-&IQR3)<=&var<=(&p75+&IQR3) then outlier=0;

else outlier=1;    /*观测值在外界之内,将outlier标识为0,在之外,则标识为1*/

run;

data outlier2;
set outlier1;
where outlier=1;
run;

使用道具

藤椅
cdmaf56 发表于 2018-9-17 11:42:23 |只看作者 |坛友微信交流群
大神,谢谢了

使用道具

板凳
cdmaf56 发表于 2018-9-17 11:43:13 |只看作者 |坛友微信交流群
bakoll 发表于 2015-6-29 09:12
一个参考
proc means data=train nopoint;
谢谢专家,可以用

使用道具

报纸
cdmaf56 发表于 2018-9-17 11:43:18 |只看作者 |坛友微信交流群
bakoll 发表于 2015-6-29 09:12
一个参考
proc means data=train nopoint;
谢谢专家,可以用

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 20:09