楼主: yunnandlg
3165 0

[学习分享] 用SAS进行数据挖掘:异常值检测 [推广有奖]

版主

但问耕耘,莫问收获

院士

0%

还不是VIP/贵宾

-

威望
0
论坛币
251627 个
通用积分
578.6351
学术水平
1667 点
热心指数
1686 点
信用等级
1650 点
经验
173191 点
帖子
1939
精华
0
在线时间
2580 小时
注册时间
2010-8-28
最后登录
2024-4-25

楼主
yunnandlg 在职认证  学生认证  发表于 2016-4-3 14:56:46 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1)数值型变量异常值检测

数值型的变量异常值检测可以通过PROC UNIVARIATE过程来完成

代码如下:

PROC UNIVARIATE DATA=IREAD.DA_FIN_200909;VAR _NUMERIC_;
RUN;

然后查看每个变量的分位数表,分析哪些变量可能存在异常的情况。


2)字符型变量异常值检测

字符型的变量异常值检测可以通过PROC FREQ过程来完成

代码如下:

PROC FREQ DATA=IREAD.DA_FIN_200909; TABLE 变量1 变量2.../MISSING;
RUN;

查看每个字符型变量的频数分布,发现异常的值


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 异常值 Univariate Variate numeric 检测

Cause morning rolls around and it's another day of sun.
清晨不久就会来到,又是阳光明媚的一天。
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 21:36