请选择 进入手机版 | 继续访问电脑版
楼主: 时光人
2193 1

[数据挖掘新闻] 数据挖掘|Grubbs异常检验算法 [推广有奖]

  • 3关注
  • 34粉丝

院士

23%

还不是VIP/贵宾

-

威望
1
论坛币
26907 个
通用积分
428.8060
学术水平
95 点
热心指数
109 点
信用等级
91 点
经验
39960 点
帖子
1629
精华
3
在线时间
579 小时
注册时间
2019-2-25
最后登录
2023-4-26

时光人 学生认证  发表于 2019-9-12 16:03:27 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

CDA数据分析师:数据科学、人工智能从业者的在线大学。
数据科学(Python/R/Julia)数据分析、机器学习、深度学习 Q群:874447702


定义

Grubbs检测,也称为最大归一化残差检测,常被用来检验服从正太分布的单变量数据集中的单个异常值。Grubbs检测基于正态假设。也就是说,在应用Grubbs检测之前,首先应验证数据是否可以通过正态分布合理地近似。

原理

Grubbs检测一次检测到一个异常值。从数据集中删除该异常值,并且迭代测试直到没有检测到异常值。但是,多次迭代会改变检测概率,并且检测不应该用于六个或更少的样本,因为它经常将大多数点标记为异常值。

假设检验

Grubbs测试是针对假设定义的:

H0

:数据集中没有异常值

H1

:数据集中只有一个异常值

Grubbs检测统计定义为:

Y、s分别表示样本均值和标准差。Grubbs检验统计量是样本标准差单位与样本均值的最大绝对偏差。

原假设

H

被拒绝,当检验统计量满足以下条件:

实际上,Grubbs检测可理解为检验最大值、最小值偏离均值的程度是否为异常。

实例代码

Grubbs检验#---------------代码范例#Grubbs检验代码实例:#######################################################################函数功能:Grubbs检验#参数说明:x:要进行判断的数据#####################################################################library(outliers)grubbs





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Grubb 数据挖掘 bbs Outliers CDA数据分析师

已有 1 人评分经验 收起 理由
guo.bailing + 100 观点有启发

总评分: 经验 + 100   查看全部评分

柳新~ 在职认证  发表于 2019-9-16 17:58:52 |显示全部楼层 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 23:16