楼主: 我是小趴菜
544 0

[数据挖掘新闻] python的Q测试是什么? [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-11-11 11:41:50 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

导入相关库:



导入数据


为了开始执行离群值测试,我们将导入一些每10分钟采样的平均风速数据






说明:在任何数据集中, outlier都是与其他数据点不一致的基准点。 如果从特定分布采样的数据具有高概率,则异常值将不属于该分布。 如果特定点是异常值,则有各种测试用于测试,这是通过常态测试中使用的相同的空假设测试来完成的。


Q测试


Dixon的Q-Test用于帮助确定是否有证据表明某个点是一维数据集的异常值。 假设数据集是正态分布的。 由于我们有非常有力的证据表明我们的数据集在所有正态检验都是正态分布 ,因此我们可以在此处使用Q-Test。 与正太检验一样,我们假设显着性水平为0.05美元,为简单起见,我们只考虑集合中的最小基准点。




对于我们的示例,Q统计量是集合中最小和最接近数字之间的绝对距离与数据集范围的比率。 这意味着:




对于我们的示例,我们将从包含完整数据集中的最小值的数据集中获取30个值,并对该样本应用测试。 然后我们将数组转换为列表并通过增加值对其进行排序。





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python outlier 显着性水平 Dixon 正态分布

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 06:14