楼主: wangdianlai
816 0

[数据软件处理] 异常数据筛选原则 [推广有奖]

  • 0关注
  • 0粉丝

大专生

3%

还不是VIP/贵宾

-

威望
0
论坛币
5 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1199 点
帖子
21
精华
0
在线时间
13 小时
注册时间
2023-1-3
最后登录
2024-7-12

楼主
wangdianlai 发表于 2023-1-9 10:43:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据中可能存在一些噪声,因此在正式应用数据前需要对一些异常数据进行剔除,一提出异常数据的原则有三条:
1.使用切比雪规定理,数据在2倍标准差内的数据项为:75%;3倍标准差内的数据为89%,4倍标准差内的数据为94%。对数据分布无要求。
2.经验法则,如果数据呈正态分布:数据在1倍标准差内的数据项为:68%;2倍标准差内的数据为95%,3倍标准差内的数据为100%
3.使用分位数:下限:Q1-1.5IQR,上限:Q3+1.5IQR,其中Q1为四分之一分位数,Q3为四分之三分位数,IQR为四分位距。该方法通常结合箱线图一起进行,更直观。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据筛选 经验法则 正态分布 数据分布 标准差

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 14:25