楼主: mack-j
3426 1

[学科前沿] 异常值怎么处理? [推广有奖]

  • 9关注
  • 2粉丝

已卖:791份资源

博士生

57%

还不是VIP/贵宾

-

威望
0
论坛币
396 个
通用积分
97.0136
学术水平
3 点
热心指数
5 点
信用等级
2 点
经验
5334 点
帖子
269
精华
0
在线时间
286 小时
注册时间
2012-2-23
最后登录
2025-8-20

楼主
mack-j 发表于 2016-1-25 11:47:35 |AI写论文
5论坛币
现在在O2O做数据分析,现在正在做用户分析,由于存在用户刷单情况,需剔除刷单用户,用统计语言叫异常值,请问大神,我该如何剔除用户异常值?
字段信息全部都有,有用户订单数量,时间,购买的产品,金额等等
已经知道数据是偏态分布。。。。
求大神解答。

关键词:怎么处理 异常值 统计语言 偏态分布 数据分析 产品 如何 统计 信息 用户

回帖推荐

snoozer 发表于2楼  查看完整内容

刷单用户和普通用户的不同在于下单频率更高?如果是的话,可以看看频率表,把频率特别高的找出来。这是最简单做法。 一般的思路,可以用parametric distribution来fit data, 然后用你的数据和fit出来的分布函数做qq-plot,找出outliers.

本帖被以下文库推荐

沙发
snoozer 发表于 2016-1-29 00:50:24
刷单用户和普通用户的不同在于下单频率更高?如果是的话,可以看看频率表,把频率特别高的找出来。这是最简单做法。

一般的思路,可以用parametric distribution来fit data, 然后用你的数据和fit出来的分布函数做qq-plot,找出outliers.
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-20 03:13