- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 29650 个
- 通用积分
- 380.5350
- 学术水平
- 1 点
- 热心指数
- 1 点
- 信用等级
- 0 点
- 经验
- 7150 点
- 帖子
- 670
- 精华
- 0
- 在线时间
- 37 小时
- 注册时间
- 2022-8-30
- 最后登录
- 2023-4-4
教授
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
 - 29650 个
- 通用积分
- 380.5350
- 学术水平
- 1 点
- 热心指数
- 1 点
- 信用等级
- 0 点
- 经验
- 7150 点
- 帖子
- 670
- 精华
- 0
- 在线时间
- 37 小时
- 注册时间
- 2022-8-30
- 最后登录
- 2023-4-4
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
基于抽样的算法SMOTE
2002年,引入了一种基于抽样的算法SMOTE(Synthetic Minority Over-Sampling Technique),试图解决类不平衡问题。由于其简单性和有效性,它是最常用的方法之一。它是过采样和欠采样的组合,但过采样方法不是复制少数类,而是通过算法构造新的少数类数据实例。 在传统的过采样中,少数类正在被复制。在SMOTE中,以这种方式构造新的少数派实例:

构造算法背后的直觉是过采样导致过度拟合,因为重复实例导致决策边界收紧。相反,我们将创建“类似”的示例。对于机器学习算法,这些新构造的实例不是精确的副本,因此软化了决策边界。这可以说明如下: 
结果,分类器更通用并且不会过度拟合。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|