6903 2

[问答] 请教不平衡分类样本,DMwR包中的SMOTE函数中perc.over和perc.under的意义 [推广有奖]

  • 0关注
  • 0粉丝

已卖:76份资源

高中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
1341 个
通用积分
0.0600
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
212 点
帖子
19
精华
0
在线时间
34 小时
注册时间
2015-2-3
最后登录
2017-5-5

楼主
彼岸没有灯塔 发表于 2015-12-24 15:25:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教不平衡分类样本,DMwR包中的SMOTE函数中perc.over和perc.under的意义。
怎样设置为好,与产生的新数据集的大小类样本比例关系是怎样的?


SMOTE(form, data, perc.over = 200, k = 5, perc.under = 200,
      learner = NULL, ...)
Arguments

form       
A formula describing the prediction problem
data       
A data frame containing the original (unbalanced) data set
perc.over       
A number that drives the decision of how many extra cases from the minority class are generated (known as over-sampling).
k       
A number indicating the number of nearest neighbours that are used to generate the new examples of the minority class.
perc.under       
A number that drives the decision of how many extra cases from the majority classes are selected for each case generated from the minority class (known as under-sampling)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Under Over Mote ERC 不平衡 平衡 样本 prediction generated examples

回帖推荐

吴追求 发表于2楼  查看完整内容

perc.over:定义过采样的抽样次数,即对于少数类样本点,需要为每个点重新构造多少个点。默认值为200,即重新为每个少数类样本点构造200/100=2个点。 perc.under:定义欠采样的抽样次数,即从多数类样本中选择perc.under倍于新生成的样本数量,默认为200,即从多数类样本中选择200/100=2倍于新生成样本的数量

沙发
吴追求 发表于 2017-5-4 20:55:56
perc.over:定义过采样的抽样次数,即对于少数类样本点,需要为每个点重新构造多少个点。默认值为200,即重新为每个少数类样本点构造200/100=2个点。
perc.under:定义欠采样的抽样次数,即从多数类样本中选择perc.under倍于新生成的样本数量,默认为200,即从多数类样本中选择200/100=2倍于新生成样本的数量

藤椅
彼岸没有灯塔 发表于 2017-5-5 09:30:21
吴追求 发表于 2017-5-4 20:55
perc.over:定义过采样的抽样次数,即对于少数类样本点,需要为每个点重新构造多少个点。默认值为200,即重 ...
非常感谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 16:55