请选择 进入手机版 | 继续访问电脑版
楼主: henryzard
5470 7

[Weka及其他] 二分类问题中,如果某一类样本相比很少,而另一类特别多时,该如何处理呢? [推广有奖]

  • 0关注
  • 1粉丝

博士生

13%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2151 点
帖子
40
精华
0
在线时间
424 小时
注册时间
2015-9-28
最后登录
2024-3-25

henryzard 发表于 2017-3-15 09:45:11 来自手机 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,导致变量选择后剩下很少的变量,分类结果中看不到很少的那一类,实在很苦恼。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:二分类 变量选择 看不到

kdfrmykdfrmy 发表于 2017-3-20 09:38:43 |显示全部楼层 |坛友微信交流群
构造一个更平衡的数据集  遇到过这个问题 忽然想不起来当时是怎么做的了  不平衡的话最后正确率会很高 直接全判为数量多的那一类

使用道具

henryzard 发表于 2017-3-23 08:12:47 来自手机 |显示全部楼层 |坛友微信交流群
kdfrmykdfrmy 发表于 2017-3-20 09:38
构造一个更平衡的数据集  遇到过这个问题 忽然想不起来当时是怎么做的了  不平衡的话最后正确率会很高 直接 ...
一类130个样本(没法增加),另一类7000多样本,我都不知道怎么办了

使用道具

henryzard 发表于 2017-3-23 08:20:20 来自手机 |显示全部楼层 |坛友微信交流群
kdfrmykdfrmy 发表于 2017-3-20 09:38
构造一个更平衡的数据集  遇到过这个问题 忽然想不起来当时是怎么做的了  不平衡的话最后正确率会很高 直接 ...
谢谢你的回复

使用道具

alexis_liu 发表于 2017-3-24 07:37:01 来自手机 |显示全部楼层 |坛友微信交流群
henryzard 发表于 2017-3-15 09:45
如题,导致变量选择后剩下很少的变量,分类结果中看不到很少的那一类,实在很苦恼。
可以过抽样,也可以欠抽样,设置一系列的两类样本比例,最后看效果!!

使用道具

你这个只能过抽样,如果欠抽样的话,样本太少了。或者使用混合抽样

使用道具

henryzard 发表于 2017-3-25 08:44:12 来自手机 |显示全部楼层 |坛友微信交流群
飞天玄舞6 发表于 2017-3-24 19:54
你这个只能过抽样,如果欠抽样的话,样本太少了。或者使用混合抽样
好的谢谢,我试试

使用道具

henryzard 发表于 2017-3-25 08:44:43 来自手机 |显示全部楼层 |坛友微信交流群
alexis_liu 发表于 2017-3-24 07:37
可以过抽样,也可以欠抽样,设置一系列的两类样本比例,最后看效果!!
好,谢谢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-17 04:45