楼主: dqd237
6079 6

[问题] 求教不平衡数据的训练集与测试集样本选择: [推广有奖]

  • 2关注
  • 0粉丝

已卖:2份资源

高中生

95%

还不是VIP/贵宾

-

威望
0
论坛币
3111 个
通用积分
8.0132
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
519 点
帖子
31
精华
0
在线时间
25 小时
注册时间
2012-4-3
最后登录
2022-5-2

楼主
dqd237 在职认证  发表于 2017-12-28 12:35:01 |AI写论文
50论坛币
求教不平衡数据的训练集与测试集样本选择:我正在用决策树提取不同类别的群体的特征,一共有四个群体,但是群体的数据不平衡,分别是1200多,800多,1000多,200多个数据,请问应该怎么进行训练集和测试集的划分与选择,谢谢!


我使用的是Clementine C5.0算法


即多分类类别不均衡的数据应该怎么抽取与选择训练集与测试集,谢谢

最佳答案

阿扁V5 查看完整内容

简单就是分层采样,周志华那本书第二章有详细讲针对不平衡数据和多分类数据的处理方法,可参考
关键词:样本选择 训练集 测试集 不平衡 clementine Clementine 决策树 样本不平衡 训练集 测试集

沙发
阿扁V5 学生认证  发表于 2017-12-28 12:35:02
简单就是分层采样,周志华那本书第二章有详细讲针对不平衡数据和多分类数据的处理方法,可参考

藤椅
dqd237 在职认证  发表于 2017-12-28 12:45:01
即多分类类别不均衡的数据应该怎么抽取与选择训练集与测试集,谢谢

板凳
wuweijia 企业认证  发表于 2017-12-30 11:59:40
支持一下

报纸
jiawenqi111 发表于 2018-1-2 18:19:13
用随机采样去做,尽量保持每个类别的样本数量一致。

地板
dqd237 在职认证  发表于 2018-1-7 01:22:53
阿扁V5 发表于 2017-12-28 12:35
简单就是分层采样,周志华那本书第二章有详细讲针对不平衡数据和多分类数据的处理方法,可参考
请问具体的书名是什么?谢谢!

7
阿扁V5 学生认证  发表于 2018-1-8 10:13:12 来自手机
《机器学习》周志华

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 04:17