楼主: 何以爱情丶
25238 12

[问答] 随机森林中树的最优个数的选择有什么依据吗? [推广有奖]

  • 1关注
  • 0粉丝

大专生

10%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
186 点
帖子
39
精华
0
在线时间
31 小时
注册时间
2015-3-27
最后登录
2015-7-21

楼主
何以爱情丶 发表于 2015-4-22 10:33:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
看了很多文献没有提及这个问题,求大神赐教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:随机森林 森林

沙发
complicated 在职认证  发表于 2015-4-22 11:29:30
个人观点:
看预测结果好坏吧,理论上树越多越好,但是如果增加对结果提升不大了就停止呗

藤椅
何以爱情丶 发表于 2015-4-22 17:45:48
complicated 发表于 2015-4-22 11:29
个人观点:
看预测结果好坏吧,理论上树越多越好,但是如果增加对结果提升不大了就停止呗
可是为什么我做的时候树多了有的结果反而会出现不好的情况呢

板凳
complicated 在职认证  发表于 2015-4-23 10:54:06
何以爱情丶 发表于 2015-4-22 17:45
可是为什么我做的时候树多了有的结果反而会出现不好的情况呢
是在原样本还是测试样本的结果?overfit?

报纸
何以爱情丶 发表于 2015-4-23 11:00:21
complicated 发表于 2015-4-23 10:54
是在原样本还是测试样本的结果?overfit?
在测试样本上。ntree=230时,测试集共800组数据分错的有4个,ntree=300时,分错的数据有93个,这是什么原因

地板
complicated 在职认证  发表于 2015-4-23 16:57:27
何以爱情丶 发表于 2015-4-23 11:00
在测试样本上。ntree=230时,测试集共800组数据分错的有4个,ntree=300时,分错的数据有93个,这是什么原 ...
哦,那可能就是过拟合了,
模型太过逼近训练数据的分布了,反而丧失了在预测时的准确性。

7
何以爱情丶 发表于 2015-4-23 20:37:57
complicated 发表于 2015-4-23 16:57
哦,那可能就是过拟合了,
模型太过逼近训练数据的分布了,反而丧失了在预测时的准确性。
不是说随机森林不会出现过拟合吗?这个问题就像您那样解释就行了?

8
complicated 在职认证  发表于 2015-4-24 10:06:48
何以爱情丶 发表于 2015-4-23 20:37
不是说随机森林不会出现过拟合吗?这个问题就像您那样解释就行了?
哦,我比较认同下面这个,转给你供参考交流哈~
http://m.zhihu.com/question/23578594

9
complicated 在职认证  发表于 2015-4-24 10:08:10
何以爱情丶 发表于 2015-4-23 20:37
不是说随机森林不会出现过拟合吗?这个问题就像您那样解释就行了?
哦,我比较认同下面这个,转给你供参考交流哈~
http://m.zhihu.com/question/23578594

10
何以爱情丶 发表于 2015-4-24 20:37:20
complicated 发表于 2015-4-24 10:08
哦,我比较认同下面这个,转给你供参考交流哈~
http://m.zhihu.com/question/23578594
这个我之前也参考过,就是说随机森林还是会出现过拟合的是吧?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-5 21:20