楼主: 唐伯小猫
17622 7

[问答] R 分析里的随机森林 [推广有奖]

  • 1关注
  • 16粉丝

VIP

学科带头人

12%

还不是VIP/贵宾

-

威望
0
论坛币
5371 个
通用积分
3.3476
学术水平
22 点
热心指数
28 点
信用等级
20 点
经验
36754 点
帖子
1427
精华
0
在线时间
1541 小时
注册时间
2005-10-3
最后登录
2025-9-18

楼主
唐伯小猫 发表于 2014-3-31 07:48:48 |AI写论文
20论坛币
最近想做随机森林的分析,用R。看到一些例子都是一开始设置了随机种子。不清楚这种设置有没有什么范围,比如有的时候设置500,有的时候3000,数据结果是不一样的。请哪位高人给详细讲解一下,多谢啦。

最佳答案

lww1993 查看完整内容

1.http://blog.csdn.net/abcjennifer/article/details/8164315我基本是参考的这个文献。 2.http://www.autonlab.org/tutorials/dtree.html讲决策树的
关键词:随机森林 数据结果 有没有 森林
心若向阳,无畏悲伤。

沙发
lww1993 发表于 2014-3-31 07:48:49
1.http://blog.csdn.net/abcjennifer/article/details/8164315我基本是参考的这个文献。
2.http://www.autonlab.org/tutorials/dtree.html讲决策树的

藤椅
yilence 学生认证  发表于 2014-3-31 16:45:06
同求~~~~~~~~~~~~~~~~~~~~~~
学习无止尽

板凳
楚韵荆风 学生认证  发表于 2014-3-31 18:07:48
random seed的设置应该是在random forest中对变量进行random sampling用到的,就相当于产生随机数一样,设置一个随机种子,可以重复的产生相同的随机数。ps: 仅供参考
共享是一种彼此的快乐

报纸
lww1993 发表于 2014-3-31 19:55:41
在做随机森林的时候,会有两个地方用到随机性。
一是用bootstrap选择n个样本点去生成classification and regression tree
二是选择node时,从所有属性中随机选取k个属性,在其中选取相应的最优属性做为node做分类或回归
上述步骤会生成一个CART.也就是一棵树。
R语言中默认是生成500棵树。
之所以选择随机数生成器,主要是为了结果的可重复性。
但是应该变化不大。
如果变化太大的话,我觉得可以多生成一些树,以降低随机性。

地板
唐伯小猫 发表于 2014-4-1 05:35:03
谢谢楼上各位好心人的回复。lww1993,我已经将你的答案设置为最佳了,谢谢!
心若向阳,无畏悲伤。

7
lww1993 发表于 2014-4-1 08:34:59
唐伯小猫 发表于 2014-4-1 05:35
谢谢楼上各位好心人的回复。lww1993,我已经将你的答案设置为最佳了,谢谢!
很高兴得到楼主的论坛币,哈哈。共同学习

8
木龙 发表于 2015-8-21 11:15:44
这种设置有没有什么范围,比如有的时候设置500,有的时候3000

楼主,这个问题我还是不懂,能否解答一下?谢谢!(这个seed的数值应该设置为多大呢?设置的大小不同有什么影响呢?该如何决定设置多大呢?)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-6 04:18