17620 2

[问答] 利用随机森林筛选重要性变量 [推广有奖]

  • 1关注
  • 0粉丝

本科生

52%

还不是VIP/贵宾

-

威望
0
论坛币
1047 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1226 点
帖子
47
精华
0
在线时间
83 小时
注册时间
2018-1-19
最后登录
2023-2-5

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人正在写一篇论文,想用随机森林来选择重要性变量,但楼主是个软件小白,不知道如何实现这一过程,所以到此来发布一个问答帖子,求助各位大神,希望能帮忙实现,有偿帮助也可以,但有以下要求:
一、实现方式为Python或R
二、我想做的是利用随机森林两阶段逐步回归筛选重要性变量,所以需要完成以下两个步骤:
1.选用相对重要性评价变量重要性,要求实现步骤如下:
(1)对所有变量计算随机森林重要性得分,按相对重要性得分降序排序
(2)将变量分为N组,每组变量数目相等
(3)保留最后一组变量排序及得分
(4)计算剩余变量随机森林重要性的分,按相对重要性得分降序排列,返回步骤(3),直到这几组变量均计算完成
(5)重复模拟100次,以100次的相对重要性得分均值作为变量重要性的得分,以及重要性排序评判标准
2.利用逐步回归筛选变量,实现步骤如下:
(1)根据改进后变量重要性排序确定的变量重要性得分,对原数据剔除该得分小于0的变量数据
(2)对剔除后的剩余变量再次进行随机森林变量重要性降序排列
(3)选择排序第一的变量,对变量做100次随机森林,计算a=OOB(误分率)
(4)加入排序中的下一个变量,做100次随机森林,计算b=OOB(误分率)
(5)若a<=b,删除加入的变量,转入步骤(4)
(6)否则,将b 赋值给a ,选择变量,重新计算现有变量重要性得分,降序排列
(7)若剔除最后一个变量,做100次随机森林,计算b=OOB
(8)若a<=b,保留该变量,转入步骤(4)
(9)否则剔除该变量,将b 赋值给a,转入步骤(4)
(10)直至遍历所有的变量,OOB最小结束。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:变量重要性 相对重要性 重要性排序 重要性评价 随机森林

沙发
杨Yuer参上 发表于 2018-6-23 16:25:36 |只看作者 |坛友微信交流群
兄弟,你这个是完整的项目了,让别人免费给你 弄肯定是不可能的。
你还是等着哪个想赚外快的大神,愿意接你的活吧!

使用道具

藤椅
ljian1718 学生认证  发表于 2018-12-19 13:24:55 |只看作者 |坛友微信交流群
看到你的帖子,是不是已经做好了?如果有需要可以Q聊,有偿服务

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 19:56