利用随机森林筛选重要性变量-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 考研考博>>

考研

>>

利用随机森林筛选重要性变量

利用随机森林筛选重要性变量

发布:还没想好用户名呢 | 分类:考研

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

本人正在写一篇论文,想用随机森林来选择重要性变量,但楼主是个软件小白,不知道如何实现这一过程,所以到此来发布一个问答帖子,求助各位大神,希望能帮忙实现,有偿帮助也可以,但有以下要求:一、实现方式为Pyth ...
坛友互助群


扫码加入各岗位、行业、专业交流群


本人正在写一篇论文,想用随机森林来选择重要性变量,但楼主是个软件小白,不知道如何实现这一过程,所以到此来发布一个问答帖子,求助各位大神,希望能帮忙实现,有偿帮助也可以,但有以下要求:
一、实现方式为Python或R
二、我想做的是利用随机森林两阶段逐步回归筛选重要性变量,所以需要完成以下两个步骤:
1.选用相对重要性评价变量重要性,要求实现步骤如下:
(1)对所有变量计算随机森林重要性得分,按相对重要性得分降序排序
(2)将变量分为N组,每组变量数目相等
(3)保留最后一组变量排序及得分
(4)计算剩余变量随机森林重要性的分,按相对重要性得分降序排列,返回步骤(3),直到这几组变量均计算完成
(5)重复模拟100次,以100次的相对重要性得分均值作为变量重要性的得分,以及重要性排序评判标准
2.利用逐步回归筛选变量,实现步骤如下:
(1)根据改进后变量重要性排序确定的变量重要性得分,对原数据剔除该得分小于0的变量数据
(2)对剔除后的剩余变量再次进行随机森林变量重要性降序排列
(3)选择排序第一的变量,对变量做100次随机森林,计算a=OOB(误分率)
(4)加入排序中的下一个变量,做100次随机森林,计算b=OOB(误分率)
(5)若a<=b,删除加入的变量,转入步骤(4)
(6)否则,将b 赋值给a ,选择变量,重新计算现有变量重要性得分,降序排列
(7)若剔除最后一个变量,做100次随机森林,计算b=OOB
(8)若a<=b,保留该变量,转入步骤(4)
(9)否则剔除该变量,将b 赋值给a,转入步骤(4)
(10)直至遍历所有的变量,OOB最小结束。
扫码或添加微信号:坛友素质互助


「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-6432025-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
经管之家 人大经济论坛 大学 专业 手机版