本人想写一篇文章,但在模型方法上遇到一些困难,所以想求助有能力的大神帮我完成以下几个操作,若有能力完成以下操作者提出有偿帮助的要求,本人也可接受。
一、实现方式为Python或R软件
操作一:利用随机森林两阶段逐步回归筛选重要性变量,需要完成以下两个步骤:
1.选用相对重要性评价变量重要性,要求实现步骤如下:
(1)对所有变量计算随机森林重要性得分,按相对重要性得分降序排序
(2)将变量分为N组,每组变量数目相等
(3)保留最后一组变量排序及得分
(4)计算剩余变量随机森林重要性的分,按相对重要性得分降序排列,返回步骤(3),直到这几组变量均计算完成
(5)重复模拟100次,以100次的相对重要性得分均值作为变量重要性的得分,以及重要性排序评判标准
2.利用逐步回归筛选变量,实现步骤如下:
(1)根据改进后变量重要性排序确定的变量重要性得分,对原数据剔除该得分小于0的变量数据
(2)对剔除后的剩余变量再次进行随机森林变量重要性降序排列
(3)选择排序第一的变量,对变量做100次随机森林,计算a=OOB(误分率)
(4)加入排序中的下一个变量,做100次随机森林,计算b=OOB(误分率)
(5)若a<=b,删除加入的变量,转入步骤(4)
(6)否则,将b 赋值给a ,选择变量,重新计算现有变量重要性得分,降序排列
(7)若剔除最后一个变量,做100次随机森林,计算b=OOB
(8)若a<=b,保留该变量,转入步骤(4)
(9)否则剔除该变量,将b 赋值给a,转入步骤(4)
(10)直至遍历所有的变量,OOB最小结束。
操作二:建立支持向量机(SVC)模型,并利用粒子群(PSO)优化模型参数
(1)利用2007-2016年的数据建立SVC模型,预测2017年第一季度、2017年第二季度、2017年第三季度、2017年第四季度和2018年第一季度的借款人违约率,并计算出预测精度和误差;
(2)利用粒子群优化SVC模型的参数;
(3)利用优化后的SVC模型预测2017年第一季度、2017年第二季度、2017年第三季度、2017年第四季度和2018年第一季度的借款人违约率。并计算出预测精度和误差;
操作三:建立BP神经网络模型,并利用粒子群(PSO)优化模型参数
(1)利用2007-2016年第四季度数据建立BP神经网络模型,预测2017年第一季度、2017年第二季度、2017年第三季度、2017年第四季度和2018年第一季度的借款人违约率;并计算出预测精度和误差;
(2)利用粒子群优化BP神经网络模型参数;
(3)利用优化后的SVC模型预测2017年第一季度、2017年第二季度、2017年第三季度、2017年第四季度和2018年第一季度的借款人违约率。并计算出预测精度和误差;
操作四:利用遗传算法全局寻优,建立SVC与BP神经网络的加权组合模型
(1)对2007-2016年第四季度数据,利用遗传算法全局寻优,建立SVC与BP神经网络的加权组合模型,预测2017年第一季度、2017年第二季度、2017年第三季度、2017年第四季度和2018年第一季度的借款人违约率;并计算出预测精度和误差;