楼主: ruhemiadui
95 0

[学习资料] 个人征信数据不平衡结构处理及特征选择 [推广有奖]

  • 0关注
  • 12粉丝

已卖:2398份资源
好评率:99%
商家信誉:一般

硕士生

51%

还不是VIP/贵宾

-

威望
0
论坛币
1138 个
通用积分
2851.8305
学术水平
6 点
热心指数
8 点
信用等级
10 点
经验
-6814 点
帖子
0
精华
0
在线时间
358 小时
注册时间
2012-6-24
最后登录
2026-2-27

楼主
ruhemiadui 发表于 2025-2-8 15:03:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
个人征信数据不平衡结构处理及特征选择
本文数据来源为“东证期货杯”全国大学生统计建模大赛中选题二提供的贷款机构历史业务数据<sup>[1]</sup>。首先,针对数据缺失,对连续变量根据数据缺失率分别采用删除法和多重填补法处理,名义变量采用特殊类别法处理;在信用数据不平衡问题上,结合K均值算法欠抽样与SMOTE过抽样组合抽样方法在处理数据不平衡问题上有较好的预测效果。
其次,在变量体系指标选择方面,改进了logistic回归的Lasso估计,采用四种信用评分模型对变量选择方法进行比较:针对不同模型特点,该变量选择方法对预测结果有不同程度提升。最后,经过实验比较可得,随机森林分类精度高;logistic回归总体分类精度略低于其他模型,但对于数据中少类样本的识别要高于一般模型;决策树模型分类精度略低于随机森林,但对数据中少类样本识别率不高。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:特征选择 个人征信 不平衡 logistic回归 logistic

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-6 16:06