基于过采样方法的信用卡用户违约预测分析
随着信用卡业务在全球范围内的迅速普及,信用风险也急剧扩张。大量信用卡用户违约行为的出现,给银行等金融机构带来了较大的损失。
因此,对信用卡用户的信用风险进行预警,提前识别违约用户就变得尤为重要。它能够为银行等金融机构提供决策依据,帮助其制定合理的放贷策略,降低自身风险,促进自身健康发展。
一般来说,信用卡数据集中各类别的分布是极度不平衡的,未违约人数占比较大,违约人数占比较小,传统的人工信用风险评估模型已不适用。本文将利用数据挖掘技术和机器学习方法,从数据和模型两个方面对信用卡数据集进行探索分析。
本文使用的数据集来自Kaggle官网,为国外某银行2015年到2017年两年间信用卡用户的历史消费及违约记录,该样本集中的类别分布极度不均衡。首先,本文将分别采用SMOTE算法和ADASYN算法对数据集进行过采样处理,使得处理后数据集中的类别相对平衡,这样做的优点是不会损失样本中多数类的信息。
然后基于过采样后的数据,分别建立逻辑回归、随机森林、神经网络、XGBoost预测模型,通过对各个模型的评价指标的对比,找到最优的预测模型,使得其能够最大限度的识 ...


雷达卡


京公网安备 11010802022788号







