CDA数据分析就业班毕业答辩集锦
—金融数据分析
项目背景:该数据为2009-2016年某商业银行中部分客户的基本交易情况,主要含交易信息,人口基本属性以及相关衍生变量,行方想根据既有信息,推出一款理财产品-'g基金',根据以上信息,行方通过这些信息,想知道那些客户是他们的目标客户。
解决方案:
此数据缺失值极多,数据不平衡,并且变量过多易陷入虚拟变量陷阱。因此首先采用欠采样将响应变量控制在1:5;然后使用随机森林和WOE算法进行变量筛选;最后填补缺失值处理异常值。之后应用logistic回归在训练组得出模型,再用测试组检验模型。
分析结果:
最后给出的模型AUC值适中,预测合理,模型比较稳健。同时,这是一个结构模型,可分析自变量的偏效应,更便于模型落地。
答辩视频
PS:想要获取「答辩完整视频和PPT」,请加入QQ群:389385514,下载链接见群公告
作品优势:
1、在进行数据清洗的时候,参考了多篇学术文献,保证了清洗方法的严肃性与适用性。
2、在进行变量筛选的时候,结合了随机森林和WOE算法进行筛选,保证了筛选结果正确且可解释。
3、在预测阈值的确定与模型变量解释的问题上,更多地考虑了模型落地的问题,保证了模型可应用在实际业务中。
CDA数据分析就业班介绍:
CDA数据分析就业班是为解决当下企业招人难、学员就业难的问题所研发的精品课程。课程以数据分析理论与实践案例结合的方式讲授,内容覆盖了国内企业招聘数据分析师岗位所需的技能,学员经过三个月系统全面的脱产学习(统计学、Excel、SQL、SPSS、SAS、R、Python),达到企业用人标准,快速在大数据时代找准工作定位。
课程详情:http://www.cda.cn/kecheng/6.html
快点加入我们,一起玩转数据分析吧!
联系方式:
电话:010-53605625
手机:18810531180(曹老师)
QQ:2881989706