楼主: 13505409896
3222 4

[学习资料] 商业银行信贷客户违约量化评估与预测方法 [推广有奖]

  • 0关注
  • 2粉丝

已卖:294份资源

博士生

2%

还不是VIP/贵宾

-

威望
0
论坛币
1047 个
通用积分
39.0465
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2616 点
帖子
150
精华
0
在线时间
76 小时
注册时间
2017-12-20
最后登录
2025-9-7

楼主
13505409896 发表于 2022-4-25 11:00:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
商业银行作为经营风险的金融机构,经营特色在于通过承担适当风险,获取与风险相匹配的收益。常见的盈利途径,比如通过承担信用风险,吸收存款、发放贷款来获取收益;又比如通过承担流动性风险,借短放长、期限错配来获取收益。本文简要介绍一下实务中常用的、在开展客户违约评估与预测方面的量化分析方法。

d060fe1c05e2bbb0.jpg

一、模型构建的基本思路

客户违约问题,本质上还是一种对客户的分类问题。基本逻辑是把客户是否守约作为被解释变量,这一被解释变量在测量方式上属于二分类变量,把客户分为“违约”和“守约”两类;把客户特征作为解释变量,客户特征包括客户的经营能力、盈利能力、偿债能力、发展潜力、现有负债及担保情况等等,这些解释变量既可以是生产经营指标、财务指标等连续变量,也可以是是否对外担保、是否存在历史违约记录等分类变量,实务中很多人喜欢将测量方式为分类的解释变量称为客户标签。

当然,这一概念可以扩展,比如针对单笔债项进行预测,被解释变量可能是多分类的,按资产质量五级分类,正常、关注、次级、可疑、损失等。解释变量也可能会扩展到除客户资质之外的影响因子,比如针对贸易融资业务,因为需要考虑贸易背景的真实性、贸易融资的自偿性,那么除了考虑借款人,还应该充分考虑交易对手的资质、担保货品的特征、应收账款的特征、供应链整体运营状况等因子的影响。


二、常见的统计分析建模技术

从分类模型的角度出发,常用的统计分析方法包括判别分析、Logistic回归分析等传统分析以及决策树分析、神经网络分析等相对较新的分析方法。这些方法通过SPSS软件都能非常便捷的实现,不需要掌握复杂的数学公式,只要理解清楚每种方法的基本概念和操作设置,通过窗口菜单式操作即可完成。

(一)Logistic回归分析

Logistic回归分析包括二元Logistic回归分析、多元Logistic回归分析和有序Logistic回归分析,三者区别在于因变量是二分类还是多分类、分类有无排序依据。如果因变量是0、1分类(如预测是否违约),则应使用二元Logistic回归分析;如果是因变量是多分类且无顺序(如预测客户可能选取的贷款品种),则使用多元Logistic回归分析;如果是因变量是多分类且有顺序(如预测单笔债项资产质量),则使用有序Logistic回归分析。限于篇幅,以二元Logistic回归分析为例介绍,其他方法类似。
大家对于经典的普通最小二乘回归分析可能比较熟悉,事实上,同普通最小二乘类似,Logistic回归分析本质上也是回归分析。因为一般的普通最小二乘回归分析要求因变量呈现正态分布,并且各组中具有相同的方差—协方差矩阵,所以直接用来为二值因变量进行回归估计是不恰当的。二元Logistic回归分析的基本原理是考虑因变量(0,1)发生的概率,用发生概率除以没有发生概率再取对数。通过这一变换改变了“回归方程左侧因变量估计值取值范围为0-1,而右侧取值范围是无穷大或者无穷小”这一取值区间的矛盾,也使得因变量和自变量之间呈线性关系。当然正是由于这一变换,使得Logistic 回归自变量系数不同于一般回归分析自变量系数,而是模型中每个自变量几率比的概念。

(二)判别分析

判别分析的基本原理是按照一定的判别准则,建立一个或多个判别函数,用现有研究对象中的大量样本观测值确定判别函数中的待定系数,并计算判别指标,从而确定出判别函数的具体形式,然后可以用来进行预测,即对于一个未确定类别的样本观测值,只要将其代入判别函数就可以判断它属于哪一类总体。需要说明的是,判别分析中的分类可以是两类或者两类以上。在SPSS中分类用“分组变量”来表示,“分组变量”必须为整数,且用户需要指定其最小值和最大值,系统将从分析中自动排除处于指定值边界以外的样本观测值。

(三)决策树分析

决策树建模技术通过创建基于树的分类模型,为探索性和证实性分类分析提供验证工具。它既可以有效的将参与分析的样本分为若干类,也可以根据自变量(预测变量)的值预测因变量(目标变量)的值。

SPSS的决策树模块可以完成以下功能:一是在所有参与分析的样本中,找出可能成为目标组的成员,比如购买者或优质客户的样本。二是针对所有参与分析的样本,划分为几个不同的类别,比如高、中和低风险组。三是创建模型规则并使用它来预测将来的事件,如某小额快贷申请者将来发生违约或某新注册会员将来成为VIP客户的可能性。四是数据降维和变量筛选,从总体的大变量集中选择有用的预测变量子集,以用于构建正式的参数模型。五是交互确定,确定仅与特定子组有关的关系,并在正式的参数模型中指定这些关系。六是类别合并或将连续变量进行离散化,以最小的损失信息对组预测类别或连续变量进行重新编码。比如将连续的年龄值分为小孩、年轻人、中年人、老年人等。

(四)神经网络

神经网络建模技术的最大特色是对模型结构和假设施加最小需求,可以应用到因变量和自变量之间关系不明确的情形中。

神经网络建模技术可以接近多种统计模型,并不需要先假设因变量和自变量间的特定关系,因变量和自变量间的特定关系在学习过程中确定。如果因变量和自变量间的线性关系更为适合,那么神经网络结果将接近线性回归模型的结果;如果因变量和自变量间的非线性关系更为适合,神经网络将自动接近非线性回归模型的结果。

就“商业银行授信客户的信用风险评估”而言,神经网络分析方法应用于信用风险评估的优点在于其对模型结构和假设施加最小需求,无严格的假设限制,且具有处理非线性问题的能力。它能有效解决非正态分布、非线性的信用评估问题,信用评估结果介于0与1之间,在信用风险的衡量下,即为违约概率。


三、关于模型的选择及质量评价  

我们构建模型的根本目的在于预测。通过对历史数据的深度挖掘,找出其中存在的规律性结论,并将之应用于未来的获客活客或风险防控。比如通过分析发现某些细分行业违约概率较高,那么在授信客户行业结构方面就要出台一些差异化政策进行适当限制;又比如通过分析某些因素交互作用较大,典型如从事XX职业的XX性别客户在XX时间段申请的贷款违约较多,那么可能就需要对该类贷款实行再次审批机制,补充更多的证明性资料,施加更加严苛的贷款条件等等。

从方法角度,判别分析和Logistic回归分析本质上都属于线性分析的范畴,如果我们能够较为合理的判定信用风险和各个解释变量是一种线性关系,那么我们完全可以选择这些传统的建模技术。但是如果我们无法较为合理的判定信用风险和各个解释变量之间的关系,那么就使用神经网络、决策树建模技术就是一种不错的选择。

从技术角度,我们在评价模型的优劣好坏时,通常从两个维度去评判,一是模型预测的准确性,二是模型预测的稳健性,两者相辅相成、缺一不可。关于模型预测的准确性,如果模型能够尽可能的拟合了历史数据信息,拟合优度很高,损失的信息量很小,而且对于未来的预测都很接近真实的实际发生值,那么模型一般是被认为是质量较高的。而关于模型的稳健性,简要解释一下,我们在构建模型时,模型样本一般分为训练样本、坚持样本和检验样本,其中训练样本包含用于训练模型的数据记录,训练样本不能为空,数据集中的某些样本观测值必须分配给训练样本以获得一个模型;检验样本是一个用于跟踪训练过程中的误差以防止超额训练的独立数据记录集,通常情况下,用户创建训练样本后,检验样本数量要小于训练样本数量,神经网络训练才是最高效的;坚持样本不用于构建模型,是一个用于评估最终模型的独立数据记录集;坚持样本的误差给出一个模型预测能力的“真实”估计值。我们期望的是模型在对训练样本以外的样本进行预测时,模型的预测精度不应该有较大幅度的下降,这就是所谓的稳健性。一般来说,神经网络、决策树的预测准确性要优于判别分析和Logistic回归分析等线性分析,但是其稳健性弱于线性分析。

从实务角度,我们还应该关注模型的价值导向,理解模型背后的业务逻辑,紧密围绕业务目标、改善商业表现去评价模型,而不应该就建模而建模。一个简单的例子,我们基于客户行为画像建立一个客户流失度模型,该模型的预测准确性比较高,如果我们的业务目标导向是要尽可能留住老客户,那么我们的模型质量还是不错的,通过预测可以做出前瞻性的安排,比如提供优惠政策、提供增值服务等等;但如果我们的业务目标是要获取更多的利润,而这些流失的客户在很大程度上对于公司的利润贡献是很低的甚至是负值(获取收入不能弥补维系成本),那么我们构建一个包括客户流失度和客户利润贡献度双目标变量的预测模型可能更为合适。


在杨维忠、张甜所著的《SPSS统计分析商用建模与综合案例精解》一书中,第4章为商业银行授信客户信用风险评估,讲解了如何使用SPSS的神经网络-多层感知器,应用到商业银行授信客户信用风险评估领域。第5章为在线旅游供应商客户分类建模技术,讲解如何使用SPSS的神经网络-径向基函数,应用到在线旅游供应商客户分类中。第6章为小额快贷大数据审批建模技术,讲解如何使用SPSS的决策树模块,应用到小额快贷大数据审批中。供感兴趣的读者朋友们参阅。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:量化评估 银行信贷 预测方法 商业银行 商业银

d060fe1c05e2bbb0.jpg (147.63 KB)

d060fe1c05e2bbb0.jpg

沙发
13505409896 发表于 2022-4-25 11:08:45
在杨维忠、张甜所著的《SPSS统计分析商用建模与综合案例精解》一书中,第4章为商业银行授信客户信用风险评估,讲解了如何使用SPSS的神经网络-多层感知器,应用到商业银行授信客户信用风险评估领域。第5章为在线旅游供应商客户分类建模技术,讲解如何使用SPSS的神经网络-径向基函数,应用到在线旅游供应商客户分类中。第6章为小额快贷大数据审批建模技术,讲解如何使用SPSS的决策树模块,应用到小额快贷大数据审批中。供感兴趣的读者朋友们参阅。

藤椅
13505409896 发表于 2022-4-25 11:09:19
在杨维忠、张甜所著的《SPSS统计分析商用建模与综合案例精解》一书中,第4章为商业银行授信客户信用风险评估,讲解了如何使用SPSS的神经网络-多层感知器,应用到商业银行授信客户信用风险评估领域。第5章为在线旅游供应商客户分类建模技术,讲解如何使用SPSS的神经网络-径向基函数,应用到在线旅游供应商客户分类中。第6章为小额快贷大数据审批建模技术,讲解如何使用SPSS的决策树模块,应用到小额快贷大数据审批中。供感兴趣的读者朋友们参阅。

板凳
13505409896 发表于 2022-4-29 12:32:33
在杨维忠、张甜所著的《SPSS统计分析商用建模与综合案例精解》一书中,第4章为商业银行授信客户信用风险评估,讲解了如何使用SPSS的神经网络-多层感知器,应用到商业银行授信客户信用风险评估领域。第5章为在线旅游供应商客户分类建模技术,讲解如何使用SPSS的神经网络-径向基函数,应用到在线旅游供应商客户分类中。第6章为小额快贷大数据审批建模技术,讲解如何使用SPSS的决策树模块,应用到小额快贷大数据审批中。供感兴趣的读者朋友们参阅。
本文来自: 人大经济论坛 SPSS论坛 版,详细出处参考: https://bbs.pinggu.org/forum.php ... mp;from^^uid=10648108

报纸
13505409896 发表于 2022-5-6 15:23:41
d060fe1c05e2bbb0.jpg

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 03:11