人工神经网络算法的信用风险预测
信用风险或信用违约表明未偿还已提供给客户的银行金融服务的可能性。信贷风险一直是银行贷款决策中广泛研究的领域。信用风险对银行和金融机构,特别是对商业银行而言,起着至关重要的作用,并且始终难以解释和管理。由于技术的进步,银行已经设法降低成本,以便开发强大而复杂的系统和模型来预测和管理信贷风险。
为了预测信用违约,已经创建并提出了几种方法。方法的使用取决于银行和金融机构的复杂程度,贷款的规模和类型。常用的方法是判别分析。这种方法使用了有助于决策的得分函数,而一些研究人员由于其限制性假设而对区分分析的有效性表示怀疑。变量之间的正态性和独立性[4]。人工神经网络模型的创建是为了克服其他效率低下的信用违约模型的缺点。
本文的目的是研究神经网络算法解决预测信用违约问题的能力,该能力衡量一段时间内贷款申请的信用度。前馈神经网络算法被应用于银行的住宅抵押贷款应用的小型数据集,以预测信用违约。模型的输出将生成一个二进制值,该值可用作分类器,以帮助银行识别借款人是否违约。本文将采用一种经验方法,该方法将讨论两个基于神经网络的模型,并且将通过训练和验证有关住宅抵押贷款申请的模型来报告实验结果。作为该方向的最后一步,还对数据集执行了线性回归方法。
2方法论
2.1数据
数据是从kaggle.com(贷款俱乐部贷款数据)收集的,其中包含850万条记录。从数据集中抽取了60
因变量: loan_status(0和1);如果借款人将违约,那么投资将是不良的;如果借款人不违约,则他或她将能够偿还全部贷款额。因此,要区分神经网络,0表示借方将违约,而1表示借方将不违约。
自变量:以下变量被视为自变量,loan_amnt,funded_amnt,emp_length,等级,funded_amnt_inv,期限,int_rate,分期付款,year_inc,issue_d和application_type
2.2模型
在这项研究中,使用了经典的前馈神经网络。前馈网络由一个具有10个输入变量的输入层,7个隐藏层和一个具有代表分类器的神经元的输出层组成。使用监督学习算法(反向传播算法)对网络进行训练。该算法通过最小化实际和期望输出之间的误差来优化神经元权重。对于神经元i,权重将通过公式进行更新,其中f为学习系数是隐藏层的输出,算法将一直运行到找到停止标准为止。
对于图3所示的神经网络算法,必须仔细选择参数,例如f的值以及神经元数和隐藏层数。在图3中,连接由每层之间的黑线表示和权重,蓝线显示每个步骤中的偏差(模型的截距)。网络是一个黑匣子,训练算法可以在融合时随时使用。同样,已经从提取的数据集中为网络算法创建了一个随机样本。然后创建一个训练和测试数据集,分别用于训练模型和验证模型的性能。
图3:信用违约模型的神经网络图
3实验与结果
已将10个归一化变量作为按顺序排列的输入作为网络输入。网络的输出是一个分类器,结果为0和1。首先,已检查数据是否缺少数据点值,没有数据丢失;无需修复数据集。输入的相关矩阵如图4所示。
图4:输入数据集的相关图
训练完数据集后,将在测试数据集上对其进行测试。为了基于其他输入来计算输出,已使用了计算功能。将7个隐藏层添加到网络并创建了模型。网络已生成以下结果矩阵:
表1:经典前馈神经网络的结果矩阵
属性
值
错误
322.833
达到阈值
0.0998
脚步
6765
总共需要6765个步骤,直到误差函数的所有导数都小于默认阈值(0.01)。在实现经典的前馈算法之后,通过使用学习速率为0.01的反向传播算法实现了另一个模型。经典过程和反向传播过程具有几乎相同的错误率。因此,经典模型拟合不如反向传播算法令人满意。
图5:输入的广义权重
表2:预测输出与期望输出的比较
实际
预测
火柴
0
0.0032
真正
0
0.00017
真正
0
0.0114
真正
1个
0.985
真正
0
0.0060
真正
0
0.0132
真正
0
0.9704
假
0
0.0101
真正
1个
0.00128
真正
最后,将线性回归应用于数据集以比较两种算法的准确性。glm()函数已用于拟合线性回归模型。对于回归,已分配了大于0.5的概率,如果回归中的预测值大于0.5,则该值为1,否则为0。已经通过合并错误分类误差来计算准确性,并且混淆矩阵的计算也如图6所示。 。
图6:混淆矩阵和线性回归统计
为了强调比较,已计算了线性回归和神经网络的均方误差,如表3所示。从表中可以看出,两个过程的均方误差大致相同,因此两个过程都相同工作。有必要知道,MSE中的偏差取决于训练和测试划分。
表3:两个过程的均方误差
MSE神经网络
MSE线性回归
0.0220449
0.0227334
4。结论
本文研究了人工神经网络和线性回归模型来预测信用违约。两种系统都已经过kaggle.com提供的贷款数据培训。两种系统的结果对数据集均显示出相同的效果,因此非常有效,通过人工神经网络的准确率为97.67575%,准确率为97.69609%。系统对输出变量的分类正确,误差很小。因此,这两个过程都可以用来识别信用违约率。而且,神经网络代表黑匣子方法,因此与线性回归模型相比,难以解释结果。因此,使用哪种模型取决于必须使用的应用程序。此外,在使用神经网络过程拟合模型时,用户需要格外注意属性和数据规范化以提高性能。总之,神经网络提供了强有力的证据来有效预测贷款申请的信用违约。
神经网络算法具有广泛的应用范围,不仅对住宅抵押至关重要。其他应用可以是由公司发行的债券评级,通常称为债券评级,对可以持续使用长达一年的短期投资进行评级,对本地和外币的长期和短期评级,主权或国家评级。通过使用适当的算法和技术,可以进一步增强预测系统,以为应用程序分配信用等级。
题库


雷达卡



京公网安备 11010802022788号







