楼主: mingdashike22
1064 17

[量化金融] 网络担保贷款违约预测 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-5-31 04:26:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Prediction defaults for networked-guarantee loans》
---
作者:
Dawei Cheng, Zhibin Niu, Yi Tu, Liqing Zhang
---
最新提交年份:
2020
---
英文摘要:
  Networked-guarantee loans may cause the systemic risk related concern of the government and banks in China. The prediction of default of enterprise loans is a typical extremely imbalanced prediction problem, and the networked-guarantee make this problem more difficult to solve. Since the guaranteed loan is a debt obligation promise, if one enterprise in the guarantee network falls into a financial crisis, the debt risk may spread like a virus across the guarantee network, even lead to a systemic financial crisis. In this paper, we propose an imbalanced network risk diffusion model to forecast the enterprise default risk in a short future. Positive weighted k-nearest neighbors (p-wkNN) algorithm is developed for the stand-alone case -- when there is no default contagious; then a data-driven default diffusion model is integrated to further improve the prediction accuracy. We perform the empirical study on a real-world three-years loan record from a major commercial bank. The results show that our proposed method outperforms conventional credit risk methods in terms of AUC. In summary, our quantitative risk evaluation model shows promising prediction performance on real-world data, which could be useful to both regulators and stakeholders.
---
中文摘要:
网络担保贷款可能会引起中国政府和银行的系统性风险相关担忧。企业贷款违约预测是一个典型的极不平衡预测问题,而网络化担保使这一问题更加难以解决。由于担保贷款是一种债务义务承诺,如果担保网络中的一家企业陷入金融危机,债务风险可能会像病毒一样在担保网络中传播,甚至导致系统性金融危机。本文提出了一种非平衡网络风险扩散模型来预测企业短期违约风险。正加权k-最近邻(p-wkNN)算法适用于无违约传染的独立情况;然后集成了数据驱动的缺省扩散模型,进一步提高了预测精度。我们对一家大型商业银行的真实三年贷款记录进行了实证研究。结果表明,我们提出的方法在AUC方面优于传统的信用风险方法。总之,我们的定量风险评估模型在实际数据上显示了良好的预测性能,这对监管机构和利益相关者都很有用。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Social and Information Networks        社会和信息网络
分类描述:Covers the design, analysis, and modeling of social and information networks, including their applications for on-line information access, communication, and interaction, and their roles as datasets in the exploration of questions in these and other domains, including connections to the social and biological sciences. Analysis and modeling of such networks includes topics in ACM Subject classes F.2, G.2, G.3, H.2, and I.2; applications in computing include topics in H.3, H.4, and H.5; and applications at the interface of computing and other disciplines include topics in J.1--J.7. Papers on computer communication systems and network protocols (e.g. TCP/IP) are generally a closer fit to the Networking and Internet Architecture (cs.NI) category.
涵盖社会和信息网络的设计、分析和建模,包括它们在联机信息访问、通信和交互方面的应用,以及它们作为数据集在这些领域和其他领域的问题探索中的作用,包括与社会和生物科学的联系。这类网络的分析和建模包括ACM学科类F.2、G.2、G.3、H.2和I.2的主题;计算应用包括H.3、H.4和H.5中的主题;计算和其他学科接口的应用程序包括J.1-J.7中的主题。关于计算机通信系统和网络协议(例如TCP/IP)的论文通常更适合网络和因特网体系结构(CS.NI)类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
--> Prediction_defaults_for_networked-guarantee_loans.pdf (1.38 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:担保贷款 Applications Quantitative Conventional Mathematical

沙发
nandehutu2022 在职认证  发表于 2022-5-31 04:26:40
网络担保贷款预测默认值Dawei Cheng*, 牛志斌+,易图*和Liqing Zhang**上海交通大学计算机科学与工程系上海市智能交互与认知工程教育委员会重点实验室。电子邮箱:{dawei.cheng,tuyi1991,lqzhang}@sjtu。埃杜。cn+中国天津大学计算机软件学院。电子邮件:zniu@tju.edu.cnAbstract-网络担保贷款可能会引起中国政府和银行的系统风险相关担忧。企业贷款违约预测是一个典型的极不平衡预测问题,网络化担保使这一问题更加难以解决。由于担保贷款是一种债务义务承诺,如果担保网络中的一家企业陷入金融危机,债务风险可能会像病毒一样在担保网络中传播,甚至导致金融不对称危机。本文提出了一个不平衡网络风险扩散模型来预测企业短期违约风险。正加权k-最近邻(p-wkNN)算法是针对独立情况开发的——当没有默认传染时;然后,集成了数据驱动的defaultdiffusion模型,以进一步提高预测精度。我们对一家大型商业银行的真实三年贷款记录进行了实证研究。结果表明,我们提出的方法在AUC方面优于传统的creditrisk方法。总之,我们的quantitativerisk评估模型显示了对真实数据的良好预测性能,这可能对监管机构和利益相关者都有用。我

藤椅
何人来此 在职认证  发表于 2022-5-31 04:26:44
导言。宏观经济状况和系统性风险最重要的驱动因素之一是消费者支出,消费者支出占美国国内生产总值(GDP)的三分之二以上[13]。消费者贷款的机会和风险敞口同样巨大,因此有必要依赖模型和算法,而不是人类的判断力。消费者信用风险评估通常在技术上以数据驱动的方式进行,并已进行了广泛的调查[2]、[9]。作为消费者贷款业务的主要组成部分之一,中小企业(SME)贷款在经济和银行业中的重要性在学术和政策文献[4]、[24]中得到了广泛认可。然而,现有的贷款决策机制落后于业务需求。大多数标准是为主要的独立参与者设计的,而不太正规的中小企业可能会提供不准确或被操纵的信息。为了满足银行的财务安全标准,中小企业群体相互支持。当越来越多的企业参与进来时,它们形成了结构复杂的网络。图1给出了在一个连接网络中与600多个企业绑定在一起的担保网络。如此复杂的网络对国民经济是一把双刃剑。一方面,这些有保障的贷款可以帮助企业在经济增长期间快速获取资金并促进发展。图1:由银行记录形成的真实世界贷款担保网络,每个节点作为一个企业。放大查看更多详细信息。另一方面,虽然复杂的网络可以在经济低迷时期减缓公司违约的风险,但它也可能导致大规模违约并传播感染。对于中小企业的信用风险,已经研究了大量的机器学习方法[6]、[21]、[26]。

板凳
mingdashike22 在职认证  发表于 2022-5-31 04:26:47
由于财务方面的特征不如图像和语音领域的任务高,因此需要具有高解释性和低复杂性的学习算法[14]。K-最近邻(KNN)分类法是最基本、最简单的分类方法之一,在对数据分布知之甚少或一无所知的情况下,它应该是分类研究的首选方法之一【23】。与logistic回归、SVM、随机森林和神经网络相比,它在低维数据上的高性能、易于实现和解释,是金融领域最受欢迎的方法之一。然而,所有上述方法都是在假设每个类的样本数大致相同的情况下设计的。在金融场景中并非如此,贷款违约记录比正常还款要小得多。我们的统计数据显示,只有大约6%的借款人有违约记录。这种高度倾斜的数据集需要定制的数据挖掘算法。基于抽样的方法在工业和学术研究中被广泛使用【16】、【8】、【10】。但这必然会改变整个数据集的分布。包括成本敏感学习(31)和集成学习(29)在内的其他方法存在模型复杂度高、可解释性低的问题。此外,也有一些关于网络保障的研究【17】、【20】,但大多数研究侧重于统计分析【19】或网络的某些结构特征【7】。他们对预测信用风险以及网络风险扩散的研究很少。

报纸
大多数88 在职认证  发表于 2022-5-31 04:26:50
在社会网络文献中,一些研究解决了社会网络上的信息扩散问题【25】、【11】、【27】,但作为一种金融行为,经济网络的风险扩散与社会网络有很大不同。为了应对上述挑战,本文提出了INDDP(不平衡网络扩散缺省预测)。P-wKNN(正加权k-最近邻分类和回归方法)首先提供了丰富的财务特征,包括与网络相关的度量,该方法易于实现,自然设计用于不平衡数据集,无偏差采样。然后,提出了一个概率图模型来模拟网络上的风险扩散。简言之,本文的主要贡献是:1)据我们所知,这是首次使用概率图模型预测担保网络上的信用风险扩散。2) 我们提出了一种新的正加权k-近邻分类和回归概率估计方法,该方法易于实现,自然设计用于不平衡数据,具有较高的解释性。3) 我们提出了一个评估网络担保贷款违约风险的实用解决方案。这比经典的物理扩散模型简单得多,对于预测网络担保数据中的默认值更有效。二、预备工作。我们简要介绍了相关的财务业务流程和功能描述。A、 业务流程。为了获得贷款,借款人需要开立账户并向银行提供详细信息。银行可能不愿发放贷款,因为中小企业很难满足银行为大公司设计的贷款标准。由于中小企业缺乏安全保障,在制定中小企业标准方面存在一些空白。

地板
kedemingshi 在职认证  发表于 2022-5-31 04:26:53
但是,他们可以提供其他公司作为背书。通常,银行需要收集尽可能多的细粒度信息,包括交易信息、客户信息、资产信息(如抵押状态)和贷款批准历史记录。如图2所示,通常有多个担保人或贷款交易,单个担保人可能在一段时间内进行多笔交易。一旦贷款获得批准,中小企业通常会立即获得全部贷款金额,并开始定期分期还款,直到贷款合同到期。我们重构了保证网络图。2: 担保贷款流程。希望获得银行贷款的中小企业(借款人)首先需要与担保人签署担保贷款合同,然后再签署贷款合同。公司将分期偿还贷款。基于九个数据表:客户档案、贷款账户信息、还款状态、担保档案、客户信用、贷款合同、担保关系、担保合同和违约状态。B、 数据描述。我们从中国一家大型商业银行收集三年的贷款记录。记录中的客户姓名被加密并替换为ID;我们可以访问企业规模等基本文件信息,以及担保ID和贷款信用等贷款信息。为了构建一个能够可靠表示客户信息与其还款能力之间统计关系的特征,我们清理了数据并构建了包括以下因素的特征:注册信息:这包括特征、资本、抵押品、能力、条件和稳定性。我们将业务性质、注册资本、企业规模、员工人数等特征作为公司的基本特征。

7
何人来此 在职认证  发表于 2022-5-31 04:26:56
大多数银行要求公司在企业申请贷款时更新这些基本信息;我们使用最新信息。历史行为:包括信用历史记录、违约记录、违约金额、总贷款金额、贷款计数、总贷款频率和总违约率。它们是根据当前贷款记录之前的所有贷款记录计算的。与网络相关的度量:例如,提取中心度。如上所述,基本文件可能不完全可信,因为小企业可能向银行提供过期甚至虚假的信息。然而,有保证的网络提供了可靠的信息,因为银行可以根据自己的记录构建这些信息。三、 算法。由于贷款和还款行为是时间事件,我们收集当前时间窗口中的所有这些事件作为培训数据集,然后预测下一个时间窗口中的违约概率。我们将违约事件定义为借款人未根据贷款合同及时偿还还款的记录。我们解决以下问题:给定:事件流E的子序列-ω、 式中,ω是指定的时间窗口。预测:概率e*下一个时间窗口ω中的默认事件。预测违约可定义为估计条件概率P(e*∈ E+ω| E-ω) 。由于数据不平衡,没有足够的数据来估计准确的条件分布。我们首先通过基于最近邻的定制算法对条件分布进行建模。然后,我们使用生成模型对扩散分布进行建模。A、 默认建模。如前所述,贷款担保是担保人承诺,如果借款人违约,担保人将承担债务义务,违约可能会在病毒感染的情况下通过网络传播。

8
nandehutu2022 在职认证  发表于 2022-5-31 04:26:59
企业违约(不能及时偿还银行)的概率记为P(A),其中A是一家小型企业。P(A)=Ps(A)+(1- Ps(A))·Pg(A)(1),其中Ps(A)是其静态违约可能性,这意味着违约概率是由企业自身状态引起的。Pg(A)是当A的担保违约时,A受到影响的可能性的扩散概率。由于a为其他借款人提供担保,如果借款人违约,a负责偿还债务;这也可能导致违约。Pg(A)旨在表示这种违约概率。Pg(A | x)表示特定担保x违约时的条件可能性。Pg(A)可以通过估算所有担保人的Pg(A | x)和Ps(x)来计算。Pg(A)=1-mYi=1(1- Ps(xi)Pg(A | xi))(2)然后,我们得到函数g(x)=1- x表示简化表示,并定义d- 第i级- 一个in-out度的邻域是NA,d,i。因此,所有距离为a的邻域都小于d- 顺序表示为Od(A)={xi | NA,d,i,i∈ 1:m}。方程式2可表示为:Pg(A)=gYxi公司∈Od(A)g(Ps(xi)Pg(A | xi))(3) 基于方程1和3,我们用以下联合分布近似期望的条件分布。A的联合分布为:P(A)=Ps(A)+g(Ps(A))·gYxi公司∈Od(A)g(Ps(xi)Pg(A | xi))(4) B.推拉窗方案。预测应适应动态设置,并定期更新预测结果。使用滑动窗口是滚动预测的一种典型方式,在事件预测实践中很常见。该业务通常每季度运营一次;因此,从业务需求的角度了解哪些借款人可能会每季度违约是有帮助的。在这项工作中,我们设置了ω天的时间窗口。

9
何人来此 在职认证  发表于 2022-5-31 04:27:02
在训练窗口中提取特征;在观察窗口中收集相应的outcomedefault标签。特性和默认结果用于训练模型。图。3: 滚动滑动窗口协议的图示。在训练窗口中提取特征;相应的结果默认标签收集在observationwindow中。特征和默认结果用于训练模型。训练后的模型用于在预测窗口期间收集输入特征,并在评估窗口结束时验证其性能。训练后的模型用于在预测窗口中收集输入特征,并在到达评估窗口末尾时验证其性能。具体而言,在本文中,我们使用三个月的时间窗口进行培训、观察、预测和评估。如图3所示,在培训阶段,对于从2013年第一季度(2013年第一季度)获得银行贷款的所有客户,将在该期间提取特征,2013年第二季度之间的还款状态是培训模型的标签。在测试阶段,我们使用经过训练的模型预测2013年第二季度期间获得贷款的客户,并使用2013年第三季度的实际还款情况评估达到2013年9月底时的绩效。这种滑动窗口设置有两个原因:1)预测应适应动态设置,并定期更新预测结果。事实上,使用滑动窗口是滚动预测的一种典型方式,通常在事件预测实践中采用,如[28]。2) 根据我们的数据集进行观察并从财务专家那里获得反馈后,该业务通常按季度运营。因此,从业务需求的角度来看,了解哪些借贷者可能会每季度违约将很有帮助。C

10
kedemingshi 在职认证  发表于 2022-5-31 04:27:05
估计参数。为了获得P(A),主要任务是估算Ps(A)和Pg(A | x),如等式4所示。估计Ps(A):估计这种可能性需要预测当前事件序列在未来几天内的演变,因为这会影响违约是否发生。给定当前子序列-ω、 我们设计了一种正加权k-最近邻分类和回归(PwkNN)方法。Naive kNN是一种非参数惰性学习算法,它通过目标样本的前k个最近邻标签来更新目标样本标签。对于极不平衡的样本情况,阴性样本(多数类)比阳性样本更频繁。4: P-wkNN算法示意图。(少数民族阶级)。如何设置k的超参数值是性能和效率之间的权衡,例如,如果k太小,因为负样本可能会压倒其接近正的样本;如果k太大,计算可能太复杂。因此,如果我们得到前k个阳性样本,我们可以更新样本的精确值。图3演示了目标值是否更可能是正示例的算法。当k设置为3,权重设置为相等时,P-wkNN可以预测其值为0.5,而kNN预测为0。在情况b中,预测的实例更有可能是负样本。如果我们将k设置为3,权重设置为相等,则p-wkNN预测为0.15,kNN预测为0。P-wkNN不会受到异常值的影响。该算法的细节描述如下:1)让S={(xi,yi),i=1,2,…,n}作为训练集,并使用类标签yi对观察值进行xibe。让我们进行一次新的观察;我们需要预测它的标签y.2)通过距离函数d(x,xi)找到x的k个最近正邻居。3) 选择k- th正邻域距离σ=d(x,xdk)作为阈值。因此x的定义邻域是N={xi | d(x,xi)≤ σ、 i=1,2。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 22:07