楼主: 何人来此
1077 33

[量化金融] 支票账户活动与企业信用违约风险 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-6-1 02:11:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Checking account activity and credit default risk of enterprises: An
  application of statistical learning methods》
---
作者:
Jinglun Yao, Maxime Levy-Chapira, Mamikon Margaryan
---
最新提交年份:
2017
---
英文摘要:
  The existence of asymmetric information has always been a major concern for financial institutions. Financial intermediaries such as commercial banks need to study the quality of potential borrowers in order to make their decision on corporate loans. Classical methods model the default probability by financial ratios using the logistic regression. As one of the major commercial banks in France, we have access to the the account activities of corporate clients. We show that this transactional data outperforms classical financial ratios in predicting the default event. As the new data reflects the real time status of cash flow, this result confirms our intuition that liquidity plays an important role in the phenomenon of default. Moreover, the two data sets are supplementary to each other to a certain extent: the merged data has a better prediction power than each individual data. We have adopted some advanced machine learning methods and analyzed their characteristics. The correct use of these methods helps us to acquire a deeper understanding of the role of central factors in the phenomenon of default, such as credit line violations and cash inflows.
---
中文摘要:
信息不对称的存在一直是金融机构关注的主要问题。商业银行等金融中介机构需要研究潜在借款人的素质,以便对企业贷款做出决策。经典方法使用logistic回归,通过财务比率对违约概率进行建模。作为法国主要商业银行之一,我们可以访问公司客户的账户活动。我们表明,这种交易数据在预测违约事件方面优于经典财务比率。由于新数据反映了现金流的实时状态,这一结果证实了我们的直觉,即流动性在违约现象中起着重要作用。此外,这两个数据集在一定程度上相互补充:合并后的数据比每个单独的数据具有更好的预测能力。我们采用了一些先进的机器学习方法,并分析了它们的特点。正确使用这些方法有助于我们更深入地了解违约现象中的核心因素的作用,如违反信贷额度和现金流入。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
--> Checking_account_activity_and_credit_default_risk_of_enterprises:_An_application.pdf (477.72 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:企业信用 违约风险 Quantitative Applications Institutions

沙发
nandehutu2022 在职认证  发表于 2022-6-1 02:11:38
支票账户活动和企业信用违约风险:统计学习方法的应用姚景伦*, Maxime LEVY-CHAPIRA+,Mamikon MARGARYAN2017年7月5日摘要不对称信息的存在一直是金融机构关注的主要问题。商业银行等金融中介机构需要研究潜在借款人的素质,以便对企业贷款做出决策。经典方法使用logistic回归通过财务比率对违约概率进行建模。作为法国主要商业银行之一,我们可以访问corporateclients的账户活动。我们表明,该交易数据在预测违约事件方面优于经典财务比率。由于新数据反映了现金流的实时状态,这一结果证实了流动性在违约现象中起着重要作用的直觉。此外,这两个数据集在一定程度上是相互补充的:合并后的数据比单个数据具有更好的预测能力。我们采用了一些先进的机器学习方法,并分析了它们的特点。正确使用这些方法有助于我们更深入地了解违约现象中核心因素的作用,如信贷额度违规和现金流入。信息系统的存在是金融机构面临的一个不可抗力问题。金融机构、商业电视台、研究企业在商业决策中的潜力。金融机构利用回归逻辑调整财务比率的方法。法国商业银行(principale banque commerciale en France)在商业客户活动中提供的辅助信息。

藤椅
nandehutu2022 在职认证  发表于 2022-6-1 02:11:42
Nousmontrons que les données transactionnelles的业绩超过了《金融监管条例》规定的财务比率。新的社区需要对临时性工作进行调整,以确保不存在流动性问题。此外,我们还将在两个基础上进行综合评估:基础融合,以确保基础个人的表现。我们的雅芳采用了多种多样的方法来评估统计数据。使用适当的方法来帮助企业进行全面的管理,以防止违反法律规定。*Ecole Polytechnique学生+法国兴业银行量化风险项目经理+法国兴业银行信贷风险建模负责人1简介正如Mishkin和Eakins(2006)指出的那样,信息不对称是金融机构存在的核心问题之一。商业银行等金融中介机构在金融体系中发挥着重要作用,因为它们可以降低交易成本,分担风险,解决信息不对称带来的问题。实现这一角色的最重要渠道之一是对潜在企业借款人的质量进行有效分析。银行需要区分可靠的借款人和不可靠的借款人,以便对公司贷款做出决策。从银行的角度来看,这减少了与公司违约相关的损失,同时对整个经济也有好处,因为资源被有效地归因于突出的项目。Altman(1968)、Beaver(1966)和Ohlson(1980)是使用统计模型预测违约的先驱。

板凳
kedemingshi 在职认证  发表于 2022-6-1 02:11:45
他们使用了根据资产负债表和损益表计算的财务比率。他们的鼓舞人心的工作得到了广泛认可,事实证明,该方法已成为许多金融机构信用风险建模的标准。然而,人们可能会怀疑,违约现象是否可以用财务比率来“解释”。直觉上,当企业的现金流不再可持续时,就会发生违约。一家公司的财务结构很可能是即将发生的违约的结果,而不是违约的原因,因为该公司可能有义务在现金流不足时出售其部分资产。Leland(2006)区分了两种信用风险模型:结构模型和统计模型(或简化模型)。他认为,上述统计模型并不是直接基于企业的现金流或价值,而是根据经验估计违约的“跳跃率”。此外,简化模型不允许对企业违约决策或其最佳财务结构决策进行综合分析。另一方面,结构模型,如Black和Scholes(1973)、Merton(1974)和Longsta off等人(2005)提出的模型,将违约与公司证券的价值联系起来,因为公司证券的估值取决于其未来的现金流,而反过来又取决于公司的运营现金流。证券市场价值的差异模型允许我们研究现金流的演变,从而研究违约概率。这一建议很有见地,但并没有为商业银行及其公司客户提供切实可行的方法。大多数中小企业不出售上市证券。对于这些公司来说,使用基于公司证券的结构模型是完全不可能的。

报纸
mingdashike22 在职认证  发表于 2022-6-1 02:11:48
然而,幸运的是,商业银行以另一种方式掌握了现金流的信息。公司客户不仅从银行借款,而且在这些银行开立支票账户。Norden和Weber(2010)证明,在违约事件发生前大约12个月,信贷额度使用、限额违规和现金流入表现出异常模式。对账户活动的衡量实质上改善了违约预测,尤其有助于监控小企业和个人。这是规模经济的另一个很好的例子,在这种经济中,银行与InitSelf共享信息,以实现更好的全球绩效。我们不使用结构模型,而是选择使用一些统计学习方法,与经典logistic回归相比,这些方法大大提高了预测性能。这一选择是因为在第一阶段很难构建一个结构模型,同时给出一个总体图像和良好的预测。使用支票账户信息解释默认设置的文献有限。通过使用统计学习方法,我们可以根据经验判断哪些变量在违约预测中最重要。这可以帮助我们在下一阶段构建结构模型。另一方面,如果我们只对预测感兴趣,那么简化形式的模型就足以满足我们的需求。然而,我们应该强调,机器学习方法的应用并不能消除经济理解的必要性。正如我们将要展示的那样,构建有意义的经济变量是机器学习必不可少的初步步骤。更重要的是,机器学习给出的“重要变量”应该谨慎对待。Strobl等人。

地板
nandehutu2022 在职认证  发表于 2022-6-1 02:11:51
(1993)重申CART中的变量选择(分类和回归树)受信息内容以外的特征的影响,例如,首选类别更多的变量。为了解决这个问题,Strobl等人(2007)提出了一种基于精确分布假设的无偏分割选择。与所有精确程序一样,此方法计算量太大。Hothornet等人(2006)提出了一种更为简洁的算法,即条件分类树(ctree),该算法基于Strasser和Weber(1999)开发的置换测试框架。此外,基于ctree构建了无偏随机林(条件随机林,简称cforest)。但是,对于我们的数据来说,森林仍然太重,无法执行。此外,随机森林意义上的无偏性是否对其他机器学习方法仍有价值尚不清楚。也就是说,在任何统计方法中,找到包含相同信息水平的具有普遍价值的变量子集都是有争议的。我们将比较通过boosting、逐步选择和lasso选择的变量,而不是使用这些计算昂贵的方法。对这些机器学习方法的透彻理解有助于解释模型选择。我们首先介绍基本的随机林和boosting,以及一些重要的修改,以适应数据中的特征。第3节比较了三种处理支票账户数据的方法,说明了有经济意义的变量的重要性,并展示了机器学习方法的一些特殊性。第4节将财务比率和问卷的绩效与账户数据的绩效进行比较,将这两个数据结合起来,以实现更好的预测绩效。

7
mingdashike22 在职认证  发表于 2022-6-1 02:11:54
第5节选择了三种模型,分别基于AIC、lasso和boosting。我们使用逻辑回归来解释这些最重要变量的边际影响。第6节对文章进行了总结。2随机林和boosting简介2.1分类树对于随机林和boosting,最常用的基本分类是分类树。假设我们想使用两个解释变量X和X对二元变量Y进行分类。图1给出了分类树的示例。这两种图形表示是等效的。树可以表示为形式^f(X)=Xm=1cmI{(X,X)∈ Rm}其中cm∈ {0,1},I是指示符函数。(1) 摘自James et al.(2013)图1——分类树的一个简单示例为了生长一棵树,中心思想是选择损失函数并最小化与树相关的损失函数。Friedman et al.(2001)和James et al.(2013)全面介绍了分类树中最重要的损失标准。我们在研究中使用基尼指数作为损失函数。然而,应该强调的是,找到全局最优解决方案的计算成本太高。相反,在实践中,我们使用“贪婪算法”,该算法接受已构建的部分,并根据该部分搜索最优解。以这种方式生长的树被称为CART(分类和回归树),由Breimanet al.(1984)提出,已成为机器学习中最流行的树算法。tree的优势显而易见:它直观且易于解释。尽管如此,如果模型适度拟合,它对训练集和测试集的预测能力通常很差。

8
可人4 在职认证  发表于 2022-6-1 02:11:57
相反,在机器学习中,通常不会出现与训练集的过度匹配(或过度减少偏差)。集成方法,如随机森林和Boosting,被认为可以解决这个难题。2.2随机森林随机森林旨在减少模型方差,从而提高测试集的预测能力。我们不是种一棵树,而是种一片森林。图2给出了算法的一般描述。实际上,m的最佳值大约为√p表示分类问题,其中p是变量总数。当然,我们可以使用交叉验证来优化此参数的值。m的这个小值乍看起来很奇怪,但实际上它是randomforest的关键。事实上,对于B个相同分布的随机变量,每个变量都具有方差σ和正的空气相关ρ,它们的平均方差为ρσ+1- ρBσ(2)即使有较大的B(随机森林中的树数),我们仍然需要减小ρ以减小平均值的方差。小m的作用是减少树木间的相关性ρ,摘自Friedman et al.(2001)图2–随机森林算法,从而减少模型方差。然而,基本随机森林对我们的数据效果很差,因为它是不平衡的(默认值不到6%)。针对这一特点,有几种补救措施,包括权重调整(Ting(2002))和分层抽样(Chen等人(2004))。我们采用了分层方法,该方法易于实施,并产生了令人满意的结果。而不是在步骤1中对每棵树的uniformlydefault和非默认观测值进行采样。(a) (例如,均匀抽样2/3个观测值),我们取2/3个默认观测值和相等数量的非默认观测值。这种显然很小的修改导致混淆矩阵的极大改善。

9
能者818 在职认证  发表于 2022-6-1 02:12:00
对于包含30个变量的agiven支票账户数据,比较如表2所示。试验曲线分别为78.72%和79.87%。2.3 boosting最常用的boosting版本是AdaBoost(Freund et al.(1996))。与平行种植决策树的随机森林相反,AdaBoost培育了一系列树。如果在之前的树中对观测结果进行了错误分类,则在正确分类之前,其权重将在后面的树中加重。中心思想是直观的,但在Friedman et al.(2000)之前,它只是一种算法,who指出了AdaBoost与加性logistic回归模型之间的内在关系:定理1真正的AdaBoost算法通过J(F)=E[E]的分段和近似优化来建立加性logistic回归模型-yF(x)]。其中,对于两类问题,加性逻辑回归模型定义为具有以下形式:表1–添加标题训练集测试集错误率错误率不平衡平衡不平衡真实值0.057%25.829%真实值0.055%25.588%1 98.861%28.599%1 99.108%27.340%Global 3.830%25.930%Global 3.940%25.660%表2–不平衡和平衡随机变量的错误率森林使用不平衡随机林的训练集和测试集的假阴性率都非常高。相比之下,使用平衡随机林的误差率更为合理。logP(y=1 | x)P(y=0 | x)=MXm=1fm(x)(3)对于增强树,fm是通过权重调整的单个树。根据结果1,增压本质上是一个优化过程。这一见解为xgboost(Friedman(2001)提出的Extremegraient Boosting)铺平了道路,xgboost搜索目标函数的梯度,并有效地实现了Boosting的基本思想。

10
能者818 在职认证  发表于 2022-6-1 02:12:03
此外,boosting和logistic回归之间的密切关系导致了一些有趣的结果,我们将在后面讨论这些结果。2.4机器学习中的过度匹配如果模型很适合训练集,但不适合测试集,那么模型就是过度匹配。在我们的研究中,模型性能标准是AUC(ROC曲线下的面积),它衡量给定模型的辨别力。应该注意的是,AUC不会受到数据不平衡的影响。一些方法,如随机森林,旨在减少模型方差,即通过将训练数据与模型解相关,我们得到了一个对数据变化不太敏感的模型。例如,在平衡随机林中,使用30个支票账户变量解释默认值,我们得到训练集的AUC=79.45%,测试集的AUC=79.85%。Boosting也被认为是以这种方式工作的。但Friedman等人(2000年)指出,助推似乎主要是一种减少偏差的过程。这个结论与我们的实验一致。使用相同的变量,我们得到训练集的AUC=87.45%,测试集的AUC=79.8%。Boosting必然会过度关注模型,但这一特性不会削弱其预测测试集的能力。应该对机器学习方法中的参数进行补充说明。虽然这不是本文的主要关注点,但让机器正确运行仍然至关重要。一个重要参数与模型的复杂性有关,例如,随机林中每个节点分裂的候选变量数量,boosting中的学习步骤数量。交叉验证用于确保适当的复杂性水平,并避免过度匹配。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 21:25