楼主: 大多数88
976 18

[量化金融] 使用LVQ+PSO简化信用评分规则 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.8997
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-5-31 08:39:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Simplifying credit scoring rules using LVQ+PSO》
---
作者:
Laura Cristina Lanzarini, Augusto Villa Monte, Aurelio F. Bariviera,
  Patricia Jimbo Santana
---
最新提交年份:
2017
---
英文摘要:
  One of the key elements in the banking industry rely on the appropriate selection of customers. In order to manage credit risk, banks dedicate special efforts in order to classify customers according to their risk. The usual decision making process consists in gathering personal and financial information about the borrower. Processing this information can be time consuming, and presents some difficulties due to the heterogeneous structure of data. We offer in this paper an alternative method that is able to classify customers\' profiles from numerical and nominal attributes. The key feature of our method, called LVQ+PSO, is the finding of a reduced set of classifying rules. This is possible, due to the combination of a competitive neural network with an optimization technique. These rules constitute a predictive model for credit risk approval. The reduced quantity of rules makes this method not only useful for credit officers aiming to make quick decisions about granting a credit, but also could act as borrower\'s self selection. Our method was applied to an actual database of a credit consumer financial institution in Ecuador. We obtain very satisfactory results. Future research lines are exposed.
---
中文摘要:
银行业的一个关键要素是对客户的适当选择。为了管理信用风险,银行专门根据客户的风险对其进行分类。通常的决策过程包括收集借款人的个人和财务信息。处理这些信息可能非常耗时,并且由于数据的异构结构而带来一些困难。我们在本文中提供了另一种方法,可以从数字和名义属性中对客户档案进行分类。我们的方法称为LVQ+PSO,其关键特征是发现一组简化的分类规则。这是可能的,因为竞争性神经网络与优化技术相结合。这些规则构成了信贷风险审批的预测模型。规则数量的减少使得这种方法不仅对信贷官员有帮助,目的是快速做出信贷发放决策,而且还可以作为借款人的自我选择。我们的方法已应用于厄瓜多尔一家信用消费金融机构的实际数据库。我们取得了非常令人满意的结果。揭示了未来的研究方向。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Simplifying_credit_scoring_rules_using_LVQ PSO.pdf (194.86 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:信用评分 PSO LVQ Applications Quantitative

沙发
mingdashike22 在职认证  发表于 2022-5-31 08:39:54
SIMPLIF YING*信用*评分*规则*与*LVQ+PSO*Laura Cristina Lanzarini和Augusto Villa Monte Universidad National de la Plata,Facultad de Informática,III-LIDI,la Plata,阿根廷Aurelio F.Bariviera商业部,Rovira i Virgili大学,Reus,西班牙,Patricia Jimbo Santana Facultad de Ciencias Administrativas,厄瓜多尔中央大学,基多,皮钦察,厄瓜多尔摘要银行业的关键要素之一在于对客户的适当选择。为了管理信用风险,银行专门根据客户的风险对其进行分类。通常的决策过程包括收集借款人的个人和财务信息。处理这些信息可能非常耗时,并且由于数据的异构结构而带来一些困难。我们在本文中提供了另一种方法,可以从数字和名义属性中对客户档案进行分类。我们的方法称为LVQ+PSO,其关键特征是发现一组简化的分类规则。这是可能的,因为竞争性神经网络与优化技术相结合。这些规则构成了信贷风险审批的预测模型。规则数量的减少使得这种方法不仅对信贷官员有帮助,目的是快速做出信贷发放决策,而且还可以作为借款人的自我选择。我们的方法已应用于厄瓜多尔一家信用消费金融机构的实际数据库。我们取得了非常令人满意的结果。揭示了未来的研究方向。关键词:信用评分、分类规则、学习矢量量化(LVQ)、粒子群优化(PSO)1。

藤椅
可人4 在职认证  发表于 2022-5-31 08:39:57
导言过去60年的经济发展伴随着金融服务的扩展和普及。事实上,消费者贷款现在为许多国家的大部分人口提供了获得某些商品和服务的机会,将付款推迟到将来某个时候。这种消费的“民主化”给金融机构带来了挑战。由于借款人数量相对减少,抵押贷款申请可以以较慢的速度决定,而消费者贷款需要更快的决定程序。借款人希望获得小额贷款,用于购买家庭设备、汽车、旅行等。他们渴望得到一个快速的答案。金融机构希望找到适当的规则,以便只批准好的借款人的信贷申请,即那些偿还其财务承诺的借款人。从借款人的角度来看,他们希望自己的申请得到肯定的答复。2金融机构通常会询问潜在客户的详尽信息:年龄、婚姻状况、工资、其他债务、工作类型等。收集这些信息是为了使用一些决策模型进行分析。此分析的结果是授予或拒绝信用。越来越多的申请者和数据增加了处理这一多维问题复杂性的适当技术的必要性。确切地说,被称为数据挖掘的领域可以揭示这种情况。Lessmann等人(2015)确认,准确预测的商业价值取决于其与公司利润方程的关系。数据挖掘包括一组能够对可用信息建模的技术。这一过程中最重要的阶段之一是知识发现。

板凳
何人来此 在职认证  发表于 2022-5-31 08:40:00
它的特点是在不假设先验假设的情况下获取新的有用信息。决策者首选的技术之一是关联规则。关联规则的一个示例是一个表达式:如果条件1,则条件2,其中两个条件都是形式命题(属性=值)的连接,其唯一限制是前件中的属性不能出现在后件中。当一组关联规则出现在随后的相同属性中时,它被称为一组分类规则(Witten et al.2011,Hernández and Ramírez,2004)。本文的目的有两个。一方面,我们将神经网络与优化技术相结合的分类规则获取方法与两种著名的分类方法进行了比较。另一方面,我们表明,由于决策所需的规则数量减少,提供的解决方案非常直观和简单。减少规则集可以提高金融机构决策过程的透明度。论文的其余部分结构如下。第2节简要讨论了有关信用风险的相关文献。第3节介绍了神经网络、元启发式和所提出的方法。第4节描述了数据并给出了真实实证应用的结果,第5节得出了我们建议的主要含义。2、相关工作研究商业风险的兴趣可以追溯到菲茨帕特里克(1932),他写了破产预测方面最早的论文之一,使用了三年内为40家公司计算的13个会计比率。20世纪60年代,美国资本市场的发展表明,有必要建立更科学的模型来评估企业的经济实力。

报纸
kedemingshi 在职认证  发表于 2022-5-31 08:40:03
因此,Altman(1968)开发了第一个z分数模型。当时,银行主要关注的是根据其信用风险对公司进行分类,因为它们是主要客户。然而,在过去几十年中,消费信贷有所增加。零售银行业是一个不断发展的行业。不仅信用卡会员数量激增,特别是在新兴经济体,而且小额消费信贷也在增加。例如,在新兴经济体中,家庭分期购买家用电器是很常见的。在这些国家,家电商店通常与金融机构联合,以便为客户提供快速决策的信贷额度。此类金融工具的存在有助于促进销售。这种联系产生了利益冲突。一方面,家电商店想向所有客户销售产品。因此,推行慷慨的信贷政策符合其最大利益。另一方面,金融机构希望信贷收入最大化,这导致对贷款损失的严格监控。公平透明的信贷政策有利于家电商店和金融机构之间建立良好的业务关系。制定此类政策的一种方法是制定客观规则,以决定是否批准信贷申请。3有几种方法可以构建规则来评估信用申请人的信用度。最早的方法是基于与Altman(1968)相似的判别分析开发的。然而,计算智能技术产生了更好的结果。

地板
nandehutu2022 在职认证  发表于 2022-5-31 08:40:07
这些技术包括人工神经网络、模糊集理论、决策树、支持向量机、遗传算法等,但并不详尽。人工神经网络是一类具有不同结构的神经网络。这些架构包括流行的模型,如反向传播网络、自组织映射和学习矢量量化。模糊集理论是由Zadeh(1965)的开创性论文发展而来的,其结果在信用分类等没有明确定义边界的情况下非常有用。决策树以树叶和决策节点的树形结构转换数据,目标是测试树的每个分支的属性,这些分支构成一个类。支持向量机搜索最优超平面,以生成二元分类,最大化类之间的间隔。遗传算法是基于自然选择的进化思想来解决优化问题的一组方法。Hand和Henley(1997)强调,由于需要保密,在这一领域发现新的统计技术很困难。更好的技术为金融机构提供了竞争优势,并且不愿意披露此类发现。Freitas(2003)讨论了遗传算法在数据挖掘和分类问题中的应用。Wang等人(2007)提出了一种基于粒子群优化的分类规则挖掘算法。Lessmann等人(2015)发现,人工神经网络的性能优于极限学习机。Abid等人(2016年)使用逻辑回归和判别分析,从2010-2012年期间突尼斯商业银行的数据库中分离出“好”和“坏”借款人。

7
何人来此 在职认证  发表于 2022-5-31 08:40:12
有关财务困境预测的传统统计模型和智能方法的更详细和最新回顾,请参阅Chen等人(2016)及其参考文献。如果目标是获得关联规则,则可以使用先验方法(Agrawal和Srikant,1994)或其一些变体。此方法识别最常见的属性集,然后将它们组合以获取规则。有多种先验方法,通常都是面向减少计算时间。根据主题分类规则,文献中包含基于树的各种构造方法,例如C4.5(Quinlan,1993)或修剪树作为部分方法(Frank和Witten,1998)。在这两种情况下,关键是要获得一组规则,涵盖满足预设错误界限的示例。从树中构造规则的方法是分区的,并基于不同属性的度量来评估其覆盖错误界的能力。3、方法提出了一种基于粒子群优化(PSO)的混合规则确定方法。有使用PSO获取规则的方法(Wang等人,2007)。然而,当使用标称属性进行操作时,需要有足够数量的示例来覆盖搜索空间的所有区域。如果这种情况不可行,其后果是种群初始化不良,导致过早收敛。在减少周转时间的同时,绕过此问题的一种方法是从竞争LVQ神经网络(学习矢量量化)中获取初始状态。有一些文献使用粒子群优化算法来确定网络中要使用的竞争神经元的最佳数量,如Hung和Huang(2010)。

8
kedemingshi 在职认证  发表于 2022-5-31 08:40:15
这不是本文的目的,因为我们使用的LVQ网络,虽然之前已经标注了维数,但它可以根据训练集中示例的比例估计每个类要使用的神经元数量。4.3.1。学习矢量量化(LVQ)学习矢量量化(LVQ)是一种基于质心或原型的监督分类算法(Kohonen,1990)。它可以解释为一个三层竞争神经网络。第一层只是一个输入层。第二层是比赛进行的地方。第三层执行分类。竞争层中的每个神经元都有一个与输入示例相同维度的相关数字向量,以及一个指示它们将表示的类的标签。这些向量在自适应过程结束时将包含有关分类原型或质心的信息。训练算法有不同的版本。我们将描述本文中使用的方法。启动算法时,应指示一定数量的K个质心。这允许定义网络架构,因为输入和输出的数量是由问题定义的。以K个随机示例初始化质心。然后,一次输入一个示例,以适应质心的位置。为此,使用预设的距离度量值确定与示例最近的质心。由于这是一个有监督的过程,因此可以确定示例和质心是否对应于同一类。如果质心和示例属于同一类,则要移动的质心将更靠近示例,以加强表示。相反,如果类不同,则质心会从示例中移开。

9
nandehutu2022 在职认证  发表于 2022-5-31 08:40:18
这些动作使用系数或适应率执行。重复此过程,直到更改小于预设阈值,或者直到在两个连续迭代中使用相同的质心识别示例,以先到者为准。在本文使用的实现中,我们还检查了第二个最近的质心,如果它属于示例的不同类别,并且距离第一个质心的距离小于1.2倍,则将其移开。Kohonen等人(2001年)可参考LVQ的几种变体。3.2。粒子群优化(PSO)是由Kennedy和Eberhart(1995)提出的一种基于种群的元启发式算法。其中,群体中的每个个体(粒子)代表了问题的可能解决方案,并适应以下三个因素:环境知识(适应值)、历史知识或过去经验(记忆)以及位于其附近的个体的历史知识或以往经验(社会知识)。PSO最初被定义为处理连续空间。为了在离散空间上操作,需要考虑一些预防措施。Kennedy和Eberhart(1997)定义了PSO方法的二进制版本。后一种方法的核心问题之一是,它很难从0变为1,一旦稳定,就很难从1变为0。这导致了二进制PSO的不同版本,以提高探索能力。特别是,这项工作将使用Lanzarini等人(2011)定义的变体。在对标称属性和数字属性进行操作时,使用PSO获取分类规则需要上述方法的组合。

10
可人4 在职认证  发表于 2022-5-31 08:40:21
之所以如此,是因为有必要说明哪些属性将是先行项的一部分,以及它可能具有哪些值或值的范围(离散空间和连续空间的组合)。由于这是一种群体技术,因此应分析群体中每个个体所需的信息。应在代表单个规则或每个人的完整规则集之间做出决定。同时,应选择每个规则的表示方案。考虑到这项工作的目的,我们遵循Venturini(1993)开发的迭代规则学习(IRL)5方法,其中每个人代表一条规则,解决方案由在一系列执行中获得的最佳个体构造而成。因此,使用这种方法意味着人口技术将反复应用,直到达到所需的覆盖率,从而为每次迭代获得一条规则:人口中的最佳个体。还决定使用固定长度表示法,其中仅对规则的先行项进行编码,并且在这种方法下,迭代过程会将总体中的所有个体与默认类相关联,而不需要对随后的类进行编码。关于每个人的适应度,它取决于两件事:首先是表示规则的重要性(基于其支持度和置信度),其次是大小(先行项中使用的属性相对于属性总数的比例)。Lanzarini等人(2015b)详细描述了粒子群算法在获取分类规则方面的应用。3.3。LVQ+PSO。提出的获取规则的方法通过迭代过程获得规则,该过程分析每个类中未包含的示例,从填充更多的类开始。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 01:49