楼主: 何人来此
537 8

[量化金融] 稳健的金融风险分类 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-6-11 05:07:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Robust Classification of Financial Risk》
---
作者:
Suproteem K. Sarkar, Kojin Oshiba, Daniel Giebisch, Yaron Singer
---
最新提交年份:
2018
---
英文摘要:
  Algorithms are increasingly common components of high-impact decision-making, and a growing body of literature on adversarial examples in laboratory settings indicates that standard machine learning models are not robust. This suggests that real-world systems are also susceptible to manipulation or misclassification, which especially poses a challenge to machine learning models used in financial services. We use the loan grade classification problem to explore how machine learning models are sensitive to small changes in user-reported data, using adversarial attacks documented in the literature and an original, domain-specific attack. Our work shows that a robust optimization algorithm can build models for financial services that are resistant to misclassification on perturbations. To the best of our knowledge, this is the first study of adversarial attacks and defenses for deep learning in financial services.
---
中文摘要:
算法是高影响力决策中越来越常见的组成部分,越来越多关于实验室环境中对抗性示例的文献表明,标准机器学习模型并不可靠。这表明,现实世界的系统也容易受到操纵或错误分类的影响,这尤其对金融服务中使用的机器学习模型构成了挑战。我们使用贷款等级分类问题来探索机器学习模型如何对用户报告数据的微小变化敏感,使用文献中记录的对抗性攻击和原始的特定领域攻击。我们的工作表明,稳健的优化算法可以为金融服务建立抗误分类干扰的模型。据我们所知,这是针对金融服务领域深入学习的对抗性攻击和防御的首次研究。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--
一级分类:Computer Science        计算机科学
二级分类:Cryptography and Security        密码学与安全
分类描述:Covers all areas of cryptography and security including authentication, public key cryptosytems, proof-carrying code, etc. Roughly includes material in ACM Subject Classes D.4.6 and E.3.
涵盖密码学和安全的所有领域,包括认证、公钥密码系统、携带证明的代码等。大致包括ACM主题课程D.4.6和E.3中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--

---
PDF下载:
--> Robust_Classification_of_Financial_Risk.pdf (1.25 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:风险分类 金融风险 Applications Cryptography Optimization

沙发
大多数88 在职认证  发表于 2022-6-11 05:07:45
稳健的金融风险分类Suprotem K.Sarkar*马萨诸塞州坎布里奇哈佛大学计算机科学系02138suproteemsarkar@g.harvard.eduKojinOshiba*计算机科学系哈佛大学剑桥分校,马萨诸塞州02138kojinoshiba@college.harvard.eduDanielGiebisch*计算机科学系哈佛大学剑桥分校,马萨诸塞州02138danielgiebisch@college.harvard.eduYaron马萨诸塞州剑桥哈佛大学计算机科学系SingerDepartment of Computer Sciences02138yaron@seas.harvard.eduAbstractand越来越多关于实验室环境中对抗性示例的文献表明,标准机器学习模型并不可靠。这表明,现实世界的系统也容易受到操纵或错误分类的影响,这尤其对金融服务中使用的机器学习模型构成了挑战。我们使用贷款等级分类问题来探索机器学习模型如何对用户报告数据的微小变化敏感,使用文献中记录的恶意攻击和原始的领域特定攻击。我们的工作表明,稳健的优化算法可以为金融服务构建模型,以抵抗对扰动的错误分类。据我们所知,这是针对金融服务领域深入学习的对抗性攻击和防御的首次研究。1简介在本文中,我们探讨了依赖机器学习的算法决策系统的鲁棒性。近年来,机器学习已成为金融决策系统的一个组成部分[,,,],通常用于预测贷款违约和确定利率。易受操纵。

藤椅
可人4 在职认证  发表于 2022-6-11 05:07:48
对于图像分类,最近的研究表明,最先进的深度学习模型可能会被愚弄,通过添加小的(尽管很小心)来输出错误的图像标签。社区致力于开发对对抗性操作具有鲁棒性的图像分类器。对于金融应用,如预测贷款违约以确定利率,如果输入数据中的小扰动可能导致这些模型中错误分类的可能性提高,则个人可能会被激励操纵数据:1。输入数据的微小扰动是否会导致分类错误?2、稳健的分类能帮助金融服务中使用的机器学习模型在受干扰的例子中表现更好吗?*Equal ContributionNIPS 2018金融服务业人工智能挑战与机遇研讨会:公平、可解释性、准确性和隐私的影响,加拿大蒙特勒尔。arXiv:1811.11079v1【stat.ML】2018年11月27日请注意,每个特征平均变化1.3%会导致95%的示例出现错误分类。表明稳健优化技术可用于培训对此类金融服务稳健的分类师,并获得以下结果:o95%的输入为1.3%(图1);o低资源信息操纵器。我们表明,当模型以最大值目标进行评估时,我们的稳健分类器的准确率比基准提高了20%。1.1论文组织在第2节中,我们讨论了我们的贷款等级分类和对抗性扰动方法,并描述了我们的稳健优化算法。在第3节中,我们评估了误分类效应交叉扰动类型。

板凳
mingdashike22 在职认证  发表于 2022-6-11 05:07:51
最后,在第4节中,我们展示了使用我们的鲁棒分类算法进行训练的结果。2方法在本节中,我们介绍了数据集、扰动和本文中使用的鲁棒优化算法。2.1 LendingClub数据多个用户输入的功能,以便通过平台实现从A到G的比传统等级更准确的信用评估,其中A分配最低利率(5-8%)和Gloan等级,以显示对抗性干扰可能影响预期结果的显著程度。我们训练神经网络作为LendingClub构建的分类系统的代理,因为我们无法访问该服务自己的专有模型。具体而言,我们通过训练神经网络从44个连续特征(包括FICO分数、债务收入比和贷款收入比)和6个离散特征(包括状态和负债状态)预测贷款等级。我们的网络使用2个大小分别为100和60的密集ReLU层,其中衰减为0.2,最后使用softmax层来定义7个可能的贷款等级的预测。该体系结构基于安徒生的体系结构,以解决这一分类问题[9]。我们实现了94.46%的测试准确率。2.2干扰类型根据直觉,在预算足够小的情况下,输入中的任何干扰都是“无意义的”,在应用干扰之前,培训和干扰程序中的每个特征。这与贷款等级预测相关,但并非来自相同的支持。快速梯度符号法(FGSM)在损失梯度方向上扰动输入L(θ,x,y)θxy产生扰动x*= x+ 标志(xL(θ,x,y))。与符号[]相反的投影梯度下降(PGD)。此外,在每一步都会重新计算梯度。每个迭代的最大扰动由一个参数剪裁.

报纸
大多数88 在职认证  发表于 2022-6-11 05:07:54
PGD迭代生成扰动样本x*i(达到最大阶跃x*N) ,遵循程序*= x、 x个*i=夹子(十)*我-1+ (x个*我-1L(θ,x*我-1,y)))。基于Jacobian的显著性映射攻击(JSMA)会影响目标标签的丢失[]。JSMA贪婪地增加了j类目标labelFj(x)的概率,显著性图定义为asS(x,t)[i]=(0,如果英尺(x)xi<0或j6=tFj(x)xi>0(英尺(x)xi)| Pj6=tFj(x)xi |,otherwiseJSMA通过持续扰动对显著性影响最大的特征进行扰动.最大显著性攻击(MSA)是我们提出的一种攻击。这种攻击模仿自我报告操作,我们分别以设定的百分比增加或减少对每个特征的扰动,并发现哪种情况下的扰动是由不知道神经网络梯度但可以更改少量特征的代理造成的。算法1 Oracle效率不当稳健优化【12】1:输入:目标L={L,…,Lm},Apx贝叶斯Oracle M,参数T,η2:对于T=1到T do3:wt【i】∝ expηPt公司-1τ=1Li(hτ)4: ht=M(wt)5:结束6:输出:在{h,…,ht}上均匀分布2.3稳健优化算法为了使我们的贷款等级预测分类对这些扰动更加稳健,我们训练我们的模型是,给定一个模型(例如神经网络)和一组扰动,算法可以识别训练。D=(D,…,Dm)L={L,…,Lm}希望在最坏的情况下使损失最小化,即τ=minh∈Hmaxi公司∈[m] Li(h)。在本文的其余部分,我们称之为瓶颈损失。此外,我们假设我们得到了一个α-近似贝叶斯oracleM。也就是说,M(D)可以找到假设h*α-近似于最小预期风险~D[L(h*)] ≤ αminh∈HEL公司~D【L(h)】在我们的设置中,L对应于模型在不同扰动下的损失。

地板
可人4 在职认证  发表于 2022-6-11 05:07:58
此外,我们假设在扰动下训练的神经网络是一个α-近似贝叶斯预言。游戏具体而言,该算法在(算法1)上运行乘法权重更新(MWU)。每次迭代,它都会对损失更大的扰动赋予更多的权重。η=plog(m)/2Th*=TPTt=1htsatis fiesmax∈[m] Li(h*) ≤ αminh∈Hmaxi公司∈[m] Li(h)+r2 log(m)t换句话说,该模型可以对扰动分布具有鲁棒性,具有相同的α乘性因子损失,并且随着迭代次数的增加,加性误差变为零。3扰动评估调整并评估更改预测标签的成功性。随着扰动预算的增加,我们评估了扰动列车示例被错误分类的程度。我们发现,小扰动可以有效地通过少量扰动数据来改变贷款类别(图2)。特别是,JSMA展示了针对显著影响神经网络贷款类别预测的特定特征的能力。FGSM基于对所有特征进行恒定量的扰动,与其他方法相比,FGSM在预算扰动大小方面更为不足。PGD可能通过不干扰显著性较低的特征来实现更高的干扰效率。1-MSA只改变了申请人的贷款收入比,尽管受到限制,但表现相当不错。MSA并没有利用神经网络的梯度,这使得它和其他网络相比处于明显的优势。然而,MSA表明,即使是单个预选变量中的一个小变化也很容易影响贷款类别分类。贷款申请图2:(A):对预先训练的分类模型的干扰。横轴是扰动特征的平均百分比变化。

7
何人来此 在职认证  发表于 2022-6-11 05:08:01
纵轴是在小扰动下错误分类的原始正确分类样本的比率。(b) :三个输入的单个扰动高达4%,导致toB贷款等级发生变化的示例。图3:(a):回报矩阵,表示稳健优化算法的robust10迭代所解决的最小-最大问题。显著更好的结果。总的来说,MSA表明,传统的基于梯度的方法对于成功的误分类不需要产生小的扰动。4稳健分类我们的实验表明,[]中引入的稳健优化算法提高了我们的贷款等级预测模型的性能。具体而言,我们使用第2.2节训练神经网络模型,以及无扰动(称为无)的原始数据集。特别是,这是一个两人游戏,其中一个玩家将玩家分类为策略,另一个玩家将扰动类型作为策略。图3a显示了在这种贷款预测优化中进行的特定博弈的收益矩阵。可以很容易地看出,如果行玩家与在特定扰动数据集上训练的分类者进行交流,列玩家可以很容易地选择不同的扰动类型,从而导致错误分类。这推动了算法1的使用,算法1本质上是估计排球员在不同分类上的最佳混合策略。算法的评估基于第2.3节中介绍的瓶颈损失。基线是具有固定均匀分布的训练,这意味着我们不会在算法的每次迭代中更新扰动类型的分布。这可以看作是图3a中对行策略的统一随机化。稳健优化的结果如图3b所示。

8
何人来此 在职认证  发表于 2022-6-11 05:08:04
横轴是迭代次数(Tin算法1)。对于顶部图,纵轴是瓶颈损失,对于顶部图,瓶颈损失从1.0增加到0.6,瓶颈精度从50%增加到70%。用稳健优化算法训练的贷款等级预测模型对扰动具有更强的鲁棒性。5结论据我们所知,我们介绍了对金融服务中使用的神经网络进行对抗性攻击和防御的第一种治疗方法。虽然输入数据中的小扰动会导致贷款评级与预期的一样,但这些输入与模型训练时使用的输入略有不同。强大的培训输入或信息操纵器。该领域的未来工作将受益于对可变特征和扰动程度的可行集合的更多探索。通过更好地理解可行扰动集和跨问题类型的更强决策边界。此外,分析不同类别的个体是否存在弱决策边界,有助于突出公平性或差异稳健性问题。最后,进一步探索跨金融服务领域的非实验室领域将有助于更好地展示如何在实践中运用稳健性。参考文献【1】魏宝、君悦和饶玉磊。使用堆叠自动编码器和长-短期记忆的金融时间序列深度学习框架。PloS one,12(7):E01809442017。[2] John Alberg和Zachary C Lipton。通过预测公司基础设施,改进基于因素的定量投资。arXiv预印本arXiv:1711.048372017。[3] 贾斯汀·西里加诺、阿帕尔·萨德瓦尼和凯·吉塞克。深入学习抵押贷款风险。arXiv预印本XIV:1607.024702016。[4]2017.[5] 罗伯·弗格斯。神经网络的有趣特性。arXiv预印本arXiv:1312.61992013。[6] 抗对抗性攻击的深度学习模型。

9
何人来此 在职认证  发表于 2022-6-11 05:08:07
arXiv预印本arXiv:1706.0608320017。[7] 在对抗环境中深度学习的局限性。《安全与隐私》(EuroS&P),2016年IEEEEuropean研讨会,第372–387页。IEEE,2016年。[8] LendingClub贷款数据。https://www.lendingclub.com/info/download-data.action, 2018.[9] 詹姆斯·安徒生。用神经网络预测贷款等级:aws上的机器学习管道。2018年中期。[10] arXiv预印本arXiv:1412.65722014。[11] ACM,2018年。[12] 目标。《神经信息处理系统的进展》,第4708–47172017页。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-3 07:07