楼主: kedemingshi
2180 60

[量化金融] 基于机器学习的金融信用风险分析 [推广有奖]

51
可人4 在职认证  发表于 2022-6-6 21:31:44
例如,AdaBoost的AUC比ANN高(91.8%,81.0%),但ANN表现出更好的准确性、精确性、召回率和F1得分。当将所有质量度量一起分析时,可以看出非线性分类器往往具有不太一致的度量。例如,SVM报告了良好的AUC和准确度(分别为84.3%和92.6%),但准确度、召回率和F1分数实际上为零,因为分类器预测的所有数据都属于混淆矩阵所示的非破产类别。这可能是由于高维问题的训练数据有限,导致这些高阶非线性分类器过度拟合,从而导致维数灾难。通常,随着特征数量(即维度)的增加,数据数量需要呈指数增长才能保持相同的密度(Verleysen&Francois,2005)。虽然通过降维,与原始论文相比,特征的数量显著减少,但30维空间的5000个数据点仍然相当少。在分析其他质量控制因素后,似乎由于数据量有限和特征数量众多,与更复杂的机器学习算法相比,更简单的分类器,如K-D树和logistic回归(尽管在测试的分类器中AUC最低,但它具有更好的平均质量控制度量)实际上能够更好地概括新数据。在测试数据上,它们的性能具有可比性,逻辑回归的性能稍好,并且需要更少的存储来进行更快的预测。

52
何人来此 在职认证  发表于 2022-6-6 21:31:47
因此,它是该数据集的首选机器学习模型,因为它平衡良好。使用机器学习分析金融信贷风险50 Jacky C.K.Chow-2018年2月表3:波兰破产数据集上不同机器学习方法的质量控制准确性RecisionRecallF1 ScoreAUCLogistic回归66.4%70.4%59.4%64.4%79.9%K-D Tree62.9%66.1%57.0%61.2%96.9%SVM92.6%0.0%0.0%0.0%84.3%DecisionTree51.5%65.4%11.6%19.7%96.1%AdaBoost91.8%14.3%2.3%4.0%91.8%ANN92.4%38.5%5.7%10.0%81.0%GP92.6%0.00.00.082.1%第6章:结论和建议Jacky C.K.Chow-2018年2月51 6结论和建议商业智能是一个快速发展的领域,具有巨大潜力,可以提高全球企业的效率和竞争力地球数据挖掘和机器学习是该领域的有用工具,可以从大数据中提取有价值的信息,以帮助制定业务战略。本文研究了几种流行的现代机器学习算法在预测企业破产方面的应用。这些信息可以帮助政府、投资者、管理者和其他利益相关者做出明智的经济决策,以避免财务损失。对制造业公司的两个非常不同的数据集进行了分析,并与其他研究人员的结果进行了比较。第一个数据集使用六个定性指标来描述韩国公司的经营状况。第二个数据集使用64个定量财务特征来评估波兰公司破产的可能性。本文的结果表明,与数据集2相比,应用于数据集1的所有机器学习算法都具有更好的性能。

53
nandehutu2022 在职认证  发表于 2022-6-6 21:31:50
这可以归因于这样一个事实,即这些来自专家建议的手工特征比财务比率更具表现力。尽管只向金融专家提出了关于每家公司的六个多项选择题,但收集到的数据显示,这两个类别之间的区别更为明显。实际上,决策树分类器只需要使用机器学习52 Jacky C.K.Chow-2018年2月的六个问题中的四个问题来分析金融信贷风险,以检测破产几率高的公司,准确率超过90%。这表明,在未来,可以提出、收集和存储的问题会更少。这些定性度量的信息性是有利的,因为即使在将数据投影到低维子空间进行可视化之后,仍然可以看到两个聚类之间的清晰分离,从而使优化、比较和分析分类方法更加直观。在数据集2中,即使有64个财务比率和一个数量级以上的数据,机器学习算法也很难将公司分类为即将破产或不具有稳健性的公司。然而,与使用大多数公司的资产负债表和损益表中现成的财务比率相比,收集专家意见的成本相当高。考虑到收集大量财务比率的成本通常低于获取专家意见的成本,建议收集更多的数据来训练分类器,以克服维数灾难和缺乏单个特征的表达能力。质量控制还应基于多个绩效指标,而不是依赖于单个分数。

54
大多数88 在职认证  发表于 2022-6-6 21:31:53
如本文所示,当使用单个质量控制指标分析和比较机器学习技术时,结论很容易产生偏差。一般来说,机器学习是金融分析师进行预测和精确发现数据模式的强大工具箱。存在许多不同的模型和验证技术来帮助数据挖掘和决策。很难确定是否有任何机器学习技术优于其他技术。事实上,作为一名数据科学家和/或金融专家,收集不同方法的优点并将其结合起来以做出更好的业务判断可能更为有益。第7章:参考文献Jacky C.K.Chow-2018年2月53 7参考文献Alpaydin,E.(2010)。机器学习导论。第二版。美国剑桥:麻省理工学院出版社。Aziz,M.,&Dar,H.(2006)。预测企业破产:我们的立场?《公司治理》,6(1),18-33。Beaver,W.(1966年)。财务比率作为失败的预测因素。《会计研究杂志》,4,71-111。Bellovory,J.、Giacomino,D.、Akers,M.(2007)。破产预测研究述评:1930年至今。《金融教育杂志》,33,87-114。Berg,M.、Cheong,O.、Kreveld,M.、Overmars,M.(2008)。计算几何(第3版)。施普林格·维拉格(Springer Verlag Berlin Heidelberg)。Bishop,C.(2006年)。模式识别和机器学习。美国纽约:斯普林格。Chawla,N.、Bowyer,K.、Hall,L.、Kegelmeyer,W.(2002)。SMOTE:合成少数超采样技术。《人工智能研究杂志》,16321-357。Chen,H.、Chiang,R.,&Storey,V.(2012)。商业智能和分析:从大数据到大影响。

55
能者818 在职认证  发表于 2022-6-6 21:31:56
MIS季刊:商业智能研究专刊,36(4),1165-1188。Chen,N.、Ribeiro,B.,&Chen,A.(2016)。金融信用风险评估:最近的回顾。《人工智能评论》,45(1),1-23。使用机器学习分析金融信贷风险54 Jacky C.K.Chow-2018年2月Columbus,L.(2016)。2016年,机器学习正在重新定义企业。美国纽约:福布斯。Davalos,S.,Gritta,R.,和Adrangi,B.(2007)。推导预测航空公司财务压力和破产的规则:遗传算法方法。《交通研究论坛杂志》,46(2),40-54。Davenport,T.,&Patil,D.(2012)。数据科学家:21世纪最性感的工作。美国沃特敦:哈佛商业评论:10月。de Andrés,J.、Landajo,M.、Lorca,P.(2012)。基于多范数分析的破产预测模型:会计比率的替代方案。基于知识的系统,30,67-77。Deakin,E.(1972)。商业失败预测因素的判别分析。《会计研究杂志》,10(1),167-179。Demyanyk,Y.,&Hasan,I.(2010)。金融危机与银行倒闭:预测方法综述。欧米茄,38315-324。du Jardin,P.(2009年)。破产预测模型:如何选择最相关的变量?《银行家、市场与投资者》,98,39-46。Ellis,D.(2008)。雷曼兄弟倒闭震惊全球市场。美国亚特兰大:有线新闻网(CNN)。F"orstner,W.,&Wrobel,B.(2016)。摄影测量计算机视觉。瑞士查姆:斯普林格国际出版社。Freund,Y.,&Schapire,R.(1997)。在线学习的决策论推广及其在boosting中的应用。《计算机与系统科学杂志》,55(1),119-139。Guzman,A.(1999年)。

56
nandehutu2022 在职认证  发表于 2022-6-6 21:31:59
国际破产:为普遍主义辩护。从伯克利法律奖学金库检索:http://scholarship.law.berkeley.edu/facpubs/1758Haldeman,R.、Altman,E.、Narayanan,P.(1977)。Zeta分析:识别公司破产风险的新模型。《银行与金融杂志》,1,29-35。霍特林,H.(1933年)。将统计变量组合成主成分的分析。《教育心理学杂志》,24417-441。第7章:参考文献Jacky C.K.Chow-2018年2月55 James Wilson,H.,Mulani,N.,&Alter,A.(2016)。销售人员进行了机器学习改造。美国剑桥:麻省理工学院斯隆管理评论。Jereza,J.、Molinab,I.、García-Laencinac,P.、Albad,E.、Ribellesd,N.、Martíne,M.、Francoa,L.(2010)。在实际乳腺癌问题中使用统计和机器学习方法进行缺失数据插补。《医学中的人工智能》,50(2),105–115。Kaski,S.、Sinkkonen,J.,&Peltonen,J.(2001)。在学习度量中使用自组织映射进行破产分析。IEEE神经网络学报,12(4),936-947。Kim,M.&Han,I.(2003)。利用遗传算法从定性破产数据中发现专家决策规则。《专家系统与应用》,25637-646。Li,M.,&Miu,P.(2010)。基于会计比率和市场信息动态加载的混合破产预测模型:二元分位数回归方法。《经验金融》,17818-833。马孔科,R.(2013年2月21日)。欧盟的跨境破产法。检索自欧洲议会:http://www.europarl.europa.eu/RegData/bibliotheque/briefing/2013/130476/LDM_BRI(2013)130476\\u REV1\\u EN。pdf Martin,D.(1977年)。银行破产预警。

57
kedemingshi 在职认证  发表于 2022-6-6 21:32:02
《银行与金融杂志》,7249-276。Meyer,P.,&Pifer,H.(1970)。银行倒闭预测。《金融杂志》,25(4),853-868。Murphy,K.(2012)。机器学习:概率视角。美国剑桥:麻省理工学院出版社。Newton,G.(2003)。企业破产:工具、策略和选择。美利坚合众国纽约:Wiley。Nocedal,J.,&Wright,S.(2006)。数值优化。第二版。美国纽约:斯普林格。Ohlson,J.(1980)。财务比率和破产概率预测。《会计研究杂志》,18(1),109-131。使用机器学习分析金融信贷风险56 Jacky C.K.Chow-2018年2月Pe~na,T.、Martínez,S.、Abudu,B.(2011)。破产预测:一些统计和机器学习技术的比较。《经济动力学计算方法》,13,109-131。Philosophov,L.、Batten,J.、Philosophov,V.(2007)。利用财务比率和长期债务到期时间表预测破产事件和时间范围。2005年全民教育莫斯科会议文件。Rasmussen,C.,&Williams,C.(2006)。机器学习的高斯过程。美国剑桥:麻省理工学院出版社。Shell,A.(2009年)。雷曼兄弟的倒闭引发了经济动荡。美国纽约市:美国广播公司(ABC)。孙,J.,贾,M.,&李,H.(2011)。财务困境预测的AdaBoost集成:与中国上市公司数据的实证比较。专家系统及其应用,38(8),9305-9312。Train,K.(2004)。模拟离散选择方法。英国剑桥:剑桥大学出版社。Trustorff,J.、Konrad,P.、Leker,J.(2011)。使用支持向量机进行信用风险预测。

58
大多数88 在职认证  发表于 2022-6-6 21:32:07
《定量财务与会计评论》,36(4),565-581。Tung,F.(2001年)。国际破产可能吗?《密歇根国际法杂志》,23(1),31-101。美国法院。(2016年7月27日)。2016年6月破产申请下降6.9%。检索自http://www.uscourts.gov/news/2016/07/27/june-2016-bankruptcy-filings-down-69-percentVerleysen,M.,&Francois,D.(2005)。数据挖掘和时间序列预测中的维数灾难。第八届人工神经网络国际研讨会(第758-770页)。西班牙巴塞罗那:计算机科学课堂讲稿。West,R.(1985)。银行状况的因子分析法。《银行与金融杂志》,9253-266。White,M.(1989年)。公司破产决定。《经济展望杂志》,3(2),129-151。第7章:参考文献Jacky C.K.Chow-2018年2月57 Williams,M.(2010)。无法控制的风险:雷曼兄弟的教训以及系统性风险如何仍能拖垮世界金融体系。美国纽约市:麦格劳·希尔教育公司。Wilson,R.,&Sharda,R.(1994)。利用神经网络进行破产预测。决策支持系统,11545-557。Yang,Z.,Platt,M.,&Platt,H.(1999)。破产预测中的概率神经网络。商业研究杂志,44(2),67-74。Zieba,M.,Tomczakb,S.,和Tomczaka,J.(2016)。集成增强树的合成特征生成在破产预测中的应用。专家系统与应用,58,93-101。使用机器学习分析金融信贷风险58 Jacky C.K.Chow-2018年2月8附录附录1:韩国破产数据集特征。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。59附录2:波兰破产数据集特征。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

59
可人4 在职认证  发表于 2022-6-6 21:32:10
60第8章:附录Jacky C.K.Chow-2018年2月59附录1:韩国破产数据集特征以下是对韩国破产数据集六个定性特征的详细描述:风险因素风险成分行业风险政府政策和国际协议周期性竞争程度市场供应的价格和稳定性规模市场需求的增长对宏观经济因素变化的敏感性国内外竞争力产品生命周期内部收益率管理风险性和管理能力管理的稳定性管理层/所有者人力资源管理增长过程/业务绩效之间的关系短期和长期业务规划,成就和可行性财务灵活性直接融资间接融资其他融资(附属公司、所有者、第三方)信誉度信用历史信息的可靠性与金融机构的关系竞争力市场定位核心能力水平差异化战略运营风险采购的稳定性和多样性交易生产效率产品和服务的需求前景销售多样化销售价格和结算条件应收帐款的收集销售网络的有效性使用机器学习分析金融信用风险60 Jacky C.K。

60
大多数88 在职认证  发表于 2022-6-6 21:32:13
周-2018年2月附录2:波兰破产数据集特征以下是波兰破产数据集中64个量化特征的完整列表:1净利润/总资产2总负债/总资产3营运资本/总资产4流动资产/短期负债5[(现金+短期证券+应收款项-短期负债)/(营业费用-折旧)]*365 6留存收益/总资产7息税前利润/总资产8权益账面价值/总负债9销售/总资产10权益/总资产11(毛利+非常项目+财务费用)/总资产12毛利/短期负债13(毛利+折旧)/销售额14(毛利+利息)/总资产15(总负债*365)/(毛利+折旧)16(毛利+折旧)/总负债17总资产/总负债18毛利/总资产19毛利/销售额20(存货*365)/销售额21销售额(n)/销售额(n-1)22利润经营活动/总资产23净利润/销售额24毛利(三年内)/总资产25(权益-股本)/总资产26(净利润+折旧)/总负债27经营活动利润/财务费用28营运资本/固定资产29总资产的对数30(总负债-现金)/销售额31(毛利+利息)/销售第8章:附录Jacky C.K。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 00:56