楼主: kedemingshi
806 26

[量化金融] 利用年度文本片段深度学习预测苦恼 [推广有奖]

21
能者818 在职认证  发表于 2022-6-11 03:32:26
p值稍大可归因于本实验中褶皱数量较少,导致统计检验较弱。型号hAUCi paud+Manpaudpmannaud+man0.843––NNaud0.842 0.299––NNman0.830 0.003 0.014–XGB 0.826 0.001 0.006 0.175NN 0.822 0.001 0.004 0.054Logit 0.814 0.000 0.001 0.009(a)AUCModel hL i paud+Manpaudmannaud+man0.1090––NNaud0.1095 0.4130–NNman0.1114 0.0312 0.1289–XGB 0.1109 0.0128 0.0627 0.3484NN 0.1122 0.0112 0.0166 0.2098Logit 0.1127 0.0081 0.0005 0.1892(b)Log score LTable 4:平均AUC和从抽样中获得的Log score。该表显示了(a)平均AUC和(b)平均对数分数,其中paud+man、paud和PMandnote p值来自当前模型和三个模型(包括文本)分数之间的配对双尾t检验。平均值和标准误差是根据4倍计算的,这是通过抽样出版年份构建的。6、注意权重高的块的情况可以从单个词块中提取注意权重,突出显示对预测很重要的单词和短语。在本节中,我们展示了五位审计师报告中的各个区块的示例。单个单词的注意颜色强度与该特定块中的最大权重相对应,为了完整性,会插入停止词,以使文本更具可读性。在下面的五种情况下,注意力机制成功地突出了直觉上应该影响困境预测的部分,例如“没有获得资金的现实选择”和“对公司继续运营的能力有很大的不确定性”。通常,这些示例展示了在传统特征中很难表示的信息,如表1所述。

22
kedemingshi 在职认证  发表于 2022-6-11 03:32:29
文本最初是丹麦语,我们注意到翻译需要转移一些单词,但我们已尽最大努力将其进行1:1的比较。原文见附录B,以供参考。例1从今往后。我们的评估是,没有任何实际的融资选择,因此,我们需要注意的是,该声明是在持续运营的基础上提交的。我们认为,由于存在重大影响,该报表如报表附注和管理层报告中所述,管理层解释了公司继续经营能力的重大不确定性,因为仍不确定是否可以产生必要的流动性用于融资示例3获得流动性用于支付重大纳税义务。目前尚不确定该公司是否能够获得额外的流动性。因此,我们无法评价公司来年继续运营的能力,为什么我们有保留意见。还应注意的是,还有一个例子4尚未收到所涉银行的确认书,在此基础上,我们无法就公司继续经营的能力得出结论。由于附注XX第XX号外部账户中的示例5,未得出结论,这表明公司的股权已耗尽。因此,公司的持续经营取决于持续提供必要的流动性。该公司20 4080 1007。展望与结论我们引入了一种由卷积神经网络和递归神经网络组成的网络架构,用于使用审计师报告和管理层年报声明预测公司困境。

23
nandehutu2022 在职认证  发表于 2022-6-11 03:32:32
通过将神经网络模型与数字财务变量连接起来,我们发现,与没有文本的神经网络相比,有审计师报告的模型AUC增加了近2个百分点,而管理层的声明仅增加了约1个百分点。在这两种情况下,模型性能的提高在1%的水平上都具有统计学意义,这表明除了数字财务变量中已经包含的信息外,还可以从文本片段中提取有用的信息。统计测试还显示,审计师报告提供的信息远远多于管理层的声明,管理层声明中包含的所有有用信息也包含在审计师报告中。这些发现表明,进一步的分析应以梅雷隆审计师的报告为重点。对于规模超过500万丹麦克朗的公司,审计报告将AUC提高了2.5个百分点以上,而管理层的报表仍约为1个百分点,这表明审计报告的文本分析对于大型公司尤其有用,因为我们从准确的困境预测中获益最多。在未来的工作中,有兴趣调查审计师报告和管理层声明中的个别段落,以确定组合中的某些段落是否更适合于困境预测。致谢作者感谢Benjamin Christofferse的有益评论。Casper Hansen和ChristianHansen通过DABAI项目获得丹麦创新基金的财政支持。附录A。

24
何人来此 在职认证  发表于 2022-6-11 03:32:35
主模型0.830.840.85(a)块大小k0.830.840.85(b)单元大小(LSTM)中的参数调整结果-4.-30.830.840.85(c)log(学习率)0.830.840.85(d)过滤器数量m2 40.830.840.85(e)池大小τ图A.1:神经网络的参数调整。图中显示了不同参数选择的AUC(NNaud+man;NNaud;NNman)。误差条表示一个标准误差。附录B.高注意权重块的情况(原始)示例1拆卸器。Det er vores vurdering,位于ikke errealistiske muligheder,位于fremskaffe finansieringog vi tager derfor forbehold,位于forudsaetning af fortsat漂移下的rsregnskabet时代。Det er voresopfattelse,atarsregnskabet,som folge afbetydelighedene示例2 til omtale iarsregnskabets noter ogledelsesberetningen,hvori ledelsen redegor for vaesentligusikkerhed om selskabets evne til at Fortsaette driften,da detnu er usikkert,om denodvendige likeviditet kan frembringes til示例3 Fremskaffelse直到到达环境保护区。我站在vaere村,直到fremskaffe denneyderligere Likvidite。我会一直站在这里,直到在福布斯托尔的佛得堡(fortsaette driften detkommendear)站着。Detskal endvidere bemaerkes,位于Ikkee,例如4小时后,ikke modtaget Tilkendgivelse fra Det involverede Pengeinstitute,og paden baggrund kan viikke nafrem til en konklusion vedrorende selskabetsevne til at fortsaette driften。Manglende konklusion PagrundExample 5panote xxnumberxx eksternt regnskab,hvoraf detfremgar,位于selskabet Egencapital er tabt。Selskabetsfortsate drift er derfor afhaengig af at der fortsat stillesden nodvendige likvidite til radigged。Selskabets0 20 4080 100参考Sabadi,M.,Barham,P.,Chen,J.,Chen,Z.,Davis,A.,Dean,J.,Devin,M.,Ghemawat,S.,Irving,G.,Isard,M.,et al.,2016年。

25
mingdashike22 在职认证  发表于 2022-6-11 03:32:38
张量流:用于大规模机器学习的系统。OSDI 16265–283。奥特曼,E.I.,1968年。财务比率、判别分析与企业破产预测。《金融杂志》23(4),589–609。Atiya,A.F.,2001年。利用神经网络进行信用风险破产预测:一项调查和新结果。IEEE关于NeuralNetworks的交易12(4),929–935。Beaver,W.、McNichols,M.、Rhie,J.,2005年。财务报表的信息量是否减少了?财务比率预测破产能力的证据。会计研究回顾10(1),93–122。伯德,S.,克莱恩,E.,洛珀,E.,2009年。Python自然语言处理:使用自然语言工具包分析文本。奥雷利。Buehlmaier,M.M.M.,Whited,T.M.,2018年。财务约束是否定价?来自文本分析的证据。《金融研究评论》31(7),2693–2728。Campbell,J.Y.,Hilscher,J.,Szilagyi,J.,2008年。搜索distressrisk。《金融杂志》63(6),2899–2939。Caruana,R.,Niculescu Mizil,A.,2006年。监督学习算法的经验比较。第23届机器学习国际会议记录,ICML\'06161-168。Cerchiello,P.、Nicola,G.、Ronnqvist,S.、Sarlin,P.,2017年。从新闻和数字金融数据中深入学习银行困境。工作纸。Chava,S.,Jarrow,R.A.,2004年。具有行业效应的破产预测。财务回顾8(4),537–569。Chen,T.,Guestrin,C.,2016年。Xgboost:一个可扩展的树提升系统。第22届ACM sigkdd知识发现和数据挖掘国际会议记录,785–794。Christoffersen,B.,Matin,R.,Molgaard,P.,2018年。机器学习模型能否捕捉企业困境中的相关性?丹麦国家银行工作文件。Gu,J.,Wang,Z.,Kuen,J.,Ma,L.,Shahroudy,A.,Shuai,B.,Liu,T.,Wang,X.,Wang,G.,Cai,J.,Chen,T.,2018年。

26
可人4 在职认证  发表于 2022-6-11 03:32:41
进化神经网络的最新进展。模式识别77354–377。Hájek,P.,Olej,V.,2013年。使用神经网络和支持向量机评估财务困境预测年度报告中的情绪。神经网络工程应用国际会议,1-10。Hochreiter,S.,Schmidhuber,J.,1997年。长期短期记忆。神经计算9(8),1735–1780。Honnibal,M.,蒙大尼,I.,2017年。spaCy 2:使用bloom嵌入、卷积神经网络和增量解析的自然语言理解。显示。Hosaka,T.,2019年。利用成像财务比率和卷积神经网络进行破产预测。具有应用程序的专家系统117、287–299。Jones,S.,Johnstone,D.,Wilson,R.,2017年。预测公司破产:对替代统计框架的评估。《商业财务与会计杂志》44(1-2),3-34。Kingma,D.P.,Ba,J.,2014年。Adam:一种随机优化方法。工作文件。Loughran,T.,麦当劳,B.,2011年。什么时候责任不是责任?文本分析、词典和10 ks。《金融杂志》66(1),35–65。Mikolov,T.,Sutskever,I.,Chen,K.,Corrado,G.S.,Dean,J.,2013年。单词和短语的分布式表示及其组成。神经信息处理系统的进展,3111–3119。Ohlson,J.,1980年。财务比率和破产概率预测。《会计研究杂志》18(1),109–131。波特,M.F.,2001年。Snowball:一种用于词干算法的语言。R"onnqvist,S.,Sarlin,P.,2017年。新闻中的银行危机:通过深入学习描述事件。神经计算264,57–70。舒姆韦,T.,2001年。更准确地预测破产:一个简单的风险模型。《商业杂志》74(1),101–124。Sun,J.,Fujita,H.,Chen,P.,Li,H.,2017年。

27
何人来此 在职认证  发表于 2022-6-11 03:32:44
基于时间加权和adaboost支持向量机集成的概念漂移动态财务困境预测。基于知识的系统120,4–14。Sun,J.、Li,H.、Huang,Q.-H.、He,K.-Y.,2014年。预测财务困境和公司失败:从最新定义、建模、抽样和特征方法进行回顾。基于知识的系统57、41–56。蔡建发,吴建伟,2008。使用神经网络集成进行破产预测和信用评分。具有应用程序的专家系统342639–2649。Zhang,L.,Wang,S.,Liu,B.,2018年。情绪分析的深度学习:一项调查。威利跨学科评论:数据挖掘和知识发现。Zieba,M.,Tomczak,S.K.,Tomczak,J.M.,2016年。利用合成特征生成集成增强树在破产预测中的应用。具有应用程序的专家系统58、93–101。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 12:06