|
p值稍大可归因于本实验中褶皱数量较少,导致统计检验较弱。型号hAUCi paud+Manpaudpmannaud+man0.843––NNaud0.842 0.299––NNman0.830 0.003 0.014–XGB 0.826 0.001 0.006 0.175NN 0.822 0.001 0.004 0.054Logit 0.814 0.000 0.001 0.009(a)AUCModel hL i paud+Manpaudmannaud+man0.1090––NNaud0.1095 0.4130–NNman0.1114 0.0312 0.1289–XGB 0.1109 0.0128 0.0627 0.3484NN 0.1122 0.0112 0.0166 0.2098Logit 0.1127 0.0081 0.0005 0.1892(b)Log score LTable 4:平均AUC和从抽样中获得的Log score。该表显示了(a)平均AUC和(b)平均对数分数,其中paud+man、paud和PMandnote p值来自当前模型和三个模型(包括文本)分数之间的配对双尾t检验。平均值和标准误差是根据4倍计算的,这是通过抽样出版年份构建的。6、注意权重高的块的情况可以从单个词块中提取注意权重,突出显示对预测很重要的单词和短语。在本节中,我们展示了五位审计师报告中的各个区块的示例。单个单词的注意颜色强度与该特定块中的最大权重相对应,为了完整性,会插入停止词,以使文本更具可读性。在下面的五种情况下,注意力机制成功地突出了直觉上应该影响困境预测的部分,例如“没有获得资金的现实选择”和“对公司继续运营的能力有很大的不确定性”。通常,这些示例展示了在传统特征中很难表示的信息,如表1所述。
|