|
附录C详尽解释了我们模型中最重要的参数。3组织支票账户数据:三种方法在当前文献中,处理支票账户数据的方法并不成熟,因为我们可以找到金融结构数据。在后一种情况下,公司财务表明了一些特别有用的比率,如营运资本/总资产、留存收益/总资产、市值/总债务等(Ross et al.(2008))。基于支票账户数据定义新功能是我们研究的中心问题。我们尝试了以下三种方法。它们将与三种不同的统计方法(逻辑回归、随机森林和boosting)相结合。3.1变量定义1(基于EconomicIntuition的连续变量)该定义受Norden和Weber(2010)的启发。在每年年底(我们注意到时间t),我们将解释变量default定义为下一年破产的二元变量。解释变量是根据过去两年的月度账户变量创建的。这30个变量列在附录A中,从数学上可分为四类:一个时期(一年或两年)开始与结束之间的特征差异(如余额、每月累计积分);时间t时该特性的值;该特性在一定时期内的标准偏差;企业属性(年销售额、行业)。其基本思想是使用库存和流量变量对某一特征进行完整且简洁的描述。此外,标准偏差(例如每月累计信用)允许我们量化与不稳定收入相关的风险。企业规模可能会以一种不受欢迎的方式对模型产生重大影响。
|