|
在交叉分类比较中包含特征变量选择是我们研究的一个独创性贡献。此外,我们的研究还考察了特征变量之间的相关性对分类绩效的影响。这里需要注意的是,与之前的比较研究中使用的许多数据集相比,金融市场数据可以而且通常会具有很强的相关性,特别是在金融压力时期,例如我们的研究所基于的时期(雷曼兄弟2008年破产前的100天)。我们认为,我们是第一批了解多重共线性对金融市场特定背景下分类绩效影响的研究机构之一。根据分类,我们发现,对于Naive Bayes和一些LDA和QDA分类,这种影响可以忽略不计(对于大多数分类家庭),也可以是负面的。我们比较了上述八个主要分类算法家族中的156个分类算法,以及不同的参数选择(可以是函数式的,也可以是数值式的)和不同的特征变量选择,以便在雷曼破产前100天的财务数据基础上构建CDS代理。我们的交叉分类比较表明,对于这些代理的构建,三个表现最好的分类是神经网络、支持向量机和袋装树。图10给出了我们结果的图形摘要。该绩效结果与King at al.(1995)和Delgado and Amorim(2014)的绩效结果大体一致。
|