对于新创建的特征,请参阅表IV。表IV新创建的特征特征解释X1~X70每个原始特征6个月的所有周期平均值X1~X70每个原始特征6个月的所有周期平均值X1~X70标准所有周期每个原始特征6个月的标准偏差X1~X70最大每个原始特征6个月的所有周期最大值X1~X70最小每个原始特征的所有周期最小值原始特征从6个月x1到X70更改所有周期从每个原始特征的第一个值更改为最后一个值x1到X70更改第二个最后一个到最后一个所有周期从第二个最后一个值更改为每个原始特征的最后一个值x1到X70范围每个原始特征的所有周期范围从6个月x1到X70平均差异所有周期每个原始特征差异的平均值从6monthsX1~X70中位数差异所有时段6个月内每个原始特征差异的中位数X1~X70标准差异所有时段6个月内每个原始特征差异的标准偏差X1~X70最大差异所有时段6个月内每个原始特征差异的最大值X1~X70最小差异所有时段6个月内每个原始特征差异的最小值2)培训框架设置和功能选择:首先,由于该方法是使用单一模型框架在不同的历史数据组上构建模型,并对不同的时间段进行预测,因此应综合考虑每个培训和验证时间段组的功能和目标变量(此处的“Norm Ret F6M”列)之间的关系。验证时间段从2002年开始至2016年。
考虑到财务预测任务背后的复杂性,对于未来的工作,基于探索性数据分析(EDA)中更详细的观察结果,考虑交互等因素,生成更多的特征,并实现更复杂的模型,包括基于树的模型和神经网络,并采用集成技术解决过度匹配问题,这将是一个很好的开始尝试的地方。八、股票市场是人类所知最不稳定的领域之一,预测股票价格一直是一项非常具有挑战性的任务。在这项使用深度学习技术的工作中,我们利用提供的财务预测数据集和半年收益率,解决了在每个时间段识别最佳表现股票的问题。所使用的框架分为四个部分,我们相应地将框架的描述分开。首先,我们通过输入NA值,然后将其重塑为6个时间步的序列来预处理数据。第二部分由卷积层组成,第三部分由递归层组成,这两个块是框架的主要构建块。第四块和最后一块是完全连接的层,用于回归任务,以预测六个月每个时间段的回报。框架如图7所示。图7:。框架框图a。方法1)预处理:框架的输入是6个月内70个属性的序列。因此,在将数据放入模型之前,我们先用零填充NA值,然后将属性重塑为1 x 6 x 70.2)个卷积层:卷积层在框架中的作用是为每个时间步提取更高维的特征,这些特征可供递归层使用。一维卷积层用于学习输入序列的高层表示。