|
这是基于时间序列的股票市场预测相关工作的主要差异之一,例如Takeuchi和Lee(2013),其准确度作为衡量相关性的指标。另一个不同之处是使用了更多的短期预测,即每天而不是每月的预测。由于我们的目标是发现股票之间的时不变相关性,因此使用五倍交叉验证和提前终止验证集来减少结果的可变性,并以节俭的方式使用数据(Seni和Elder,2010)。图1:梯度计算和深度分类模型过程的示意图。对于每个时间序列,通过在预先确定的时间窗口上进行简单线性回归来计算每个时间间隔的强度近似值,然后提取其梯度,形成时间间隔的梯度向量(β1,1,β1,2,…,β1,n),作为特征矩阵的一列。后者用于训练一个深度前馈神经网络,用于方向趋势变化的二元预测。这样,每个折叠和库存使用60-20-20的训练、验证和测试集。在进行交叉验证时,一个中心问题是选择正确的分割比率。60-20-20分割是机器学习中经常使用的经验法则,除了训练集和测试集之外,还需要验证集。关于较大的训练集,我们希望确保训练集中有足够多的数据点,以使模型能够高效地学习。
|