|
offf-货架机器学习方法由于其更非线性的性质而优于逻辑回归;因此,我们将重点讨论这些方法。我们没有尝试和比较许多机器学习方法,也没有调整它们的参数,直到找到可预测性为止,而是选择了一种因其鲁棒性和性能而闻名的方法:普通随机森林(RF)[7,22],它在这方面有许多有用的特征:首先,它们避免了样本中的过度拟合,它们是鲁棒的,非线性,在不调整任何参数的情况下具有很好的整体预测能力(至少在许多“标准”数据集上是如此[11])。另一个好处是每个预测值的相对重要性的可用性。因此,我们将能够检查组状态,即超前滞后,平均而言比一天中的时间更重要。为了计算速度,校准是每天进行的,而不是每小时。因此,给定一天的预测取决于使用前一天数据的校准。我们选择了10个校准窗口长度,用Tin表示,范围从45到90周(9到18周),常见差异为5天(1周)。尽管RFsoutput分类概率,即下一个订单流的符号将为+1的概率,例如,我们将最可能的预测状态作为2018年7月27日0:50 WSPC/指令文件手稿14 CHALLET、CHICHEPORTICHE、LALLOUACHE、Kassibrakis的预测。除了计算每个校准长度的各自性能外,我们还对来自每个时间尺度的预测进行了多数投票。如果+1和-1获得相同票数时,预测设置为零。最后,我们使用了软件包RandomForestSRC[22],没有调整射频校准功能的任何参数。4.1.1。
|