|
因为用传统的优秀机器学习方法很难预测时间序列数据,如图9所示。异常时间序列(以天为基础)。图10:。NCR(按日计算)。(例如,SVM),这些初步实验表明,使用基于深度学习的技术(如LSTM RNN)可以实现潜在的良好结果,特别是在我们提出的框架内,我们可以控制我们想要使用多少信息来进行更好的预测(例如,对于基于窗口的预测,只使用前一个窗口来预测下一个窗口)。最后,图13和表1显示了我们在实验中应用的三种LSTM RNN变体的比较。首先,基于日的预测方法优于其他方法,因为它能够检测命中率最高的所有正常模式。基于日期的预测性能更好,因为它使用该窗口所有前几天的真实历史记录。但这种方法的局限性在于,它可以预测的提前天数只有一天。另一方面,基于窗口的预测方法在前一个窗口的基础上提前预测整个窗口(50天),因此其性能如图11所示。异常时间序列(基于整个历史)。图12:。NCR(基于整个历史)。比白天的预测要差一点。最后,整个基于历史的预测方法在使用整个历史数据集进行预测时执行worstas,这对于时间序列预测是不切实际的。此外,表一显示了发现异常模式的模式结果(按方法分组)。前两种模式(模式1和模式2)在整个时间序列中多次在所有公司中检测到。但实际的非法内幕交易案件只针对两个不同时间段的两家不同公司。
|