|
尽管ACF/PACF图表明大部分数据集接近白噪声,但几个顺序(p,d,q)=(1,1,0),(0,1,1),(1,1),(2,1,1),(2,1,1),(2,1,0)似乎适用。我们将ARIMA模型与这五个订单进行匹配,并为每个序列/开发/测试1/测试2数据集的数据选择AIC值最小的模型。我们用来计算AIC度量的对数似然函数的方法是最大似然估计。在拟合ARIMA模型后,我们为每21个时间步生成预测,以计算残值。然后,每个数据的最后一个数据点将作为目标变量Y,其余数据点作为变量X(图3)。新的X/Y分割数据集将是下一个LSTM modelsector的输入值。我们利用金字塔模型来拟合ARIMA模型(https://github.com/tgsmith61591/pyramid)表1:。值得注意的趋势和1级差异数据的ACF/PACF 4.1.3算法算法1。ARIMA模型拟合算法1:数据集=[训练,开发,测试1,测试2]2:顺序=[(1,1,0),(0,1,1),(1,1,1),(2,1,1),(2,1,0)]3:对于数据集中的所有数据do4:X=空列表5:Y=空列表6:对于数据中的所有时间序列T do7:模型=空列表8:对于订单中的所有订单do9:Morder=fit ARIMA(T,order)10:将Morderto添加到模型11:使用AIC模型M fitin models12:残差=X-预测(T,M fit)13:将残差[0:20]添加到X14:将残差[20]添加到Y15:保存X,Y4.2 LSTM4.2.1数据我们使用随机选择的150只标普500股票的ARIMA模型得出的残差值作为LSTM模型的输入。数据集包括序列X/Y、开发X/Y、测试1 X/Y和测试2 X/Y。每个数据集有55875行,包含20个时间步,每个时间序列对应一个Y数据集(图3)。
|