摘要:本文将基于标普500 的股票数据进行研究,使用四种方法描绘收盘价和收益率的变化规律,其中包括:ARIMA,GARCH,隐马尔科夫模型(HMM),长短期记忆网络(LSTM)。我们将使用ARIMA 和LSTM 模型拟合收盘价序列;用GARCH 和HMM 拟合收益率序列:其中ARIMA 将解释股价变化规律并给出粗略预测,而LSTM 将对股价做出更高精度的预测;GARCH 将从波动的角度刻画收益率,而HMM 将着重刻画股价的内在规律。对于收盘价而言,我们通过ACF,PACF,单位根检验,过度拟合等方式,拟合得到AR(5)模型,但是在用MLE 估计出模型后,残差检验结果存在争议,并且模型预测能力有待完善,因此ARIMA 模型对此数据集的解释能力有限。而对于GARCH 模型,我们通过ACF,PACF,EACF, Mcleod-Li 检验等方式确定了模型为GARCH(1,1),拟合参数后残差检验通过,并且模型具有不错的方差预测能力。其次我们通过拟合HMM 模型,弥补了GARCH 只能预测方差的不足:两个隐变量的HMM 模型准确地预测除了股票的涨跌变化;三个隐变量的HMM 准确地识别出了“涨”、“跌”和“波动”三个状态,并且发现了三个隐状态之间的转换规律,同时我们还基于此给出了对于涨跌情况的预测概率,进一步指导投资者决策。最终我们通过最小化测试集泛化误差,拟合得到时间步为6 的LSTM 模型,实现了对股价的更精确预测,进一步提升投资者的决策能力。压缩包中有word和pdf版本的论文,供学习参考。
标普500的股票数据研究——基于时间序列分析理论.rar
(1.96 MB, 需要: RMB 8 元)