使用SmartMining进行时间序列建模时候,大部人喜欢使用指数平滑节点来构建时间序列模型,但是也有很多数据适用于ARIMA模型,设计到模型的配置。所以一般构建ARIMA模型,首先需要进行自相关检验。
一般过程如下:
通过自相关检验如何进行模型的配置:
其中:ACF是自相关图,PACF是偏自相关图。
ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。
需要设置的有选择学习方法(条件似然和极大似然)和pdq值,另外还有Yule-Walker方法,但是Yule-Walker方法只适用于ARI(p,d)模型。(预期其数,置信度和最大延迟数暂时不说了)。
下面说说p,d,q
p为序列的自相关系数,即t期序列与t-k期序列的相关系数;q为序列的偏相关系数,即t期序列对t-1,t-2,……,t-k期序列做回归时的偏回归系数。P值越小,越能拒绝自相关系数全为0的原假设,即序列存在自相关关系。
判断的重要概念要看拖尾和截尾:这一对概念从图表上很容易看出,前者指AC或者PAC呈几何衰减(指数式衰减或者正弦式衰减),后者指AC或者PAC在某一阶之前明显不为0,之后突然接近或者等于0。看拖尾还是截尾主要是看收敛的趋势是像被切了一刀一样突兀的还是缓慢的。
AR(p)模型:自相关系数拖尾,偏自相关系数p阶截尾。从自相关函数ACF来看,在自回归方程的基础上可以很简单地构造自相关系数,最后发现自相关系数等于w^k(w为自回归系数),对于平稳时间序列(注意这一前提条件,如果放开这一条件图形将会很难识别),|w|<1,所以当w>0时,ACF呈现为指数式衰减至0。当w<0时,ACF则正负交替呈指数衰减至0,整体表现则是正弦式衰减;从偏相关函数PACF来看,这就相当明显了,因为PACF与自回归方程的形式完全一样,只是自回归方程只有滞后p期,而PACF则有更多的滞后项。于是乎,很明显,当k<=p,偏相关系数不等于0,当k>p,偏相关系数等于0,明显呈现出截尾现象。
MA(q)模型:自相关系数q阶截尾,偏自相关系数拖尾。从自相关函数ACF来看,在移动平均方程的基础上也可以很简单地构造自相关系数,这时候的自相关函数为分段函数,当k<=q,偏相关系数不等于0,当k>q,偏相关系数等于0,明显呈现出截尾现象;从偏相关函数PACF来看,任何一个可逆的MA(q)过程都可以转换成一个无限阶、系数按几何衰减的AR过程(将白噪声替换为序列的滞后形式即可),呈现拖尾现象。与AR(p)不同的是,当v>0(v为移动平均系数)时,PACF呈现为交替式正弦衰减。当v<0时,PACF则呈指数衰减至0。
ARMA(p,q)模型:自相关系数拖尾,偏自相关系数拖尾。是以上两者的结合,实际判别p、q值时还是比较依赖经验的。