时间序列数据通常分为平稳的时间序列数据和非平稳的时间序列数据。当我们得到一组时间序列数据的时候,建模之前首先要检验它的平稳性。平稳的时间序列数据和非平稳的时间序列数据的建模过程大体相同,一般分为以下五个过程:
第一,模型的建立;模型的建立意思就是说模型的识别问题。在识别数据符合什么模型之前,首先要检验数据是否为平稳的数据,如果数据是平稳的话,一般是通过数据的ACF和PACF图的截尾和拖尾性质来判断是符合AR模型,MA模型还是ARMA模型。AR模型ACF是拖尾的,PACF是截尾的,MA模型ACF是截尾的,PACF是拖尾的,ARMA的ACF和PACF都是拖尾的。如果数据是非平稳的话,一般有两种处理方式,一种是把数据变成平稳的,即可以通过差分(非平稳是由随机趋势或者由确定性趋势(关于时间的一次函数)引起的)或者是对时间回归的方式(有确定性趋势(关于时间的多项式)引起的)将数据变成平稳的数据然后进行看数据的ACF和PACF图对模型识别;另一种是直接对原数据进行建模,建立合适的模型之后,检验变量之间是否存在协整关系来判断该回归模型是否为伪回归的问题。
第二,模型的定阶;在识别数据符合什么模型之后要确定模型的阶数。常用的模型的定阶方法是AIC和BIC,原理是找到合适的阶数使得AIC和BIC的值最小。对于平稳时间的建模,像模型为AR、MA和ARMA模型也可以通过PACE、ACF、EACF来定阶,一般AR模型可以通过PACF来确定阶数,MA模型可以通过ACF来确定阶数,ARMA模型可以通过EACF来确定阶数。
第三,模型的估计;在确定模型的阶数之后要对模型进行估计,估计方法通常有矩估计,最小二乘估计,极大似然估计。矩估计是利用样本的矩对模型进行估计的,最小二乘估计的原理是使得模型残差的平方和最小,极大似然估计的原理是估计参数,使得在该估计的参数下,样本数据出现的概率最大。它们也有各自的缺陷,比如矩估计的精度在小样本的情况下要小于其他两种估计的精度。在模型分布已知的情况下,最大似然估计的精度是最高的,在模型分布未知的情况下,最小二乘估计相对来说是比较好的。
第四,模型的检验;对模型估计之后,得到了变量之间确定的函数关系,但这个关系是否正确要对模型进行检验。模型的检验主要分两种,一种是对各参数的检验,另一种是对模型的检验。对各参数的检验是检验各个参数在给定显著水平下是否显著,对模型的检验是检验模型拟合后的残差是否为白噪声,如果为白噪声,则认为建立的模型是适当的,充分拟合了数据,如果模型拟合后的残差不是白噪声,那就要修改模型,从新估计检验。
第五,模型的应用;模型通过检验之后,就可以对模型进行应用了---预测,分析。