时间序列预测法的实际应用分析 作者简介:温品人(1961-),女,江苏常熟人,扬州市广播电视大学文经系讲师。[FQ)]
时间序列预测法的实际应用分析 温品人 (扬州市广播电视大学,江苏 扬州 225009) 摘 要:根据所搜集的实际数据资料,以统计学为基础,采用时间序列预测方法,对扬州市农业总产值时间序列建立了趋势模型,结果说明简单模型也能达到较好的拟合效果和精度。 关键词:时间序列; 模型; 拟合; 预测 中图分类号:G30 文献标识码:B 文章编号:1008-4207(2001)06-0063-03 一、时间序列预测法
时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。时间序列预测方法的基本思想是:预测一个现象的未来变化时,用该现象的过去行为来预测未来。即通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来作出预测。
现实中的时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使时间序列的变化呈现出某种趋势和一定的规律性,有些则起着短期的、非决定性的作用,使时间序列的变化呈现出某种不规则性。时间序列的变化大体可分解为以下四种:
(1)趋势变化,指现象随时间变化朝着一定方向呈现出持续稳定地上升、下降或平稳的趋势。
(2)周期变化(季节变化),指现象受季节性影响,按一固定周期呈现出的周期波动变化。
(3)循环变动,指现象按不固定的周期呈现出的波动变化。
(4)随机变动,指现象受偶然因素的影响而呈现出的不规则波动。 时间序列一般是以上几种变化形式的叠加或组合。时间序列预测方法分为两大类:一类是确定型的时间序列模型方法;另一类是随机型的时间序列分析方法。确定型时间序列预测方法的基本思想是用一个确定的时间函数y=f(t)来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。具体可分为趋势预测法、平滑预测法、分解分析法等。随机型时间序列分析法的基本思想是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构来对时间序列进行预测。本文讨论的时间序列预测法指的是确定型时间序列模型方法。
二、实际应用分析 1.预测方法和模型的选择 表11980~1999年扬州市农业总产值 单位:万元
年份 | 农业总产值 | 年份 | 农业总产值 | 年份 | 农业总产值 |
1980 | 220 553 | 1987 | 345 560 | 1994 | 483 960 |
1981 | 236 285 | 1988 | 357 909 | 1995 | 549 807 |
1982 | 267 120 | 1989 | 357 788 | 1996 | 600 986 |
1983 | 278 787 | 1990 | 357 671 | 1997 | 620 281 |
1984 | 312 089 | 1991 | 305 855 | 1998 | 667 542 |
1985 | 331 172 | 1992 | 362 848 | 1999 | 711 741 |
1986 | 338 848 | 1993 | 414 892 |
|
|
表1是扬州市1980~1999年农业总产值的有关数据资料,资料摘自《扬州统计年鉴2000》,表中产值按990年不变价格计算。根据表1时间序列的资料,画出时间序列折线图1。通过观察时间序列图,可以看出此时间序列具有明显的趋势变动。在1980~1999年20年间,扬州市农业总产值总体呈明显的上升趋势。农业总产值的变化分为两个时间段:1980~1990年时间序列呈曲线变化趋势,1991~1999年时间序列呈线性变化趋势。根据直观的判断,对时间序列采取分段处理的方法,即对1980~1990年的时间序列拟合二次曲线趋势模型,对1991~1999年的时间序列拟合线性趋势模型。
2.建立模型
(1)二次曲线趋势模型:Yt=a+bt+ct2 上述方程中的三个未知参数a、b、c根据最小二乘法求得。即对时间序列拟合一条趋势曲线,使之满足下列条件:各实际值Yt与趋势值〖AKY^〗t的离差平方和为最小,即∑(Yt-〖AKY^〗t)2=最小值,得到标准求解方程: ∑Y=na+b∑t+c∑t2 ∑tY=a∑t+b∑t2+c∑t3 ∑t2Y=a∑t2+b∑t3+c∑t4 当取时间序列的中间时期数为原点时,有∑t=0,上式可简化为:
∑Y=na+c∑t2 ∑tY=b∑t2 ∑t2Y=a∑t2+c∑t4 经过计算,得到对扬州市1980~1990年农业总产值时间序列拟合的二次曲线模型为: Y^t=316488.1+14584.3t-705.3t2。
(2)线性趋势模型:Y^t=a+bt
上述方程中的两个未知参数a、b也是根据最小二乘法的原理求得。
b=n∑tY-∑t∑Y/n∑t2-(∑t)2 a=1/n(∑Y-b∑t) 同样,为计算方便,取时间序列的中间时期数为原点,此时有∑t=0,上式可简化为: a=1/n∑Y b=∑tY/∑t2 经过计算,得到对扬州市1991~1999年农业总产值时间序列拟合的线性模型为: Y^t=524212+51090.5t
3.对模型的有效性进行检验
对时间序列拟合了趋势模型,如果用线性趋势模型Y^t=524212+51090.5t预测扬州市2000年的农业总产值,这一预测是否有效,还需要进行有效性检验。笔者用的是时间序列自相关的分析,即通过计算误差项的自相关系数来判断误差是否属于随机误差。
线性预测模型所对应的误差项时间序列共9项数据,即n=9。自相关系数公式:
rk=∑(Y′t-Y′)(Y′t-k-Y′)/∑(Y′t-Y′)2 其中,Y′t=Yt-Y^t,Y′=∑Y′/n。 Y′t-k是误差项时间序列各期滞后序列,见表2。 表2 误差项时间序列及各滞后序列
年份 | Y′t | Y′t-1 | Y′t-2 | Y′t-3 |
1991 | 13995 |
|
|
|
1992 | 8093 | 13995 |
|
|
1993 | 7139 | 8093 | 13995 |
|
1994 | 10838 | 7139 | 8093 | 13995 |
1995 | 25595 | 10838 | 7139 | 8093 |
1996 | 25683 | 25595 | 10838 | 7139 |
1997 | 6112 | 25683 | 25595 | 10838 |
1998 | 9944 | 6112 | 25683 | 25595 |
1999 | 16833 | 9944 | 6112 | 25683 |
根据公式计算得到:r1=0.1969,r2=-0.5743,r3=-0.2978。置信度为95%的置信区间为[-0.66,0.66],计算得到的误差项的自相关系数r1、r2、r3都落在这个区间内,则有95%的把握认为所有的自相关系数与零没有显著性差异,因此判断误差是随机误差,则线性趋势模型用于预测是有效的。根据模型,得到扬州市2000年农业总产值的预测值为779 665万元,实际值为761 776万元,预测误差为2.35%。 4.预测精度分析
不同的预测对象具有不同的特点,而不同的预测方法也有各自的优点和缺点。预测的关键就是为预测对象寻找合适的预测方法,使得预测结果具有更高的可靠性和精确度。一般认为预测精度是指预测模型拟合好坏的程度,即由预测模型所产生的模拟值与历史实际值拟合程度的优劣。表3 是根据模型计算的趋势值(模拟值)及相对误差指标。 表3趋势值和误差计算表 根据表3的数据画出实际值、趋势值的时间序列图1,其中虚线为趋势值线。
三、结论
从计算结果分析,对农业总产值时间序列进行分段处理,拟合模型,拟合效果较好,精度较,说明简单模型也能达到较高的精度。在一些情况下,有些复杂的预测模型,如B-J方法的ARMA模型其预测精度高于简单模型。但B-J方法在模型识别时要50个以上的历史统计数据,对按年记录的经济资料很难搜集。在实际预测时,有时采用组合预测模型,可以达到更高的预测精度。
时间序列预测法是一种重要的预测方法,其预测模型都比较简单,它对资料的要求比较单一,只需变量本身的历史数据,因此,在实际情况中有着广泛的适用性。