首先我们从模型的前半部分AR(p)开始——
什么是AR模型,说白了就是序列Y的变动与Yt-1,Yt-2等有关,那么我们就利用这些来对Y进行短期的预测,至于AR(p)中的p就是Y与它前p期有关。当然直白的话只能用来理解,真的落到白纸黑字,咱还是要稍微像样点,比如写成这样就有教科书的感觉了——
如果预测是分析的目的,那么,随机过程的元素Yt对它的过去的依赖性就很重要。这使我们能够利用已经收集的样本观测值的过去信息预测变量的未来值。存在这种依赖性的简单例子是自回归过程:
自回归AR(p)模型: yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt
式中假设:yt的变化主要与时间序列的历史数据有关,与其它因素无关;εt不同时刻互不相关,εt与yt历史序列不相关。
引进延迟算子(延迟算子的内容可翻看:【时间简“识”】3.差分、延迟算子的故事!),中心化AR(p)模型又可以简记为:
想要运用这个模型,首先我们要求序列是要平稳的(平稳不知道?那赶紧戳:【时间简“识”】2.那些必不可少的预处理)
- AR模型平稳性判别方法
AR(p)模型平稳的充要条件是它的p个特征根都在单位圆内
根据特征根和自回归系数多项式的根成倒数的性质,等价判别条件是该模型的自回归系数多项式的根都在单位圆外
2.平稳域判别
没例子没真相 ,这就给大家看个例子——
AR模型又具有哪些统计特性呢?1、均值——
2、方差——
引入知识点——green函数
什么是GREEN函数?
这个表达形式称为传递形式,其中系数{Gj,j=1,2,3……} 称为格林(GREEN)函数或记忆函数。格林函数描述了系统是怎样记忆噪音(扰动)的。
Green函数的意义:
- Gj描述了j个时间单位以前的扰动(即εt-j)对系统当前行为Xt的影响。
- |Gj|的大小反映了系统记忆性的强弱。
- j→∞,|Gj|→0过去干扰的影响逐渐衰减。
- 衰减的快慢与|Gj|随j的变化方式有关,同时如果有单个εt加入系统,Green函数决定了系统回到均衡位置的速度快慢。
3、自相关和偏自相关系数——
AR模型自相关呈现拖尾性,模型偏自相关系数P阶截尾。
具体表现为:
自相关:
偏自相关:
其中:
附上建模的步骤供大家参考:
❀建模基本步骤❀
- 数据的采集和预处理
- 模型参数的估计 (关键的一步)
- 模型适用性的检验
❦数据的采集和预处理
时间序列为平稳、正态、零均值的时序是建立AR模型的前提条件,因此需检验时间 序列是否满足这个前提条件。若不满足, 需对数据进行处理,使其满足建立AR模型 的前提条件。
❦模型参数的估计
• 估计模型自回归参数和残余方差。
• 模型参数估计方法有很多种,例如最小二 乘法、协方差法等。
❦模型的适用性检验
参数估计方法只能在给定模型阶次p的条件下 确定模型参数,但阶次p究竟为多少才合适的 问题没有得到解决,而模型适用性检验的核心 就是解决模型定阶问题。模型的适用性的最根 本准则应是检验是否为白噪声序列,将采用 AIC准则进行检验。 AIC(p)=-2lnL+2p 式中,L为时间序列的似然函数,p为模型阶次。 可得到AR(n)模型的向前一步的预测值。