楼主: 我爱南开
1321 5

[学科前沿] 时序问题求助,悬赏50大洋。谢谢各位! [推广有奖]

  • 0关注
  • 0粉丝

已卖:277份资源

大专生

28%

还不是VIP/贵宾

-

威望
0
论坛币
908 个
通用积分
0.4200
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
453 点
帖子
45
精华
0
在线时间
39 小时
注册时间
2008-9-10
最后登录
2012-6-3

楼主
我爱南开 发表于 2012-2-23 20:57:07 |AI写论文
50论坛币
问题有三,数据见附件:
一、分析忠县结核病月病率数据(2001-2010)是否为一个平衡序列;
二、如何确定ARIMA方法的三个最佳参数(p,d,q)
三、应用确定的ARIMA模型预测2011年忠县的结核病发病率,观察模型的拟合度。
数据资料.xls (39.5 KB)

最佳答案

samurai023 查看完整内容

一、分析忠县结核病月病率数据(2001-2010)是否为一个平衡序列[/backcolor]? 请问是否指"平稳序列",如果是,大概步骤如下: 1. 一般的时间序列考虑两种非平稳性:一个是趋势平稳trend stationary,这个算是deterministic trend; 另一个是差分平稳difference stationary,算是stochastic trend。楼主可以先画个图,大致看一下又没有time trend,或者看看数据是否是指数增长的,如果看起来很像指数增长,那就要取对数。 ...
关键词:ARIMA模型 ARIMA MA模型 模型预测 Rim 结核病 发病率 大洋 模型 平衡

本帖被以下文库推荐

沙发
samurai023 发表于 2012-2-23 20:57:08
一、分析忠县结核病月病率数据(2001-2010)是否为一个平衡序列

请问是否指"平稳序列",如果是,大概步骤如下:

1. 一般的时间序列考虑两种非平稳性:一个是趋势平稳trend stationary,这个算是deterministic trend; 另一个是差分平稳difference stationary,算是stochastic trend。楼主可以先画个图,大致看一下又没有time trend,或者看看数据是否是指数增长的,如果看起来很像指数增长,那就要取对数。

2. 然后楼主可以用Stata或者Eviews等软件进行Augmented Dick-Fuller (ADF) test,来判断是否有单位根()里面通常有以下几种选择:无截距无线性趋势,有截距无线性趋势,有截距有线性趋势。可以三个都作,如果三个结果都是能拒绝或者都不能拒绝原假设,那就没有歧义。如果结果不一致,那可以看截距项和线性趋势项显不显著(但后者的统计量应该有问题),或者是根据理论依据,来选择其中一个比较合适,根据其结果展开后面的讨论。

二、如何确定ARIMA方法的三个最佳参数(p,d,q

1. 差分阶数d。
首先要在第一步确定了由单位根存在,也就是数据属于差分平稳,否则d=0,直接考虑ARMA就行。
如果是差分平稳,那就先差分一次,然后对差分序列进行ADF test, 看差分之后的序列是否还有单位根,如果没有则d=1.
如果有,则继续差分,直至得到的数据没有单位根。这样你就知道了d.

2. p, q
定好了d之后,
(1) 你可以先选择一个较大的p和q,估计这个模型,看AR(p) 或者 MA(q)项是否显著,如果不显著,可以把它扔掉。就变成了ARIMA(p-1, d, q) 或者ARIMA(p, d, q-1)。
继续以上步骤,直至剩下的项全部显著,这样就得到一个ARIMA(p*, d, q*)。
(2) 或者根据AIC或BIC进行选择。

三、应用确定的ARIMA模型预测2011年忠县的结核病发病率,观察模型的拟合度。

拟合度应该是指样本内拟合的程度,和预测无关,看R方就行了。
1. 如果你想要看一下预测的功效,就要只用前面一部分样本进行回归,留下来一部分样本,比如10年的12个月,来比较模型的预测值和实际值之间的差别。
假设你用了01年1月~09年12月的数据进行了回归,选择好了一个模型。Eviews之类的软件应该都提供预测功能,你可以预测下一期,也就是10年1月的数据。
之后的做法有好几种:
(1)预测好10年1月的数据之后,保存下来,然后用01年1月~10年1月的数据进行回归,还用相同的(p,d,q),得到参数的估计值之后,预测10年2月的数据,保存之后,重复前面的过程。在这个过程中,用于估计的样本会越来越大。
(2)与(1)不同的是,就是用同样数量的样本进行估计,比如预测好10年1月的数据后,用01年2月~10年1月的数据回归并预测,不停地重复,每次后面加入一个样本之后,前面相应地扔掉一个样本。这样你就得到了10年的12个预测值和实际值,可以计算均方误差MSE,就是把每个月的预测值减去实际值,然后平方,在求12个月的平均。

2. 如果你想预测11年
那可以用(1),每次都把预测来的数据当作实际值,然后不用重新估计参数。


1的作用在于评价你的模型的预测能力,得到的均方误差越小,说明预测值和实际值越接近,你预测得越好。这样你去预测还没有实际值的11年的话,结果也容易让别人信服。
已有 1 人评分热心指数 收起 理由
gemini69 + 1 热心帮助其他会员

总评分: 热心指数 + 1   查看全部评分

藤椅
leihengzhishang 发表于 2012-2-23 21:30:07
不就是让别人帮你弄模型和预测那部分嘛。

板凳
我爱南开 发表于 2012-2-23 22:05:25
leihengzhishang 发表于 2012-2-23 21:30
不就是让别人帮你弄模型和预测那部分嘛。
回答得好可以加分,绝不吝惜,谢谢各位朋友

报纸
我爱南开 发表于 2012-2-24 21:05:38
samurai023 发表于 2012-2-23 20:57
一、分析忠县结核病月病率数据(2001-2010)是否为一个平衡序列?

请问是否指"平稳序列",如 ...
万分感谢!

地板
samurai023 发表于 2012-2-24 21:07:50
我爱南开 发表于 2012-2-24 21:05
万分感谢!
不客气,能对您有帮助最好。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 19:04