楼主: ostrich
20754 21

关于AIC的注(欢迎探讨研究) [推广有奖]

  • 0关注
  • 30粉丝

教师

副教授

78%

还不是VIP/贵宾

-

威望
0
论坛币
27721 个
通用积分
19.2202
学术水平
4 点
热心指数
3 点
信用等级
2 点
经验
16592 点
帖子
498
精华
0
在线时间
618 小时
注册时间
2005-7-2
最后登录
2024-6-3

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
看到论坛中有不少关于AIC的问题,于是花了点时间研究了一下。现进行阐述:
1、对数似然值(loglikelihood)定义都一致:l=-(n/2)*ln(2*pi)-(n/2)*ln(sse/n)-n/2.其中n为样本量,sse为残差平方和。
AIC的定义有些书上有点不同,如何晓群的<<应用回归分析>>书中为:AIC=-2*l+2*p.其中,l为对数似然值,p为参数个数,包括常数项。
而易丹辉的<<数据分析与EVIEWS应用>>中为:AIC=(-2*l+2*p)/n.
可以很明显的看出,两者的定义相差n倍。
2、R中AIC的计算:
R中计算AIC值有两个函数:AIC和extractAIC,两者有差别。
因为似然函数中的未知参数的个数为p+1,其中p为前面所讲的包括常数项的参数个数。故
在R中AIC=-2*l+2*(p+1),将前面的l值代入,也可写为:AIC=n*ln(2*pi)+n*ln(sse/n)+n+2(p+1).
而extractAIC=n*ln(sse/n)+2*p,即截取了AIC的一部分,而去掉了常数部分。
3、R中计算的部分结果:
> AIC(res)  #说明:res为lm回归的结果,样本量为18;自变量有3个,参数则为4个。
[1] 40.57416
> logLik(res)
'log Lik.' -15.28708 (df=5)
> l1=logLik(res)
> l1
'log Lik.' -15.28708 (df=5)
> a1=-2*l1+2*4
> a1
可看出AIC与a1相差2,即因为a1中少加了2的原因。
> c1[4,2] #提取的残差
[1] 5.7607
> 18*log(c1[4,2]/18)+2*4
[1] -12.50763
> extractAIC(res)
[1]   4.00000 -12.50763
说明extractAIC用的就是上述公式。
而在EVIEWS中其结果则为2.413009,是怎么得来的呢?它实际上等于=a1/18=(AIC(res)-2)/18,也即第1点上提到的易丹辉书上的公式。
这也就是用EVIEWS与用R不同的原因了,结果肯定不同,因为公式不同。那么它们之间的关系是什么呢?
AIC(EVIEWS)=(AIC(R)-2)/n.(其中AIC(EVIEWS)代表EVIEWS中AIC值,AIC(R)代表R中AIC值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:AIC Likelihood extract EVIEWS Eview AIC

已有 3 人评分学术水平 热心指数 信用等级 收起 理由
Stakiny + 1 + 1 + 1 观点有启发
benney1981 + 1 观点有启发
gtl + 1 + 1 好!!!!1

总评分: 学术水平 + 3  热心指数 + 2  信用等级 + 1   查看全部评分

沙发
miragew 发表于 2010-6-8 19:10:30 |只看作者 |坛友微信交流群
AIC 计算的基本公式是:
AIC = -2*log(LL) + 2*p
LL: log-likelihood
p: numbers of independent prarameters

其他的形式多为根据问题的修正形式,换句话来说,就是在某个问题中,Akaike 的AIC 不一定有效,但修正后的有效。
一般的模型选择,往往需要AIC和BIC同时进行判断
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Stakiny + 1 + 1 + 1 观点有启发
yahoocom + 20 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

藤椅
aresblq 发表于 2010-6-12 08:53:53 |只看作者 |坛友微信交流群
有时候AIC1<AIC2,但是BIC1>BIC2,怎么判断?

使用道具

板凳
ivy_cyh 发表于 2011-9-21 21:32:07 |只看作者 |坛友微信交流群
这下明白了。谢谢!
be busy living, be busy dying.

使用道具

报纸
muwatuo 在职认证  发表于 2011-9-24 11:21:52 |只看作者 |坛友微信交流群
高手!能解释下,AIC是如何定义的吗?合理性在哪

使用道具

地板
楚韵荆风 学生认证  发表于 2011-9-24 20:51:13 |只看作者 |坛友微信交流群
AIC是Akaike在1973,1974年提出的,是在K-L信息量(Kullback-Leibler)I(g,f)基础上改进的,基本思想是用一个概率密度函数f去逼近真实的未知的密度函数g,使得I(g,f)达到最小,对于I(g,f)等价的是一个对数似然函数在g下的期望的负数-E_g(log(f(X))),它的一个无偏估计是-(logf(X1)+logf(X2)+...+log(Xn)),通常在一个参数族{f_m(.| theta_m)}选择f_m使得上述无偏估计达到最小,由于我们只有来自g的观测数据Xi (i=1,...,n),通常采用两步估计法,第一步:对固定的m,求theta的估计,第二步:对所有m求全局极小值,对应的m和theta就是所求的估计,然而这个估计有个缺点:两次使用了数据来估计对数似然(第一次估计theta,第二次由theta的估计计算对数似然函数的值),这样会引起过度拟合,得到的估计自然是有偏的,Akaike通过增加一个偏倚项来修正这种偏倚,从而就定义了AIC准则=-(极大化对数似然)+(待估参数个数),第一项反映的是拟合的优劣程度,第二项增加的是对模型复杂性的惩罚。我们知道一个有限支撑上的连续函数可以用任意一个n阶多项式进行逼近,当多项式的阶数或者系数个数达到数据点的个数时,拟合的误差为0,显然,此时拟合并不好,因此AIC通过增加一个模型的复杂性的惩罚(参数个数),当复杂模型使得对数似然减小时,参数的个数在增加,这样AIC的值不会过小,这就解决了这种过拟合问题,在图像上显示出来是一个U型,也就是有一个合适的模型参数p使得AIC最小,但p不会太小也不会太大,类似于非参数回归中带宽的选择来平衡偏倚和方差。
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
Stakiny + 1 + 1 + 1 观点有启发
epoh + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

共享是一种彼此的快乐

使用道具

7
ztzt6512 发表于 2011-10-18 14:06:04 |只看作者 |坛友微信交流群
严格上讲,楼上说的还不完全正确,AIC是预测k-L损失函数I(g,f)的渐近无偏估计量,不是无偏估计量,应该才对! 另外,BIC是贝叶斯因子(Bayes factor)的大样本近似! 两者虽然都是用于模型选择,但目的完全是不同的! BIC, 有consistency, AIC是没有的,什么意思了,就是假如有一个真实模型存在,随着样本趋向于无穷,BIC是能够以概率1选择这个真实模型, AIC是没有的!我说这么多,可能很多同学不一定明白!简单来讲吧,AIC和BIC的原理是不同的,AIC是从预测角度,选择一个好的模型用来预测,BIC是从拟合角度,选择一个对现有数据拟合最好的模型,从贝叶斯因子的解释来讲,就是边际似然最大的那个模型! 因此,他们结论不一致是很正常的!
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Stakiny + 1 + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

8
pywang61 发表于 2011-11-18 21:37:32 |只看作者 |坛友微信交流群
真是太感謝了~真強、解釋的真好~

使用道具

9
莣灬Liǘ年 发表于 2011-11-25 22:14:20 |只看作者 |坛友微信交流群
AIC出现负数 说明什么?

使用道具

10
zsy0301 发表于 2011-12-4 14:55:28 |只看作者 |坛友微信交流群
多谢楼主,讲得很透彻。另经估算,gretl中的AIC应该和R中定义相同。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-3 22:27