人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › 关于AIC的注（欢迎探讨研究）

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 3 下一页

发帖

楼主: ostrich

20754 21

关于AIC的注（欢迎探讨研究） [推广有奖]

0关注
30粉丝

教师

副教授

78%

还不是VIP/贵宾

威望: 0 级
论坛币: 27721 个
通用积分: 19.2202
学术水平: 4 点
热心指数: 3 点
信用等级: 2 点
经验: 16592 点
帖子: 498
精华: 0
在线时间: 618 小时
注册时间: 2005-7-2
最后登录: 2024-6-3

楼主

ostrich 发表于 2010-6-8 17:37:41 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

看到论坛中有不少关于AIC的问题，于是花了点时间研究了一下。现进行阐述：
1、对数似然值（loglikelihood)定义都一致：l=-(n/2)*ln(2*pi)-(n/2)*ln(sse/n)-n/2.其中n为样本量，sse为残差平方和。
AIC的定义有些书上有点不同，如何晓群的<<应用回归分析>>书中为：AIC＝-2*l+2*p.其中，l为对数似然值，p为参数个数，包括常数项。
而易丹辉的<<数据分析与EVIEWS应用>>中为：AIC＝(-2*l+2*p)/n.
可以很明显的看出，两者的定义相差n倍。
2、R中AIC的计算：
R中计算AIC值有两个函数：AIC和extractAIC,两者有差别。
因为似然函数中的未知参数的个数为p+1,其中p为前面所讲的包括常数项的参数个数。故
在R中AIC=-2*l+2*(p+1),将前面的l值代入，也可写为:AIC=n*ln(2*pi)+n*ln(sse/n)+n+2(p+1).
而extractAIC=n*ln(sse/n)+2*p,即截取了AIC的一部分，而去掉了常数部分。
3、R中计算的部分结果：
> AIC(res)　　＃说明：res为lm回归的结果，样本量为18；自变量有3个，参数则为4个。
[1] 40.57416
> logLik(res)
'log Lik.' -15.28708 (df=5)
> l1=logLik(res)
> l1
'log Lik.' -15.28708 (df=5)
> a1=-2*l1+2*4
> a1
可看出AIC与a1相差2，即因为a1中少加了2的原因。
> c1[4,2]　＃提取的残差
[1] 5.7607
> 18*log(c1[4,2]/18)+2*4
[1] -12.50763
> extractAIC(res)
[1] 4.00000 -12.50763
说明extractAIC用的就是上述公式。
而在EVIEWS中其结果则为2.413009，是怎么得来的呢？它实际上等于=a1/18=(AIC(res)-2)/18,也即第1点上提到的易丹辉书上的公式。
这也就是用EVIEWS与用R不同的原因了，结果肯定不同，因为公式不同。那么它们之间的关系是什么呢？
AIC（EVIEWS）＝(AIC（R）－2)/n.(其中AIC(EVIEWS)代表EVIEWS中AIC值，AIC（R）代表R中AIC值。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享1 收藏19 回帖

关键词：AIC Likelihood extract EVIEWS Eview AIC

相关帖子

已有 3 人评分	学术水平	热心指数	信用等级	收起理由
Stakiny	+ 1	+ 1	+ 1	观点有启发
benney1981	+ 1			观点有启发
gtl	+ 1	+ 1		好！！！！1

总评分: 学术水平 + 3 热心指数 + 2 信用等级 + 1 查看全部评分

使用道具举报

沙发

miragew 发表于 2010-6-8 19:10:30 |只看作者 |坛友微信交流群

AIC 计算的基本公式是：
AIC = -2*log(LL) + 2*p
LL: log-likelihood
p: numbers of independent prarameters

其他的形式多为根据问题的修正形式，换句话来说，就是在某个问题中，Akaike 的AIC 不一定有效，但修正后的有效。
一般的模型选择，往往需要AIC和BIC同时进行判断

已有 2 人评分	论坛币	学术水平	热心指数	信用等级	收起理由
Stakiny		+ 1	+ 1	+ 1	观点有启发
yahoocom	+ 20				热心帮助其他会员

总评分: 论坛币 + 20 学术水平 + 1 热心指数 + 1 信用等级 + 1 查看全部评分

使用道具举报

藤椅

aresblq 发表于 2010-6-12 08:53:53 |只看作者 |坛友微信交流群

有时候AIC1<AIC2，但是BIC1>BIC2，怎么判断？

使用道具举报

板凳

ivy_cyh 发表于 2011-9-21 21:32:07 |只看作者 |坛友微信交流群

这下明白了。谢谢！

be busy living, be busy dying.

使用道具举报

报纸

muwatuo

发表于 2011-9-24 11:21:52 |只看作者 |坛友微信交流群

高手！能解释下，AIC是如何定义的吗？合理性在哪

使用道具举报

地板

楚韵荆风

发表于 2011-9-24 20:51:13 |只看作者 |坛友微信交流群

AIC是Akaike在1973，1974年提出的，是在K-L信息量（Kullback-Leibler）I（g，f）基础上改进的，基本思想是用一个概率密度函数f去逼近真实的未知的密度函数g，使得I（g，f）达到最小，对于I（g，f）等价的是一个对数似然函数在g下的期望的负数-E_g(log(f(X)))，它的一个无偏估计是-(logf(X1)+logf(X2)+...+log(Xn))，通常在一个参数族｛f_m(.| theta_m)｝选择f_m使得上述无偏估计达到最小，由于我们只有来自g的观测数据Xi (i=1,...,n)，通常采用两步估计法，第一步：对固定的m，求theta的估计，第二步：对所有m求全局极小值，对应的m和theta就是所求的估计，然而这个估计有个缺点：两次使用了数据来估计对数似然（第一次估计theta，第二次由theta的估计计算对数似然函数的值），这样会引起过度拟合，得到的估计自然是有偏的，Akaike通过增加一个偏倚项来修正这种偏倚，从而就定义了AIC准则=-（极大化对数似然）+（待估参数个数），第一项反映的是拟合的优劣程度，第二项增加的是对模型复杂性的惩罚。我们知道一个有限支撑上的连续函数可以用任意一个n阶多项式进行逼近，当多项式的阶数或者系数个数达到数据点的个数时，拟合的误差为0，显然，此时拟合并不好，因此AIC通过增加一个模型的复杂性的惩罚（参数个数），当复杂模型使得对数似然减小时，参数的个数在增加，这样AIC的值不会过小，这就解决了这种过拟合问题，在图像上显示出来是一个U型，也就是有一个合适的模型参数p使得AIC最小，但p不会太小也不会太大，类似于非参数回归中带宽的选择来平衡偏倚和方差。

已有 2 人评分	学术水平	热心指数	信用等级	收起理由
Stakiny	+ 1	+ 1	+ 1	观点有启发
epoh	+ 1	+ 1	+ 1	精彩帖子

总评分: 学术水平 + 2 热心指数 + 2 信用等级 + 2 查看全部评分

共享是一种彼此的快乐

使用道具举报

7楼

ztzt6512 发表于 2011-10-18 14:06:04 |只看作者 |坛友微信交流群

严格上讲，楼上说的还不完全正确，AIC是预测k-L损失函数I（g，f）的渐近无偏估计量，不是无偏估计量，应该才对！另外，BIC是贝叶斯因子(Bayes factor)的大样本近似！两者虽然都是用于模型选择，但目的完全是不同的！ BIC, 有consistency, AIC是没有的，什么意思了，就是假如有一个真实模型存在，随着样本趋向于无穷，BIC是能够以概率1选择这个真实模型， AIC是没有的！我说这么多，可能很多同学不一定明白！简单来讲吧，AIC和BIC的原理是不同的，AIC是从预测角度，选择一个好的模型用来预测，BIC是从拟合角度，选择一个对现有数据拟合最好的模型，从贝叶斯因子的解释来讲，就是边际似然最大的那个模型！因此，他们结论不一致是很正常的！

已有 1 人评分	学术水平	热心指数	信用等级	收起理由
Stakiny	+ 1	+ 1	+ 1	观点有启发

总评分: 学术水平 + 1 热心指数 + 1 信用等级 + 1 查看全部评分

使用道具举报

8楼

pywang61 发表于 2011-11-18 21:37:32 |只看作者 |坛友微信交流群

真是太感謝了~真強、解釋的真好~

使用道具举报

9楼

莣灬Liǘ年 发表于 2011-11-25 22:14:20 |只看作者 |坛友微信交流群

AIC出现负数说明什么？

使用道具举报

10楼

zsy0301 发表于 2011-12-4 14:55:28 |只看作者 |坛友微信交流群

多谢楼主，讲得很透彻。另经估算，gretl中的AIC应该和R中定义相同。

使用道具举报

返回列表

12 3 下一页

发帖

本版微信群

加好友,备注cda
拉您进交流群

手机版 |

意见反馈 |

帮助 |

新手入门 |

用户手册 |

友情链接 |

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

关于AIC的注（欢迎探讨研究） [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群