楼主: peijianshi
27027 46

[学习分享] 广义可加模型(即GAM)中偏残差图究竟表示什么意思? [推广有奖]

  • 0关注
  • 16粉丝

副教授

80%

还不是VIP/贵宾

-

威望
0
论坛币
638 个
通用积分
2.2489
学术水平
12 点
热心指数
12 点
信用等级
5 点
经验
15373 点
帖子
636
精华
0
在线时间
568 小时
注册时间
2010-3-11
最后登录
2022-9-8

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
接触了四五年的广义可加模型generalized additive models,我一直没有理解最重要的偏残差图形的意思,因为广义可加模型还提供的偏残差图,从数据拟合的结果来看,偏残差反映了单个自变量对因变量的影响。但是既然是残差,又如何能够反映这种影响呢?假设残差符合正态分布,那么偏残差的分布岂不是无规律的吗?但是为什么偏残差可以反映变量间的函数关系呢?
广义可加模型(即GAM)中偏残差图究竟表示什么意思?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:可加模型 GAM Generalized Generalize Additive 模型

R万岁!
沙发
guleijoy 在职认证  发表于 2012-3-23 11:32:53 |只看作者 |坛友微信交流群

使用道具

藤椅
peijianshi 发表于 2012-3-27 18:57:25 |只看作者 |坛友微信交流群
我已经清楚啦。偏残差是指因变量减去期望值后再减去其他变量的s(x)后的残差,对于简单广义可加模型而言(高斯link),使用的是后向拟合法,直到稳定为止,所以偏残差是最后一次拟合(即稳定了)的结果;而对于复杂一些的广义可加模型(比如二项link),则是后向拟合和最大似然共用,类似,不过后向拟合变成了内循环,而外循环还要使用(新)因变量加权值。
偏残差是可以反映某个自变量对因变量的效果(比如指数函数)的大体趋势。呵呵,广义可加从这个层面上讲非常具有弹性和简单。但是,从一开始广义可加模型面临变量间交互作用不请的弱点,尽管Hastie等试图说明可以考虑到这种互动,但是的确不清晰。但不影响这个模型的使用。
R万岁!

使用道具

板凳
ywh19860616 发表于 2012-7-4 08:51:08 |只看作者 |坛友微信交流群
peijianshi 发表于 2012-3-27 18:57
我已经清楚啦。偏残差是指因变量减去期望值后再减去其他变量的s(x)后的残差,对于简单广义可加模型而言(高 ...
peijianshi,您知道Generalized additive model对
样本观测者的大小有无具体要求?比如最小样本量。
一份耕耘,一份收获。

使用道具

报纸
peijianshi 发表于 2012-7-6 17:48:50 |只看作者 |坛友微信交流群
任何统计模型的,当然是样本越多越好。GAMs没有要求,但是如果样本量太小,拟合结果的可靠性肯定较差。呵呵。
已有 1 人评分学术水平 热心指数 收起 理由
ywh19860616 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

R万岁!

使用道具

地板
ywh19860616 发表于 2012-7-7 07:55:51 |只看作者 |坛友微信交流群
peijianshi 发表于 2012-7-6 17:48
任何统计模型的,当然是样本越多越好。GAMs没有要求,但是如果样本量太小,拟合结果的可靠性肯定较差。呵呵 ...
谢谢,应该是这样的,特别是对于非线性或者非参数模型
呵呵,也看了这个模型一段时间了,发展很快,功能越来
越多,希望以后可以像您多多请教。
一份耕耘,一份收获。

使用道具

7
peijianshi 发表于 2012-7-10 10:08:44 |只看作者 |坛友微信交流群
ywh19860616 发表于 2012-7-7 07:55
谢谢,应该是这样的,特别是对于非线性或者非参数模型
呵呵,也看了这个模型一段时间了,发展很快,功能 ...
相互讨论。不用客气。现在都出现了广义可加混合模型了。
R万岁!

使用道具

8
ywh19860616 发表于 2012-7-10 21:48:32 |只看作者 |坛友微信交流群
peijianshi 发表于 2012-7-10 10:08
相互讨论。不用客气。现在都出现了广义可加混合模型了。
是的,您看到比较多了
混合模型和面板数据相似,有2个下标的。
现在一个问题是我用这个模型来研究经济问题,
截面数据样本量太少了,比如世界91个国家。样本量
受到限制。
您一般用这个模型分析哪类问题?
一份耕耘,一份收获。

使用道具

9
ywh19860616 发表于 2012-7-12 08:08:00 |只看作者 |坛友微信交流群
peijianshi 发表于 2012-7-10 10:08
相互讨论。不用客气。现在都出现了广义可加混合模型了。
前辈,可否再请教您一个问题
在mgcv 包的gam函数中一个选项
设置问题:
gam(..,gamma=1,...)
这里的gamma应该如何选取,因为默认为1,
而有时候为了避免overfit,又设置为1.4
您是如何看的?
一份耕耘,一份收获。

使用道具

10
peijianshi 发表于 2012-7-12 12:30:15 |只看作者 |坛友微信交流群
使用非参数模型(包括GAM, LOESS, 神经网络, 树),出现overfit是不可避免的。因为这些方法大多是let the data speak,而不是let the background mechanism speak.
一般而言,除非是建立机制的模型(自己建模,如微分方程组联立),根据模型假设和拟合结果的合理程度才能正确评估是否存在overfit的现象。
所以我个人认为您说的那个选项无实际意义。判断是否overfit关键是要看您的变量是什么,拟合结果又说明了什么,而拟合结果是否符合研究对象学科意义上的逻辑。
一点浅释,莫见笑。可能版主回答的会更科学一些。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
ywh19860616 + 2 + 2 + 2 非常感谢,我就是因为设置不同选项,得到的.

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

R万岁!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-7 02:45