楼主: CDA网校
647 0

[每天一个数据分析师] 广义线性模型 [推广有奖]

管理员

大师

61%

还不是VIP/贵宾

-

威望
3
论坛币
30923 个
通用积分
3005.8973
学术水平
259 点
热心指数
267 点
信用等级
234 点
经验
194341 点
帖子
5081
精华
19
在线时间
3683 小时
注册时间
2019-9-13
最后登录
2024-4-18

初级热心勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
广义线性模型是线性模型的扩展,其特点是不强行改变数据的自然度量,数据可以具有非线性和非恒定方差结构[59],主要是通过联结函数g()(link function),建立响应变量Y的数学期望值 与线性组合的预测变量P之间的关系: 。

与线性模型相比,GLM模型中Y的分布可以是任何形式的指数分布(如高斯分布、泊松分布、二项式分布),联结函数可以是任何单调可微函数(如对数函数logarithm 或逻辑函数logit)。Y的方差通过方程函数 依赖于其数学期望值 ,这里 , 为比例(或者称为离差)参数[57-58,60]。这些优点使得GLM模型可以处理非正态分布的响应变量,同时可包含定性、半定量的预测变量;Y通过连接函数g(E(Y))与线性预测因子P建立联系,不仅确保线性关系,且可保证预测值落在响应变量的变幅内,并可解决数据过度离散的问题,从而使GLM逐渐成为植被-环境关系研究的重要模型,并得到越来越多的关注。
GAM是GLM模型的半参数扩展(semi-parametric extensions)[59],与GLM不同的是其函数的组成成分是光滑函数(smooth Functions)。GAM也是通过联结函数,建立响应变量的数学期望值与预测变量的一个光滑函数的关系: 。假如以物种的出现或缺失为观测变量,则响应变量遵循二项式分布(取值为0或1),某物种出现的概率可用逻辑联结函数(logistic link function)来表示 , GAM形式就可以写为 。
GAM模型的优点,在于其解决响应变量与预测因子间的高度非线性和非单调关系方面的突出能力,是一种基于数据的模型(data-driven),数据决定着响应变量和预测因子之间的关系[58]。同时,GAM模型可同时针对不同的变量,采取不同的策略建模,如可对部分预测因子进行线性拟和,而对其他因子通过光滑函数进行拟和,故GAM有时也称为半参数模型。
正因为如此,GAM模型具有高度的灵活性,且能有效揭示数据中所隐含的生态关系,提高我们对生态系统的理解。这些特点使GAM模型成为植被-环境研究中应用较为广泛的模型之一,并有研究进一步提出了GLM和GAM扩展模型,如矢量广义线性模型(VGLM)和矢量广义相加模型(VGAM),可以容许不止一个线性或相加因子(linear/additive predictor)。另有不少学者则将GAM模型与GIS结合,对植被空间分布进行研究,如A.Lehmann等[18]开发的基于S语言程序模型GRASP可有效地实现GAM分析结果与GIS的结合,将模型建立、验证与空间预测制图统一起来。其他一些统计程序,如SAS、STATISTICA等也逐渐将GAM模型纳入,作为数据挖掘的重要工具。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:广义线性模型 线性模型 Parametric statistica Extensions

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 22:02