混合线性模型(proc mixed)
1. GLM是应用最小二乘法原理计算协方差参数的,这一模型对协方差结构有极端的假定。当需要估计尽可能多的方差及协方差参数时,GLM模型有一定的局限性,而基于似然函数法原理的混合效应线性模型分析方法可满足不受协方差参数限制的要求,而且MIXED模型还可以分析观察时间点不相等的资料,也能充分利用具有缺失观察值的资料,它允许资料存在某种相关性及协方差矩阵的多样性,更适应重复测量资料的特点。
2. 一般线性模型(GLM)要求误差项e具有独立一致的正态分布,而许多实际资料不能满足这一假定。Mixed 模型允许误差项具有更灵活的结构,包括相关性和方差的不齐性。
3. 混合效应线性模型(proc mixed)采用最大似然估计法(maximum likelihood,ML)和约束最大似然估计法(restricted maximum likelihood,REML)原理计算协方差矩阵。
4. 应用混合效应线性模型的步骤:
① 确定固定效应和随机效应;
② 选择协方差结构,常见的有7种。
a. 独立结构(又称方差分量结构) VC ,矩阵中含1个协方差参数;
b. 复合对称结构CS,矩阵中含2个协方差参数;
c. 空间幂相关结构 SP(POW),含2个协方差参数;
d. 无结构(又称不规则结构) UN,含n(n+1)/2个协方差参数;
e. 一阶自回归结构 AR(1),含2个协方差参数;
f. 带状主对角结构 UN(1),含n个协方差参数;
g. 循环相关结构 TOEP,含n个协方差参数;
③上述不同的协方差矩阵中,选出似然比统计量(-2 Log Likelihood)、Akaike’s Information Criterion(AIC)、及Schwartz’s Bayesian Criterion(BIC)较小的一个。如果这些统计量很近似,则选含参数个数最少的一个,通常以AIC为主要判断指标。
④ 选定协方差结构后,再筛选固定效应参数,剔除无统计学意义的高阶效应。