2.在随机截距模型中加入水平1的自变量,使用AIC,BIC比较模型,并计算R-square
#词汇成绩(gevocab)可能对阅读成绩具有预测作用,要将gevocab作为自变量,则相应的R语句为
Model3.1 <- lme(fixed = geread~gevocab, random = ~1|school, data = Achieve)
#模型固定效应部分,参数fixed = geread~gevocab声明阅读成绩由词汇成绩来预测。
#random部分定义了随机效应和嵌套结构。如果仅需要随机截距,用来表示截距的符号是1。
#在本例中,random = ~1|school声明仅使用随机截距模型,随机截距随学校变化而变化。
summary(Model3.1)
#summary()命令可以提供下列信息:
#Linear mixed-effects model fit by REML
# Data: Achieve
#除了显著性检验之外,我们能够得到AIC,BIC,和log likelihood信息,这些信息可用来进行模型比较。
#我们可以根据AIC和BIC将该模型与零模型的拟合度进行比较,AIC和BIC越小,表示模型拟合越好。
#模型3.1的AIC和BIC分别为43145.2和43145.17。模型3.0的AIC和BIC分别为46274.31和46296.03。
#因为模型3.1的两个指标都较小,因此我们作出结论:模型3.1对数据的拟合更好。
#实质上,这说明我们应当将geread作为自变量包含进模型中,回归系数显著性的检验结果也支持了这一点。
# AIC BIC logLik
# 43145.2 43174.17 -21568.6
#
#Random effects:
# Formula: ~1 | school
# (Intercept) Residual
#StdDev: 0.3158785 1.94074
#
#Fixed effects: geread ~ gevocab
# Value Std.Error DF t-value p-value
#(Intercept) 2.0233559 0.04930868 10159 41.03447 0
#gevocab 0.5128977 0.00837268 10159 61.25850 0
#我们能够得到固定效应斜率和固定效应截距之间的相关,但我们往往不关心这个相关系数。
# Correlation:
# (Intr)
#gevocab -0.758
#
#Standardized Within-Group Residuals:
# Min Q1 Med Q3 Max
#-3.0822506 -0.5734728 -0.2103488 0.3206692 4.4334337
#
#Number of Observations: 10320
#Number of Groups: 160
#我们也能确定geread中的变异中有多少存在于学校层面。
#具体来说,上述结果说明在排除了gevocab的预测作用之后,截距在学校层面的变异为0.3158785*0.3158785,
#而在个体层面(within-school)的变异为1.940740*1.940740。
#在多层模型中,我们可以计算每一个水平的R-square(Snijders & Bosker,1999)。对水平1来说,我们可以计算