HLM使用心得(有收获,有问题、会更新)
近期才知道有HLM模型,觉得有点意思,于是乎就学习了下,有点心得与大家共享。
一、什么是HLM
中文名为跨层次线性分析模型。
首先来说说这个“层”,可以是两层,也可以是三层。比如对北京市居民的调研,一是分区(平原区、丘陵区、山区),二是可以分村镇(城镇、近郊村、远郊村),三是个人层面。由此,对于某个居民来说,从他/她身上观测到的特征,一是个人独立拥有的,二是村镇整体的特征在个人身上的体现,三是区特征在个人身上的体现。
其次说说这个线性模型,简单来说就是两个OLS模型(以两层模型为例),一个在个体level-1层面,一个在团体level-2层面(在上文的例子来看,可以是村镇或者区层面)。由此,要注意个体自变量(请注意解释变量大致可以分为:自变量+控制变量)分成两类,一是个体层面度量获得的自变量,叫作level-1预测因子,二是在团体层面度量获得的,叫作level-2预测因子。在个体和团队层面都可以有一些控制变量,比如个体的年龄、团体成立的时间。
模型有几点需要注意的(操作步骤类此):
一是每层都是线性模型;
二是空模型的设定在第一层,注意第一层公式只有一个,第二层公式数量取决于第一层需要得到的回归系数数量;
三是空模型中的第一个层公式加入level-1预测因子,成为随机模型;
四是随机模型的第二层的第一个公式(以第一层公式的截距项系数作为因变量)加入level-2预测因子,则成为截距模型;
五是在截距模型基础上,对第二层的第二个公式(第一层公式的自变量系数作为因变量)加入level-2预测因子,则成为斜率模型。
最后要强调下,如一般线性模型一样,多层次线性模型依旧是用来揭示和解读自变量和因变量的因果关系,两者的区别无非是将用作解释的因素从个体成面提升到了团队层面,因此重中之重在与:一是系数的大小及显著性;二是模型整体的拟合优度(Deviance-变异值的变化等)
一、使用HLM的步骤
1.需要有个HLM的软件。作为收费软件,HLM提供了免费的学生版,有点良心。但是学生版可以跑的变量十分有限,应该不超过5个。当然,HLM也不允许有太多变量,否则不易聚合。
2. 要有个数据集(用于level-1公式计算),包括个体变量;根据分类分量汇总出一个新的数据集(用于level-2公式计算),包括团体变量。
3. 确定是否存在组间效应,即进行分层次的研究是否有必要(通过空模型完成,只要在第一层公式中将因变量设定,其他不需要有变量即可),只有当:组间方差/(组间方差+组内方差)>0.059,才行,当然越大越好。