最近碰巧看到一些文章,为大家总结一下作者的关键观点,希望有所帮助。
1. VIF的阈值
在文献中,主要出现了三个VIF的阈值,其中包括最早的10,后来的5,以及更加针对formative indicators的3.3。那我曾经就这个问题跟群友有所讨论,个人认为,标准是衡量多重共线性问题严重程度的的一种手段,他取决于作者可以接受的多重共线性的大小。但是我还是基于实用主义,如果你的vif明明小于三,为什么不引用3.3标准,他明显比5,比10更加显示出你的多重共线性没问题。特别是,当涉及到formative的变量或者量表问题的时候,3.3也是广泛应用的一种标准。
2.共线性的成因
2.1 问卷设计者与答卷者认知的不同
就是说,作者认为两个变量他们是不同的,但是当答卷者在做回答的时候却觉得他们两个是一个范畴的概念,这样容易造成这两个变量数据之间的共线性。我有朋友在其论文收集中,将两个不一样的变量放到一个问卷模块中进行收集,结果出现了强烈共线性,造成一些假设的不显著。这一点设计的时候需要注意。
2.2 自变量中有多余的变量。
作者定义中说,这种情况排除第一种里面说的,也就是说,设计问卷的人和回答问卷的人同时意识到这两个变量是不一样的,但是在答卷者数据回答真实的情况下,却又很强的重复性。作者举例说,研究认识的财富以及实际的财富对某项产品使用的影响,认识的财富主要指的是我觉得我有钱没有,实际的财富,主要是一些数据方便客观的指标,如我的存款等等。但是,财富的认知一定程度上反应自己的实际财富,所以当答卷者给出真实高质量数据的时候,两者具有很强的共线性。
3. 共线性的表现
3.1 R2比较大。
作为smartpls,不给出模型适配度的一些指标。最基本的,我们使用r2来衡量模型解释现象的能力,希望大些为好。但是,如果r2过大,也是共线性的一种表现。因为在衡量自变量之间的共线性上,VIF=1/(1-r2)。可知,如果r2=0.9,那么VIF就已经超过了10。
3.2 变量之间相关系数高
如果你发现你的变量之间有的相关系数大于0.835或者更高,那么最好检测一下vif看一下是否存在共线性。
3.3 Loadings 大于1 (oblique-roted CFA)
验证性因子分析是SMOS等基于方差的结构方程建模的必须经过的一步,如果在此时,发现有loading大于1,也是一种表现。
3.4Cross-loading大于0.5 (不旋转的CFA)
在做CFA的时候会默认给出一个不旋转的解决方案,如果发现一个indicator属于他自己归属的因子之外的因子的loading大于点五,也是一种共线性的警示。
3.5 用Orthogonally rotated方法进行探索性因子分析后,发现超出预期的因子分类。
3.6 就是在验证结构模型的时候,发现路径系数大于1或者小于-1.
4. 共线性的处理
4.1 删除衡量变量的量表问题
这个只能应用于reflective的部分,因为如果indictors和variable之间是formative的关系,那么indictor是不能删除的。
我们可以找出cross loading特别高的一些indictors,考虑删除他的合理性
4.2 将问题归到更适合他的变量中去
也就是说,如果我们的indicator x本来设计的时候属于变量A,但是分析后发现,他到A的loading特别小,但是到B的cross loading反而很大,那么就考虑将x放到B变量下,而不是A变量下的合理性
4.3 删除某个变量
如果发现不仅仅某个indictor是问题的所在,某个变量所有的indictors都问题很大,那么只能考虑删除变量。这个是我们很不乐意见到的,因为这样做,意味着模型的变化。但是如果发现共线性的原因在于此,那么我们必须这么做,要不然没法进行下面的分析。
4.4 关于4.3的问题,也可以根据理论来看,可否把这这个变量的所有indictors并入到与他有特别大cross loading的那个变量中,形成一个新的变量。譬如A的indictors与B的indictors存在很大的共线性,那么久可以考虑是否把A和B合并为新的变量C。
因为我的一些小研究,共线性的问题都不大,vif均低于5,甚至3.3,所以此问题对我不是太严重,但是发现还是有一些朋友再问这些东西,希望有所帮助。主题版权归原作者及期刊所有。
原文出处来自于:Kock, N. and Lynn, G.S. (2012). Lateral collinearity and misleading results in variance-based SEM: an illustration and recommendations. Journal of the Association for Inforamtion Systems, 13(7), 546-580.
P.s.: 鉴于版权,不提供文章下载,请自行下载。