关于共线性问题的成因，表现，及应对 - LISREL、AMOS等结构方程模型分析软件

1关注
35粉丝

讲师

55%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 51836 个
通用积分: 9.0234
学术水平: 28 点
热心指数: 22 点
信用等级: 12 点
经验: 10233 点
帖子: 681
精华: 0
在线时间: 326 小时
注册时间: 2007-9-9
最后登录: 2023-10-30

楼主

jialin3105 发表于 2013-6-9 09:32:48 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

最近碰巧看到一些文章，为大家总结一下作者的关键观点，希望有所帮助。

1. VIF的阈值
在文献中，主要出现了三个VIF的阈值，其中包括最早的10，后来的5，以及更加针对formative indicators的3.3。那我曾经就这个问题跟群友有所讨论，个人认为，标准是衡量多重共线性问题严重程度的的一种手段，他取决于作者可以接受的多重共线性的大小。但是我还是基于实用主义，如果你的vif明明小于三，为什么不引用3.3标准，他明显比5，比10更加显示出你的多重共线性没问题。特别是，当涉及到formative的变量或者量表问题的时候，3.3也是广泛应用的一种标准。

2.共线性的成因
2.1 问卷设计者与答卷者认知的不同
就是说，作者认为两个变量他们是不同的，但是当答卷者在做回答的时候却觉得他们两个是一个范畴的概念，这样容易造成这两个变量数据之间的共线性。我有朋友在其论文收集中，将两个不一样的变量放到一个问卷模块中进行收集，结果出现了强烈共线性，造成一些假设的不显著。这一点设计的时候需要注意。
2.2 自变量中有多余的变量。
作者定义中说，这种情况排除第一种里面说的，也就是说，设计问卷的人和回答问卷的人同时意识到这两个变量是不一样的，但是在答卷者数据回答真实的情况下，却又很强的重复性。作者举例说，研究认识的财富以及实际的财富对某项产品使用的影响，认识的财富主要指的是我觉得我有钱没有，实际的财富，主要是一些数据方便客观的指标，如我的存款等等。但是，财富的认知一定程度上反应自己的实际财富，所以当答卷者给出真实高质量数据的时候，两者具有很强的共线性。

3. 共线性的表现
3.1 R2比较大。
作为smartpls，不给出模型适配度的一些指标。最基本的，我们使用r2来衡量模型解释现象的能力，希望大些为好。但是，如果r2过大，也是共线性的一种表现。因为在衡量自变量之间的共线性上，VIF=1/(1-r2)。可知，如果r2=0.9，那么VIF就已经超过了10。
3.2 变量之间相关系数高
如果你发现你的变量之间有的相关系数大于0.835或者更高，那么最好检测一下vif看一下是否存在共线性。
3.3 Loadings 大于1 （oblique-roted CFA）
验证性因子分析是SMOS等基于方差的结构方程建模的必须经过的一步，如果在此时，发现有loading大于1，也是一种表现。
3.4Cross-loading大于0.5 （不旋转的CFA）
在做CFA的时候会默认给出一个不旋转的解决方案，如果发现一个indicator属于他自己归属的因子之外的因子的loading大于点五，也是一种共线性的警示。
3.5 用Orthogonally rotated方法进行探索性因子分析后，发现超出预期的因子分类。
3.6 就是在验证结构模型的时候，发现路径系数大于1或者小于-1.

4. 共线性的处理
4.1 删除衡量变量的量表问题
这个只能应用于reflective的部分，因为如果indictors和variable之间是formative的关系，那么indictor是不能删除的。
我们可以找出cross loading特别高的一些indictors，考虑删除他的合理性
4.2 将问题归到更适合他的变量中去
也就是说，如果我们的indicator x本来设计的时候属于变量A，但是分析后发现，他到A的loading特别小，但是到B的cross loading反而很大，那么就考虑将x放到B变量下，而不是A变量下的合理性
4.3 删除某个变量
如果发现不仅仅某个indictor是问题的所在，某个变量所有的indictors都问题很大，那么只能考虑删除变量。这个是我们很不乐意见到的，因为这样做，意味着模型的变化。但是如果发现共线性的原因在于此，那么我们必须这么做，要不然没法进行下面的分析。
4.4 关于4.3的问题，也可以根据理论来看，可否把这这个变量的所有indictors并入到与他有特别大cross loading的那个变量中，形成一个新的变量。譬如A的indictors与B的indictors存在很大的共线性，那么久可以考虑是否把A和B合并为新的变量C。

因为我的一些小研究，共线性的问题都不大，vif均低于5，甚至3.3，所以此问题对我不是太严重，但是发现还是有一些朋友再问这些东西，希望有所帮助。主题版权归原作者及期刊所有。

原文出处来自于：Kock, N. and Lynn, G.S. (2012). Lateral collinearity and misleading results in variance-based SEM: an illustration and recommendations. Journal of the Association for Inforamtion Systems, 13(7), 546-580.

P.s.: 鉴于版权，不提供文章下载，请自行下载。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏13 回帖

关键词：共线性性问题 Collinearity illustration Association 实用主义文章

[学习分享] 关于共线性问题的成因，表现，及应对 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

[学习分享] 关于共线性问题的成因，表现，及应对 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群