(2)观测变量的个数问题
通常认为,观测变量不宜太多,当然也不宜太少,推荐是3-5个。但是具体的原因是什么,许多书籍对此都语焉不详。
事实上,与样本容量相同,观测变量当然是越多越好,潜变量对应的观测变量越多,说明对潜变量的描述越全面,
然而,观测变量越多,模型就越复杂,通过检验的可能性就变差,同时对样本容量的要求也越高,在客观上增加了
调研的难度。
由于SEM要求变量服从多元正态分布,所谓多元正态分布,并不是每个变量都服从正态分布就可以了。每个变量都服从
正态分布,并不保证整体服从多元正态分布。但是在单个变量都服从正态分布的情况下,变量越多,整体服从多元正态分布的
可能性就越高,因此从这个意义上来讲,当然是观测变量越多越好。
在实践操作中,观测变量多,模型操作的余地就比较大。通常一个潜变量对应的若干观测变量在经历了信度、效度(汇聚、区分)
正态性等等前测后,总会有一些观测变量会被删除,如果自己的观测变量少于3个,这种删除变量提高模型质量的做法就很难进行。
我个人认为,问卷调查时,观测变量不得少于5个,以6-8个为佳,在完成数据前测之后,至少要有5个变量。事实上,观测变量
多了总比少了强,多了可以删,少了可就难办了。
当然,对于以量表形式测量的潜变量来说,即使很简单的量表,通常也有5个以上的题项。但是对于一些没有成熟量表的概念来说,
创造出6-8个题来测量还真不是一件容易的事情。这时候,就要用到心理测量的知识和方法了,此处不予赘述。
需要指出的是,在保证题项多于3个的基础上,还要保证题项的平衡,即模型中,不同潜变量对应的观测变量的个数最好比较接近,
如果相关太多,会影响模型的质量和稳定性。
有不少文章中,一个潜变量只有两个变量,甚至只有一个观测变量,这是肯定不可以的。侯杰泰的书上详细说明了对于单变量的潜变量
在处理时,要注意的一些问题。不难看出,由于需要指定部分载荷系数,因此模型的可信度将受到影响。
题项太多了怎么办,这又是另外一个问题:题项合并,这个我在后面会予以说明
我的QQ:99847730,欢迎交流,批评指正