按: 原来以为这个系列贴会有比较多的人关注,现在看来看的人不多,回复的就更少了,呵呵,有点失望
如果有人愿意做更深次的讨论的话,可以联系我
QQ:99847730
Email: tozhouyy@126.com
(3)模型的大小与合适的模型
尽管已经有越来越多的人认识到,SEM只是一个工具,应用时相关实证模型的理论基础才是最重要的。但是在国内期刊的
论文中,还是明显能够看到为应用而应用的情况。就好象前面有一个帖子问“SEM能够用于面板数据”,先不说能用不能用,单
就是这种思路就有问题,如果论文中应用的是面板数据,当然应当是问“面板数据用什么方法来求解比较科学”。为数据找科学
的方法,而不是因为熟悉了一个方法,就想尽办法来应用它。
实证研究中,永远都是理论是第一位的,逻辑推理是第二位的,模型构建是第三位的,统计方法是最末位的。
用过线性回归的朋友都有过这样的印象,同样的数据,如果一次列入比较多的自变量,模型通过的可能性就会比较低,如果
列入的变量比较少,甚至只有单自变量,则能够通过检验的可能性大大增加。对于SEM来说,同样存在这样的问题。
经常有人问我:我的模型(假设)通不过检验怎么办?我答:把模型做简单点。也许这是唯一简捷的方法。不可否认,一个复杂
的模型确实很有震撼力,但是面对一堆较低的指标,通常也是很尴尬的事情。
然而,我的意思并不是让大家都做简单的模型。相反,在大的模型能够通过检验的情况下,尽量还是用大的模型。大的模型包含了
多的潜变量,它相当于把所有的研究变量纳入一个系统中研究,而如果拆分成一个个小的模型,只能研究在不考虑其他变量的情况下,
小的模型中所涉及到的变量之间的关系。
一个不得不面对的问题是:一个假设,如果放在大模型中检验,结果显示通不过,但是放到小模型中检验,却通过了。我们该相信谁?
我的观点:如果理论支持复杂的模型,我们就应当以大模型的结果为准。而如果你想创新理论,则不妨先从小一点的模型做起,再逐步
放大模型的规模。
那么,什么是“合适的模型”。一个合适的模型,至少应当满足以下条件:
(1)模型的建立有明确的理论支持;
(2)模型中的变量应当包括该研究中大多数变量;
(3)模型所涉及到的“边界”是清晰的(什么是模型的边界,这是个很抽象的概念,大家意会吧)
(4)模型中的假设应当有超过一半是显著的(否则你的理论肯定是有问题,或者模型的边界不够清晰,比如你把一些关系不大的变量也纳入模型中了)
(5)模型的输出结果是可解释的,即使是未通过检验的假设,也有尽可能合理的解释。
颇为遗憾的是,在许多论文中,我们只能看到作者呈现的最终结果,至于模型被检验、甚至是被修正的过程,限于篇幅或者其它众所周知的原因,都
没有报告,我们无法判断模型是否是合适的,有时甚至难以判断模型是否是“边界清晰”的。有的作者甚至只呈现出一个输出结果,连这个输出结果是
用“大”模型还是“小”模型输出的,都没有办法判断。
还有一些作者,在学位论文中,用了一个大的模型,然后把这个大模型分拆成若干个小的模型,分别发表出来,有时路径系数甚至都是相同的,呵呵
还有一些更夸张的做法:比如假设是一条一条验证的,然后自己手绘一个SEM模型图,把一条一条验证的结果同时绘在这张图上。
对于大模型与小模型的检验结果相矛盾这个问题上,我想值得统计学家来研究一下。以上我的想法仅供大家参考,谢谢