骄傲的小矮人 发表于 2013-2-25 10:05
控制变量和自变量放在一起的话,解释时还怎么体现出了“控制了**因素之后...”呢? 望大侠赐教
那是很久以前的帖子了,呵呵。
大概情况是这样:在实际研究中,控制变量和研究变量肯定是混在一起的,只是我们的研究对某项变量感兴趣,这就是所谓研究变量(自变量)了,但其他影响因素也必须考虑,其实也就是说有些我们不想要的变量,但它们的的确确存在,而且影响我们的研究结果,那么,怎么才能客观地在有其它变量存在的情况下衡量研究变量(自变量)的影响呢?最常见的方法,就是将我们研究中存在的其它变量(也叫混杂因素了)固定于某个水平(在连续变量,多取平均数;在分类变量,多取最小或最大水平),研究变量的所有结果,都是相对于这些混杂因素的某个取值而言的,所谓“在控制了**因素之后”,其含义其实就是自变量的所有变化,都有一个统一的比较水平,而不是一部分值是在混杂变量最小值的时候取得的,而另一部分是在混杂变量是最大值的时候取得的。只有这样比较才本质上公平,是不是?
俺不是专业的,措辞可能不严谨不连贯,就请多多包涵了,呵呵。
其实呢,“在控制了**因素之后”很有些套话的意味,但大家都这么说,显得对统计原理是了解的,呵呵。现在多因素分析都用程序,估计没人会手工将研究因素的值“对齐”于某个混杂因素的某水平,这样说,仅仅说明了我的研究已经考虑到了混杂因素的存在,也考虑到了比较基线的一致性。