因子分析一般都是针对类似的变量进行降维的。
一般而言,进行因子分析的变量一定是连续变量。心理学里面有量表,量表一般都是用这个方法降维。不过我们在许多社会调查数据中得到的结果都是分类变量(比如态度是五分类的)。这个时候,如果允许较大程度的误差的话,分类变量是可以使用因子分析的,不过也必然会受到质疑。
因子分析的作用是在若干相似变量中提取公因子(这也暗示了一定要连续变量才可以),简化模型。比如:假设我们研究中要使用20个变量,但有五个可以提取因子成为一个新变量,另外五个也可以提一个。那么,分析师侯,纳入模型的就会有十二个。统计追求的是简洁明了,所以,它的作用大概就在这里。使用时候因地制宜吧,没有万能的方法。
进行logistic回归中有无必要进行因子分析:这个还是要看你所研究变量自身的属性,如上所述。
再有,logistic回归中四步和五步的比较:如果他们俩的区分度相等,那么,就像二楼朋友讲的,看它们其他方面的区别,比如AIC、BIC等,不一定非要几步,这个没有强制规定的。不过,我们在这个时候要比较四步模型和五步模型的-2LL或者-LL(不同统计软件报告方式不同),以及伪R方。这两个指标的意思就是:在likelihood估计中,-2LL是估计大小的问题,即模型有无作用,作用大致上是好是坏,这个遵循AIC,BIC。而伪R方就类似OLS和GLS的确定系数,是模型的解释力有多大。总的来看,-2ll越小,伪R方越大,模型越可取。


雷达卡





京公网安备 11010802022788号







