相信大家在使用SPSS软件对数据做因子分析的时候可能会遇到这样的情况,就是有些观测变量是正指标,有些是负指标,而有些是适度指标(流动比率、速动比率、资产负债率等),由于因子分析是通过计算最终公因子的总的分来得出评价结果的高低、好坏,所以适度指标理论上是否应该正向化一下?如果需要正向化又如何处理?
为此我和我的同学电话咨询了科大统计学的一位在读博士,他告诉我们不需要,他说改变的只是特征值和特征向量... ...对结果没有什么影响,听得不是明白,但由于写大论文要使用,结果发现不做正向化的数据很不理想,提取得公因子经济学意义很难解释,而且部分有违常理,遂对适度指标进行正向化,方法有很多种,大家可以在网上多看一下,我这里列举几种供参考,1.x'=1/x(X为原始数据,X'为正向化后数据)这种方法本人感觉不大好,如果是负指标正向化的话,使用比较合适;2.x'=1/|x-A|(A为X的理论最优值,如流动比率一般为2,速冻比率为1,资产负债率为50%),这种方法我试验过,结果还可以;3.x'=1/(1+|x-A|)(变量意义如前)这种方法感觉更优良一些,但是我没有实验过,而且每种方法在不同样本里试验效果有差异,所以不能一概而论那个好坏,以上的3个都是很简单的处理方法,我看到一些比较复杂的处理方法,由于公式不是和好输入,这里面就不介绍了。
我知道这个板块里面有一些是SPSS的高手,我目前由于写大论文正在用因子分析法,所以使用过程中会有一些心得和问题,希望贴出来以后大家可以给与帮助或共同探讨。对与适度指标的正向化处理不知大家有没有什么高见?希望可以共同交流。
PS:看到一些网友问关于数据做因子分析前要不要做标准化的问题,我可以明确的告诉你,不需要,为此我做过试验,拿标准化前后的数据做因子分析,只在结果输出的第一个图里(Descriptive Statistics)数据有变化,既统计变量的均值和方差变为0和1,关于后面具体的results 没有变化。