小弟的本科论文应用了因子分析方法,今天刚刚答辩完毕,趁着还有热乎劲想总结应用因子分析法过程之中的两个问题,以给未来应用它的朋友些许启示。
1、因子分析得出的因子得分组内具有可比性,组与组没有可比性。
小弟是对五年的财务数据进行因子分析,要比较这些财务数据的变化。开始本按照很多篇文献的做法,对每年的财务数据分别进行一遍因子分析,结果再比较它们得出的因子得分均值的时候,发现这些均值都趋近于0。看着很多篇文献拿着这些趋近于零的均值进行比较我就纳闷了,这个均值为什么都是0呢?这有可比性吗?我就上论坛去搜索寻找答案,发现很多人都遇到了这个问题,但是都没有人给予一个统一的答复;或者虽然给予了一个统一的“这个均值本来就应该等于0”,也没有对我这种情形给予解决的办法。比如说这些帖子(你们都有统一答复了!!):
https://bbs.pinggu.org/thread-741729-1-1.html
https://bbs.pinggu.org/thread-962370-1-1.html
https://bbs.pinggu.org/thread-1200353-1-1.html
https://bbs.pinggu.org/thread-1383246-1-1.html
因子分析后计算的因子得分均值为0,数值在0上下浮动,有正有负,因子得分组内具有可比性,组与组之间没有可比性。那这就说明很多文献中都错误的应用了因子分析法,他们比较趋近于0的得分均值是没有意义的。那我的做法就是,将五组数据合并成为一组,做一遍因子分析,当然每一个样本都是有时间作为第二关键字的,最后按时间分组计算因子得分均值,这时候因为处在一个组内,所以就有可比性了。
2、数据的正向化处理
关于这个,有一个帖子解释的非常详细,并且经过我的实践应用,我发现那几种方法都非常合适,这里一块总结在此:
https://bbs.pinggu.org/thread-201674-1-1.html