这段时间,在琢磨主成分分析和因子分析,体会是:
主成分分析:
1.用较少的变量表示原来的样本;
2.目的是样本数据信息损失最小的原则下,对高维变量进行降维。
3.参数估计,一般是求相关矩阵的特征值和相应的特征向量(主成分分析法),取前几个计算主成分。
4.应用:应用较少变量来解释各个样本的特征(数据降维、综合平价)。
因子分析:
1.用较少的因子表示原来的变量;
2.目的是尽可能保持原变量相互关系(结构)原则下;寻找变量的公共因子。
3.参数估计,指定几个公因子,将其还原成相关系数矩阵,在和原样本相关矩阵最相似(最大似然法)原则下,估计各个公因子的估计值。
4.应用:找到具有本质意义的少量因子来归纳原来变量的特征(因子降维、潜在因子)。
本人是研究算法的,因此可认为:因子分析用最大似然估计法可能反映了数据分析的本质。
最近对我们的DPS中因子分析的最大似然法进行了重大改进,参数估计速度、精度提高了许多,相见:
http://www.chinadps.net/whatsnew1.htm