公司 | 销售净利率 (X1) | 资产净利率 (X2) | 净资产收益率 (X3) | 销售毛利率 (X4) |
歌华有线 五粮液 用友软件 太太药业 浙江阳光 烟台万华 方正科技 红河光明 贵州茅台 中铁二局 红星发展 伊利股份 青岛海尔 湖北宜化 雅戈尔 福建南纸 | 43.31 17.11 21.11 29.55 11.00 17.63 2.73 29.11 20.29 3.99 22.65 4.43 5.40 7.06 19.82 7.26 | 7.39 12.13 6.03 8.62 8.41 13.86 4.22 5.44 9.48 4.64 11.13 7.30 8.90 2.79 10.53 2.99 | 8.73 17.29 7.00 10.13 11.83 15.41 17.16 6.09 12.97 9.35 14.3 14.36 12.53 5.24 18.55 6.99 | 54.89 44.25 89.37 73 25.22 36.44 9.96 56.26 82.23 13.04 50.51 29.04 65.5 19.79 42.04 22.72 |
数据标准化处理后,进行主成分分析,得到一系列表
解释的总方差
初始特征值 提取平方和载入
成份 合计 方差的 % 累积 % 合计 方差的 % 累积 %
1 1.897 47.429 47.429 1.897 47.429 47.429
2 1.550 38.740 86.169 1.550 38.740 86.169
3 .393 9.826 95.995
4 .160 4.005 100.000
提取方法:主成份分析。
提取出两个主成分f1,f2,主成分载荷矩阵如下:
成份矩阵(a)
成份
1 2
Zscore(x1) .731 -.513
Zscore(x2) .818 .503
Zscore(x3) .359 .897
Zscore(x4) .752 -.477
提取方法 :主成份。
a. 已提取了 2 个成份。
将主成分载荷矩阵每列(以第一列为例)的系数
0.730886 |
0.817845 |
0.359033 |
0.751797 |
除以其相应的特征根(1.89716914093361)的开根(1.37737763192728)后得到主成分系数向量:
0.530636 |
0.59377 |
0.260664 |
0.545818 |
则f1=0.530636*zx1+0.59377*zx2+0.260664*zx3+0.545818*zx4,带入第一个标准化后的数据(以歌华有线为例),计算得1.23183373990056,即主成分f1的值。
问题:这样计算有问题么?我在google,检索:“利用spss主成分分析 filetype:doc”,下载名为“主成分分析与因子分析详细的异同和SPSS软件”的文章,上文采用的数据即来自该文章。
按照该文章计算,f1(歌华有线)=
1.23,和我计算的也是一样的。
但是,问题:
spss在数据源窗口中按照主成分分析后,会自动计算FACT1_1,其f1(歌华有线)=0
.89433210502036。和我计算得不一样。请教大家,怎么回事儿?SPSS自动计算得到的FACT1_1,是按照什么公式(步骤)计算的呢?
另外,我计算主成分分析,得到低维的变量,以方便在后面作为BP神经网络的输入端(减少输入),训练模型后用于预测。那么再请教一下,训练好之后,我用一个元组的变量来预测。按照之前的步骤,首先要进行标准化,然后按照主成分得分公式,计算得到f1,f2...的值,带入模型,就可以预测出应变量的值了。
但是,问题:
我这样总体分析思路对么?如果对,如何才能将一个元组里的多个变量值,标准化?