SPSS计算变量
这是我之前做的一点工作,希望对你有用
确定主成分的个数m(注意:m<p)
Analyze—Data Reduction—Factor(打开Factor Analyze对话框)—Descriptive—Initial Solution; KMO and Bartlett’s test of sphericity—Continue—Extraction--(全部是默认即可:Method: Principle Components(主成分分析法);Correlation Matrix(显示相关系数矩阵;Unrotated factor solution(未旋转结果,这是主成分分析和因子分析核心差别);Eigenvalue Over 1 (提取特征值大于1的成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。);Max Iterations for Convergence(最大迭代次数))—Continue—Rotation—None(无旋转)—Continue—OK
主成分个数m的确定依据输出表(方差分解主成分提取分析表)
Total Variance Explained
Component | Initial Eigenvalues | Extraction Sums of Squared Loadings |
Total | % of Variance | Cumulative % | Total | % of Variance | Cumulative % |
1 | 3.050 | 61.008 | 61.008 | 3.050 | 61.008 | 61.008 |
2 | 1.370 | 27.394 | 88.401 | 1.370 | 27.394 | 88.401 |
3 | .398 | 7.970 | 96.371 | | | |
4 | .181 | 3.629 | 100.000 | | | |
5 | 3.95E-012 | 7.89E-011 | 100.000 | | | |
Extraction Method: Principal Component Analysis.
从中选取Initial Eigenvalues 大于1 的成分因子,本例中为1和2;二者的累积贡献率已达88.401%。特征值的贡献还可以从SPSS的所谓碎石图看出,选择Extraction--Screen Plot
5.确定主成分 的表达式
从输出结果我们还能得到 Component Matrix(初始因子载荷矩阵),由此矩阵可以进一步探究第一主成分主要反映每户拥有电话机、专业人员占总就业人员比例、农业从业人员人均受教育年限(年)、知识化指数四个指标的基本信息,第二主成分主要反映科技投入占农业增加值比例这一指标的信息。所以提取的两个主成分基本可以反映全部指标的信息,可以用这两个新组合变量来代替原来变量。但是这两个变量的表达式不能从Component Matrix看出。
用Component Matrix除以主成分对应的特征值的平方根便可以得到每个指标的系数。具体步骤:
将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(命名为变量B1 、B2 ),然后利“Transform--Compute Variable”,在Compute Variable对话框中输入“A1=B1/SQR(3.05)[注:第二主成分SQR后的括号中填1.37],即可得到特征向量A1,同理可得到特征向量A2。将得到的特征向量与标准化后的数据(变量)相乘,就可以得出主成分表达式。