在主成分分析(Principal Component Analysis,PCA)中,对应指标的系数称为主成分载荷(Principal Component Loadings)。主成分载荷表示原始变量与每个主成分之间的线性关系强度。
假设我们有一个包含 p 个变量的数据集,进行 PCA 后得到 k 个主成分。那么对于第 j 个主成分和第 i 个变量,它们之间的载荷可以通过以下公式计算:
载荷(Loading) = 第 j 个主成分的标准化得分 × 第 i 个变量的标准差 / 根号下该主成分的特征值
其中,第 j 个主成分的标准化得分是将原始数据在该主成分上的投影,第 i 个变量的标准差是该变量在数据集中的标准差,该主成分的特征值表示该主成分所解释的方差。
具体而言,假设我们有一个数据矩阵 X,其中每一列代表一个变量,行代表一个观测样本。经过 PCA 计算后,得到了 k 个主成分,其中第 j 个主成分的标准化得分存储在向量 Z_j 中,第 i 个变量的标准差为 sigma_i,第 j 个主成分的特征值为 lambda_j。那么第 j 个主成分和第 i 个变量之间的载荷可表示为:
Loading_ij = Z_j * sigma_i / sqrt(lambda_j)
这样,对于每个主成分和对应的变量,都可以计算得到其对应的载荷值。
需要注意的是,PCA 的结果会对变量进行标准化处理,使得每个变量具有零均值和单位方差。这样做是为了消除不同变量之间的尺度差异,确保主成分载荷的比较公平和可解释性。载荷值的绝对大小表示了变量与主成分之间的相关强度,正负号表示了它们之间的正负关系。