样本总方差为p维矩阵tr(Σ)。
主成分分析是把p个随机变量的总方差tr(Σ),分解为p个不相关的随机变量的方差之和。
各个主成分的方向用特征向量表示
各个主成分的方差——即相应的特征根表明了该主成分的在该方向上的方差,方差的值越大,表明主成分综合原始变量的能力越强。
【结合书中的散点图可以理解。P116,图5-1】
是以能够解释累计贡献率的含义:这几个新的方向上集合的方差能够代表样本总方差的百分比。
虽然主成分的贡献率这一指标给出了选取主成分的一个准则,但是累计贡献率只是表达了前m个主成分提取了的多少信息,它并没有表达某个变量被提取了多少信息,因此仅仅使用累计贡献率这一准则,并不能保证每个变量都被提取了足够的信息。因此,有时还往往需要另一个辅助的准则。——这就是信息提取率。
信息提取率的含义就是:变换之后,原来的p维向量方向上向量在新的坐标系下的信息表达水平。