有n个样本,m个指标,得到观测数据x_ij , i=1,2,...,n; j=1,2,...,m.
\[\begin{alignat}{1}&均值:\bar{x_j}=\frac{1}{n}\sum_{t=1}^{n}x_{tj} j=1,2,...,m \\
&标准差:s_j=\sqrt{\frac{1}{n-1}\sum_{t=1}^{n}(x_{tj}-\bar{x_j})^2 } j=1,2,...,m\\
&极差:R_j=\max_{t=1,2..,n} x_{tj}-\min_{t=1,2,..n} x_{tj} j=1,2,...,m \end{alignat}\]
1.中心化变换:变换之后均值为0,协方差阵不变,可以用来方便地计算样本协方差阵。
\[{x_{ij}}^*=x_{ij}-\bar{x_j} i=1,2,...,n; j=1,2,...,m\\S^*=S=(s_{ij})_{m \times m}\\其中s_ij=\frac{1}{n-1}\sum_{t=1}^{n}(x_{ti}-\bar{x_i})(x_{tj}-\bar{x_j})=\frac{1}{n-1}\sum_{t=1}^{n}{x_{ti}}^*{x_{tj}}^*\]
2.标准化变换:变换之后每个变量均值为0,标准差为1,变换后的数据与变量的量纲无关。
\[{x_{ij}}^*=\frac{x_{ij}-\bar{x_j}}{s_j} \, i=1,2,...,n; j=1,2,...,m\]
3.极差标准化变换:变换后每个变量样本均值为0,极差为1,变换后数据绝对值数据在(-1,1)中,能减少分析计算中的误差,
无量纲。
\[{x_{ij}}^*=\frac{x_{ij}-\bar{x_j}}{R_j}\, i=1,2,...,n; j=1,2,...,m\]
4.极差正规化变换:变换后数据在[0,1]之间;极差为1,无量纲。
\[{x_{ij}}^*=\frac{x_{ij}-\min_{1 \leq t \leq n}}{R_j}\, i=1,2,...,n; j=1,2,...,m\]
5.对数变换:将具有指数特征的数据结构变换为现行数据结构。
\[{x_{ij}}^*=\ln(x_{ij})\,x_{ij}>0 \, i=1,2,...,n; j=1,2,...,m\]
还有平方根变换和立方根变换把非线性数据结构变为线性数据结构。


雷达卡




京公网安备 11010802022788号







