定义一:设阈值T是给定的正数,如果集合G中任意两个元素的距离d_ij都满足:d_ij<T(i,j \in G),则称G对于阈值T组成一个类。定义二:设阈值T是给定的正数,如果集合G中每个i \in G都满足下面条件,其中n是集合元素个数,则称G对于阈值T组成一个类:
\[\frac{1}{n-1}\sum_{j \in G}d_ij<=T\]
定义三:设T和H(H>T)是两个给定的正数,如果集合G中的两两元素距离的平均满足下条件,则真G对于阈值T,H形成一个类:
\[\frac{1}{n(n-1)}\sum_{i \in G}\sum_{j \in G}d_ij \leq T,d_ij \leq H\]
定义四:设T是给定正数,将集合G任意一i\inG,一定存在j inG,使得两元素的距离d_ij满足下面条件,则称G对于阈值T形成分类:
\[d_{ij} \leq T\]
定义五:设阈值T是给定的正数,将集合G任意分为两类:G1和G2,这两类之间的距离D(G1,G2)满足:D(G1,G2)<T,则称G对于阈值T组成一个类。
设类G包含n个样本,其中X_(t)为m维总体的样本,通常用下面三种特征刻画类:
(1)均值或者质心:
\[{\bar{X}}_G=\frac{1}{n}\sum_{t=1}^{n}X_{(t)}\]
(2)样本离差阵A_G级样本协方差阵S_G:
\[A_G=\sum{t=1}^{n}(X_{(t)}-{\bar{X}}_G)(X_{(t)}-{\bar{X}}_G)',\,S_G=\frac{1}{n-1}A_G\]
(3)类的直径:用D_G表示类G的直径,常用的直径有:
\[D_G=\sum_{t=1}^{n}(X_{(t)}-{\bar{X}}_G)'(X_{(t)}-{\bar{X}}_G)=tr(A_G),\,D_G=\max_{i,j \in G}d_ij\]


雷达卡


京公网安备 11010802022788号







