|
(18) 这是簇yi和Yj相交处的对象数。Mis是一个k×l矩阵,其中k和l分别是Y和Y的簇数。让我们将a称为在Y和Y中处于同一簇中的对象对的数量,将b称为在Y和Y中处于两个不同簇中的对象对的数量【33】。然后,将兰德指数定义为a和b的总和,通过对的总数进行归一化[33]:R(Y,Y)=2(a+b)N(N- 1) =kXi=1lXj=1mij公司. (19) 然后,我们将广义超几何分布作为与两个独立集群相关的零假设,并将调整后的兰德指数定义为零假设下兰德指数与其平均值之间的差异,通过该差异可达到的最大值进行归一化[32]:RARI=R- tt+t- t、 (20)其中t=Pki=1|易|, t=Plj=1|Yj公司|, t=2ttN(N-1).我们将使用这两种方法来调整光谱聚类中的参数。5.3. 聚类数的选择为了在谱聚类中调整聚类数n,我们将聚类结果与每种相关类型的位置代理划分进行比较。位置代理是基于串相关的谱聚类结果,这意味着我们需要确定位置代理的聚类数。这可以通过在n和ns之间构建关系来实现:ns=(144 n≤ 144n n>144,(21),其中144是MISO中不同“名称代码”的数量(见第3.6节)。如果ns=144,我们使用的信息与使用“代码”分区的信息完全相同。如果ns>144,我们会使用比代码提供的信息更多的信息,因为有些代码会被分为几个部分。如果聚类评估需要更多信息,它将随着聚类数n的增加而增加。对于n为1到300的每种类型的相关度量,我们计算相对于位置代理的RARI。
|