|
还值得一提的是,找到精确的最大模块化是一个NP难问题,人们不希望有算法来解决它。2.4.2归一化谱聚类(NSC)NSC是一种算法,它将相似矩阵和聚类数k作为输入,并将数据集划分如下[34,36]。算法NSC algorithmW=(wij)i,j=1,2,。。。,n: 相似矩阵xk:聚类数d:di=nPj=1wij,i=1,2,nL=D- W:拉普拉斯矩阵ν,ν,νk← Eigne问题k个最小特征值的特征向量Lν=λDνV∈ Rn×k← 带ν,ν,νkas columnsyi∈ Rk,i=1,2,n← VC第i行的对应向量,C,Ck公司← 彝族群∈ Rk,i=1,2,n通过k-means算法但是什么是k的好选择?回答这个问题的一个工具是特征间隙启发式[36]。将相似矩阵的拉普拉斯L的排序特征值定义为λ,λ,λn,特征向量表示网络应划分为k个簇,以便λk+1明显大于λ,λk。换句话说,如果k=1,2,…,最大间隙在λk和λk+1之间,n- 1在相似矩阵的拉普拉斯特征值排序中,我们将网络划分为K簇。2.5调整后的兰德指数(ARI)兰德指数【37】是统计中的一种度量,用于量化数据集两部分之间的相似性。ARI是针对偶然性进行修正的兰德指数的另一个版本。给定两个分区,即包含n个元素的集合S的A和B,A={A,A,…,Ar}和B={B,B,…,Bs}的ARI为ARI=Pij日本国立卫生研究院-“Pi人工智能Pj公司北京#n圆周率人工智能+圆周率人工智能-“Pi人工智能Pj公司北京#n(13) 其中nij=| Ai∩ Bj |,ai=sPj=1nij,Bj=rPi=1nij。
|