大部分信息由链接的权重承载,较少由简单的拓扑结构(度和其他结构特征)承载。社区检测研究网络结构的经典方法是搜索社区,即内部链路密度较大的网络区域。直观地说,这些区域是由级别更高的节点集群形成的,或者对于加权网络,是由强度更大的节点集群形成的。有人提出了几种方法来发现网络社区,而不必预先设定社区的数量,而是让它们从网络本身中涌现出来。在其他方面,我们引用了模块化的优化,这是一种测量链路结构与随机网络的差异程度的方法,在随机网络中,链路被分配有统一的概率,而内部社区不存在(这是函数的一部分)。对于加权网络,模块性由以下公式定义:Qw=2W·Xijwij-sisj2Wδ(ci,cj)(1),其中si=Pjwijand sj=Piwijare分别表示节点i和j的强度(权重之和),W=Pijwijis表示权重和函数的总和,如果(i,j)属于同一社区,则δ(ci,cj)等于1,如果它们是不同社区的成员,则δ(ci,cj)等于0。最大模块化值为1(社区被隔离的理想情况),也可以取负值。0值与对应于整个图形的单个分区一致。负值意味着分离特定集群中的节点没有特别的优势,因此不存在任何社区结构。为了研究社区的存在,通常有必要修剪网络,如果它们的重量低于某个阈值,就切断链接。在我们的例子中,我们打算只考虑由节点构成的链接,它们的财务报表向量具有很大的相似性/权重w。
|