|
最后,正如前面关于分类的小节所示,考虑整个网络可能会产生误导,尤其是在不考虑权重的情况下查看连接时,因为这对于某些度量是必要的。2.3.1模块化结构推断网络中模块化结构的标准方法之一是通过模块化最大化。该方法将节点划分为称为模块的子集,这样节点与同一模块中的其他节点连接良好,并且与其他模块中节点的链接数量较少。在模C中给定一个分区P,其模性为q=2mXC∈PXi,j∈CAij公司-kinikoutj2m(2) 其中,Aijis是邻接矩阵的(i,j)元素,kini(kouti)是节点i的入(出)度。最佳划分是模块化最大化的划分。尽管有associatedLMHLMHFigure 4:三个分区中的评级分布,模块化(顶部),层次结构(底部)。虚线是整个样本中节点之间评分的无条件(空)分布。完整标记表示零分布的上方(虚线上方)或下方(虚线下方)表示在1%显著水平的超几何测试中具有统计学意义,并进行Bonferroni校正。优化问题是近似解存在的NP难、快速和可靠的启发式算法,这里采用了著名的Louvain方法【Blondel等人,2008年】。每个月,我们都会发现最佳分区大约有2000个模块。这些网络在规模上确实是异构的:例如,13个最大的网络覆盖了网络中95%以上的节点。我们在至少500个已知评级的每个模块中对风险非均匀分布的无效假设进行超几何检验。这些数字不到1%,大约每月19人。(详见B.3表10)。
|