加权复杂网络社团结构的组合模型
Combination Model of Weighted Complex Network Community Structure
DOI: 10.12677/AAM.2021.105168, PDF, HTML, XML, 下载: 295  浏览: 423  科研立项经费支持
作者: 马领娟, 尹小彩, 苏日娜, 丁爱婷, 高彩霞*:内蒙古大学数学科学学院,内蒙古 呼和浩特
关键词: 加权复杂网络弱社团均值切割算法Weighted Complex Network Weak Community Mean Cutting Algorithm
摘要: 社团结构是复杂网络的一个重要特性,通过对社团结构的检测可以发现网络中藏有的规律。本文利用弱社团定义去识别加权网络的社团结构,提出了优化模型和均值切割算法。数值实验表明对网络进行加权处理更具有现实意义。
Abstract: Community structure is an important characteristic of complex networks, and the hidden rules in networks can be found by detecting the community structure. In this paper, the community structure of weighted networks is identified by using the weak community definition, and an optimization model and a mean cut algorithm are proposed. Numerical experiments show that it is more practical to weight networks.
文章引用:马领娟, 尹小彩, 苏日娜, 丁爱婷, 高彩霞. 加权复杂网络社团结构的组合模型[J]. 应用数学进展, 2021, 10(5): 1592-1597. https://doi.org/10.12677/AAM.2021.105168

1. 引言

复杂网络具有诸多拓扑特性,如小世界网络,无尺度网络等 [1],其中社团结构是其尤为重要的一个特性 [2]。近年来,有关社团结构的检测已有很多较为完善的模型。通过对社团结构检测的研究发现已有的模型和算法都存在着不同的局限性。

模块化函数Q是由Newman和Girvan (2004)定义的,用于检测社团结构的度量函数。Li等人(2008)提出了另一种度量函数D,用来优化社团结构的检测。然而,用模块函数Q和D检测社团结构可能产生分辨率极限,甚至出现错误识别现象 [3] [4] [5]。为了更加定量化地解决社团结构的检测问题,Radicchi等人(2004)提出了弱社团意义下的社团定义 [4]。

由于在现实背景下,复杂网络中节点间的关系是错综复杂的,普通网络已无法展现节点间联系的强弱程度。通过对网络进行加权处理,以便更客观的刻画节点间的重要性,本文中将两个节点间的权重n模拟成节点之间有n条边相连,提出了优化的弱社团定义,即候选子网络中的权重之和应不小于该子网络其余部分的权重之和。通过对网络进行加权处理,建立了一个满足弱社团定义的优化模型,并设计了相应的均值切割算法求解该模型。进一步模拟日本空手道俱乐部的数值算例,验证了所提出的模型和算法具有实用性及有效性。

2. 加权网络社团识别的模型

给定一个加权的无向图 G = ( V , E ) 及其邻接矩阵 A = [ a i j ] G 的顶点集 V = { v 1 , v 2 , , v n } a i j 表示节点 v i v j 之间的联系程度,也就是权重。

本文将 V t 表示为 V 的子集, V ¯ t = V / V t V t 的补集, V t 是定义在弱社团下的,即

M ( V t , V t ) M ( V t , V ¯ t ) (1)

其中

M ( V t , V t ) = i V t j V t a i j , M ( V t , V ¯ t ) = i V t j V t ¯ a i j

在网络 G 中,给定一个划分 P K = ( G 1 , G 2 , , G K ) = ( ( V 1 , E 1 ) , , ( V K , E K ) ) K 是满足弱社团定义的社团数量。在不考虑权重下提出的模块化函数 Q [5] [6]

Q = S = 1 K [ L ( V S , V S ) 2 L ( L ( V S , V S ) + L ( V S , V ¯ S ) 2 L ) 2 ] S = 1 K Q S

和Li等人 [7] 提出的另一种模块化函数 D

D = s = 1 k L ( V s , V s ) L ( V s , V ¯ S ) | V S | S = 1 K D S

其中 L = L ( V , V ) / 2 是网络中的连接总数。这里, Q D 可能会产生错误识别现象及分辨率极限问题。Zhang等人 [8] (2010)提出的组合优化模型

max k = 1 n y k

s . t . k = 1 n x i k = 1 z l k x i k z l k x j k x i k + x j k 1 z l k i = 1 n x i k y k i = 1 n x i k n y k 2 l = 1 L z l k j = 1 n i = 1 n x i k a i j 2 l = 1 L z l k + y k x i k { 0 , 1 } , y k { 0 , 1 } , z l k { 0 , 1 } , i = 1 , 2 , , n , k = 1 , 2 , , n , l = 1 , 2 , , L

其中, n 是网络中的节点数, L 是网络中的边数, z l k 表示边 e l 是否属于 k 社团, e l = ( v i , v j ) 表示连接节点 v i v j 的边, x i k 是指节点 v i 是否属于第 k 个社团 [8]。该模型一定程度上克服了 Q D 所暴露出的错误识别现象及分辨率极限问题,但没有考虑到节点之间的权重影响。

本文在该组合优化模型基础上进行了加权处理,能更进一步表述出社团与社团之间的联系。给定一个加权网络,社团识别问题是将该网络划分成尽可能多的不重叠子网络,使每个子网络满足给定的弱社团定义。

约定 n 是一个正整数,定义下面几个集合

S n = { S R n × n | S }

S 0 n = { S R n × n | S S 0 , d i a g ( S ) = 0 }

其中, S 0 代表矩阵 S 的所有元素都是非负的, d i a g ( S ) 代表由矩阵 S 的对角线上的元素组成的向量 [9]。其中, a i j 表示节点 v i v j 之间的权重,对每一个矩阵 M R n × n ,定义 L ( M ) 是一个 n × n 维的矩阵,它的分量有如下表达式

L ( M ) i j = { M i j , i j k i M i k , i = j

L 构成 R n × n 上的线性算子。对于每一个矩阵 A S 0 n ,构造一个带权重的无向图 G ( V , E ) ,其中 V 是图的顶点集,矩阵 A 是该图邻接矩阵 [9]。

y k 表示第 k 个社团是否为空, y k = 0 当且仅当第 k 个社团没有节点 [8]。即,

y k = { 1 k 0

A k 表示第 k 个社团的邻接矩阵, A k = [ a i j k ] 即,

a i j k = { a i j , v i v j k 0

弱社团定义可以表示为

t r ( L ( A k ) ) 2 i = r a n k ( A k ) + 1 n j = 1 r a n k ( A k ) a i j

即删除候选网络的一些边使得删去的边的总权重比网络其余部分的权重小。其中目标函数

k = 1 n y k t r ( L ( A k ) )

表示出了删去的边的权重尽可能小,且得到的社团越多越好。因此建立了如下社团识别模型:

max k = 1 n y k t r ( L ( A k ) ) s . t . t r ( L ( A k ) ) 2 i = r a n k ( A k ) + 1 n j = 1 r a n k ( A k ) a i j .

3. 均值切割算法

v i G v j G e i j G 内边, s i j 表示 e i j 的权值。如果,仅 v i G v j G 成立,则 e i j 为割边,记为 e i j s i j 表示 e i j 的权值。 G 所有割边组成的集合记为割集 L

步骤1:输入图 G = ( V , E ) k = 1 P ˜ = ϕ ,随机选取 G G ,若满足 ( L ( s ) ) ( L ( s ) ) ,则 G 合格。否则,转到步骤3。

步骤2:判断 E ( L ( s ) ) E ( L ( s ) ) 是否成立,若不等式成立,则 G 为一个合格社团切割, k = k + 1 P ˜ = P ˜ { G } ,否则,返回步骤1。

步骤3:设 G = G \ G ,返回步骤1。

步骤4:重复上述步骤,直到 G = ϕ ,完成所有切割,输出 k P ˜ G 的最优划分。

4. 数值实验

Zachary (1977)通过两年的观察分析了著名空手道俱乐部网络,该网络是由34个节点和78条边组成的,其中节点代表俱乐部的成员,边代表俱乐部成员之间的友谊。由于俱乐部的管理者和俱乐部的教练之间产生了分歧,俱乐部被分成了几个子俱乐部。Zhang等人 [8] (2010)在不加权的条件下,根据弱社团定义将网络划分为以下四个社团(图1):

C 1 = { 5 , 6 , 7 , 11 , 17 } , C 2 = { 24 , 25 , 26 , 27 , 28 , 30 } , C 3 = { 1 , 2 , 3 , 4 , 8 , 12 , 13 , 14 , 18 , 20 , 22 } ,

C 4 = { 9 , 10 , 15 , 16 , 19 , 21 , 23 , 29 , 31 , 32 , 33 , 34 }

然而,在上述划分中俱乐部成员间关系的重要性没有提现。在本文中,通过对边进行加权处理,以权重表示成员间关系的强弱,对该算例进行随机数值模拟。在优化后的弱社团定义下该网络被划分为以下三个社团(图2):

G 1 = { 1 , 4 , 5 , 6 , 7 , 11 , 12 , 13 , 17 , 18 , 22 } , G 2 = { 2 , 3 , 8 , 9 , 10 , 14 , 16 , 20 , 31 , 32 }

G 3 = { 15 , 19 , 20 , 21 , 23 , 24 , 25 , 27 , 28 , 29 , 30 , 33 , 34 }

Figure 1. Unweighted

图1. 不加权

Figure 2. Weighted

图2. 加权

通过对该现实算例进行加权处理,结合现实背景表明加权后的划分更加直观的反映出社团间的关系。

5. 结论

本文基于Radicchi等人(2004)的弱社团意义下的社团定义,提出了一个优化的弱社团定义。根据该定义,建立了加权网络社团结构检测的模型,该模型更进一步阐述了社团与社团之间的联系。为求解该模型,给出均值切割算法,数值实验验证提出的模型及算法对实际问题更具有应用性,但存在使用模型和算法检测到的加权网络社团结构与假设的实验结果有偏差的问题。

基金项目

本文受到内蒙古大学校级大学生创新创业训练计划项目(项目编号:202011223)和内蒙古自治区高等学校科学技术研究项目(项目编号:NJZY19005)的资助。

NOTES

*通讯作者。

参考文献

[1] Albert, R. and Barabási, A.-L. (2002) Statistical Mechanics of Complex Networks. Reviews of Modern Physics, 74, 47-97.
https://doi.org/10.1103/RevModPhys.74.47
[2] Girvan, M. and Newman, M.E.J. (2002) Community Structure in Social and Biological Networks. Proceedings of the National Academy of Sciences of the USA, 99, 7821-7826.
https://doi.org/10.1073/pnas.122653799
[3] Ravasz, E., Somera, A.L., Mongru, D.A., Oltvai, Z.N. and Barabasi, A.-L. (2002) Hierarchical Organization of Modularity in Metabolic Networks. Science, 297, 1551-1555.
https://doi.org/10.1126/science.1073374
[4] Radicchi, F., Castellano, C., Cecconi, F., Loreto, V. and Parisi, D. (2004) Defining and Identifying Communities in Networks. Proceedings of the National Academy of Sciences of the USA, 101, 2658-2663.
https://doi.org/10.1073/pnas.0400054101
[5] Newman, M.E.J. (2006) Modularity and Community Structure in Networks. Proceedings of the National Academy of Sciences of the USA, 103, 8577-8582.
https://doi.org/10.1073/pnas.0601602103
[6] Newman, M.E.J. and Girvan, M. (2004) Finding and Evaluating Community Structure in Networks. Physical Review E, 69, Article ID: 026113.
https://doi.org/10.1103/PhysRevE.69.026113
[7] Li, Z.P., Zhang, S.H., Wang, R.-S., Zhang, X.-S. and Chen, L.N. (2008) Quantitative Function for Community Detection. Physical Review E, 77, Article ID: 036109.
https://doi.org/10.1103/PhysRevE.77.036109
[8] Zhang, X.-S., Li, Z.P., Wang, R.-S. and Wang, Y. (2012) A Combinatorial Model and Algorithm for Globally Searching Community Structure in Complex Networks. Journal of Combinatorial Optimization, 23, 425-442.
https://doi.org/10.1007/s10878-010-9356-0
[9] 刘歆, 吴国宝, 张瑞, 张在坤. 一种连续的谱聚类优化模型[J]. 计算数学, 2018, 40(4): 354-366.