1. 引言
在自然界中,我们经常看到迁徙的大雁群,共筑巢穴的蜜蜂群,以及协同搬运食物的蚂蚁群等一致性的行为。尽管每个生物体自身的能力有限,但是通过合作却能够创造出超越个体能力之和的总价值。多智能体系统 [1] 的思想正来源于此,并在一致性控制问题 [2]、编队控制 [3]、包围控制 [4]、群集控制 [5] 等方面展开深入的研究。
包围控制是指通过利用合适的算法,驱使所有跟随者的状态最终进入到由领导者所产生的凸包内。它具有更广泛的工程应用价值。例如,当航空母舰在海上航行时,护航舰队们利用包围控制算法将航母包围在中间,以保护航母。正是由于包围控制在具体的工程应用上具有广泛的价值,从而引起了学者们的研究热潮。如在文献 [6] 中,作者通过自适应内部模型和递归稳定控制律,提出了一种分布式包围控制方案,使得智能体能够进入到由领导者所形成的凸包内。文献 [7] 针对具有输入饱和的线性多智能体系统,通过一种新的低增益反馈方法,分别提出了状态反馈和输出反馈包围控制协议。文献 [8] 讨论了具有有向交互拓扑的时滞高阶线性时不变多智能体系统的编队包围控制问题,并将时滞多智能体系统的编队包围控制问题转化为时滞系统的渐近稳定性问题。在文献 [9] 中,作者研究了具有通信时变时滞的一般线性多智能体系统的包围控制问题。基于有向交互拓扑,给出了反馈控制器存在的一些充分条件,保证了所需的控制效果。
值得一提的是,现有的研究大多集中在多智能体系统的渐近收敛问题上。然而,在实际应用中,通常要求系统高效地完成给定的任务。在这种情况下,渐近收敛不足以满足要求,因此需要研究具有更好收敛特性的有限时间问题。例如,在文献 [10] 中,作者研究了具有不确定非线性动态和有向通信约束的多网络系统的编队包围控制问题,并提出了一种分布式自适应有限时间控制方法。文献 [11] 中的工作考虑了具有完全未知输入的虚拟领导者的二阶多智能体系统的有限时间编队包围跟踪问题,并引入了三层递阶结构。这些结果表明,尽管有限时间稳定性具有更好的收敛特性,但是系统的初始值会影响收敛时间的上界。此外,在实际应用中很难获得系统的初始值。基于此,大量学者对固定时间包围控制问题进行了研究,如在文献 [12] 中,作者介绍了有向拓扑下网络化非线性系统的分布式固定时间包围控制问题,并首次提出了一种无连续控制更新的分布式事件触发控制协议。文献 [13] 中,作者提出了一种分布式固定时间控制协议,在固定的交互拓扑上引导领导者达成外部一致,并使得所有跟随者进入领导者形成的凸包。
与现有的包围控制问题不同的是,本文给出的场景中的一些领导者与邻居有着相反的表现,我们称这类问题为准包围控制问题。在多智能体系统中,以相反的状态欺骗他人的节点称为对抗性节点。它是从一个群体中的一些个体为了增强感染力或避免与主流观点的差异而隐藏真实观点并表达修正观点的普遍情况下抽象出来的。具有对抗性节点的系统表现出与普通系统完全不同的进化轨迹。据我们所知,在对抗性节点存在的情况下,固定时间控制问题很少被考虑。受文献 [13] 的启发,本文使用了一种新的方法,证明了在所设计的控制协议下,具有对抗性节点的多智能体系统可以在固定时间内实现给定的准包围控制,并且给出了多智能体系统实现准包围控制的稳定时间上界估计式。
2. 预备知识
2.1. 符号说明
记符号
为所有元素都为1的
行1列的实向量,
为
维单位矩阵。
表示所有正(非
负)实数的集合,
表示矩阵或向量
的转置。
为对角元素是
的对角矩阵。
和
分别表示标量的绝对值和向量的2范数,
表示标准符号函数。对于
和
,令
,其中
,则
记
为
的
个按升序排列的特征值,其中
为Hermitian矩阵。
2.2. 图论
用
来表示交互拓扑图,其中
表示图中所有节点的集合,
表示图中所有边的集合。两个节点
和
之间的连接权重用
表示,权重矩阵用
表示。如果节点
和节点
之间存在边,即
,则
,否则
。本文不考虑自循环的情形,即
。将度矩阵
定义为
,其中
,与图
相关的Laplacian矩阵定义为
。
有向边
意味着智能体
可以从智能体
接收信息,并且智能体
称为智能体
的邻居。记
为节点
的相邻节点的集合。图的一条从
到
的有向路径是指一个有序序列
,其中
。此外,如果对任意两个不同的节点存在有向路径,则称该图是强连通的。
2.3. 一些定义与引理
定义2.3.1 [14]:考虑一个非线性系统
(1)
其中
表示系统的状态变量,
表示非线性向量场。
如果方程(1)的任何解
满足下列条件
(i) Lyapunov稳定:对于任意
,存在
,使得
,其中
,
(ii) 有限时间收敛:存在稳定时间函数
,使得
,且对所有
,
.
我们称系统(1)的原点是全局有限时间稳定的。
定义2.3.2 [14]:如果系统(1)的原点是全局有限时间稳定的,且对任意
,稳定时间函数
有界,即存在
,使得对所有
,
,我们称系统(1)的原点是固定时间稳定的。
引理2.3.1 [15]:考虑一个标量系统
(2)
其中
均为正奇数,且满足
,以及
。那么上述等式全局有限时间稳定,且固定时间的上界为
引理2.3.2 [16]:若
,且
,则
引理2.3.3 [13]:如果一个与Laplacian矩阵
相关的有向图
是强连通的,则存在一个正列向
量
满足
和
。此外,取
,则
和
是与某些无向图(分别记为
和
)相关的有效Laplacian矩阵,且对任意
,下列不等式成立
其中,
表示图
的最大度数。
3. 问题表述
考虑一个由
个智能体组成的多智能体系统,第
个智能体的动力学行为用下式描述:
(3)
其中
表示第
个智能体的状态,
表示第
个智能体的控制输入。
构造控制协议的表达式为
(4)
其中

,其中
和
分别表示领导者和跟随者的集合。并且
,
为标度参数,
表示对抗性节点,
表示合作节点,
与
具有相同的符号。
定义3.1 [13]:如果对于任意初始状态
,存在一个独立于
的标量
,使得方程(3)的解
满足下列条件
其中
称为稳定时间。我们称系统(3)可以实现固定时间准包围控制。此外,当
时,固定时间准包围控制问题是全局求解的。
在定义3.1中,
和
分别表示智能体
的内部状态和外部状态。其中,领导者为自己隐藏内部状态
,并将唯一的外部状态
表示给其他智能体,而跟随者则基于外部状态的错误蜂拥而至。控制协议的设计是为了消除外部状态的偏差。值得注意的是,当
的绝对值相同时,将实现双边一致,当
的值被分成类时,将实现集群一致。更一般而言,外部状态会达成一致,称为外部一致,而内部状态只能由外部状态间接地描述。跟随者的内部状态和外部状态是相等的,即
。因此,跟随者将会达成一致,并以领导者的外部状态为目标。
4. 主要结果
为使得多智能体系统能够实现固定时间准包围控制,本文给出以下假设:
假设4.1:与领导者相关联的子图是强连通的,并且对于每个跟随者,至少存在一条从领导者到该节点的有向路径。其中,跟随者会受领导者的影响,反之不成立。
根据拓扑学中的假设,Laplacian矩阵显然具有如下形式
(5)
其中
表示领导者之间的信息交流,
表示跟随者之间的信息交流,
为领导者对跟随者的影响。
引理4.1 [17]:在假设4.1下,
的所有特征值都具有正实部。
由于领导者不受跟随者的影响,故收敛分析只需证明领导者达成外部一致和在假设领导者的状态不变的情况下,所有跟随者的状态最终收敛到由领导者所产生的凸包内即可。
为简明起见,记
和
分别表示领导者和跟随者的状态集合。
定理4.1:如果假设4.1成立,那么系统(3)在协议(4)下可以实现固定时间准包围控制。
证明:考虑以下候选的Lyapunov函数:
(6)
其中,
在引理2.3.3中定义。显然,
是正定的,径向无界的。通过引理2.3.2和
的性质,我们可以得出
沿闭环系统轨迹的时间导数为

其中

通过引理2.3.3,我们可以得出
其中
。为方便起见,令
,
,
.在
中替换
的结果,可得到
(7)
这给出了引理2.3.1的直接结果,即领导者可以在
时达成一致
(8)
在我们分析跟随者的收敛之前,我们假设领导者已经达成了外部一致。记
。然后,
,并且还具有
,其中
,
,
。按照相同的步骤,考虑以下候选的Lyapunov函数:
(9)
其中
是
的解,且引理4.1使得
。显然,
,且它是径向无界的。由于
,因此
关于时间的导数为
重复上述证明,并注意到
,其中
,则

从而可得
(10)
其中
第二阶段的稳定时间为
(11)
因此,系统(3)在协议(4)下可以实现固定时间准包围控制,并且总的调整时间由下式表示
(12)
5. 数值模拟
为了验证文中理论结果的有效性,我们考虑图1中一个包含6个智能体的系统,分别标记为
,其中领导者被标记为
,智能体
和智能体
传播相反的信息,其连接线路由虚线表示。于是邻接矩阵和Laplacian矩阵分别为
显然,假设4.1是满足的。给定领导者的
,并选择
和
。
内部状态轨迹的时间演变如图2所示,外部状态轨迹的时间演变如图3所示,控制输入轨迹如图4所示,其中领导者的状态和输入用实线表示,跟随者的状态和输入用虚线表示。

Figure 1. The structure of interaction topology
图1. 交互拓扑结构
由公式(8)和公式(11)可以估计总的固定时间
。如图3所示,所有智能体的外部状态在
时达到一致。根据定义3.1,系统(3)可以实现固定时间准包围控制。图2描述了智能体的内部状态。其中,具有相同标度参数
的智能体1和智能体3在
时达到一致,具有不同标度参数
的智能体2在
时达到稳定状态。显然,内部状态既没有达成集群一致,也没有达成双边一致。在本例中,智能体2的状态是隔离的。事实上,如果所有的标度参数
在某些极端情况下是完全不同的,领导者的内部状态就会彼此分离。
6. 结论
本文讨论了存在对抗性节点的多智能体系统的固定时间准包围控制问题。在代数图论和固定时间稳定性定理的基础上,通过给出充分条件,证明了期望的准包围控制可以在有限时间内实现。数值仿真结果表明,在所设计的固定时间控制协议下,多智能体系统可以在较短的时间内实现预期的准包围控制。同时,我们可以发现系统的稳定时间上界
不受系统初始值的影响,而与控制协议中的参数,拓扑图结构及智能体数量有关。
基金项目
本文得到湖南省自然科学基金项目(2020JJ6003),湖南省教育厅重点项目(20A425)和湖南省环保科研课题(湘财建二指(2019) 0011号)的支持。
参考文献
NOTES
*通讯作者。