1. 引言
多智能体系统的定义是:一个由众多独立智能体组成的系统,这些智能体通过连接相互协调,以完成一项复杂的任务。在这种情况下,智能体一般是指能够感知周围环境并正确利用自身能力对环境做出适当反应的物理或抽象实体。随着对自然界中一些集体行为的观察和思考,研究人员开始了对多智能体系统协调控制的研究。多智能体系统的协调控制是一个新兴的研究领域,它借鉴了多个学科的观点,并整合了不同领域的见解。在实际应用中,单个智能体的结构相对简单,由特定的传感、计算、存储和通信能力组成,能够执行单一功能。相比之下,由数量有限的智能体组成的系统不仅包含单个智能体的所有功能,还能通过自身和其他智能体的状态信息接收动态系统的控制输入。近几十年来,许多多智能体系统模型被应用于各个领域,包括生物学、物理学和工程学。这些模型吸引了众多学者的关注。一致性是群体中群体行动的一种特征,在许多领域都发挥着重要作用,如群体控制[1]、缺陷检测[2]和动物监控[3]等。
由于多智能体系统在现代工业中的广泛应用,在多智能体系统中达成共识已有悠久的历史。DeGroot [4]对管理科学和统计学的研究采用了加权平均技术来估计一组未知变量个体的概率分布函数,从而使一致性问题成为一个热门的学术话题。生态学家雷诺德模拟了各种动物群体的行为,提出了Boid模型[5]。Vicsek利用Boid模型建立了一个基于统计力学的离散模型,用于模拟粒子群中共识行为的出现[6]。后来,Jadbabaie通过对Vicsek模型的理论分析,用线性模型取代了非线性模型[7]。Olfat-Saber 和Murray 提出了解决一阶多智能体系统中一致性问题的框架[8]。他们设计了一种一致性算法,并证明了当通信拓扑图是无向且强连接的均衡图时,该算法的渐近共识能力。
一般来说,我们可以将其分为两种类型,一类是无领导者的多智能体系统,而另一类是领导–跟随者的多智能体系统,这两者的研究都非常的有意义,本文研究的是领导–跟随者的多智能体系统,在实际生活中有很多领导协作的例子。例如,在森林火灾中,利用机器人来取代人类去扑灭大火会更加地安全,在这个过程中,一部分机器人作为领导者,另一部分可以作为跟随者。如果能实现多领导者协同控制,那么就可以实现森林的区域灭火,从而代替人类,降低一定的风险,提高工作效率。此外在海域探索等问题中也有很多实际的用处。
而近年来,人们越来越关注描述多智能体系统的偏微分方程模型。邱倩等[9]研究了使用输出反馈方法来解决具有切换拓扑的抛物型偏微分方程模型所代表的智能体之间的一致性问题。他们开发了一种新颖的基于边界的自适应控制协议,以确保切换图在所有切换实例中的连通性。闫旭等[10]研究了包含反应扩散项的多智能体系统在空间边界控制下的输出一致性。Ferrari-Trecate等[11]利用函数分析法对文献中提出的各种模型进行了归纳,为这一领域做出了贡献。王玉娟等[12]提出了一种新颖的时间决定分布式控制方法,以实现网络多系统中的一致性和包容性。但在实际情况中,优先考虑输出一致性而不是状态一致性是有益的[13]-[15]。本文提出用输出一致性代替状态一致性,并考虑了智能体之间的通信问题。它研究了一类抛物型偏微分方程模型的多智能体系统输出一致性的问题,并证明它能在边界控制器下实现输出一致性。
本文采用分布式边界控制方法研究多智能体系统的输出一致性问题。主要贡献有:1) 基于分布式边界测量方法设计边界控制器,考虑每个智能体与其邻居在通信过程中传输的信息,以实现输出一致性。2) 在分布式边界控制器下,设计了线性矩阵不等式(LMI)。然后利用李亚普诺夫直接法获得多智能体系统输出一致性的充分条件。3) 不需要对空间中的内部点进行控制,只需要对空间域的边界点进行控制,因此减少了控制器的数量,大大降低了系统的复杂性和成本。
2. 预备知识
图论知识:本文首先介绍一些图论知识,这些理论将贯穿全文。加权有向图
是一对有序图,其中
是节点集,
是边集,
是与有向图相关联的加权邻接矩阵,智能体i与智能体j存在连接定义为
,智能体i与智能体j不存在连接定义为
。此外,图G的拉普拉斯矩阵表示为
,其中
,
。
3. 问题描述
本文考虑的是由一个领导者和m个跟随者组成的多智能体系统。领导者的动态方程如下:
(1)
在这里
,
,
是状态,
是输出,
是初始值,
代表第j个神经元的激活函数,
,
,
和
都是已知常数。
考虑m个跟随者的动态方程为:
(2)
在这里
是状态,
是输出,
是控制器,
是初始值,
,
,
和
都是已知常数。
将领导者(1)与上述条件结合起来考虑,可以得到领导者输出状态:
(3)
在此基础上,考虑跟随者(2),可以进一步得到输出状态:
(4)
由于分布式测控与集中式测控、分层递阶式测控结构相比,显得更加扁平与稳定,因此本文开发了一种依赖于分布式测量的边界控制器,用于在多智能体系统的领导者和跟随者之间达成输出一致性。
(5)
在这里k是已知常数表示耦合强度,
是内耦合矩阵,
是控制增益,
是无向图,若智
能体i与智能体j之间有连接则
否则
。
假设1:图G是连通的。
假设2:神经元激活函数
是Lipschitz连续的,则存在一个常数
对于每一个
,
,
满足
。
在这里
,
。
定义
为输出一致性误差,
。因此可以得到输出一致性误差的动态方程为:
(6)
考虑
和
是m维向量,定义
假设3:矩阵
为正定矩阵。
引理1 [16]:考虑一个正定实对称矩阵
,
是一个向量函数满足
或者
,则有:。
4. 主要结果
本节将研究使用边界控制器(5)的领导者–跟随者多智能体系统(1)和(2)的输出一致性。
定理1:在假设1~3条件下,如果
满足指定的线性矩阵不等式,就会通过实施边界控制器(5)增强领导者(1)和跟随者(2)之间的输出一致性:
(7)
在这里
,
。
证明:为了让误差系统达到输出一致性,设计了如下的李雅普诺夫函数:
(8)
接下来在假设2的基础上对函数
进行求导:
(9)
然后利用误差系统(6)中的边界条件可得:
(10)
根据假设3由于矩阵
是正定矩阵,所以根据引理1可以得到:
(11)
将(8)式和(9)式代入(7)式中可得:
(12)
在这里,
在式(7)中被定义,因此可以证明边界控制器(5)能使领导者(1)与跟随者(2)达到输出一致,具体表现在公式(12)中。
5. 数值仿真
为了说明结果的有效性,本文列举了一个数值算例来进行说明。考虑由四个智能体组成的多智能体系统,即
(13)
使用以下参数
,
,
,
,
,
,
,
,
,
,并考虑初始值为
,
,
,
。
图1显示了在多智能体系统未采取任何控制措施的情况下,利用上述矩阵和初始值条件进行的误差系统剖析。很明显,如果没有适当的控制,多智能体系统无法实现输出一致。
Figure 1. Error systems without control
图1. 没有控制的误差系统
根据定理1,使用MATLAB工具求解线性矩阵不等式(7)即可得到控制增益
,
,
,
,
。
如图2所示,误差系统随着时间t的增大,系统收敛到平衡状态,因此误差系统在边界控制器的作用下实现了输出一致。
Figure 2. Error systems under boundary control
图2. 在边界控制器下的误差系统
6. 结论
本文研究了基于偏微分方程模型多智能体系统输出一致性的问题。每个智能体模型都由一个抛物型偏微分方程模型组成,该抛物型偏微分方程模型设定为一维空间中的诺伊曼边界条件。边界控制器位于边界的每个边缘,并与智能体及其邻居通信。利用线性矩阵不等式,李雅普诺夫直接法为边界控制器的输出一致性提供了充分条件,证明了在控制增益满足定理1中的线性矩阵不等式时,多智能体系统在边界控制器的作用下,能实现输出一致。数值模拟结果表明了该方法的有效性。还需要开展更多研究,以确定在不同边界条件(包括迪利克雷边界条件)下利用椭圆和双曲偏微分方程模型[17] [18]的多智能体系统的输出一致性。此外,还应该探索实施各种边界控制方法,如模糊边界控制,以分析具有偏微分方程模型的多智能体系统。
基金项目
国家自然科学基金(62373143),湖南省自然科学基金(2021JJ50063),湖南省教育厅重点项目(21A0366, 22A0406),湖南省教育厅自然科学项目(23C0205)。
NOTES
*通讯作者。