1. 引言
多智能体系统是由多个独立智能体组成的一类群系统,各智能体之间可以通过信息交换、通信协作完成单一智能体难以完成的复杂任务。目前,多智能体系统在智能微电网、多机器人协同控制、卫星编队控制以及交通系统等领域得到了广泛的应用[1]-[3]。而一致性问题是多智能体系统协同控制的基本目标,也是核心问题,因此关于多智能体系统的一致性问题研究引起了广大学者的兴趣[4]。
文献[5]研究了一般线性系统的领导跟随一致性问题,但要求切换系统中所有图都包含以领导者为根的有向生成树。然而,在实际应用中,通信拓扑可能因环境干扰或节点故障发生动态切换,且部分子图可能不包含生成树(即无法保证全局连通性),这导致传统一致性协议失效,系统可能无法收敛。例如,无人机编队中部分节点通信中断或传感器故障时,子图连通性被破坏,系统稳定性面临严峻挑战[6]。比如,当某一无人机失去与领航者的直接通信时,若拓扑切换频繁且包含非连通子图,系统可能因误差累积而失稳。类似问题也存在于分布式计算领域,节点间的动态通信延迟或拓扑切换可能导致任务分配不均,进而影响全局收敛效率。因此,研究切换拓扑下部分子图不连通的一致性控制方法具有显著的实际意义。
近年来,离散时间多智能体系统的研究逐渐受到关注。相较于连续时间系统,离散时间模型更贴近实际数字控制器和通信网络的采样特性,但其动态分析更为复杂,尤其是在切换拓扑下,需结合离散切换系统理论和代数图论工具[7]。然而,现有研究多聚焦于连续时间系统,离散时间系统下的切换拓扑一致性研究仍较为匮乏[8]。此外,传统方法通常要求系统矩阵完全可控,这一条件在实际应用中难以满足(如部分节点缺乏直接控制输入),亟需放宽对系统矩阵的限制,仅需可稳定即可。例如,针对连续时间模型,文献[9]提出了两种新的多李雅普诺夫函数,通过求解线性矩阵不等式解决了有向切换网络下的领导跟随一致性问题,但未把思路应用到离散系统中。
基于上述讨论,本文研究了离散时间系统下有向切换网络的领导跟随一致性问题,具有一定创新性,主要贡献如下:
1) 针对离散时间模型,提出基于状态反馈的一致性协议,结合切换拓扑的动态特性,填补了该领域的研究空白,并将一致性问题转化为状态误差的稳定性问题,通过引入平均驻留时间方法,解决了传统连续时间方法在离散采样下的保守性。
2) 通过一个最优化问题解决了通信过程中子图连通性不佳的问题,即部分子图不包含有向生成树的问题;
3) 放宽了对系统矩阵的限制,仅要求系统矩阵可稳定,允许系统矩阵部分不可控。
2. 问题描述
本文考虑由1个领导者和N个跟随者构成的一般线性多智能体系统,其中领导者的动力学模型为
(1)
其中,
表示领导者智能体在t时刻的状态变量,矩阵
和矩阵
均为适当维数的常数矩阵。
跟随者的动力学模型表示为
(2)
其中
表示第i个跟随者在t时刻的状态变量,
表示第i个跟随者在t时刻的控制输入。
本文的研究目标是:根据上述领导跟随者多智能体系统,设计一个分布式控制器,使得
(3)
我们引入一个新的变量
,用该变量表示第i个跟随者与领导者之间的状态误差,则全局状态误差可以表示为
,进而可以把领导跟随者一致性问题转化为变量
的稳定性问题,即
(4)
构造如下李雅普诺夫函数来分析
的渐近稳定性:
(5)
其中
是与通信拓扑相关的正定矩阵,
是与单个智能体动力学相关的正定矩阵。通过Kronecker积
将局部稳定性条件扩展至多智能体系统,将图拓扑与单个智能体动力学相耦合,使得李雅普诺夫函数可以同时表征单个智能体动力学和多智能体之间通信关系。
先简单证明
。构造两个新的矩阵
,
,显然根据Kronecker积的性质,
和
都是正定矩阵,
,同理
,进而有。在后续的证明中只需证明
渐近收敛至零。
本文考虑的切换拓扑下的一致性问题,如果我们通过一个时变的有向拓扑图
来描述多智能体系统中不断切换的通信关系,
表示子图的总个数,
表示t时刻图
的下标。多智能体系统的通信关系可以表示为
,其中
表示t时刻的图的节点,即各个智能体,
表示t时刻各节点间的连接情况,即各智能体之间的通信情况。图的邻接矩阵记为
,并且当
时,
,否则
。各节点的入度值为
,则图
的入度矩阵记为
,进而图的拉普拉斯矩阵可以定义为
。
假设1:对于
,有向图
包含有向生成树,而对于
,有向图
不包含有向生成树。
定义1:[10]给定一个切换信号
和时间区间
,如果对于所有的
,都存在一个
,使得
(6)
则称正常数
为切换信号
的平均驻留时间,
为振荡边界,
表示切换信号
在时间区间
内的切换次数。
假设2:存在
和
,使得对于所有
,通信拓扑包含有向生成树的总时长
和不包含生成树的总时长
满足
。
注释1:对于定义1描述的切换信号,在离散时间系统下有
,特别地,当
时,切换图的切换方式变为随机切换。通过合理选择
和
,可以设计出适应不同应用场景的切换策略,确保多智能体网络在不包含生成树的情况下仍能实现一致性。
注释2:对于假设1,由于通信拓扑的子图只有包含有向生成树和不包含有向生成树两种情况,所以
。如果所有子图均不包含生成树,那么图的连通性不足以实现一致性,所以
也是一个必要条件。从直观上看,若子图在较长时间内不包含生成树,系统的状态可能无法获得足够的时间以实现收敛。因此,通过假设2和定义1,我们为系统在不包含生成树的情况下仍能实现一致性提供了理论支持,这些假设和定义共同构成了后续分析的基础,确保我们能够在复杂的网络结构中有效地研究一致性问题。假设在一个多智能体系统中,领导者节点通过有向生成树向跟随者节点传递信息,当部分子图不包含生成树时,跟随者节点可能无法接收到领导者的指令,从而导致系统状态无法收敛。然而,如果这些不包含生成树的子图出现的时间足够短,系统仍然有可能通过其他路径实现信息传递和状态收敛。
引理1:[11] [12]如果N阶矩阵
的特征值的实部均为正数,并且当
时,下述不等式有正定解
:
(7)
其中
,
,
。
引理2:如果n阶矩阵
为对称矩阵,n阶矩阵
为正定矩阵,那么对于任意m阶半正定矩阵
以及对应的
,下面不等式恒成立:
(8)
证明:首先证明
的特征值均为实数。由于
是正定矩阵,可进行Cholesky分解,即存在可逆下三角矩阵
使得
,其逆矩阵为
,考虑到
为对称矩阵,并对矩阵
进行相似变换可得
。由于
,所以
为对称矩阵,其特征值均为实数,而相似变换不改变特征值,因此
的特征值也均为实数。
其次证明
。对于任意非零向量
,有
,将上式两边左乘
并进行整理可得
,这表明矩阵
是半正定的,即
。
再有Kronecker积的线性性,将矩阵不等式
与半正定矩阵
进行Kronecker积,可得
由于
,且Kronecker积保序性成立,即若
,则
,故
成立。
最后,对于任意向量
,将上述矩阵不等式代入二次型,有:
证毕。
假设3:系统矩阵
可稳定,且矩阵
满秩。
注释3:如果系统矩阵
可控,那么
一定可稳定。如果系统矩阵
不可控,那么存在一些状态无法通过控制输入来影响,这些不可控状态对应的特征值我们称之为不可控特征根,其集合记为
。我们设计一个参数
来描述不可控特征根的稳定性,
,其中
。显然,当系统矩阵
完全可控时,
,此时
可稳定。而当系统矩阵
不完全可控时,若
,则
,此时系统不可控部分是稳定的,
也是可稳定的。
引理3:[13]如果假设3成立,那么对于任意
,总能够找到与之对应的
,使得如下黎卡提不等式有正定解
:
(9)
其中,
,并且在若干个满足条件的
中,我们可以找到一个使不等式(9)成立的最小值
,
。
为了方便后续的计算推导,我们将t时刻的图的拉普拉斯矩阵
写成分块形式:
(10)
其中
为N阶矩阵,
,
为全0元素的行向量。如果t时刻的有向拓扑图
包含生成树,则0是拉普拉斯矩阵
的单一特征根,其余的N个特征根均具有正实部。
根据引理1,我们做出如下假设。
假设4:存在
,使得
,且
尽可能的小,其中
,
。
当假设4成立时,对任意
,以下矩阵不等式都成立:
(11)
其中
为不等式的正定解,且
。
当式和式成立的条件均满足时,我们针对第i个智能体设计如下分布式控制协议:
(12)
其中反馈增益矩阵
。
注释4:本文设计的分布式控制协议基于状态反馈机制,与传统方法要求所有子图均包含生成树不同[14],本文引入参数
对反馈增益矩阵进行缩放,使得在非连通子图下仍能通过优化
维持误差有界。此外,通过结合改进的黎卡提方程(9)和图矩阵不等式(11),该协议放宽了对系统矩阵完全可控的限制,仅需
可稳定即可,从而适用于更广泛的物理系统。在设计的过程中,反馈增益K及后续的均是在使用李雅普诺夫函数证明
的稳定性的过程中由反步的方法得到的。控制协议的具体设计步骤如下:1、根据引理1,我们做出了假设4,该假设的意义是根据选取的
,能够选取尽可能小的参数
,使得图矩阵不等式(11)可解,并求解出相对应的正定矩阵
;2、我们构造了一个放缩因子
用来描述切换拓扑的子图包含生成树的情况,使得不包含有向生成树的子图也可以有其对应的正定矩阵
,并且引入一个参数
构造出不包含生成树情况下的黎卡提方程(17);3、由于系统矩阵是可稳定的,所以由引理3,可以选取合适的
,并利用凸优化工具包CVX求解出同时满足黎卡提方程(9)和(17)的与单个智能体相关的正定矩阵P,该步骤将单个智能体的动力学和智能体间的通信关系耦合,但在一定程度上也对
和
的取值进行了限制;4、根据求得的P可以计算出反馈增益K,控制协议(12)设计完成,并在后续过程中能够实现一致性的证明。
矩阵P可由式(9)求解出,矩阵
的求解将分为两个部分。当子图包含有向生成树时,式(11)已经给出了求解方法,而针对剩下的不包含有向生成树的子图,有一个直观的想法是构建一个与
的均值相关的正定矩阵来描述,以确保李雅普诺夫函数的构造具有一致性。
(13)
其中,
为图
中包含生成树的子图的个数。我们希望存在一个放缩因子
用于描述不同拓扑结构下
之间的关系,以确保李雅普诺夫函数在不同拓扑下的统一性。对于放缩因子
我们做出如下设计:
(14)
其中,
且对于任意
,
。
为了处理部分子图不包含有向生成树的情形,我们定义一个与该情况下的拓扑图相关的矩阵:
(15)
其中,
为
的特征值放缩参数,那么该情况下的拓扑结构的最小特征值定义为
(16)
我们希望系统在不包含生成树的拓扑结构下依然保持稳定,所以引入一个参数
,进而可以通过优化问题最小化
使式(9)和下式同时成立:
(17)
其中
,
为使式(9)和式(17)同时成立的最小值。
3. 主要结果
定理1:对于离散时间系统下的多智能体系统(1)和(2),有以下条件:
1) 假设1、2、3、4均成立;
2) 参数
,
和
的选择满足矩阵不等式(9)、(11)和(17);
3) 式(18)成立,即:
(18)
其中,
为平均驻留时间,
为假设2中的参数,其目的是限制不包含生成树的拓扑结构的持续时间。
如果上述条件全部满足,则基于分布式控制协议(12)的多智能体系统可以实现状态一致性。
证明:跟随者智能体的动力学方程(2)改写成全局形式为:
(19)
控制输入的方程(12)改写成全局形式为:
(20)
因此,系统的误差动态方程可写成:
(21)
我们在式(5)中给出了李雅普诺夫函数
,针对子图包含生成树和不包含生成树的情况,下面对李雅普诺夫函数的变化量
进行分类讨论。
情况1:t时刻的通信拓扑图包含有向生成树,且从t时刻到
时刻的拓扑图不发生变化,即
,则
时刻的李雅普诺夫函数为
(22)
由于通信拓扑不变,因此
,李雅普诺夫函数的变化量可以表示为:
(23)
因此,在情况1的条件下,李雅普诺夫函数的变化量满足:
(24)
情况2:t时刻的通信拓扑图包含有向生成树,且从t时刻到
时刻的拓扑图不同,即
且
,此时有
,则
时刻的李雅普诺夫函数为:
(25)
与情况1的证明类似,上式结合式(9)和式(11),李雅普诺夫函数的变化量可以表示为:
(26)
因此,在情况2的条件下,李雅普诺夫函数的变化量满足:
(27)
情况3:t时刻的通信拓扑图不包含有向生成树,且从t时刻到
时刻的拓扑图不同,即
且
,此时有
,
,则
时刻的李雅普诺夫函数为:
(28)
将
,
,
代入上式,李雅普诺夫函数的变化量可以表示为:
(29)
注意到
为对称矩阵,
为正定矩阵,
为半正定矩阵,式(15)中
,则由引理2可得,下述不等式始终成立:
(30)
将式(16),式(17)以及式(30)代入式(29)可得:
(31)
因此,在情况3的条件下,李雅普诺夫函数的变化量满足:
(32)
情况4:t时刻的通信拓扑图不包含有向生成树,且从t时刻到
时刻的拓扑图不发生变化,即
,这意味着t时刻和
时刻同时不包含生成树,此时亦有
,
,由式(14)可知
,即
,和情况3的证明类似, 容易得到在情况4的条件下,李雅普诺夫函数的变化量满足:
(33)
根据式(24),式(27),式(32)以及式(33)所描述的4种情况,不难发现,每发生一次切换,不等式的右边多乘一次
项;每出现一个包含有向生成树的子图,不等式的右边多乘一次
项;每出现一个不包含有向生成树的子图,不等式的右边多乘一次
项。综上所述,并结合假设1和假设2,可以得到如下的通式:
(34)
由式(18)可得
,并且当
时,
,所以有
。
定理1证明完毕。
注释5:当不包含生成树的子图占比超过一定阈值,即
时,李雅普诺夫函数
的增长速率
将主导系统发散。当所有子图都包含有向生成树时,根据假设2有
,此时定理1中的条件3可以简化成
,即只要平均驻留时间
大于某个值,就可以实现领导跟随状态一致性。特别地,当切换图的切换方式为随机切换时,可以取
,此时条件3变为
,通过调整参数的选择来判断控制器的一致性能力。
4. 数值仿真
在本节中,利用一个仿真实例来验证定理1的有效性。考虑由1个领导者和6个跟随者构成的多智能体系统,其切换通信拓扑图如图1所示,其中智能体0为领导者智能体,智能体1~6为跟随者智能体。
Figure 1. Communication topologies
and
图1. 通信拓扑图
和
显然,图包
含有向生成树,图
不包含有向生成树。在图
所描述的拉普拉斯矩阵可以写成
根据式(10),有
此外,选取的参数为:
显然,
可控,有
,取
,
,
,可以通过LMI工具包求解矩阵不等式(11),得到
不难看出
,
,,结合最优化问题(17),
,并且
控制器的开环增益为
选择
,通信拓扑在该平均驻留时间下发生切换,该切换过程中有
。
图2,图3,图4描述了不同初始状态下的系统状态轨迹,图5描述了不同初始状态下的系统输入轨迹,图6描述了跟随者与领导者间的状态一致性误差。由图6可知,在本文给出的控制协议下,系统在图1给出的切换拓扑下可以实现领导跟随一致性。
[-rId564-]
Figure 2. The states trajectories of
图2.
的状态轨迹
[-rId572-]
Figure 3. The states trajectories of
图3.
的状态轨迹
[-rId581-]
Figure 4. The states trajectories of
图4.
的状态轨迹
[-rId590-]
Figure 5. The inputs trajectories
图5. 输入轨迹
[-rId599-]
Figure 6. State consensus error between followers and leader
图6. 跟随者与领导者间的状态一致性误差
注释6:在对正定矩阵P进行求解的时候,涉及到最优化的问题,上述的P是基于凸优化工具包CVX求解得到的,在利用凸优化工具包CVX进行求解时,只会给出P的一个解,但显然满足条件的正定矩阵P是不唯一的。文献[13]给出了一种迭代的求解方法,根据迭代并进行验算,我们发现如下两个正定矩阵
和
同样满足约束(9)和(17),并且根据控制协议(12)中反馈增益K的设计,可以得到
和
,进而可以得到在
和
控制下的状态一致性误差,如图7所示。
Figure 7. State consensus error under different parameters
图7. 不同参数下的状态一致性误差
特别地,本文选取的系统矩阵
与文献[14]一致,但文献[14]对于矩阵A的谱半径进行了严格的要求:A的特征值均位于单位圆内。显然,当我们对选取的A进行微调后,取
,此时的矩阵A不满足文献[14]所设计的控制器的要求。而在本文中,选取
,
,
,求解矩阵不等式可得
由图8可以看出,调整后的系统在本文设计的控制协议下依然可以实现状态一致性。
注释7:尽管文献[14]研究的是无领导者一致性问题,本文设计的控制器经过一些调整后也可以适用于无领导一致性问题,只需将
的维度从N维变成
维,并对拉普拉斯矩阵
的形式进行一些改动。
[-rId643-]
Figure 8. State consensus error between followers and leader
图8. 跟随者与领导者间的状态一致性误差
5. 总结