1. 引言
考虑由N个智能体组成的网络,每个智能体都有强凸的局部成本函数
。全局成本函数
是局部成本函数之和,即
。协作控制的目标是设计一种分布式算法来解决以下凸优化问题
(1)
即全局成本函数
在
处达到最小。近年来,上述凸优化问题(1)被应用来解决许多实际问题,比如统计估计、并行计算和无线网络资源分配等 [1] [2] [3]。
目前,已经涌现出一系列关于分布式凸优化问题研究的成果。在文献 [4] 和 [5] 中,Nedic等提出了分布式次梯度下降算法和分布式次梯度投影算法分别解决无约束凸优化问题和约束凸优化问题。Lin等 [6] 使用次梯度投影算法来解决分布式凸优化问题,指出该算法适用于具有非同一性约束和通信延迟的多智能体系统。上述算法在实现的过程中,都需要智能体持续地获取其邻居的信息,并持续进行控制更新,这需要较高的通信成本。为了克服上述缺陷,将事件触发机制应用于解决凸优化问题,即智能体只在特定的事件发生时刻进行信息传递和控制更新,这能够有效降低通信成本。Liu等 [7] 提出了一种基于事件触发通信的分布式凸优化算法,解决了无向连通图上的凸优化问题。Chen等 [8] 提出一种解决有向网络上分布式凸优化问题的事件触发零梯度和算法,分别讨论了连续时间情形和离散时间情形。Lü等 [9] 研究了一阶离散时间多智能体系统的一类凸优化问题,提出一种基于事件触发的分布式次梯度投影算法。Mo等 [10] 研究了具有非均匀梯度增益的二阶多智能体网络的自适应事件触发优化问题,设计了一种具有非均匀梯度增益的分布式自适应事件触发优化算法。Yang等 [11] 提出了基于比例积分策略的分布式优化算法,并将分布式优化算法与事件触发通信相结合,证明了在局部成本函数可微且凸的条件下,智能体状态渐近收敛到全局最小值点。
值得注意的是,上述文献的研究均假设智能体自身与其邻居智能体之间以同步通信和同步更新为前提,即智能体之间存在一个虚拟的全局时钟监控和调控智能体之间进行更新和完成信息传递。但是随着智能体的规模不断扩大,时钟同步变得越来越难以实现。异步检查事件触发机制只需使用每个智能体上的本地时钟就可以完成协作任务,并且避免了连续通信、降低了通信负载。将异步问题与优化问题结合考虑的研究成为近年来的研究热点。Hachem等 [12] 提出一种随机原始——对偶择优算法,并将算法用于异步求解分布式优化问题中。Xie等在文献 [13] 中提出一种随时间变化的事件触发异步分布式凸优化算法,解决了时变无向网络上的凸优化问题。Nicola等 [14] 研究了在节点之间通信易发生故障,代理之间没有同步情况下最小化凸代价函数的问题,提出了改进的放松ADMM方法。Ali等 [15] 提出一种基于预测校正异步乘法交流器的方法,在子问题计算异构的情况下,该算法减少了计算资源的不充分利用。
综合以上研究成果发现,这些成果的共同点是算法需要持续监控智能体自身及其邻居的状态,导致了额外的能量消耗。故一些研究将周期监测机制与事件触发机制结合,使得事件检查仅在周期时刻进行,不再需要持续对智能体自身及其邻居的状态进行监控。例如,Zhang等 [16] 研究了有向拓扑上具有量化信息通信的多智能体系统的周期事件触发一致性问题,讨论了周期事件触发控制对一致性问题的影响。Wang等 [17] 基于周期事件触发机制,研究了异步多智能体系统的一致性问题。Liu等 [18] 在事件触发机制的基础上引入周期检测,解决了有时滞系统的一致性问题。Zhao等 [19] 提出一种基于周期检测的分布式事件触发零梯度和算法,解决了强连通平衡有向图上多智能体系统的凸优化问题。以上工作有效减少了智能体之间的通信量和控制输入的更新频率,Zeno行为可以更好地被排除。除此之外,与传统的触发条件相比,文献 [20] [21] 在触发条件下引入动态变量确保了更少的触发瞬间,减少了触发次数。
本文研究了多智能体系统的优化问题,提出了基于动态事件触发策略和异步周期检测的分布式凸优化算法。在本文考虑的系统中,每个智能体的初始状态是不同的,智能体根据自己的时钟周期地检查事件触发条件。由于事件触发条件仅在周期时刻进行检验,那么相邻事件触发时刻的时间间隔的最小值是采样周期h,可以直接排除Zeno行为,动态积分型事件触发条件,能够更有效地减少事件发生次数。
本文其余部分结构如下:第二部分给出了相关的基础知识,第三部分对模型进行了描述,并提出了凸优化算法。第四部分分别针对固定拓扑和切换拓扑情形,提出了积分型动态事件触发条件,并分析给出保证智能体状态渐近收敛到全局最优点的充分条件。第五部分利用数值仿真验证理论结果的有效性。第六部分给出文章的主要结论和未来研究的方向。
符号说明:在本文中,符号
和
分别表示n维实向量集和
维实矩阵集。
为n维单位矩阵。1是元素都是1的具有合适维数的列向量,0是元素都是0的具有合适维数的列向量,
表示矩阵L的转置,
表示指标集。
2. 准备工作
2.1. 代数图论
在一个由N个智能体组成的多智能体系统中,智能体间的信息交换可以描述成
,其中
是有限非空节点集,
是边集,
是
的邻接矩阵,其中
当且仅当
,否则
。本文中,我们假设图中每一个节点都没有自环边,即对
。如果存在一条边
,那么节点j称为是i的邻居,意味着智能体i能接收到来自智能体j的信息。智能体i的邻居集定义为
。如果
当且仅当
,即
,则称图
是无向图。从节点i到节点j的路径是指存在节点序列
,其中
,使得
。对于有向图,如果从任意一个节点到另一个节点都存在一条有向路径,则称其为强连通平衡图。对于无向图,如果任意一对不同节点之间都存在一条路径,那么称其为连通图。图
的度矩阵
表示为
,其中
是节点i的入度。图
的Laplacian矩阵定义为
。对于所有
,如果满足
,则称
是平衡的。
在具有切换拓扑的多智能体系统中,用集合
表示多智能体系统。每一个拓扑图
可以用
来表示,其中
分别是图
的节点集、边集、邻接矩阵。
2.2. 相关定义和引理
定义1: [11] 称一个二次连续可微函数
是局部强凸的,如果对于
,存在常数
,有以下等价条件成立:
,
其中
,
是
的凸性参数。
引理1: [22] 对于一个强连通平衡图
,存在向量
使得
。令
,其中
。令
,则有以下不等式成立:
(2)
引理2: [23] 对于一个无向连通图
,图的Laplacian矩阵
是对称且半正定的,记
的特征值序列为
,有
。并且有以下不等式成立:
(3)
其中
,并且
。
3. 问题描述
考虑由N个智能体组成的多智能体系统,智能体i的动态方程描述为
(4)
其中
是智能体i的状态,代表智能体i对
的估计。为简单起见,我们仅考虑
的情形。
表示局部目标函数
的最小值,
是待设计的控制输入。如果
,则凸优化问题(1)得到解决。
对于每个智能体
,令事件检测周期为h且智能体i的事件检查序列为递增序列
,其中
。假设
。令
是事件触发时刻。在本文中,我们规定
,即智能体i在初始时刻更新。定义分段常值函数
为智能体i的最新传播状态,其中
。
针对系统(4),我们对智能体i设计的控制算法为
(5)
其中
,当
;
,当
。
注1:假设所有智能体的启动时间不同,但是所有智能体都有一个共同的固定事件检测周期,即它们异步检测事件触发条件。我们考虑的是当时间t趋于无穷时,所有智能体状态的变化趋势,故我们在
内对所提算法进行收敛性分析,其中
,当
时,控制算法为0,我们不予考虑。
基于注1,采用控制算法(5)的多智能体系统(4)可表示为
(6)
其中
。令
,
。则算法(6)可等价表示为
(7)
为了执行所设计的控制算法,我们需要设立事件触发条件来确定智能体何时传播其状态信息给它的邻居及何时对其控制器进行更新。对于每个智能体i,我们针对不同多智能体系统设立动态事件触发条件。
4. 主要结果
4.1. 具有固定拓扑的多智能体网络
在这一部分,我们假定多智能体系统具有固定拓扑,分别讨论拓扑图是强连通平衡和无向连通的情形。
在多智能体系统具有固定拓扑的情形下,我们设计的事件触发条件为
(8)
其中
是一个正常数,
是
的第i行。q连续的取自然数1,2,3,...的值,直到满足(8)的第一个q成立,然后令
,
是引入的非负动态变量,其中
,
,
,且
。
定理1:对于具有固定拓扑的多智能体系统,假设系统的拓扑图
是强连通平衡的,如果周期h,参数
等满足如下不等式
(9)
其中
如引理1中定义。则在事件触发条件(8)的作用下,分布式事件触发算法(5)可以解决凸优化问题(1),即
。
证明:
考虑一个李雅普诺夫函数为
,
其中
,
。将
求导,得到
(10)
其中
。因为图
是强连通平衡的,所以
,因此
。将
和
带入(10)中得到
。
由积分的性质得
(11)
给定任意k,对于每一个
,存在
使得
,在这种情况下,我们有
(12)
对于给定的任意p,假定
,
,可以得到
(13)
令
,可得
(14)
并且
(15)
根据触发条件(8),对任意p有以下不等式成立
(16)
在(14)中
(17)
上述第一个不等式用到了公式
,其中
。因为
,其中
,所以结合(16),(17)得到
(18)
进而可以得
(19)
将(12)~(15)以及(18)和(19)结合得到
(20)
其中
。在(11)中
(21)
因为
(22)
其中
,所以有
(23)
将(20)~(23)代入(11)中化简得
(24)
令
,定义
,故(24)可化为
由(2)我们有
进而可得
.
根据(9)可知,
,并且根据凸函数的定义可知,
,即
非负,
非负,那么
非负,故得到
。因为我们采取的是周期检测,控制器周期地检查事件触发条件并进行控制更新,因此
,且为一个确定的值,进而得到
,由(2)可知,
,因此,
,进而有
(25)
由(7)可知,
,结合(16)和(25)可得,
,由
的定义进一步可得
其中
。故得到
(26)
结合(25)和(26)可得,
,因为
是强连通平衡的,所以
,其中c是一个常数。
因为
,即
是一个常数,又因为
是
的最优点,所以
。故得到
。因为
是强凸函数,所以
是强凸函数,那么
的最优点唯一,又因为
,所以
,故
。
我们很容易将定理1的结论推广到无向图中。
推论1:对于具有固定拓扑的多智能体系统,假设系统的拓扑图
是无向连通的,如果周期h、参数
等满足如下不等式
(27)
其中
如引理2中定义。则在事件触发条件(8)下作用下,分布式事件触发算法(5)可以解决凸优化问题(1),即
。
证明:
证明过程类似于定理1。对于一个无向连通图,有
通过将定理1证明过程中的
替换成
,我们可以得到推论1的证明,详细的证明过程省略。
4.2. 具有切换拓扑的多智能体网络
在本节中,将协议扩展到通信拓扑
在具有相同有限顶点集的连通图
之间切换的情况,切换网络可以用分段常数开关信号来建模
。切换时间定义为
,定义在检查时刻
的活动拓扑为
且相应的Laplacian矩阵为
,我们将
用
表示,
用
表示。
注2:我们所讨论的切换拓扑不仅在检查时刻进行切换,还可以在检查时刻之间进行切换。两个连续的检查时刻之间可能发生一次或者多次切换,但是对控制器和事件检测器产生影响的是到当前检查时刻最近的一次切换。在两个连续的检查时刻,邻域关系保持不变的智能体不会受到切换的影响,在两个检查时刻之间通信发生变化的智能体必须使用当前的邻居集来判断其事件条件和控制律。
在多智能体系统是切换拓扑的情形下,分布式事件触发算法与固定拓扑下相同。分别给出拓扑图是强连通平衡和无向情形下的收敛性分析。我们设计的事件触发条件为
(28)
同理,
是
的第i行。
注3:对于集合
,每一个
都是一个强连通平衡图,并且存在向量
,使得
。令
,
,其中
的定义如引理1所示,则
注4:由LaSalle不变集原理可知,虽然拓扑在多个连通图之间切换,但是解集独立于任何一个拓扑,因此可得到以下定理。
定理2:对于多智能体系统是切换拓扑,假设系统的拓扑图
是强连通平衡的,如果周期h、参数
等满足如下不等式
(29)
其中
如注3中定义。则在事件触发条件(28)下作用下,分布式事件触发算法(5)可以解决凸优化问题(1),即
。
证明 类似的考虑李雅普诺夫函数为
研究多智能体系统是切换拓扑并且拓扑图是强连通平衡和无向情形下的凸优化问题。对
求导可以得到
其中
,因为
是强连通平衡的,所以
。
,进而得到
如果
类似于定理1的证明过程,可以得到
(30)
定义
,故(30)可化为
根据注3可以得到
.
由(29)可知
,根据和证明定理1相同的分析过程,可以得到
。
同理可以将结论扩展到多智能体系统是切换拓扑且拓扑图是无向连通的情形,得到下面的推论。在得到推论2前,我们做如下说明。
注5:对于集合
,每一个
都是一个无向平衡图,Laplacian矩阵
满足
,
其中
,
的定义同引理2。
推论2:对于多智能体系统是切换拓扑,假定系统的拓扑图
是无向连通平衡的,如果周期h、参数
等满足如下不等式
(31)
其中
如注5中定义。则在事件触发条件(28)下作用下,分布式事件触发算法(5)可以解决凸优化问题(1),即
。
证明过程略。
5. 数值仿真
在这一部分,我们给出一个数值仿真的例子来说明理论结果的有效性。考虑一个由4个智能体组成的多智能体系统,其通信拓扑图如图1所示。设计智能体的局部成本函数为:
。易得到优化问题(1)的全局最优点为
。每个智能体的初始值为
。从局部成本函数的设计可得
。在仿真过程中,我们将参数设计为:
。仿真结果见图2~4。图2给出了每个智能体的事件触发时刻,从图3我们可以看出智能体的状态最终收敛到最优值
。图4给出了智能体状态与最优值之间差的变化趋势,进一步验证了智能体的状态最终收敛到最优值。

Figure 1. Communication topology among agents
图1. 智能体之间的通信拓扑图

Figure 4. States evolution of
图4.
的状态演变
6. 结论
本文研究了异步多智能体的凸优化问题,提出了一种基于动态周期事件触发的分布式凸优化算法,给出了一个动态积分型事件触发条件。与一般的凸优化算法相比,该算法避免了连续通信,降低了更新频率和通信负载,进而节约系统的资源。由于两个事件的触发时刻的最小间隔是检查周期h,Zeno行为可以有效地被排除,数值仿真也验证了所得结果的有效性。在未来的工作中,将研究在二阶多智能体系统和二阶异步多智能体系统中,基于事件触发的凸优化问题。