时滞高阶多智能体系统的一致性
Higher-Order Consensus in Multi-Agent System with Delay
DOI: 10.12677/AAM.2017.69133, PDF, HTML, XML, 下载: 1,632  浏览: 4,169  国家自然科学基金支持
作者: 文 豪, 王 晓:国防科技大学文理学院,湖南 长沙
关键词: 多智能体系统时滞一致性Lyapunov函数Multi-Agent System Delay Consensus Lyapunov Function
摘要: 本文首先通过将高阶多智能体系统的一致性问题转化为 阶线性时滞系统的稳定性,借助于Lyapunov函数方法,获得了时滞 小于某个定值时、系统可达成一致性的结果,最后利用数值仿真验证本文的结果。
Abstract: In this paper, the consensus problem of high-order multi-agent system with delay is considered. Via constructing Lyapunov function, the result of high-order multi-agent system consensus is obtained when the delay is smaller than a certain value. Finally, a numerical simulation is used to verify our main result.
文章引用:文豪, 王晓. 时滞高阶多智能体系统的一致性[J]. 应用数学进展, 2017, 6(9): 1098-1104. https://doi.org/10.12677/AAM.2017.69133

1. 引言

单个智能体已很难适应越来越复杂的任务,而多智能体系统则可以通过多个智能体的信息交互与合作,解决较为复杂的任务。目前,多智能体系统被广泛应用于无人机编队、自主水下航行器、网络同步、水雷布阵等各个领域,吸引了众多学者的关注。一致性是指随着时间的演化,一个多智能体系统中所有的智能体的某个或者某些状态趋于一致,是多智能体实现协同合作、完成共同任务的基础 [1] [2] 。

多智能体一致性问题大多是在一阶和二阶系统中进行的 [3] [4] [5] [6] [7] ,但在某些特定环境下,研究高阶多智能体系统的一致性却更有现实意义。例如,当鸟群在飞行时,如果其中一个个体突然察觉到危险或食物,在这种环境下,鸟群如要快速达成共识,不仅需要它们的相对位置和速度,而且也需要了解它们的加速度 [8] 。为此,Ren等在文 [8] 中提出了如下描述高阶多智能体系统模型并研究了该系统的一致性问题。

{ ξ ˙ i 1 ( t ) = ξ i 2 ( t ) ξ ˙ i 2 ( t ) = ξ i 3 ( t ) ξ ˙ i m ( t ) = u i ( t ) , i = 1 , 2 , , N . (1)

其中, u i ( t ) 是控制输入,满足

u i ( t ) = c j = 1 , j i N G i j k = 1 m α k ( ξ j k ( t ) ξ i k ( t ) ) , i = 1 , 2 , , N . (2)

这里 c > 0 是外部耦合强度, α k 是内部耦合强度, G = ( G i j ) N × N 是关联矩阵,因此我们可以定义该系统的图结构 G = ( Ξ , ε , G ) ,其中, Ξ = ( ξ 1 , ξ 2 , , ξ N ) ε Ξ × Ξ G = ( G i j ) N × N ,随后,虞文武等 [9] 也研究了上述高阶多智能体系统,并给出了其达成一致性的充要条件。

在实际应用中获取相对位置信息的难度远比获取相对速度信息的难度低,考虑到避免无法获取速度信息的影响,虞文武等 [10] 等在控制输入函数中引入了时滞。事实上,时滞的不可避免,通常多智能体系统总要收到处理时间延迟和信息交互时间延迟的影响 [11] ,因此研究时滞高阶多智能体系统的一致性问题,非常有现实意义。本文主要研究具有如下含有时滞的 m 阶多智能体系统。

{ ξ ˙ i 1 ( t ) = ξ i 2 ( t ) ξ ˙ i 2 ( t ) = ξ i 3 ( t ) ξ ˙ i m ( t ) = u i ( t τ ) , i = 1 , 2 , , N . (3)

其中,控制输入函数 u i ( t ) 如式(2)所示, τ 表示处理延迟。

受文 [9] 的启发,本文首先通过将系统(3)的一致性问题转化为 N 1 的线性时滞系统的稳定性,再通过构造Lyapunov泛函 [12] ,获得了在处理延迟 τ 小于某个定值时,系统(3)可达成一致性的结果。最后用数值仿真给出了满足本文条件时,3个智能体构成的高阶智能体系统可以达成一致性。

2. 预备知识及引理

为了研究系统(3)的一致性,首先引入如下一致性的定义 [2] 。

定义1:称多智能体系统(3)达成 m 阶一致性,若对任意初始条件,系统(3)的解 { ξ i k ( t ) } i = 1 N ( k = 1 , 2 , , m ) 满足

为了研究系统(3)的一致性,类似于文 [9] 定义Laplace矩阵 L = ( L i j ) N × N L i i = j = 1 , j i N L i j L i j = G i j , i j

此时控制输入(2)可以表示成如下形式

u i ( t τ ) = c j = 1 N L i j k = 1 m α k ξ j k ( t τ ) , i = 1 , 2 , , N . (4)

由于 L 是一个主对角占优的实对称Laplace矩阵,记 N 个特征值为 λ 1 , λ 2 , , λ N ,则有 0 = λ 1 λ 2 λ N 。令 η i ( t ) = ( ξ i 1 ( t ) , , ξ i m ( t ) ) T

C = [ 0 1 0 0 0 1 0 0 0 ] , D = [ 0 0 0 0 0 0 α 1 α 2 α m ] ,

则可将系统(3)转化为

η ˙ i ( t ) = C η i ( t ) c j = 1 N L i j D η j ( t τ ) , i = 1 , 2 , , N , (5)

其中, η i ( t ) m 是状态向量。再令 η = ( η 1 T , η 1 T , , η N T ) T ,则系统(5)可写成

η ˙ ( t ) = ( I N C ) η ( t ) c ( L D ) η ( t τ ) . (6)

由于 L 是Laplace矩阵,故存在酉矩阵 P [13] ,使得 P T L P = Λ = d i a g ( λ 1 , λ 2 , , λ N ) 。因此可得

( P T I m ) η ˙ ( t ) = ( P T C ) η ( t ) c ( P T D ) η ( t τ ) = ( I N C ) ( P T I m ) η ( t ) c ( Λ D ) ( P T D ) η ( t τ ) .

ζ ( t ) = ( P T I m ) η ( t ) = ( ζ 1 T , ζ 2 T , , ζ N T ) T ,则 ζ ( t ) 满足

ζ ˙ ( t ) = ( I N C ) ζ ( t ) c ( Λ D ) ζ ( t τ ) . (7)

或者

ζ ˙ i ( t ) = C ζ i ( t ) c λ i D ζ i ( t τ ) , i = 1 , 2 , , N . (8)

由定义1和上述系统转化过程,类似于文 [2] 定理4.2的证明可得如下引理。

引理1: G 是连通图,则(3)达成一致性的充分必要条件是系统(8)的解 ζ i ( t ) 满足

lim t ζ i ( t ) = 0 , i = 2 , , N . (9)

3. 主要结果

下面给出本文的主要结果。

定理1:若矩阵 C c λ i D ( i = 2 , 3 , , N )的特征多项式均满足Routh-Hurtiwz判据,则当时滞 τ 满足 0 < τ τ 0 时,系统(3)可达成一致性,这里 τ 0 = min 2 i N { p i 2 ( C + c λ i D ) c λ i D } > 0 p i 为矩阵 C c λ i D ( i = 2 , 3 , , N )的特征值的最小模。

证明:由引理1可知,只需证明系统(8)的解 ζ i ( t ) 满足(9)。为此,定义Lyapunov函数如下: v ( X ) = X T , X , X n ,显然, v ( X ) n 上的正定函数。对任意 α > 0 定义

v α = { X | v ( X ) α } .

下面分三步证明系统(8)的解 ζ i ( t ) 满足(9)。

第一步:证明对任意 α > 0 , τ > 0 ,都存在 δ i δ i ( α , τ ) > 0 ,当 ζ i ( t ) < δ i ( α , τ ) , t [ τ , 0 ] 时,系统(8)的解 ζ i ( t ) [ τ , τ ] 上满足

ζ i ( t ) v α , i = 2 , 3 , , N . (10)

事实上,对任意 α > 0 , τ > 0 ,取 δ i = ( 1 + c λ i D τ ) 1 e C τ ( α ) 1 / 2 > 0 ,则当 ζ i ( t ) < δ i ( α , τ ) , t [ τ , 0 ] 时,对任意的 t [ 0 , τ ] ,系统(8)两边从0到 t 积分可得

ζ i ( t ) = ζ ( 0 ) + 0 t C ζ i ( s ) c λ i D ζ i ( s τ ) d s .

从而有

ζ i ( t ) δ + 0 t ( C ζ i ( s ) + c λ i D δ ) d s δ ( 1 + c λ i D τ ) e C τ ( α ) 1 / 2 .

因此(10)成立。

第二步:证明当 t 2 τ s t 时,存在 α > 0 使得 ζ i ( t ) v α , ζ i ( s ) v α ,则对任意 ε > 0 都存在 τ i > 0 ,当 τ < τ i 时,系统(8)的解 ζ i ( t ) 满足

ζ i ( t ) ζ i ( t τ ) < ε ζ i ( t ) , i = 2 , 3 , , N . (11)

由第一步证明可知,这样的 α 存在,并且

sup t 2 τ s t ζ i ( s ) α λ min ( I ) = ζ i ( t )

类似第一步的证明,由系统(8)可得

ζ i ( t ) ζ i ( t τ ) = t τ t C ζ i ( s ) c λ i D ζ i ( s τ ) d s τ ( C + c λ i D ) sup t 2 τ s t ζ i ( s ) τ ( C + c λ i D ) ζ i ( t ) .

故对任意的 ε > 0 ,取 τ i ε ( C + c λ i D ) 1 即得(11)成立。

第三步:由第一步和第二步的结果可得,函数 v ( X ) 沿系统(8)的轨线的全导数为

d v ( ζ i ( t ) ) d t = ( C ζ i ( t ) c λ i D ζ i ( t τ ) ) T , ζ i ( t ) + ζ i ( t ) T , C ζ i ( t ) c λ i D ζ i ( t τ ) = ζ i ( t ) T C T , ζ i ( t ) c λ i ζ i ( t ) T D T , ζ i ( t ) + ζ i ( t ) T , C ζ i ( t ) ζ i ( t ) T , c λ i D ζ i ( t ) + c λ i ζ i ( t ) T D T , ζ i ( t ) c λ i ζ i T ( t τ ) D T , ζ i ( t ) + ζ i ( t ) T , c λ i D ζ i ( t ) ζ i ( t ) T , c λ i D ζ i ( t τ ) p i ζ i ( t ) 2 + 2 ε c λ i D ζ i ( t ) 2 = ( 2 ε c λ i D p i ) ζ i ( t ) 2 .

因此,当 ( 2 ε c λ i D p i ) < 0 时,对任意的 0 < τ τ 0 i = 2 , 3 , , N ,都有

d v ( ζ i ( t ) ) d t γ ζ i ( t ) 2

成立,这里 γ p i 2 ε c λ i D > 0 。这意味着系统(8)的解 ζ i ( t ) 满足(9)。定理得证。

4. 数值模拟

因为系统(6)的零解是渐近稳定性的当且仅当系统(3)可达成一致性。因此,这里对系统(6)的零解的渐近稳定性行为进行模拟,为此在系统(6)中取 L = [ 1 1 0 0 1 1 0 1 1 ] c = 1 C = [ 0 1 0 0 0 1 0 0 0 ] D = [ 0 0 0 0 0 0 1 2 3 2 3 2 ] 容易计算Laplace矩阵 L 的非零特征根为1和2,且 C c λ i D 分别为 C D C 2 D 满足Routh-Hurwitz判据。且容易计算 ( λ 2 , p 2 ) = ( 1 , 1 / 2 ) ( λ 3 , p 3 ) = ( 2 , 1 ) τ 0 = min 2 i 3 { p i 2 ( C + c λ i D ) c λ i D } = min { 1 3 , 1 4 } = 1 4 。 取时滞 τ = 1 / 4 ,则由定理1可得系统(3)可达一致性。系统8)的解满足(9),如图1所示。

但在相同的初值条件下,如果时滞 τ 1 4 大,例如 τ = 2 3 ,系统(3)不能达到一致性,即系统(8)的解 ζ i ( t ) 不满足(9) (见图2)。

当时滞 τ = 1 3 时,数值模拟显示,系统(3)仍可达到一致性,这说明定理1仅为系统(3)达到一致性的充分条件。但在 τ = 1 3 + 0.07375 时数值模拟显示,系统(3)不能达到一致性。通过多次数值模型,我们猜测在 ( 1 3 + 0.0737 , 1 3 + 0.07375 ) 之间会存在一个能够使得系统(3)达到一致性的临界时滞,甚至在该临界时滞附

(a) 特征值 λ 2 = 1 ,初值为 ( ζ 21 , ζ 22 , ζ 23 ) = ( 2 , 1 , 3 ) 时系统(8)的解的图像 (b) 特征值 λ 3 = 2 ,初值为 ( ζ 31 , ζ 32 , ζ 33 ) = ( 1 , 2 , 3 ) 时系统(8)的解的图像

Figure 1. The trajectories of system (8) when τ = 1 4

图1. τ = 1 4 时系统(8)的解的图像

(c) 特征值 λ 2 = 1 ,初值为 ( ζ 21 , ζ 22 , ζ 23 ) = ( 2 , 1 , 3 ) 时系统(8)的解的图像 (d) 特征值 λ 3 = 2 ,初值为 ( ζ 31 , ζ 32 , ζ 33 ) = ( 1 , 2 , 3 ) 时系统(8)的解的图像

Figure 2. The trajectories of system (8) when τ = 2 3

图2. τ = 2 3 时系统(8)的解的图像

近系统会出现Hopf分支最终导致周期解的出现,但目前我们还不能从理论上给予证明,这也是下一步我们要进行的工作。

基金项目

国家自然科学基金资助,项目编号:11401577。

参考文献

[1] 陈杰, 方浩, 辛斌. 多智能体系统的协同群集运动控制[M]. 北京: 科学出版社, 2017.
[2] 虞文武, 温光辉, 陈冠荣, 曹进德. 多智能体系统分布式协同控制[M]. 北京: 高等教育出版社, 2016: 218-219.
[3] Hong, Y., Chen, G. and Bushnell, L. (2008) Technical Communique: Distributed Observers Design for Leader-Following Control of Mul-ti-Agent Networks. Automatica, 44, 846-850.
https://doi.org/10.1016/j.automatica.2007.07.004
[4] Hu, J., Hong, Y. and Gao, L. (2007) Tracking Control for Multi-Agent Consensus with an Active Leader and Variable Topology. Automatica, 42, 1177-1182.
[5] Ren, W. (2007) Second-Order Consensus Algorithm with Extensions to Switching Topologies and Reference Models. Proceedings of the 2007 American Control Conference, New York, 11-13 July 2007, 1431-1436.
[6] Ren, W. (2008) On Consensus Algorithms for Double-Integrator Dynamics. IEEE Transactions on Automatic Control, 53, 1503-1509.
https://doi.org/10.1109/TAC.2008.924961
[7] Ren, W. and Atkins, E. (2013) Second-Order Consensus Protocols in Multiple Vehicle Systems with Local Interactions. AIAA Guidance, Navigation, and Control Conference and Exhibit, San Francisco, 15-18 August 2005, 1-13.
[8] Ren, W., Moore, K.L. and Chen, Y. (2007) High-Order and Model Reference Consensus Algorithms in Cooperative Control of MultiVehicle Systems. Journal of Dynamic Systems Measurement & Control, 129, 678-688.
https://doi.org/10.1115/1.2764508
[9] Yu, W., Chen, G., Ren, W., et al. (2011) Distributed Higher Order Con-sensus Protocols in Multiagent Dynamical Systems. IEEE Transactions on Circuits & Systems I: Regular Papers, 58, 1924-1932.
https://doi.org/10.1109/TCSI.2011.2106032
[10] Yu, W., Chen, G., Cao, M., et al. (2013) Delay-Induced Con-sensus and Quasi-Consensus in Multi-Agent Dynamical Systems. IEEE Transactions on Circuits & Systems I: Regular Papers, 60, 2679-2687.
https://doi.org/10.1109/TCSI.2013.2244357
[11] Atay, F.M. (2013) The Consensus Problem in Networks with Transmission Delays. Philosophical Transactions of the Royal Society A, 371, 20120460.
[12] Gopalsamy, K. (1992) Stability and Oscillations in Delay Differential Equations of Population Dynamics. Springer Netherlands, 214-218.
https://doi.org/10.1007/978-94-015-7920-9
[13] Horn, R.A. and Johnson, C.R. (2013) Matrix Analysis. Cam-bridge University Press, Cambridge.