建模与仿真  >> Vol. 8 No. 3 (August 2019)

具有输入饱和的严格反馈系统的约束控制
Constrained Control for Strict Feedback Systems with Input Saturation

DOI: 10.12677/MOS.2019.83013, PDF, HTML, XML, 下载: 364  浏览: 1,237  科研立项经费支持

作者: 唐 丽*, 贾继阳:辽宁工业大学理学院,辽宁 锦州

关键词: 自适应控制全状态约束障碍李雅普诺夫函数Adaptive Control Full State Constraints Barrier Lyapunov Functions

摘要: 针对具有全状态约束和输入饱和的非线性严格反馈系统,提出了一种自适应神经网络跟踪控制方案。文中利用反步递推和神经网络逼近相结合的方法设计自适应控制器。在设计过程中,首先,利用高斯误差函数构建一种连续可导的非对称饱和模型。其次,通过选取正切型障碍李雅普诺夫函数处理状态约束问题,即确保全状态约束不被违背。对比已有对数型障碍李雅普诺夫函数和积分型障碍李雅普诺夫函数,正切型的障碍李雅普诺夫函数是一种即可以处理具有约束的系统又可以处理没有约束的系统的函数。再次,通过定理证明闭环系统的所有信号是一致最终有界的,误差信号保持在零的小邻域内,并且不违反全状态约束。最后,由仿真结果验证所提方案的有效性和可行性。
Abstract: An adaptive neural network tracking control scheme is proposed for nonlinear strict feedback systems with full state constraints and input saturation. The adaptive controller is designed by combining the backstepping technique and neural network approximator. In the design process, firstly, a continuous differentiable asymmetric saturation model is constructed by using Gaussian error function. Secondly, tangent Barrier Lyapunov functions (tan-BLFs) are selected to deal with the state constraint problems, that is to ensure that the full-state constraint is not violated. Com-pared with existing logarithm-BLFs and integral-BLFs, tan-BLFs are the BLFs that can deal with both constrained and unconstrained systems. Thirdly, it is proved by the theorem that all the signals in the closed-loop systems are uniformly ultimately bounded, and the error signals are kept in the small neighborhood of zero, and full state constraints are not violated. Finally, the simulation results show that the proposed scheme is effective and feasible.

文章引用: 唐丽, 贾继阳. 具有输入饱和的严格反馈系统的约束控制[J]. 建模与仿真, 2019, 8(3): 102-116. https://doi.org/10.12677/MOS.2019.83013

1. 引言

近年来,基于实际需求和理论研究,约束控制系统的设计在国内外开始盛行并备受关注,包括对系统的输入 [1] 、输出 [2] 和状态 [3] 等方面的约束,如果在系统运行过程中违反约束控制条件,则会影响系统动态性能,致使系统不稳定,更有甚者会损坏物理器件,有时需要人工干预来满足约束条件,这样既耗时又耗力。一般而言,针对具有输入约束 [1] 的控制系统,主要是通过死区输入、饱和输入和迟滞输入等几种方式来对系统进行约束。同时,针对具有输出和状态约束的控制系统方法 [3] 也相继问世,其中包括模型预测控制方法(MPC)、超驰控制、不变域控制法、自适应变结构控制、误差转换函数、极值搜索控制、饱和补偿方控制方法和障碍李雅普诺夫函数控制方法等。本文采用正切型障碍李雅普诺夫函数控制方法进行约束控制。

基于障碍李雅普诺夫函数的自适应约束控制方法能在不需要得到系统显式解的情况下使得约束条件不被违反,因而,与后期调试或试凑相比,该方法的可操作性更高,特别是针对高阶非线性系统或者大规模互联过程。目前正切型障碍李雅普诺夫函数得到了较为广泛的应用。在文献 [4] 中,针对一类具有参数不确定和全状态约束的严格反馈非线性系统,基于所构造的调节函数,提出了一种正切型障碍李亚普诺夫函数来保证跟踪误差的有界性,结合一个数值算例,证明了该方法能够达到预期的性能,且不突破全状态约束。而在文献 [5] 中,则是利用障碍李亚普诺夫函数对具有输出约束的严格反馈非线性系统进行系统化的控制设计,提出了基于对称和非对称对数型障碍李亚普诺夫函数的反推控制设计方法,保证了输出约束条件不违反,并证明闭环系统中的信号有界性。通过仿真,对比了正切型障碍李亚普诺夫函数和对数型障碍李亚普诺夫函数来说明控制性能的差异。在文献 [6] 中,针对具有状态约束的多输入多输出(MIMO)非线性系统,提出了一种新的自适应容错控制(FTC)方案,构建了一种新的正切型时变障碍李亚普诺夫函数,设计了一个辅助系统来分析输入约束的影响,在两自由度机械手控制系统上,验证了该方案的有效性。

本文针对具有全状态约束和输入饱和的非线性单输入单输出系统进行自适应跟踪控制研究。利用反步递推和神经网络逼近相结合的方法设计了自适应控制器。利用误差函数得到了一个连续可导的非对称饱和模型,再通过构造恰当的正切型障碍李雅普诺夫函数来解决约束控制问题,保证了系统所有状态均不违反约束条件,其中tan-BLFs可以同时处理具有约束和无约束的系统,证明了闭环系统的所有信号都是一致最终有界的,误差信号收敛到零的小邻域内。最后,通过仿真例子进一步验证了所提约束控制策略的有效性。

2. 问题描述及稳定性分析

2.1. 系统描述

考虑下面一类非线性严格反馈系统

{ x ˙ i = f i ( x ¯ i ) + g i ( x ¯ i ) x i + 1 i = 1 , , n 1 x ˙ n = f n ( x ¯ n ) + g n ( x ¯ n ) u ( v ) y = x 1 (1)

其中, x ¯ i = [ x 1 , , x n ] T R i 是系统的状态,且 | x i | k c i , k c i 是一个常数; y R 是系统的输出, f i ( x ¯ i ) , i = 1 , , n 1 是不确定非线性光滑函数, g i ( x ¯ i ) 是已知函数。 u ( ν ) R 为饱和器的输出,也是系统的输入, ν R 是饱和器的输入,有如下描述

u ( v ) = u M × e r f ( π 2 u M v ) (2)

其中, u M = ( ( u + + u ) + ( u + u ) sgn ( v ) ) / 2 ,这里 u + u 是分别是执行器的上界和下界, sgn ( ) e r f ( ) 分别是标准符号函数和高斯误差函数。

为了便于接下来的控制器设计,定义如下函数

其中,c为正常数,u和v均为时间函数。则

u = c v + Δ ( v ) (3)

将公式(3)代入系统(1),可得

(4)

对于系统(4),现提出如下假设、引理及注解。

假设1: y d 是一个连续有界函数,因此 y ˙ d y ¨ d 都可导。

假设2:假设对于 t 0 y d 满足 | y d | Y 0 < k c i ,同时i阶时间导数 y d ( i ) ( t ) 满足 | y d ( i ) ( t ) | Y i , i = 1 , , n ,其中, Y 1 , , Y n 是正常数, Y 0 ( t ) : R + R +

假设3:信号的控制增益函数 g i ( ) 是已知的,存在常数 g ¯ i g i > 0 使得 g ¯ i | g i ( ) | > g i , i = 1 , , n

假设4:存在常数 Δ ¯ c _ c ¯ ,使得 Δ ( v ) 和c在系统(1)中满足 Δ ( v ) Δ ¯ c [ c _ , c ¯ ]

引理1:对于有界的初始条件,如果存在一个连续和正定的李雅普诺夫函 V ( x ) ,满足 k 1 ( x ) V ( x ) k 2 ( x ) ,这样就有 V ˙ ( x ) γ V ( x ) + ν ,其中 k 1 , k 1 : n κ 类函数,并且 ν 是一个小的正常数,那么结果就是 x ( t ) 是一致有界的。

本文的控制目标是构造一个自适应神经网络控制器,使系统输出y能较好的跟踪上期望信号 y d ,并且全部的状态都不违反约束界,所有信号是半全局最终有界的。

2.2. 控制器设计和系统稳定性分析

本节运用反步递推方法对具有输入饱和全状态约束的非线性严格反馈系统进行神经网络自适应控制器u的设计,最终证明系统是稳定的。现给出误差变量 z i 和虚拟控制器 α i 的定义,即 z i = x i α i 1 , i = 1 , , n , α 0 = y d , α i , i = 1 , , n 1

第1步:定义误差变量 z 1 = x 1 y d , z 2 = x 2 α 1 ,并且选取正切型障碍李雅普诺夫函数 V 1 = ( k b 1 2 / π ) tan ( ( π z 1 2 ) / ( 2 k b 1 2 ) ) ,其中 | z 1 | < k b 1 , k b 1 是正常数。根据系统(4)、公式(2)和公式(3),则有

z ˙ 1 = x ˙ 1 y ˙ d = f 1 ( x 1 ) + g 1 ( x 1 ) x 2 y ˙ d = f 1 ( x 1 ) + g 1 ( x 1 ) ( z 2 + α 1 ) y ˙ d (5)

V 1 对时间t求导,则得到 V ˙ 1 的表示如下

V ˙ 1 = z ( f 1 ( x 1 ) + g 1 ( x 1 ) ( z 2 + α 1 ) y ˙ d ) sec 2 ( π z 1 2 2 k b 1 2 ) (6)

利用神经网络逼近 f 1 ( x 1 ) y ˙ d ,则有

f 1 ( x 1 ) y ˙ d = W 1 T S 1 ( Z 1 ) + ε 1 ( Z 1 ) (7)

其中, W 1 是神经网络权重向量, ε 1 ( Z 1 ) 是神经网络逼近误差, | ε 1 ( Z 1 ) | ε 1 * , Z 1 [ x 1 , y ˙ d ] T 。将式(7)代入式(6),可得

V ˙ 1 = z 1 ( g 1 ( x 1 ) z 2 + W 1 T S 1 ( Z 1 ) + ε 1 ( Z 1 ) ) sec 2 ( π z 1 2 2 k b 1 2 ) (8)

根据杨氏不等式有

{ z 1 W 1 T S 1 ( Z 1 ) sec 2 ( π z 1 2 2 k b 1 2 ) 1 2 a 1 2 + Θ 1 2 a 1 2 S 1 T ( Z 1 ) S 1 ( Z 1 ) z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) z 1 ε 1 ( Z 1 ) sec 2 ( π z 1 2 2 k b 1 2 ) 1 2 ε 1 * 2 + 1 2 z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) g 1 ( x 1 ) z 1 z 2 sec 2 ( π z 1 2 2 k b 1 2 ) 1 2 z 2 2 + 1 2 g 1 2 ( x 1 ) z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) (9)

W max , 1 2 W 1 2 ,记 W max , 1 2 = Θ 1 ,其中 Θ ˜ 1 = Θ 1 Θ ^ 1 ,且 Θ ^ 1 Θ 1 的估计,将(9)代入(8)有

V ˙ 1 1 2 z 2 2 + 1 2 g 1 2 ( x 1 ) z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) + 1 2 a 1 2 + 1 2 ε 1 * 2 + Θ 1 2 a 1 2 S 1 T ( Z 1 ) S 1 ( Z 1 ) z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) + 1 2 z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) + g 1 ( x 1 ) z 1 α 1 sec 2 ( π z 1 2 2 k b 1 2 ) (10)

设计虚拟控制器 α 1 如下

α 1 = 1 g 1 ( x 1 ) ( k b 1 2 ϕ 1 π z 1 cos ( π z 1 2 2 k b 1 2 ) sin ( π z 1 2 2 k b 1 2 ) 1 2 z 1 sec 2 ( π z 1 2 2 k b 1 2 ) 1 2 g 1 2 ( x 1 ) z 1 sec 2 ( π z 1 2 2 k b 1 2 ) Θ ^ 1 2 a 1 2 S 1 T ( Z 1 ) S 1 ( Z 1 ) z 1 sec 2 ( π z 1 2 2 k b 1 2 ) ) (11)

其中, ϕ 1 是正设计参数,且 lim z 1 0 ( k b 1 2 ϕ 1 ) / ( π z 1 ) ( sin ( ( π z 1 2 / 2 k b 1 2 ) ) / sec ( ( π z 1 2 / 2 k b 1 2 ) ) ) = 0 ,将虚拟控制器(11)代入(10)得

V ˙ 1 1 2 z 2 2 + Θ ˜ 1 2 a 1 2 S 1 T ( Z 1 ) S 1 ( Z 1 ) z 1 2 sec 4 ( π z 1 2 2 k b 1 2 ) + 1 2 a 1 2 + 1 2 ε 1 * 2 k b 1 2 π ϕ 1 tan ( π z 1 2 2 k b 1 2 ) (12)

第2步:定义误差变量 , z 3 = x 3 α 2 ,并且选取正切型障碍李雅普诺夫函数 V 2 = V 1 + ( k b 2 2 / π ) ( tan ( π z 2 2 / 2 k b 2 2 ) ) ,其中 , k b 2 是正常数。则根据系统(4),式(11)得到

z ˙ 2 = x ˙ 2 α ˙ 1 = f 2 ( x ¯ 2 ) + g 2 ( x ¯ 2 ) x 3 α ˙ 1 = f 2 ( x ¯ 2 ) + g 2 ( x ¯ 2 ) x 3 α ˙ 1 (13)

其中,,且 α ˙ 1 = α 1 x 1 x ˙ 1 + α 1 y d y ˙ d + α 1 y ˙ d y ¨ d + α 1 Θ ^ 1 Θ ^ ˙ 1 , V 2 对时间t求导,再将(13)代入,则 V ˙ 2 表示如下

V ˙ 2 = V ˙ 1 + z 2 z ˙ 2 sec 2 ( π z 2 2 2 k b 2 2 ) = z 2 ( f 2 ( x ¯ 2 ) + g 2 ( x ¯ 2 ) ( z 3 + α 2 ) α ˙ 1 ) sec 2 ( π z 2 2 2 k b 2 2 ) + V ˙ 1 (14)

利用神经网络逼近 f 2 ( x ¯ 2 ) α ˙ 1 ,则有

f 2 ( x ¯ 2 ) α ˙ 1 = W 2 T S 2 ( Z 2 ) + ε 2 ( Z 2 ) (15)

其中, Z 2 [ x 1 , x 2 , y d , y ˙ d , y ¨ d , Θ ^ 1 ] T ,将(15)代入(14)有

V ˙ 2 = V ˙ 1 + z 2 ( W 2 T S 2 ( Z 2 ) + ε 2 ( Z 2 ) + g 2 ( x ¯ 2 ) z 3 + g 2 ( x ¯ 2 ) α 2 ) sec 2 ( π z 2 2 2 k b 2 2 ) (16)

根据杨氏不等式,有

(17)

,记 W max , 2 2 = Θ 2 ,其中 Θ ˜ 2 = Θ 2 Θ ^ 2 ,且 Θ ^ 2 Θ 2 的估计(17)代入(16)得

V ˙ 2 1 2 z 3 2 + 1 2 g 2 2 ( x ¯ 2 ) z 2 2 sec 4 ( π z 2 2 2 k b 2 2 ) + 1 2 a 2 2 + Θ 2 2 a 2 2 S 2 T ( Z 2 ) S 2 ( Z 2 ) z 2 2 sec 4 ( π z 2 2 2 k b 2 2 ) + 1 2 ε 2 * 2 + 1 2 z 2 2 sec 4 ( π z 2 2 2 k b 2 2 ) + g 2 ( x ¯ 2 ) α 2 z 2 sec 2 ( π z 2 2 2 k b 2 2 ) + 1 2 z 2 2 + 1 2 a 1 2 + Θ ˜ 1 2 a 1 2 S 1 T ( Z 1 ) S 1 ( Z 1 ) z 1 2 sec 4 ( π z 2 2 2 k b 2 2 ) + 1 2 ε 2 * 2 k b 1 2 π ϕ 1 tan ( π z 1 2 2 k b 1 2 ) (18)

设计虚拟控制器 α 2 如下

α 2 = 1 g 2 ( x ¯ 2 ) ( k b 2 2 ϕ 2 π z 2 sin ( π z 2 2 2 k b 2 2 ) cos ( π z 2 2 2 k b 2 2 ) Θ ^ 2 2 a 2 2 S 2 T ( Z 2 ) S 2 ( Z 2 ) z 2 sec 2 ( π z 2 2 2 k b 2 2 ) 1 2 z 2 sec 2 ( π z 2 2 2 k b 2 2 ) 1 2 g 2 2 ( x ¯ 2 ) z 2 sec 2 ( π z 2 2 2 k b 2 2 ) 1 2 z 2 cos 2 ( π z 2 2 2 k b 2 2 ) ) (19)

其中, ϕ 2 是正设计参数,且 lim z 2 0 ( k b 2 2 ϕ 2 ) / ( π z 2 ) ( sin ( ( π z 2 2 / 2 k b 2 2 ) ) / sec ( ( π z 2 2 / 2 k b 2 2 ) ) ) = 0 ,将虚拟控制器(19)代入(18)有

V ˙ 2 j = 1 2 ( 1 2 a j 2 + 1 2 ε j * 2 k b j 2 π ϕ j tan ( π z j 2 2 k b j 2 ) + Θ ˜ j 2 a j 2 S j T ( Z j ) S j ( Z j ) z j 2 sec 4 ( π z j 2 2 k b j 2 ) ) + 1 2 z 3 2 (20)

第i步 ( i = 2 , , n 1 ) :定义误差变量 z i = x i α i 1 z i + 1 = x i + 1 α i ,并且选取正切型障碍李雅普诺夫函数 V i = V i 1 + ( k b i 2 / π ) ( tan ( π z i 2 / 2 k b i 2 ) ) ,其中 , k b i 是正常数。则根据系统(4),得到

z ˙ i = x ˙ i α ˙ i 1 = f i ( x ¯ i ) + g i ( x ¯ i ) x i + 1 α ˙ i 1 = f i ( x ¯ i ) + g i ( x ¯ i ) ( z i + 1 + α i ) α ˙ i 1 (21)

其中, α i 1 ( x 1 , , x i 1 , y d , , y d ( i 1 ) , Θ ^ 1 , , Θ ^ i 1 ) ,并且有

α ˙ i 1 = j = 1 i 1 α i 1 x j x ˙ j + j = 0 i 1 α i 1 y d ( j ) y d ( j + 1 ) + j = 1 i 1 α i 1 Θ ^ j Θ ^ ˙ j

接着, V i 对时间t求导,再将(21)代入,则 V ˙ i 表示如下

V ˙ i = V ˙ i 1 + Z i Z ˙ i sec 2 ( π z i 2 2 k b i 2 ) = V ˙ i 1 + z i ( f i ( x ¯ i ) + g i ( x ¯ i ) ( z i + 1 + α i ) α ˙ i 1 ) (22)

利用神经网络逼近 f 2 ( x ¯ 2 ) α ˙ i 1 ,则有

f i ( x ¯ i ) α ˙ i 1 = W i T S i ( Z i ) + ε i ( Z i ) (23)

其中, Z i [ x 1 , , x i , y d , , y d ( i ) , Θ ^ 1 , , Θ ^ i 1 ] T ,将(23)代入到(22)得到

V ˙ i = V ˙ i 1 + z i ( W i T S i ( Z i ) + ε i ( Z i ) + g i ( x ¯ i ) z i + 1 + g i ( x ¯ i ) α i ) sec 2 ( π z i 2 2 k b i 2 ) (24)

根据杨氏不等式,有

{ z i W i T S i ( Z i ) sec 2 ( π z i 2 2 k b i 2 ) 1 2 a i 2 + W i 2 2 a i 2 S i T ( Z i ) S i ( Z i ) z i 2 sec 4 ( π z i 2 2 k b i 2 ) 1 2 a i 2 + W max , i 2 2 a i 2 S i T ( Z i ) S i ( Z i ) z i 2 sec 4 ( π z i 2 2 k b i 2 ) = 1 2 a i 2 + Θ i 2 a i 2 S i T ( Z i ) S i ( Z i ) z i 2 sec 4 ( π z i 2 2 k b i 2 ) z i ε i ( Z i ) sec 2 ( π z i 2 2 k b i 2 ) 1 2 ε i * 2 + 1 2 z i 2 sec 4 ( π z i 2 2 k b i 2 ) g i ( x ¯ i ) z i z i + 1 sec 2 ( π z i 2 2 k b i 2 ) 1 2 z i + 1 2 + 1 2 g i 2 ( x ¯ i ) z i 2 sec 4 ( π z i 2 2 k b i 2 ) (25)

W max , i 2 W i 2 ,记,其中 Θ ˜ i = Θ i Θ ^ i ,且 Θ ^ i Θ i 的估计,再将(25)代入(24)得到

V ˙ i V ˙ i 1 + 1 2 z i + 1 2 + 1 2 g i 2 ( x ¯ i ) z i 2 sec 4 ( π z i 2 2 k b i 2 ) 1 2 a i 2 + Θ i 2 a i 2 S i T ( Z i ) S i ( Z i ) z i 2 sec 4 ( π z i 2 2 k b i 2 ) + 1 2 ε i * 2 + 1 2 z i 2 sec 4 ( π z i 2 2 k b i 2 ) + g i ( x ¯ i ) α i z i sec 2 ( π z i 2 2 k b i 2 ) (26)

设计虚拟控制器 α i 如下

α i = 1 g i ( x ¯ i ) ( k b i 2 ϕ i π z i sin ( π z i 2 2 k b i 2 ) cos ( π z i 2 2 k b i 2 ) Θ ^ i 2 a i 2 S i T ( Z i ) S i ( Z i ) z i sec 2 ( π z i 2 2 k b i 2 ) 1 2 z i sec 2 ( π z i 2 2 k b i 2 ) 1 2 g i 2 ( x ¯ i ) z i sec 2 ( π z i 2 2 k b i 2 ) 1 2 z i cos 2 ( π z i 2 2 k b i 2 ) ) (27)

且有 lim z i 0 ( k b i 2 ϕ i / π z i ) ( sin ( π z i 2 / 2 k b i 2 ) / sec ( π z i 2 / 2 k b i 2 ) ) = 0 ,根据(13)和(21),再将虚拟控制器(27)代入到(26)得到

V ˙ i j = 1 i ( 1 2 a j 2 + 1 2 ε j * 2 k b i 2 π ϕ j tan ( π z j 2 2 k b i 2 ) + Θ ˜ j 2 a j 2 S j T ( Z j ) S j ( Z j ) z j 2 sec 4 ( π z j 2 2 k b i 2 ) ) + 1 2 z i + 1 2 (28)

第n步:定义跟踪误差变量 z n = x n α n 1 ,其中 | z n | < k b n , k b n 是正常数。则根据系统(4),得到

z ˙ n = x ˙ n α ˙ n 1 = f n ( x ¯ n ) + g n ( x ¯ n ) c v + g n ( x ¯ n ) Δ ( v ) α ˙ n 1 ( x ¯ n ) x n + 1 (29)

其中, α n 1 ( x 1 , , x n 1 , y d , , y d ( n 1 ) , Θ ^ 1 , , Θ ^ n 1 ) ,并且

α ˙ n 1 = j = 1 n 1 α n 1 x j x ˙ j + j = 0 n 1 α n 1 y d ( j ) y d ( j + 1 ) + j = 1 n 1 α n 1 Θ ^ j Θ ^ ˙ j

选取正切型障碍李雅普诺夫函数

V n = V n 1 + k b n 2 c π tan ( π z n 2 2 k b n 2 ) + j = 1 n 1 2 ξ j Θ ˜ j 2 (30)

其中, ξ j , j = 1 , , n 是正设计参数。

V n 对时间t求导,再将(29)代入,则 V ˙ n 表示如下

(31)

利用神经网络逼近 f n ( x ¯ n ) α ˙ n 1 ,则有

f n ( x ¯ n ) α ˙ n 1 = W n T S n ( Z n ) + ε n ( Z n ) (32)

其中, Z n [ x 1 , , x n , y d , , y d ( n ) , Θ ^ 1 , , Θ ^ n 1 ] T ,将(32)代入到(31),得到

V ˙ n = V ˙ n 1 + 1 c z n ( W n T S n ( Z n ) + ε n ( Z n ) + g n ( x ¯ n ) c v + g n ( x ¯ n ) Δ ( v ) ) sec 2 ( π z n 2 2 k b n 2 ) j = 1 n Θ ˜ j T Θ ^ ˙ j ξ j (33)

根据杨氏不等式有

{ 1 c z n W n T S n ( Z n ) sec 2 ( π z n 2 2 k b n 2 ) 1 2 a n 2 c 2 + Θ n 2 a n 2 S n T ( Z n ) S n ( Z n ) z n 2 sec 4 ( π z n 2 2 k b n 2 ) 1 c z n ε n ( Z n ) sec 2 ( π z n 2 2 k b n 2 ) 1 2 ε n * 2 c 2 + 1 2 z n 2 sec 4 ( π z n 2 2 k b n 2 ) 1 c z n g n ( x ¯ n ) Δ ( v ) sec 2 ( π z n 2 2 k b n 2 ) 1 2 Δ ¯ 2 c 2 + 1 2 z n 2 g n 2 ( x ¯ n ) sec 4 ( π z n 2 2 k b n 2 ) (34)

将(34)代入到(33)得到

V ˙ n V ˙ n 1 + 1 2 a n 2 c 2 + Θ n 2 a n 2 S n T ( Z n ) S n ( Z n ) z n 2 sec 4 ( π z n 2 2 k b n 2 ) + 1 2 ε n * 2 c 2 + 1 2 z n 2 sec 4 ( π z n 2 2 k b n 2 ) + 1 2 Δ ¯ 2 c 2 + 1 2 z n 2 g n 2 ( x ¯ n ) sec 4 ( π z n 2 2 k b n 2 ) + z n g n ( x ¯ n ) v sec 2 ( π z n 2 2 k b n 2 ) j = 1 n Θ ˜ j T Θ ^ ˙ j ξ j (35)

现取函数v如下

(36)

根据(12)、(20)和(30),将函数v代入,得到

V ˙ n j = 1 n ( 1 2 a j 2 c 2 + 1 2 ε j * 2 c 2 k b j 2 π ϕ j tan ( π z j 2 2 k b j 2 ) + Θ ˜ j 2 a j 2 S j T ( Z j ) S j ( Z j ) z j 2 sec 4 ( π z j 2 2 k b j 2 ) ) + 1 2 Δ ¯ 2 c 2 j = 1 n Θ ˜ j T Θ ^ ˙ j ξ j (37)

设计如下自适应律 Θ ^ ˙ j , j = 1 , , n

Θ ^ ˙ j = ξ j 2 a j 2 S j T ( Z j ) S j ( Z j ) z j 2 sec 4 ( π z j 2 2 k b j 2 ) σ j Θ ^ j (38)

其中, σ j 为修正项,提高系统鲁棒性。

将(38)代入(37)有

V ˙ n j = 1 n ( 1 2 a j 2 c 2 + 1 2 ε j * 2 c 2 k b j 2 π ϕ j tan ( π z j 2 2 k b j 2 ) + σ j Θ ˜ j T Θ ^ j ξ j ) + 1 2 Δ ¯ 2 c 2 (39)

又因为

Θ ˜ j T Θ ^ j 1 2 Θ j 2 1 2 Θ ˜ j 2 (40)

V ˙ n j = 1 n ( k b j 2 π ϕ j tan ( π z j 2 2 k b j 2 ) σ j Θ ˜ j 2 2 ξ j + σ j Θ j 2 2 ξ j + 1 2 a j 2 + 1 2 ε j * 2 ) + 1 2 Δ ¯ 2 (41)

进一步整理,可得

V ˙ n A V n + B (42)

其中,

{ A = min ( c ϕ j , σ j ) , j = 1 , , n B = j = 1 n ( 1 2 a j 2 c 2 + 1 2 ε j * 2 c 2 + σ j Θ j 2 2 ξ j ) + 1 2 Δ ¯ 2 c 2 , j = 1 , , n (43)

故根据李雅普诺夫函数第二法,系统(4)是稳定的。根据上述分析,可得如下定理结果:

定理1:基于假设1至假设3,虚拟控制器(11)、(19)和(27),控制器(36)和自适应律(38),考虑一个具有输入饱和的全状态约束的非线性严格反馈系统(4),如果满足初始状态 | x i | k c i ,则有以下性质成立

1) 误差变量是有界的;

2) 不违反全部状态约束;

3) 闭环系统的全部信号是有界的。

证明:

根据公式(33)和公式(42),A和B按(43)取值,再将公式(42)乘 e A t ,对乘积之后的结果在 [ 0 , t ] 上取积分得

0 V n ( t ) ( V n ( 0 ) B A ) e A t + B A V n ( 0 ) e A t + B A (44)

结合公式(31)和公式(45)有

k b n 2 π tan ( π z n 2 2 k b n 2 ) V n ( t ) B A + V n ( 0 ) e A t (45)

j = 1 n 1 2 ξ j Θ ˜ j 2 V n ( t ) B A + V n ( 0 ) e A t (46)

再根据(47)和(48)有

(47)

1 2 ξ 1 Θ ˜ 1 2 V 1 ( t ) B A + V 1 ( 0 ) e A t (48)

根据(49)和(50)得到误差变量 z 1 , Θ ˜ 1 满足

| z 1 | 2 k b 1 2 π arctan ( π 2 k b 1 2 ( B A + V 1 ( 0 ) e A t ) ) (49)

| Θ ˜ 1 | 2 ξ 1 ( B A + V 1 ( 0 ) e A t ) (50)

由此可见 z 1 , Θ ˜ 1 是一致最终有界的,又因为误差变量 z 1 = x 1 y d y d 是有界的,所以 x 1 = z 1 + y d 也是有界的。所以再根据公式(13)可知作为的关于 x 1 , y d , Θ ^ 1 y ˙ d 的函数, α 1 也是有界的。

根据(47)和(48)还可以得到

k b 2 2 π tan ( π z n 2 2 k b 2 2 ) V 2 ( t ) B A + V 2 ( 0 ) e A t (51)

(52)

则可得

| z 2 | 2 k b 2 2 π arctan ( π 2 k b 2 2 ( B A + V 2 ( 0 ) e A t ) ) (53)

根据(53)可知 z 2 是有界的,又因为 z 2 = x 2 α 1 ,且 α 1 是有界的,所以 x 2 = z 2 + α 1 是有界的。剩下的信号的有界性可以通过归纳证明。假设 x ¯ i 是有界的,然后有 α 1 , , α i 也应该是有界的。剩余信号的有界性可以通过归纳证明。根据 z i + 1 = x i + 1 α i , x i + 1 的有界性可以推出。根据光滑性 x 1 f i + 1 ( x ¯ i + 1 ) g i + 1 ( x ¯ i + 1 ) 也有界。因为 α i + 1 z i + 1 , x 1 , , x i + 1 , y d , , y d ( i + 1 ) , Θ ^ 1 , , Θ ^ i + 1 的函数,因此它也是有界的。通过归纳,可以得出状态向量 x ¯ n 和实际控制输入v,其中v是关于 z n , x 1 , , x n , y d , , y d ( n ) Θ ^ 1 , , Θ ^ n 函数,因此v也是有界的。因此,将所采用的神经网络构造在足够大的逼近区域上,可以得到一个稳定的自适应神经控制器,使有界初始条件保证闭环系统中所有信号的有界性。根据(42)和引理1,很容易证明,闭环系统的所有信号最终都是一致有界的。

3. 仿真实验

为检验方案可行性,根据所设计的控制方法对如下具有全状态约束的非线性严格反馈系统

{ x ˙ 1 = 0.4 sin ( x 1 2 ) + x 2 x ˙ 2 = 0.1 ( x 1 + x 2 ) 2 + u ( v ) y = x 1 (54)

其中, x 1 x 2 是状态变量,状态的约束描述为 | x 1 | < k c 1 = 0 .9 , | x 2 | < k c 2 = 1 .3 ; u是系统的输入,y是系统的输出,针对系统(1)设计自适应神经网络控制器使得输出y尽可能地跟踪上期望的轨迹 y d = 0 .8sin ( t ) ,同时闭环系统的所有信号都是一致最终有界的(图1图2)。

Figure 1. The trajectories of the state x1 and the reference signal yd

图1. 状态x1及参考信号的轨迹

控制器的设计如下

α 1 = ( ϕ 1 π z 1 k b 1 2 ) ( sin ( π z 1 2 2 k b 1 2 ) cos ( π z 1 2 2 k b 1 2 ) ) 1 2 z 1 sec 2 ( π z 1 2 2 k b 1 2 ) 1 2 z 1 sec 2 ( π z 1 2 2 k b 1 2 ) Θ ^ 1 2 a 1 2 S 1 T ( Z 1 ) S 1 ( Z 1 ) z 1 sec 2 ( π z 1 2 2 k b 1 2 ) v = k b 2 2 ϕ 2 π z 2 ( sin ( π z 1 2 2 k b 1 2 ) cos ( π z 1 2 2 k b 1 2 ) ) + Θ ^ 2 2 a 2 2 S 2 T ( Z 2 ) S 2 ( Z 2 ) z 2 sec 2 ( π z 2 2 2 k b 2 2 ) + 1 2 z 2 sec 2 ( π z 2 2 2 k b 2 2 ) + 1 2 sec 2 ( π z 2 2 2 k b 2 2 ) + 1 2 z 2 cos 2 ( π z 2 2 2 k b 2 2 ) )

其中,误差变量 z 1 = x 1 y d , z 2 = x 2 α 1 , Z 1 = [ x 1 , y ˙ d , y d ] T , Z 2 [ x 1 , x 2 , y d , y ˙ d , y ¨ d , Θ ^ 1 ] T

Figure 2. The trajectory of the state x2

图2. 状态x2的轨迹

设计自适应律如下

Θ ^ ˙ j = ξ j 2 a j 2 S j T ( Z j ) S j ( Z j ) z j 2 sec 4 ( π z j 2 2 k b j 2 ) σ j Θ ^ j , j = 1 , 2

状态初始值设置为 x 1 ( 0 ) = 0.1 , x 2 ( 0 ) = 0.2 ,自适应律初始值设置 Θ ^ 1 ( 0 ) = 0.01 , Θ ^ 2 ( 0 ) = 0.01 。参数设计为 σ 1 = 24 , σ 2 = 24 , ξ 1 = 8 , ξ 2 = 4 , ϕ 1 = 24 , ,给定常数 u 0 = 2.5 , u 1 = 5 , a 1 = 5 , a 2 = 8

根据以上的设计方法,用MATLAB仿真进行仿真,所得的仿真曲线描述于图1~6。图1是y跟踪 y d 的轨迹和状态 x 1 的轨迹,图2是状态的轨迹,从图1图2可以看出所设计系统很好地跟踪,并且状态变量都是有界的;图3是误差变量 z 1 z 2 的相位轨迹图,很清晰的表达出误差在很小的范围内波动;图4是自适应律 Θ ^ 1 Θ ^ 2 的轨迹,易知,自适应律有界;图5图6分别是控制器u和饱和器输入v的轨迹,从而可以看出u和v都是有界的。图1说明跟踪效果良好,且约束条件不违反;图2说明系统状态有界,且不违反约束条件;图3说明误差均在很小的范围内波动;图4~6说明自适应律、控制器及饱和执行器输入均有界。因此,综合图1~6,该方案的优势和准确性得到了较为良好的验证。

Figure 3. The phase trajectories of the errors z1 and z2

图3. 误差变量z1和z2的相位轨迹

Figure 4. The curves of the adaptive laws Θ ^ 1 and

图4. 自适应律 Θ ^ 1 Θ ^ 2 的轨迹

Figure 5. The curve of the system input u

图5. 系统输入u的轨迹

Figure 6. The trajectory of the saturated input v

图6. 饱和输入v的轨迹

4. 结论

本文研究了不确定非线性单变量严格反馈系统的智能约束控制问题。被考虑的三角结构系统,包含了执行器的饱和输入模块。利用径向基神经网络对系统中的未知动态进行辨识,采用高斯误差函数建立出非对称饱和执行器的模型,构造正切型的障碍李雅普诺夫函数来解决系统所有状态必须满足约束条件的问题。基于李雅普诺夫稳定性原理和反步递推技术,证明了闭环系统所有信号的有界性,确保了跟踪误差保持在原点的小邻域内,保证了状态约束条件不被违反。最后,利用数值仿真验证了所提神经网络控制方法的有效性和可行性。

基金项目

辽宁省高校基本科研业务费重点项目(JZL201715402),辽宁省高等学校创新团队(LT2016006)。

参考文献

[1] 武晓晶. 具有输入输出约束特性的非线性系统自适应控制研究[D]: [博士学位论文]. 秦皇岛: 燕山大学, 2012.
[2] 王敏. 具有时变输出约束的非线性系统鲁棒自适应控制研究[D]: [硕士学位论文]. 扬州: 扬州大学, 2018.
[3] 唐忠樑. 具有输出约束和状态约束的不确定非线性系统的自适应神经网络控制及其应用[D]: [博士学位论文]. 成都: 电子科技大学, 2016.
[4] Wang, C. and Wu, Y. (2019) Finite-Time Tracking Control for Strict-Feedback Nonlinear Systems With Full State Constraints. International Journal of Control, 92, 1426-1433.
https://doi.org/10.1080/00207179.2017.1397290
[5] Tee, K.P., Ge, S.S. and Tay, E.H. (2009) Barrier Lyapunov Functions for the Control of Output-Constrained Nonlinear Systems. Automatica, 45, 918-927.
https://doi.org/10.1016/j.automatica.2008.11.017
[6] Jin, X. (2016) Adaptive Fault Tolerant Control for a Class of Input and State Constrained MIMO Nonlinear Systems. International Journal of Robust & Nonlinear Control, 26, 286-302.
https://doi.org/10.1002/rnc.3312