1. 引言
当模型不确定性满足Lipschitz条件或者存在着较小的上界时,可以设计线性的扰动观测器和线性的控制策略,减少或抵消模型不确定的影响,保证系统有良好的性能。如果模型不确定性不满足Lipschitz条件或者其上界比较大,如何设计一个合乎要求的控制器,使得系统的不确定性对系统性能的影响尽量小,是一个具有挑战的问题。
为了解决此问题,本文提出一种新颖的自适应神经网络控制策略。首先考虑一类控制系数为未知函数的SISO仿射非线性系统,其不确定性分为二部分:不显含控制的项和含控制的仿射项,其中和可能不满足Lipschitz条件或者其上界比较大。对于这类系统,尽管假设了 (即被控系统具有可控性),但在自适应控制对仿射项进行估计时可能出现控制奇异问题[1] ,即在参数自学习过程中,逼近模型在某一点上由于 (其中为的估计)而可能失去其可控性。为了解决控制奇异问题,文[2] 建议离线学习选取与理想值充分靠近的值作为的初始值;文[3] -[5] 提出通过projection算法将约束到一个可行域内部来避免控制奇异问题,但可行域的构造需要一些先验知识;文[4] [6] 提出利用神经网络或者模糊系统来逼近函数的逆,但前提条件是已知的1阶导数的上界。不同于文[2] -[6] ,本文所提出的控制策略是,通过等价变换将仿射项分成二项:一项控制系数为常数,另一项控制系数为未知函数;基于此,构造自适应神经网络控制器对模型不确定性进行补偿,同时使得仿射项中控制系数为未知函数的一项在Lyapunov函数的导数中保持半负定,从而避免了控制奇异问题。
2. 问题描述
考虑如下SISO不确定仿射非线性系统
(1)
其中,,和分别为系统的状态变量,控制输入和系统输出,与均为未知的光滑函数;控制设计目标为:设计直接自适应神经网络控制器使之与系统构成的闭环系统为半全局一致最终有界,同时其输出能够有效地跟踪光滑参考信号。
预备知识
RBF神经网络具有良好的逼近性质[7] 。本文借助RBF神经网络来逼近控制系统中连续的未知非线性函数,其数学模型如下
(2)
式中,为非线性映射,为输入向量,为权值向量,为神经网络节点的个数,,其中采用高斯函数,即
(3)
式中,为第个基函数的中心点,为高斯函数围绕中心点的宽度。
假设1 对于任一给定常数和连续函数,存在理想的权值使得可以表述为
(4)
且,其中为逼近误差。
引理1[8] 对于高斯RBF神经网络逼近器(3)-(4), 存在常数使得
(5)
式中,为无穷数列的极值,其中。应该指出,与神经网络的输入变量、节点数无关。
定义1 (半全局一致最终有界)[9] 考虑系统
(6)
其中是光滑函数,其解是半全局一致最终有界,如果对于任一给定的紧集,存在常数使得。
3. 自适应神经网络控制的设计及其稳定性分析
在给出系统设计之前,引入如下一些常用的假设。
假设2 存在未知常数使得。
假设2中的为系统的可控性条件,其意味着光滑函数为严格正定或者严格负定。不失一般性,假定。
假设3 参考信号已知,并且,其中为的一个紧集。
引入跟踪误差和
(7)
(8)
式中,常数且。由[10] 可知,跟踪误差在上渐近收敛于原点。
由式(1)与式(8)可知,关于时间的导数为
(9)
式中,。
构造候选的Lyapunov函数
(10)
其关于时间的导数为
(11)
式中,,。
控制设计的基本思想为:通过适当地构造式(11)的可设计项来确保,即如果的选取使得(i),其中为待定常数;(ii),则且为系统(9)的平衡点。
3.1. 控制设计方案I
由于与未知且为光滑函数,因而中的为关于与的未知光滑函数。由RBF神经网络的逼近性质可知,可表述成
(12)
式中,为逼近误差,为理想的权值使得,其中常数。
构造控制器
(13)
式中,为的估计值,,参数,常数为待定小量。
由假设2可知
(14)
考虑如下候选的Lyapunov函数
(15)
式中,,且为自适应增益矩阵。
由式(11)-式(15),可得
(16)
考虑到
(17)
(18)
设计自适应律
(19)
式中,为待定常数。
引理2[11] 对于式(19),存在紧集为
(20)
使得如果,则,其中常数为的上界。
由式(18)-式(20),可得
(21)
由Young不等式,可得
(22)
(23)
将式(21)-式(23)代入式(16),可得
(24)
基于以上的设计与分析,如下定理给出系统的闭环稳定性及其动态性能。
定理1 假定存在充分大的紧集使得,则对于所有有界的初始条件,系统在假设1-3下与满足式(13)与式(19)的控制器所构成的闭环系统有如下性质
(i) 闭环系统为半全局一致最终有界,且状态变量收敛于集合
(25)
(ii) 输出跟踪误差满足
(26)
证明 (i)由式(18)可知,当在紧集
(27)
之外时有,式中。这意味着随着时间增长收敛于。
由引理2与有界定理[12] 可知,与为半全局一致最终有界。由注2可知,有界意味着状态随时间收敛于集合,其中定义见于式(25)。又由式(13)可知,亦有界。由此,闭环系统所有信号为半全局一致最终有界。
(ii) 对式(24)在区间上积分,可得
(28)
注意到,因此
(29)
并得证。 ■
注2:为了解决控制奇异问题,不同于文[2] -[6] ,本文所提出的控制策略是,通过构造自适应神经网络控制器对模型不确定性进行补偿,同时使得控制系数为未知函数的项在Lyapunov函数的导数中保持半负定,从而避免了控制奇异问题。
为了满足快速性、可实现性和高可靠性等方面的要求,工程实际总是希望控制结构与算法尽量简单。基于此,控制策略II的提出能进一步减少控制器(13)中神经网络输入的维数。
3.2. 控制设计方案II
式(9)可以重写成
(30)
引理3[10] [13] 假定与已知,且。如果控制器设计为
(31)
式中,,,则系统(30)的状态变量随着时间增长收敛于集合
(32)
式中,常数和为待定参数。
证明 考虑,且已知,可得
(33)
(34)
由式(33)-式(34),可得
(35)
这意味着随时间增长收敛于集合。 ■
由于与未知,且为关于的光滑函数,故中的为关于的未知光滑函数。由RBF神经网络的逼近性质可知,可写成
(36)
设计控制为
(37)
式中,与的定义见于式(13),且的自适应律采用式(19)。
(38)
类似于控制策略I的分析,有如下结论。
定理2 假定存在充分大的紧集使得,则对于所有有界的初始条件,系统在假设1-3下与满足式(37)与式(19)的控制器所构成的闭环系统有如下性质:
(i) 闭环系统所有变量为半全局一致最终有界,且状态变量收敛于集合
(39)
式中,,的定义见于式(25)。
(40)
式中,,的定义见于式(26)。
4. 仿真实例
为了说明所提出的控制策略的有效性,考察如下SISO不确定非线性系统
(41)
式中,与均为未知函数,为外部干扰。
控制设计目标是:设计控制输入使得系统输出能够有效地跟踪参考信号,其中为如下van der Pol振子的输出信号
(42)
式中,当时van der Pol振子的输出轨迹出现极限环。
系统的控制策略I自适应神经网络控制器的设计采用式(13),即
式中,,,,且
控制器参数选取,,,,,初始值的选取为,,,其中神经网络选取27个节点(即),,,中心值在区间上为均匀分布。图1(a)表明了控制系统状态有界;图1(b)表明了系统跟踪性能良好,系统输出经过2秒左右就能够较好地跟踪参考信号;图1(c)表明了系统控制量有界;图1(d)表明了神经网络状态逼近器能够较好地逼近未知函数。
系统的控制策略II自适应神经网络控制器的设计采用式(37),即
式中,,,,,其余参数取值不变。
由于图1(a)和图1(b)可知,尽管神经网络输入维数减少,但被控系统的控制性能保持不变,系统输出保持着经过2秒左右就能够较好地跟踪参考信号;比较于图1(c)与图2(c)可知,神经网络输入维数减
(a) (b)(c) (d)
Figure 1. Simulation results of the control scheme I of SISO nonlinear systems (a) System state x; (b) System output y follows yr; (c) System control u; (d) Approximator and uncertainty
图1. SISO非线性系统控制策略I的仿真结果 (a) 系统状态量x; (b) 系统输出量y 跟;踪yr; (c) 系统控制量u; (d) 估计器与不确定性
Figure 2. Simulation results of the control scheme II of SISO nonlinear systems (a) System state x; (b) System output y follows yr; (c) System control u; (d) Approximator and uncertainty
图2. SISO非线性系统控制策略II的仿真结果 (a) 系统状态量x; (b) 系统输出量y跟踪yr; (c) 系统控制量u; (d)估计器与不确定性
少,控制系统输出量在开始时刻幅度增大,但很快进入有界的周期信号;图1(d)和图2(d)表明了神经网络状态逼近器能够较好地逼近未知函数。
5. 结论
针对一类控制增益为未知非线性函数的不确定非线性系统,本文提出了一种新颖的系统化设计策略。该设计策略不仅能够避免控制奇异问题,还能够简化控制系统设计。此外,该设计策略能够在宽松条件下导出简单的控制结构,便于工程实现并且能够运用到更一般的系统当中。
基金项目
国家自然科学基金(61374003), 2014年广东普通高校青年创新人才项目:“不确定非仿射非线性系统的输出调节及其应用研究”;2013年广东技术师范学院博士科研规划项目;广东技术师范学院校项目(14KJY12)。
参考文献