具有扰动的非线性系统最优控制问题
An Optimal Control Problem for Nonlinear Systems with Perturbations
摘要: 在本文中,我们发展了一类具有扰动的非线性系统最优控制理论。该问题的目标是通过建立一个框架来解决最优控制问题,使得参数化的代价函数是最小的。为了避免求解哈密顿雅可比贝尔曼方程的稳态形式,我们设计了一个代价函数,它依赖于动态系统,Lyapunov函数,通过求解哈密顿雅可比贝尔曼方程获得了一个稳定的反馈控制器的具体表达式,并且该反馈控制器使得系统是渐近稳定的。最后通过一个实例来说明本文所提方法的有效性。
Abstract: In this paper, we develop a class of optimal control theory for nonlinear systems with perturbations. The objective of this problem is to establish a framework to solve the optimal control problem so that the parameterized cost function is minimized. In order to avoid solving the steady- state form of the Hamilton-Jacobi-Bellman equation, we design a cost function, which depends on the dynamic system, Lyapunov function. By solving the Hamilton-Jacobi-Behrman equation, we obtain a concrete expression of a stable feedback controller, and the feedback controller makes the system asymptotically stable. Finally, an example is given to illustrate the effectiveness of the proposed method.
文章引用:周梓昕, 张洋, 吴迪. 具有扰动的非线性系统最优控制问题[J]. 理论数学, 2023, 13(3): 468-475. https://doi.org/10.12677/PM.2023.133051

1. 引言

线性系统稳定性分析是控制领域的一个重要研究方向,而外部扰动作用下系统的稳定性问题是工程领域的研究热点之一。在现实生活中,由于系统自身的原因,或者输电路故障,机器老化,发电机失负荷等都会使得系统失去稳定性,具有这些扰动因素的系统就是扰动系统。近年来,扰动系统的稳定性得到了大量的研究 [1] [2] [3] [4] [5] 。

现代工程一个重要的特点就是对某种可控的物体寻求某种控制过程,从而达到预先的目的,这就是控制。所谓最优控制问题的提出,就是将通常的最优控制问题抽象成一个数学问题,并用数学语言严格的表示出来。近年来,有关线性系统的最优控制问题引起了许多学者的关注。在自然界中,控制系统总是会受到外界扰动的影响,例如海洋系统中海浪力或者风力的扰动,飞行系统中机翼所承受风力的扰动等 [6] ,因此研究系统外部扰动作用下的最优控制问题具有一定的实际意义。近年来,关于系统的最优控制问题得到了大量的研究 [2] [6] [7] [8] 。文献 [9] 将带有逻辑判断的脉冲表达式转换为代数表达式,进而使用Mazur定理证明最优控制的存在性。文献 [10] 根据微分方程最优化问题的结论对模型进行了最优控制。文献 [6] 针对外部扰动的线性系统,提出一种前馈–反馈最优控制的逐次逼近算法。但是文献 [6] [9] [10] 都并没有给出最优控制的具体表达式。文献 [7] 利用Lyapunov稳定性判据和脉冲微分方程等理论,以一类非线性系统作为研究对象,得到了系统稳定的判据,控制对象不用每时每刻都受控制器的影响,从而极大的减少了成本。然而具有扰动的非线性系统的最优控制问题却没有得到很好的发展。

本文的目的是研究在外部扰动作用下的线性系统最优控制问题,找到最优的反馈控制降低运行成本,通过求解哈密顿雅可比贝尔曼方程的稳态形式,构造一种灵活的代价函数使得参数化的代价函数是最小的,并且得到稳定的反馈控制器,最重要的是,本文得到了反馈控制器的具体表达式,该反馈控制器使得系统是渐近稳定的,最后通过一个实例验证本文中所提方法的有效性。本文的其余部分组织如下:在第二节中介绍一些预备知识,第三节中给出了具有扰动的非线性系统的最优控制的主要结果,第四节中提供了一个实例来证明所提方法的有效性。

2. 预备知识

在本节中,介绍一些基本的符号以及一些稳定性定理。N表示所有正整数集,R表示所有实数, R + 表示非负实数集,用欧几里得范数 · 表示n维实空间 R n R n × m 表示 n × m 实矩阵, P m 表示 m × m 的正定矩阵, B δ ( x ) 表示以 δ 为中心x为半径的开球, A T 表示矩阵A的转置, I n 表示 n × n 单位矩阵。对于 A , B R m × n 或着 A , B R n A B ( A B , A > B , A < B )表示对应元素 A , B 满足相应不等式 ( , > , < )。特别的,如果 A 0 称A为非负矩阵,如果 x > 0 称x为正定向量。

在稳定性的研究中,李亚普诺夫(Lyapunov)明确给出了两套解决稳定性的方法,即Lyapunov第一方法和Lyapunov第二方法。Lyapunov第一方法又称为间接法,是利用齐次状态方程解的特性判断系统的内部稳定性,适用于线性定常、线性时变、线性离散以及可线性化的非线性系统。经典控制理论中关于线性系统稳定性的判别都可以看作是Lyapunov判稳第一法的工程应用。Lyapunov第二方法又称为直接法,它不是求解微分方程组,而是通过构造所谓的Lyapunov函数(标量函数)来直接判断运动的稳定性,因此又称为直接法。在现代控制理论中,Lyapunov第二方法是研究稳定性的主要方法,也是研究非线性时变系统最有效的方法,是许多系统研究稳定性的有效工具。本文中需要用到的方法为Lyapunov第二方法,下面来简单介绍一下Lyapunov意义下的稳定性。

我们首先考虑一般的非线性自治动力系统

x ˙ ( t ) = f ( x ( t ) ) , x ( 0 ) = x 0 , t 0 (1)

其中 x ( t ) D R n x ( t ) 为系统状态, f : D R n ,是连续的函数且 f ( 0 ) = 0 ,D是开集且 0 D ,下

面的定义介绍了当 t 0 时稳定性的几种类型对应系统(1)的零解。

定义2.1 [11] 对于任意的 ε > 0 ,存在 δ = δ ( ε ) > 0 ,使得对任意的 x ( 0 ) < δ

x ( t ) < ε , t 0

则称系统(1)的零解是Lyapunov稳定(见图1)。

定义2.2如果系统(1)的零解是Lyapunov稳定的且存在 δ > 0 ,使得对任意的 x ( 0 ) < δ

lim t x ( t ) = 0

则称系统(1)的零解是(局部)渐近稳定(见图2)。

定义2.3如果系统(2.1)的零解是Lyapunov稳定的且对于任意的 x ( 0 ) R n

lim t x ( t ) = 0

则称系统(1)的零解是全局渐近稳定。

定义2.4如果 α , β , δ > 0 ,使得对于任意的 x ( 0 ) < δ

x ( t ) α x ( 0 ) e β t , t 0

则称系统(1)的零解是(局部)指数稳定。

定义2.5 [12] 如果 α , β > 0 ,使得对于任意的 x ( 0 ) R n

x ( t ) α x ( 0 ) e β t , t 0

则称系统(1)的零解是全局指数稳定。

Figure 1. The equilibrium point is Lyapunov stable [12]

图1. 平衡点的Lyapunov稳定 [12]

Figure 2. Asymptotic stability of the equilibrium point [12]

图2. 平衡点的渐近稳定 [12]

显然,指数稳定意味着渐近稳定,渐近稳定意味着Lyapunov稳定。下面的定理为Lyapunov第二方法,也称为Lyapunov直接法,是本文中判断系统稳定性的有效工具。令 V : D R 是一个连续可微函数,沿系统(1)的轨迹求导,记为 V ˙ ( x ) = V ( x ) f ( x ) ,且 V ( x ) 依赖于系统(2.1)。

定理2.1 [12] 考虑非线性动态系统(1),假设存在一个连续可微的函数 V : D R 使得

V ( 0 ) = 0

V ( x ) > 0 , x D , x 0

V ( x ) f ( x ) 0 , x D

那么系统(1)的零解是Lyapunov稳定,另外,如果

V ( x ) f ( x ) < 0 , x D , x 0

那么系统(1)的零解是渐近稳定。最后,如果存在 α , β , ε > 0 p 1 ,使得对任意的 V : D R

α x p V ( x ) β x p , x D ,

V ( x ) f ( x ) ε V ( x ) , x D ,

那么系统(1)的零解是指数稳定。

3. 扰动系统的最优控制

3.1. 系统描述

为了解决具有扰动系统的最优控制问题,考虑如下非线性系统

x ˙ ( t ) = f ( x ( t ) ) + g ( x ( t ) ) u ( t ) + h ( x ( t ) ) ϖ ( t ) , x ( 0 ) = x 0 , t 0 (2)

x ( t ) , f ( t ) 如(1)式中定义, g : R n R n × m ,(2)中的 u R m 被限制于由可测函数组成的可容许类控制, h : R n R n 为光滑函数, ϖ 为外部扰动。连续函数 ϕ : R n R m 满足 ϕ ( 0 ) = 0 称为一个控制率。如果 u ( t ) = ϕ ( x ( t ) ) , t 0 ,其中 ϕ ( ) 是一个控制率, x ( t ) 满足(2)式,那么我们称 u ( ) 是一个反馈控制率给定一个控制率 ϕ ( ) 和一个反馈控制率 u ( t ) = ϕ ( x ( t ) ) ,那么系统(2)有如下的形式

x ( t ) = f ( x ( t ) ) + g ( x ( t ) ) ϕ ( x ( t ) ) + h ( x ( t ) ) ϖ ( t ) , x ( 0 ) = x 0 , t 0 , (3)

定义一组调节控制器

S ( x 0 ) = { u ( ) : u ( ) 是可容许的, x ( t ) 由系统(2)给出且满足 lim t x ( t ) = 0 }

下面引入性能积分 L ( x , u ) 有如下形式

L ( x , u ) = L 1 ( x ) + L 2 ( x ) + u T R ( x ) u (4)

其中 L 1 : R n R , L 2 : R n R 1 × m , R : R n P m

3.2. 最优控制理论

下面给出本文的主要定理。

定理2.1 考虑非线性动态系统(2)且性能函数为

J ( x 0 , u ( ) ) = 0 [ L 1 ( x ( t ) ) + L ( x ( t ) ) u ( t ) + u T ( t ) R ( x ( t ) ) u ( t ) ] d t (5)

假设存在一个连续可微函数 V : R n R L 2 : R n R 1 × m 使得:

(i) V ( 0 ) = 0

(ii) V ( x ) > 0 , x D , x 0

(iii) L 2 ( 0 ) = 0

(iv) V ( x ) x 时,

(v) V ( x ) [ f ( x ) 1 2 g ( x ) R 1 ( x ) L 2 T ( x ) 1 2 g ( x ) R 1 ( x ) g T ( x ) V T ( x ) + h ( x ) ϖ ] < 0 , x R , x 0

那么闭环系统(3)的零解是全局渐近稳定的,且反馈控制率为

ϕ ( x ) = 1 2 R T ( x ) [ L 2 T ( x ) + g T ( x ) V T ( x ) ] (6)

性能函数(5)与

L 1 ( x ) = ϕ T ( x ) R ( x ) ϕ ( x ) V ( x ) [ f ( x ) + h ( x ) ϖ ] (7)

在某种意义上最小化

J ( x 0 , ϕ ( x ( ) ) ) = min u ( ) S ( x 0 ) J ( x 0 , u ( ) ) , x 0 R (8)

最后,

J ( x 0 , ϕ ( x ( ) ) ) = V ( x 0 ) , x 0 R n (9)

证明:设Hamilton函数有如下形式:

H ( x , u ) = L ( x , u ) + V ( x ) [ f ( x ) + g ( x ) u ( x ) + h ( x ) ϖ ] = L 1 ( x ) + L 2 ( x ) u + u T R ( x ) u + V ( x ) [ f ( x ) + g ( x ) u ( x ) + h ( x ) ϖ ] (10)

H / x = 0 可以得到反馈控制率(6),即

L 2 T ( x ) + 2 R ( x ) u + g T ( x ) V T ( x ) = 0

由条件(iv),(v)和定理2.1可以得到闭环系统(3)的零解是全局渐近稳定的。由(6)、(7)和(10)可以得到

H ( x , ϕ ( x ( t ) ) ) = L 1 ( x ( t ) ) + L 2 ( x ( t ) ) ϕ ( x ( t ) ) + ϕ T ( x ( t ) ) R ( x ( t ) ) ϕ ( x ( t ) ) + V ( x ( t ) ) [ f ( x ( t ) ) + g ( x ( t ) ) ϕ ( x ( t ) ) + h ( x ( t ) ) ϖ ] = L 1 ( x ( t ) ) ϕ T ( x ( t ) ) R ( x ( t ) ) ϕ ( x ( t ) ) + V ( x ( t ) ) [ f ( x ( t ) ) + h ( x ( t ) ) ϖ ] = 0 , (11)

由条件(6)、(10)和(11)可以得到

H ( x , u ) = H ( x , u ) H ( x , ϕ ) = L 2 ( x ( t ) ) [ u ϕ ( x ( t ) ) ] + u T R ( x ( t ) ) u ϕ T ( x ( t ) ) R ( x ( t ) ) ϕ ( x ( t ) ) + V ( x ( t ) ) g ( x ( t ) ) [ u ϕ ( x ( t ) ) ] = 2 ϕ ( x ( t ) ) R ( x ( t ) ) [ u ϕ ( x ( t ) ) ] + u T R ( x ( t ) ) u ϕ T ( x ( t ) ) R ( x ( t ) ) ϕ ( x ( t ) ) = [ u ϕ ( x ( t ) ) ] T R ( x ( t ) ) [ u ϕ ( x ( t ) ) ] 0 , t 0 , u R m (12)

令为(3)的解,那么我们有

V ˙ ( x ( t ) ) | ( 3 ) = V ( x ( t ) ) [ f ( x ( t ) ) + g ( x ( t ) ) ϕ ( x ( t ) ) + h ( x ( t ) ) ϖ ] (13)

由(10)、(11)和(13)有

L ( x , ϕ ( x ( t ) ) ) = V ˙ ( x ( t ) ) | ( 3 ) + L ( x , ϕ ( x ( t ) ) ) + V ( x ( t ) ) [ f ( x ( t ) ) + g ( x ( t ) ) ϕ ( x ( t ) ) + h ( x ( t ) ) ϖ ] = V ˙ ( x ( t ) ) | ( 3 ) (14)

把(14)式两边同时从0到t积分,可以得到

0 t L ( s , ϕ ( x ( s ) ) ) d s = V ( t 0 ) V ( t ) , t 0 (15)

t 可以得到

J ( x 0 , ϕ ( x ( ) ) ) = V ( x 0 ) , x 0 R n (16)

故(9)式得证。下面对于 t 0 , u S ( x 0 ) x ( t ) 表示为(2)式的解,那么我们有

V ˙ ( x ( t ) ) | ( 2 ) = V ( x ( t ) ) [ f ( x ( t ) ) + g ( x ( t ) ) u ( x ( t ) ) + h ( x ( t ) ) ϖ ] (17)

由(10)和(11),我们有

L ( x , u ( x ( t ) ) ) = V ˙ ( x ( t ) ) | ( 2 ) + L ( x , u ( x ( t ) ) ) + V ( x ( t ) ) [ f ( x ( t ) ) + g ( x ( t ) ) u ( x ( t ) ) + h ( x ( t ) ) ϖ ] = V ˙ ( x ( t ) ) | ( 2 ) + H ( x , u ( t ) ) (18)

类似于(15) (16)的讨论,由(12)和(18)以及 u ( ) S ( x 0 ) 得到

J ( x 0 , ϕ ( x ( ) ) ) = 0 [ V ˙ ( x ( t ) ) | ( 2 ) + H ( x , u ( t ) ) ] d t = V ( t 0 ) V ( t ) + 0 H ( x , u ( t ) ) d t V ( t 0 ) = J ( t 0 , u ( ⋅ ) )

这就证明了(8)式,证明完成。

4. 实例分析

例1考虑下面非线性方程

x ˙ 1 ( t ) = x 2 4 ( t ) x 1 3 ( t ) x ˙ 2 ( t ) = x 1 2 ( t ) + u ( t ) (19)

选择一个Lyapunov函数为 V ( x ) = p 1 x 1 2 + p 2 x 2 2 其中 x [ x 1 x 2 ] T , p 1 > 0 , p 2 > 0 性能积分为 L ( x , u ) = L 1 ( x ) + L 2 ( x ) u + u T R ( x ) u 其中 R ( x ) > 0 和性能函数(5),设 L 2 ( x ) = 2 R ( p 1 p 2 x 1 x 2 3 + x 1 2 ) 满足条件(v),由(6)可得反馈控制率为

u = ϕ ( x ) = 1 2 R 1 ( x ) { [ 0 1 ] [ 2 p 1 x 1 2 p 2 x 2 ] + 2 R ( p 1 p 2 x 1 x 2 3 + x 1 2 ) } = R 1 p 2 x 2 p 1 p 2 x 1 x 2 3 x 1 2 (20)

且性能函数(5)有

L 1 ( x ) = R ( x ) [ R 1 p 2 x 2 + p 1 p 2 x 1 x 2 3 + x 1 2 ] 2 [ 2 p 1 x 1 ( x 2 4 x 1 3 ) + 2 p 2 x 2 x 1 2 ] (21)

而且 V ( x ) 满足条件(iv)

V ˙ ( x ) = 2 p 1 x 1 x 2 4 2 p 1 x 1 4 + 2 p 2 x 1 2 x 2 2 p 2 x 2 ( p 1 p 1 x 1 x 2 3 + x 1 2 ) p 2 x 2 R 1 2 p 2 x 2 = 2 p 1 x 1 x 2 4 2 p 1 x 1 4 + 2 p 2 x 1 2 x 2 2 p 1 x 1 x 2 4 2 p 2 x 1 2 x 2 2 p 2 2 R x 2 2 = 2 p 1 x 1 4 2 p 2 2 R x 2 2 < 0

故定理1条件满足。该系统在控制率(20)作用下的运动轨迹如图3所示。

Figure 3. Motion trajectory of system (19) under feedback control rate (20)

图3. 在反馈控制率(20)下系统(19)的运动轨迹

5. 结论

本文研究了一类具有扰动的非线性系统的最优控制问题。 [12] 中只考虑了非线性系统的最优控制问题,由于现实生活中扰动的存在,本文考虑了一类具有扰动系统的最优控制,是对 [12] 中结果的进一步改进。通过构造灵活的代价函数,避免哈密顿雅可比贝尔曼方程求解的复杂性,并且得到了反馈控制器的具体表达式,该反馈控制器使得系统是渐近稳定的且在某种意义上代价函数最小,因此具有一定的应用价值。一个最后通过一个实例和仿真验证了本文中所提方法的有效性。目前还没有关于具有扰动的非线性系统的最优控制问题,因此本文提出的最优控制理论进一步地完善了具有扰动的非线性系统的最优控制问题。然而本文的研究结果只是初步的,对于具有扰动的时滞非线性系统,如何找到最优控制器,使得非线性–非二次代价函数最小是个有趣的问题,还有待进一步研究。

参考文献

[1] 倪郁东, 韩姣杰. 具有扰动的脉冲系统的渐近稳定性[J]. 合肥工业大学学报, 2022, 45(10): 1428-1434.
[2] Liu, L. and Sun, J. (2008) Finite-Time Stabilization of Linear Systems via Impulsive Control. International Journal of Control, 81, 905-909.
https://doi.org/10.1080/00207170701519060
[3] 赵海清, 张玉乐, 王光雪. 脉冲扰动系统的集合稳定性[J]. 大连交通大学学报, 2012, 33(3): 94-96.
[4] 宋阳琴. 脉冲系统的渐近稳定性[D]: [硕士学位论文]. 合肥: 合肥工业大学, 2019.
[5] 廖晓昕. 稳定性的理论、方法和应用[M]. 武汉: 华中科技大学出版社, 2010.
[6] 唐功友, 刘鹏, 谢楠. 具有持续扰动的时滞系统前馈-反馈最优控制[J]. 控制与决策, 2005, 20(5): 505-510, 515.
[7] 赵飞亚. 一类非线性系统的脉冲控制与同步研究[D]: [硕士学位论文]. 重庆: 重庆大学, 2016.
[8] 周旺旺. 线性脉冲切换系统的稳定性分析与控制研究[D]: [硕士学位论文]. 上海: 东华大学, 2020.
[9] 钟荣花, 韦维. 一类带逻辑脉冲线性系统的最优控制问题[J]. 应用数学, 2022, 35(3): 722-730.
[10] 李双增. 一类脉冲微分系统的最优控制[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2010.
[11] Bernstein, D.S. (1993) Nonquadratic Cost and Nonlinear Feedback Control. International Journal of Robust and Nonlinear Control, 3, 211-229.
https://doi.org/10.1002/rnc.4590030303
[12] Haddad, W.M. and Chellaboina, V. (2008) Nonlinear Dynamical Systems and Control: A Lyapunov-Based Approach. Princeton University Press, Princeton, NJ.
https://doi.org/10.1515/9781400841042