时滞随机控制系统解的估计
Estimation of Solutions for Stochastic Control Systems with Time Delays
DOI: 10.12677/AAM.2019.810187, PDF, HTML, XML, 下载: 839  浏览: 1,053 
作者: 许 洁, 崔晓梅:吉林化工学院理学院,吉林 吉林
关键词: 时滞系统估计Cauchy-Schwarz不等式Gronwall不等式Time Delay System Estimation Cauchy-Schwarz Inequality Gronwall Inequality
摘要: 对于时滞随机系统解的估计问题是研究时滞系统控制问题的重要基础,本文利用Cauchy-Schwarz不等式、Gronwall不等式对一般情况下时滞控制系统状态方程的解进行估计,用两种方法证明了我们的结论,为进一步研究时滞系统控制问题提供理论基础。
Abstract: Estimation of solutions for stochastic time delay systems is an important basis for the problem of optimal control systems with time delay. In this paper, we estimate the solution of the state equation of time delay control systems for the general case by using Cauchy-Schwarz and Gronwall inequalities. We use two methods to prove our conclusions, and lay a theoretical foundation for further study of time-delay control problems. And we hope to lay a theoretical foundation for further research on time-delay control.
文章引用:许洁, 崔晓梅. 时滞随机控制系统解的估计[J]. 应用数学进展, 2019, 8(10): 1597-1601. https://doi.org/10.12677/AAM.2019.810187

1. 引言

最优控制问题是指在给定的约束条件下,寻求一个控制,使给定的系统性能指标达到极大值(或极小值)。然而在很多实际问题中,最优控制不存在或者即使存在却不易求得,于是关于最优控制问题的近似最优解问题得到了人们的广泛关注 [1] [2] [3] [4] [5] 。在近似最优控制问题的研究中,关于时滞控制系统状态方程解的估计在进一步研究最优控制和近似最优控制相应结论中具有非常重要的作用 [6] [7] [8] 。文献 [2] 中讨论了线性时滞随机系统中状态变量和控制变量含有不同时滞变量的状态方程解的估计问题,文献 [3] 中探讨了一般情况的时滞系统近似最优控制问题,但是在文献 [3] 的讨论中,仅讨论了状态变量和控制变量含有相同时滞变量的情况。在此类文章研究的基础上,我们对更一般情况的时滞随机系统,即状态变量和控制变量含有不同时滞变量的一般时滞系统进行研究,利用两种方法给出此类系统状态方程解的估计。从而为进一步研究时滞系统近似最优控制问题的最大值原理奠定理论基础。

2. 符号介绍

( Ω , F , P ) 是完备的概率空间, { F t } t 0 是由标准布朗运动 W ( t ) 生成的域流。 δ 1 δ 2 和T是已知常数。 L F 2 ( 0 , T ; R m ) 表示 R m F t 适应过程 { X ( t ) , 0 t T } 的空间,其中 E [ s r | X ( t ) | 2 d t ] < ζ : [ δ 1 , 0 ] R n 是连续函数。

我们研究一般的时滞随机系统,其状态方程为:

{ d x ( t ) = b ( t , x ( t ) , x ( t δ 1 ) , u ( t ) , u ( t δ 2 ) ) d t + σ ( t , x ( t ) , x ( t δ 1 ) , u ( t ) , u ( t δ 2 ) ) d W ( t ) , x ( t ) = ζ ( t ) , t [ δ 1 , 0 ] (1)

代价泛函(性能指标)

J ( u ( ) ) = E { 0 T { L ( t ) , x ( t ) , u ( t ) } d t + Φ ( x ( T ) ) } (2)

其中 b : [ 0 , T ] × R m × R m × R k × R k R m σ : [ 0 , T ] × R m × R m × R k × R k R m × d 为已知函数,且 b , σ 满足以下假设条件:

(A1) 存在常数 C > 0 使得对任意 x 1 ( t ) , x 2 ( t ) , x 1 ( t δ ) , x 2 ( t δ ) , u 1 ( t ) , u 2 ( t ) , u 1 ( t δ ) , u 2 ( t δ ) 下面不等式成立:

| ρ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 C [ | x 1 ( t ) x 2 ( t ) | 2 + | x 1 ( t δ 2 ) x 2 ( t δ 2 ) | 2 + | u 1 ( t ) u 2 ( t ) | 2 + | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 ]

其中 ρ = b , σ

Γ 是非空的凸控制域, U [ 0 , T ] Γ 表示可容控制集合, u ( t ) 定义为

u ( t ) = { 0 , t [ δ 2 , 0 ] u ( t ) L F 2 ( 0 , T ; R m ) u ( t ) U , t [ 0 , T ]

3. 主要内容

定义1:设 u 1 ( t ) , u 2 ( t ) U [ 0 , T ] ,定义 d ( u 1 ( t ) , u 2 ( t ) ) = [ E 0 T | u 1 ( t ) u 2 ( t ) | 2 ] 1 2

时滞系统状态方程解的估计在最优控制理论中具有重要意义,下面我们用两种方法给出关于时滞系统解的估计的证明。

定理1:在假设条件(A1)下,设 u 1 ( t ) , u 2 ( t ) U [ 0 , T ] ,其对应的状态轨迹分别设为 x 1 ( t ) , x 2 ( t ) ,则存在常数C使得 E [ sup 0 t T | x 1 ( t ) x 2 ( t ) | 2 ] C d ( u 1 ( t ) , u 2 ( t ) ) 2

证明: (方法一) 利用Cauchy-Schwarz不等式及假设条件(A1)可得

E [ sup 0 t T | x 1 ( t ) x 2 ( t ) | 2 ] C { E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) σ ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t } (3)

E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 2 ( t δ 2 ) ) b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) b ( t , x 1 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | b ( t , x 1 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t

E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + E 0 T | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 d t + E 0 T | x 1 ( t ) x 2 ( t ) | 2 d t + E 0 T | x 1 ( t δ 1 ) x 2 ( t δ 1 ) | 2 d t (4)

利用变量代换

E 0 T | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 d t = E δ 2 T δ 2 | u 1 ( t ) u 2 ( t ) | 2 d t = E δ 2 0 | u 1 ( t ) u 2 ( t ) | 2 d t + E 0 T δ 2 | u 1 ( t ) u 2 ( t ) | 2 d t E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t = d ( u 1 ( t ) , u 2 ( t ) ) 2 (5)

同理

E 0 T | x 1 ( t δ 2 ) x 2 ( t δ 2 ) | 2 d t = E δ 2 T δ 2 | x 1 ( t ) x 2 ( t ) | 2 d t = E δ 2 0 | x 1 ( t ) x 2 ( t ) | 2 d t + E 0 T δ 2 | x 1 ( t ) x 2 ( t ) | 2 d t E 0 T | x 1 ( t ) x 2 ( t ) | 2 d t (6)

将(5) (6)代入(4)得

E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + E 0 T | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 d t + E 0 T | x 1 ( t ) x 2 ( t ) | 2 d t + E 0 T | x 1 ( t δ 2 ) x 2 ( t δ 2 ) | 2 d t d ( u 1 ( t ) , u 2 ( t ) ) + E 0 T | x 1 ( t ) x 2 ( t ) | 2 d t (7)

上述结论中当b换成 σ 时结论显然成立,则有

E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) σ ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 2 ( t δ 2 ) ) σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) σ ( t , x 1 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | σ ( t , x 1 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) σ ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t

E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + E 0 T | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 d t + E 0 T | x 1 ( t ) x 2 ( t ) | 2 d t + E 0 T | x 1 ( t δ 2 ) x 2 ( t δ 2 ) | 2 d t d ( u 1 ( t ) , u 2 ( t ) ) + E 0 T | x 1 ( t ) x 2 ( t ) | 2 d t (8)

将(7) (8)代入(3)

E [ sup 0 t T | x 1 ( t ) x 2 ( t ) | 2 ] C { E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t + E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) σ ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t } C { d ( u 1 ( t ) , u 2 ( t ) ) 2 + 0 T E [ sup 0 t θ | x 1 ( t ) x 2 ( t ) | 2 ] d θ }

利用Gronwall不等式,可得 E [ sup 0 t T | x 1 ( t ) x 2 ( t ) | 2 ] C d ( u 1 ( t ) , u 2 ( t ) ) 2 ,证毕。

证明(方法二):利用文献 [1] 的估计3或文献 [2] 中命题2可得

| b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 2 ( t ) , x 2 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 C [ | u 1 ( t ) u 2 ( t ) | 2 + | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 ]

再由假设条件(A1)有

E 0 T | b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) b ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t C E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + C E 0 T | u 1 ( t δ 2 ) u 2 ( t δ 2 ) | 2 d t = C E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + C E δ 2 T δ 2 | u 1 ( t ) u 2 ( t ) | 2 d t = C E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + C E δ 2 0 | u 1 ( t ) u 2 ( t ) | 2 d t + C E 0 T δ 2 | u 1 ( t ) u 2 ( t ) | 2 d t C E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t + C E 0 T | u 1 ( t ) u 2 ( t ) | 2 d t C d ( u 1 ( t ) , u 2 ( t ) ) 2

同理可证

E 0 T | σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 1 ( t ) , u 1 ( t δ 2 ) ) σ ( t , x 1 ( t ) , x 1 ( t δ 1 ) , u 2 ( t ) , u 2 ( t δ 2 ) ) | 2 d t C d ( u 1 ( t ) , u 2 ( t ) ) 2

因此 E [ sup 0 t T | x 1 ( t ) x 2 ( t ) | 2 ] C d ( u 1 ( t ) , u 2 ( t ) ) 2 证毕。

本文对时滞系统一般情况的状态方程的解进行估计,推广了文章 [2] [3] 中的部分结果,为进一步研究时滞系统的最优问题或近似最优问题提供一定理论基础。

参考文献

[1] Zhou, X.Y. (1998) Stochastic Near-Optimal Controls: Necessary and Sufficient Conditions for Near-Optimality. SIAM Journal on Control and Optimization, 36, 929-947.
https://doi.org/10.1137/s0363012996302664
[2] Zhang, F. (2017) Maximum Principle for Near-Optimality of Stochastic Delay Control Problem. Advances in Difference Equations, 98.
https://doi.org/10.1186/s13662-017-1155-9
[3] Wang, Y. and Wu, Z. (2017) Necessary and Sufficient Conditions for Near-Optimality of Stochastic Delay Systems. International Journal of Control, 91, 1730-1744.
https://doi.org/10.1080/00207179.2017.1327725
[4] 潘立平, Koklay. 广义时间最优控制问题的近似最优解[J]. 数学年刊: A辑, 1998(5): 601-612.
[5] 齐斌. 具有时滞的广义时间最优控制问题的近似最优解[J]. 东莞理工学院学报, 2007, 14(1): 22-25.
[6] 杨园华, 韩春艳, 刘晓华, 等. 有界随机测量时滞的网络控制系统的最优估计[J]. 控制理论与应用, 2014, 31(2): 181-187.
[7] 王青丽. 时滞随机系统的估计和控制[D]: [硕士学位论文]. 曲阜: 曲阜师范大学, 2011.
[8] 韩春艳. Markovian随机时滞系统的状态估计[D]: [博士学位论文]. 济南: 山东大学, 2010.