1. 引言
自然生活中,许多现象和工程应用都可以用微分方程来建模,自上世纪七十年代Lions的奠基性工作以来,偏微分方程及最优控制理论已经得到了广泛的研究和分析 [1] [2] [3]。实际上,在自然界中存在着大量的不确定性,比如结构力学、地震学、金融数学等领域,都存在随机的因素,因此需要用随机模型来描述这些问题。如同确定型微分方程一样,这些随机问题的准确解很难求解,用数值方法来逼近这些问题的准确解是一种必然的选择。因此,随机问题的理论分析以及数值近似成为了当前研究的热点问题。
随机最优控制问题无论在数学、金融、物理还是工程上都有广泛的应用。目前,求解随机偏微分方程最优控制问题的常用方法有蒙特卡洛(MC)方法、随机有限元方法、随机配置法等。MC方法是进行数值仿真中处理随机数据时的首选方法,此方法在求解随机偏微分方程数值解时是最简单易行的方法,它在执行过程中只需不断重复求解给定样本下的一个确定的偏微分方程。众所周知,MC方法其收敛速度为
(N是样本点数),为了达到某个误差精度,该方法在求解时需要大量的抽样。尽管如此,但由于方法简单,因此该方法及其改进受到了很多学者的青睐。确定型最优控制问题的数值解,需要通过多次迭代来求解状态方程和对偶状态方程。而对于随机偏微分方程最优控制问题的数值求解,MC方法对模型中的随机量进行抽样离散时,求解每个抽样点对应的确定性偏微分方程花费的计算量比直接求解确定型最优控制问题的计算量多得多。因此,随机最优控制问题的数值求解计算量是相当惊人的。
对于椭圆随机最优控制问题已有一些研究成果 [4] [5] [6]。对于抛物随机最优控制问题,巩本学等人 [7] 采用随机Galerkin方法对控制受限的随机抛物方程最优控制问题进行了研究,得到了控制、状态、伴随变量的先验误差估计,其中随机系数的处理是通过K-L展开,该方法是将随机量展开成一个有限维数的空间,维数越高,误差越小,但是计算量随着维数的增加而呈指数增加,“维数烦恼”在此得到体现。蒙特卡洛方法是一种简单的方法,每次抽样后,只需要按照原来确定问题的方法来求解即可,只是需要求解这样的问题很多(大量)次,计算量非常大。骆艳等人在求解随机抛物偏微分方程初边值问题时采用了一种基于时间的集成算法 [8],每个时间步迭代的矩阵是相同的,大大地提高了这种具有时间迭代的计算效率。
本文针对一类抛物随机最优控制问题,在文献 [8] 的基础上利用集成MC隐式Euler法来研究其数值近似,随机系数的处理通过定义集成平均的方式使得计算量大大减少。
2. 模型描述
设
是完备的概率空间,
是所有可能结果的集合,
是事件的
-代数,
是一个概率测度。记
空间上的内积和范数分别为
,
。记
为
空间上具有s阶导数的Sobolev空间,其中s是一个非负整数,
。当
时,常用
来代替
,特别地,
是
的子空间。
是
的对偶空间,其上的范数定义为
。对于
,空间
包含了所有随机函数
,它们相对于
-代数是可测的,其中
是D的
-代数,
空间上的范数定义为
和
.
空间
包含了所有随机函数
,该空间上的范数同上面定义方式一致 [7]。
考虑如下一维随机抛物方程最优控制问题:
, (1)
其中
满足如下的抛物方程初边值条件:
(2)
其中
表示空间区域,
为随机变量,E表示对随机变量取期望,
和
分别表示关于时间和空间的偏导数,
给定,
和
分别是一个给定的常数,
为凸集。
对任意
,为了保证问题(1)~(2)解的存在唯一性,假设系数
是有界且一致强制的,即存在
使得在
上几乎处处成立
。
引入下列记号:
,
,
.
其中双线性形式
,则状态方程(2)的弱形式可以表述为:对于给定的
,求
,使得
.
利用Lagrange乘数法可得求解原问题(1)~(2)等价于求
,
,
满足如下最优性系统:
(3)
由于F为凸集,因此数值求解具有随机系数的抛物型最优控制问题(1)~(2),就等价于求解最优性系统(3)。问题(3)的求解需要涉及到随机抛物方程的数值模拟,以下首先介绍数值模拟抛物方程定解问题的方法,然后再介绍(3)的计算方法。
3. 集成MC隐式Euler法
3.1. 随机抛物方程初边值问题的集成MC隐式Euler法
此处仅考虑随机抛物方程初边值问题的数值方法,因此此处将式(2)中的
替换成
并假设已知。在抛物方程初边值问题(2)的数值求解方法中,MC方法是一种非常重要的方法,在给定每个抽样(给定
)后,利用原来确定问题的数值方法及程序便可求解。这样为了得到式(2)的统计解,就需要将其数值求解K次,然后平均,其中第k次就相当于求解下述问题
(4)
在对问题(4)进行离散时,考虑到离散格式的稳定性,常用隐式Euler法。因此对不同的k,对应不同的系数矩阵,就要算一次矩阵的逆。集成方法得到的离散格式对所有抽样只需要算一次逆矩阵,这就大大减少了计算量。下面介绍处理问题(4)的集成MC隐式Euler法。
选取一组独立同分布的随机样本
,对应于不同的k,有不同的 解
,其中
。对时间区域
进行均匀划分,
,时间节点
,其中步长为
。定义随机系数的集成均值如下:
. (5)
则基于时间的状态方程可用如下的离散格式来近似,即
, (6)
其中
,
,
。将式(6)变形得
.
对空间
采用等距剖分
,设步长为
,节点坐标为
,
。取有限元空间
,此处的K表示剖分
的某个区间
,
表示一次多项式。用
表示
时式(6)的近似解在
时刻的值,即
。则式(6)的集成MC隐式Euler格式为:求
,使得对任意
有
(7)
其中,初始条件
。
接下来考虑其矩阵形式,在
上,设
为节点基函数,则
可表示为
,在式(7)中取
便可得:
即
记
,
,
,
.
则式(7)的矩阵格式为
. (8)
为了便于比较和分析计算效果,我们同时给出一般的,没有采用集成方法MC隐式Euler格式:求
,使得对任意
有
.
其中,初始条件
。类似的方法可得其矩阵形式为:
. (9)
将式(8)和式(9)相比较,为了得到
,集成方法针对不同的抽样
只需要求一次矩阵的逆
,而非集成方法,针对不同的抽样
,每迭代一次都要算一次矩阵的逆
,这样,抽样次数K越大,计算逆矩阵的次数就越多,造成计算量也越大。
3.2. 随机抛物方程初边值问题的集成MC隐式Euler格式的稳定性及误差分析
接下来先讨论集成格式(7)的稳定性,假设下述两个条件是成立的:
i) 存在一个正常数
,使得对于任意的
,有
.
ii) 存在正常数
和
,使得对于任意的
,有
.
其中,条件(i)保证了问题的一致强制性,条件(ii)表示系数
到式(5)定义的集成均值
的距离是一致有界的。
引理 [8] 3.1. 设
并且成立假设条件(i) (ii)及
,则集成格式(7)是稳定的,并且式(7)的数值解满足
其中,C是与
无关的常数。
下面对式(4)进行误差估计,设
是在
和
时式(2)的解,
是式(7)的解,记
,定义全离散集成MC隐式Euler格式(7)的近似为:
.
接下来,将对
进行估计,考虑到数值求解时我们采用的是MC方法进行随机抽样,因此,该式误差来源由有限元离散误差和抽样误差两部分构成,即可以写成如下
.
注意到,右边第一部分为有限元离散产生的误差,第二部分是MC抽样产生的误差。
引理 [8] 3.2 对于给定的
和
,在假设(i) (ii)及
成立的条件下,有下面式子成立
其中,C是与
无关的正常数。
4. 随机抛物最优控制问题的集成MC隐式Euler法
现在我们来考虑随机抛物最优控制问题,对问题(2)中随机系数
的随机量进行随机抽样
,便得
,如同前面取
,在随机抛物方程初边值问题集成MC隐式Euler法的基础上,根据最优性条件(3),采用变分离散的技巧 [9],我们可以得到问题(2)的第k次集成MC隐式Euler格式为:求
,使得对任意
有下式成立:
(10)
(11)
(12)
若
,则式(12)等价于
.
若
,则式(12)等价于
.
其中
。
以下考虑(10)~(12)的迭代算法,为此对任意
,定义
.
根据求解最优控制问题的思路,给出如下迭代算法
算法I (Algorithm I)
为了计算出目标函数的近似值,将式(1)进行离散得到:
,
其中
的表达式为:
.
这里我们采用的是复化右矩形公式离散第k次抽样计算得到的目标函数值的近似。
5. 误差估计
考虑到数值求解(10)-(12)时我们采用的是MC方法进行随机抽样,因此,误差来源由离散误差和抽样误差两部分构成。
和
分别是问题(3)和(10)-(12)的解,
,用样本均值
来近似
,在
时,
定义为
,
我们使用符号
,则有如下误差
对上述式子两边开平方根,即
.
接下来考虑
的有限元近似
,用同样方式有如下定义
.
对于任意的
,由三角不等式可得
. (13)
可以看到,式(13)右边有两部分,第一部分是有限元离散产生的估计,第二部分是MC抽样产生的估计。
首先分析第一项,根据Cauchy-Schwarz不等式可以得到
.
根据文献 [5] 有下式成立
.
即
.
再根据
,
得
.
其中,C是一个与h无关的正常数,仅取决于
。综上所述,根据引理3.2整理可得
。该结论可归结为如下定理:
定理4.1
,对
,有
成立,其中
是一个与h无关的正常数,仅取决于
。
6. 数值算例
我们给出一个数值算例,通过数值模拟来验证所提方法的有效性。该算例无精确解,取空间区间为
,时间区间为
,目标泛函中的
,
,随机系数a表示为如下形式:
.
用Matlab软件进行数值模拟,以下只列出
时的模拟情况。计算时间情况如下表1,目标泛函
的近似计算值见表2。

Table 1. When h = τ = 1 / 32 , the number of samples and the time of numerical simulation (s: seconds)
表1.
,抽样数与模拟时间情况(s:秒)

Table 2. When h = τ = 1 / 32 , the calculation results of the objective function value under different sampling
表2.
,不同抽样下目标函数计算结果
7. 结论
本文针对一类随机抛物最优控制问题提出的集成蒙特卡洛隐式Euler法,大大减少了计算量,抽样数越大,误差越小,越节省计算量。该方法是针对处理随机系数而提出的一种减少计算量的方法,它不影响空间方向、时间方向的误差精度。该集成格式可用于其它带随机扩散系数的演化方程随机最优控制问题的数值求解。
基金项目
项目名称:随机最优控制问题的高效Monte Carlo有限元法;合同编号:国家自然科学基金项目(11961008)。