1. 引言
变分不等式问题自从20世纪60年代由Stampacchia首次提出以来,已经发展成为了数学规划和非线性分析领域的重要理论基础。变分不等式问题是[1]:设
是实Hilbert空间,
和
分别表示内积和范数。
是
的闭凸子集,
是非线性映射。经典的变分不等式是指:寻找
满足
(1-1)
该问题的解集记为
。
国内外学者对变分不等式问题的研究集中在许多个方面,首先是解的存在性与唯一性,其次是求解算法的探索。在解决变分不等式问题的算法中,其最经典的算法是投影梯度法[2]。此方法的局限性在于要求算子具有强单调性且Lipschitz连续,否则不能保证其收敛性,并且该算法在单调情形下可能振荡,因而Korpel-Evich (1976)提出外推投影梯度算法[3],该算法仅要求算子单调且Lipschitz连续。传统外推投影梯度算法虽然解决了单调变分不等式的收敛问题,但存在两个关键缺陷,其一是计算成本高,每次迭代需计算两次投影及函数值,其二是固定步长限制。
投影梯度类算法的收敛速度是受限于问题条件数,尤其是在非强单调或者高维问题中表现尤为不佳。黄金比例算法通过引入历史信息加权和最优步长设计,突破经典方法的收敛速率瓶颈。Malitsky [4]提出了具有完全自适应步长的黄金比例算法,该算法在每次迭代仅需要计算一次函数值以及一次投影。此外,
步长是自适应确定的。完全自适应步长的黄金比例算法有遍历性的
收敛速率和
线性收敛速率。
之后Yang和Liu [5]提出了对黄金比例算法的修改,将算子推广到伪单调情形。但该算法中要求步长是递减的,Chinedu和Yekini [6]在此算法的基础上提出完全自适应算法:一步向后惯性黄金比例算法。算法的优点是加入惯性项,对算法进行加速。
本文在一步惯性黄金比例算法的基础上提出了两步惯性自适应黄金比例算法,使之更充分应用前面的迭代信息,加快了收敛速度。其方法较Nesterov重球法更一般化,数值实验也验证了算法的优异性。
2. 预备知识
文中,我们使用符号
表示序列
弱收敛到
。
定义2.1 [6]:
1)
-Lipschitz连续,存在
,如果对于任意
,使得
2) 序列弱–强连续,如果对于任意的序列
弱收敛于
,我们有
强收敛于
。
3) 序列弱连续,如果对于任意序列
弱收敛于
,我们有
弱收敛于
。
定义2.2 [6]:
1)
-强单调,存在
,如果对于任意
,使得
2) 单调,如果对于任意
3) 拟单调,对于任意
引理2.1 (Minty) [6]:设
为连续单调映射,则
是(1-1)的解当且仅当
是下列问题的解
该问题的解集被指定为
,我们知道
是
的一个闭的凸子集,根据
的凸性和映射
的连续性可得
。
引理2.2 [6]:以下等式成立:
1)
;
2)
。
引理2.3 [6]:若
是一个非空闭凸子集,
是
中的序列,满足:
1)
,
存在;
2)
的所有弱聚点都在
中。
则
弱收敛到集合
中一点。
3. 主要结论
3.1. 算法描述
在一步惯性黄金比例算法的基础上我们提出两步惯性黄金比例算法。
算法3-1:(两步惯性黄金比例算法)
假设参数
和
满足以下条件:
(3-1)
1. 选择
和
。
2. 设
和
,求步长
(3-2)
3. 计算
(3-3)
其中
。
4. 令
,转到2。
注3.1:
(1) 我们所提出的算法是基于Chinedu和Yekini的一步惯性黄金比例算法所提出的两步惯性黄金比例算法,其中
,
。
(2) 我们的算法中的惯性因子是非正的。这是不同于文献[7] [8]中惯性因子通常为非负的特征。这种负值特性可能源于算法的特质,因此我们的算法可以看作是自适应黄金比例具有向后惯性步长
的算法。并且在数值算例4.1中比较了惯性步长
时在迭代步数和收敛速度的优越性。
(3) 在Yang和Liu [5]提出的算法中,作者所定义的步长是非递增的。因此,它们是限制性的。但我们在公式(3-2)中所给出的步长是不需要非递增的;相反,
可以大于
(由于
和
,我们有
)和
是有界的。
(4) 对于算法3-1当
时,其相当于Chinedu和Yekini的一步惯性黄金比例算法;当
时,其相当于Malitsky [4]提出了具有完全自适应步长的黄金比例算法。
我们做出以下假设以确保我们提出的算法的弱收敛。
假设3.1:
(1)
。
(2)
在
中是局部Lipschitz连续的,意味着
在
的任何有界子集中是Lipschitz连续。
(3) 当
和
,我们有
。
(4)
是在
上的拟单调算子。
注3.2:在假设3.1(3)中,我们施加了一个比文献[9]中对序列弱连续性要求更弱的条件。
对于公式(3-2),我们分两种情况讨论:
情况1:当
时,因此我们有
. (3-4)
情况2:当
,我们得到
(3-5)
应用和文献[4]中的引理2相似的思想,我们可以证明当序列
是有界的时,序列
和
都是有界的,并且远离零。在这一论断下面的引理中得到详细阐述。
引理3.1:若假设3.1(2)成立,则
和
是远离零且有界的成立条件是
是有界的。
证明:对于公式(3-2),我们得到
,由于
是有界的,我们看到假设3.1的(2)存在
使得
。取一个足够大的
使得
我们现在假设
,
。则下列两种情况必有其一(
):
(3-6)
或者
(3-7)
由公式(3-6)和公式(3-7)可得:
因此,可以得出结论
是有界远离零的。
3.2. 两步惯性黄金比例算法的弱收敛性
下面证明两步惯性黄金比例算法的弱收敛性。
引理3.2:在满足假设3.1(1)和(2)的情况下,算法产生的序列
和
是有界的。
证明:对于
,有
.(3-8)
同理我们有
则有
.(3-9)
在公式(3-8)中,令
,公式(3-9)中,令
,则有
.(3-10)
.(3-11)
由
,我们有
.(3-12)
将公式(3-12)代入公式(3-11),我们有
.(3-13)
对于公式(3-10),由于
,则有
.(3-14)
再由公式(3-13),我们有
.(3-15)
将公式(3-14)和公式(3-15)相加,得到
将上式同时乘以
,且由已知条件可知
,得
(3-16)
我们注意到
(3-17)
(3-18)
把公式(3-17)和公式(3-18)代入公式(3-16),得到
(3-19)
而
(3-20)
将公式(3-20)代入公式(3-19),我们有
(3-21)
由
,则有
(3-22)
(3-23)
把公式(3-23)代入公式(3-21)中,我们有
(3-24)
由
(3-25)
(3-26)
代入公式(3-24),整理并移项有
(3-27)
令
则上式变为
(3-28)
下面我们说明
。注意到
则
由算法3-1条件
,可知
,从而有
所以
。
比较公式(3-28)右侧各项系数,并注意到
(公式(3-3) (3-4)所得)
,从而有
。所以
是非增的,且
是有界的。
由
极限存在,我们可以得到
由上述结论,可知
极限存在,因而
是有界的。所以
有界,同时
也是有界的。
引理3.3:如果
是
的弱聚点,则在假设条件下,我们有
或
。
证明:由引理3.2可知
和
都是有界的,如果
是
的弱聚点则它也是
的弱聚点,因为,
,当
时,因此存在
,使得
。
现在检查下面两种情形。
情况1:如果
由假设3.1(3)我们有
因此我们可以得到
。
情况2:如果
不失一般性,我们选择
的子列并仍然定义
使得,
由投影性质对所有
,有
(3-29)
因为
,因而有
(3-30)
基于(3-30)我们继续预测情况2的两种情形。
情形(a)对所有的
,我们假设
,我们选择
,使得
。因此
,使得
,
,因为
是拟单调的。我们有
,当
我们有
,即
。
情形(b)对所有的
。我们假定
,由公式(3-30)我们有
(3-31)
意味着
(3-32)
由于
,则
,使得
。我们令
,因而有
。
由公式(3-31)有
结合上述不等式及
的拟单调性
因此有
(3-33)
这里
,由于
是有界的,由公式(3-30)
由公式(3-33)可知,对所有的
,有
,即
。
定理3.1:在假设3.1成立及
,对于
条件下,序列
弱收敛到变分不等式问题(1-1)的一个解。
证明:令
的弱聚点集为
,下面证明
。
令
,存在一个序列
,使得
,当
时,由
的弱闭性,则
,对所有
。
是非零则
也是非零的,由引理3.3得
,因此
。
其中
因为
,则
。且
有界,则
存在,对所有的
。
由引理2.3得
,此外
,有
,即证明完毕。
4. 数值实验
4.1. 有限维算例
例4.1设
,定义
如下:
(4-1)
在这种情况下
是拟单调且Lipschitz连续的,但既不是伪单调也不是单调的,此外,我们有
和
。
在计算过程中,选取如下参数:
Malitsky的算法:
。
Yang和Liu的算法:
.
Chinedu和Yekini的算法:
。
算法3-1 (我们的算法):
。
我们使用停止准则
对于所有算法,其中
是误差,我们选择
。于是我们选择如下的初值
:
情况1:
;
情况2:
;
情况3:
;
情况4:
(见表1)。
Table 1. Comparative analysis results of various algorithms
表1. 各类算法的比较分析结果
Algorithm |
Case 1 |
Case 2 |
Case 3 |
Case 4 |
CPU |
Iter |
CPU |
Iter |
CPU |
Iter |
CPU |
Iter |
Malitsky算法 |
0.0027 |
63 |
0.0026 |
59 |
0.0027 |
59 |
0.0029 |
60 |
Yang & Liu算法 |
0.0034 |
244 |
0.0031 |
244 |
0.0021 |
6 |
0.0036 |
245 |
Chinedu & Yekini算法 |
0.0018 |
20 |
0.0014 |
24 |
0.0016 |
24 |
0.0016 |
21 |
算法3-1 |
0.0016 |
18 |
0.0013 |
22 |
0.0015 |
22 |
0.0014 |
19 |
注:CPU表示运行时间(s),Iter表示迭代次数。
我们也将使用线性图来呈现上述四种情况的收敛速率以及迭代次数,其中横坐标表示迭代次数,纵坐标表示误差。如图1所示,由于算法3-1相较于其他算法采用了更多以前信息,使得在迭代中较好的修正迭代步长,且减少对初始值选取的依赖性。
Figure 1. Showing case 1 (a),case 2 (b),case 3 (c),and case 4 (d)
图1. 分别表示情况1 (a),情况2 (b),情况3 (c),情况4 (d)
4.2. 无限维算例
对任意
,设
表示平方可积的Hilbert空间,可测向量函数
,定义:
相应的范数
让我们研究一下最优控制问题
(4-2)
假设存在这样的控制。在这种情况下,
表示容许控制的集合:
因此,
取
维盒的形状,并且它构成分段连续函数.特别地,控制可以是以分段常数函数为特征的开关式控制。
最终目标可以表示为:
其中,
是定义在可行集上的可微凸函数.
考虑一种情形,其中轨迹
满足由微分方程组表示的约束:
其中
和
是连续矩阵对于每个
,根据庞特里亚金最大值原理,我们可以找到一个函数
,为此解出
,对于几乎每个
的方程组:
(4-3)
(4-4)
(4-5)
其中
表示从
到
的法向圆锥。
对于
很好地建立了表示目标成本函数的梯度,我们可以将(4-4)转换为下面的VIP:寻找
,使得
(4-6)
让我们通过选择一个自然数
来离散连续函数,其网格大小为
。令
,表示为它的分段常数扩张,用它的分段线性插值来表示任何离散化状态
:
其中
。
使用欧拉方法在每次迭代时求解常微分方程组
(4-7)
(4-8)
例4.2谐振子的控制
我们需要最小化
,并满足动力学方程和约束条件:
动力学方程:
(4-9)
取初始条件
,
。
我们知道这个问题的精确最优控制是:
如图2所示,算法3-1的在谐振子控制案例中的稳定性十分良好,也从侧面反映出了算法3-1在无限维空间中具有良好的稳定性。
Figure 2. Calculated by Algorithm 3-1, on the left: the blue line represents the random initial control, and the red line represents the optimal control. On the right: shows the optimal trajectory
图2. 由算法3-1计算,在左侧:蓝线代表随机初始控制,而红线代表最优控制.在右侧:显示最佳轨迹
5. 结论
本文提出了一个两步惯性黄金比例算法来解决变分不等式问题。该算法充分应用了前面的迭代信息,达到了较快的收敛速率。数值实验结果也表明,所提出的两步惯性黄金比例算法(算法3-1)在测试中均展现出显著的性能优势。但对算法的强收敛性和遍历意义下序列收敛速率没有讨论。今后可以考虑变分包含问题中,两步惯性邻近点算法的应用,同时也可将该思想推广到向前–向后–向前算法,原始对偶算法等。
基金项目
国家自然科学基金:非光滑双稳定非线性能量阱靶向能量转移全局动力学和优化设计。项目编号:12172376。