1. 引言
令
是
维欧式空间,本文考虑经典的变分不等式问题(Variational Inequality Problem,简称VIP):找
使得
(1.1)
其中
是
中的非空闭凸子集,
是从
到
的一个连续映射,
表示
中的内积。我们用
来表示VIP的解集。
来表示VIP的对偶变分不等式的解集,即
VIP最早由Hartman和Stampacchia [1]在1966年提出,用于研究偏微分方程的解的存在性和唯一性。随后,变分不等式逐渐发展成为解决均衡问题,优化问题和不动点问题的有力工具[2]-[4]。
Goldstein-Levitin-polyak [5] [6]在1964年提出了投影算法,其算法具体结构如下:
其中
为投影算子,该算法的收敛性需要
在
上强单调且Lipschitz连续。为了削弱
的强单调性,1976年Korpelevich [7]和Khobotov [8]提出了外梯度投影算法(EGA),其算法具体结构如下:
EGA的收敛性只需要
在
上单调且
-Lipschitz连续。但EGA的每次迭代需要计算两次向
的投影,这导致当向
的投影不易实施时,EGA的效率不高。
为了在每次迭代中减少一次向
的投影,Solodov和Tseng [9]介绍了压缩投影算法(简称PCA,该类算法的进展还可参见He [10],Ye [11]);Tseng [12]提出了向前向后分裂算法(简称FBSA),其算法具体结构如下:
并在
伪单调且Lipschitz连续的条件下证明了算法的全局收敛性。
最近,Liu和Yang [13]介绍了一种自适应的FBSA (简称LYA)来求解拟单调变分不等式,其自适应步长为:
其中
是非负实数列,满足
。
Ye和Deng [14]将FBSA与PCA结合,提出了一种新的求解拟单调变分不等式的压缩投影算法,其下一个迭代点的形式为:
在映射
在
上连续、拟单调,
且
是有限集的条件下,证明了算法的全局收敛性。
Polyak [15]提出了惯性方法,利用前一个迭代点来加速凸优化算法。此后,惯性方法也被用来加速非凸优化算法,例如文献[16] [17]。在映射为Lipschitz连续条件下的惯性算法得到了广泛的研究,其中求解伪单调VIP的有[18]-[20];求解拟单调VIP的有惯性次梯度外梯度法[21]、惯性Tseng方法[22]等。但在映射仅连续条件下的求解拟单调变分不等式的惯性算法比较少。
受文献[12]-[15]的启发,本文提出了一种求解拟单调变分不等式的惯性向前向后分裂算法(INPCA)。在与文献[14]相同的假设条件下,证明了新算法的全局收敛性。数值实验结果表明,与NPCA和LYA相比,在低维实例下INPCA具有较少的迭代次数;在高维实例下,INPCA具有较少的迭代次数、投影次数和CPU耗时。
2. 预备知识
本节中,我们回顾一些基本的定义、性质和一些引理。
表示正整数,
表示
中的范数,
表示向量
到集合
的距离,即
表示向量
集合
的正交投影,即
从而向量
到集合
的距离等于
。对
及
,令
为问题(1.1)的自然残差函数,即
定义1 设
是
中的集合,映射
,
(1) 若存在常数
,使得
则称
在
上是
-强单调的。
(2) 若
则称
在
上是单调的。
(3) 若
则称
在
上是伪单调的。
(4) 若
则称
在
上是拟单调的。
根据上述定义,自然的有:(1)
(2)
(3)
(4)。
引理1 [23]设
为非负序列使得
并且存在一个正数
,使得
,则存在
使得
引理2 [2] [24]设
是非空闭凸集,则有以下不等式成立。
(1)
;
(2)
;
(3)
;
(4)
。
引理3 [25]设
是
中任一向量,
是一个半空间,则
特别地,当
时,可得
引理4 [2]若
,则
的充要条件是
。
引理5 [26]对任意的
及任意的
,有
引理6 [18]对任意的
及任意的实数
,有
引理7 [27]设
是非空闭凸集,
是
上的映射。若下列条件之一成立:
在
上是伪单调的,且
;
是
的梯度,其中
是包含
的开集
上的可微拟凸函数,且在
上可取得其全局最小值;
在
上是拟单调的,
且
有界;
在
上是拟单调的,
在
上不为零,且存在正数
,使得对任意
,当
时,存在
满足
且
;
在
上是拟单调的,且
,其中
;
在
上是拟单调的,
非空,且存在
使得
,
则
非空。
3. 主要内容
在本节中,首先介绍求解拟单调变分不等式的惯性投影算法INPCA,再证明算法的合理性和生成序列的收敛性。
首先介绍INPCA,其具体结构如下:
算法3.1
步骤0 选取初始点
,选取参数
,
和
,选取正数列
满足
,设
。
步骤1 计算
其中
(3.1)
步骤2 (线搜索)选取
,寻找最小的非负整数
使得
(3.2)
令
,
并转到下一步。
步骤3 计算
,若
,停止(
解);否则转到下一步。
步骤4 令
,其中
. (3.3)
计算
(3.4)
步骤5 令
,并返回步骤1。
注1. 由引理3可知
具体形式为:
其中
,
。
引理8 设
由INPCA所生成的数列,则对
都有:
(1)
;
(2)
,进而有
。
证明 (1) 由
和
的定义可知结论成立。
(2) 由式(3.1)分类讨论可知:
。这结合
的定义可知
成立。
我们为了说明INPCA的合理性,需要说明INPCA中提到的线搜索可以在有限步内停止,并且对于每个
,都有由(3.3)定义的半空间
是非空闭凸集。下面我们先介绍INPCA中的线搜索可以在有限步内停止。
引理9 若
在
上连续,则对任意的
,
及
,存在有限的非负整数
使得下式成立:
(3.5)
证明:因为线搜索(3.5)与文献[28]中的线搜索一致,故由文献[28]的引理10知结论成立。
接着,我们用下面的引理来说明(3.3)中由
定义的半空间
非空,从而由(3.4)可以生成点
。
引理10 若
在
上连续且
,
,
,
和
是由INPCA所生成的无穷序列,
是由(3.3)所定义的函数,则对任意的
都有
(1)
;
(2)
。
进而对任意的
有
及
。
证明:(1) 设
,由
的定义可得
其中第一个不等式由
且
可得,最后一个不等式由引理2 (1),
的定义以及
可得。这证明了(1)。
(2) 由
的定义可知
其中第一个不等式由Cauchy-Schwartz不等式可得,第二个不等式由(3.2)式可得,最后一个不等式由
和
可得。这完成了(2)的证明。
最后,我们对INPCA的收敛性进行分析。
引理11 若
在
上连续且
,
,
,
和
是由INPCA所生成的无穷序列,则对任意的
,有
(1)
成立;
(2)
存在,且
,进而有
,
,
,
及
均有界。
证明 (1) 由引理10 (2)知:
,任取
,有
(3.6)
其中第一个不等式由引理2(2)可得。
另一方面,我们有
其中不等式由
及
的定义可得。这结合(3.6)可知
其中第二个不等式由(3.2)可得。这就完成了(1)的证明。
(2)由(1),
,
的定义和引理2 (4)可知
其中第二个不等式由
可得。由此,令
,
,
,
则由引理8 (2)及引理1可知
存在,即
收敛。进而知
有界。
结合
的定义及引理8可知
(3.7)
另一方面,由(1)还可得
其中最后一个不等式由Cauchy-Schwartz不等式可得。对上式取极限,结合(3.7),
的有界性,
,
可知:
(3.8)
这结合(3.7)可得
由
的有界性,(3.7)以及(3.8)可知
,
也均有界。这结合
的连续性还可得
,
和
也均有界。这完成了(2)的证明。
引理12 若
在
上连续且
,
,
,
和
是由INPCA所生成的无穷序列,则有
(3.9)
证明:由三角不等式可知
(3.10)
另一方面,由(3.2)和引理11(2)可知
(3.11)
另一方面,对
,由
的定义及引理2(3)可得
(3.12)
最后一个不等式由
可得(参见(3.2))。
此外,还有
将此式代入(3.12)可得
令
,结合引理11(2)以及
可得
这结合(3.10)和(3.11)可知(3.9)成立。
定理1 若
在
上连续,拟单调且
,
,
,
和
是由INPCA所生成的无穷序列,则对
的任意聚点
都有
。并且还满足
或者
。
证明:设
为
的聚点。则存在子列
满足
这结合引理11(2)可得
(3.13)
从而由
及
是闭集可知
。利用(3.13)以及文献[14]中的定理1 (将
替换为
)可知结论成立。
定理2 若
在
上连续,拟单调且
且满足
为有限集。设
是INPCA生成的无穷序列,则
收敛到
中的一点。
证明:设
为
的所有聚点构成的集合,则由定理1可知
。我们按以下情况进行分类讨论。
情况一 若存在
使得
。此时,由引理11(2)可知存在。这结合
为序列
的聚点可知
即
收敛到
中一点。
情况二 若对任意的
都有
,则由定理1可知
且
。因此,我们有
。这结合题设可知
为有限集。因此,文献[13]中的引理3.5成立。进而,结合式(3.9)中
以及文献[13]中的定理3.1可知
收敛到
中一点。
综上,定理2成立。
4. 数值实验
在本节中,我们用数值实验来验证INPCA的有效性。我们将Ye和Deng [14]中的算法1称为NPCA,将Liu和Yang [13]的算法3.1称为LYA。所有实验均在Intel(R) Core(TM) Ultra 5 125H 3.60 GHz和内存为32.00GB的笔记本电脑上使用MATLAB R2023b进行。
INPCA的参数设置为:
,
,
,
,以及对
取
其中
的选择是对Ye [29]中的参数调整所得。NPCA与LYA的参数选取分别与文献[14]和[13]中一致,即NPCA为
,
,
;LYA为
,
,
。
例1 此例被Ye和He [27]及Ye和Deng [14]测试。令
,且
,其中
在
内随机生成,则
。此例的停止准则如下:
其中dist表示当前迭代点到解集的距离。对于例1,我们首先在
时测试此算例,在表1中给出了初始点
,
,迭代次数iter,投影次数np,CPU时间(单位:秒);当
时,初始点
按文献[14]中的方式生成,即
在表2中给出
,iter,np和CPU情形(
),其结果为10次实验的平均值。
Table 1. Numerical experimental results of example 1 when
表1. 例1在
时的数值实验结果
|
a |
iter |
np |
CPU |
INPCA |
NPCA |
LYA |
INPCA |
NPCA |
LYA |
INPCA |
NPCA |
LYA |
(0, 0, 0, 0, 5) |
5 |
18 |
29 |
41 |
56 |
99 |
42 |
0.02328 |
0.04841 |
0.02845 |
(0, 0, 5, 0, 0) |
5 |
18 |
29 |
41 |
56 |
99 |
42 |
0.02356 |
0.03950 |
0.02452 |
(0, 2, 0, 2, 1) |
5 |
15 |
26 |
36 |
43 |
84 |
37 |
0.01897 |
0.03312 |
0.01985 |
(1, 1, 1, 1, 6) |
10 |
23 |
28 |
39 |
68 |
59 |
40 |
0.02824 |
0.02484 |
0.02837 |
(5, 0, 0, 0, 5) |
10 |
21 |
37 |
40 |
63 |
78 |
41 |
0.02356 |
0.02397 |
0.02354 |
Table 2. Numerical experimental results of example 1 when
表2. 例1在
的数值实验结果
n |
iter |
np |
CPU |
INPCA |
NPCA |
LYA |
INPCA |
NPCA |
LYA |
INPCA |
NPCA |
LYA |
100 |
23 |
121 |
42 |
65 |
243 |
43 |
0.05039 |
0.10313 |
0.03740 |
200 |
26 |
254 |
57 |
73 |
510 |
58 |
0.10220 |
0.53385 |
0.13586 |
500 |
28 |
671 |
93 |
79 |
1343 |
94 |
0.76908 |
9.86117 |
1.56018 |
1000 |
29 |
1388 |
147 |
80 |
2778 |
148 |
4.12551 |
103.61323 |
12.92367 |
例2 此例被Sun [30]和Malitsky [31]用于算法测试。令
,
,其中
,
且
;
,
,
的元素
满足
此例的停止准则为:
其中,在NPCA和LYA中,
,在INPCA中,
。我们在表3中给出
,iter,np和CPU,结果为10个随机初始点的平均值。
Table 3. Numerical experimental results of example 2
表3. 例2的数值实验结果
n |
iter |
np |
CPU |
INPCA |
NPCA |
LYA |
INPCA |
NPCA |
LYA |
INPCA |
NPCA |
LYA |
1000 |
22 |
31 |
204 |
66 |
266 |
205 |
0.00954 |
0.02860 |
0.04241 |
3000 |
22 |
33 |
235 |
68 |
288 |
236 |
0.08062 |
0.32705 |
0.54946 |
5000 |
23 |
34 |
259 |
71 |
297 |
260 |
0.33722 |
1.34843 |
2.37148 |
注3 由表1~3可知,在低维算例中,INPCA的迭代次数比NPCA、LYA少,投影次数和CPU耗时与NPCA、LYA基本相当。在高维算例中,INPCA的迭代次数,投影次数和CPU耗时均少于NPCA、LYA。
致 谢
衷心感谢我的导师叶明露教授。从读文献都生涩,到完成论文;从选题迷茫到终稿落定,每一步都离不开他的悉心指引。他治学严谨、眼中有光,这份态度与热忱,深深影响了我,并将成为我前行路上长久的光亮。
基金项目
国家自然科学基金面上项目(No. 11871059),西华师范大学培育项目(No. 20A024)。
NOTES
*通讯作者。