1. 引言
近些年来,优化领域中有一个重要的研究热点就是锥约束优化,该问题在线性代数、统计应用、信息与图像处理、压缩感知、计算机视觉等诸多领域有着重要的应用[1]-[4]。锥约束优化问题引起了国内外科学和工程领域专家学者的关注和广泛研究。其中,二阶锥约束变分不等式是锥约束优化问题的一个重要分支,在统计学、经济学、机器学习、信息处理等科学和工程领域有着重要的应用,受到众多学者的关注[5]-[8]。
本文将研究的二阶锥约束变分不等式问题:求解
满足
(1.1)
其中,约束集合
表示为
(1.2)
表示欧式空间的内积,
都是连续可微的,且二阶锥
如下定义
(1.3)
,
,
,每个
是
维的二阶锥。
2017年以来,Attouch等[9]-[12]构造了阻尼惯性梯度系统来解决Hilbert空间上的无约束优化问题
。Attouch等[9]中的阻尼惯性梯度系统包含时间尺度系数
和阻尼系数
如下
其中,
表示为Hilbert空间上
的梯度,
和
在
上是非负连续函数。Attouch等[9]在仅涉及
和
的条件下,得到了
的值的收敛率。在这一通用框架中,快速收敛性质与
的渐近消失性质以及
的时间尺度特性密切相关。证明了由此得到的收敛率的最优性,并研究了系统受到外部扰动时的稳定性。
本文将运用带扰动项的阻尼惯性梯度系统来求解约束集合为(1.2)的二阶锥约束变分不等式问题(1.1)。为此,需要对二阶锥约束变分不等式问题进行优化问题
的转化,然后建立带扰动项的阻尼惯性梯度系统。受到Attouch等[9]-[12]的研究方法的启示,将运用该系统研究得到转化后的优化问题的
的值的收敛率。从而得到原始的二阶锥约束变分不等式问题(1.1)的解的收敛性。
2. 预备知识
2.1. 投影算子与投影定理
设集合C是一个凸闭集合,对于任意
,都存在唯一的
,使得
,
则称
为点
在集合C上的投影点,记作
,
是定义好的映射,称之为投影算子。对任意
,有
成立。
引理2.1 [13]:设
为Hilbert空间,集合
为一闭凸集,对任意的
,则存在
满足
当且仅当
。
2.2. 二阶锥的定义及相关性质
定义2.1 [14]:若
满足
,
则称
为
维的二阶锥,又称冰激凌锥。
表示为
范数。当
时,
退化为非负实数集
。
定义2.2 [14]:对任意
,定义Jordan积运算为
表示为
,
。且对任意
,
是
中唯一满足
的向量。
定义2.3 [14]:相似于矩阵的谱分解,对任意向量
,其谱分解为
(2.1)
其中
,
表示为向量
的特征值,且
,
表示为向量
的特征向量,表示为
其中
是
上的单位向量。显然,若
时,向量
的谱分解是唯一的。
引理2.2 [14]:对于任意向量
,
表示为
到二阶锥
上的投影
,其中
2.3. 光滑化二阶锥互补函数
定义2.4 [14]:假设映射
满足
(2.2)
则称映射
为二阶锥上的互补函数。
定义2.5 [14]:二阶锥互补函数中的自然残差函数(NR函数)如下
,
(2.3)
其中
是
在
上的投影算子。由定义2.4,对任意
,有
当且仅当
。由定义2.3和引理2.2,对式(2.5)中的
可表示为
函数
同样为半光滑函数。
对此,通过光滑化投影算子
,引入光滑化映射
,对NR函数进行光滑化,
即对任意
,定义光滑化映射
为
(2.4)
则由投影算子
的定义可见,
。此外,当满足
时,
在
上是连续可微的。则光滑化后的NR函数表示为
(2.5)
具体表示为
其中
。
2.4. 二阶锥约束变分不等式的无约束优化问题的转化
二阶锥约束变分不等式问题(1.1)的KKT条件如下
(2.6)
其中
为变分不等式的拉格朗日函数。对于
,其等价于
对此,运用光滑化的
函数(2.5),将
表示为
对于
,定义如下的光滑化函数
(2.7)
其中
(2.8)
则求解变分不等式问题(1.1)的KKT条件的解转化为求解光滑化方程组
(2.9)
接下来,引入效益函数
,则解决光滑化方程组(2.9)等价于求解下面的无约束优化问题
(2.10)
而且容易知道,若效益函数
是(2.10)的解,则
就是具有不等式约束条件的变分不等式问题(1.1)的KKT点。
3. 带扰动项的阻尼惯性梯度系统的稳定性分析
本章将建立带扰动项的阻尼惯性梯度系统来求解无约束优化问题(2.10),从而实现对二阶锥约束变分不等式问题(1.1)的KKT点的求解。
3.1. 带扰动项的阻尼惯性梯度系统的建立
问题(2.10)的带扰动项的阻尼惯性梯度系统如下
(3.1)
其中,
表示为阻尼惯性参数,
为时间尺度参数,且
在
上是非负连续函数。
可
以是对系统的外部作用、扰动或控制项,统称为系统的扰动项。
是无约束优化问题(2.10)
中
有关
计算所得到的梯度
。假设该系统的解是一定存在的,显然系统对应的平衡点
是无约束优化问题(2.10)的解。
当扰动项
时,带扰动项的阻尼惯性梯度系统(3.1)变化如下
(3.2)
称之为阻尼惯性梯度系统。
3.2. 带扰动项的阻尼惯性梯度系统的稳定性分析
在初始情形
的情况下,对阻尼惯性梯度系统(3.2)直接积分,可以得到
假设其满足
条件
在
条件下,定义函数
如下
(3.3)
通过对式(3.3)进行求导,可以得到
(3.4)
定义全局能量函数
(3.5)
以及锚函数
(3.6)
其中,
,解集
非空。
定义能量函数
(3.7)
结合(3.5)和(3.6),可以得到
(3.8)
定理3.1:时间尺度参数
是一个连续非负函数,阻尼惯性参数
是一个满足假设条件
的连续函数且二者满足
增长条件如下
此外,扰动项
是局部可积的并满足
条件
则当
时,带扰动项的阻尼惯性梯度系统(3.1)的解的轨迹
在
上对应的函数值的收敛速度满足
而且解的轨迹
在
上是有界的。
证明:为方便计算,本定理证明过程中仍记
。首先,根据公式(3.7),对能量函数
进行求导,由带扰动项的阻尼惯性梯度系统(3.1)及(3.4)式可以得到
由Cauchy-Schwarz不等式以及函数
的凸性,上式可得
(3.9)
根据
增长条件、(3.4)式和能量函数
的定义(3.7)式对(3.8)继续计算得
通过对上述不等式进行积分,并应用条件
,可以得到下述不等式关系
(3.10)
显然,从上述不等式(3.10)可以得到能量函数
是有界的,即设
。根据
的定义(3.8),对于任意的
,都有
即
。
由
的定义(3.8),又因为
是有界的,可以得到
表达式中的
也是有界的,设
。对其展开计算有
则显然下式必成立
(3.11)
同时,结合锚函数
的定义(3.6)及其一阶导数结果
不等式(3.11)可表示为
由于锚函数
的定义(3.6)、函数
的定义(3.3)式及
条件,对上述不等式进行积分可以得到带
扰动项的阻尼惯性梯度系统(3.1)的解轨迹是有界的。结合
的有界性,则可以推断出
在
也是有界的,从而定理4.1得证。
4. 数值实验
Sun等[4]中建立了如下的一阶微分方程系统求解一类互补问题
(4.1)
其中,
是该模型中的缩放因子。现将该一阶微分方程系统与本文的带有扰动项的阻尼惯性梯度系统进行理论条件的对比。具体如表1。
下面将用带扰动项的阻尼惯性梯度系统(3.1)来求解二阶锥约束变分不等式。通过数值算例,对比带扰动项的二阶微分方程系统(3.1)和一阶微分方程系统(4.1)的数值计算结果。
例 4.1:考虑下面的二阶锥约束变分不等式问题
其中
Table 1. Comparison of theoretical conditions
表1. 理论条件对比
理论条件 |
一阶微分方程系统(4.1) |
带扰动项的阻尼惯性梯度系统(3.1) |
解集
非空 |
√ |
√ |
,
满足假设条件
|
|
√ |
的非奇异性 |
√ |
|
为半正定的 |
√ |
|
是紧集 |
√ |
|
满足假设条件
|
|
√ |
,
且
该问题的最优解为
。
表2给出了解决例4.1的一阶微分方程系统(4.1)和带扰动项的阻尼惯性梯度系统(3.1)的到达平衡点所需的CPU时间(s)和数值计算对比结果。
Table 2. Comparison of numerical results for example 4.1
表2. 例4.1的数值结果比较
|
一阶微分方程系统(4.1) |
带扰动项的阻尼惯性梯度系统(3.1) |
CPU时间(s) |
0.0546689 |
3.1426901 |
的数值计算结果 |
|
|
5. 小结
运用Attouch等学者的阻尼惯性梯度系统求解优化问题的思想,本文研究了二阶锥约束的变分不等式(1.1)的KKT解的收敛性问题。首先运用光滑化的自然残差函数建立了二阶锥约束的变分不等式问题(1.1)的KKT条件的光滑化方程,并建立了无约束优化问题。建立了带扰动项的阻尼惯性梯度系统,并研究了该系统的稳定性定理,从而得到了二阶锥约束变分不等式问题(1.1)的KKT点的收敛性。并与已有的一阶微分方程系统进行了理论条件和数值结果的对比,在理论条件上,带有扰动项的阻尼惯性系统更容易实现。但是在数值计算上,一阶微分方程系统要更快一些,但是其差值不是特别大,可忽略不计。
项目支持
沈阳航空航天大学2025年大学生创新创业项目,编号D202410291440128891。