一类变分不等式的惯性黄金比例算法的研究
Research on the Inertial Golden Ratio Algorithm for a Class of Variational Inequalities
DOI: 10.12677/pm.2025.1511277, PDF, HTML, XML,    国家自然科学基金支持
作者: 王爱宏, 樊书博:中国民航大学理学院,天津
关键词: 变分不等式黄金比例算法惯性弱收敛Variational Inequalities Golden Ratio Algorithm Inertial Weak Convergence
摘要: 变分不等式是优化理论中的重要问题,在许多实际问题中都有广泛应用。传统求解变分不等式的方法有:投影外梯度法、镜像梯度法、邻近点算法、交替方向法、黄金比例算法等。黄金比例算法相较于投影梯度算法在每次迭代的过程中减少了一次投影的运算,因而提高了收敛速度。本文旨在研究一类变分不等式的黄金比例算法,在已有的一步惯性算法的基础上提出两步惯性黄金比例算法,并证明了在适当的参数条件下该算法的弱收敛性。最后通过数值实验比较了Malitsky的算法,Yang和Liu的算法,Chinedu和Yekini的算法以及我们所提出的算法在迭代时间和迭代步数上的性能差异,验证了本文所提出算法的优异性。
Abstract: Variational inequality is an important problem in optimization theory. The traditional methods for solving variational inequalities include: extragradient method, mirror gradient method, proximity point algorithm, alternating direction method, golden ratio algorithm, etc. Compared with the projection gradient algorithm, the golden ratio algorithm reduces the operation of one projection in the process of each iteration, so as to improve the convergence speed. The purpose of this thesis is to study a kind of golden ratio algorithm for variational inequality, and to propose a two-step inertial golden ratio algorithm based on the one-step ones. The weak convergence of the algorithm is proved under the appropriate parameter conditions. Finally, numerical experiments are carried out to compare the performance differences of Malitsky’s algorithm, Yang and Liu’s algorithms, Chinedu and Yekini’s algorithms, and the proposed algorithm in terms of iteration time and iteration steps, which verifies the superiority of the proposed algorithm.
文章引用:王爱宏, 樊书博. 一类变分不等式的惯性黄金比例算法的研究[J]. 理论数学, 2025, 15(11): 146-160. https://doi.org/10.12677/pm.2025.1511277

1. 引言

变分不等式问题自从20世纪60年代由Stampacchia首次提出以来,已经发展成为了数学规划和非线性分析领域的重要理论基础。变分不等式问题是[1]:设 H 是实Hilbert空间, , 分别表示内积和范数。 C H 的闭凸子集, F:HH 是非线性映射。经典的变分不等式是指:寻找 x C 满足

F( x ),y x 0,yC, (1-1)

该问题的解集记为 S

国内外学者对变分不等式问题的研究集中在许多个方面,首先是解的存在性与唯一性,其次是求解算法的探索。在解决变分不等式问题的算法中,其最经典的算法是投影梯度法[2]。此方法的局限性在于要求算子具有强单调性且Lipschitz连续,否则不能保证其收敛性,并且该算法在单调情形下可能振荡,因而Korpel-Evich (1976)提出外推投影梯度算法[3],该算法仅要求算子单调且Lipschitz连续。传统外推投影梯度算法虽然解决了单调变分不等式的收敛问题,但存在两个关键缺陷,其一是计算成本高,每次迭代需计算两次投影及函数值,其二是固定步长限制。

投影梯度类算法的收敛速度是受限于问题条件数,尤其是在非强单调或者高维问题中表现尤为不佳。黄金比例算法通过引入历史信息加权和最优步长设计,突破经典方法的收敛速率瓶颈。Malitsky [4]提出了具有完全自适应步长的黄金比例算法,该算法在每次迭代仅需要计算一次函数值以及一次投影。此外,

步长是自适应确定的。完全自适应步长的黄金比例算法有遍历性的 O( 1 k ) 收敛速率和 R 线性收敛速率。

之后Yang和Liu [5]提出了对黄金比例算法的修改,将算子推广到伪单调情形。但该算法中要求步长是递减的,Chinedu和Yekini [6]在此算法的基础上提出完全自适应算法:一步向后惯性黄金比例算法。算法的优点是加入惯性项,对算法进行加速。

本文在一步惯性黄金比例算法的基础上提出了两步惯性自适应黄金比例算法,使之更充分应用前面的迭代信息,加快了收敛速度。其方法较Nesterov重球法更一般化,数值实验也验证了算法的优异性。

2. 预备知识

文中,我们使用符号 x k v ˜ 表示序列 { x k } 弱收敛到 v ˜

定义2.1 [6]:

1) L -Lipschitz连续,存在 L>0 ,如果对于任意 u ˜ , v ˜ H ,使得

F( u ˜ )F( v ˜ ) L u ˜ v ˜ .

2) 序列弱–强连续,如果对于任意的序列 { u n } 弱收敛于 v ˜ ,我们有 { F( u n ) } 强收敛于 F( v ˜ )

3) 序列弱连续,如果对于任意序列 { u n } 弱收敛于 v ˜ ,我们有 { F( u n ) } 弱收敛于 F( v ˜ )

定义2.2 [6]:

1) ρ -强单调,存在 ρ>0 ,如果对于任意 u ˜ , v ˜ H ,使得

F( u ˜ )F( v ˜ ), u ˜ v ˜ ρ u ˜ v ˜ 2 .

2) 单调,如果对于任意 u ˜ , v ˜ H

F( u ˜ )F( v ˜ ), u ˜ v ˜ 0.

3) 拟单调,对于任意 u ˜ , v ˜ H

F( v ˜ ), u ˜ v ˜ >0 F( u ˜ ), u ˜ v ˜ 0.

引理2.1 (Minty) [6] F:CH 为连续单调映射,则 x 是(1-1)的解当且仅当 x 是下列问题的解

xC, F( x ), x x 0, x C.

该问题的解集被指定为 S D ,我们知道 S D C 的一个闭的凸子集,根据 C 的凸性和映射 F 的连续性可得 S D S

引理2.2 [6]以下等式成立:

1) 2 u ˜ , v ˜ = u ˜ 2 + v ˜ 2 u ˜ v ˜ 2 = u ˜ + v ˜ 2 u ˜ 2 v ˜ 2 , u ˜ , v ˜ H

2) ( 1+ α ˜ ) u ˜ α ˜ v ˜ 2 =( 1+ α ˜ ) u ˜ 2 α ˜ v ˜ 2 + α ˜ ( 1+ α ˜ ) u ˜ v ˜ 2

引理2.3 [6] CH 是一个非空闭凸子集, { x k } H 中的序列,满足:

1) xC lim k x k x 存在;

2) { x k } 的所有弱聚点都在 C 中。

{ x k } 弱收敛到集合 C 中一点。

3. 主要结论

3.1. 算法描述

在一步惯性黄金比例算法的基础上我们提出两步惯性黄金比例算法。

算法3-1(两步惯性黄金比例算法)

假设参数 δ[ ( 5 1 )/2 ,1 ) θ( 1/2 ,0 ] 满足以下条件:

δ( 1+δ )( 1+θ )1. (3-1)

1. 选择 λ 0 , λ ¯ >0, x 1 , x 0 , y 0 , y 1 , w 0 C,δ[ ( 5 1 )/2 ,1 ) 1/2 <θ<η0

2. 设 θ 0 =1,ρ=δ( 1+δ )( 1+θ ) k=1 ,求步长

λ k =min{ ρ λ k1 , θ k1 4 λ k1 δ y k y k1 2 F( y k )F( y k1 ) 2 , λ ¯ }. (3-2)

3. 计算

{ x k =( 1δ ) y k +δ w k1 , w k = x k +θ( x k x k1 )+η( x k1 x k2 ), y k+1 = P C ( w k λ k F( y k ) ), (3-3)

其中 θ k = λ k λ k1 δ

4. 令 kk+1 ,转到2。

3.1

(1) 我们所提出的算法是基于Chinedu和Yekini的一步惯性黄金比例算法所提出的两步惯性黄金比例算法,其中 δ=1/ϕ ϕ= ( 5 +1 )/2

(2) 我们的算法中的惯性因子是非正的。这是不同于文献[7] [8]中惯性因子通常为非负的特征。这种负值特性可能源于算法的特质,因此我们的算法可以看作是自适应黄金比例具有向后惯性步长 w k = x k +θ( x k x k1 )+η( x k1 x k2 ) 的算法。并且在数值算例4.1中比较了惯性步长 θ,η<0 时在迭代步数和收敛速度的优越性。

(3) 在Yang和Liu [5]提出的算法中,作者所定义的步长是非递增的。因此,它们是限制性的。但我们在公式(3-2)中所给出的步长是不需要非递增的;相反, λ k 可以大于 λ k1 (由于 δ> ( 5 1 )/2 θ>1/ δ( 1+δ ) 1 ,我们有 ρ>1 )和 { λ k } 是有界的。

(4) 对于算法3-1当 η=0 时,其相当于Chinedu和Yekini的一步惯性黄金比例算法;当 η=θ=0 时,其相当于Malitsky [4]提出了具有完全自适应步长的黄金比例算法。

我们做出以下假设以确保我们提出的算法的弱收敛。

假设3.1

(1) S D

(2) F C 中是局部Lipschitz连续的,意味着 F C 的任何有界子集中是Lipschitz连续。

(3) 当 { y k }C y k v ,我们有 F( v ) lim inf n F( y k )

(4) F 是在 H 上的拟单调算子。

3.2在假设3.1(3)中,我们施加了一个比文献[9]中对序列弱连续性要求更弱的条件。

对于公式(3-2),我们分两种情况讨论:

情况1:当 λ k ρ λ k1 时,因此我们有

θ k ρ/δ . (3-4)

情况2:当 θ k1 λ k1 δ = θ k θ k1 λ k ,我们得到

λ k 2 F( y k )F( y k1 ) 2 θ k θ k1 4 y k y k1 2 . (3-5)

应用和文献[4]中的引理2相似的思想,我们可以证明当序列 { y k } 是有界的时,序列 { λ k } { θ k } 都是有界的,并且远离零。在这一论断下面的引理中得到详细阐述。

引理3.1若假设3.1(2)成立,则 { λ k } { θ k } 是远离零且有界的成立条件是 { y k } 是有界的。

证明:对于公式(3-2),我们得到 λ k λ ¯ ,由于 { y k } 是有界的,我们看到假设3.1的(2)存在 L>0 使得 F( y k )F( y k1 ) L y k y k1 。取一个足够大的 L 使得

λ j 1 4 L 2 δ 2 λ ,j=0,1.

我们现在假设 λ j 1 4 L 2 δ 2 λ j=0,1,,k1 。则下列两种情况必有其一( ρ>0 ):

λ k =ρ λ k1 λ k1 1 4 L 2 δ 2 λ ¯ . (3-6)

或者

λ k = 1 4 δ 2 λ k2 y k y k1 2 F( y k )F( y k1 ) 2 1 4 L 2 δ 2 λ k2 1 4 L 2 δ 2 λ ¯ . (3-7)

由公式(3-6)和公式(3-7)可得:

λ k 1 4 L 2 δ 2 λ ¯ .

因此,可以得出结论 { θ k } 是有界远离零的。

3.2. 两步惯性黄金比例算法的弱收敛性

下面证明两步惯性黄金比例算法的弱收敛性。

引理3.2在满足假设3.1(1)和(2)的情况下,算法产生的序列 { x k } { y k } 是有界的。

证明:对于 y k+1 = P C ( w k λ k F( y k ) ) ,有

y k+1 w k + λ k F( y k ),y y k+1 0 .(3-8)

同理我们有 y k = P C ( w k1 λ k1 F( y k1 ) ) 则有

y k w k1 + λ k1 F( y k1 ),y y k 0 .(3-9)

在公式(3-8)中,令 y= x ¯ S D ,公式(3-9)中,令 y= y k+1 ,则有

y k+1 w k + λ k F( y k1 ), x ¯ y k+1 0 .(3-10)

y k w k1 + λ k1 F( y k1 ), y k+1 y k 0 .(3-11)

x k =( 1δ ) y k +δ w k1 ,我们有

y k x k = δ 1δ ( x k w k1 )=δ( y k w k1 ) .(3-12)

将公式(3-12)代入公式(3-11),我们有

1 δ ( y k x k )+ λ k1 F( y k1 ), y k+1 y k 0 .(3-13)

对于公式(3-10),由于 δ>0 ,则有

1 δ y k+1 w k + λ k F( y k ), x ¯ y k+1 0 .(3-14)

再由公式(3-13),我们有

θ k δ ( y k x k )+ θ k λ k1 F( y k1 ), y k+1 y k 0 .(3-15)

将公式(3-14)和公式(3-15)相加,得到

1 δ y k+1 w k , x ¯ y k+1 + λ k δ F( y k ), x ¯ y k+1 + θ k δ y k x k , y k+1 y k + θ k λ k1 F( y k1 ), y k+1 y k 0.

将上式同时乘以 δ ,且由已知条件可知 θ k = λ k λ k1 δ δ θ k λ k1 = λ k ,得

λ k F( y k ), x ¯ y k+1 + λ k F( y k1 ), y k+1 y k w k y k+1 , x ¯ y k+1 + θ k x k y k , y k+1 y k . (3-16)

我们注意到

w k y k+1 , x ¯ y k+1 = 1 2 [ w k y k+1 2 + y k+1 x ¯ 2 w k x ¯ 2 ]. (3-17)

θ k x k y k , y k+1 y k = θ k 2 [ x k y k 2 + y k+1 y k 2 x k y k+1 2 ]. (3-18)

把公式(3-17)和公式(3-18)代入公式(3-16),得到

1 2 y k+1 x ¯ 2 1 2 w k x ¯ 2 1 2 w k y k+1 2 θ k 2 x k y k 2 θ k 2 y k+1 y k 2 + θ k 2 x k y k+1 2 + λ k F( y k )F( y k+1 ), y k y k+1 . (3-19)

2 λ k F( y k )F( y k+1 ), y k y k+1 2 λ k F( y k )F( y k+1 ) y k y k+1 2 λ k L y k y k+1 y k y k+1 θ k θ k1 y k y k+1 y k y k+1 θ k 2 y k y k+1 2 + θ k1 2 y k y k+1 2 . (3-20)

将公式(3-20)代入公式(3-19),我们有

y k+1 x ¯ 2 w k x ¯ 2 w k y k+1 2 θ k [ x k y k 2 + y k+1 y k 2 x k y k+1 2 ]+ θ k 2 y k y k+1 2 + θ k1 2 y k y k+1 2 . (3-21)

x k =( 1δ ) y k +δ w k1 ,则有

y k+1 = 1 1δ x k+1 δ 1δ w k . (3-22)

y k+1 x ¯ 2 = 1 1δ ( x k+1 x ¯ ) δ 1δ ( w k x ¯ ) 2 = 1 1δ x k+1 x ¯ 2 δ 1δ w k x ¯ 2 + δ ( 1δ ) 2 x k+1 w k 2 = 1 1δ x k+1 x ¯ 2 δ 1δ w k x ¯ 2 +δ y k+1 w k 2 . (3-23)

把公式(3-23)代入公式(3-21)中,我们有

1 1δ x k+1 x ¯ 2 1 1δ w k x ¯ 2 ( 1+δ ) y k+1 w k 2 + θ k x k y k+1 2 θ k x k y k 2 + θ k1 2 y k y k1 2 θ k 2 y k+1 y k 2 . (3-24)

w k x ¯ 2 =( 1+θ ) x k x ¯ 2 ( θη ) x k1 x ¯ 2 η x k2 x ¯ 2 +( 1+θ )( θη ) x k x k1 2 +η( 1+θ ) x k x k2 2 η( θη ) x k1 x k2 2 . (3-25)

y k+1 w k 2 = ( 1+θ )( y k+1 x k )( θη )( y k+1 x k1 )η( y k+1 x k2 ) 2 =( 1+θ ) y k+1 x k 2 ( θη ) y k+1 x k1 2 η y k+1 x k2 2 +( 1+θ )( θη ) x k x k1 2 +η( 1+θ ) x k x k2 2 η( θη ) x k1 x k2 2 . (3-26)

代入公式(3-24),整理并移项有

1 1δ x k+1 x ¯ 2 θ 1δ x k x ¯ 2 η 1δ x k1 x ¯ 2 + θ k 2 y k+1 y k 2 δ 2 ( 1+θ )( θη ) 1δ x k x k1 2 1 1δ x k x ¯ 2 θ 1δ x k1 x ¯ 2 η 1δ x k1 x ¯ 2 + θ k1 2 y k+1 y k 2 δ 2 ( 1+θ )( θη ) 1δ x k1 x k2 2 +[ δ 2 ( 1+θ )( θη ) 1δ η( θη ) 1δ +( 1+δ )η( θη ) ] x k1 x k2 2 +[ η( 1+θ ) 1δ ( 1+δ )η( 1+θ ) ] x k x k2 2 +[ θ k ( 1+δ )( 1+θ ) ] x k y k+1 2 +( 1+δ )( θη ) y k+1 x k1 2 +( 1+δ )η y k+1 x k2 2 θ k x k y k 2 . (3-27)

Γ k = 1 1δ x k x ¯ 2 θ 1δ x k1 x ¯ 2 η 1δ x k2 x ¯ 2       + θ k1 2 y k y k1 2 δ 2 ( 1+θ )( θη ) 1δ x k1 x k2 2 .

则上式变为

Γ k+1 Γ k + δ 2 ( θη )( 1+θη ) 1δ x k1 x k2 2 + η( 1+θ ) δ 2 1δ x k x k2 2         +[ θ k ( 1+δ )( 1+θ ) ] x k y k+1 2 +( 1+δ )( θη ) y k+1 x k1 2         +( 1+δ )η y k+1 x k2 2 θ k x k y k 2 . (3-28)

下面我们说明 Γ k 0 。注意到

x k1 x ¯ 2 2 x k2 x k1 2 +2 x k2 x ¯ 2 ,

Γ k 1 1δ x k x ¯ 2 2θ 1δ x k1 x k2 2 2θ 1δ x k2 x ¯ 2 η 1δ x k2 x ¯ 2 δ 2 ( 1+θ )( θη ) 1δ x k1 x k2 2 = 1 1δ x k x ¯ 2 2θ+ δ 2 ( 1+θ )( θη ) 1δ x k1 x k2 2 2θ+η 1δ x k2 x ¯ 2 .

由算法3-1条件 1/2 <θ<η0 ,可知 θη<0,1+θη>0,1+θ>0,2θ+η<0 ,从而有

δ 2 ( θη )( 1+θη ) 1δ <0, η( 1+θ ) δ 2 1δ <0,( 1+δ )( θη )<0,( 1+δ )η<0.

所以 Γ k 0

比较公式(3-28)右侧各项系数,并注意到 θ k ( 1+δ )( 1+θ ) (公式(3-3) (3-4)所得) θ k >0 ,从而有 Γ k+1 Γ k 。所以 { Γ k } 是非增的,且 { Γ k } 是有界的。

{ Γ k } 极限存在,我们可以得到

lim k y k+1 x k =0, lim k x k1 x k2 =0, lim k x k x k1 =0, lim k w k x k =0, lim k y k+1 w k =0, lim k y k x k =0, lim k y k+1 y k =0.

由上述结论,可知

lim k [ 1 1δ x k x ¯ 2 θ 1δ x k1 x ¯ 2 η 1δ x k2 x ¯ 2 ]

极限存在,因而

{ 1 1δ x k x ¯ 2 θ 1δ x k1 x ¯ 2 η 1δ x k2 x ¯ 2 }

是有界的。所以 { x k } 有界,同时 { y k } 也是有界的。

引理3.3如果 v { y k } 的弱聚点,则在假设条件下,我们有 v S D F( v )=0

证明:由引理3.2可知 { x k } { y k } 都是有界的,如果 v { y k } 的弱聚点则它也是 { x k } 的弱聚点,因为, x k y k 0 ,当 k 时,因此存在 { x k j }{ x k } ,使得 x k j v C

现在检查下面两种情形。

情况1:如果 lim sup j F( y k j ) =0, lim j F( y k j ) =lim inf j F( y k j ) =0.

由假设3.1(3)我们有

0 F( v ) lim j inf F( y k ) =0,

因此我们可以得到 F( v )=0

情况2:如果

lim sup j F( y k j ) >0.

不失一般性,我们选择 { F( y k j ) } 的子列并仍然定义 { F( y k j ) } 使得,

lim j F( y k j ) = M 1 >0.

由投影性质对所有 yC ,有

0 y k j w k j + λ kj F( y k j ),y y k j+1 = y k j+1 w k j ,y y k j+1 + λ k j F( y k j ), y k j y k j+1 + λ k j F( y k j ,y y k j ) , (3-29)

因为 lim k y k+1 w k = lim k y k+1 y k =0 ,因而有

0lim inf j F( y k j ,y y k j ) lim sup j F( y k j ),y y k j <,yC, (3-30)

基于(3-30)我们继续预测情况2的两种情形。

情形(a)对所有的 yC ,我们假设 lim sup j F( y k j ,y y k j ) >0 ,我们选择 { y k j l } ,使得 lim j F( y k j ),y y k j >0 。因此 l 0 1 ,使得 F( y k j l ),y y k j l >0 l l 0 ,因为 F 是拟单调的。我们有 F( y ),y y k j l 0,yC,l l 0 ,当 l 我们有 F( y ),y v 0,yC ,即 v S D

情形(b)对所有的 yC 。我们假定 lim sup j F( y k j ),y y k j =0 ,由公式(3-30)我们有

lim j F( y k j ),y y k j =0,yC, (3-31)

意味着

F( y k j ),y y k j +| F( y k j ),y y k j |+ 1 j+1 >0,yC. (3-32)

由于 lim j F( y k j ) = M 1 >0 ,则 j 0 1 ,使得 F( y k j ) > M 1 2 ,j j 0 。我们令 b k j = F( y k j ) F( y k j ) 2 ,j j 0 ,因而有 F( y k j ), b k j =1,j j 0

由公式(3-31)有

F( y k j ),y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 ] y k j >0.

结合上述不等式及 F 的拟单调性

F( y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 ] ),y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 y k j ] 0.

因此有

F( y ),y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 ] y k j F( y )F( y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 ] ),y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 ] y k j L M 1 ( F( y k j ),y y k j + 1 j+1 ) M 2 . (3-33)

这里 M 2 >0 ,由于 { y+ b k j [ | F( y k j ),y y k j |+ 1 j+1 ] y k j } 是有界的,由公式(3-30)

lim j ( | F( y k j ),y y k ||+ 1 j+1 )=0.

由公式(3-33)可知,对所有的 yC ,有 F( y ),y v 0 ,即 v S D

定理3.1在假设3.1成立及 F( x )0 ,对于 xC 条件下,序列 { x k },{ y k } 弱收敛到变分不等式问题(1-1)的一个解。

证明:令 { y k } 的弱聚点集为 ω w ( y k ) ,下面证明 ω w ( y k ) S D

v ω w ( y k ) ,存在一个序列 { y k j }{ y k } ,使得 y k j v ,当 j 时,由 C 的弱闭性,则 v C ,对所有 xC F( x ) 是非零则 F( v ) 也是非零的,由引理3.3得 v S D ,因此 ω w ( x k ) S D

x k1 x ¯ 2 = x k1 x k 2 + x k x ¯ 2 +2 x k1 x k , x k x ¯ .

x k2 x ¯ 2 = x k2 x k1 2 + x k1 x k 2 +2 x k2 x k1 , x k1 x k                    +2 x k2 x k1 , x k x ¯ +2 x k1 x k , x k x ¯ .

Γ k = 1 1δ x k x ¯ 2 θ 1δ [ x k1 x k 2 +2 x k1 x k , x k x ¯ ] θ 1δ x k x ¯ 2 η 1δ [ x k2 x k1 2 + x k1 x k 2 +2 x k2 x k1 , x k1 x k +2 x k2 x k1 , x k x ¯ + 2 x k1 x k , x k x ¯ ] η 1δ x k x ¯ 2 δ 2 ( 1+θ )( θη ) 1δ x k1 x k2 2 = 1θη 1δ x k x ¯ 2 a k b k c k .

其中

a k = θ 1δ [ x k1 x k 2 +2 x k1 x k , x k x ¯ ], b k = η 1δ [ x k2 x k1 2 + x k1 x k 2 +2 x k2 x k1 , x k1 x k       +2 x k2 x k1 , x k x ¯ + 2 x k1 x k , x k x ¯ ], c k = δ 2 ( 1+θ )( θη ) 1δ x k1 x k2 2 .

因为 lim k x k x k1 = lim k x k1 x k2 =0 ,则 a k 0, b k 0, c k 0 。且 1θη 1δ 有界,则 lim k x k x ¯ 存在,对所有的 x ¯ S D

由引理2.3得 { x k } x ¯ S D ,此外 x k y k 0 ,有 { y k } v S D ,即证明完毕。

4. 数值实验

4.1. 有限维算例

例4.1设 C=[ 1,1 ] ,定义 F 如下:

F( v )={ 2v1,      v>1, v 2 ,           v[ 1,1 ], 2v1,    v<1. (4-1)

在这种情况下 F 是拟单调且Lipschitz连续的,但既不是伪单调也不是单调的,此外,我们有 S D ={ 1 } S={ 1,0 }

在计算过程中,选取如下参数:

Malitsky的算法: ϕ=φ= ( 5 +1 )/2 , λ 0 =2, λ ¯ =2

Yang和Liu的算法:

δ=0.5( ( 1+4( α/ ( 2θ ) +1α )1 )/2 ),θ=1,α=0.5,μ=0.5, λ 1 =2 .

Chinedu和Yekini的算法: δ=0.618,θ=0.1, λ 0 =2, λ ¯ =2

算法3-1 (我们的算法): δ=0.618,θ=0.2,η=0.15, λ 0 =2, λ ¯ =2

我们使用停止准则 TO L k :=max{ y k+1 x k 2 , y k x k 2 }<ε 对于所有算法,其中 ε 是误差,我们选择 ε= 10 5 。于是我们选择如下的初值 y 0 , y 1 , x 1 , x 0 , w 0

情况1: y 0 =0.1, y 1 =0.2, x 1 =0.05, x 0 =0.15, w 0 =0.03

情况2: y 0 =0.2, y 1 =0.2, x 1 =0.05, x 0 =0.2, w 0 =0.03

情况3: y 0 =0.2, y 1 =0.2, x 1 =0.05, x 0 =0.2, w 0 =0.03

情况4: y 0 =0.1, y 1 =0.3, x 1 =0.05, x 0 =0.25, w 0 =0.03 (见表1)。

Table 1. Comparative analysis results of various algorithms

1. 各类算法的比较分析结果

Algorithm

Case 1

Case 2

Case 3

Case 4

CPU

Iter

CPU

Iter

CPU

Iter

CPU

Iter

Malitsky算法

0.0027

63

0.0026

59

0.0027

59

0.0029

60

Yang & Liu算法

0.0034

244

0.0031

244

0.0021

6

0.0036

245

Chinedu & Yekini算法

0.0018

20

0.0014

24

0.0016

24

0.0016

21

算法3-1

0.0016

18

0.0013

22

0.0015

22

0.0014

19

注:CPU表示运行时间(s),Iter表示迭代次数。

我们也将使用线性图来呈现上述四种情况的收敛速率以及迭代次数,其中横坐标表示迭代次数,纵坐标表示误差。如图1所示,由于算法3-1相较于其他算法采用了更多以前信息,使得在迭代中较好的修正迭代步长,且减少对初始值选取的依赖性。

Figure 1. Showing case 1 (a),case 2 (b),case 3 (c),and case 4 (d)

1. 分别表示情况1 (a),情况2 (b),情况3 (c),情况4 (d)

4.2. 无限维算例

对任意 0<T ,设 L 2 ( [ 0,T ], m ) 表示平方可积的Hilbert空间,可测向量函数 z:[ 0,T ] m ,定义:

z,v = 0 T z( t ),v( t ) dt.

相应的范数

z 2 = z,z = ( 0 T z( t ) 2 dt ) 1 2 <.

让我们研究一下最优控制问题

z ( t )=argmin{ f( z ):zZ }. (4-2)

假设存在这样的控制。在这种情况下, Z 表示容许控制的集合:

Z={ z( t ) L 2 ( [ 0,T ], m ): z i ( t )[ z i , z i + ],i=1,2,3,,m }.

因此, Z m 维盒的形状,并且它构成分段连续函数.特别地,控制可以是以分段常数函数为特征的开关式控制。

最终目标可以表示为:

f( z )=g( w( T ) ).

其中, g 是定义在可行集上的可微凸函数.

考虑一种情形,其中轨迹 w( t ) L 2 ( [ 0,T ] ) 满足由微分方程组表示的约束:

w ˙ ( t )=D( t )w( t )+E( t )z( t ),w( 0 )= w 0 ,t[ 0,T ].

其中 D( t ) E( t ) 是连续矩阵对于每个 t[ 0,T ] ,根据庞特里亚金最大值原理,我们可以找到一个函数 p L 2 ( [ 0,T ] ) ,为此解出 ( w , p , z ) ,对于几乎每个 t[ 0,T ] 的方程组:

{ w ˙ ( t )=D( t ) w ( t )+E( t ) z ( t ), w ( 0 )= w 0. (4-3)

{ p ˙ ( t )=D ( t ) p ( t ), p ( T )=g( w( T ) ). (4-4)

0E ( t ) p ( t )+ N Z ( z ( t ) ). (4-5)

其中 N Z ( z ) 表示从 Z z 的法向圆锥。

对于 Gz( t ):=E ( t ) p( t ) 很好地建立了表示目标成本函数的梯度,我们可以将(4-4)转换为下面的VIP:寻找 zZ ,使得

Gz,vz 0,vZ. (4-6)

让我们通过选择一个自然数 N 来离散连续函数,其网格大小为 h:=T/N 。令 z N :=( z 0 , z 1 ,, z N1 ) ,表示为它的分段常数扩张,用它的分段线性插值来表示任何离散化状态 w N :=( w 0 , w 1 ,, w N )

w N ( t )= w i + t t i h ( w i+1 w i )+ t t i1 h ( w i w i1 ).

其中 t[ t i , t i+1 ),i=0,1,,N1

使用欧拉方法在每次迭代时求解常微分方程组

{ w i+1 N = w i N +h[ D( t i ) w i N +E( t i ) z i N ], w( 0 )= w 0 . (4-7)

{ p i N = p i+1 N +hD ( t i ) T p i+1 N , P( N )=g( w N ). (4-8)

例4.2谐振子的控制

我们需要最小化 w 2 ( 3π ) ,并满足动力学方程和约束条件:

动力学方程:

{ w ˙ 1 ( t )= w 2 ( t ), w ˙ 2 ( t )= w 1 ( t )+z( t ),t[ 0,3π ], (4-9)

取初始条件 w( 0 )=0 z( t )[ 1,1 ]

我们知道这个问题的精确最优控制是:

z ( t )={ 1,      t[ 0, π 2 )( 3π 2 , 5π 2 ), 1,   t( π 2 , 3π 2 )( 5π 2 ,3π ].

图2所示,算法3-1的在谐振子控制案例中的稳定性十分良好,也从侧面反映出了算法3-1在无限维空间中具有良好的稳定性。

Figure 2. Calculated by Algorithm 3-1, on the left: the blue line represents the random initial control, and the red line represents the optimal control. On the right: shows the optimal trajectory

2. 由算法3-1计算,在左侧:蓝线代表随机初始控制,而红线代表最优控制.在右侧:显示最佳轨迹

5. 结论

本文提出了一个两步惯性黄金比例算法来解决变分不等式问题。该算法充分应用了前面的迭代信息,达到了较快的收敛速率。数值实验结果也表明,所提出的两步惯性黄金比例算法(算法3-1)在测试中均展现出显著的性能优势。但对算法的强收敛性和遍历意义下序列收敛速率没有讨论。今后可以考虑变分包含问题中,两步惯性邻近点算法的应用,同时也可将该思想推广到向前–向后–向前算法,原始对偶算法等。

基金项目

国家自然科学基金:非光滑双稳定非线性能量阱靶向能量转移全局动力学和优化设计。项目编号:12172376。

参考文献

[1] Hartman, P. and Stampacchia, G. (1966) On Some Non-Linear Elliptic Differential-Functional Equations. Acta Mathematica, 115, 271-310. [Google Scholar] [CrossRef
[2] Facchinei, F. and Pang, J.S. (2003) Finite-Dimensional Variational Inequalities and Complementarity Problems-Volume I. Springer.
[3] Vasilyev, F.P., Khoroshilova, E.V. and Antipin, A.S. (2010) An Extragradient Method for Finding the Saddle Point in an Optimal Control Problem. Moscow University Computational Mathematics and Cybernetics, 34, 113-118. [Google Scholar] [CrossRef
[4] Malitsky, Y. (2020) Golden Ratio Algorithms for Variational Inequalities. Mathematical Programming, 184, 383-410. [Google Scholar] [CrossRef
[5] Yang, J. and Liu, H. (2020) A Self-Adaptive Method for Pseudomonotone Equilibrium Problems and Variational Inequalities. Computational Optimization and Applications, 75, 423-440. [Google Scholar] [CrossRef
[6] Izuchukwu, C. and Shehu, Y. (2024) A Golden Ratio Algorithm with Backward Inertial Step for Variational Inequalities. Communications in Nonlinear Science and Numerical Simulation, 138, Article 108217. [Google Scholar] [CrossRef
[7] Salahuddin (2022) The Extragradient Method for Quasi-Monotone Variational Inequalities. Optimization, 71, 2519-2528. [Google Scholar] [CrossRef
[8] Ye, M. and He, Y. (2015) A Double Projection Method for Solving Variational Inequalities without Monotonicity. Computational Optimization and Applications, 60, 141-150. [Google Scholar] [CrossRef
[9] Yu, Y., Zhao, Y. and Yin, T.C. (2023) Convergence of Extragradient-Type Methods for Fixed Point Problems and Quasimonotone Variational Inequalities. Journal of Nonlinear and Convex Analysis, 24, 2225-2237.