二阶锥约束变分不等式的阻尼惯性梯度系统的方法研究
Research on the Method of Damped Inertial Gradient System for Second-Order Cone Constrained Variational Inequalities
摘要: 本文聚焦二阶锥约束变分不等式问题,旨在探寻有效的求解方法与分析其相关性质。首先,通过分析KKT条件并借助光滑化的二阶锥互补函数,将二阶锥约束变分不等式问题转化为无约束优化问题。随后,受Attouch等工作启发,构造阻尼惯性梯度系统来求解该无约束优化问题。在此基础上,对阻尼惯性梯度系统进行稳定性分析,在给定的阻尼系数、时间尺度系数条件及特定增长条件下,证明了系统解的轨迹收敛速度和有界性。研究成果为二阶锥约束变分不等式问题的求解提供了新的思路和理论依据。
Abstract: This paper focuses on the second-order cone constrained variational inequalities problem, aiming to explore effective solution methods and analyze its relevant properties. Firstly, by analyzing the KKT conditions and using the smoothed second-order cone complementarity function, the second-order cone constrained variational inequality problem is transformed into an unconstrained optimization problem. Subsequently, inspired by the work of Attouch et al., a damped inertial gradient system is constructed to solve this unconstrained optimization problem. On this basis, the stability analysis of the damped inertial gradient system is conducted. Under the given conditions of damping coefficients, time scale coefficients, and specific growth conditions, the convergence rate and boundedness of the trajectories of the system’s solutions are proved. The research results provide new ideas and theoretical basis for solving the second-order cone constrained variational inequality problem.
文章引用:宋瑷如, 于晓雪, 施玉缘, 王莉. 二阶锥约束变分不等式的阻尼惯性梯度系统的方法研究[J]. 理论数学, 2025, 15(9): 165-174. https://doi.org/10.12677/pm.2025.159243

1. 引言

变分不等式理论是当今非线性分析的重要组成部分,它在力学、微分方程、控制论、数理经济、对策理论、优化理论、非线性规划等理论和应用学科都有广泛的应用。其中,二阶锥约束变分不等式是变分不等式问题的一个重要分支,在统计学、经济学、机器学习、信息处理等科学和工程领域有着重要的应用,受到众多学者的关注[1]-[4]。本文要解决的二阶锥约束变分不等式问题:求解 x C 满足

F( x ),y x 0,    yC, (1.1)

其中,约束集合C表示为

C={ x n |g( x )K }, (1.2)

, 表示为欧式空间的内积。 h: n l g: n m 都是连续可微的,且

K= K m 1 × K m 2 ×× K m p , (1.3)

l0 m 1 , m 2 ,, m p 1 m 1 + m 2 ++ m p =m ,每个 K m i ( i=1,,p ) m i 维的二阶锥。所谓二阶锥是指:若 K n n ( n1 ) 满足

K n ={ ( x 1 , x 2 )| x 1 ,  x 2 n1 x 1 x 2 }

则称 K n n 维的二阶锥,又称冰激凌锥。 表示为 l 2 范数。当 n=1 时, K n 退化为非负实数集 +

对二阶锥约束变分不等式通常运用二阶锥约束变分不等式的KKT条件建立神经网络方法进行求解[5]-[8]。特别第,Nazemi和Sabeghi [1] [2]与Sun等[3]运用Lyapunov函数方法证明了神经网络方法是稳定的。2017年以来,Attouch等[6]-[9]构造了一个阻尼惯性梯度系统来解决Hilbert空间上的无约束优化问题 minΦ( x ) 。贾丹娜[10]运用微分方程方法研究了具有等式约束的二阶锥约束变分不等式问题。

本文将在Attouch等[6]-[9]的基础上,需要对二阶锥约束变分不等式问题进行优化问题 minΦ( x ) 的转化,然后建立阻尼惯性梯度系统,将运用该系统研究得到转化后的优化问题的 Φ( x( t ) )minΦ 的值的收敛率。从而得到原始的二阶锥约束变分不等式问题(1.1)的KKT解的收敛性。

2. 二阶锥约束变分不等式问题的无约束优化问题的转化

二阶锥约束变分不等式问题(1.1)等价于下面的广义方程

F( x ) N C ( x ) ,

N C ( x ) 为约束 C 的法锥,可以表示为

N C ( x )={ Jg ( x ) T λ| λ m , λ,g( x ) =0 }.

对于二阶锥约束变分不等式问题(1.1),可以通过分析其KKT条件来解决

{ L( x,μ,λ )=0, 0λg( x )0,

其中

L( x,μ,λ )=F( x )+Jg ( x ) T λ,

L( x,μ,λ ) 为变分不等式的拉格朗日函数。对于 g( x )λ ,其等价于

g i ( x ) λ i , g i ( x ) K m i , λ i K m i ,i=1,,p.

对此,可以运用光滑化的NR二阶锥互补函数[10],将 g( x )λ 表示为

φ NR ε ( g i ( x ), λ i )=0,

的形式。

对于 z=( ε,x,λ ) 1+n+m ,定义如下函数

S( z )=S( ε,x,μ,λ )=( ε L( x,λ ) φ NR ε ( g( x ),λ ) ), (2.1)

(2.1)中 φ NR ε ( g( x ),λ ) 具体可表示为

φ NR ε ( g( x ),λ )=( φ NR ε ( g m 1 ( x ), λ m 1 ) φ NR ε ( g m 2 ( x ), λ m 2 )               φ NR ε ( g m p ( x ), λ m p ) ),

其中 g m i ( x ) K m i λ m i K m i

从而,求解二阶锥约束变分不等式问题(1.1)的KKT点等价于求解光滑方程组

S( z )=( ε L( x,λ ) φ NR ε ( g( x ),λ ) )=0,

对于 z=( ε,x,λ ) 1+n+m ,引入效益函数 Φ( z )= 1 2 S( z ) 2 ,解决该光滑方程组问题等价于求解下面的无约束优化问题

minΦ( z )=min 1 2 S( z ) 2 . (2.2)

3. 二阶锥约束的变分不等式的阻尼惯性梯度系统的稳定性分析

本章将建立具有阻尼惯性参数和时间尺度参数的阻尼惯性梯度系统来求解无约束凸优化问题(2.2),从而实现对二阶锥约束的变分不等式问题(1.1)的KKT点的求解。

3.1. 阻尼惯性梯度系统的建立

受到Attouch等[6]及贾丹娜[10]工作的启发,对无约束优化问题(2.2)构造如下的阻尼惯性梯度系统

( ε ¨ ( t ) x ¨ ( t ) λ ¨ ( t ) )+γ( t )( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) )+β( t )( ε S ( z ) T S( z ) x S ( z ) T S( z ) λ S ( z ) T S( z ) )=0, (3.1)

其中, γ( t ) 表示为阻尼系数, β( t ) 为时间尺度系数,且 γ,β [ t 0 ,+ ) 上是非负连续函数。 ( ε S ( z ) T S( z ) x S ( z ) T S( z ) λ S ( z ) T S( z ) ) 是无约束优化问题(2.2)中 Φ( z ) 有关 z=( ε,x,λ ) 计算所得到的梯度 Φ( z ) 。假设该系统的解是一定存在的,显然系统对应的平衡点 z * =( ε * , x * , λ * ) 是无约束优化问题(2.2)的解。

3.2. 阻尼惯性梯度系统的稳定性分析

在初始情形 Φ( ε,x,μ,λ )=0 下,对阻尼惯性梯度系统(3.1)直接积分,可以得到

p( t )= e t 0 t γ( u )du .

假设其满足以下 H 0 条件

t 0 + du p( u ) < +.

在满足上述 H 0 条件下,定义函数 Γ:[ t 0 ,+ )

Γ( t )=p( t ) t + du p( u ) , (3.2)

通过对式(3.2)进行求导,可以得到

Γ ˙ ( t )=γ( t )Γ( t )1. (3.3)

最后,定义全局能量函数 W( t )

W( t )= 1 2 ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 +β( t )( Φ( ε( t ),x( t ),λ( t ) )minΦ ). (3.4)

以及锚函数 h( t )

h( t )= 1 2 ( ε( t ) x( t ) λ( t ) )( ε * x * λ * ) 2 , (3.5)

其中 ( ε * x * λ * )argminΦ

对于全局能量函数 W( t ) 和锚函数 h( t ) ,都是作为用于稳定性分析的能量函数 ξ:[ t 0 ,+ ) 的基本组成部分,且 ξ( t ) 是一个非负函数如下

ξ( t )=Γ ( t ) 2 W( t )+h( t )+Γ( t ) h ˙ ( t ), (3.6)

具体表达形式为

ξ( t )=Γ ( t ) 2 β( t )( Φ( ε( t ),x( t ),λ( t ) )minΦ )           + 1 2 ( ε( t ) x( t ) λ( t ) )( ε * x * λ * )+Γ( t )( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 . (3.7)

下面给出阻尼惯性梯度系统的稳定性定理。

定理3.1时间尺度系数 β:[ t 0 ,+ ) 是一个连续非负函数,阻尼系数 γ:[ t 0 ,+ ) 是一个满足假设条件 H 0 的连续函数。阻尼系数 γ( t ) 和时间尺度系数 β( t ) 满足 H γ,β 增长条件

Γ( t ) β ˙ ( t )β( t )( 32γ( t )Γ( t ) ).

则当 t+ 时,阻尼惯性梯度系统(3.1)的解的轨迹 z=( ε,x,λ ) × n × m [ t 0 ,+ ) 上对应的函数值的收敛速度满足

Φ( ε( t ),x( t ),λ( t ) )minΦ=Ο( 1 β( t )Γ ( t ) 2 ),

而且解的轨迹 z=( ε,x,λ ) [ t 0 ,+ ) 上是有界的。

证明:为方便计算,记 m=minΦ 。首先,对能量函数 ξ( t ) 求导,根据 ξ( t ) 的定义(3.6),需要对能量函数 ξ( t ) 中的全局能量函数 W( t ) 和锚函数 h( t ) 求导。

全局能量函数 W( t ) 的导数计算过程如下

W ˙ ( t )= ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ),( ε ¨ ( t ) x ¨ ( t ) λ ¨ ( t ) ) +β( t ) ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ),( ε S ( z ) T S( z ) x S ( z ) T S( z ) λ S ( z ) T S( z ) ) + β ˙ ( t )( Φ( ε( t ),x( t ),λ( t ) )m ) = ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ),( ε ¨ ( t ) x ¨ ( t ) λ ¨ ( t ) )+β( t )( ε S ( z ) T S( z ) x S ( z ) T S( z ) λ S ( z ) T S( z ) ) + β ˙ ( t )( Φ( ε( t ),x( t ),λ( t ) )m ) = ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ),γ( t )( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) + β ˙ ( t )( Φ( ε( t ),x( t ),λ( t ) )m ),

简化可得

W ˙ ( t )=γ( t ) ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 + β ˙ ( t )( Φ( ε( t ),x( t ),λ( t ) )m ).

锚函数 h( t ) 求一阶导数可得

h ˙ ( t )= ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ),( ε( t ) ε * x( t ) x * λ( t ) λ * ) ,

继续求二阶导数可得

h ¨ ( t )= ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 + ( ε ¨ ( t ) x ¨ ( t ) λ ¨ ( t ) ),( ε( t ) ε * x( t ) x * λ( t ) λ * ) .

综合以上结果及(3.3)计算能量函数导数 ξ( t ) 如下

ξ ¨ ( t )=2Γ( t ) Γ ˙ ( t )W( t )+Γ ( t ) 2 W ˙ ( t )+ h ˙ ( t )+ Γ ˙ ( t ) h ˙ ( t )+Γ( t ) h ¨ ( t ) =2Γ( t ) Γ ˙ ( t )W( t )+Γ ( t ) 2 W ˙ ( t )+γ( t )Γ( t ) h ˙ ( t )+Γ( t ) h ¨ ( t ) =2Γ( t ) Γ ˙ ( t )W( t )+Γ ( t ) 2 W ˙ ( t )+Γ( t )( γ( t ) h ˙ ( t )+ h ¨ ( t ) ) =Γ( t ) z ˙ ( t ) 2 +2Γ( t ) Γ ˙ ( t )β( t )( Φ( ε( t ),x( t ),λ( t ) )m ) +Γ ( t ) 2 β ˙ ( t )( Φ( ε( t ),x( t ),λ( t ) )m )+Γ( t )( γ( t ) h ˙ ( t )+ h ¨ ( t ) ),

在上式中 z ˙ ( t ) 2 = ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 。根据阻尼惯性梯度系统(3.1)及 Φ( z ) 的凸性,继续计算

γ( t ) h ˙ ( t )+ h ¨ ( t ) = γ( t )( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ),( ε( t ) ε * x( t ) x * λ( t ) λ * ) + ( ε ¨ ( t ) x ¨ ( t ) λ ¨ ( t ) ),( ε( t ) ε * x( t ) x * λ( t ) λ * ) + ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 = γ( t )( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) )+( ε ¨ ( t ) x ¨ ( t ) λ ¨ ( t ) ),( ε( t ) ε * x( t ) x * λ( t ) λ * ) + ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 =β( t ) ( ε S ( z ) T S( z ) x S ( z ) T S( z ) λ S ( z ) T S( z ) ),( ε( t ) ε * x( t ) x * λ( t ) λ * ) + ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 β( t )( Φ( ε( t ),x( t ),λ( t ) )m )+ ( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2

则能量函数 ξ( t ) 的导数可进一步计算如下

ξ ˙ ( t )=Γ( t ) z ˙ ( t ) 2 +2Γ( t ) Γ ˙ ( t )β( t )( Φ( ε( t ),x( t ),λ( t ) )m ) +Γ ( t ) 2 β ˙ ( t )( Φ( ε( t ),x( t ),λ( t ) )m )+Γ( t )( γ( t ) h ˙ ( t )+ h ¨ ( t ) ) ( Φ( ε( t ),x( t ),λ( t ) )m )Γ( t )( 2 Γ ˙ ( t )β( t )+Γ( t ) β ˙ ( t )β( t ) ).

由式(3.3),上式继续化简

ξ . ( t )( Φ( ε( t ),x( t ),λ( t ) )m )Γ( t )( Γ( t ) β ˙ ( t )+β( t )( 2γ( t )Γ( t )3 ) ).

根据条件 H γ,β ξ ˙ ( t )0 ,因此能量函数 ξ( t ) [ t 0 ,+ ) 上是递减的,从而当 t[ t 0 ,+ ) 时有 ξ( t )ξ( t 0 ) 成立。

根据能量函数 ξ( t ) 的定义(3.6)和(3.7)可以得到,对于任意的 t t 0 都有下式成立

Φ( ε( t ),x( t ),λ( t ) )minΦ ξ( t 0 ) β( t )Γ ( t ) 2

等价于

Φ( ε( t ),x( t ),λ( t ) )minΦ=O( 1 β( t )Γ ( t ) 2 ).

下面讨论阻尼惯性梯度系统(3.1)的解的轨迹的有界性,已知函数 ξ( t ) [ t 0 ,+ ) 上是递减的,对于任意 t[ t 0 ,+ ) 时,有以下不等式成立

( ε( t ) x( t ) λ( t ) )( ε * x * λ * )+Γ( t )( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2 2ξ( t )2ξ( t 0 ).

在展开上述不等式后可以得到

( ε( t ) x( t ) λ( t ) )( ε * x * λ * ) 2 +2Γ( t ) ( ε( t ) x( t ) λ( t ) )( ε * x * κ * ),( ε ˙ ( t ) x ˙ ( t ) λ ˙ ( t ) ) 2ξ( t 0 ). (3.8)

假设 q( t )= t + ds p( s ) ,当满足假设条件 H 0 时,则函数 q( t ) t t 0 时是有界的,而且满足

q ˙ ( t )= 1 p( t ) ,      q( t )= Γ( t ) p( t ) . (3.9)

将(3.8)式除以 p( t ) ,并令 C=ξ( t 0 ) ,结合(3.9)式可以得到

1 p( t ) h( t )+q( t ) h ˙ ( t ) C p( t ) ,     t[ t 0 ,+ ).

进一步整理得

q( t ) h ˙ ( t ) q ˙ ( t )( h( t )C )0,     t[ t 0 ,+ ),

其中, h( t ) 为锚函数。

对上式除以 q ( t ) 2 得到

1 q ( t ) 2 [ q( t ) h ˙ ( t ) q ˙ ( t )( h( t )C ) ]= d dt ( h( t )C q( t ) )0,     t[ t 0 ,+ ).

对上述不等式 d dt ( h( t )C q( t ) )0 积分,则得 h( t ) C 1 ( 1+q( t ) ) C 1 >0 。根据锚函数 h( t ) 的定义(3.5),因此阻尼惯性梯度系统(3.1)的解的轨迹是有界的,定理3.1得证。

4. 与一介微分方程方法的对比分析

在本节中,将与Sun等[5]中的基于光滑二阶锥互补NR函数建立的神经网络模型进行理论条件比较(表1),进一步阐述阻尼惯性梯度系统与一阶微分方程方法的异同点。神经网络模型为一阶微分方程系统如下

{ dz( t ) dt =ρΦ( z( t ) ), z( t 0 )= z 0 . (4.1)

其中, ρ>0 为神经网络模型中的一个缩放因子。 Φ( z ) 表示为二阶锥约束优化问题(1.1)基于光滑二阶锥互补NR函数 φ NR ε 建立的KKT条件的光滑效益函数,与本文相同。对于系统稳定性的研究中,Sun等[5]要求 S( z ) 为非奇异的,则一阶微分方程系统(4.1)的平衡点为指数稳定的。

Table 1. Comparison of theoretical conditions

1. 理论条件对比

理论条件

一阶微分方程系统(4.1)

阻尼惯性梯度系统(3.1)

解集 argminΦ 非空

S( z ) 的非奇异性

JF( x * ) 为半正定的

argminΦ 是紧的

γ( t ) β( t ) 满足假设条件 H γ,β

在本节,将用二阶微分方程系统(3.1)来求解二阶锥约束变分不等式问题,通过数值算例,对比阻尼惯性梯度系统(3.1)和一阶微分方程系统(4.1)解决相同的二阶锥约束变分不等式问题的区别。

4.1 考虑下面的二阶锥约束问题

F( x * ),y x * 0,yC

其中

C={ x 3 | g( x ) K 2 }

F( x ) g( x ) 如下定义

F( x )=( 2 x 1 +2 x 2 +0.004 x 1 3 8 2 x 2 + x 3 +0.007 x 2 3 6 2 x 1 + x 3 +0.005 x 3 3 4 )

g( x )=( x 1 + x 2 + x 3 2 2+ x 1 2 x 2 ).

该问题的唯一最优解为 x * = ( 1.0835,0.8262,0.5072 ) T

表2给出了求解例4.1中的一阶微分方程系统(4.1)和阻尼惯性梯度系统(3.1)的到达平衡点所需的CPU时间(s)和数值计算对比结果。

Table 2. Comparison of numerical results for example 4.1

2. 例4.1的数值结果对比

4.1的一阶微分方程系统(4.1)

4.1的阻尼惯性梯度系统(3.1)

CPU时间(s)

0.076345

1.003143

数值结果

( 1.0835 0.8262 0.5072 )

( 1.0835, 0.8262, 0.5072 )

5. 小结

本研究围绕二阶锥约束变分不等式的问题展开,通过一系列转化和分析,取得了多方面成果。研究将二阶锥约束变分不等式问题转化为广义方程,借助KKT条件与光滑化的NR二阶锥互补函数,将其等价转化为无约束优化问题,搭建起从复杂约束问题到无约束优化求解的桥梁,为后续求解提供了便利。基于无约束优化问题,构造阻尼惯性梯度系统。在特定的阻尼系数、时间尺度系数条件及增长条件下,证明该系统解的轨迹收敛速度满足一定关系,且轨迹有界。这不仅揭示了系统在求解过程中的动态特性,也为算法设计提供了理论支撑,确保求解过程的有效性和可靠性。将阻尼惯性梯度系统方法与已有的神经网络的一阶微分方程方法在理论条件与数值计算两个方面做了对比。在理论条件方面,阻尼惯性梯度系统所需条件更弱,但是在数值算例的比较过程中,计算速度要稍差一些,但是相差不是特别大。

基金项目

沈阳航空航天大学2025年大学生创新创业项目,编号D202410271723581175。

参考文献

[1] Nazemi, A. and Sabeghi, A. (2020) A New Neural Network Framework for Solving Convex Second-Order Cone Constrained Variational Inequality Problems with an Application in Multi-Finger Robot Hands. Journal of Experimental & Theoretical Artificial Intelligence, 32, 181-203.
https://doi.org/10.1080/0952813x.2019.1647559
[2] Nazemi, A. and Sabeghi, A. (2019) A Novel Gradient-Based Neural Network for Solving Convex Second-Order Cone Constrained Variational Inequality Problems. Journal of Computational and Applied Mathematics, 347, 343-356.
https://doi.org/10.1016/j.cam.2018.08.030
[3] Sun, J., Chen, J. and Ko, C. (2012) Neural Networks for Solving Second-Order Cone Constrained Variational Inequality Problem. Computational Optimization and Applications, 51, 623-648.
https://doi.org/10.1007/s10589-010-9359-x
[4] Sun, J. and Zhang, L. (2009) A Globally Convergent Method Based on Fischer-Burmeister Operators for Solving Second-Order Cone Constrained Variational Inequality Problems. Computers & Mathematics with Applications, 58, 1936-1946.
https://doi.org/10.1016/j.camwa.2009.07.084
[5] Sun, J., Fu, W., Alcantara, J.H. and Chen, J. (2021) A Neural Network Based on the Metric Projector for Solving SOCCVI Problem. IEEE Transactions on Neural Networks and Learning Systems, 32, 2886-2900.
https://doi.org/10.1109/tnnls.2020.3008661
[6] Attouch, H., Chbani, Z. and Riahi, H. (2019) Fast Proximal Methods via Time Scaling of Damped Inertial Dynamics. SIAM Journal on Optimization, 29, 2227-2256.
https://doi.org/10.1137/18m1230207
[7] Attouch, H. and Cabot, A. (2017) Asymptotic Stabilization of Inertial Gradient Dynamics with Time-Dependent Viscosity. Journal of Differential Equations, 263, 5412-5458.
https://doi.org/10.1016/j.jde.2017.06.024
[8] Attouch, H., Chbani, Z., Peypouquet, J. and Redont, P. (2018) Fast Convergence of Inertial Dynamics and Algorithms with Asymptotic Vanishing Viscosity. Mathematical Programming, 168, 123-175.
https://doi.org/10.1007/s10107-016-0992-8
[9] Attouch, H. and Peypouquet, J. (2019) Convergence Rate of Proximal Inertial Algorithms Associated with Moreau Envelopes of Convex Functions. In: Bauschke, H., Burachik, R. and Luke, D., Eds., Splitting Algorithms, Modern Operator Theory, and Applications, Springer International Publishing, 1-44.
https://doi.org/10.1007/978-3-030-25939-6_1
[10] 贾丹娜. 二阶锥约束变分不等式问题的微分方程方法研究[D]: [硕士学位论文]. 沈阳: 沈阳航空航天大学, 2024.