半定锥约束变分不等式的二阶充分性条件
Second-Order Sufficient Conditions for Semi-Definite Constrained Variational Inequalities
摘要: 半定锥约束变分不等式问题是目前研究热门话题——锥约束变分不等式问题的其中一部分,在优化理论、经济学和工程应用中具有重要意义。在本文中,我们给出了半定锥约束变分不等式问题的二阶充分性条件。我们首先回顾了变分不等式的基本理论概念及其在半定锥约束下的具体形式,然后通过构造相应的拉格朗日函数,将问题的解与二阶充分性条件关联起来,最后我们给出了相关定理的具体内容及其证明,确保在给定约束条件下解的存在性与最优性。
Abstract: The semi-definite cone-constrained variational inequality problem is currently a hot topic of research and is a part of the broader cone-constrained variational inequality issues, which hold significant importance in optimization theory, economics, and engineering applications. In this paper, we present the second-order sufficient conditions for the semi-definite cone-constrained variational inequality problem. We first review the fundamental theoretical concepts of variational inequalities and their specific forms under semi-definite cone constraints. Then, by constructing the corresponding Lagrangian function, we establish a connection between the solutions of the problem and the second-order sufficient conditions. Finally, we provide the specific content and proof of the relevant theorems to ensure the existence and optimality of the solutions under the given constraints.
文章引用:卢丹, 张杰, 刘书宇. 半定锥约束变分不等式的二阶充分性条件[J]. 应用数学进展, 2024, 13(11): 4933-4938. https://doi.org/10.12677/aam.2024.1311475

1. 引言

变分不等式(Variational Inequalities, VI)是一类重要的数学问题,自20世纪60年代起,Lions、Browder、Stampacchia、KyFan、Lemke、Cottle和Dantzing等人提出并创立变分不等式问题及其相关基本理论,此后经过许多数学家所进行的杰出工作,使变分不等式问题的相关理论取得了重要发展,并广泛应用于博弈论、金融学和力学等许多领域。随着半定编程的发展,研究者们开始关注涉及半定约束的变分不等式问题,根据中国运筹学会编著[1]一文,上个世纪九十年代,二阶锥规划和半定规划成为国际优化领域的主要研究热点之一。这表明了半定锥约束变分不等式问题在那个时期开始受到广泛关注。进一步地,[2]一文详细介绍了半定规划的发展与研究现状、基本理论、相关算法以及变分不等式问题的相关知识与投影类算法。文章还提到,在半定规划问题满足严格可行的约束条件下,利用得到的KKT条件,将求解半定规划问题等价地转化为求解变分不等式问题。这说明了半定锥约束变分不等式问题的研究不仅涉及理论基础,还包括具体的算法实现。这些研究内容进一步丰富了半定锥约束变分不等式问题的算法研究领域。综上所述,半定锥约束变分不等式问题的发展历程可以追溯到上个世纪九十年代,并且在随后的研究中,不仅涉及了理论基础的探讨,还包括了多种算法的开发和应用。这些研究为解决实际问题提供了重要的理论和技术支持。

本文旨在研究半定锥约束变分不等式问题的二阶充分性条件,这是因为在解决这类问题时,我们常常需要考虑解的性质,尤其是在最优性条件的研究中。二阶充分性条件为我们提供了一种更为严格的解的性质判定方式,尤其是在存在多重解的情形下。二阶充分性条件能够有效地帮助我们筛选处真正的最优解。因此,本文旨在研究半定锥约束变分不等式问题的二阶充分性条件具有重要的理论意义和应用价值。

2. 预备知识

2.1. 半定锥约束变分不等式问题

S p 表示 p×p 阶的实对称矩阵空间,在 S p 中定义内积 A,B =Tr( AB ),A,B S p ,此内积引导的范数即Frobenius范数 A = ( i=1 n j=1 n a ij 2 ) 1/2 。用 S + p 表示 p×p 阶的对称半正定矩阵构成的锥,记 S p 表示 p×p 阶的对称半负定矩阵构成的锥,可以验证: S p = S + p

非线性半定规划问题: min xQ f( x ) s.t.G( x ) S + p ,其中 f: R n R 是实值函数, G: R n S p 是一矩阵值函数, Q R n 是一闭凸集。

基于上述描述,我们可定义SDCCVI问题。

定义2.1 半定锥约束变分不等式问题(SDCCVIP):给定一个映射 F: R n R n ,对于给定的子集 C 与半定锥 S + p ,要找到一点 xC ,使得对 yC ,满足 F( x ),yx0 ,其中 C={ x R n |G( x ) S + P }

2.2. 切锥与二阶切锥

定义2.2 本文用 T S + p ( x * )={ S p , ifxint S + p S + p , ifx=0 { w, x * 0|w S p }, ifx bd S + p \{ 0 } 来描述 S + p x * S + p 处的切锥;用 T S + p 2 ( x * ,d )={ S p , ifx T S + p ( x * ) T S + p ( x * ), ifx=0 { w,d d 2 |w S p }, otherwise = T 2 来描述 S + p x * S + p 处沿方向d的二阶切锥。见[3] [4]

2.3. 二阶正则

定义2.3.1 称集合K在点 yK 沿方向 d T k ( y ) 关于线性映射 M:XY 是二阶正则的:

若对任何具有下述形式的 y n K: y n =y+ t n d+ 1 2 t n 2 r n ,其中 t n 0 r n =M w n + a n ,其中 { a n } Y中的收敛序列, { w n } X中的满足 t n w n 0 的序列,则下述条件成立: lim n d( r n , T S + p 2 ( y,d ) )=0 。见[3]

3. 二阶充分性条件定理及其证明

接下来我们来描述SDCCVI问题的二阶充分性条件定理及其证明,该证明同Sun在[4]中定理2类似。

给出定理之前,补充以下定义。

定义3.1 x * S + P 的距离: dist( x * , S + p ):=inf{ x * y ,y S + P }

定义3.2 支撑函数:记 σ( x,C )=max{ x,v :vC } 为集合C的支撑函数。

定义3.3 本文用 ( x * ) 记作满足kkt条件的Lagrange乘子,将 t n 0 表示 { t n } 是单调递减趋于0的序列。

定义3.4 x * 处的临界锥与极限法锥: C( x * )={ d|d T C ( x * ),dF( x * ) } N S + P ( x * ):= limsup x S + p x * N ^ S + p ( x ) ,其中 N ^ S + p ( x * ):={ v S p | v,y x * ο( y x * ),y S + p }

定理3.1 x * 为SDCCVI的一个可行解, Λ( x * )={ λ } 是非空且紧的,若 JF( x * ) 正半定且 0int{ G( x * )+JG( x * ) R n S + p } ,则 sup λN( x * ) { J x L( x * ,λ )d,d + d T H( x * ,λ )d }0,dC( x * )\{ 0 } 为SDCCVI的二阶充分性条件。

其中 是Kronecker积, H( x * ,λ )=2 ( G( x * ) x ) T ( λG ( x * ) T )( G ( x * ) T x ) G( x * ) x P 2 ×n Jacobi矩阵, G( x * ) x :=[ vec G 1 ( x * ),,vec G n ( x * ) ] G i ( x * )= G( x * ) x i vec( A ) 记由A的列拉直得到的向量。

证明

x * 是问题SDCCVI的一个可行解,由 JF( x * ) 正半定的,则存在 ε>0 使得 F( x * ),x x * 0 x Β ε ( x * )C ,其中 Β ε ( x * ) x * ε 邻域。

这等价于

xargmin{ F( x * ),x x * |x Β ε ( x * )C } (1)

由于 JF( x * ) 正半定则

(1)成立当且仅当

xargmin{ F( x * ),x x * +JF( x * )( x x * ),( x x * )|x Β ε ( x * )C } (2)

成立。

考虑这样的一个优化问题

{ min F( x * ),x x * + 1 2 JF( x * )( x x * ),x x * s.t. x Β ε ( x * )C (3)

显然

x * 为(3)的稳定点当且仅当

0F( x * )+JF( x * )( x x * )+ N Β ε ( x * )C( x * ) (4)

其中

N Β ε ( x * )C( x * ) = N Β ε ( x * ) ( x * )+ N C( x * ) = N C( x * ) (5)

由(4)和(5)知 0F( x * )+ N C ( x * )

因此当 x * 为SDCCVI问题的可行解时, x * 也是(3)的稳定点。

接下来考虑(3)的临界锥 C p ( x * ) 与SDCCVI的临界锥 C( x * ) 之间的关系:事实上 C( x * )= C p ( x * )

这是因为

C p ( x * )={ d R n |( JG( x * )d d ) T S + p × Β ε ( x * ) ( G( x * ), x * ), d,F( x * )+JF( x * )( x x * ) =0 }

T S + p × Β ε ( x * ) ( G( x * ), x * )= T S + p ( G( x * ) )× T Β ε ( x * ) ( x * )= T S + p ( G( x * ) )× R n

因此 C p ( x * )={ d R n |( JG( x * )d ) T S + p ( G( x * ) ), d,F( x * ) =0 }=C( x * )

易知(3)的Lagrange函数为

L( x * ,λ,μ )= F( x * ),x x * + 1 2 JF( x * )( x x * ),x x * + G( x ),λ + x,μ

x L( x * ,λ,μ )=F( x * )+JF( x * )( x x * )+JG( x * )λ+μ

xx L( x * ,λ )=JF( x * )+ J x G( x * )λ ,此处记 xx L( x * ,λ )= J x L( x * ,λ )

S + p G( x * ) 沿着 JG( x * )d 方向对于映射 JG( x * ),dC( x * ) 是二阶正则的,

这是因为利用二阶正则性定义

y n =G( x * )+ t n ( JG( x * )d )+ 1 2 t n 2 r n , y n S + p

其中 t n 0 r n =JG( x * ) w n + a n a n 为一收敛序列以及 t n w n 0( n+ ) 使得 lim n dist( r n , T S + p 2 ( G( x * ),JG( x * )d ) )=0

基于以上所述,知对于 P n S + p × Β ε ( x * ) P n =( G( x * ) x * )+ t n ( JG( x * )d d )+ 1 2 t n 2 ( r n q n )

其中 ( r n q n )=( JG( x * ) w n w n )+( a n b n ) ( a n b n ) 是一个收敛序列以及 t n w n 0( n+ )

因此我们得到

lim n dist( r n , T S + p 2 ( G( x * ),JG( x * )d ) )=0

lim n dist( ( r n q n ), T S + p × Β ε ( x * ) 2 ( ( G( x * ), x * )( JG( x * )d,d ) ) ) = lim n dist( ( r n q n ), T S + p 2 ( G( x * ),JG( x * )d )× T Β ε ( x * ) 2 ( x * ,d ) ) = lim n dist( r n , T S + p 2 ( G( x * ),JG( x * )d ) )=0.

因此 S + p G( x * ) 沿着 JG( x * )d 方向对于映射 JG( x * ),dC( x * ) 是二阶正则的。

因此 sup λ( x * ) { xx 2 L( x * ,λ ) δ * ×( ( λ,μ ), T S + p × Β ε ( x * ) 2 ( G( x * ), x * ),( JG( x * )d,d ) }>0,d C p ( x * )\{ 0 }

我们可以进一步化简

sup λ( x * ) { xx 2 L( x * ,λ )( d,d ) δ * ×( ( λ,μ ), T S + p × Β ε ( x * ) 2 ( G( x * ), x * ),( JG( x * )d,d ) } = sup λ( x * ) { xx 2 L( x * ,λ )( d,d ) δ * ×( ( λ,μ ), T S + p 2 ( G( x * ),JG( x * )d )× T Β ε ( x * ) 2 ( x * ,d ) } = sup λ( x * ) { xx 2 L( x * ,λ )( d,d ) δ * ×( ( λ,μ ), T S + p 2 ( G( x * ),JG( x * )d× R n ) } = sup λ( x * ) { J x L( x * ,λ )( d,d ) δ * ( λ| T S + p 2 ( G( x * )+JG( x * )d ) ) }.

综上所述,SDCCVI问题的二阶充分性条件为

sup λ( x * ) { J x L( x * ,λ )( d,d ) δ * ( λ| T S + p 2 ( G( x * )+JG( x * )d ) ) },dC( x * )\{ 0 }

sup λN( x * ) { J x L( x * ,λ )d,d + d T H( x * ,λ )d }0,dC( x * )\{ 0 }

其中 H( x * ,λ )=2 ( G( x * ) x ) T ( λG ( x * ) T )( G ( x * ) T x ) G( x * ) x P 2 ×n Jacobi矩阵。

4. 结论

1) 重要性:本论文详细描述并证明了半定锥约束变分不等式二阶充分性条件定理及其相关证明,提供了一种有效的方法来验证该类问题局部最优解的性质。这在许多领域(如控制系统、资源分配、线性回归及金融投资组合优化)中尤为重要,能够帮助决策者在多维空间中找到最优解。

2) 先进性:本文结合拉格朗日乘数法和Hessian矩阵的分析为优化理论提供了坚实的基础。这种理论框架使得半定锥约束变分不等式问题的求解过程变得更加系统化、更方便。此外,论文中所涉及的数值分析与计算方法还能够帮助提高相关算法的收敛性与效率,对获得更加精确的数值解有重要意义。

3) 局限性:虽然二阶条件能有效判断局部最优性,但在某些特定情况下,如非凸问题中,仅依赖于此条件可能会导致无法找到全局最优解。因此,在实际应用中需结合其他方法一同使用,以确保结果的全局最优性。

致 谢

本人感谢我的导师张教授对本论文的指导,在研究过程中提供了宝贵的建议和支持,他严谨的治学态度和深厚的专业知识使我创作了这篇论文并收益颇丰。

参考文献

[1] 中国科学技术协会. 2012-2013运筹学学科发展报告[Z]. 2014.
[2] 秦淑英. 半定规划的两种投影类算法[D]: [硕士学位论文]. 呼和浩特: 内蒙古工业大学, 2015.
[3] 张立卫, 吴佳, 张艺. 变分分析与优化[M]. 北京: 科学出版社, 2013.
[4] Sun, J., Fu, W., Alcantara, J.H. and Chen, J. (2021) A Neural Network Based on the Metric Projector for Solving SOCCVI Problem. IEEE Transactions on Neural Networks and Learning Systems, 32, 2886-2900.
https://doi.org/10.1109/tnnls.2020.3008661