基数约束优化问题的内罚函数法
An Interior Penalty Algorithm for Cardinality-Constrained Optimization Problems
DOI: 10.12677/AAM.2024.131003, PDF, HTML, XML, 下载: 67  浏览: 126 
作者: 吴 霜*, 王雪纯:辽宁师范大学数学学院,辽宁 大连
关键词: 基数约束内罚函数法约束规范稳定性Cardinality Constraints Interior Penalty Method Constraint Qualification Stationarity
摘要: 基数约束优化问题是一类重要的优化问题,这类问题在很多领域都有着广泛的应用。由于其具有较难处理的基数约束,所以对基数约束优化问题的算法研究较少。本文将介绍基数约束优化问题的内罚函数法,并证明了该算法产生点列收敛到AM-稳定点。进一步证明在AM-正则性条件下,可以得到基数约束优化问题的M-稳定点。
Abstract: The cardinality-constrained optimization problems are an important class of optimization problems which have been applied in many fields. Due to the special structure of the cardinality constraints, there are few researches on the algorithm of cardinality-constraint optimization problems. We in-troduce an interior penalty algorithm for cardinality-constrained optimization problems and prove that the algorithm reaches an approximate Mordukhovich stationary. Furthermore, under the AM-regularity condition, we can obtain the Mordukhovich stationary of cardinality-constrained op-timization problems.
文章引用:吴霜, 王雪纯. 基数约束优化问题的内罚函数法[J]. 应用数学进展, 2024, 13(1): 21-28. https://doi.org/10.12677/AAM.2024.131003

1. 引言

本文主要研究基数约束(cardinality-constrained,简称CC)优化问题,具体形式如下

min f ( x ) s .t . g ( x ) 0 , h ( x ) = 0 , x 0 κ , (1.1)

其中, κ 是整数且 κ < n f : R n R , g : R n R m , h : R n R p 是连续可微的。 x 0 表示x的基数,但 0 不是范数,它既不是连续的也不是凸的。

为了处理难于求解的基数约束优化问题,可以将它改写为连续优化问题 [1]

min f ( x ) s . t . g ( x ) 0 , h ( x ) = 0 , x y = 0 , n κ e T y 0 , 0 y e , (1.2)

其中, 表示哈达玛积, e = ( 1 , , 1 ) T R n ,这个问题被称为(1.1)的松弛问题。问题(1.1)和(1.2)在全局最优解的意义下是等价的,即问题(1.1)的全局最优解对应于问题(1.2)的全局最优解,并且如果 x 是问题(1.1)的局部最优解,则每个可行点 ( x , y ) 是问题(1.2)的局部最优解 [1] 。

近年来,基数约束优化问题因其在投资组合 [2] 、统计回归 [3] 等领域的广泛应用而备受关注,并有大量学者尝试从不同角度解决这些问题 [4] [5] 。由于基数约束的特殊结构,往往不能直接应用标准非线性规划的理论和算法直接处理基数约束优化问题。2016年Burdakov O. P.等人 [1] 提出了正则方法并证明其能收敛到M-稳定点。2021年Kanzow C.等人 [6] 介绍了另一种正则方法以及拉格朗日方法,这两种算法都能收敛到AM-稳定点。2022年Xue Menglong等人 [7] 提出了带有安全域的增广拉格朗日方法并证明其能收敛到PCAM-稳定点。本文主要研究基数约束优化问题的求解方法,将求解MPCC问题的内罚函数法推广至基数约束优化问题,并对算法进行收敛性分析,证明了在较弱的条件下可得到CC-AM-稳定点,若还满足较弱的约束规范,则我们可得到CC-M-稳定点。

本文基本结构如下:第二章介绍一些用到的基本知识,第三章介绍基数约束优化问题的内罚函数法,第四章证明内罚函数法的收敛性结果,第五章给出最后的总结。

2. 基础知识

为了更好地呈现松弛的基数约束问题(1.2),引入函数 θ : R n R G , H , H ˜ : R n R n ,分别为

θ ( y ) = n κ e T y , G ( x ) = x , H ( y ) = y , H ˜ ( y ) = y e ,

则松弛的基数约束优化问题(1.2)可以改写为

min f ( x ) s . t . g ( x ) 0 , h ( x ) = 0 , θ ( y ) 0 , H ( y ) 0 , H ˜ ( y ) 0 , G ( x ) H ( y ) = 0. (2.1)

由 [8] 可知,松弛问题(2.1)每个可行点都是AKKT点,根据这个结果可为这类问题定义近似条件。为此,考虑松弛问题(2.1)的拉格朗日函数

L ( x , y , λ g , λ h , λ θ , λ G , λ H , λ H ˜ ) = f ( x ) + ( λ g ) T g ( x ) + ( λ h ) T h ( x ) + ( λ G ) T G ( x ) + λ θ θ ( y ) + ( λ H ) T H ( y ) + ( λ H ˜ ) T H ˜ ( y )

以及

x , y L ( x , y , λ g , λ h , λ θ , λ G , λ H , λ H ˜ ) = ( f ( x ) + g ( x ) λ g + h ( x ) λ h + G ( x ) λ G θ ( y ) λ θ + H ( y ) λ H + H ˜ ( y ) λ H ˜ ) .

对于松弛问题(2.1)可行域内任意点 ( x , y ) ,我们定义如下指标集

I = { i { 1 , , n } : H i ( y ) = 0 , G i ( x ) 0 } , J = { i { 1 , , n } : H i ( y ) = 0 , G i ( x ) = 0 } , M = { i { 1 , , n } : H i ( y ) < 0 , G i ( x ) = 0 } .

定义2.1 [8] (AW-稳定点)令 ( x , y ) 是松弛问题(2.1)的可行点,则 ( x , y ) 是该问题的近似弱稳定点(AW-稳定点),如果存在 ( x k , y k ) R n × R n ( λ k ) = ( λ g , k , λ h , k , λ θ , k , λ G , k , λ H , k , λ H ˜ , k ) R + m × R p × R + × R n × R n × R + n

使得 ( x k , y k ) ( x , y )

1) x , y L ( x k , y k , λ k ) 0

2) min { g ( x k ) , λ g , k } 0

3) min { θ ( y k ) , λ θ , k } 0

4) min { | G i ( x k ) | , | λ i G , k | } 0 i = 1 , , n

5) min { H i ( y k ) , | λ i H , k | } 0 i = 1 , , n

6) min { H ˜ ( y k ) , λ H ˜ , k } 0

为了更好的定义稳定点结果,我们首先给出一些常用指标集:

I g ( x ) = { i : g i ( x ) = 0 } , I 0 ( x ) = { i : x i = 0 } , I ± ( x ) = { i : x i 0 } .

定义2.2 [6] (CC-M-稳定点)令 x 是问题(1.1)的可行点,称 x 是基数约束优化问题的M-稳定点(CC-M-稳定点),如果存在乘子 λ g R m , λ h R p λ G R n 使得下列条件成立

1) 0 = f ( x ) + g ( x ) λ g + h ( x ) λ h + λ G

2) λ i g = 0 i I g ( x ) λ i G = 0 i I ± ( x )

定义2.3 [6] (CC-AM-稳定点)令 x 是问题(1.1)的可行点,称 x 是基数约束优化问题的近似M-稳定点(CC-AM-稳定点),如果存在序列 { x k } R n , { λ g , k } R + m , { λ h , k } R p , { λ G , k } R n 使得 { x k } x

1) { f ( x k ) + g ( x k ) λ g , k + h ( x k ) λ h , k + λ G , k } 0

2) λ i g , k = 0 i I g ( x ) λ i G , k = 0 i I ± ( x )

定义2.4 [9] (外半连续)称集值映射 S : R n R m x 处是外半连续的,如果

lim sup x x S ( x ) S ( x ) .

为了给出约束规范的定义,我们先给出和定义中用到的锥的具体形式。令 x R n 是问题(1.1)的可行点,则对于任意 x R n

K x ( x ) = { g ( x ) λ g + h ( x ) λ h + λ G | ( λ g , λ h , λ G ) R + m × R p × R n , λ i g = 0 i I g ( x ) , λ i G = 0 i I ± ( x ) } .

值得注意的是,指标集 I g ( x ) I ± ( x ) 依赖的是 x 而不是x。

定义2.4 [6] (CC-AM-正则性) 问题(1.1)的可行点 x 满足CC-AM-正则性条件,如果下述条件成立

lim sup x x K x ( x ) K x ( x ) .

3. 基数约束优化问题的内罚函数法

为了避免 G ( x ) H ( y ) = 0 带来的困难,我们用 l 1 -罚问题 [10] 来代替松弛问题(2.1)

min f ( x ) + i = 1 n γ i G i ( x ) H i ( y ) s .t . g ( x ) 0 , h ( x ) = 0 , θ ( y ) 0 , H ( y ) 0 , H ˜ ( y ) 0 , (3.1)

其中, γ = ( γ 1 , , γ n ) + n 是惩罚参数。因为问题(3.1)是光滑的,我们可以应用标准的非线性规划的算法来解决它,比如内部方法。通过引入松弛变量 s , t , v ,问题(3.1)可以改写为如下问题

min f ( x ) + i = 1 n γ i G i ( x ) H i ( y ) s .t . g i ( x ) + s i = 0 , s i > 0 , i = 1 , , m , h i ( x ) = 0 , i = 1 , , p , θ ( y ) + t = 0 , t > 0 , H i ( y ) 0 , i = 1 , , n , H ˜ i ( y ) + v i = 0 , v i > 0 , i = 1 , , n .

上述问题的罚问题是

min f ( x ) + i = 1 n γ i G i ( x ) H i ( y ) μ i = 1 m ln s i μ ln t μ i = 1 n ln v i μ i = 1 n ln ( H i ( y ) ) s .t . g i ( x ) + s i = 0 , i = 1 , , m , h i ( x ) = 0 , i = 1 , , p , θ ( y ) + t = 0 , H ˜ i ( y ) + v i = 0 , i = 1 , , n , (3.2)

其中, μ > 0 是障碍参数。问题(3.2)的拉格朗日函数为

L ( x , y , s , t , v , γ , μ , λ h , λ g , λ θ , λ H ˜ ) = f ( x ) + γ G ( x ) H ( y ) μ i = 1 m ln s i μ ln t μ i = 1 n ln v i μ i = 1 n ln ( H i ( y ) ) + i = 1 m λ i g ( g i ( x ) + s i ) + i = 1 p λ i h h i ( x ) + λ θ ( θ ( y ) + t ) + i = 1 n λ i H ˜ ( H ˜ i ( y ) + v i ) , (3.3)

问题(3.2)的一阶KKT条件可以写为

f ( x ) + g ( x ) λ g + h ( x ) λ h + G ( x ) ( γ H ( y ) ) = 0 , θ ( y ) λ θ + H ˜ ( y ) λ H ˜ + H ( y ) ( γ G ( x ) μ H ( y ) ) = 0 , s i λ i g μ = 0 , i = 1 , , m , t λ θ μ = 0 ,

v i λ i H ˜ μ = 0 , i = 1 , , n , g i ( x ) + s i = 0 , i = 1 , , m , h i ( x ) = 0 , i = 1 , , p , θ ( y ) + t = 0 , H ˜ i ( y ) + v i = 0 , i = 1 , , n . (3.4)

定义 λ G = γ H ( y ) , λ H = γ G ( x ) μ H ( y ) , λ = ( λ g , λ h , λ θ , λ G , λ H , λ H ˜ ) ,e是一个适当维数的向量,S表示对角线上是s的对角矩阵,对 T , V 有相同的定义方式。

KKT条件(3.4)可以简洁地表示为

x , y L ( x , y , s , t , v , γ , μ , λ ) = 0 , (3.5a)

S λ g μ e = 0 , T λ θ μ e = 0 , V λ H ˜ μ e = 0 , (3.5b)

c ( x , y , s , t , v ) = 0 , (3.5c)

其中,

c ( x , y , s , t , v ) = ( g ( x ) + s h ( x ) θ ( y ) + t H ˜ ( y ) + v ) . (3.6)

在下面将介绍基数约束优化问题基于 l 1 -惩罚公式的内部方法。在算法以及后文中, 表示无穷范数。

算法1. 基数约束优化问题的内罚函数法

除了要求近似满足边界问题的最优性条件(3.7)外,我们还通过(3.8)对 G ( x ) H ( y ) = 0 进行了刻画。目前,对序列 { μ k } { ε p e n k } , { ε c o m p k } 的要求是当 k 时它们都收敛到0。

在(3.8)中使用 min { H ( y k ) , | G ( x k ) | } 作为互补性的度量 [10] ,而不是 G ( x k ) H ( y k ) ,是因为它对问题的规模不敏感且与变量的数量无关。而且,即使当 G i ( x k ) H i ( y k ) 都收敛到0时,该度量也是准确的。

算法I的公式足够通用,以允许在步骤2中对惩罚参数进行各种更新策略。一种方法是选择 μ k 并用 γ k = γ k 1 求解(3.2),直到满足条件(3.7)。如果条件(3.8)也成立,那么我们进入步骤3,否则,增加 γ k 并使用相同的障碍参数 μ k 再次求解(3.2)。如果有必要,重复该过程,直到(3.8)被满足。

4. 内罚函数法的收敛性分析

本章将介绍内罚函数法的全局收敛性分析。已经提出了许多算法来解决步骤2中的问题,例如文献 [11] 和其中的参考文献。众所周知,这些内部方法可能无法满足(3.7),因此算法I可能无法完成步骤2。对内部方法的分析超过了本文的范围,我们假设内部方法总是成功的,并且算法I生成一个满足条件(3.7)和(3.8)的无限迭代序列 { x k , y k , s k , t k , v k , γ k , μ k , λ k } 。下面定理将证明算法I的收敛性结果。

定理4.1假设序列 { ε p e n k } , { ε c o m p k } , { μ k } 都收敛到0,算法I生成一个迭代序列 { x k , y k , s k , t k , v k , γ k , μ k , λ k } ,满足条件(3.7)和(3.8)。如果 ( x , y ) 是序列 { ( x k , y k ) } 的极限点,则 ( x , y ) 是松弛问题(2.1)的可行点。如果还满足 ε c o m p k = ο ( max { γ i k } 1 ) ,则 x 是问题(1.1)的CC-AM-稳定点。

证明:设 ( x , y ) 是算法I生成的序列 { ( x k , y k ) } 的一个极限点,令K是一个无限指标集使得 { ( x k , y k ) } k K ( x , y ) ,则对充分大的k有 ( x k , y k ) U ( x , y ) 。由于算法第2步保证了松弛变量 s k , t k , v k 是正的,再根据 g ( x k ) , h ( x k ) , θ ( y k ) , H ˜ ( y k ) 的连续性,条件(3.7c)和 ε p e n k 0 可得

g i ( x ) = s i 0 , i = 1 , , m , h i ( x ) = 0 , i = 1 , , p , θ ( y ) = t 0 , H ˜ i ( y ) = v i 0 , i = 1 , , n ,

其中, s i = lim k K s i k , t = lim k K t k , v i = lim k K v i k 。由 H ( y k ) 的连续性以及算法I要求 H ( y k ) > 0 ,当 k 时可以得到 H ( y k ) H ( y ) 0 。根据(3.8)和 ε c o m p k 0 直接可得 G ( x ) H ( y ) = 0 。因此, ( x , y ) 是松弛问题(2.1)的可行点。

根据(3.7a)可得 x , y L ( x k , y k , s k , t k , v k , γ k , μ k , λ k ) 0 。由(3.7c)可得 g ( x ) = s 0 ,由(3.7b)可得 ( λ g ) T s = 0 ,则 ( λ g ) T ( g ( x ) ) = 0 ,同时 λ g , k > 0 ,所以 min { g ( x k ) , λ g , k } 0 。同理可得 min { θ ( y k ) , λ θ , k } 0 min { H ˜ ( y k ) , λ H ˜ , k } 0

i M ,可知 H i ( y ) < 0 G i ( x ) = 0 ,当k充分大可得 G i ( x k ) 0 ,由(3.8)知 min { H i ( y k ) , | G i ( x k ) | } = | G i ( x k ) | ε c o m p k ,所以 γ i k G i ( x k ) 0 ,由 λ i H , k 定义可知 | λ i H , k | 0 。若 i I J ,可得 H i ( y ) = 0 H i ( y k ) 0 。两种情况都满足 min { H i ( y k ) , | λ i H , k | } 0 i = 1 , , n

i I ,可知 G i ( x ) 0 H i ( y ) = 0 ,当k充分大可得 | G i ( x k ) | > 0 H i ( y k ) 0 ,由(3.8)知 min { H i ( y k ) , | G i ( x k ) | } = H i ( y k ) ε c o m p k ,所以 γ i k H i ( y k ) 0 ,由 λ i G , k 定义可知 | λ i G , k | 0 。若 i J M ,可得 G i ( x ) = 0 | G i ( x k ) | 0 。两种情况都满足 min { | G i ( x k ) | , | λ i G , k | } 0 i = 1 , , n

因此, ( x , y ) 是松弛问题(2.1)的AW-稳定点。根据文献 [1] 可知, ( x , y ) R n × R n 是松弛问题(2.1)的可行点意味着 x 是问题(1.1)的可行点。由文献 [6] 定理A.3可知,若 ( x , y ) R n × R n 是松弛问题(2.1)的可行点,并且是松弛问题(2.1)的AW-稳定点,则 x 是问题(1.1)的CC-AM-稳定点。□

结合上述定理,在CC-AM-正则性条件下,我们可以得到如下推论。

推论4.2 假设 ( x , y ) 是由算法I生成的序列 { ( x k , y k ) } 的极限点,并且满足定理4.1的条件,若CC-AM-正则性在 x 处成立,则 x 是问题(1.1)的CC-M-稳定点。

证明:若 ( x , y ) 是由算法I生成的序列 { ( x k , y k ) } 的极限点,并且满足定理4.1的条件,则 x 是问题(1.1)的CC-AM-稳定点。由文献 [6] 定理4.7可知,若 x 是问题(1.1)的CC-AM-稳定点,结合CC-AM-正则性条件,则 x 是问题(1.1)的CC-M-稳定点。□

5. 总结

本文主要研究了基数约束优化问题的内罚函数法,并对算法进行了收敛性分析,证明了在某些条件下内罚函数法产生的点列收敛到CC-AM-稳定点。进一步,在CC-AM-正则性条件下,可以得到基数约束优化问题的CC-M-稳定点,因此得到了求解基数约束优化问题的有效算法。

NOTES

*通讯作者。

参考文献

[1] Burdakov, O.P., Kanzow, C. and Schwartz, A. (2016) Mathematical Programs with Cardinality Constraints: Reformula-tion by Complementarity-Type Conditions and a Regularization Method. SIAM Journal on Optimization, 26, 397-425.
https://doi.org/10.1137/140978077
[2] Bertsimas, D. and Shioda, R. (2009) Algorithm for Cardinali-ty-Constrained Quadratic Optimization. Computational Optimization and Applications, 43, 1-22.
https://doi.org/10.1007/s10589-007-9126-9
[3] Dong, H., Ahn, M. and Pang, J.S. (2019) Structural Properties of Affine Sparsity Constraints. Mathematical Programming, 176, 95-135.
https://doi.org/10.1007/s10107-018-1283-3
[4] Krulikovski, M.H.E., Ribeiro, A.A. and Sachine, M. (2021) On the Weak Stationarity Conditions for Mathematical Programs with Cardinality Constraints: A Unified Approach. Applied Mathematics & Optimization, 84, 3451-3473.
https://doi.org/10.1007/s00245-021-09752-0
[5] Kanzow, C., Raharja, B.A. and Schwartz, A. (2021) An Aug-mented Lagrangian Method for Cardinality-Constrained Optimization Problems. Journal of Optimization Theory and Ap-plications, 189, 793-813.
https://doi.org/10.1007/s10957-021-01854-7
[6] Kanzow, C., Raharja, A.B. and Schwartz, A. (2021) Sequential Optimality Conditions for Cardinality-Constrained Optimization Problems with Applications. Computational Optimiza-tion and Applications, 80, 185-211.
https://doi.org/10.1007/s10589-021-00298-z
[7] Xue, M.L. and Pang, L.P. (2022) A Strong Sequential Optimality Condition for Cardinality-Constrained Optimization Problems. Numerical Algorithms, 92, 1875-1904.
https://doi.org/10.1007/s11075-022-01371-2
[8] Ribeiro, A.A., Sachine, M. and Krulikovski, E.H.M. (2022) A Comparative Study of Sequential Optimality Conditions for Mathematical Programs with Cardinality Constraints. Journal of Optimization Theory and Applications, 192, 1067-1083.
https://doi.org/10.1007/s10957-022-02007-0
[9] Rockafellar, R.T. and Wets, J.B. (2009) Variational Analysis. Springer-Verlag, Berlin.
[10] Leyffer, S., López-Calva, G. and Nocedal, J. (2006) Interior Methods for Mathematical Programs with Complementarity Constraints. SIAM Journal on Optimization, 17, 52-77.
https://doi.org/10.1137/040621065
[11] Forsgren, A., Gill, P.E. and Wright, M.H. (2002) Interior Methods for Nonlinear Optimization. SIAM Review, 44, 525-597.
https://doi.org/10.1137/S0036144502414942