一类新的光滑化l1精确罚函数法
A New Smooth l1 Exact Penalty Function Methods
DOI: 10.12677/AAM.2023.125259, PDF, HTML, XML, 下载: 229  浏览: 350 
作者: 瞿小敏:长沙理工大学数学与统计学院,湖南 长沙
关键词: 约束优化问题精确罚函数法光滑罚函数Constrained Optimization Problem Accurate Penalty Function Method Smooth Penalty Function
摘要: 罚函数法是求解约束优化问题的一种经典方法,其基本思想是将约束优化问题转化为无约束优化问题进行求解。本文我们提出了一类新的具有二次连续可微性质的光滑化l1精确罚函数,并证明了相应罚函数算法的全局收敛性。此外,我们进行了数值实验,数值结果表明了该方法比较有效。
Abstract: Penalty function method is a classical method for solving constrained optimization problems. Its basic idea is to transform constrained optimization problem into constrained optimization problem for solving. In this article, we propose a new class of smoothing exact penalty function methods and prove their global convergence. In addition, we conducted numerical experiments, and the numer-ical results showed that the method is relatively effective.
文章引用:瞿小敏. 一类新的光滑化l1精确罚函数法[J]. 应用数学进展, 2023, 12(5): 2582-2592. https://doi.org/10.12677/AAM.2023.125259

1. 引言

罚函数法是求解约束优化问题的一种常用方法,其基本思想是:将约束条件转化为某种惩罚函数加到目标函数中去,从而将约束优化问题的求解转化为一系列无约束优化问题的求解。在一定条件下,如果罚问题的解是原问题的解或者原问题的解是罚问题的解,则称该罚函数为精确罚函数;如果罚函数中包含原问题的目标函数和约束函数而不包含它们的梯度,则称该罚函数为简单罚函数 [1] 。

本文考虑如下不等式约束优化问题:

( P ) min f ( x ) s .t . g i ( x ) 0 , i = 1 , , m , (1.1)

其中 f , g i : R n R i I = { 1 , 2 , , m } 是连续可微函数。记 X 0 = { x R n | g i ( x ) 0 , i = 1 , 2 , , m } ,则 X 0 是问题(P)的可行集。下面给出一些关于近似最优解的定义。

定义1.1 [2] 如果 x ε 是问题(P)的可行解, x * 是(P)的最优解,并且满足 | f ( x * ) f ( x ε ) | ε 。则称 x ε 是(P)的ε-近似最优解。

定义1.2 [2] 如果满足对 i I g i ( x ε ) ε ,则 x ε R n 是问题(P)的ε-可行解。

l 2 罚函数是一种经典常见的罚函数:

F 2 ( x , ρ ) = f ( x ) + ρ i I max { g i ( x ) , 0 } 2 .

l 2 罚函数是光滑但非精确的。1967年,Zangwill [3] 提出了经典 l 1 罚函数:

F 1 ( x , ρ ) = f ( x ) + ρ i I max { g i ( x ) , 0 } .

其相应无约束优化问题为

( P 1 ) min F 1 ( x , ρ ) s .t x R n .

l 1 罚函数是精确的,但是不可微 [5] ,因而不能有效应用求解光滑优化问题的算法进行求解,对 l 1 这样的非光滑罚函数进行光滑化是十分重要的。学者们对 l 1 精确罚函数采用各种光滑化函数进行光滑化处理,以达到光滑精确罚函数的效果。

1994年,Mustafa Ç [4] 提出了一个可以求解大规模问题的光滑化 l 1 罚函数。2012年,Lian [5] 提出了如下带有指数的光滑化 l 1 罚函数:

P ε ( t ) = { 3 ε 2 e t ε 2 ε , t 0 t ε 2 e t ε , t > 0.

2016年,Ahmet [6] 提出了带有一个参数的一类光滑化 l 1 罚函数,该罚函数对应的光滑化罚问题的解和原问题的解之间的误差较小。2009年,刘 [7] 提出了一种新的精确罚函数:

P ε ( t ) = { ε 2 e t ε , t 0 t + ε 2 e t ε , t > 0.

该罚函数至少两次连续可微。2013年,Xu [8] 提出了如下具有二阶连续可微性质的光滑化 l 1 罚函数:

P ε ( t ) = { 0 , t < 0 , t 3 6 ε 2 , 0 t < ε t + ε 2 2 t 4 3 ε , ε t .

2015年,BINH [9] 提出了一种带有指数的二阶连续可微光滑化 l 1 罚函数。2019年,Xu [10] 提出了如下的二阶连续可微的光滑化 l 1 罚函数:

P ε ( t ) = { 0 , t < 0 , m 3 ρ 3 t 4 10 ε 3 , 0 t < ε m ρ , t + 3 ε 2 5 m 2 ρ 2 t 3 ε 2 m ρ , ε m ρ t .

此外有一些学者 [11] [12] 对低价精确罚函数的光滑化函数也进行了深入研究。

受文献 [8] 的启发,本文对 l 1 罚函数提出了一类新的具有二次连续可微性质的光滑化罚函数,选择适当的参数可以得到较高的光滑化精度。在此基础上我们给出了求解不等式约束优化问题的 l 1 光滑化罚函数法,并进行了数值实验。

2. 一类二阶光滑罚函数

考虑如下函数

P ( t ) = { 0 , t 0 , t , t > 0 ,

l 1 罚函数的罚问题(P1)转化为如下形式:

min F 1 ( x , ρ ) = f ( x ) + ρ i I P ( g i ( x ) ) , x R n .

受文献 [8] 的启发,我们对 P ( t ) 构造如下的光滑化函数:

P ε ( t ) = { 0 , t 0 , q ε 1 p t p p ( p + q 1 ) , 0 < t < ε , t + ( 1 p ) ε q t 1 q ( 1 q ) ( p + q 1 ) + q ( p 1 ) p ( 1 q ) ε , ε t . (2.1)

其中 p > 2 q 2 ε > 0 是光滑化参数。下面分析 P ε ( t ) 的连续可微性质。

P ε ( t ) 的一阶导数式(2.2)和二阶导数式(2.3)如下:

P ε ( t ) = { 0 , t 0 , q ( p + q 1 ) ( t / ε ) p 1 , 0 < t < ε , 1 + 1 p ( p + q 1 ) ( ε / t ) q , ε t . (2.2)

t 0 时, lim t 0 P ε ( t ) = 0 ,当 0 < t < ε 时, lim t 0 P ε ( t ) = 0 lim t ε P ε ( t ) = q p + q 1 ,当 t ε 时, lim t ε P ε ( t ) = 1 + 1 p p + q 1 = q p + q 1 ,因此 P ε ( t ) 连续可微。

P ε ( t ) = { 0 , t 0 , q ( p 1 ) ( p + q 1 ) ε ( t / ε ) p 2 , 0 < t < ε , q ( p 1 ) ( p + q 1 ) t ( ε / t ) q , ε t . (2.3)

t 0 时, lim t 0 P ε ( t ) = 0 ,当 0 < t < ε 时, lim t 0 P ε ( t ) = 0 lim t ε P ε ( t ) = q ( p 1 ) p + q 1 ,当 t ε 时, lim t ε P ε ( t ) = q ( p 1 ) p + q 1 ,因此 P ε ( t ) 二阶连续可微。

l 1 的光滑化罚函数为:

F ( x , ρ , ε ) = f ( x ) + ρ i I P ε ( g i ( x ) ) ,

其相应的光滑化罚问题:

( SP ) min F ( x , ρ , ε ) = f ( x ) + ρ i I P ε ( g i ( x ) ) s .t . x R n

若f是二阶连续可微的,则 F ( x , ρ , ε ) 也是二阶连续可微函数。下面我们给出 P ε ( t ) P ( t ) 的误差估计。

定理2.1 对于任意的t和 ε > 0 ,下面的不等式成立:

0 P ( t ) P ε ( t ) q ( p 1 ) p ( q 1 ) ε .

证明:对于任意的t, ε > 0 ,由 P ( t ) P ε ( t ) 的定义有

P ( t ) P ε ( t ) = { 0 , t 0 , t q ε 1 p t p p ( p + q 1 ) , 0 < t < ε , ( 1 p ) ε q t 1 q ( 1 q ) ( p + q 1 ) + q ( p 1 ) p ( q 1 ) ε , ε t .

0 < t < ε 时, P ( t ) P ε ( t ) 可导,因而

[ P ( t ) P ε ( t ) ] = 1 q ( p + q 1 ) ( t / ε ) p 1 > 0 ,

即此时 P ( t ) P ε ( t ) = t q ε 1 p t p p ( p + q 1 ) 单调递增,因此当 t [ 0 , ε ) 时有

0 P ( t ) P ε ( t ) = t q ε 1 p t p p ( p + q 1 ) < p ( p + q 1 ) q p ( p + q 1 ) ε .

t ε 时,显然 P ( t ) P ε ( t ) = ( 1 p ) ε q t 1 q ( 1 q ) ( p + q 1 ) + q ( p 1 ) p ( q 1 ) ε 是单调递增的,即此时

p ( p + q 1 ) q p ( p + q 1 ) ε P ( t ) P ε ( t ) = ( 1 p ) ε q t 1 q ( 1 q ) ( p + q 1 ) + q ( p 1 ) p ( q 1 ) ε q ( p 1 ) p ( q 1 ) ε .

由上述可得

0 P ( t ) P ε ( t ) q ( p 1 ) p ( q 1 ) ε , i I .

因此结论得证。

注记:当ε和q确定时, ( q ( p 1 ) ε / p ( q 1 ) ) 对于p单调递增,当ε和p确定时, ( q ( p 1 ) ε / p ( q 1 ) ) 对于q单调递减。由定理2.1可知, P ( t ) P ε ( t ) 的误差可以任意小,只要光滑参数ε足够小,即

lim ε 0 P ε ( t ) = P ( t )

下面分析 l 1 精确罚函数的罚问题(P1)和光滑化罚问题(SP)之间的关系。

定理2.2 若 { ε j } 0 是一正序列,且 lim j ε j = 0 ,对于某个给定的 ρ > 0 ,设 x j 是问题(SP): min x R n F ( x , ρ , ε j ) 的一个解, x 是序列 { x j } 的一个极限点,则 x 是问题(P1): min x R n F 1 ( x , ρ ) 的最优解。

证明:由 x j 是问题(SP)的一个解可知,

F ( x j , ρ j , ε j ) F ( x , ρ j , ε j ) .

结合定理2.1有

0 i I P ( g i ( x ) ) i I P ε ( g i ( x ) ) q ( p 1 ) p ( q 1 ) m ε ,

0 ρ i I P ( g i ( x ) ) ρ i I P ε ( g i ( x ) ) q ( p 1 ) p ( q 1 ) m ε ρ ,

0 [ f ( x ) ρ i I P ( g i ( x ) ) ] [ f ( x ) ρ i I P ε ( g i ( x ) ) ] q ( p 1 ) p ( q 1 ) m ε ρ ,

0 F 1 ( x , ρ ) F ( x , ρ , ε ) q ( p 1 ) p ( q 1 ) m ε ρ , (2.4)

于是

F 1 ( x j , ρ ) F ( x j , ρ , ε j ) + q ( p 1 ) p ( q 1 ) m ρ ε j F ( x , ρ , ε j ) + q ( p 1 ) p ( q 1 ) m ρ ε j F 1 ( x , ρ ) + q ( p 1 ) p ( q 1 ) m ρ ε j ,

j 时有 F 1 ( x , ρ ) F 1 ( x , ρ ) ,因此 x 是问题(P1)的最优解。结论得证。

定理2.3对于某个给定的 ρ > 0 ε > 0 ,如果 x * 是问题(P1)的最优解, x 是问题(SP)的最优解,则

0 F ( x * , ρ ) F ( x , ρ , ε ) q ( p 1 ) p ( q 1 ) m ρ ε .

特别地,如果 x 是原问题(P)的ε-可行解, x * 是原问题(P)的可行解,则 x 是原问题(P)的近似最优解。

证明:由式(2.4)可知,

0 F ( x * , ρ ) F ( x * , ρ , ε ) q ( p 1 ) p ( q 1 ) m ρ ε ,

0 F ( x , ρ ) F ( x , ρ , ε ) q ( p 1 ) p ( q 1 ) m ρ ε .

因为 x * 是问题(P1)的最优解, x 是问题(SP)的最优解,则有

F ( x * , ρ ) F ( x , ρ ) ,

F ( x , ρ , ε ) F ( x * , ρ , ε ) ,

因而

0 F ( x * , ρ ) F ( x * , ρ , ε ) F ( x * , ρ ) F ( x , ρ , ε ) F ( x , ρ ) F ( x , ρ , ε ) q ( p 1 ) p ( q 1 ) m ρ ε ,

0 F ( x * , ρ ) F ( x , ρ , ε ) q ( p 1 ) p ( q 1 ) m ρ ε .

0 [ f ( x * ) + ρ i I P ( g i ( x * ) ) ] [ f ( x ) + ρ i I P ε ( g i ( x ) ) ] q ( p 1 ) p ( q 1 ) m ρ ε ,

如果 x 是原问题(P)的ε-可行解, x * 是原问题(P)的可行解,则 x * 是原问题(P)的最优解且

g i ( x ) ε ,

i I P ( g i ( x * ) ) = 0.

结合 P ε ( t )

0 i I P ε ( g i ( x ) ) q p ( p + q 1 ) m ε ,

ρ i I P ε ( g i ( x ) ) f ( x * ) f ( x ) q ( p 1 ) p ( q 1 ) m ρ ε + ρ i I P ε ( g i ( x ) ) ,

| f ( x * ) f ( x ) | q ( p + q 2 ) ( q 1 ) ( p + q 1 ) m ε ρ ,

因此 x 是原问题(P)的近似最优解。结论得证。

3. 罚函数算法和收敛性分析

基于光滑化罚问题(SP),提出如下求解问题(P)的一个罚函数算法。

定理3.1 假设 lim | | x | | f ( x ) = + ,序列 { x j } 是由Algorithm I产生的,若 { F ( x j , ρ j , ε j ) } 有界,则 { x j }

界,且 { x j } 的极限点是问题(P)的最优解。

证明:首先证 { x j } 有界。由 { F ( x j , ρ j , ε j ) } 有界可知,存在一个数L使得

F ( x j , ρ j , ε j ) L , j = 0 , 1 , 2 ,

f ( x j ) + ρ j i I P ε j ( g i ( x j ) ) L , j = 0 , 1 , 2 , (3.1)

假设 { x j } 无界,不失一般性,不妨设 x j + ( j ) ,由 lim x f ( x ) = + 可知, lim j f ( x j ) = +

与式(3.1)矛盾,因此 { x j } 有界。

其次证 { x j } 的极限点是问题(P)的最优解。设 { x j } 的极限点是 x ,即 lim j x j = x 。下面我们分两步完成证明。

第一步,假设 x 不是问题(P)的ε-可行解,则存在 i 1 I α > 0 使得 g i 1 ( x ) α > ε ,由 P ε ( t ) 单调递增可知,

f ( x j ) + ρ j ( α + ( 1 p ) ε j q α 1 q ( 1 q ) ( p + q 1 ) + q ( p 1 ) p ( 1 q ) ε j ) F ( x j , ρ j , ε j ) L , (3.2)

j 时,由Algorithm I知 ρ j + ε j 0 ,即

f ( x j ) + ρ j ( α + ( 1 p ) ε j q α 1 q ( 1 q ) ( p + q 1 ) + q ( p 1 ) p ( 1 q ) ε j ) + , (3.3)

与式(3.2)矛盾,因此 x 是原问题(P)的ε-可行解。

第二步,设 x * 是原问题(P)的最优解,由于序列 { x j } 是由Algorithm I产生的,则

F ( x j , ρ j , ε j ) F ( x * , ρ j , ε j ) , j = 0 , 1 , 2 ,

f ( x j ) + ρ j i I P ε j ( g i ( x j ) ) f ( x * ) + ρ j i I P ε j ( g i ( x * ) ) = f ( x * ) .

P ε ( g i ( x j ) ) > 0 可知, f ( x j ) f ( x * ) ,当 j 时,有 f ( x ) f ( x * ) 。又因为 x * 是原问题(P)的最优解,所以 f ( x * ) f ( x ) 。综上 f ( x ) = f ( x * ) ,结论得证。

4. 数值实验

下面通过求解5个不等式约束优化问题数值算例,验证Algorithm I的有效性,并与 l 1 罚函数法、 l 2 罚函数法以及文献 [5] [7] [8] [10] 罚函数算法的数值结果进行比较。在式(2.1)中取p = 3,q = 7。

例4.1 考虑如下约束优化问题(文献 [13] 中的例4.1)

min f ( x ) = x 1 2 + x 2 2 + 2 x 3 2 + x 4 2 5 x 1 5 x 2 21 x 3 + 7 x 4 , s .t . g 1 ( x ) = 2 x 1 2 + x 2 2 + x 3 2 + 2 x 1 + x 2 + x 4 5 0 , g 2 ( x ) = x 1 2 + x 2 2 + x 3 2 + x 4 2 + x 1 x 2 + x 3 x 4 8 0 , g 3 ( x ) = x 1 2 + 2 x 2 2 + x 3 2 + 2 x 4 2 x 1 x 4 10 0.

x 0 = ( 0 , 0 , 0 , 0 ) , ε 0 = 0.0001 , ρ 0 = 5 , N = 2 , η = 0.01 , ε = 10 6 。数值实验结果如表1所示,其中文献 [7] 的算法结果不收敛,Algorithm I所得目标函数值最小,且最小值为−44.233837585,迭代次数为2次。

Table 1. Example 4.1 comparison results

表1. 例4.1对比结果

例4.2 考虑如下约束优化问题(文献 [14] 中的例4.1)

min f ( x ) = x 1 2 + x 2 2 , s .t . g 1 ( x ) = x 1 2 x 2 0 , g 2 ( x ) = x 1 0.

x 0 = ( 2 , 2 ) , ε 0 = 0.1 , ρ 0 = 1 , N = 2 , η = 0.01 , ε = 10 6 。数值实验结果如表2所示,Algorithm I、 l 1 l 2 、文献 [8] 和文献 [10] 都能计算出目标函数值最小值,且最小值均为0,迭代次数均为1次。

Table 2. Example 4.2 comparison results

表2. 例4.2对比结果

例4.3 考虑如下约束优化问题(文献 [15] 中的例3.3)

min f ( x ) = 2 x 1 6 x 2 + x 1 2 2 x 1 x 2 + 2 x 2 2 , s .t . g 1 ( x ) = x 1 + x 2 2 0 , g 2 ( x ) = x 1 + 2 x 2 2 0 , g 3 ( x ) = x 1 0 , g 3 ( x ) = x 2 0.

x 0 = ( 0 , 0 ) , ε 0 = 0.1 , ρ 0 = 5 , N = 2 , η = 0.01 , ε = 10 6 。数值实验结果如表3所示,其中 l 2 、文献 [8] 、文献 [10] 的算法结果不收敛,Algorithm I所得目标函数值最小,且最小值为−7.200000084,迭代次数为4次。

Table 3. Example 4.3 comparison results

表3. 例4.3对比结果

例4.4 考虑如下约束优化问题

min f ( x ) = 9 8 x 1 6 x 2 4 x 3 + 2 x 1 2 + 2 x 2 2 + 2 x 3 2 + 2 x 1 x 2 + 2 x 1 x 3 , s .t . g 1 ( x ) = x 1 + x 2 + 2 x 3 3 0.

x 0 = ( 0 , 0 , 0 ) , ε 0 = 0.1 , ρ 0 = 2 , N = 4 , η = 0.01 , ε = 10 6 。数值实验结果如表4所示,其中文献 [10] 的算法结果不收敛,Algorithm I所得目标函数值最小,且最小值为0.11111090,迭代次数为3次。

Table 4. Example 4.4 comparison results

表4. 例4.4对比结果

例4.5 考虑如下约束优化问题

min f ( x ) = ( x 1 1 ) 2 + ( x 2 2 ) 2 , s .t . g 1 ( x ) = x 1 + x 2 1 0 , g 2 ( x ) = x 1 + x 2 2 0 , g 3 ( x ) = x 1 0 , g 3 ( x ) = x 2 0.

x 0 = ( 0 , 0 ) , ε 0 = 0.1 , ρ 0 = 2 , N = 10 , η = 0.01 , ε = 10 6 。数值实验结果如表5所示,其中文献 [8] 的算法结果不收敛,Algorithm I所得目标函数值最小,且最小值为0.499999198,迭代次数为3次。

Table 5. Example 4.5 comparison results

表5. 例4.5对比结果

从这5个数值例子可以看出,Algorithm I所得目标函数值是最小的,因此其对于求解不等式约束优化问题的最优解是有效的。

5. 结论

本文提出了一类新的光滑化 l 1 精确罚函数,其具有二阶连续可微性质。并且证明了对应算法的全局收敛性。最后通过数值实验说明了该算法的有效性。

参考文献

[1] 连淑君, 唐加会, 杜爱华. 带等式约束的光滑优化问题的一类新的精确罚函数[J]. 运筹学学报, 2018, 22(4): 108-116.
https://doi.org/10.15960/j.cnki.issn.1007-6093.2018.04.010
[2] Yang, X.Q., Meng, Z.Q., Huang, X.X., et al. (2003) Smoothing Nonlinear Penalty Functions for Constrained Optimization Problems. Numerical Functional Analysis and Optimization, 24, 351-364.
https://doi.org/10.1081/NFA-120022928
[3] Zangwill, W.I. (1967) Non-Linear Programming via Penalty Func-tions. Management Science, 13, 344-358.
https://doi.org/10.1287/mnsc.13.5.344
[4] Pinar, M.Ç. and Zenios, S.A. (1994) On Smoothing Exact Penalty Functions for Convex Constrained Optimization. SIAM Journal on Optimization, 4, 486-511.
https://doi.org/10.1137/0804027
[5] Lian, S.-J. (2012) Smoothing Approximation to l1 Exact Penalty Function for Inequality Constrained Optimization. Applied Mathematics and Computation, 219, 3113-3121.
https://doi.org/10.1016/j.amc.2012.09.042
[6] Sahiner, A., Kapusuz, G. and Yilmaz, N. (2016) A New Smoothing Approach to Exact Penalty Functions for Inequality Constrained Optimization Problems. Numerical Algebra Control & Optimization, 6, 161-173.
https://doi.org/10.3934/naco.2016006
[7] Liu, B. (2009) On Smoothing Exact Penalty Functions for Nonlinear Constrained Optimization Problems. Journal of Applied Mathematics and Computing, 30, 259-270.
https://doi.org/10.1007/s12190-008-0171-z
[8] Xu, X., Meng, Z., Sun, J., et al. (2013) A Second-Order Smooth Penalty Function Algorithm for Constrained Optimization Problems. Computational Optimization and Applications, 55, 155-172.
https://doi.org/10.1007/s10589-012-9504-9
[9] Binh, N.T. (2015) Smoothing Approximation to l1 Exact Penalty Function for Constrained Optimization Problems. Journal of Applied Mathematics & Informatics, 33, 387-399.
https://doi.org/10.14317/jami.2015.387
[10] Xu, X., Dang, C., Chan, F.T.S., et al. (2019) On Smoothing l1 Exact Penalty Function for Constrained Optimization Problems. Numerical Functional Analysis and Optimization, 40, 1-18.
https://doi.org/10.1080/01630563.2018.1483948
[11] 连淑君. 不等式约束优化问题的低阶精确罚函数的光滑化算法(英文) [J]. 运筹学学报, 2012, 16(2): 51-64.
https://doi.org/10.15960/j.cnki.issn.1007-6093.2012.02.007
[12] 赫振华, 白富生. 低阶精确罚函数的一种光滑化逼近(英文) [J]. 运筹学学报, 2010, 14(2): 11-22.
https://doi.org/10.15960/j.cnki.issn.1007-6093.2010.02.001
[13] Meng, Z., Dang, C., Jiang, M., et al. (2013) Ex-actness and Algorithm of an Objective Penalty Function. Journal of Global Optimization, 56, 691-711.
https://doi.org/10.1007/s10898-012-9900-9
[14] Meng, Z., Dang, C. and Yang, X. (2006) On the Smoothing of the Square-Root Exact Penalty Function for Inequality Constrained Optimization. Computational Optimization and Applica-tions, 35, 375-398.
https://doi.org/10.1007/s10589-006-8720-6
[15] Wu, Z.Y., Lee, H.W.J., Bai, F.S. and Zhang, L.S. (2005) Quad-ratic Smoothing Approximation to l1 Exact Penalty Function in Global Optimization. Journal of Industrial & Manage-ment Optimization, 1, 533-547.
https://doi.org/10.3934/jimo.2005.1.533