1. 引言
邻近点算法(Proximal Point Method, PPM) [1]通过引入正则化项将复杂原问题转化为一系列易于求解的子问题,在单目标优化问题中展现出卓越的求解能力。随着研究的深入,学者们将邻近点算法扩展至多目标优化领域,提出了标量化邻近点算法(Scalarized Proximal Point Method, SPPM)。该方法通过引入标量化函数将多目标问题转化为单目标问题,从而借助成熟的单目标优化理论进行求解。然而,当目标函数为拟凸且局部Lipschitz连续时,精确求解往往计算成本高昂,甚至不可行。
本文提出一种基于Bregman距离的非精确邻近点算法,用于求解无约束拟凸多目标优化问题。该方法在正则化项中采用Bregman距离替代欧几里得范数,并允许Fréchet
-次微分的非精确计算。受Rockafellar [2]精度准则的启发,我们提出两种误差准则,并在温和假设下证明:当目标函数真且下半连续时,算法序列收敛于弱帕累托最优点;当目标函数拟凸且Lipschitz连续时,序列收敛于帕累托稳定点。进一步地,在附加增长条件下,我们证明采用相对误差准则的算法具有线性收敛速率,且当正则化参数趋于零时可实现超线性收敛。
2. 预备知识
在本文中,
表示
维实欧几里得空间
的内积,
表示其对应的范数。设
表示以
为中心、半径
的闭球,并用
表示
的单位闭球。用
表示转置符号。
表示
在
处的梯度。对任意非空子集
,
的指示函数
定义为:当
时,
,否则(即
时),
。集合
是闭集当且仅当
下半连续。
定义2.1 设
是真下半连续函数,且
是任意非负实数。
在
处的Fréchet
-次微分定义为
显然,当
时,Fréchet
-次微分就退化为Fréchet次微分,记为
。根据[3],我们可以得到这两种次微分之间的如下关系
(1)
以下结果确保了真函数的极小值点集合非空的充分条件。
命题2.1 [4] 若真函数
在处有局部极小值,则
。
引理2.1 [4] 设
是下半连续且强制的真函数,则其最优值
是有限的,且以下集合是非空且紧的。
下面给出Bregman距离的定义并研究其关键性质(参见[5]),这些性质是我们算法的理论基础。
定义2.2 设
在
上严格凸且可微。与
相关联的Bregman距离
定义为
Bregman距离不是严格意义上的距离,
,当且仅当
时等号成立。此外,一般来说它既不对称,也不满足三角不等式。当
时,
就退化为半欧几里得距离的平方。
引理2.2 [6]设
是真闭严格凸函数,在点
处有限,且在
处可微,则有
(2)
为确保算法的良定性,对
做如下假设。
(A1)
局部Lipschitz连续;
(A2)
是强凸函数。
命题2.2 设
是满足假设(A1)和(A2)的Bregman距离。则对每个
,
在
处是局部Lipschitz连续且强制的。
证明:固定
。由假设(A1),存在
和
,使得对任意
,有
。由定义2.2知,对任意
,有
所以函数
在
处局部Lipschitz连续。
固定
。由假设(A2),存在
,使得对所有
,有:
由定义2.2,显然
(3)
令
取极限,可得
因此
是强制函数。
在
中,符号
表示非负象限,
表示正象限。设
为两个向量。本文中考虑的偏序关系
由
诱导,定义为:
。
本文研究以下无约束多目标优化问题:
(4)
其中每个目标函数
是真拟凸函数,且
。如果多目标函数的每个分量函数是拟凸的(或凸的、连续可微的、可微的、连续的、下半连续的),则称该多目标函数是拟凸的(或凸的、连续可微的、可微的、连续的、下半连续的)。
设
表示
在
处的雅可比矩阵,即
是
中的一个矩阵,其元素
,其中
,
。我们可以将其表示为:
。若多目标函数
是可微的,且对任意
,都满足以下条件:
则称
是伪凸的。
注2.1 上述伪凸向量值函数的定义可参考[7]。若
是按分量伪凸的,那么
是伪凸的,反之不成立。此外,伪凸函数是拟凸函数(参见[8])。
定义2.3 决策向量
是
1) 问题(4)的帕累托最优点,如果不存在
,使得
且
;
2) 问题(4)的弱帕累托最优点,如果不存在
,使得
;
3) 问题(4)的帕累托稳定点,如果对所有
,都有
。
众所周知,每个帕累托最优点也是弱帕累托最优点,且每个弱帕累托最优点也是帕累托稳定点。此外,当
是伪凸函数时,问题(4)的帕累托稳定点也是弱帕累托最优点(也可参见[8])。
3. 算法
在本节中,我们针对多目标优化问题(4)提出一种基于Bregman距离的非精确标量化邻近点算法(ISPPMB),然后给出该算法的一些基本性质,这些性质将在收敛性分析中用到。为此,对问题(4)中的函数
作如下假设:
(H1)
,即对任意
和
,有
;
(H2)
是拟凸的;
(H3)
是真下半连续函数,且
;
(H4)
是
-完备的。即对每个满足
且对所有
都有
的序列
,存在
,使得对所有
,都有
。
假设(H4)已在诸多关于凸或拟凸向量优化的邻近点算法研究工作中被采用,可参考文献[9]、[10]和[11]。显然,若每个目标函数
均为强制函数,则水平集
为紧集,此时假设(H4)自然成立。
本文所考虑的ISPPMB算法如下。
Algorithm 1. 基于Bregman距离的非精确标量化邻近点算法(ISPPMB) |
初始化:设
为任意初始点。选择满足假设(A1)和(A2)的Bregman函数
。设置
。 迭代步骤:给定
, 找到
和
使得: |
(5) 其中,
,
,
且
。 停止准则:若
或
是帕累托稳定点,则停止。否则,令
并返回迭代步骤。 |
命题3.1 设
满足假设 (H1)、(H2)和(H3)。那么,ISPPMB算法是良定的。
证明:采用数学归纳法进行证明。对于
,由于
是初始点,结论成立。假设
存在,定义函数
如下:

由假设(H1),
,由于
且
,
有下界,因此函数
是真函数。由假设(H3)可知
下半连续,且由命题2.2可知
局部Lipschitz连续。假设(H2)和(H3)意味着
是闭凸集,因此
凸且下半连续。于是有
下半连续。此外,由命题2.2,可知
是强制的,那么
也是强制的。因此,
是下半连续且强制的真函数,那么由引理2.1可知,存在
是
的极小值点。即通过命题2.1得到
满足
(6)
即式(5)在
时成立。因此,ISPPMB算法的迭代步骤是良定的。
从命题3.1的证明中还可以看出,如果对某个
,有
,那么
这意味着
是优化问题
的临界点。此外,如果
是这个优化问题的极小值点,那么可以验证
是问题(4)的弱帕累托最优点。因此,我们假设对所有
,都有
,并且每次迭代的
都不是帕累托稳定点,也就是说,由ISPPMB算法生成的序列
是无穷的。
接下来,我们给出Fréchet
-次微分的有用性质。命题3.2的证明参考[10]。
命题3.2 假设(H2)和(H3)满足。设
,
,且
是闭凸集。若
,
,且
(其中
),则
定义集合
(7)
结合假设(H1)~(H4),显然
是闭凸集,
且
。
引理3.1 设
为满足(H1)、(H3)和(H4)的函数,
是由ISPPMB算法生成的序列。若
是
的一个聚点,则
。
证明:设
是序列
的一个聚点,那么存在子序列
,使得
。下面将证明
。
任取
。由于对每个
,都有
,由
的定义可得
。于是:

这表明序列
是递减的。进一步,由假设(H1)可知,序列
有下界。因此,
是收敛的,于是:
由上述不等式可得:

这意味着
,即对所有
,有
。结合式(7)可得
。
4. 收敛性分析
在本节中,通过分别考虑两种误差准则(绝对误差和相对误差),分析了ISPPMB算法两种变体的收敛性:当
拟凸且连续可微时,算法生成的序列收敛到问题(4)的帕累托稳定点;而当
伪凸且连续可微(或真凸且下半连续)时,该序列收敛到问题(4)的弱帕累托最优点。
4.1. 带有绝对误差准则的ISPPMB算法
在本小节中,假设ISPPMB算法生成的误差序列
满足以下估计准则:
引理4.1 设
是由ISPPMB算法生成的序列。若假设(H1)~(H4)和(E1)成立,那么对于每个
,
收敛,且
是有界的。此外,
。
证明:设
。由(5)可知,存在
,使得
(8)
由命题3.2可得
(9)
在式(2)中取
,
,
,得到:
(10)
对(8)两端与
作内积后,将(10)代入等式右端第二项,并令
,得到
上述等式结合(9),得到
(11)
其中第二个不等式由(E1)中
的定义得到。注意到,对任意
,有
。在(11)中令
,得到
(12)
其中第二个不等式由(3)得到。由此还可推出
由于假设(E1)保证了
,那么对于固定常数
,存在
,使得对任意
,有
,进而
,
。结合(E1),有
因此,由[12]可知
收敛,因此序列
是有界的。
最后,对(12)进行整理,有
考虑到
收敛,且
,于是可得
。
命题4.1 若假设(H1)~(H4)和(E1)成立,那么由ISPPMB算法生成的序列
收敛到
中的某个点。
证明:由引理4.1可知,
有界,因此存在
的聚点
以及子序列
,使得
。根据引理3.1,有
。然后再次应用引理4.1,可知
收敛。因此,结合这一点以及
,可直接得出
。
接下来,证明当正则化参数
有界时,由ISPPMB算法生成的序列
收敛到问题(4)的帕累托稳定点。为此,我们对
考虑以下假设:
(H5)
是
上的连续可微函数。
定理4.1 假设(H1)、(H3)、(H4)、(H5)和(E1)成立,且存在正常数
,使得
。那么由ISPPMB算法生成的序列
收敛到问题(4)的帕累托稳定点。
证明:显然,假设(H5)比(H3)更强。那么,根据命题4.1,存在
,使得
。此外,由于序列
是有界的,存在子序列
,使得
,其中
且
。根据(5),有
(13)
由于
是连续可微的,根据(1),有
其中第三个等式由[13]以及
成立。将上式应用于(13),可知存在
和
,使得
(14)
由于
,有
(15)
取
。显然,
。将式(14)两端同时与
作内积
在(10)和(15)中令
并带入上式,同时注意到(E1)中
的定义以及
,可得
(16)
其中,第四个不等式应用了(3)。在(16)中令
,并应用引理4.1和(E1),可得
(17)
另一方面,由于
,可得
。由
的拟凸性,对每个
,有
(参考[14])。据此以及(17),同时注意到
,于是有
因此,对任意
,有
(18)
假设
不是问题(4)的帕累托稳定点。那么存在
,使得
,即
(19)
所以,由
的连续可微性,存在
,使得

这意味着
。因此在(18)中取
,
,对所有满足
的
,有
进而
,这与(19)矛盾。因此,
是帕累托稳定点。
推论4.1 假设条件(H1)、(H4)、(H5)和(E1)成立,
是伪凸的,且存在正常数
使得
。那么由ISPPMB算法生成的序列
收敛到问题(4)的弱帕累托最优点。
证明:由注2.1可知,伪凸函数也是拟凸的,并且当
是伪凸函数时,问题(4)的帕累托稳定点也是它的弱帕累托最优点(见第2节)。因此,结论可直接由定理4.1推出。
4.2. 带有相对误差准则的ISPPMB算法
在本小节中,我们研究ISPPMB算法满足另一种误差准则时的收敛性质:设
和
是由ISPPMB算法生成的序列,且误差序列
满足以下条件:
引理4.2 设
是由ISPPMB算法生成的序列。若假设(H1)~(H4)以及(E2)、(E2.1)、(E2.2)成立,那么存在
,使得对于所有
和所有
,有
(20)
其中
。此外,对于所有
,
收敛,
是有界的,且
。
证明:通过使用引理4.1第一部分中直到(11)第一个不等式的证明过程,然后利用条件(E2)、(E2.1)和式(3),对任意
,我们有:
(21)
令
,注意到,对任意
,有
。因此:
将此关系代入(21)并整理各项,可得:
由于(E2.2)保证了
(
),存在
,使得对任意
,有
。利用上述不等式,有
因此不等式(20)得证。
显然,由(20)可知,对任意
和
,有以下式子成立
由于
(由(E2.2)),对于所有
,存在
,使得对所有
,有
,因此
。再结合条件(E2.2),意味着
因此,由[12]可知
收敛,因此序列
是有界的。
最后,再次由关系(20),我们有
对上述不等式两边取极限,并考虑到
收敛,且
,于是可得
。
下面命题4.2的证明与命题4.1类似,在证明过程中我们只需将引理4.2的应用改为引理4.2的应用。
命题4.2 若假设(H1)~(H4)以及(E2)、(E2.1)、(E2.2)成立,那么由ISPPMB算法生成的序列
收敛到
中的某个点。
定理4.2 假设(H1)、(H2)、(H4)、(H5)以及(E2)、(E2.1)、(E2.2)成立,且存在正常数
,使得
。那么由ISPPMB算法生成的序列
收敛到问题(4)的帕累托稳定点。
证明:由命题4.2可知,存在
,使得
。此外,由于序列
是有界的,存在子序列
,使得
,其中
且
。然后,使用定理4.1中(16)第二个不等式的相同证明过程,对任意
,我们可得:
(22)
其中,第二个不等式应用了条件(E2)、(E2.1)和式(3),第三个不等式考虑了
。在(22)中令
,并应用引理4.2和(E2.2),可得
再次遵循定理4.1中(17)之后的证明过程,于是可得
是问题(4)的帕累托稳定点。
推论4.2 假设条件(H1)、(H4)、(H5)以及(E2)、(E2.1)、(E2.2)成立,
是伪凸的,且存在正常数
使得
。那么由ISPPMB算法生成的序列
收敛到问题(4)的弱帕累托最优点。
证明:通过采用与推论4.1的证明类似的讨论,可知所需结果可直接由定理4.2得到。
定理4.3 假设条件(H1)、(H3)、(H4)以及(E2)、(E2.1)、(E2.2)成立,
是凸的,且存在正常数
使得
。那么由ISPPMB算法生成的序列
收敛到问题(4)的弱帕累托最优点。
证明:与定理4.2证明的开头类似,我们有
(其中
),且存在子序列
,使得
(其中
且
)。
注意到式(5),有
(23)
其中
。由于
是凸的,可得
然后,根据凸函数的次梯度不等式,对所有
,有
(24)
对式(23)两端与
做内积,容易验证对任意
,
其中第二个不等式由(10)得到。将此关系代入式(24),并考虑条件(E2)、(E2.1)、(3)以及关于参数
的有界性假设,我们可得对所有
,
(25)
假设
不是问题(4)的弱帕累托最优点。那么,存在
使得
,这意味着
,因此
。将
代入式(25),同时利用引理4.2和条件(E2.2),令
可得
(26)
然而,由
且
,可得
,这与式(26)矛盾。因此,
是问题(4)的弱帕累托最优点。
注2.1 为了实现带有相对误差准则的ISPPMB算法,我们需要使用一些迭代算法来求解一个隐式包含问题,并验证条件(E2)、(E2.1)和(E2.2)是否满足(参见[9])。我们使用以下步骤来找到满足条件(5)、(E2)、(E2.1)和(E2.2)的
和
。
1) 选择序列
和
,使得对于某个正实数
,有
,且
。此外,定义序列
,使得对于所有
,都有
。
2) 寻找
。使用数值方法(例如,使用MATLAB软件工具中的fmincon或patternsearch函数)来找到问题的稳定点的近似点
,该问题为
3) 计算
(对于所有
)以及
。注意,如果对于所有
,都有
,那么
。
4) 计算
。
5) 寻找
。找到
(对于所有
)以及
,使得:
其中
上述误差向量的构造可转化为如下线性逆问题:
其中
,
是第
个位置为1的标准向量,
是未知的
矩阵,
是已知向量,且
和
也是已知的。
5. 收敛速度
在本节中,我们旨在估计ISPPMB算法满足相对误差准则时的收敛速率。为此,我们需要额外的假设。定义集合
其中
表示问题(4)的帕累托稳定点集。
2022年,Papa Quiroz和Cruzado[9]以及赵晓芃[11]等人在欧氏空间框架下,利用一类增长条件研究了多目标优化问题中非精确邻近点算法的收敛速度。受此启发,本文基于Bregman距离引入如下增长条件,以分析所提出算法ISPPMB的收敛速度:
(H6) 对于
且
,存在
和
,使得对所有
,以及所有满足
的
,都有
若对所有
,有
,且
那么假设(H6)就退化为参考文献[9]中所使用的增长条件。
定理5.1 设
和
是由ISPPMB算法生成的序列。假设(H1)-(H6)以及(E2)、(E2.1)、(E2.2)成立,且存在正常数
,使得
。那么序列
线性收敛到问题(4)的帕累托稳定点。此外,若
,则收敛是超线性的。
证明:根据定理4.2,我们可知
收敛到问题(4)的帕累托稳定点,记为
。设
和
是假设(H6)中与
对应的正常数。由(5),存在
,使得
然后,由假设(E2)和
可得:
(27)
其中,第二个不等式应用了假设(A1)。由于
(由(E2.2))且
(由引理4.2),存在
,使得对任意
,有
。因此,由(H6)和(27)第二个不等式,对任意
,有
将此与引理4.2中的(20)结合,对于所有
,可得
即
(28)
其中
(29)
由于对所有
,有
,我们有
显然,由于
,有
于是,存在
,使得对于所有
,有
这一点,结合(28),意味着对于所有
,有
即
线性收敛到
。
此外,若
,则应用这一点以及
在(29)中,可得
,这与(28)一起意味着
收敛是超线性的。
结合定理4.3,通过使用与定理5.1类似的证明方法,我们可得到以下结果,因此此处省略证明。
定理5.2 假设(H1)、(H3)、(H4)、(H6)以及(E2)、(E2.1)、(E2.2)成立,
是凸的,且存在正常数
使得
。那么由算法3.1生成的序列
线性收敛到问题(4)的一个弱帕累托最优点。此外,若
,则收敛是超线性的。
6. 总结
本文提出了一种基于Bregman距离的非精确邻近点算法,用于求解无约束拟凸多目标优化问题。该方法引入Fréchet次微分的非精确计算,并结合绝对误差与相对误差两种准则,建立了算法的收敛性理论。结果表明,在适当假设下,算法生成的序列可收敛至帕累托稳定点或弱帕累托最优点。进一步地,在附加增长条件下,证明了相对误差准则下的算法具有线性收敛速率,且当正则化参数趋于零时可实现超线性收敛。
本文的理论分析基于若干关键假设,这些假设在保证理论严密性的同时,也带来了一定的应用局限性。未来的研究方向之一是将帕累托稳定点的概念推广至不可微情形,弱化现有假设以拓展算法的适用性。该工作将进一步丰富拟凸多目标优化的理论体系,并推动其在机器学习等领域的实际应用。