1. 引言
考虑无约束最优化问题(记为UCP):
(1)
其中
是一个光滑函数,且有下界。UCP是最优化领域中最重要和最基本的问题之一,学者们对其进行了系统而深入的研究。有许多经典的迭代方法来求解UCP,包括最速下降法、共轭梯度法、信赖域法、牛顿法、拟牛顿法等 [1] [2]。尽管信赖域方法、牛顿方法和拟牛顿方法具有很好的收敛性,但它们不适合大规模的UCP,因为它们需要计算Hessian矩阵
或其近似值,从而导致大量的计算和存储。最速下降法和共轭梯度法在迭代方案中只包括梯度
,因此,它们适用于求解大规模的UCP。
共轭梯度法的基本思想可以追溯到Hestenes和Stiefel求解线性方程组的研究成果。后来,Fletcher和Reeves将其推广到解决非线性优化问题。共轭梯度法自出现以来,一直受到学者们的密切关注。从初始迭代
开始,共轭梯度法的迭代格式为
(2)
其中
是由某些线搜索计算的步长,
是生成的搜索方向,其定义下式
(3)
其中,
和
是共轭参数,这是不同共轭梯度方法之间的根本区别。比较著名的共轭参数包括:Hestenes-Stiefiel (HS),Polak-Ribiere-Polyak (PRP),Fletcher-Reeves (FR),与Dai-Yuan (DY)。具体定义如下 [3]:
如果UCP中的
是一个强二次函数,并且(2)中的步长
是通过精确的线搜索生成的,则上述四个
公式是等价的,否则可以得到四个著名的共轭梯度方法,即HS方法、PRP方法、FR方法和DY方法。这四个方法具有不同的收敛结果和数值性能。FR方法和DY方法分别在强Wolfe线搜索和Wolfe线搜索下具有全局收敛性。对于HS方法和PRP方法,它们通常被认为是实际应用中最有效的两种共轭梯度法,但即使步长
是精确步长,它们也可能发散。
大量数值试验表明,高效的共轭梯度法产生的搜索方向满足两个性质:充分下降条件和共轭条件,也就是
(4)
与
(5)
其中
。近几年学者们设计了多种满足(4)或(5)的共轭梯度法。比如,Hager与Zhang [4] 将(3)中的参数
取为
如果
,则有
文献 [5] [6] 提出了两种修正的PRP共轭梯度法,其方向取为
其中
。容易验证上面两类方向都满足
,并且容易看出
的设计动机来自于Schmidt正交化方法。基于这个设计思想, [7] 提出了一类满足夹角性质的记忆梯度法,其产生的方向同时满足(4)与夹角条件
。
本文继续对这一方向进行研究,提出了两种同时满足充分下降性和共轭条件的改进HS共轭梯度法。本文的其余部分组织如下:第2节提出了HS方法的两种变体,并证明了生成序列的一些重要性质。第3节证明了它们的全局收敛性。在第4节中,我们给出了一些图像去噪的试验结果。第5节给出一些未来的研究方向。
2. 两类改进的HS方法
在这一节中,我们设计两种改进的HS方法的迭代格式。在无需线搜索的条件下,它们产生的方向满足充分下降条件和共轭条件。
正如在第1节中所分析,由下式产生的方向
满足充分下降条件:
(6)
因此,为了确保
满足共轭条件,我们只需将其代入(5)式,并求解得到的线性方程。也就是
由此得
(7)
其中
替换成了
。然后,将(7)代入(6),得到以下迭代方向:
(8)
引理2.1由(8)定义的方向
满足充分下降条件和共轭条件。此外,如果步长
是通过精确的线搜索计算的,并且
,那么
,其中
是HS方法的方向,即
证明 从
的公式可得
(9)
因此,方向
满足充分下降条件和共轭条件。
由于
是通过精确的行搜索计算的,因此我们有
。这与(7)、(8)表明如果
,则
及
。证毕。
参数
由以下两个步骤生成:首先通过Schmidt正交化使
满足充分下降条件,然后通过求解相应的线性方程调整得到的
满足共轭条件。显然,上述两个步骤可以交换顺序。也就是说,可以先通过施密特正交化使
满足共轭条件,然后调整得到的
以满足充分下降条件。具体地,为了使(3)定义的
满足共轭条件,通过Schmidt正交化得
然后将上述等式代入等式
,得
(10)
其中
替换成了
。于是,得到了一个新的方向
(11)
引理2.2由(11)定义的方向
满足充分下降条件和共轭条件。此外,如果步长
是通过精确的线搜索计算的,并且
,那么
。
证明 从
的公式可得
(12)
因此,方向
满足充分下降条件和共轭条件。
由于
是通过精确的行搜索计算的,因此我们有
。这与(9)、(10)表明如果
,则
及
。证毕。
在下文中,对问题(1)做出以下限制。假设:
(H1) 水平集
有界;
(H2) 在
的某个邻域中,梯度
是Lipschitz连续的,即存在一个常数
,使得
(H3) 函数
在
上一致凸,即存在一个常数
,使得
(13)
假设(H1)与(H2)表明存在正常数
与B使得
(14)
(15)
在共轭梯度法中,步长
通常由非精确线性搜索确定,比如 Armijo线搜索、Wolfe线搜索、Goldstein线搜索等。本文采用Armijo线搜搜,即步长
是集合
中满足下面不等式的最大的
:
(16)
其中
,
。
由(13)得
(17)
如果
,则由充分下降性及(17)得
,这说明
是问题(1)的一个稳定点。
基于上面的分析,下面给出求解问题(1)的两项HS共轭梯度法。
TTMHSCG1方法(两项修正HS共轭方法1)
步0. 选取正常数
,
,
满足
。选取初始迭代点
,计算
。令
,
。
步1. 如果
,停止否则转步2。
步2. 由Armijo线搜索(16)确定步长
。
步3. 令
,计算
。
步4. 如果
与
的符号相同且
则令
;否则
由(8)式确定。
步5. 令
,返回步1。
类似地,基于
可得另一类HS共轭梯度法。
TTMHSCG2方法(两项修正HS共轭方法2)
步0~步3. 与TTMHSCG1方法一样。
步4. 如果
与
的符号相同且
则令
;否则
由(11)式确定。
步5. 令
,返回步1。
3. 全局收敛性
本文讨论TTMHSCG1与TTMHSCG2的全局收敛性。下面的引理给出了Armijo线搜索所生成的步长序列
存在一个正下界。
引理3.1 如果函数
满足假设(H1)与(H2),步长
由Armijo线搜索确定,则
(18)
证明 如果
,这说明
不满足(16),即
(19)
由中值定理及(H2)得,存在常数
使得
由此式及(19)容易得到(18)成立。证毕。
定理3.1 假设(H1)~(H3)成立,令
是算法TTMHSCG1与TTMHSCG2生成的点列,则
证明 我们只证明了TTMHSCG1的全局收敛性。TTMHSCG2的证明与其类似。事实上,由(H2)可得
;由(H3)可得
。
以下证据分为三种情况。第一种情况,当
与
有不同的符号时,有
由此可得
(20)
第二种情况,当
,并且
与
符号相同时,有
其中不等式是根据(14)、(15)得到的。于是
(21)
第三种情况,当
,并且
与
符号相同时,由TTMHSCG1的第4步得
(22)
因此,从(20)~(22),可得
(23)
其中
。
另一方面,从Armijo线搜索(17),我们有
由这个式子与充分下降条件可得
(24)
下面利用反证法证明结论。假设
不成立,于是存在常数
与无穷点列K使得
由此式及(18) (23) (24)得
以及
显然上面两个式子是矛盾的,因此假设不成立。证毕。
4. 数值实验
本节利用TTMHSCG1与TTMHSCG2求解 [8] 中提出的图像处理的两阶段法。令
表示一个有
个像素的图像,对于每个
,令
表示
的相邻点,即
同时令
表示点
的观测像素。下面简要回顾一下两阶段法。在第一阶段,两阶段法利用自适应中值滤波器(AMF)探测出椒盐噪声的位置,并令
表示椒盐噪声的坐标集合;第二阶段,两阶段法通过求解下面的最优化问题填补椒盐噪声点处的像素值。
其中
是正则化参数,
是保边函数,
是一个列向量(按字典序排列)。
图1与图2给出利用TTMHSCG1与TTMHSCG2还原Lena (256 × 256)的结果,其中图1的PSNR由13.8402增加到29.0134,图2的PSNR由13.8571增加到28.4543。

Figure 1. The denosing results of TTMHSCG1 (left: original, middle: nosed, right: recovered)
图1. TTMHSCG1去噪效果(左:原始图,中:含噪图,右:去噪图)

Figure 2. The denosing results of TTMHSCG2 (left: original, middle: nosed, right: recovered)
图2. TTMHSCG2去噪效果(左:原始图,中:含噪图,右:去噪图)
由图1与图2的还原效果可以看出,TTMHSCG1与TTMHSCG2成功地将脉冲噪声去除,因此其在脉冲噪声去噪方面表现良好。
5. 结论
本文设计了两种修正的HS共轭梯度法,它们同时满足充分下降性与共轭条件,同时这两个性质是不依赖于线搜索的。同时本文证明了两种修正HS共轭梯度法的全局收敛性。最后初步的数值实验表明所设计方法在脉冲噪声去噪方面是有效的。
致谢
感谢审稿人对本文提出的宝贵意见。
基金项目
枣庄学院博士科研启动基金、枣庄学院教学改革重点项目(XJG20019)。