凸约束优化问题的杂交三阶投影HS-PRP方法

doi:10.12677/AAM.2022.118607

期刊菜单

凸约束优化问题的杂交三阶投影HS-PRP方法
A Hybrid Three-Term Projected HS-PRP Method for Optimization with Convex Constraint

DOI: 10.12677/AAM.2022.118607, PDF, HTML, XML, 下载: 202 浏览: 314
作者: 周姣利：长沙理工大学数学与统计学院，湖南长沙
关键词: 投影；共轭梯度法；线搜索；全局收敛；Projected； Conjugate Gradient Method； Line Search； Global Convergence

摘要: 本文提出了一种杂交三阶投影HS-PRP共轭梯度法求解凸约束优化问题并证明了该算法的全局收敛性，该方法是求解无约束优化问题的三阶HS共轭梯度法的推广。数值实验结果表明，该算法是有效的。

Abstract: In this paper, we propose a hybrid third-term projected HS-PRP conjugate gradient method for solving convex constrained optimization problems and establish its global convergence, which is a generalization of the third-term HS conjugate gradient method for unconstrained optimization. Numerical experimental results show that the algorithm is effective.

文章引用：周姣利. 凸约束优化问题的杂交三阶投影HS-PRP方法[J]. 应用数学进展, 2022, 11(8): 5750-5759. https://doi.org/10.12677/AAM.2022.118607

1. 引言

自共轭梯度法被提出以来，因其具有良好的收敛性质，且所需存储量小，因此被广泛用于求解大规模无约束优化问题。

共轭梯度法的基本迭代格式如下：

$x_{k + 1} = x_{k} + α_{k} d_{k}$ ,

$d_{k} = {\begin{cases} - g_{k}, k = 0 \\ - g_{k} + β_{k} d_{k}, k > 0 \end{cases}$ ,

其中 $α_{k}$ 为步长因子，由某种线搜索确定； $d_{k}$ 为搜索方向， $β_{k}$ 为共轭参数， $g_{k} = \nabla f (x_{k})$ 。

共轭参数 $β_{k}$ 的经典选取方式有Fletcher-Reeves [1]，Polak-Ribière-Polyak [2]，Hestenes-Stiefel [3]，Dai-Yuan [4]，Conjugate Descent [5]，Liu-Storey [6] 六种，其具体表达式如下：

$β_{k}^{F R} = \frac{{‖ g_{k} ‖}^{2}}{{‖ g_{k - 1} ‖}^{2}}$ , $β_{k}^{P R R} = \frac{g_{k}^{T} (g_{k} - g_{k - 1})}{{‖ g_{k - 1} ‖}^{2}}$ , $β_{k}^{H S} = \frac{g_{k}^{T} (g_{k} - g_{k - 1})}{d_{k - 1}^{T} (g_{k} - g_{k - 1})}$ ,

$β_{k}^{D Y} = \frac{{‖ g_{k} ‖}^{2}}{d_{k - 1}^{T} (g_{k} - g_{k - 1})}$ , $β_{k}^{C D} = - \frac{{‖ g_{k} ‖}^{2}}{g_{k - 1}^{T} d_{k - 1}}$ , $β_{k}^{L S} = - \frac{g_{k}^{T} (g_{k} - g_{k - 1})}{g_{k - 1}^{T} d_{k - 1}}$ .

其中 $‖ \cdot ‖$ 表示Euclidean范数， $y_{k - 1} = g_{k} - g_{k - 1}$ 。由于分子不同，可将这六种经典的共轭梯度法分为两类。第一类如FR、CD和DY方法，其共轭参数 $β_{k}$ 有共同的分子 ${‖ g_{k} ‖}^{2}$ ，虽然它们具有良好的全局收敛性，但数值表现一般；第二类如PRP、HS和LS方法，其共轭参数 $β_{k}$ 有共同的分子 $g_{k}^{T} (g_{k} - g_{k - 1})$ ，虽然它们拥有良好的数值表现，但对全局收敛的条件要求较强。为得到数值实验和理论结果都较好的共轭梯度法，许多学者对这些经典方法做了修正 [7] [8] [9] [10]。

2007年，Zhang等人在 [11] [12] [13] 的基础上，提出了三阶HS共轭梯度法 [14]，即TTHS方法，搜索方向 $d_{k}$ 的取法如下：

$d_{k} = - g_{k} + β_{k}^{H S} d_{k - 1} + θ_{k} y_{k - 1}$ , $θ_{k} = \frac{g_{k}^{T} d_{k - 1}}{d_{k - 1}^{T} y_{k - 1}}$ .

该方法的优点在于：生成的搜索方向 $d_{k}$ 总满足 $g_{k}^{T} d_{k} = - {‖ g_{k} ‖}^{2}$ ，即不依赖任何线搜索而具有充分下降性。为了得到TTHS方法在标准Wolf线搜索下的全局收敛性，Zhang等人提出了以下两种算法。一种是截断TTHS方法(CTTHS方法)：

$d_{k} = {\begin{cases} - g_{k}, if s_{k}^{T} y_{k} \geq ε_{1} {‖ g_{k} ‖}^{r} s_{k}^{T} s_{k}, \\ - g_{k} + β_{k}^{H S} d_{k - 1} + θ_{k} y_{k - 1}, if s_{k}^{T} y_{k} \geq ε_{1} {‖ g_{k} ‖}^{r} s_{k}^{T} s_{k}, \end{cases}$

其中 $ε_{1}$ 和 $γ$ 是任意正常数。另一种是改进的TTHS方法(MTTHS方法)：

$d_{k} = {\begin{cases} - g_{k} if k = 0, \\ - g_{k} + β_{k}^{M H S} d_{k - 1} - θ_{k}^{M} z_{k - 1} if k > 0, \end{cases}$

其中

$β_{k}^{M H S} = \frac{g_{k}^{T} z_{k - 1}}{d_{k - 1}^{T} z_{k - 1}}$ , $θ_{k}^{M} = \frac{g_{k}^{T} d_{k - 1}}{d_{k - 1}^{T} z_{k - 1}}$ , $z_{k - 1} = y_{k - 1} + t {‖ g_{k} ‖}^{γ} s_{k - 1}$ .

t和 $γ$ 为任意正常数， $y_{k - 1} = g_{k} - g_{k - 1}$ , $s_{k - 1} = x_{k} - x_{k - 1}$ 。

为保证MTTHS方法在修改的Armijo线搜索下的全局收敛性，考虑做如下修改：

$d_{k} = {\begin{cases} - g_{k} if k = 0, \\ - g_{k} + β_{k}^{M H S} d_{k - 1} - θ_{k}^{M} z_{k - 1} if k > 0, \end{cases}$

其中

$β_{k}^{M H S} = \frac{g_{k}^{T} z_{k - 1}}{d_{k - 1}^{T} z_{k - 1}}$ , $θ_{k}^{M} = \frac{g_{k}^{T} d_{k - 1}}{d_{k - 1}^{T} z_{k - 1}}$ , $z_{k} = y_{k} + t_{k} s_{k}$ ,

其中

$y_{k} = g_{k +1} - g_{k}$ , $s_{k} = x_{k + 1} - x_{k}$ , $r \geq 0$ , $t_{k} = 1 + \max {\frac{- y_{k}^{T} s_{k}}{{‖ s_{k} ‖}^{2}}, 0}$ .

1990年，Touati-Ahmed和Storey首次引入了杂交共轭梯度法 [15]，其共轭参数 $β_{k}$ 的取法为： $β_{k}^{T S} = \max {0, \min {β_{k}^{F R}, β_{k}^{P R P}}}$ ，杂交共轭梯度法的提出，使得共轭梯度法的理论性质和数值试验都表现得更佳。随后，许多学者对杂交共轭梯度法做了进一步研究，见文献 [16] [17]。

在杂交共轭梯度法的启发下，本文考虑杂交三项HS-PRP共轭梯度法：

$d_{k} = {\begin{cases} - g_{k} if k = 0, \\ - g_{k} + β_{k} s_{k - 1} - θ_{k} z_{k - 1} if k > 0, \end{cases}$

其中

$β_{k} = \frac{g_{k}^{T} z_{k - 1}}{\max {s_{k - 1}^{T} z_{k - 1}, μ {‖ g_{k - 1} ‖}^{2}}}$ , $θ_{k} = \frac{g_{k}^{T} s_{k - 1}}{\max {s_{k - 1}^{T} z_{k - 1}, μ {‖ g_{k - 1} ‖}^{2}}}$ , $z_{k} = y_{k} + t_{k} s_{k}$ .

其中

$y_{k} = g_{k +1} - g_{k}$ , $s_{k} = x_{k + 1} - x_{k}$ , $t_{k} = 1 + \max {\frac{- y_{k}^{T} s_{k}}{{‖ s_{k} ‖}^{2}}, 0} > 0$ , $μ$ 为任意正常数。

我们注意到，上述共轭梯度法旨在求解无约束优化问题，该方法并不适合直接用于求解约束优化问题。2021年，Zhou提出了一种求解凸约束优化问题的投影PRP方法 [18]，利用投影的性质证明了该算法在修改的Armijo线搜索下具有全局收敛性。本文的目的是推广杂交三阶HS-PRP共轭梯度法求解凸约束优化问题，并证明该算法在修改的Armijo线搜索下的全局收敛性。

本文其余部分组织如下：第二部分详细介绍了求解凸约束优化问题的杂交三阶投影HS-PRP共轭梯度法；第三部分证明该算法的全局收敛性；第四部分给出数值实验结果。

2. 杂交三阶投影HS-PRP共轭梯度法

本文的目的是推广求解无约束优化问题的杂交三阶HS-PRP共轭梯度法用于求解以下凸约束优化问题：

$\min_{x \in Ω} f (x)$ . (1)

其中 $Ω \subseteq R^{n}$ 是闭凸集， $f (x)$ 为 $R^{n} \to R$ 的光滑函数。显然，若 $x^{*}$ 是问题(1)的局部极小点，那么 $x^{*}$ 一定是满足定义2.1的稳定点。

定义2.1. $x^{*} \in Ω$ 是问题(1)的稳定点当且仅当： $g {(x^{*})}^{T} (x - x^{*}) \geq 0$ , $\forall x \in Ω$ 。

定义2.2. 从 $R^{n}$ 到闭凸集 $Ω$ 的投影算子为：

$P_{Ω} = \arg \min_{y \in Ω} ‖ y - x ‖$ . (2)

令

$r_{k} = P_{Ω} (x_{k} - g_{k}) - x_{k}$ . (3)

显然， $x_{k}$ 是问题(1)的稳定点当且仅当 $r_{k} = 0$ 。

算法1. (杂交三阶投影HS-PRP方法)

步0. 取初始点 $x_{0} \in Ω$ , $δ > 0$ , $μ > 0$ , $ρ \in (0, 1)$ , $0 < λ_{\min} < λ_{\max} < \infty$ 。选取一个正序列 ${η_{k}}$ 满足： $\sum_{k = 0}^{\infty} η_{k} \leq η < \infty$ 。令

$d_{0} = - g_{0}$ , $k : = 0$ . (4)

步1. 若 $r_{k} = 0$ , 则停止计算；否则，转步2。

步2. 按如下公式计算 $d_{k}$

$d_{k} = {\begin{cases} - g_{k} if k = 0, \\ - g_{k} + β_{k} s_{k - 1} - θ_{k} z_{k - 1} if k > 0, \end{cases}$ (5)

其中

$y_{k} = g_{k +1} - g_{k}$ , $s_{k} = x_{k + 1} - x_{k}$ , $t_{k} = 1 + \max {\frac{- y_{k}^{T} s_{k}}{{‖ s_{k} ‖}^{2}}, 0} > 0$ . (7)

步3. 计算 $α_{k} = \max {σ_{k} ρ^{j}, j = 0, 1, 2, \dots}$ 满足：

$f (P_{Ω} (x_{k} + α_{k} d_{k})) \leq f (x_{k}) - δ {‖ α_{k} d_{k} ‖}^{2} + η_{k}$ , (8)

其中 $σ_{k} \in [λ_{\min}, λ_{\max}]$ 。

步4. 令 $x_{k + 1} : = P_{Ω} (x_{k} + α_{k} d_{k})$ , $k : = k + 1$ , $s_{k} = x_{k + 1} - x_{k} = P_{Ω} (x_{k} + α_{k} d_{k}) - x_{k}$ ，转步1。

注2.2.

1) 由(3)可知，若 $g_{k} = 0$ ，则 $r_{k} = 0$ ，则 $x_{k}$ 是问题(1)的稳定点；

2) 若 $\max {s_{k - 1}^{T} z_{k - 1}, μ {‖ g_{k - 1} ‖}^{2}} = 0$ ，则 $‖ g_{k - 1} ‖ = 0$ ，这也就意味着 $x_{k - 1}$ 是问题(1)的稳定点；

3) 由 $d_{k}$ 的定义可知：

$d_{k}^{T} g_{k} = - ‖ g_{k} ‖^{2}$ ； (9)

4) 由投影算子的连续性和 $η_{k} > 0$ 可知线搜索(8)对任意充分小的 $α > 0$ 都成立。线搜索(8)来自文献 [19]。

接下来我们将介绍投影算子的一些重要性质，这些性质对我们后面证明该算法的全局收敛性非常有用。引理2.3和引理2.4来自文献 [20]。

引理2.3. 若 $z \in Ω$ ，则有：

${(P_{Ω} (x) - x)}^{T} (z - P_{Ω} (x)) \geq 0, \forall x \in R^{n}$ , (10)

$‖ P_{Ω} (x) - P_{Ω} (y) ‖ \leq ‖ x - y ‖, \forall x, y \in R^{n}$ , (11)

引理2.4. 对任意 $x \in Ω$ , $\frac{‖ P_{Ω} (x - α g (x)) - x ‖}{α}$ 在 $α > 0$ 上非增。

引理2.5. 对任意 $x_{k} \in Ω$ 。有：

$g_{k}^{T} (x_{k} - P_{Ω} (x_{k} - α g_{k})) \geq \frac{{‖ P_{Ω} (x_{k} - α g_{k}) - x_{k} ‖}^{2}}{α}, \forall α > 0$ , (12)

证明：由(10)和 $x_{k} \in Ω$ 可知：

$\begin{array}{l} g_{k}^{T} (x_{k} - P_{Ω} (x_{k} - α g_{k})) \\ = \frac{1}{α} {(x_{k} - P_{Ω} (x_{k} - α g_{k}) + P_{Ω} (x_{k} - α g_{k}) - (x_{k} - α g_{k}))}^{T} (x_{k} - P_{Ω} (x_{k} - α g_{k})) \\ = \frac{{‖ P_{Ω} (x_{k} - α g_{k}) - x_{k} ‖}^{2}}{α} + \frac{1}{α} {(P_{Ω} (x_{k} - α g_{k}) - (x_{k} - α g_{k}))}^{T} (x_{k} - P_{Ω} (x_{k} - α g_{k})) \\ \geq \frac{{‖ P_{Ω} (x_{k} - α g_{k}) - x_{k} ‖}^{2}}{α} \end{array}$

证毕。

3. 全局收敛性

在这一部分，我们将讨论算法1在以下假设条件下的全局收敛性。首先，我们定义水平集：

$Ω_{1} = {x | f (x) \leq f (x_{0}) + η} \cap Ω$ , (13)

其中 $η$ 满足(4)。显然 $x_{k} \in Ω_{1}$ 对任意 $k \geq 0$ 都成立。

假设A.

1) 由(13)定义的水平集 $Ω_{1}$ 是有界的；

2) 存在 $Ω_{1}$ 的某些凸邻域N，使得梯度函数 $g (x)$ 在 $N \cap Ω$ 上Lipschitz连续，即存在常数 $L > 0$ ，使得：

$‖ g (x) - g (y) ‖ \leq L ‖ x - y ‖, \forall x, y \in N \cap Ω$ (14)

由假设A可知存在常数 $M > 0$ ，使得：

$g (x) \leq M, \forall x \in N \cap Ω$ (15)

显然，由线搜索(8)和(4)我们可以得到：

$\lim_{k \to \infty} α_{k} d_{k} = 0$ (16)

引理3.1. 设 ${x_{k}}$ 是由算法1产生的序列且假设A成立，则对任意的 $k \geq 0$ ，有：

$‖ z_{k} ‖ \leq ‖ y_{k} ‖ + t_{k} ‖ s_{k} ‖ \leq (L + t_{k}) ‖ s_{k} ‖$ . (17)

$\begin{matrix} s_{k}^{T} z_{k} = s_{k}^{T} y_{k} + t_{k} {‖ s_{k} ‖}^{2} \\ = {\begin{cases} s_{k}^{T} y_{k} + {‖ s_{k} ‖}^{2} \geq {‖ s_{k} ‖}^{2}, s_{k}^{T} y_{k} \geq 0 \\ s_{k}^{T} y_{k} + {‖ s_{k} ‖}^{2} - s_{k}^{T} y_{k} = {‖ s_{k} ‖}^{2}, s_{k}^{T} y_{k} < 0 \end{cases} \end{matrix}$ . (18)

由(18)可知： $s_{k}^{T} z_{k} \geq {‖ s_{k} ‖}^{2}$ 。

引理3.2. 若假设A成立，则存在常数 $C > 0$ 使得：

$‖ d_{k} ‖ \leq C, \forall k \geq 0$ . (19)

证明：由(5)、(6)、(15)、(17)、(18)可知：

$\begin{matrix} ‖ d_{k} ‖ \leq ‖ g_{k} ‖ + \frac{2 ‖ g_{k} ‖ ‖ z_{k - 1} ‖}{\max {s_{k - 1}^{T} z_{k - 1}, μ {‖ g_{k - 1} ‖}^{2}}} ‖ s_{k - 1} ‖ \\ \leq ‖ g_{k} ‖ + \frac{2 ‖ g_{k} ‖ ‖ z_{k - 1} ‖}{s_{k - 1}^{T} z_{k - 1}} ‖ s_{k - 1} ‖ \\ \leq M + \frac{2 M (L + t_{k - 1}) ‖ s_{k - 1} ‖}{{‖ s_{k - 1} ‖}^{2}} ‖ s_{k - 1} ‖ \\ = M + 2 M (L + t_{k - 1}) \end{matrix}$

令 $C = M + 2 M (L + t_{k - 1})$ 即得(19)，证毕。

定理3.3. 设 ${x_{k}}$ 是由算法1产生的序列且假设A成立，则有：

$\underset{k \to \infty}{\lim \inf} ‖ r_{k} ‖ = 0$ . (20)

证明：反证法，假设结论不成立，则存在常数 $τ > 0$ 使得：

$‖ r_{k} ‖ \geq τ, \forall k \geq 0$ . (21)

由(21)可知存在常数 $ε > 0$ ，使得：

$‖ g_{k} ‖ \geq ε, \forall k \geq 0$ . (22)

否则存在无限子集 $K \subseteq {0, 1, 2, \dots}$ 使得：

$\lim_{k \in K, k \to \infty} ‖ r_{k} ‖ = \lim_{k \in K, k \to \infty} ‖ P_{Ω} (x_{k} - g_{k}) - x_{k} ‖ \leq \lim_{k \in K, k \to \infty} ‖ g_{k} ‖ = 0$ . (23)

最后一个不等式由(11)和 $P_{Ω} (x_{k}) = x_{k}$ 可得，因此上式与(21)矛盾，即(22)成立。

1) 若 $\underset{k \to \infty}{\lim \sup} α_{k} > 0$ ，由(9)和(16)可得： $\underset{k \to \infty}{\lim \inf} ‖ g_{k} ‖ = 0$ 。这与(22)式矛盾。

2) 若 $\underset{k \to \infty}{\lim \sup} α_{k} = 0$ ，则存在 ${α^{'}}_{k} = \frac{α_{k}}{ρ}$ 不满足不等式(8)，即：

$f (P_{Ω} (x_{k} + {α^{'}}_{k} d_{k})) - f (x_{k}) > - δ {‖ {α^{'}}_{k} d_{k} ‖}^{2} + η_{k} > - δ {‖ {α^{'}}_{k} d_{k} ‖}^{2}$ . (24)

由拉格朗日中值定理和引理2.5可得：

$\begin{array}{l} \frac{f (P_{Ω} (x_{k} + {α^{'}}_{k} d_{k})) - f (x_{k})}{{α^{'}}_{k}} \\ = \frac{g {(ξ_{k})}^{T} (P_{Ω} (x_{k} + {α^{'}}_{k} d_{k}) - x_{k})}{{α^{'}}_{k}} \\ = \frac{g_{k}^{T} (P_{Ω} (x_{k} - {α^{'}}_{k} g_{k}) - x_{k})}{{α^{'}}_{k}} + \frac{{(g (ξ_{k}) - g_{k})}^{T} (P_{Ω} (x_{k} + {α^{'}}_{k} d_{k}) - x_{k})}{{α^{'}}_{k}} \\ + \frac{g_{k}^{T} (P_{Ω} (x_{k} + {α^{'}}_{k} d_{k}) - P_{Ω} (x_{k} - {α^{'}}_{k} g_{k}))}{{α^{'}}_{k}} \\ = \frac{g_{k}^{T} (P_{Ω} (x_{k} - {α^{'}}_{k} g_{k}) - x_{k})}{{α^{'}}_{k}} + Δ_{k} \\ \leq - \frac{{‖ P_{Ω} (x_{k} - {α^{'}}_{k} g_{k}) - x_{k} ‖}^{2}}{{α^{'}}_{k}^{2}} + Δ_{k}, \end{array}$

其中 $ξ_{k}$ 介于 $x_{k}$ 和 $P_{Ω} (x_{k} + {α^{'}}_{k} d_{k})$ 之间。上述不等式结合(24)可得：

$\frac{{‖ P_{Ω} (x_{k} - {α^{'}}_{k} g_{k}) - x_{k} ‖}^{2}}{{α^{'}}_{k}^{2}} \leq | Δ_{k} | + δ {α^{'}}_{k} {‖ d_{k} ‖}^{2}$ . (25)

由(11)和(15)可得：

$\begin{matrix} | Δ_{k} | \leq ‖ g (ξ_{k}) - g_{k} ‖ ‖ \frac{P_{Ω} (x_{k} + {α^{'}}_{k} d_{k}) - x_{k}}{{α^{'}}_{k}} ‖ + ‖ g_{k} ‖ ‖ \frac{P_{Ω} (x_{k} + {α^{'}}_{k} d_{k}) - P_{Ω} (x_{k} - {α^{'}}_{k} g_{k})}{{α^{'}}_{k}} ‖ \\ \leq ‖ g (ξ_{k}) - g_{k} ‖ ‖ d_{k} ‖ + M ‖ d_{k} + g_{k} ‖ \\ \leq C ‖ g (ξ_{k}) - g_{k} ‖ + M ‖ d_{k} + g_{k} ‖, \end{matrix}$

由(5)、(6)、(11)、(15)、(17)、(22)以及 $α_{k} \to 0$ 可得：

$\begin{matrix} \lim_{k \to \infty} ‖ d_{k} + g_{k} ‖ \leq \lim_{k \to \infty} \frac{2 ‖ g_{k} ‖ ‖ z_{k - 1} ‖}{\max {s_{k - 1}^{T} z_{k - 1}, μ {‖ g_{k - 1} ‖}^{2}}} ‖ s_{k - 1} ‖ \\ \leq \lim_{k \to \infty} \frac{2 M (L + t_{k - 1}) ‖ s_{k - 1} ‖}{μ {‖ g_{k - 1} ‖}^{2}} ‖ s_{k - 1} ‖ \\ \leq \lim_{k \to \infty} \frac{2 M (L + t_{k - 1}) {‖ α_{k - 1} d_{k - 1} ‖}^{2}}{μ ε^{2}} \\ = 0 \end{matrix}$ (26)

因此，由 $g (x)$ 的连续性和 ${α^{'}}_{k} \to 0$ 以及(26)可知： $Δ_{k} \to 0$ 。

由(3)、(19)、(25)，引理2.4以及 ${α^{'}}_{k} \to 0$ ，我们可以得到：

${‖ r_{k} ‖}^{2} = {‖ P_{Ω} (x_{k} - g_{k}) - x_{k} ‖}^{2} \leq \frac{{‖ P_{Ω} (x_{k} - {α^{'}}_{k} g_{k}) - x_{k} ‖}^{2}}{{α^{'}}_{k}^{2}} \leq | Δ_{k} | + δ {α^{'}}_{k} {‖ d_{k} ‖}^{2} \to 0$ .

这与(21)矛盾，证毕。

4. 数值实验

在这一部分我们将通过数值实验来验证本文所提出算法的有效性。实验测试在PC机上完成，PC机配置：联想，Intel(R) Core(TM) i7-8700 CPU @ 3.20GHz 3.19GHz，8Gb内存，Windows10操作系统，所有代码用Matlab R2016b编写并运行。

测试对象：函数来自文献 [18]，表达式如下：

$f (x) = \frac{1}{2} \sum_{i = 1}^{n - 1} {(x_{i} - x_{i - 1})}^{2} + \frac{1}{12} \sum_{i = 1}^{n - 1} γ_{i} {(x_{i} - x_{i - 1})}^{4} + \frac{1}{2} x^{T} x$ .

约束集 $Ω = {x | - 10 \leq x_{i} \leq 10, i = 1, 2, \dots, n}$ ，其中 $γ_{i} \geq 0 (i = 1, 2, \dots, n - 1)$ 为任意常数。

令 $γ = {[γ_{1}, γ_{2}, \dots, γ_{n - 1}]}^{T}$ 。

测试参数： $δ = 0.1$ , $ρ = 0.1$ , $μ = 1$ , $λ_{\max} = λ_{\min} = 1$ , $η_{k} = {0.5}^{k}$ 。

初始点： $x_{0} = {(- 1.2, 1, - 1.2, 1 \dots, - 1.2, 1)}^{T}$ 。

终止条件：迭代次数 $k \geq 500$ 或 ${‖ r_{k} ‖}_{\infty} \leq 10^{- 5}$ ，其中 ${‖ r_{k} ‖}_{\infty}$ 表示迭代终止时 $r_{k}$ 的无穷范数。

采用本文提出的算法与Zhou在文献 [18] 中提出的投影PRP算法求解上述测试问题，分别记为算法1和算法2，测试结果见表1和表2。

Table 1. Test function with γ = ( 1 , 2 , ⋯ , n − 1 ) T

表1. 测试函数中 $γ = {(1, 2, \dots, n - 1)}^{T}$

Table 2. Test function with γ = 1 n ( 1 2 , 2 2 , ⋯ , ( n − 1 ) 2 ) T

表2. 测试函数中 $γ = \frac{1}{n} {(1^{2}, 2^{2}, \dots, {(n - 1)}^{2})}^{T}$

由表1和表2的数据我们可以知道，在迭代次数和运行时间两个方面，本文提出的算法优于 [18] 提出的投影PRP方法。

5. 结束语

本文提出了一种求解凸约束优化问题的杂交三阶投影HS-PRP共轭梯度法，它是求解无约束优化问题的共轭梯度法的推广。利用投影的相关性质，我们证明了该算法在修改的Armijo线搜索下的全局收敛性。数值结果表明，本文所提出的算法较投影PRP算法更优。

参考文献

参考文献

[1]	Fletcher. R. and Reeves, C.M. (1964) Function Minimization by Conjugate Gradients. The Computer Journal, 7, 149-154. https://doi.org/10.1093/comjnl/7.2.149
[2]	Polyak, B.T. (1969) The Conjugate Gradient Method in Ex-treme problems. USSR Computational Mathematics and Mathematical Physics, 9, 94-112. https://doi.org/10.1016/0041-5553(69)90035-4
[3]	Hestenes, M.R. and Stiefel, E. (1952) Method of Conjugate Gradient for Solving Linear System. Journal of Research of the National Bureau of Standards, 49, 409-436. https://doi.org/10.6028/jres.049.044
[4]	Dai, Y.H. and Yuan, Y. (1999) A Nonlinear Conjugate Gradient Method with a Strong Global Convergence Property. SIAM Journal on Optimization, 10, 177-182. https://doi.org/10.1137/S1052623497318992
[5]	Fletcher, R. (1987) Practical Methods of Optimization, Vol. 1: Unconstrained Optimization. Wiley & Sons, New York.
[6]	Liu, Y. and Storey, C. (1991) Efficient Generalized Con-jugate Gradient Algorithms, Part 1: Theory. Journal of Optimization Theory and Applications, 69, 129-137. https://doi.org/10.1007/BF00940464
[7]	Zhou, W. and Li, D. (2014) On the Convergence Properties of the Un-modified PRP Method with a Non-Descent Line Search. Optimization Methods Software, 29, 484-496. https://doi.org/10.1080/10556788.2013.811241
[8]	Hager, W.W. and Zhang, H. (2005) A New Conjugate Gra-dient Method with Guaranteed Descent and an Efficient Line Search. SIAM Journal on Optimization, 16, 170-192. https://doi.org/10.1137/030601880
[9]	Gilbert, J.C. (1994) Convergence Properties of Conjugate Descent Method for Optimization. SIAM Journal on Optimization, 2, 24-32.
[10]	杨萌, 王祥玲. 修正HS共轭梯度法的全局收敛性[J]. 桂林电子科技大学学报, 2009, 29(4): 300-302.
[11]	Zhang, L., Zhou, W. and Li, D. (2006) A Descent Modified Polak-Ribière-Polyak Conjugate Gradient Method and Its Global Convergence. IMA J Numerical Analysis, 26, 629-640. https://doi.org/10.1093/imanum/drl016
[12]	Zhang, L., Zhou, W. and Li, D. (2006) Global Convergence of a Modi-fied Fletcher Reeves Conjugate Gradient Method with Armijo-Type Line Search. Numerische Mathematik, 104, 561-572. https://doi.org/10.1007/s00211-006-0028-z
[13]	Li, D.H. and Fukushima, M. (2001) A Modified BFGS Method and Its Global Convergence in Nonconvex Minimization. Journal of Computational and Applied Mathematics, 129, 15-35. https://doi.org/10.1016/S0377-0427(00)00540-9
[14]	Zhang, L., Zhou, W. and Li, D. (2007) Some Descent Three-Term Conjugate Gradient Methods and Their Global Convergence. Optimization Methods and Software, 22, 697-711. https://doi.org/10.1080/10556780701223293
[15]	Touati-Ahmed, D. and Story, C. (1990) Global Con-vergent Hybrid Conjugate Gradient Method. Journal of Optimization Theory and Applications, 64, 379-397. https://doi.org/10.1007/BF00939455
[16]	Dai, Y.H. and Yuan, Y. (2001) An Efficient Hybrid Conjugate Method for Unconstrained Optimization. Annals of Operations Research, 103, 33-47. https://doi.org/10.1023/A:1012930416777
[17]	Dai, Z.F. and Wen, F.H. (2015) Comments on Another Hybrid Conjugate Gradient Algorithm for Unconstrained Optimization by Andrei. Numerical Algorithms, 69, 337-341. https://doi.org/10.1007/s11075-014-9899-8
[18]	Zhou, W. (2021) A Projected PRP Method for Optimization with Convex Constraint. Pacilici Journal of Optimization, 17, 47-55.
[19]	Zhou W. (2013) A Short Note on the Global Con-vergence of the Unmodified PRP Method. Optimization Letters, 7, 1367-1372. https://doi.org/10.1007/s11590-012-0511-7
[20]	Calamai, P.H. and Moré, J.J. (1987) Projected Gradient Methods for Linearly Constrained Problems. Mathematical Programming, 39, 93-116. https://doi.org/10.1007/BF02592073

为你推荐

友情链接