非扩张映射的广义修正两步惯性Mann Halpern算法

doi:10.12677/aam.2025.148380

期刊菜单

非扩张映射的广义修正两步惯性Mann Halpern算法
Generalized Modified Two-Step Inertial Mann Halpern Algorithm for Nonexpansive Mappings

DOI: 10.12677/aam.2025.148380, PDF, HTML, XML,
作者: 李钱涛：福州大学数学与统计学院，福建福州
关键词: 两步惯性；Mann算法；非扩张映射；强收敛性；Two-Step Inertial； Mann Algorithm； Nonexpansive Mapping； Strong Convergence

摘要: 受广义Krasnoselskii-Mann算法和两步惯性项应用的启发，本文提出了一种求解非扩张映射不动点问题的广义修正两步惯性Mann Halpern算法。在一定合适的条件下，本文证明了算法的强收敛性。在数值实验中，本文将算法用于解决凸可行问题。数值结果表明，在某些情况下，该算法更具优势。

Abstract: Motivated by the application generalized Krasnoselskii-Mann algorithm and two-step inertial extrapolation, this paper proposes a generalized modified two-step inertial Mann Halpern algorithm for solving fixed point problems with nonexpansive mapping. Under mild assumptions, the strong convergence of the proposed method are established. In numerical experiment, a convex feasibility problem is solved. Numerical results demonstrate that our algorithm has advantages in some cases.

文章引用：李钱涛. 非扩张映射的广义修正两步惯性Mann Halpern算法[J]. 应用数学进展, 2025, 14(8): 160-169. https://doi.org/10.12677/aam.2025.148380

1. 引言

设 $ℋ$ 是一个实Hilbert空间， $〈 \cdot, \cdot 〉$ 和 $‖ \cdot ‖$ 分别为其内积及诱导的范数。设 $C$ 是 $ℋ$ 的一个非空闭凸子集。映射 $T : C \to C$ 称为非扩张的，即

$‖ T (x) - T (y) ‖ \leq ‖ x - y ‖, \forall x, y \in C$ .

集合 $Fix (T) : = {x \in C | T (x) = x}$ 代表映射 $T$ 的不动点集。

本文我们主要考虑如下不动点问题：寻找 $x^{*} \in C$ ，使得 $T (x^{*}) = x^{*}$ ，其中 $T$ 是不动点非空的非扩张映射。求解非扩张映射不动点问题是优化理论、非线性分析及其在信号处理、机器学习等领域应用中的一个核心课题。经典的求解不动点的方法有Picard迭代算法。但该算法仅适用于压缩映射，对于非扩张映射可能不收敛。

一种著名的求解非扩张映射不动点方法是Krasnoselskii-Mann迭代[1]-[3] (之后简称为KM迭代)。选定初始点 $x_{0} \in C$ ，该迭代更新步骤为：

$x_{n + 1} = α_{n} x_{n} + (1 - α_{n}) T (x_{n})$ , (1)

其中， $α_{n} \in (0, 1)$ ，由(1)所定义的序列 ${x_{n}}$ 在 $\sum_{n = 0}^{\infty} α_{n} (1 - α_{n}) = + \infty$ 的条件下弱收敛于 $T$ 的不动点。

基于上述KM迭代，Kanzow [4]等人于2017年进一步提出了广义KM迭代，给定初始点 $x_{0} \in C$ ，迭代步骤为：

$x_{n + 1} = α_{n} x_{n} + β_{n} T (x_{n}) + e_{n}$ , (2)

其中， $α_{n}, β_{n} \in [0, 1]$ ， $α_{n} + β_{n} \leq 1$ ， ${e_{n}}$ 被称为残差向量。由(2)定义的序列 ${x_{n}}$ 弱收敛于 $T$ 的不动点的充分条件为： $\sum_{n = 0}^{\infty} α_{n} β_{n} = + \infty$ ， $\sum_{n = 0}^{\infty} ‖ e_{n} ‖ < + \infty$ 及 $\sum_{n = 0}^{\infty} (1 - α_{n} - β_{n}) < + \infty$ 。

Halpern迭代是另一种求解非扩张映射不动点的有效方法。它最早于1967年由Halpern [5]提出。关于Halpern迭代进一步的研究见文献[6]-[9]。基于KM迭代和Halpern迭代，Kim和Xu [10]提出了一种修正Mann迭代并证明了该算法的强收敛性。其主要步骤如下：

${\begin{array}{l} y_{n} = λ_{n} x_{n} + (1 - λ_{n}) T (x_{n}) \\ x_{n + 1} = α_{n} u + (1 - α_{n}) T (y_{n}), \end{array}$ (3)

其中， $u, x_{0} \in C$ ， $α_{n}, λ_{n} \in (0, 1)$ 。该迭代的收敛性条件见文献[10]。

一般而言，Mann迭代的收敛速率是比较慢的。惯性加速是一种著名的加快收敛速率的方法，它最早由Polyak [11]提出。Mainge [12]首次提出了惯性Mann算法，该算法由KM迭代和惯性加速结合。惯性加速也被用于分裂算法中，例如惯性Douglas-Rachford分裂算法[13]和惯性前向后向分裂算法[14]。Tan [15]等人通过引入惯性项改进了算法(3)，提出了一种修正惯性Mann Halpern算法，其迭代形式为：

${\begin{array}{l} w_{n} = x_{n} + α_{n} (x_{n} - x_{n - 1}) \\ y_{n} = λ_{n} w_{n} + (1 - λ_{n}) T (w_{n}) \\ x_{n + 1} = θ_{n} u + (1 - θ_{n}) y_{n} \end{array}$ (4)

其中， $x_{0}, x_{1}, u \in C$ ， $λ_{n}, θ_{n} \in (0, 1)$ 。由算法(4)定义的序列 ${x_{n}}$ 在一定条件下是强收敛的，具体细节见文献[15]。

除了一步惯性以外，多步惯性加速也被一些研究者讨论。Iyiola [16]等曾指出一步惯性在某些可行性问题下可能存在加速失败的情况。在文献[16]中，他们提出了两步惯性临近点算法并证明了算法的弱收敛性。在[16]的数值实验中，两步惯性临近点算法比一步惯性临近点算法收敛更快。这表明两步惯性的应用是有意义的。两步惯性可表示为：

$x_{n + 1} = x_{n} + α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2})$ ,

其中 $α_{n} > 0$ ， $β_{n} < 0$ 。

受Kanzow [4]和Iyiola [16]启发，本文推广了Tan [15]提出的算法，提出了广义修正两步惯性Mann Halpern算法：

${\begin{array}{l} w_{n} = x_{n} + α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2}) \\ y_{n} = u_{n} w_{n} + v_{n} T (w_{n}) + e_{n} \\ x_{n + 1} = θ_{n} u + (1 - θ_{n}) y_{n} \end{array}$ (5)

其中， $x_{0}, x_{1}, x_{2}, u \in C$ ， $α_{n}, u_{n}, v_{n}, e_{n}, θ_{n} \in (0, 1)$ ， $β_{n} \in (- 1, 0]$ 且 $u_{n} + v_{n} \leq 1$ 。算法(5)在算法(4)的基础上添加了两步惯性项并推广了Mann迭代步的系数，在取值上更为灵活。

本文的结构如下：在第二节，我们会给出一些证明定理所用到的引理。在第三节，我们将证明在一定条件下广义修正两步惯性Mann Halpern算法的强收敛性。在第四节，我们将用算法(4)和算法(5)去求解凸可行问题并比较它们的表现。

本文中，序列 ${x_{n}}$ 强收敛于 $x^{*}$ 记为 $x_{n} \to x^{*}$ ，序列 ${x_{n}}$ 弱收敛于 $x^{*}$ 记为 $x_{n} ⇀ x^{*}$ 。本文中，均假设 $T$ 是非扩张的且 $Fix (T) \neq \emptyset$ 。符号 $Π_{C} (x)$ 表示实Hilbert空间中 $x$ 在集合 $C$ 上的投影，即 $Π_{C} (x) : = \underset{y \in C}{\arg \min} ‖ x - y ‖$ 。

2. 预备知识

本节将给出一些后续证明所需要的引理。

引理1. $\forall x, y \in ℋ$ ，有以下事实：

1) ${‖ x + y ‖}^{2} \leq {‖ x ‖}^{2} + 2 〈 y, x + y 〉$ ；

2) ${‖ s x + t y ‖}^{2} = s (s + t) {‖ x ‖}^{2} + t (s + t) {‖ y ‖}^{2} - s t {‖ x - y ‖}^{2}$ ， $\forall s, t \in ℝ$ ；

3) ${‖ x + y ‖}^{2} \leq 2 ({‖ x ‖}^{2} + {‖ y ‖}^{2})$ 。

引理2. [17]设 $C$ 是实Hilbert空间 $ℋ$ 中的一个非空闭凸集， $T$ ： $C \to C$ 是一个非扩张映射， $x^{*} \in ℋ$ 。 $C$ 中的序列 ${x_{n}}$ 满足 $n \to + \infty$ 时， $x_{n} ⇀ x^{*}$ 且 $T (x_{n}) - x_{n} \to 0$ ，则 $x^{*} \in Fix (T)$ 。

引理3. [14]设 ${b_{n}}$ 是非负实序列且满足：

$b_{n + 1} \leq (1 - γ_{n}) b_{n} + γ_{n} δ_{n}$ 及 $b_{n + 1} \leq b_{n} - t_{n} + q_{n}$ ，

其中， ${γ_{n}}$ 是(0，1)的序列， ${t_{n}}$ 是非负实序列。若实序列 ${δ_{n}}$ ， ${q_{n}}$ 满足以下三个条件：

1) $\sum_{n = 0}^{\infty} γ_{n} = + \infty$ ，

2) $\lim_{n \to + \infty} q_{n} = 0$ ，

3) ${t_{n}}$ 的任意子序列 ${t_{n_{k}}}$ 满足 $\lim_{k \to + \infty} t_{n_{k}} = 0$ 蕴含 $\underset{k \to + \infty}{\lim \sup} δ_{n_{k}} \leq 0$ 。

则 $\lim_{n \to + \infty} b_{n} = 0$ 。

3. 算法及收敛性分析

本节将分析在一定条件下广义修正两步惯性Mann Halpern算法的强收敛性。我们再给出广义修正两步惯性Mann Halpern算法的迭代步骤：

定理3.1：设 $C$ 是实Hilbert空间 $ℋ$ 中的一个非空闭凸集， $T : C \to C$ 是一个非扩张映射且 $T$ 至少有一个不动点。取 $u \in C$ ，序列 $α_{n}, u_{n}, v_{n}, e_{n}, θ_{n} \in (0, 1), β_{n} \in (- 1, 0]$ 且 $u_{n} + v_{n} \leq 1$ 。若下述条件成立：

(C₁) $\lim_{n \to + \infty} θ_{n} = 0, \sum_{n = 0}^{+ \infty} θ_{n} = + \infty$ ，

(C₂) $\lim_{n \to + \infty} \frac{α_{n} ‖ x_{n} - x_{n - 1} ‖}{θ_{n}} = 0, \lim_{n \to + \infty} \frac{β_{n} ‖ x_{n - 1} - x_{n - 2} ‖}{θ_{n}} = 0$ ，

(C₃) $\lim_{n \to + \infty} \frac{1 - u_{n} - v_{n}}{θ_{n}} = 0, \sum_{n = 0}^{\infty} (1 - u_{n} - v_{n}) < + \infty$ 且 $\inf_{n \geq 1} u_{n} > 0, \inf_{n \geq 1} v_{n} > 0$ ，

(C₄) $\sum_{n = 0}^{\infty} ‖ e_{n} ‖ < + \infty, \lim_{n \to + \infty} \frac{‖ e_{n} ‖}{θ_{n}} = 0$ 。

对于 $x_{0}, x_{1}, x_{2} \in C$ 。由算法(6)生成的序列 ${x_{n}}$ 强收敛于 $p = Π_{Fix (T)} (u)$ 。

证明：我们先证明 ${x_{n}}, {y_{n}}, {w_{n}}, {T (w_{n})}$ 有界。取 $p \in Fix (T)$ ，则

$‖ x_{n + 1} - p ‖ = ‖ θ_{n} (u - p) + (1 - θ_{n}) (y_{n} - p) ‖ \leq θ_{n} ‖ u - p ‖ + (1 - θ_{n}) ‖ y_{n} - p ‖$ . (7)

由(7)得，

$\begin{matrix} ‖ y_{n} - p ‖ = ‖ u_{n} (w_{n} - p) + v_{n} (T (w_{n}) - p) + e_{n} - (1 - u_{n} - v_{n}) p ‖ \\ \leq u_{n} ‖ w_{n} - p ‖ + v_{n} ‖ T (w_{n}) - p ‖ + ‖ e_{n} - (1 - u_{n} - v_{n}) p ‖ \\ \leq ‖ w_{n} - p ‖ + (1 - u_{n} - v_{n}) ‖ e_{n} - p ‖ + (u_{n} + v_{n}) ‖ e_{n} ‖ \end{matrix}$ (8)

第二个不等式成立是因为 $T$ 是非扩张的且 $u_{n} + v_{n} \leq 1$ 。除此之外，

$\begin{matrix} ‖ w_{n} - p ‖ = ‖ x_{n} + α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2}) - p ‖ \\ \leq ‖ x_{n} - p ‖ + α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖ \end{matrix}$ (9)

将(8)和(9)代入(7)式得到，

$\begin{matrix} ‖ x_{n + 1} - p ‖ \leq (1 - θ_{n}) ‖ x_{n} - p ‖ + θ_{n} (‖ u - p ‖ + \frac{α_{n}}{θ_{n}} (1 - θ_{n}) ‖ x_{n} - x_{n - 1} ‖ + \frac{| β_{n} |}{θ_{n}} (1 - θ_{n}) ‖ x_{n - 1} - x_{n - 2} ‖) \\ + (1 - θ_{n}) (1 - u_{n} - v_{n}) ‖ e_{n} - p ‖ + (1 - θ_{n}) (u_{n} + v_{n}) ‖ e_{n} ‖ \end{matrix}$

由条件(C₂)，我们可以推得 $sup_{n \geq 0} {\frac{α_{n}}{θ_{n}} (1 - θ_{n}) ‖ x_{n} - x_{n - 1} ‖ + \frac{| β_{n} |}{θ_{n}} (1 - θ_{n}) ‖ x_{n - 1} - x_{n - 2} ‖}$ 可以足够小，设

$M = 2 max {‖ u - p ‖, sup_{n \geq 0} {\frac{α_{n}}{θ_{n}} (1 - θ_{n}) ‖ x_{n} - x_{n - 1} ‖ + \frac{| β_{n} |}{θ_{n}} (1 - θ_{n}) ‖ x_{n - 1} - x_{n - 2} ‖}}$ ,

则 $M < + \infty$ 。又由于 $u_{n} + v_{n} \leq 1$ ，我们得到，

$\begin{matrix} ‖ x_{n + 1} - p ‖ \leq (1 - θ_{n}) ‖ x_{n} - p ‖ + θ_{n} M + (1 - u_{n} - v_{n}) ‖ e_{n} - p ‖ + ‖ e_{n} ‖ \\ \leq max {‖ x_{n} - p ‖, M} + (1 - u_{n} - v_{n}) ‖ e_{n} - p ‖ + ‖ e_{n} ‖ \end{matrix}$

进而，

$‖ x_{n + 1} - p ‖ \leq \dots \leq max {‖ x_{0} - p ‖, M} + \sum_{i = 0}^{n} (1 - u_{i} - v_{i}) ‖ e_{i} - p ‖ + \sum_{i = 0}^{n} ‖ e_{i} ‖$ .

结合条件(C₃)和条件(C₄)可得，

$\sum_{i = 0}^{n} (1 - u_{i} - v_{i}) ‖ e_{i} - p ‖ \leq \sum_{i = 0}^{n} (1 - u_{i} - v_{i}) (‖ e_{i} ‖ + ‖ p ‖) < + \infty$ .

则 ${x_{n} - p}, {x_{n}}$ 有界。又由于，

$\begin{matrix} ‖ w_{n} ‖ = ‖ x_{n} + α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2}) ‖ \\ \leq ‖ x_{n} ‖ + α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖ \end{matrix}$

结合条件(C₁)和条件(C₂)，可以推得 $α_{n} ‖ x_{n} - x_{n - 1} ‖$ 是有限的。类似地， $β_{n} ‖ x_{n - 1} - x_{n - 2} ‖$ 也是有限的，从而 ${w_{n}}, {w_{n} - p}$ 是有界的。 $T$ 是非扩张的，则 $‖ T (w_{n}) - p ‖ \leq ‖ w_{n} - p ‖$ ，这说明 ${T (w_{n})}, {y_{n}}$ 是有界的。

接下来，我们将证明 ${x_{n}}$ 强收敛于 $p = Π_{Fix (T)} (u)$ 。由 $x_{n}$ 的定义及引理1(1)可得，

$\begin{matrix} {‖ x_{n + 1} - p ‖}^{2} = {‖ (1 - θ_{n}) (y_{n} - p) + θ_{n} (u - p) ‖}^{2} \\ \leq {(1 - θ_{n})}^{2} {‖ y_{n} - p ‖}^{2} + 2 〈 θ_{n} (u - p), x_{n + 1} - p 〉 \\ \leq (1 - θ_{n}) {‖ y_{n} - p ‖}^{2} + 2 θ_{n} 〈 (u - p), x_{n + 1} - p 〉 \end{matrix}$ (10)

再由 $y_{n}$ 的定义及引理1(1)，(2)可知，

$\begin{matrix} {‖ y_{n} - p ‖}^{2} = {‖ u_{n} (w_{n} - p) + v_{n} (T (w_{n}) - p) + e_{n} - (1 - u_{n} - v_{n}) p ‖}^{2} \\ \leq {‖ u_{n} (w_{n} - p) + v_{n} (T (w_{n}) - p) ‖}^{2} + 2 〈 (u_{n} + v_{n} - 1) p + e_{n}, y_{n} - p 〉 \\ = u_{n} (u_{n} + v_{n}) {‖ w_{n} - p ‖}^{2} + v_{n} (u_{n} + v_{n}) {‖ T (w_{n}) - p ‖}^{2} - u_{n} v_{n} {‖ w_{n} - T (w_{n}) ‖}^{2} \\ + 2 (u_{n} + v_{n} - 1) 〈 p, y_{n} - p 〉 + 2 〈 e_{n}, y_{n} - p 〉 \\ \leq {‖ w_{n} - p ‖}^{2} - u_{n} v_{n} {‖ w_{n} - T (w_{n}) ‖}^{2} + 2 (u_{n} + v_{n} - 1) 〈 p, y_{n} - p 〉 + 2 〈 e_{n}, y_{n} - p 〉 \end{matrix}$ (11)

(11)式中的第二个不等式是因为 $T$ 是非扩张且 $u_{n} + v_{n} \leq 1$ 。为方便讨论，我们记

$ϕ_{n} : = 2 (u_{n} + v_{n} - 1) 〈 p, y_{n} - p 〉 + 2 〈 e_{n}, y_{n} - p 〉$ .

由 $w_{n}$ 的定义知，

$\begin{matrix} {‖ w_{n} - p ‖}^{2} = {‖ x_{n} + α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2}) - p ‖}^{2} \\ = {‖ x_{n} - p ‖}^{2} + {‖ α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2}) ‖}^{2} + 2 〈 α_{n} (x_{n} - x_{n - 1}) + β_{n} (x_{n - 1} - x_{n - 2}), x_{n} - p 〉 \\ \leq {‖ x_{n} - p ‖}^{2} + 2 α_{n}^{2} {‖ x_{n} - x_{n - 1} ‖}^{2} + 2 β_{n}^{2} {‖ x_{n - 1} - x_{n - 2} ‖}^{2} + 2 〈 w_{n} - x_{n}, x_{n} - p 〉 \\ {‖ x_{n} - p ‖}^{2} + 2 {‖ w_{n} - x_{n} ‖}^{2} - 4 α_{n} β_{n} 〈 x_{n} - x_{n - 1}, x_{n - 1} - x_{n - 2} 〉 + 2 〈 w_{n} - x_{n}, x_{n} - p 〉 \\ \leq {‖ x_{n} - p ‖}^{2} + 2 〈 w_{n} - x_{n}, w_{n} - p 〉 - 4 α_{n} β_{n} ‖ x_{n} - x_{n - 1} ‖ \cdot ‖ x_{n - 1} - x_{n - 2} ‖ \\ \leq {‖ x_{n} - p ‖}^{2} + 2 ‖ w_{n} - p ‖ (α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖) - 4 α_{n} β_{n} ‖ x_{n} - x_{n - 1} ‖ \cdot ‖ x_{n - 1} - x_{n - 2} ‖ \end{matrix}$ (12)

第一个和第二个不等式分别由引理1 (3)和Cauchy-Schwarz不等式得到。注意到 $β_{n} < 0$ ，将等式(11)和(12)代入(10)可得，

$\begin{matrix} {‖ x_{n + 1} - p ‖}^{2} \leq (1 - θ_{n}) {‖ x_{n} - p ‖}^{2} + 2 (1 - θ_{n}) ‖ w_{n} - p ‖ (α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖) \\ - 4 α_{n} β_{n} (1 - θ_{n}) ‖ x_{n} - x_{n - 1} ‖ \cdot ‖ x_{n - 1} - x_{n - 2} ‖ + 2 θ_{n} 〈 u - p, x_{n + 1} - p 〉 \\ - (1 - θ_{n}) u_{n} v_{n} {‖ w_{n} - T (w_{n}) ‖}^{2} + (1 - θ_{n}) ϕ_{n} \end{matrix}$ (13)

又因为 $θ_{n}, λ_{n} \subset (0, 1)$ ，可以进一步得到

$\begin{matrix} {‖ x_{n + 1} - p ‖}^{2} \leq (1 - θ_{n}) {‖ x_{n} - p ‖}^{2} + 2 ‖ w_{n} - p ‖ (α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖) \\ - 4 α_{n} β_{n} ‖ x_{n} - x_{n - 1} ‖ \cdot ‖ x_{n - 1} - x_{n - 2} ‖ + 2 θ_{n} 〈 u - p, x_{n + 1} - p 〉 + (1 - θ_{n}) ϕ_{n} \end{matrix}$ (14)

以及

$\begin{matrix} {‖ x_{n + 1} - p ‖}^{2} \leq {‖ x_{n} - p ‖}^{2} + 2 ‖ w_{n} - p ‖ (α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖) - 4 α_{n} β_{n} ‖ x_{n} - x_{n - 1} ‖ \cdot ‖ x_{n - 1} - x_{n - 2} ‖ \\ + 2 θ_{n} 〈 u - p, x_{n + 1} - p 〉 - (1 - θ_{n}) u_{n} v_{n} {‖ w_{n} - T (w_{n}) ‖}^{2} + (1 - θ_{n}) ϕ_{n} \end{matrix}$ (15)

令 $b_{n} = {‖ x_{n} - p ‖}^{2}, γ_{n} = θ_{n}, t_{n} = (1 - θ_{n}) u_{n} v_{n} {‖ w_{n} - T (w_{n}) ‖}^{2}$ ，

$\begin{matrix} q_{n} = 2 ‖ w_{n} - p ‖ (α_{n} ‖ x_{n} - x_{n - 1} ‖ + | β_{n} | ‖ x_{n - 1} - x_{n - 2} ‖) - 4 α_{n} β_{n} ‖ x_{n} - x_{n - 1} ‖ \cdot ‖ x_{n - 1} - x_{n - 2} ‖ \\ + 2 θ_{n} 〈 u - p, x_{n + 1} - p 〉 + (1 - θ_{n}) ϕ_{n} \end{matrix}$

$δ_{n} = θ_{n} q_{n}$ ,

因为

$0 \leq | 2 θ_{n} 〈 u - p, x_{n + 1} - p 〉 | \leq 2 θ_{n} ‖ u - p ‖ \cdot ‖ x_{n + 1} - p ‖$ ,

$‖ ϕ_{n} ‖ \leq 2 | u_{n} + v_{n} - 1 | \cdot ‖ p ‖ \cdot ‖ y_{n} - p ‖ + 2 ‖ e_{n} ‖ \cdot ‖ y_{n} - p ‖$ ,

且 ${x_{n} - p}, {y_{n} - p}, {w_{n} - p}$ 有界，结合条件(C₁)，(C₂)，(C₃)，(C₄)可以得到，

$\sum_{n = 0}^{\infty} γ_{n} = + \infty$ , $\lim_{n \to + \infty} q_{n} = 0$ .

从而，引理3的前两个条件满足。只需证明 $\lim_{k \to + \infty} t_{n_{k}} = 0$ 蕴含 $\underset{k \to + \infty}{\lim \sup} δ_{n_{k}} \leq 0$ ， ${t_{n_{k}}}$ 为 ${t_{n}}$ 的任意子序列。

取 ${t_{n}}$ 的一个子序列 ${t_{n_{k}}}$ 满足 $\lim_{k \to + \infty} t_{n_{k}} = 0$ 。由条件(C₃)可知，

$\lim_{k \to + \infty} ‖ w_{n_{k}} - T (w_{n_{k}}) ‖ = 0$ . (16)

由条件(C₂)，取 $k \to + \infty$ ，有

$\begin{matrix} ‖ w_{n_{k}} - x_{n_{k}} ‖ = ‖ x_{n_{k}} + α_{n_{k}} (x_{n_{k}} - x_{n_{k} - 1}) + β_{n_{k}} (x_{n_{k} - 1} - x_{n_{k} - 2}) - x_{n_{k}} ‖ \\ \leq α_{n_{k}} ‖ x_{n_{k}} - x_{n_{k} - 1} ‖ + | β_{n_{k}} | ‖ x_{n_{k} - 1} - x_{n_{k} - 2} ‖ \to 0 \end{matrix}$ (17)

因为 ${x_{n_{k}}}$ 有界，则存在 ${x_{n_{k}}}$ 的子序列 ${x_{n_{k_{l}}}}$ 满足

$x_{n_{k_{l}}} ⇀ x^{*} (l \to + \infty)$ 且 $\underset{k \to + \infty}{\lim \sup} 〈 u - p, x_{n_{k}} - p 〉 = \lim_{l \to + \infty} 〈 u - p, x_{n_{k_{l}}} - p 〉$ 。

由(17)可知 $w_{n_{k_{l}}} ⇀ x^{*} (l \to + \infty)$ 。结合(16)及引理2可推得 $x^{*} \in Fix (T)$ 。再由 $p = Π_{Fix (T)} (u)$ 及投影的性质可得 $〈 u - p, x^{*} - p 〉 \leq 0$ ，这意味着

$\underset{k \to + \infty}{\lim \sup} 〈 u - p, x_{n_{k}} - p 〉 = \lim_{l \to + \infty} 〈 u - p, x_{n_{k_{l}}} - p 〉 = 〈 u - p, x^{*} - p 〉 \leq 0$ . (18)

除此以外，

$\begin{matrix} ‖ y_{n_{k}} - w_{n_{k}} ‖ = ‖ v_{n_{k}} (T (w_{n_{k}}) - w_{n_{k}}) + (u_{n_{k}} + v_{n_{k}} - 1) w_{n_{k}} + e_{n_{k}} ‖ \\ \leq v_{n_{k}} ‖ T (w_{n_{k}}) - w_{n_{k}} ‖ + (1 - u_{n_{k}} - v_{n_{k}}) ‖ w_{n_{k}} ‖ + ‖ e_{n_{k}} ‖ \end{matrix}$

由，条件(C₃)，(C₄)，可以推得 $\lim_{k \to + \infty} ‖ y_{n_{k}} - w_{n_{k}} ‖ = 0$ 。结合(18)可知， $\lim_{k \to + \infty} ‖ y_{n_{k}} - x_{n_{k}} ‖ = 0$ 。因为，

$‖ x_{n_{k} + 1} - x_{n_{k}} ‖ \leq θ_{n_{k}} ‖ u - x_{n_{k}} ‖ + (1 - θ_{n_{k}}) ‖ y_{n_{k}} - x_{n_{k}} ‖$ ,

于是 $\lim_{k \to + \infty} ‖ x_{n_{k} + 1} - x_{n_{k}} ‖ = 0$ ，这说明

$\underset{k \to + \infty}{\lim \sup} 〈 u - p, x_{n_{k} + 1} - p 〉 \leq 0$ .

再由条件(C₃)，(C₄)可得，

$\lim_{k \to + \infty} ‖ \frac{1 - θ_{n_{k}}}{θ_{n_{k}}} ϕ_{n_{k}} ‖ \leq \lim_{k \to + \infty} \frac{2 (1 - u_{n_{k}} - v_{n_{k}})}{θ_{n_{k}}} ‖ p ‖ ‖ y_{n_{k}} - p ‖ + 2 \frac{‖ e_{n_{k}} ‖}{θ_{n_{k}}} ‖ y_{n_{k}} - p ‖ = 0$ .

所以， $\underset{k \to + \infty}{\lim \sup} δ_{n_{k}} \leq 0$ 。由引理3可得 $\lim_{n \to + \infty} b_{n} = 0$ ，所以序列 ${x_{n}}$ 强收敛于 $x^{*}$ 。

4. 数值实验

本节我们将用算法(4)和算法(5)求解凸可行问题并比较它们的表现，所有实验均用Matlab2020a编写，程序运行环境为Lenovo笔记本电脑，CPU型号为Inter (R) Core(TM) i5-10200H CPU@2.40 GHz，运行内存为16.00GB RAM。

下面简述凸可行问题[18]。给定一组非空闭凸集 $C_{i} \subset ℝ^{n} (i = 0, 1, \dots, m)$ ，凸可行问题是指：

寻找

$x^{*} \in C : = \cap_{i = 0}^{m} C_{i}$ (19)

其中 $C \neq \emptyset$ ，定义映射 $T : ℝ^{n} \to ℝ^{n}$ ，

$T : = P_{0} (\frac{1}{m} \sum_{i = 1}^{m} P_{i})$ (20)

其中， $P_{i} = P_{C_{i}} (i = 0, 1, \dots, m)$ 代表 $C_{i}$ 上的度量投影。由于 $P_{i}$ $(i = 0, 1, \dots, m)$ 是非扩张的，可以推得 $T$ 是非扩张的且

$Fix (T) = Fix (P_{0}) \cap \cap_{i = 1}^{m} Fix (P_{i}) = C_{0} \cap \cap_{i = 1}^{m} C_{i} = C .$

对于凸可行问题(19)而言，一种经典的解法就是求解由(20)定义的映射 $T$ 的不动点[19]。

在这节实验中，我们设 $C_{i}$ 是一个闭球，其球心为 $c_{i} (c_{i} \in ℝ^{n})$ ，半径为 $r_{i} (r_{i} > 0)$ 。于是， $C_{i}$ 的度量投影为：

$P_{i} (x) : = {\begin{array}{l} c_{i} + \frac{r_{i}}{‖ c_{i} - x ‖} (x - c_{i}) & if ‖ c_{i} - x ‖ > r_{i}, \\ x & if ‖ c_{i} - x ‖ \leq r_{i} . \end{array}$

令 $v_{0} = [10, 10, \dots, 10]$ ，取 $r_{i} = 1 (i = 0, 1, \dots, m)$ ， $c_{0} = v_{0}$ ， $c_{1} = v_{0} + [1, 0, \dots, 0]$ ， $c_{2} = v_{0} + [- 1, 0, \dots, 0]$ ，剩余的 $c_{i} = v_{0} + d_{i} (i = 3, 4, \dots, m)$ ， $d_{i} \in {(- 1 / \sqrt{n}, 1 / \sqrt{n})}^{n}$ ，即 $d_{i}$ 的每个分量按均匀分布随机得取于 $(- 1 / \sqrt{n}, 1 / \sqrt{n})$ 。从上述的选择，我们可以推得 $Fix (T) = {v_{0}}$ 。

下面给出算法(4) (记作MIMHA)和算法(5) (记作G2IMMH)实验参数的选择和停止准则的设置。

实验参数的选择：G2IMMH参数选取为，

$u_{n} = 0.1 - \frac{1}{{(n + 3)}^{2}}$ , $v_{n} = 0.9 - \frac{1}{{(n + 3)}^{2}}$ , $θ_{n} = \frac{1}{10000 n}$ , $e_{n} = 0$ ,

$α_{n} = {\begin{array}{l} \frac{n - 1}{n + 2}, & x_{n} = x_{n - 1} \\ \frac{10}{(n^{2} + 1) ‖ x_{n} - x_{n - 1} ‖}, & x_{n} \neq x_{n - 1} \end{array}$ , $β_{n} = {\begin{array}{l} 0, & x_{n - 1} = x_{n - 2} \\ \frac{- 0.2}{(n^{2} + 1) ‖ x_{n - 1} - x_{n - 2} ‖}, & x_{n - 1} \neq x_{n - 2} \end{array}$ , $u = x_{3}$ .

MIMHA的参数选取为， $λ_{n} = 0.1$ 。 $θ_{n}, α_{n}, u$ 同G2IMMH。

输入和停止准则设置：初始值 $x_{1}, x_{2}, x_{3}$ 是服从(0, 1)均匀分布的随机向量。MIMHA的初始值设为 $x_{2}, x_{3}$ 。G2IMMH的初始值设为： $x_{1}, x_{2}, x_{3}$ 。定义 $Err : = {‖ x_{n} - v_{0} ‖}_{\infty}$ ，设 $τ = 0.005$ 。停止准则设为：

$Err < τ$ .

在实验中，我们记凸集个数和向量空间的维数为 $(m; n) = (50 k; 50 k) (k = 1, 2, \dots, 10)$ ，一共进行十组实验，每组实验重复5次再取平均值。

表1为10组数据的结果。表1中，Iter表示迭代次数，CPU运行时间的单位为秒。图1是 $n = 100$ ， $m = 100$ 情况下的误差图像，图中Proposed代表本文提出的算法G2IMMH。从表1和图1中，我们可以看出G2IMMH能有效求解凸可行问题且它的迭代次数和CPU运行时间比MIMHA更少，这说明G2IMMH在一定的情况下比MIMHA更有优势。

Table 1. Experimental results in different dimensions

表1. 不同维度下的实验数据

$(m; n)$	MIMHA		G2IMMH
$(m; n)$	Iter	CPU Time	Iter	CPU Time
(50; 50)	111,948	4.45	37,337	1.49
(100; 100)	165,173	13.00	37,666	2.98
(150; 150)	183,481	22.61	38,362	4.75
(200; 200)	205,149	35.49	38,381	6.67
(250; 250)	198,346	45.26	38,858	8.86
(300; 300)	219,213	59.27	39,196	10.54
(350; 350)	253,986	84.40	39,067	12.82
(400; 400)	224,138	90.07	39,124	16.01
(450; 450)	199,758	97.63	39,175	19.17
(500; 500)	216,043	117.64	39,584	22.65

Figure 1. Graph of error under the condition that $n = 100$ and $m = 100$

图1. $n = 100$ ， $m = 100$ 时的误差图像

5. 总结

本文提出了一种广义修正两步惯性Mann Halpern算法并在合适的条件下证明了它的收敛性。在求解凸可行问题的数值实验中，和文献[15]中的算法进行了比较，实验结果表明本文提出的算法在解决该实验问题中更有优势。在未来的研究中，我们还会将该算法运用到Douglas-Rachford分裂算法中并用于求解一些实际问题，比如图像处理，矩阵优化及机器学习等。我们也将进一步研究该算法的收敛速率。

参考文献

[1]	Krasnoselskii, M.A. (1955) Two Remarks on the Method of Successive Approximations. Uspekhi Matematicheskikh Nauk, 10, 123-127.
[2]	Mann, W.R. (1953) Mean Value Methods in Iteration. Proceedings of the American Mathematical Society, 4, 506-510. [Google Scholar] [CrossRef]
[3]	Reich, S. (1979) Weak Convergence Theorems for Nonexpansive Mappings in Banach Spaces. Journal of Mathematical Analysis and Applications, 67, 274-276. [Google Scholar] [CrossRef]
[4]	Kanzow, C. and Shehu, Y. (2017) Generalized Krasnoselskii-Mann-Type Iterations for Nonexpansive Mappings in Hilbert Spaces. Computational Optimization and Applications, 67, 595-620. [Google Scholar] [CrossRef]
[5]	Halpern, B. (1967) Fixed Points of Nonexpanding Maps. Bulletin of the American Mathematical Society, 73, 957-961. [Google Scholar] [CrossRef]
[6]	Wittmann, R. (1992) Approximation of Fixed Points of Nonexpansive Mappings. Archiv der Mathematik, 58, 486-491. [Google Scholar] [CrossRef]
[7]	Song, Y. (2008) A New Sufficient Condition for the Strong Convergence of Halpern Type Iterations. Applied Mathematics and Computation, 198, 721-728. [Google Scholar] [CrossRef]
[8]	Chuang, C., Lin, L. and Takahashi, W. (2012) Halpern’s Type Iterations with Perturbations in Hilbert Spaces: Equilibrium Solutions and Fixed Points. Journal of Global Optimization, 56, 1591-1601. [Google Scholar] [CrossRef]
[9]	Lieder, F. (2020) On the Convergence Rate of the Halpern-Iteration. Optimization Letters, 15, 405-418. [Google Scholar] [CrossRef]
[10]	Kim, T. and Xu, H. (2005) Strong Convergence of Modified Mann Iterations. Nonlinear Analysis: Theory, Methods & Applications, 61, 51-60. [Google Scholar] [CrossRef]
[11]	Polyak, B.T. (1964) Some Methods of Speeding up the Convergence of Iteration Methods. USSR Computational Mathematics and Mathematical Physics, 4, 1-17. [Google Scholar] [CrossRef]
[12]	Maingé, P. (2008) Convergence Theorems for Inertial Km-Type Algorithms. Journal of Computational and Applied Mathematics, 219, 223-236. [Google Scholar] [CrossRef]
[13]	Boţ, R.I., Csetnek, E.R. and Hendrich, C. (2015) Inertial Douglas-Rachford Splitting for Monotone Inclusion Problems. Applied Mathematics and Computation, 256, 472-487. [Google Scholar] [CrossRef]
[14]	Cholamjiak, W., Cholamjiak, P. and Suantai, S. (2018) An Inertial Forward-Backward Splitting Method for Solving Inclusion Problems in Hilbert Spaces. Journal of Fixed Point Theory and Applications, 20, Article No. 42. [Google Scholar] [CrossRef]
[15]	Tan, B., Zhou, Z. and Li, S. (2020) Strong Convergence of Modified Inertial Mann Algorithms for Nonexpansive Mappings. Mathematics, 8, Article 462. [Google Scholar] [CrossRef]
[16]	Iyiola, O.S. and Shehu, Y. (2022) Convergence Results of Two-Step Inertial Proximal Point Algorithm. Applied Numerical Mathematics, 182, 57-75. [Google Scholar] [CrossRef]
[17]	Bauschke, H.H. and Combettes, P.L. (2017) Convex Analysis and Monotone Operator Theory in Hilbert Spaces. Springer.
[18]	Dong, Q.L., Yuan, H.B., Cho, Y.J. and Rassias, T.M. (2016) Modified Inertial Mann Algorithm and Inertial CQ-Algorithm for Nonexpansive Mappings. Optimization Letters, 12, 87-102. [Google Scholar] [CrossRef]
[19]	Bauschke, H.H. and Borwein, J.M. (1996) On Projection Algorithms for Solving Convex Feasibility Problems. SIAM Review, 38, 367-426. [Google Scholar] [CrossRef]

为你推荐

友情链接