1. 引言
流形是一般几何对象的总称,是欧式空间中的曲线,曲面等概念的推广。流形上的优化不仅是近年来信息科学领域发展起来的一门新兴学科,同时也是优化理论与方法的重要组成部分。在优化领域中,通过利用流形的几何结构,一些欧式空间的非凸问题可以转化为流形上的凸优化问题,一些约束优化问题可以视为流形上的无约束优化问题。因此,近年来这个领域的研究受到越来越多的关注。
哈达玛流形是一个完备的具有非正曲率 [1] [2] 的简单连通有限维黎曼流形,包括大量重要的矩阵流形和模型。在机器学习 [3],图像处理 [4] 中都有着广泛的应用。由于其优良的几何结构,哈达玛流形上任意两点间测地线的唯一性假设,避免了算法设计的奇异性。近年来,国内外研究了各种非正曲率流形,如对称正定流形和n阶旋转群,已经出现在机器学习和计算机视觉中 [5] [6] [7]。考虑流形的几何结构,设计内在的迭代结构保持算法 [8] [9],为一些任务的研究提供了更准确,更有效的途径。
作为非正曲率流形,哈达玛流形具有无共轭点的优良性质,因此其上任意两点之间存在唯一的测地线。它使算法的迭代在整个流形上有了很好的定义,并在这样的流形上发展了许多保持结构的算法。例如,Colao等人考虑了非线性哈达玛流形上的平衡问题,证明了一类双函数平衡点的存在性 [1] 和定义在哈达玛流形上的集值映射的不动点定理,并讨论了平衡点的近似问题。近几年,Ruizgarzon等人提出了哈达玛流形的约束向量优化问题弱有效Pareto点的经典充要条件 [10],Ferreia和Louzeiro将梯度方法推广到截面曲率有界的流形上,并证明了一阶收敛速度 [11]。另一方面,Ferreira和Oliveira提出了一种求解哈达玛形上光滑凸函数的邻近点方法 [12],并说明了Riemann流形中的凸分析,可以用来解决欧式空间中的非凸约束问题,并估计了𝑃 (1/l)的收敛速度 [9] [13]。Wang等人将求解多值向量场奇异点的非精确近点方法推广到哈达玛流形上 [14]。Bento等人还将一种近似点法推广到一般Riemann流形,并进行了收敛性分析 [15] 以及进一步的矢量优化 [16]。Ansari等人提出了一种正则化的非精确邻近点算法,用于寻找哈达玛流形上最大单调集值向量场的奇点 [17]。Baygorrea等人建立了哈达玛流形上拟凸极小化的非精确邻近点方法 [18] 并估计其收敛速度 [19]。Tang和Huang还估计了向量函数在哈达玛流形上的邻近点算法的收敛速度 [20]。近几年,Chen等人提出了Stiefel流形上的黎曼近似梯度(RPG)方法 [21],而Torres Almeida等人则修改了邻近点算法来优化哈达玛流形上的DC函数 [22]。结果表明,基于梯度的方法和哈达玛流形上的邻近点算法极大地丰富了流形优化的研究。
在本文中,我们将以另一种方式加速求解哈达玛流形上一类非凸非光滑问题的内蕴近端梯度算法。也就是说,我们考虑下面的最小化问题:
(1)
其中
是有限维哈达玛流形(具有非正截面曲率的流形),
是测地光滑函数,
是下半连续函数,可以不连续。
2. 预备知识
我们在本节提出了一些关于哈达玛流形的概念。更详细的内容,请参阅 [2] [13] [18]。
哈达玛流形是一个具有非正截面曲率的完全单连通黎曼流形。在哈达玛流形上任意两点之间存在唯一的测地线。设
是哈达玛流形,给定
,
表示
上在
点的切空间。对任意
,指数映射定义为:
,指数映射定义为
满足
,其中,
为切向量在对应黎曼度量
下的范数。
是
和
两点间的测地距离。在哈达玛流形上,对于任意两点
,我们有
。设
为一条曲线,
表示
上的Levi-Civita联络。一个沿着曲线
的向量场
是平行向量场,当且仅当
,当
时,
是一条测地线。测地线
表示
,
以及
。
将向量
映射到
并保持向量内积不变,称
为M上的平行移动,即
,特别地,
。流形上的一个测地三角
是由
及连接这些点的三条最小测地线组成的集合。余弦定理是哈达玛流形上一个重要的性质,任意给定
上的测地三角
,有
。
定义2.1
上的可微函数
的梯度是L-Lipschitz连续的,那么称
是测地L-光滑(G-L光滑)函数。即
。
注:定义2.1等价于
(2)
定义2.2 如果函数
在
满足
则称
在
点上是1-强制的。
定义2.3 令
是一个下半连续的恰当函数,
在
上的Fréchet次微分定义为
3. 哈达玛流形上的近端梯度法
在欧式空间中近端算法可以看作是解决一些非光滑、有约束、大规模问题的常规方法。本节中,我们将介绍哈达玛流形上的近端梯度法。
定义3.1 黎曼流形上的近端算子定义为:
其中,
。
我们接下来给出下列假设:
假设3.1
是一个恰当的,并且在M上是G-L光滑函数,
是一个恰当的,在M上是下半连续函数。
假设3.2 函数
是1-强制的,并且在M上有下界。
引理3.1 设
在
上是一个紧集,则存在一个常数
使得任意
和
,都有
(3)
证明:由于
是一个有限维哈达玛流形,我们可以把
看作
点处的光滑函数,此时,结论得证。
注 实际上,由引理3.1我们可以得出
。梯度向量场在
上,当
时,梯度向量场
是严格单调的。因此,对任意
和
,我们有
即,
因此,
此时,在引理3.2中
。
接下来,我们给出哈达玛流形上满足上述假设的定步长近端梯度算法(如下算法1)。
Algorithm 1. Upper proximal gradient method
算法1. M上近端梯度法
收敛性分析
定理3.1 当假设3.1,3.2成立时,算法1生成的迭代序列
在一个有界区域中,设
是
的任意聚点,则
。
证明:
(5)
令
,则
由
的G-L光滑性质,我们有,
(8)
由余弦定理,我们有,
(9)
由(8),(9)我们可得,
(10)
因为
,所以,
。从而可得
是非增的,因此,我们有
由于
是1-强制的,我们可以得到
是有界的,因此,
有聚点。因为
是非增的且有界,因此,
在
所有的聚点上都有相同的值,记为
。
接下来,我们将证明
在一个有界域中。由(10),我们可得
因此,
进而,
由(5)的最优性可得,
之后,我们有,
因此,
因为
是G-L光滑的,且
在一个有界域上,存在一个紧集
使得
的范数对于任意
是有限的,那么,
自然在一个有界区域
中。除此之外,我们还可得到
,
都在一个紧集
中。因此,由引理可得,存在一个常数
,使得,
(16)
由(14),(15),(16)我们可以得出
(17)
设
是
的任意聚点,当
时,
的子列
。我们现在证明
。由(5)我们知道
那么,
有余弦定理,我们可以得到
由于
在一个有界区域中,对于任意
,
自然也是有界的。因此,我们有
此外,由
下半连续,我们有
所以,我们可以得到
(18)
由
的连续性和(18),可知当
,
由(14),(17)—(19),以及次微分的定义可得
.
4. 结论
本文针对于极小化非凸非光滑函数问题,主要研究了哈达玛流形上的近端梯度算法,我们首先将欧式空间的近端梯度算法推广到哈达玛流形上,再根据该流形的优良结构,给出流形上近端梯度法的收敛性证明。理论上,我们可以得出我们提出的哈达玛流形上的近端梯度算法是收敛的。由于流形上非线性性质,收敛速度的理论研究存在一定的困难,还需要进一步研究。