1. 研究背景
相位恢复技术广泛应用于X射线晶体学、透射电子显微镜和相干衍射成像等领域[1] [2],其任务是通过观测到的幅度信息来恢复丢失的相位信息。近年来,[3]和[4]将相位恢复的概念进一步扩展到更广义的情境中,提出了广义相位恢复。广义相位恢复涵盖了标准的相位恢复问题,具有更广泛的应用前景。
我们在本文中讨论如下广义相位恢复的如下二次测量归回模型
(1.1)
其中
是观测值,
代表未知的真实信号,
是样本数量,
是测量矩阵,
是独立同分布的随机噪声。
二次测量回归模型有着广泛的应用,例如相位恢复[5]、无标记距离几何问题[6]、未知视图层析成像[7] [8]、潮流分析及电力系统状态估计[9]等。这些都可以转化为从二次测量模型中恢复信号的问题,利用可以测量的信号强度,点之间的距离,系统电流和功率等信息来获得我们需要的相位,点的位置,电压等信息。
在相位恢复领域,针对二次测量系统的信号恢复问题,许多学者通过梯度下降的方法直接求解。例如,Candes等人将秩1的相位恢复问题转化为结构化的二次测量回归模型,并提出了Wirtinger Flow (WF)方法。该方法结合了谱初始化算法,有足够的测量值时,谱初始化能够以高概率产生接近全局最优解的初始点,WF方法能以线性速度收敛至真实信号。[10]进一步证明,具有旋转不变性的次高斯测量模型可以通过结合谱初始化的WF方法以高概率有效求解。[11]引入了截断Wirtinger Flow (TWF)算法来解决传统的相位恢复模型,TWF可以通过截断一些离群点来地提高WF的性能。该方法抛弃了对初始估计或搜索方向影响太大的项,提供了更稳健的下降方向,从而提高了实际性能。此外,该方法在包含噪声的情况下也达到了接近最优的统计精度。数值试验表明,该方法具有较低的采样复杂度。[12]提出了截断重构的WF方法,进一步降低了采样复杂度。
另一方面,[13]提出了一种改进的Levenberg-Marquardt方法,该方法的初始点接近全局最优解集,且证明了其具有全局线性收敛性和局部二次收敛性。[14]则提出了一种两阶段算法,第一阶段旨在为第二阶段提供良好的初始值,第二阶段通过高斯–牛顿方法求解优化问题,可用该方法实现从任意初始点进行相位恢复。在电力系统状态估计的应用中,一些学者通过将该问题转化为非凸约束的二次规划问题,采用可行点追踪法进行求解[15]。
[16]在WF方法的基础上提出了一种改进的相位恢复算法,称为加权Wirtinger Flow (RWF)方法。RWF通过求解一系列权值变化的子相位恢复问题来寻找全局最优解,数值实验表明,RWF比WF具有更低的采样复杂度。该算法的关键是巧妙地从算法迭代过程中计算出了权重,添加权重实际上是一种自适应TWF方法。作者还表明,当权重以1和10/9为界时,RWF将收敛到相位恢复问题的全局最优解。
我们将RWF应用于基于高斯随机测量矩阵的二次测量回归模型(1.1)式,研究如下加权最小二乘问题,
(1.2)
其中,
,表示权重,若
,则
。
2. RWF算法及其性质
我们使用谱方法来估计算法的初始点,下面将给出算法的实现框架(见算法1)和一些性质,便于后续算法收敛性的证明。
Algorithm 1. Reweighted Wirtinger Flow algorithm
算法1. Reweighted Wirtinger Flow算法
第一步:初始化
,令
; 第二步:如果
执行第三步和第四步;否则结束循环。 第三步:找到最小的非负整数
使得下面不等式成立
(2.1) 第四步:令
,
,
,返回第二步; |
的梯度和海色矩阵如下所示,
(2.2)
假设1 对任意
,存在常数
,满足
.
接下来我们将会证明在假设1成立的条件下,算法产生的序列收敛到优化模型的稳定点。下面先给出一些引理及其证明,以便于分析算法性质和后续的收敛性证明。
引理1 如果假设1成立,那么函数
是强制的,即
,并且对于任意给定的
,函数
的水平集
是紧的,
(2.3)
证明:由
可知
,通过柯西不等式和假设1,可以得出
当
时,
,即
是强制的,从而水平集
是有界的。再由
的连续性可知其水平集
是闭集,从而是紧集。
引理2 如果假设1成立,那么对任意给定的
,
和
存在。
证明:由公式(2.2),柯西不等式和假设1可以得到,对任意的
由上面不等式可以得到,
下面我们可以证明海瑟矩阵由上界。对于任意的
,有下面不等式成立,
由上面不等式可以得到
因此,
和
存在。
引理3 对于给定的点
,定义
如果假设1成立,那么对于任意有界的
和任意的
有
。
证明:
有界,由引理1可知
是紧集;因为
是连续的所以
有界;由引理2中
的有界性可知
;对于任意的
,显然有
,证明结束。
下面我们证明算法中的序列
存在并且是有界的,即引理4,从而证明算法产生的函数值序列
是非增序列。
引理4 如果假设1成立,那么存在
使得(2.1)式成立。
证明:当
时,有
,由引理3可知
。下面证明
。当
时,
且
,显然成立。当
时,由
可知
(2.4)
即
,又因为
,所以
。
考虑
,
,由
可知下面不等式成立
从而
。因为函数
二次连续可微,下面对
进行泰勒展开
(2.5)
因此,当
时,(2.1)式成立。
由算法更新公式和(2.5)可以得到
,因此
,通过引理3我们有
。
当
时,类似(2.4)有
且
。考虑
,
,对于
有不等式
成立,则
所以当
时,不等式(2.1)成立。由归纳法可知
时,(2.1)式成立。
3. 收敛性分析
引理5 如果假设1成立,则算法产生的序列
是非增序列且
有界的。
证明:由引理3可知对任意的
,我们有
。因此
,即
,所以
。
由(1.4)式可得
(2.6)
因为
,所以
是非增的,且
,所以
,由
有界可知
有界。
定理1 如果假设1成立,设
为算法1生成的序列,则
所以
其任意非零的聚点
是(1.2)的稳定点。如果
,那么该序列收敛到(1.2)局部最小点。
证明:(1) 对引理5中的(2.6)式进行求和,
即
,由正项级数的性质可得
,
。由算法更新公式及
,可知
(2) 由引理5可知,数列
有界,因此存在其子列收敛到
,由(1)以及梯度的连续性可知
,即
是稳定点。若
连续可微且正定,那么该序列收敛到问题(1.2)的局部最小点。
4. 数值实验
我们将RWF方法与Wirtinger Flow (WF)方法和Phaselift方法进行比较。其中RWF算法和WF算法均使用谱初始点。分别对比各算法在不同样本量与变量维数比值情况下的成功率,运行时间,以及相对误差,包括无噪声情况以及方差为0.01的高斯测量噪声情况。
为了衡量算法是否能正确恢复真实信号,我们定义真实信号
与算法估计信号
的相对误差如下所示,
,
如果在无噪声情况下相对误差 < 10−5,在有噪声情况下相对误差5 × 10−3,则恢复成功。
在无噪声且样本量比较小的情况下(见图1),RWF在恢复正确率方面有明显的优势,除了CPU运行时间之外,相对误差比WF也更小一些。在噪声情况下(见图2),RWF方法和WF方法的恢复精度都比较高,样本量较小时,RWF的恢复正确率较高,并且在CPU运行时间相较于WF和Phaselift有一定的优势。因此我们的数值实验验证了RWF在解决二次测量回归模型时,在运行时间和较小样本情况的准确率方面表现很好。
Figure 1. Results of RWF, WF and Phaselift algorithm in noiseless condition
图1. 无噪声情况下RWF,WF和Phaselift算法的运行结果对比
Figure 2. Results of RWF, WF and Phaselift algorithm in noisy condition
图2. 噪声情况下RWF,WF和Phaselift算法的运行结果对比
5. 总结
本文探讨了在二次测量回归模型中,如何高效地重构未知信号的问题。我们聚焦于相位恢复领域的算法,应用RWF方法解决二次测量回归模型的信号恢复。将RWF方法引入二次测量回归模型是本文的创新点,相较于传统的Wirtinger Flow (WF)及PhaseLift方法,该方法不仅优化了计算效率,在运行时间上展现出良好优势,而且,在样本复杂度较小的情况下,RWF在信号恢复准确率上有一定提高。另外,我们还证明了RWF算法产生的迭代序列能够收敛到问题的局部极小点,为基于二次测量回归模型的RWF方法提供了理论保障。
基金项目
河北省自然科学基金A2023202038。