交替投影算法求解非负逆特征值问题

doi:10.12677/ORF.2021.111002

期刊菜单

交替投影算法求解非负逆特征值问题
Alternating Projection Method for Solving Nonnegative Inverse Eigenvalue Problems

DOI: 10.12677/ORF.2021.111002, PDF, HTML, XML, 被引量国家自然科学基金支持
作者: 杨丹, 王湘美：贵州大学数学与统计学院，贵州贵阳
关键词: 非负逆特征值问题；凸可行性问题；交替投影算法；非光滑牛顿算法；Nonnegative Inverse Eigenvalue Problem； Convex Feasibility Problem； Alternating Projection Method； Non-Smooth Newton Algorithm

摘要: 通过把给定部分特征对的非负逆特征值问题转化为一个凸可行性问题，提出交替投影算法求解该问题。建立了这一算法的线性收敛性。最后，通过数值例子，比较了交替投影算法和非光滑牛顿法(白等人2011年提出)的收敛效率。数值实验结果表明，交替投影算法总是能收敛到问题的解，而非光滑牛顿法在一些情形下求不出解。此外，交替投影算法收敛的效率也比非光滑牛顿法高。

Abstract: The alternating projection method is proposed for solving nonnegative inverse eigenvalue prob-lems with partial eigendata, by reformulating the problem as a convex feasibility problem. The (linear) convergnece property of the method is established. At last, some numerical experiments are provided to compare the method with the non-smooth Newton algorithm proposed by Bai et al. in 2011. Numerical experiment results show that the alternative projection algorithm always converges to the solution of the problem, while the non-smooth Newton method fails to find the solution in some cases. In addition, the alternative projection algorithm is more efficient than the non-smooth Newton method.

文章引用：杨丹, 王湘美. 交替投影算法求解非负逆特征值问题[J]. 运筹与模糊学, 2021, 11(1): 9-14. https://doi.org/10.12677/ORF.2021.111002

1. 引言

非负逆特征值问题来源非常广泛，它主要来自于离散的数学物理反问题、系统参数识别、地震断层成像技术、主成分分析与勘测、结构分析、电路理论、机械系统模拟等许多应用领域，有着重要的应用背景 [1] - [6] 。这类问题提出来的几十年里，吸引了大量学者，取得到了重要研究成果。非负逆特征值问题可以分为以下两大类：1) 已知n个特征值 $λ_{1}, λ_{2}, \dots, λ_{n}$ ，求一个非负n阶非负矩阵¹ (或者非负对称矩阵/

随机矩阵)；2) 已知部分特征对 ${λ_{k}, x_{k}}_{k = 1}^{p} (p \leq n)$ ，其中 $λ_{k}$ 是特征值， $x_{k}$ 是其对应的特征向量，求一个n

阶非负矩阵(或者非负对称矩阵/随机矩阵)。关于这两类问题的研究主要包括两方面 [7] ，一方面是关于问题解的存在性；另一反面是求解这些问题的数值算法。例如，求解第一类问题的等光谱流动算法 [8] 以及交替投影算法 [9] 等。关于第二类问题的数值算法求解见文献 [10] [11] [12] ，其中文献 [10] 通过把非负逆特征值问题转化为优化问题，提出了非光滑牛顿法。在满足某种非退化的条件下，证明了算法是二阶收敛的。但该算法在求解子问题的计算量大，收敛的效率并不理想。

本文主要研究第二类非负逆特征值问题。通过把这一问题转化为凸可行性问题，提出了交替投影算法，并给出了投影的计算式。同时，我们证明了算法的(线性)收敛性。最后，通过数值例子比较了交替投影算法和非光滑牛顿法的收敛效率。数值实验结果表明，交替投影算法总能收敛到问题的解，而非光滑牛顿法在一些情形下不收敛。此外，非光滑牛顿法虽然在一定条件下二阶收敛，但是因为子问题计算量大，非光滑牛顿法的实际运算效率不如交替投影算法。

本文的结构如下。第二节是预备知识，包括一些相关的概念和记号。文章的主要结果在第三节，我们提出求解非负逆特征问题的交替投影算法，并证明了算法的线性收敛性。第四节是数值实验及与非光滑牛顿法的比较。

2. 预备知识

这节主要介绍矩阵分析中的一些符号，概念和结论，参考 [13] [14] [15] 。设 $R^{n}$ 和 $C^{n}$ 分别表示n维实向量空间和复向量空间， $R^{m \times n}$ 和 $C^{m \times n}$ 分别表示 $m \times n$ 阶实矩阵空间和 $m \times n$ 阶复矩阵空间。矩阵 $A \in R^{m \times n}$ 的

转置，共轭转置，迹分别记为 $A^{T}$ ， $A^{H}$ ， $tr (A)$ ，其中 $tr (A) = \sum_{i = 1}^{n} a_{i i}$ 。在 $R^{n \times n}$ 中，定义内积 $〈 \cdot, \cdot 〉$ 如下：

$〈 A, B 〉 = tr (A^{T} B), \forall A, B \in R^{n \times n} .$

其诱导Frobenius模记为 ${‖ \cdot ‖}_{F}$ ，即

${‖ A ‖}_{F} = \sqrt{〈 A, A 〉} = \sqrt{\sum_{i, j = 1}^{n} a_{i j}^{2}}, A \in R^{n \times n} .$

设矩阵 $A \in C^{m \times n}$ 。如果矩阵 $X \in C^{m \times n}$ 满足以下四个方程：

$A X A = A, X A X = X, {(A X)}^{H} = A X, {(X A)}^{H} = X A .$

则称矩阵X为矩阵A的广义逆矩阵，记作 $A^{+}$ 。

假设 $S \subseteq R^{n \times n}$ 为 $R^{n \times n}$ 中非空子集。设 $X \in R^{n \times n}$ ，点X到集合S上的距离和投影分别记为 $d_{S} (\cdot), P_{S} (\cdot)$ 即

$d_{S} (X) : = \inf_{Y \in S} ‖ X - Y ‖$

和

$P_{S} (X) = \underset{Y \in S}{\arg \min} ‖ X - Y ‖ = {Y \in S | d_{S} (X) : = ‖ X - Y ‖} .$

如果任意两点 $x_{1}, x_{2} \in S$ ，都有

$λ_{1} x_{1} + (1 - λ) x_{2} \in S, \forall λ \in (0, 1),$

则称S为 $R^{n \times n}$ 中的凸集。设 $A \in R^{n \times n}, b \in R$ ，我们称集合 $H = {X \in R^{n \times n} | 〈 A, X 〉 \leq b}$ 为 $R^{n \times n}$ 中的半空间，几个半空间的交称为 $R^{n \times n}$ 中的多面体，容易验证半空间和多面体都是凸集。

3. 非负逆特征值问题及交替投影算法

本文主要研究以下非负逆特征值问题(下面简记为NIEP)。已知p个特征对 ${λ_{k}, x_{k}}_{k = 1}^{p} (p \leq n)$ 是A的p

个特征对，其中 $λ_{k} \in C$ ， $x_{k} \in C^{n}$ 是特征值 $λ_{k}$ 对应的特征向量，求一个非负矩阵A。为此我们先引进一些记号。不失一般性，我们不妨假设前2s个是共轭特征对，其余是实特征对，即对任意 $1 \leq i \leq s$ ，

$λ_{2 i - 1} = a_{i} + b_{i} \sqrt{- 1}, λ_{2 i} = a_{i} - b_{i} \sqrt{- 1}, x_{2 i - 1} = x_{i R} + x_{i I} \sqrt{- 1}, x_{2 i} = x_{i R} - x_{i I} \sqrt{- 1},$

其中 $a_{i}, b_{i} \in R, x_{i R}, x_{i I} \in R^{n}$ 。记

$Λ = d i a g (λ_{1}^{[2]}, \dots, λ_{s}^{[2]}, λ_{2 s + 1}, \dots, λ_{p}) \in R^{P \times P}$

和

$X = [x_{1 R}, x_{1 I}, \dots, x_{s R}, x_{s I}, x_{2 s + 1}, \dots, x_{p}] \in R^{n \times p},$

其中 $λ_{i}^{[2]} = [\begin{matrix} a_{i} & b_{i} \\ - b_{i} & a_{i} \end{matrix}]$ 。则NIEP是求一个非负矩阵 $A \in R^{n \times n}$ ，使得

$A X = X Λ .$ (1)

设

$C_{1} = {A \in R^{n \times n} | A X = X Λ}, C_{2} = R_{+}^{n \times n}$ (2)

( $R_{+}^{n \times n}$ 是全体n阶非负矩阵的集合)。容易验证 $C_{1}, C_{2}$ 都是多面体，从而是凸集.则NIEP可以转化为以下凸可行性问题：

求矩阵 $A \in R^{n \times n}$ ，使得 $A \in C_{1} \cap C_{2}$ 。 (3)

通过把NIEP转化为问题(3)，我们用以下交替投影算法求解NIEP。关于交替投影算法的其他应用和研究结果可见参考文献 [16] 。

算法3.1 (交替投影算法)

Step 0 给定初始矩阵 $A^{0} \in R^{n \times n}$ ， $ε > 0$ ，令 $k = 0$ 。

Step 1令 $A^{k + 1} = P_{C_{2}} (P_{C_{1}} (Y^{k}))$ 。

Step 2 若 ${‖ A^{k + 1} X - X Λ ‖}_{F} \leq ε$ ，算法终止；否则，进入下一步。

Step 3 令 $k = k + 1$ ，转Step 1。

下面分别给出 $P_{C_{1}} (\cdot)$ 和 $P_{C_{2}} (\cdot)$ 的计算式。由定义容易验证，对任意 $A = (a_{i j}) \in R^{n \times n}$ ，有 $P_{C_{2}} (A) = {({\bar{a}}_{i j})}_{n \times n}$ ，其中

${\bar{a}}_{i j} = {\begin{cases} a_{i j}, a_{i j} \geq 0 \\ 0, a_{i j} < 0 \end{cases}, i, j = 1, 2, \dots, n .$

为得到 $P_{C_{1}} (\cdot)$ 的计算式，我们引用以下结论，见 [10] 。

引理3.1设 $B_{1} \in R^{q \times m}, B_{2} \in R^{n \times t}, B_{3} \in R^{q \times t}$ ，其中 $p, q, t$ 为正整数。则集合 $C = {A \in R^{m \times n} | B_{1} A B_{2} = B_{3}}$ 非空的充分必要条件是 $B_{1}, B_{2}, B_{3}$ 满足 $B_{1} B_{1}^{+} B_{3} B_{2}^{+} B_{2} = B_{3}$ 。并且当C非空时有

$P_{C} (Y) = B_{1}^{+} B_{3} B_{2}^{+} + A - B_{1}^{+} B_{1} A B_{2} B_{2}^{+}, \forall Y \in R^{m \times n} .$

引理3.2设集合 $C_{1}$ 由(2)定义，则 $C_{1}$ 非空的充分必要条件是 $X Λ X^{+} X = X Λ$ 。并且当 $C_{1}$ 非空时有

$P_{C_{1}} (Y) = X Λ X^{+} + Y (I - X X^{+}), \forall Y \in R^{n \times n} .$

证：由定义有 $C_{1} = {A \in R^{n \times n} | E A X = X Λ}$ ，其中E是n阶单位阵。令 $B_{1} = E, B_{2} = X, B_{3} = X Λ$ ，由引理3.1， $C_{1}$ 非空的充分必要条件是 $B_{1} B_{1}^{+} B_{3} B_{2}^{+} B_{2} = B_{3}$ ，即 $X Λ X^{+} X = X Λ$ 。并且此时对任意 $Y \in R^{n \times n}$ ，有 $P_{C_{1}} (Y) = B_{1}^{+} B_{3} B_{2}^{+} + Y - B_{1}^{+} B_{1} Y B_{2} B_{2}^{+} = X Λ X^{+} + Y (I - X X^{+})$ 。证毕。

定理3.3设NIEP解集非空， ${A^{k}}$ 是算法3.1产生的点列。则 ${A^{k}}$ 线性收敛到NIEP的一个的解。

证：用定义容易验证 $C_{1}, C_{2}$ 是多面体。从而由 [17] (或 [16] )，知 ${C_{1}, C_{2}}$ 线性正则。再由 [17] (或 [16] )，可知算法3.1产生的点列 ${A^{k}}$ 线性收敛到问题(3)的一个解。从而 ${A^{k}}$ 线性收敛到NIEP的一个解。证毕。

4. 数值实验结果

在这一节，我们将用数值实验验证算法3.1的收敛性，并比较该算法和非光滑牛顿法 [10] 的收敛效率。注意到，在文献 [10] 中，作者证明了非光滑牛顿法在某种非退化的条件下二阶收敛。所以非光滑牛顿法不能保证对所有初始点算法收敛。此外，因为非光滑牛顿法求解子问题要花费很多时间，其实际运算效率并不高。下面的数值例子也表明，非光滑牛顿法不一定收敛，并且算法3.1比非光滑牛顿法收敛效率更快。

Table 1. n = 100 , [ a , b ] = [ 0 , 1 ]

表1. $n = 100, [a, b] = [0, 1]$

Table 2. p = 10 , [ a , b ] = [ 0 , 1 ]

表2. $p = 10, [a, b] = [0, 1]$

Table 3. n = 100 , [ a , b ] = [ 1 , 10 ]

表3. $n = 100, [a, b] = [1, 10]$

Table 4. p = 10 , [ a , b ] = [ 1 , 10 ]

表4. $p = 10, [a, b] = [1, 10]$

在以下数值实验中，我们采用编程软件为Matlab2016a。初始矩阵 $A^{0} \in R^{n \times n}$ 为随机产生的n阶矩阵，iter，Err和time (s)分别表示算法的迭代次数，误差( $Err = ‖ A^{k} X - X Λ ‖ {}_{F}$ )和CPU运行时间(以秒为单位)。在每次实验时，我们随机生成一个 $n \times n$ 矩阵，其元素均匀分布在 $[a, b]$ 之间，并取其前p个特征对为给定特征对。其中第1，2个数值实验在随机生成的元素均匀分布在[0, 1]之间；第3，4个数值实验在随机生成的元素均匀分布在[1, 10]之间。具体的实验结果分别见表1~4。其中“−”表示算法迭代10,000次没有达到精度。此时，我们认为算法不收敛。

基金项目

论文得到国家自然科学基金(11661019)和贵州省数据驱动建模学习与优化创新团队(黔科合平台人才[2020]5016)资助。

NOTES

¹所有元素都是非负实数的矩阵称为非负矩阵。

参考文献

[1]	Chu, M.T. and Golub, G.H. (2002) Structured Inverse Eigenvalue Problems. Acta Numerica, 11, 1-71. [Google Scholar] [CrossRef]
[2]	Egleston, P.D, Lenker, T. and Narayan, S.K. (2004) The Nonnegative Inverse Eigenvalue Problem. Linear Algebra and its Applications, 379, 475-490. [Google Scholar] [CrossRef]
[3]	Chu, M.T. and Driessel, K.R. (1991) Constructing Symmetric Nonnegative Matrices with Prescribed Eigenvalues by Difffferential Equations. SIAM Journal on Mathematical Analysis, 22, 1372-1387. [Google Scholar] [CrossRef]
[4]	Hald, H.O. (1972) On Discrete and Numerical Invers Sturm-Liouville Problems. Ph.D. Thesis. New York University, New York.
[5]	Li, N. (1997) A Matrix Inverse Ei-genvalue Problem and Its Application. Linear Algebra and its Applications, 266, 143-152. [Google Scholar] [CrossRef]
[6]	Deakin, A.S. and Luke, J.M. (1992) On the Inverse Eigen-value Problem for Matrices. Journal of Physics A: Mathematical and General, 25, 635-648. [Google Scholar] [CrossRef]
[7]	Chu, M.T. and Golub, G.H. (2005) Inverse Eigenvalue Problems: Theory, Algorithms and Applications. Oxford University Press, Oxford.
[8]	Chen, X. and Liu, D.L. (2011) Isospectral Flow Method for Nonnegative Inverse Eigenvalue Problem with Prescribed Structure. Journal of Computational & Ap-plied Mathematics, 235, 3990-4002. [Google Scholar] [CrossRef]
[9]	Robert, O. (2006) Numerical Methodsfor Solving Inverse Eigen-value Problems for Nnonnegative Matrices. Society for Industrial and Applied, 28, 190-212. [Google Scholar] [CrossRef]
[10]	Bai, Z.J., Stefano, S.C. and Zhao, Z. (2012) Nonnegative Inverse Eigen-value Problems with Partial Eigendata. Numerische Mathematik, 120, 387-431. [Google Scholar] [CrossRef]
[11]	Chu, M.T., Diele, F. and Sgura, I. (2004) Gradient Flow Method for Matrix Completion with Prescribed Eigenvalues. Linear Algebra and its Applications, 379, 85-112. [Google Scholar] [CrossRef]
[12]	Loewy, R. and London, D.A. (1978) Note on an Inverse Problem for Nonnegative Matrices. Linear and Multilinear Algebra, 6, 83-90. [Google Scholar] [CrossRef]
[13]	Clarke, F.H. (1983) Optimization and Nonsmooth Analysis. Wiley, New York.
[14]	许以超. 线性代数与矩阵论[M]. 北京: 高等教育出版社, 2008.
[15]	朱元国, 饶玲, 严涛, 张军, 李成宝. 矩阵分析与计算[M]. 北京: 国防工业出版社, 2010.
[16]	Bauschke, H.H. and Borwein, J.M. (1996) On Projection Algorithms for Solving Convex Feasibility Problems. SIAM Review, 38, 367-426. [Google Scholar] [CrossRef]
[17]	Zhao, X.P., Ng, K.F., Li, C. and Yao, C.H. (2018) Linear Reg-ularity and Linear Convergence of Projection-Based Methods for Solving Convex Feasibility Problems. Applied Mathe-matics & Optimization, 78, 613-641. [Google Scholar] [CrossRef]

为你推荐

友情链接