一类复对称线性系统的不平衡CRI迭代方法
Lopsided CRI Iteration Method for a Class of Complex Symmetric Linear Systems
摘要: 基于实部与虚部组合(CRI)迭代方法,提出了一种不平衡CRI (LCRI)迭代方法,用于求解复对称半正定线性系统。理论上利用谱理论分析了LCRI方法的收敛性,并给出了拟最优参数的表达式,数值上进一步验证了新方法的高效性。
Abstract: Based on the combination of real and imaginary parts (CRI) iteration method, a lopsided CRI (LCRI) iteration method is proposed for solving complex symmetric positive semi-definite linear systems. By using the spectral theory, we not only analyze the convergence property of the LCRI method, but also obtain the quasi-optimal parameter expression. The efficiency of the new method is further verified numerically.
文章引用:罗漪清. 一类复对称线性系统的不平衡CRI迭代方法[J]. 应用数学进展, 2025, 14(3): 357-363. https://doi.org/10.12677/aam.2025.143123

1. 引言

考虑复对称线性系统

Ax=b,   A n×n ,   x,b n , (1)

其中A是一个大型稀疏复对称矩阵,形式为 A=W+iT i= 1 表示虚数单位,矩阵 W,T n×n 均为实对称矩阵。系统(1)常出现在科学计算和工程应用中,例如时间依赖的偏微分方程基于快速傅里叶变换(FFT)的数值解问题[1]、光的散射成像问题[2]、结构动力学问题[3]和量子力学问题[4]等。近年来,学者们针对线性系统(1)提出了许多矩阵分裂迭代法。

当矩阵 W,T 是对称半正定的,且其中至少有一个是对称正定的时,系统(1)通常被称为复对称正定线性系统。Bai等人[5]基于系数矩阵A的Hermitian和反Hermitian分裂(HSS),即 A=H+S ,其中

H= 1 2 ( A+ A * )=W,   T= 1 2 ( A A * )=iT,

分别为矩阵A的Hermitian部分和反Hermitian部分,率先提出了HSS迭代方法;由于HSS方法在每一步迭代中都需要求解一个平移的反Hermitian方程组,Bai等人[6]为克服此问题,提出了修正的HSS (MHSS)迭代方法;为了加快MHSS方法的收敛速率,Bai等人[7]将预处理技术应用于MHSS方法,建立了预处理的MHSS (PMHSS)迭代方法;随后,Li等人[8]提出了一种不平衡PMHSS (LPMHSS)迭代方法,并在理论和数值上表明了当系数矩阵的实部占主导时,LPMHSS方法的表现优于MHSS和PMHSS方法。

此外,Wang等人[9]在不限制矩阵 W,T 至少有一个是对称正定的情况下,即 W,T 均为对称半正定矩阵,且满足 N( W )N( T )={ 0 } ,提出了一种实部与虚部组合(CRI)迭代方法,其格式如下:

方法1 (CRI迭代方法) 给定初始估计向量 x ( 0 ) n ,直到迭代序列 { x ( k ) }( k=0,1,2, ) 收敛,按照如下方式计算新的迭代解 x ( k+1 )

{ ( αT+W ) x ( k+ 1 2 ) =( αi )T x ( k ) +b, ( αW+T ) x ( k+1 ) =( α+i )W x ( k+ 1 2 ) ib,

其中, α 为给定的正常数。

上述方法可以看作是PMHSS迭代方法的变体,作者证明了CRI方法的理论性质与数值性能均优于PMHSS方法。

为了进一步提高CRI迭代方法的数值性能,本文借鉴文献[8]的不平衡分裂迭代思想,构建了一种用于求解复对称半正定线性系统的不平衡CRI (LCRI)迭代方法。本文结构安排如下:第2节构建LCRI方法的迭代格式;第3节利用谱理论分析LCRI方法的收敛性和拟最优参数;第4节通过数值实验检验LCRI方法的性能;第5节主要总结本文的研究工作。

2. LCRI迭代方法

本节首先给出LCRI迭代方法的迭代格式。线性系统(1)可以写作以下两种等价形式

Wx=iTx+b, ( αW+T )x=( α+i )Wxib,

通过交替迭代上述两个不动点方程,可以得到LCRI迭代方法。值得一提的是,为了避免 Wx 带来额外的工作量,该方法的迭代格式可描述为:

方法2 (LCRI迭代方法) 给定初始估计向量 x ( 0 ) n ,直到迭代序列 { x ( k ) }( k=0,1,2, ) 收敛,按照如下方式计算新的迭代解 x ( k+1 )

{ x ( k+ 1 2 ) =iT x ( k ) +b, ( αW+T ) x ( k+1 ) =( α+i ) x ( k+ 1 2 ) ib, (2)

其中, α 为给定的正常数。

在LCRI迭代方法的每一步中,我们只需要求解一个线性子系统,由文献[9]可知其系数矩阵 αW+T 是实对称正定的,因此可以通过Cholesky分解精确计算,也可以通过共轭梯度法或多重网格法不精确计算。而CRI迭代方法的每一步需要求解系数矩阵分别为 αT+W αW+T 的两个线性子系统,由此可以断言LCRI迭代方法会比CRI方法在求解线性系统(1)时更加高效。

经过简单的推导,我们可以将LCRI方法的迭代格式(2)重新表述为标准形式

x ( k+1 ) =L( α ) x ( k ) +G( α )b, (3)

其中

L( α )=( 1αi ) ( αW+T ) 1 T,   G( α )=α ( αW+T ) 1 .

显然, L( α ) 是LCRI方法的迭代格式(2)或(3)的迭代矩阵。因此,LCRI迭代方法收敛当且仅当迭代矩阵的谱半径小于1,即 ρ( L( α ) )<1 。此外,若引入矩阵

B( α )= 1 α ( αW+T ),   C( α )=( 1 α i )T,

则LCRI迭代方法可以看作是由矩阵分裂

A=B( α )C( α )

导出的,且迭代矩阵可以表示为 L( α )=B ( α ) 1 C( α )

3. LCRI迭代方法的收敛性分析

本节从理论上对LCRI迭代方法的收敛性进行分析,我们首先给出一个有用的引理。

引理1 (见[9]) 设 W,T n×n 均为对称半正定矩阵,且满足 N( W )N( T )={ 0 } ,则存在一个非奇异矩阵P使得

W= P T ΛP, T= P T ΓP,

其中, Λ=diag( λ 1 , λ 2 ,, λ n ) Γ=diag( γ 1 , γ 2 ,, γ n ) 满足

λ i + γ i =1,    λ i 0,  γ i 0( i=1,2,,n ).

基于上述引理的结论,下面我们分析LCRI迭代方法的收敛条件。

定理1 A=W+iT 是一个复对称非奇异矩阵,其中 W,T n×n 均为对称半正定矩阵。假设 γ max 是矩阵T的最大特征值,若参数 α 满足

( 12 γ max )α+2 γ max ( 1 γ max )>0,

则用于求解系统(1)的LCRI迭代方法对于任意的初始估计向量 x ( 0 ) n 都是收敛的。

证明:由于矩阵WT都是对称半正定的,且满足 N( W )N( T )={ 0 } ,因此根据引理1,存在一个非奇异矩阵P,使得

L( α )=( 1αi ) ( αW+T ) 1 T=( 1αi ) P 1 ( αΛ+Γ ) 1 ΓP,

显然,迭代矩阵 L( α ) 相似于

L ˜ ( α )=( 1αi ) ( αΛ+Γ ) 1 Γ,

则有

ρ( L( α ) )=ρ( L ˜ ( α ) )=ρ( ( 1αi ) ( αΛ+Γ ) 1 Γ )= max 1jn { 1+ α 2 γ j α λ j + γ j }= max 1jn { 1+ α 2 γ j α+( 1α ) γ j }.

为了方便起见,记

f( γ j )= 1+ α 2 γ j α+( 1α ) γ j ,

对函数 f( γ j ) 关于 γ j 求导可得

df( γ j ) d γ j = α 1+ α 2 ( α+( 1α ) γ j ) 2 >0,

则函数 f( γ j ) [ 0,+ ) 上单调递增,从而

max 1jn f( γ j )=f( γ max )= 1+ α 2 γ max α+( 1α ) γ max ,

因此,我们有

ρ( L( α ) )=f( γ max )<1    ( 12 γ max )α+2 γ max ( 1 γ max )>0,

定理证毕。

由定理1可知,LCRI迭代方法的收敛速度可能取决于两个因素,一个是对称半正定矩阵T的谱,另一个是迭代参数 α 的选取。在实际应用中,为了避免LCRI方法选取实验最优参数所造成的额外工作量,我们希望找到最优参数 α 的良好估计,以极小化迭代矩阵的谱半径,从而提高LCRI方法的收敛速率。因此,我们在下述推论中给出迭代参数 α 的估计式。

推论1 假设定理1的条件成立,设 γ max 是矩阵T的最大特征值,则LCRI迭代方法的拟迭代参数为

α * =arg min α { ρ( L( α ) ) }=arg min α { 1+ α 2 γ max α+( 1α ) γ max }= 1 γ max 1,

此时对应的迭代矩阵的谱半径为

ρ( L( α * ) )= γ max 2 γ max 2 2 γ max +1 .

4. 数值实验

本节通过数值实验来检验LCRI迭代方法的数值性能,我们将从迭代步数(IT)和迭代时间(CPU)这两个方面比较PMHSS、LPMHSS、CRI和LCRI迭代方法。在实验中,我们对所有测试方法所含的子系统均使用Cholesky分解进行求解,并在分解之前使用对称近似极小度方法(SYMAMD)进行重排,具体细节可参考文献[10]

在算法的实现过程中,我们选取初始向量 x ( 0 ) 为零向量,停止标准均为当前迭代解 x ( k ) 的相对残差满足条件

bA x ( k ) 2 b 2 10 6 ,

或者迭代步数达到 k max =1000 。对于所有测试方法中涉及的迭代参数,我们选取实验最优值 α exp ,即使得迭代步数最小的值。若最优参数值形成一个区间,则在此区间内选取使得迭代时间最小的值作为最优参数。PMHSS和LPMHSS方法中使用的预处理矩阵V选取为W。所有数值结果均通过MATLAB [版本号9.12.0.1884302 (R2022a)]计算得到,计算机配置:中央处理器1.70 GHz [Intel(R) Core(TM) i5 1240P],内存15.7 G,操作系统Windows 11。

算例1 (参考[8] [9]) 考虑如下形式的复对称线性系统

[ ( ω 2 M+K )+i( ω C V + C H ) ]x=b,

其中 ω 为圆周频率,M是惯性矩阵,K是刚度矩阵, C V 为粘性阻尼矩阵, C H 为滞后阻尼矩阵。这里取 M=I C V =10M C H =μK ,其中 μ 是阻尼系数。此外,假设K为二维区域 Ω=[ 0,1 ]×[ 0,1 ] 上一致网格剖分下对具有齐次Dirichlet边值条件的负拉普拉斯算子的五点中心差分格式近似矩阵,每个方向上网格步长都取 h=1/ ( m+1 ) 。因此矩阵 K= I m V m + V m I m ,其中 V m = h 2 tridiag( 1,2,1 ) m×m 。实验中,取圆周频率 ω=0.5 ,右端向量 b=( 1+i )A1 ,其中 1 是分量全为1的向量。此外,通过对系统方程两边同时乘以 h 2 使问题标准化。

迭代方法的收敛速度在很大程度上取决于迭代矩阵的谱半径,图1描绘了网格数 m=64 的情况下,CRI和LCRI迭代方法在不同阻尼系数( μ=0.1,0.01,0.001 )下迭代矩阵谱半径的比较。从图1可以看出,当 μ 较小时(即系数矩阵实部占主导),LCRI方法的迭代矩阵谱半径比CRI方法的迭代矩阵谱半径小很多,但当 μ 较大时(即系数矩阵虚部占主导),CRI方法的表现更好。

Figure 1. The spectral radius of the iteration matrix ρ versus the parameter α

1. 迭代矩阵的谱半径 ρ 与参数 α 的关系图

下面我们取阻尼系数 μ=0.001 进行实验。在表1中,我们列出了PMHSS、LPMHSS、CRI和LCRI方法的实验最优参数范围以及LCRI方法的拟最优参数 α * 的值。实验中发现LPMHSS和LCRI方法对于参数 α 的取值不太敏感,这里我们人为地将参数 α 的上界设为1000,而PMHSS和CRI方法的实验最优参数取值范围则相对较小,且随着网格数m的增大而逐渐变窄,这说明LPMHSS和LCRI方法在参数选取上更加灵活。此外,LCRI方法的拟最优参数 α * 的值均在其实验最优参数取值范围内,这表明由推论1所得到的拟最优参数 α * 是LCRI方法迭代参数的一个不错的选择。

Table 1. The ranges of experimental optimal parameter or the values of quasi-optimal parameter of the tested methods

1. 测试方法的实验最优参数取值范围或拟最优参数值

方法

参数

m=64

m=128

m=256

m=512

PMHSS

α exp

[0.75,1.32]

[0.76,1.31]

[0.76,1.30]

[0.76,1.30]

LPMHSS

α exp

[0.96,1000]

[1.10,1000]

[1.42,1000]

[0.62,1000]

CRI

α exp

[0.63,1.61]

[0.63,1.58]

[0.64,1.56]

[0.66,1.53]

LCRI

α exp

[0.96,1000]

[1.10,1000]

[1.42,1000]

[0.62,1000]

LCRI

α *

107.95

119.49

122.83

123.71

所有测试方法对应于不同网格大小的数值结果如表2所示,包括实验最优参数、迭代步数和迭代时间。可以观察到,PMHSS方法的迭代步数不受网格数m的影响,LPMHSS、CRI和LCRI方法的迭代步数均随网格数m的增大而逐渐减小。无论是从迭代步数还是迭代时间来看,LPMHSS、CRI和LCRI方法均对PMHSS方法有着显著的改进效果。LCRI方法和LPMHSS方法的迭代步数相同,但前者的迭代时间小于后者。事实上,LCRI方法可以看作将LPMHSS方法的预处理矩阵V取为W,且相较于LPMHSS方法少求解一个系数矩阵为W的线性子系统,从而降低了计算成本。此外,当网格数 m=64,128,256 时,LCRI方法的迭代步数和迭代时间均优于CRI方法。当网格数 m=512 时,这两种方法的迭代步数相同,但LCRI方法在迭代时间上的优势更为明显,这表明LCRI方法能够更高效地处理大规模问题。

Table 2. The numerical results of the tested methods with experimental optimal parameter values

2. 测试方法利用实验最优参数所得的数值结果

方法

m=64

m=128

m=256

m=512

PMHSS

α exp

0.99

1.15

1.01

0.76

IT

34

34

34

34

CPU

0.0847

0.1961

0.6949

3.0806

LPMHSS

α exp

940

630

420

130

IT

6

5

4

4

CPU

0.0219

0.0457

0.0919

0.3787

CRI

α exp

1.17

0.80

1.02

0.66

IT

7

6

5

4

CPU

0.0321

0.0533

0.1443

0.4407

LCRI

α exp

130

690

70

60

IT

6

5

4

4

CPU

0.0179

0.0332

0.0668

0.2008

因此,当系数矩阵的实部W相对于虚部T占主导且问题规模较大时,我们倾向于使用LCRI迭代方法来求解复对称线性系统(1)。

5. 总结

本文基于CRI迭代方法,利用不平衡分裂迭代思想,构建了一种不平衡CRI (LCRI)迭代方法来求解复对称半正定线性系统。理论分析表明,当迭代参数 α 满足一定条件时,LCRI方法可以收敛到线性系统(1)的唯一精确解。并通过极小化迭代矩阵的谱半径,给出了拟最优参数 α * 的表达式。数值结果表明,当线性系统(1)的系数矩阵实部占主导且问题规模较大时,LCRI方法具有高效性与稳健性。

参考文献

[1] Bertaccini, D. (2004) Efficient Preconditioning for Sequences of Parametric Complex Symmetric Linear Systems. Electronic Transactions on Numerical Analysis, 18, 49-64.
[2] Arridge, S.R. (1999) Optical Tomography in Medical Imaging. Inverse Problems, 15, R41-R93.
https://doi.org/10.1088/0266-5611/15/2/022
[3] Feriani, A., Perotti, F. and Simoncini, V. (2000) Iterative System Solvers for the Frequency Analysis of Linear Mechanical Systems. Computer Methods in Applied Mechanics and Engineering, 190, 1719-1739.
https://doi.org/10.1016/s0045-7825(00)00187-0
[4] Van Dijk, W. and Toyama, F.M. (2007) Accurate Numerical Solutions of the Time-Dependent Schrödinger Equation. Physical Review E, 75, Article ID: 036707.
https://doi.org/10.1103/physreve.75.036707
[5] Bai, Z., Golub, G.H. and Ng, M.K. (2003) Hermitian and Skew-Hermitian Splitting Methods for Non-Hermitian Positive Definite Linear Systems. SIAM Journal on Matrix Analysis and Applications, 24, 603-626.
https://doi.org/10.1137/s0895479801395458
[6] Bai, Z., Benzi, M. and Chen, F. (2010) Modified HSS Iteration Methods for a Class of Complex Symmetric Linear Systems. Computing, 87, 93-111.
https://doi.org/10.1007/s00607-010-0077-0
[7] Bai, Z., Benzi, M. and Chen, F. (2011) On Preconditioned MHSS Iteration Methods for Complex Symmetric Linear Systems. Numerical Algorithms, 56, 297-317.
https://doi.org/10.1007/s11075-010-9441-6
[8] Li, X., Yang, A. and Wu, Y. (2013) Lopsided PMHSS Iteration Method for a Class of Complex Symmetric Linear Systems. Numerical Algorithms, 66, 555-568.
https://doi.org/10.1007/s11075-013-9748-1
[9] Wang, T., Zheng, Q. and Lu, L. (2017) A New Iteration Method for a Class of Complex Symmetric Linear Systems. Journal of Computational and Applied Mathematics, 325, 188-197.
https://doi.org/10.1016/j.cam.2017.05.002
[10] Saad, Y. (2003) Iterative Methods for Sparse Linear Systems. 2nd Edition, SIAM.