1. 引言
本文研究绝对值方程(Absolute Value Equation, AVE)的求解问题,其基本形式为:
(1)
其中
为n阶实系数矩阵,
为实常数向量,
表示由向量
的分量的绝对值组成的向量。
绝对值方程AVE (1)在科学与工程计算中具有广泛应用。例如,线性规划、二次规划及双矩阵博弈等问题均可转化为线性互补问题(LCP) [1] [2]。基于模方法,LCP可重新表述为形如(1)的绝对值方程组[3]。特别地,文献[4]-[9]提出了一系列基于模的矩阵分裂迭代方法来求解LCP的解。
近年来,许多学者对AVE (1)的唯一可解性进行了研究,如Wu和Li在[10]中给出了AVE (1)唯一可解的两个充要条件和一些充分条件。AV (1)的更多可解性条件可以在[11]等参考文献中找到。为了逼近其数值解,一些学者已经提出了大量的方法来求解AVE (1),包括修正或广义牛顿法[1] [12],矩阵分裂迭代法[13],Picard型方法[14],神经网络模型方法[15] [16]等。
文献[17]通过将绝对值方程(1)转化为一个等价的块结构非线性方程组,提出了一类基于块系数矩阵分裂的SOR-like迭代法。受这一方法的启发,后续研究进一步发展了多种基于等效2 × 2块形式的迭代方法,用于求解绝对值方程。这些方法主要包括:不动点迭代方法[18],修正不动点(MFPI)迭代方法[19]、移位分裂不动点迭代方法[20]、预条件移位分裂不动点迭代方法[21]。这些方法的核心思想是利用矩阵分裂技术或等效变换,将原始问题转化为更适合迭代求解的形式,并结合预条件、松弛因子等策略来加速收敛。
本文在此基础上,结合预条件移位分裂迭代法[22],提出了一种SOR-like-PSS迭代法。我们严格证明了在参数选取适当时,该方法的迭代序列收敛于AVE (1)的解。进一步的数值实验表明,SOR-like-PSS迭代法在计算效率与求解精度上均表现出显著优势,验证了其可行性与有效性。
本文的组织结构如下。在第1节中,我们给出了一些将在整篇论文中使用的符号和预备工作。在第2节中,我们提出了一种求解AVE (1)的SOR-like-PSS迭代法,并证明了所提出的迭代方法的收敛性。实验结果和参数选择分别在第3和4节中给出,第5节为结论。
2. 预备知识
在下文中,我们给出论文所用到的一些数学符号和基本定义。
设
表示所有实
矩阵的集合,且
。向量
的第
个分量记为
。对于
,
表示一个向量,其分量根据
对应分量的正负或零分别取1、−1或0。
表示一个向量,其第
个分量为
。
符号
表示
单位矩阵。若
,则
表示一个
的对角矩阵,其
位置元素为
。设
,如果对所有的
都有
,则记为
。若矩阵
的所有元素满足
,则称其为非负(正)矩阵。对于矩阵
,
表示其谱范数,定义
,其中
为2-范数。
表示向量或矩阵的
-范数。
表示向量或矩阵的
范数。
以下命题已在文献[10]的命题4中得证。
命题1 [3] 设
非奇异。若
,则对于任意
,绝对值方程(1)存在唯一解。
为后文分析求解绝对值方程(AVE)的SOR-like-PSS法的收敛性,我们给出以下引理。
引理1 [23]-[25]对于任意向量
,有以下结论:
(1)
;
(2) 若
,则
;
(3) 若
且
是非负矩阵,则
。
引理2 [23] [24]对于任意矩阵
,若
,则
。
引理3 [23] [26]实二次方程
的两个根的模均小于1的充要条件是
且
。
3. 预条件移位分裂SOR-Like迭代法(SOR-Like-PSS)
设
,则AVE(1)等价于
(2)
其可以被重新表述为下面的2 × 2块非线性方程
。 (3)
其中
,
。
注意,(3)式也是非线性的,因为矩阵
依赖于变量
。在实际计算中,求解(3)式也是相当复杂的。
设
,
其中
,
,
,
那么我们可以得到下面的不动点方程
,
其中参数
。即
。 (4)
基于不动点方程(4),我们可以建立如下的矩阵分裂迭代法来求解AVE (1),称为SOR-like迭代法。
算法1 (用于求解绝对值方程组的SOR-like迭代法[17])
设
是一个非奇异矩阵,且
。给定初始向量
和
,对于
直
到序列
收敛,计算:
(5)
通过使用矩阵A的以下预条件移位分裂(the preconditioned shift-splitting,简称PSS) [22]
,
其中参数
是一个正的常数,
是对称正定矩阵,矩阵
是非奇异的,从而得到以下方程:
。 (6)
这就得到了下面的用于AVE(1)的SOR-like-PSS方法,其中
是(6)式的解对。
算法2 (用于求解绝对值方程组的SOR-like-PSS迭代法)
设
,
。设
是一个正的常数,使得
是非奇异的。 给定初始向量
和
,使用以下迭代方法计算
,其中
,直到
满足停机准则:
。 (7)
其中
,
是正的常数,
是对称正定矩阵。
注1 若矩阵
是半正定的,则矩阵
非奇异的条件自然成立。即使矩阵
是奇异的,我们也总能找到一些足够大的参数来保证矩阵
是非奇异的。因此,SOR-like-PSS方法比SOR-like方法具有更广泛的应用范围。
在本节剩余部分,假设AVE(1)存在唯一解。
是(6)的解对,而
是由SOR-like-PSS迭代(7)生成的序列。迭代误差定义为:
,
。
通过估计上述两个迭代误差,可以得到相应的收敛定理。
定理1 设
是一个正的常数,使得
是非奇异的。记
,
,
,
以及
。
则我们有
。 (8)
其中,
。
此外,当参数
和
满足
,
, (9)
则对于任何初始向量,由SOR-like-PSS迭代生成的迭代序列
收敛于AVE(1)的唯一解
。
证明:由(6)、(7)式,得
, (10)
, (11)
由(10)式,我们能够得到
。 (12)
由(11)式和引理1,有
, (13)
重新排列(12)式和(13)式,有
。 (14)
设
。
(14)式左乘非负矩阵
,根据引理1,我们有
, (15)
它可以被重写为
。 (16)
取不等式(16)两边的
-范数并根据引理1的(2),则(8)式得证。
由于
,
我们有
。
由(16)式,我们推断
。
因此,如果满足条件(9),则我们有
。
由于
,
它遵循
,
,
这意味着迭代序列
在条件(9)下收敛于
。这就证明了定理。
通过一个新的加权范数,使用不同的误差估计,我们可以得到另一个收敛定理如下。
定理2 假设定理1的条件满足,
的定义同定理1一致,记
则有下面不等式成立:
(17)
其中,
。
此外,
当且仅当参数
和
满足
,
, (18)
也就是说,如果条件(18)成立,则对于任何初始向量,由SOR-like-PSS迭代生成的迭代序列
收敛于AVE(1)的唯一解
。
证明:设
,
易知
。
(15)式左乘非负矩阵
,根据引理1,我们有
, (19)
取不等式(19)两边的2范数并根据引理1的(2),得到
。
下证
。
设
是
的特征值,由于
,
我们有
,
。
因此,
是以下实二次方程的根
。
根据引理3可以得出,
当且仅当
,
。
由(17)式,我们得到
因此,当满足条件(18)时,我们有
。
根据定义
,
我们有
,
,
这意味着迭代序列
在条件(18)下收敛于
。这就证明了定理。
定理2表明,为了获得SOR-like-PSS方法的收敛性,我们需要找到其中
成立的条件。这里,我们给出了比定理2中更简单的收敛条件。
推论1 设定理1的条件满足,
的定义同定理1,
和
如定理2所定义。若
,
, (20)
, (21)
则
,即也就是说,当条件(20)~(21)成立时,SOR-like-PSS方法是收敛的。
证明:设
,我们有
,
其中
。
根据引理2,可以得到
。
设
。因此,如果
,则我们有
。然后,
。
因此,如果满足条件(20)~(21),则迭代序列
收敛于
。
4. 数值实验
本节通过两个算例验证SOR-like-PSS法的有效性和可行性。我们将SOR-like-PSS法与SOR-like法[17]以及FPI-SS法[20]从迭代步数(表示为“IT”)、以秒为单位的CPU耗时(表示为“CPU”)和绝对残差(表示为“RES”)等方面进行比较,绝对残差定义为
。
在下面所有实验中,我们选择
,其中
,所有初始向量
和
都选择为零向量,当
或最大迭代步数
超过500时,所有的迭代都将终止。所有计算均在一台配备3.60 GHz中央处理(Intel(R) Core(TM) i7-7700 CPU @ 3.6 0GHz)和8GB内存的个人计算机上使用MATLABR2017 a上实现。
算例1 [5] 设绝对值方程(1)的系数矩阵
,定义
,其中
是一个块三角矩阵,
是一个三角矩阵,
。设
是绝对值方程(1)的精确解。
算例1在
,
时的最优实验参数、IT、CPU和RES列于表1,表2。
Table 1. Numerical results of Example 1 with
表1. 算例1在
时的数值结果
Method |
n |
502 |
1002 |
1502 |
2002 |
SOR-like |
|
0.82 |
0.82 |
0.82 |
0.82 |
|
IT |
11 |
12 |
12 |
12 |
|
CPU |
0.0211 |
0.2080 |
0.6257 |
1.1916 |
|
RES |
9.0602e-07 |
3.6667e-07 |
4.7014e-07 |
5.6475e-07 |
FPI-SS |
|
0.90 |
0.90 |
0.90 |
0.90 |
|
|
5.51 |
5.51 |
5.51 |
5.51 |
|
IT |
14 |
14 |
14 |
14 |
|
CPU |
0.0326 |
0.1982 |
0.5184 |
0.9921 |
|
RES |
4.8485e-07 |
6.8766e-07 |
8.4315e-07 |
9.7425e-07 |
SOR-like-PSS迭代法 |
|
0.99 |
0.99 |
0.99 |
0.99 |
|
|
1.29 |
1.29 |
1.29 |
1.29 |
|
IT |
7 |
7 |
7 |
7 |
|
CPU |
0.0217 |
0.1961 |
0.3962 |
0.7304 |
|
RES |
2.8643e-07 |
4.5397e-07 |
6.0753e-07 |
7.5567e-07 |
Table 2. Numerical results of Example 1 with
表2. 算例1在
时的数值结果
Method |
n |
502 |
1002 |
1502 |
2002 |
SOR-like |
|
0.92 |
0.92 |
0.92 |
0.92 |
|
IT |
8 |
9 |
9 |
9 |
|
CPU |
0.0164 |
0.1883 |
0.7615 |
1.0446 |
|
RES |
5.5132e-07 |
7.3638e-08 |
1.1178e-07 |
1.4993e-07 |
FPI-SS |
|
0.94 |
0.94 |
0.92 |
0.94 |
|
|
8.88 |
8.84 |
8.78 |
8.80 |
|
IT |
10 |
10 |
11 |
11 |
|
CPU |
0.0185 |
0.1244 |
0.3368 |
0.6825 |
|
RES |
7.7974e-07 |
9.8700e-07 |
9.5461e-07 |
6.7937e-07 |
SOR-like-PSS迭代法 |
|
0.99 |
0.99 |
0.99 |
0.99 |
|
|
1.07 |
1.07 |
1.07 |
1.07 |
|
IT |
6 |
6 |
6 |
6 |
|
CPU |
0.0246 |
0.1528 |
0.3511 |
0.7446 |
|
RES |
2.1027e-07 |
3.4315e-07 |
4.7011e-07 |
5.9496e-07 |
算例2 [5] 设绝对值方程(1)的系数矩阵
,定义
,其中
是一个块三角矩阵,
是一个三角矩阵,
。设
是绝对值方程(1)的精确解。
算例2在
时的最优实验参数、IT、CPU和RES列于表3,表4。
Table 3. Numerical results of Example 2 with
表3. 算例2在
时的数值结果
Method |
n |
502 |
1002 |
1502 |
2002 |
SOR-like |
|
0.79 |
0.79 |
0.79 |
0.79 |
|
IT |
15 |
15 |
15 |
15 |
|
CPU |
0.3892 |
1.5757 |
3.1612 |
6.7889 |
|
RES |
4.2355e-07 |
5.7706e-07 |
6.9771e-07 |
8.0051e-07 |
FPI-SS |
|
0.90 |
0.91 |
0.91 |
0.88 |
|
|
5.34 |
5.40 |
5.38 |
5.26 |
|
IT |
15 |
15 |
15 |
16 |
|
CPU |
0.1524 |
0.5283 |
1.6408 |
3.0823 |
|
RES |
5.8616e-07 |
8.3084e-07 |
9.9359e-07 |
9.2265e-07 |
SOR-like-PSS迭代法 |
|
0.99 |
0.99 |
0.99 |
0.99 |
|
|
1.29 |
1.29 |
1.29 |
1.29 |
|
IT |
7 |
7 |
7 |
7 |
|
CPU |
0.0296 |
0.3821 |
0.8144 |
1.2769 |
|
RES |
2.8643e-07 |
4.5397e-07 |
6.0753e-07 |
7.5567e-07 |
Table 4. Numerical results of Example 2 with
表4. 算例2在
时的数值结果
Method |
n |
502 |
1002 |
1502 |
2002 |
SOR-like |
|
0.93 |
0.93 |
0.93 |
0.93 |
|
IT |
8 |
8 |
8 |
8 |
|
CPU |
0.1478 |
1.1199 |
1.7352 |
3.1458 |
|
RES |
2.3886e-07 |
4.5917e-07 |
6.7920e-07 |
8.9916e-07 |
FPI-SS |
|
0.95 |
0.95 |
0.93 |
0.94 |
|
|
8.62 |
8.67 |
8.50 |
8.09 |
|
IT |
11 |
11 |
11 |
12 |
|
CPU |
0.0922 |
0.7353 |
2.9834 |
2.1956 |
|
RES |
4.6536e-07 |
6.8277e-07 |
9.0588e-07 |
9.7296e-07 |
SOR-like-PSS迭代法 |
|
0.99 |
0.99 |
0.99 |
0.99 |
|
|
1.06 |
1.06 |
1.06 |
1.06 |
|
IT |
7 |
8 |
8 |
8 |
|
CPU |
0.0619 |
0.4147 |
0.9071 |
1.4777 |
|
RES |
9.3860e-07 |
1.1337e-07 |
1.3198e-07 |
1.4828e-07 |
我们发现,SOR-like-PSS迭代法收敛到精确解的迭代步数以及耗时都比SOR-like法以及FPI-SS法更优。
5. 参数选择
本文提出的SOR-like-PSS方法包含两个关键参数:松弛参数
和正则化参数
。这两个参数对算法的收敛速度有显著影响。然而,目前尚无有效的理论准则用于确定其最优值。因此我们通过数值实验的方式,在不同问题规模和矩阵类型下测试了参数组合(α, ω)对迭代次数的影响。实验结果表明,在多数测试问题中,当
且
时,算法收敛最快且稳定性良好。
下面,我们以算例1中
的情形为例,进行参数敏感性分析。如图1所示,在固定参数
的情况下,SOR-like-PSS方法的迭代次数对参数
表现出显著的敏感性。当
从0增加到约0.8时,迭代步数迅速下降,表明算法收敛速度加快;而在区间
内,迭代步数达到最低点并保持稳定,说明此时算法具有最优的收敛性能和较高的计算效率。当
时,迭代步数急剧上升并趋于最大值500次,显示算法在此区间内收敛性能显著下降甚至不收敛。因此,区间
是选择
的理想范围。
图2展示了固定参数
时,SOR-like-PSS方法在不同问题规模(n = 2500, 10000, 22500, 40000)下的迭代次数随参数
变化的整体趋势。当
时,所有曲线均维持在最大迭代步数500次(即未收敛),表明算法在此区间内无法有效收敛;随着
增大,迭代次数显著下降,并在区间
内趋于稳定,显示出良好的收敛性能和鲁棒性;当
时,迭代步数有所上升,但仍保持在相对较低的水平,未出现急剧增长,这说明算法在该区域仍具备一定的稳定性,但性能不如
时理想。结合图3的精细扫描结果可知,当
时,迭代步数达到最小,因此该区间为
的最优选择范围。
Figure 1. IT vs. relaxation parameter
for different problem sizes with fixed
图1.
,不同问题规模下迭代步数随松弛参数
的变化
Figure 2. IT vs. regularization parameter
for different problem sizes with fixed
图2.
,不同问题规模下迭代步数随正则参数
的变化
Figure 3. Local changes in IT vs.
for different problem sizes with fixed
图3.
,不同问题规模下迭代步数随正则参数
的局部变化
6. 结论
本文将系数矩阵的预条件移位分裂与SOR-like迭代法相结合,提出了求解绝对值方程(AVE)的SOR-like-PSS迭代法,并且给出了SOR-like-PSS迭代法的收敛条件。此外,通过两个线性互补问题的数值算例,我们证明了SOR-like-PSS迭代法在迭代步数和计算时间方面均优于SOR-like迭代法。但是,在理论上如何选择最佳的SOR-like-PSS迭代法中所涉及的参数需要进一步的研究。