1. 问题背景
分数阶微分方程基于分数阶微积分的概念,是对传统整数阶微分方程的扩展,包含一个或多个分数阶导数项[1] [2]。分数阶微分算子具有非局部性,适用于描述具有记忆效应和遗传特性的材料[3]-[5]。通过在空间变量中引入分数阶导数,可用于刻画物质在空间上的反常扩散现象。空间分数阶扩散方程在生物医学、材料科学等多个研究领域中得到了广泛的应用[6] [7]。
1.1. 空间分数阶扩散方程
对于一维变系数双侧空间分数阶扩散方程的初边值问题:
(1)
(2)
(3)
其中
为分数,左侧分数阶导数
和右侧分数阶导数
可为G-L分数阶导数或R-L分数阶导数,
为扩散系数且
,
为源项,(2)为边值条件,(3)为初值条件。
定义1 Grünwald-Letnikov (G-L)分数阶导数:设
是一个正实数,令
,n为正整数,函数
定义在区间
上,称
(4)
为函数
的
阶Grünwald-Letnikov分数阶导数,其中
,
为不超过
的最大整数,
表示二项式系数
。
定义2 Riemann-Liouville (R-L)分数阶导数:设
是一个正实数,令
,n为正整数,函数
定义在区间
上,称
(5)
为函数
的
阶Riemann-Liouville分数阶导数,其中
。
1.2. 离散化
由于空间分数阶扩散方程的解析解往往难以显式给出,故高效的数值模拟已成为当前相关领域研究的前沿问题[7]-[10]。此外,基于加速器计算的混合精度求解方法能够显著提高数值解的精度[11]。求解分数阶偏微分方程的数值算法主要包括有限差分法、有限元法、谱方法和级数逼近法等[9] [12]-[14]。本节将主要介绍利用有限差分法对时间导数和空间分数阶导数进行离散,从而得到方程的离散形式。
通过定义时间步长
和空间网格大小
(M和N都是正整数),我们可以得到时间和空间上的离散点
,
。(1)中的时间导数可以用标准一阶时差商进行离散[15]-[17],即:
(6)
当对空间分数阶导数利用移位Grünwald近似[18] [19],可得:
(7)
(8)
其中
。由此,我们可以得到方程无条件稳定的隐式有限差分格式:
(9)
其中
,
。
1.3. 预处理
利用空间分数阶扩散方程的离散形式,可以进一步转化为线性方程组的求解问题。不同的离散格式对应着具有不同结构特征的方程组。由于分数阶微分算子的非局部性,系数矩阵通常是大型稠密矩阵,因此通常选择Krylov子空间法来进行迭代求解[20]-[22]。然而,方程组的收敛性质受系数矩阵特征值分布的影响,当特征值分布较为发散时,Krylov子空间迭代求解的效率会很低,因此需要对方程组进行预处理。特别地,在约束优化问题中,多重网格预处理使得PCG迭代求解的次数显著减少[23]。近年来,针对不同特点的结构化方程组,学者们开展了多种预处理方法的研究,旨在提高求解效率[18] [24]-[26]。
不同的预处理方法取决于方程组的构造和对系数矩阵的近似,对于数值求解空间分数阶扩散方程中的结构化方程组,学者们通常基于矩阵结构和性质来构造不同的预处理矩阵,并应用到Krylov子空间法中求解该线性方程组。针对数值求解空间分数阶PDE中出现的结构化方程组,本文整理了近些年来提出的不同预处理方法,并进行了对比分析和总结。
本文具体结构如下:在第2部分,介绍了空间分数阶扩散方程不同离散格式下对应的结构化方程组,在第3部分,整理并对比分析了关于这些方程组的预处理方法。最后,本文对数值求解空间分数阶扩散方程中的预处理方法作出总结,并为进一步的研究提供了参考思路。
2. 结构化方程组
2.1. 对角矩阵与Toeplitz矩阵相乘结构的方程组
对于一维变系数双侧空间PDE,对时间导数采用一阶时差商离散格式,对空间导数采用移位Grünwald差分公式,得到数值求解框架[27]:
(10)
其中,系数矩阵
的形式为:
(11)
I为单位矩阵,
为对角矩阵,T为Toeplitz矩阵,
,系数矩阵的主要结构为对角矩阵与Toeplitz矩阵的乘积。空间上,
的对角元素对应于空间各离散点的扩散值,因此矩阵的对角元素并不相同,从而使得系数矩阵
不再具有Toeplitz结构。时间上,
的元素受时间步数m的影响,导致系数矩阵在时域上不断变化。系数矩阵在时空结构上的变化使得求解方程组具有较高的计算复杂度。
2.2. 对角矩阵与Toeplitz矩阵相加结构的方程组
对于一维单变系数双侧空间PDE,对时间导数采用一阶时差商离散格式,对空间导数采用移位Grünwald差分公式,得到数值求解框架[28]:
(12)
其中,系数矩阵
的形式为:
(13)
为对角矩阵,T为对称Toeplitz矩阵,系数矩阵的结构为对角矩阵与Toeplitz矩阵的和。同样地,
的对角元素取决于空间离散点上的扩散值,使得系数矩阵
未能保持严格的对称Toeplitz结构。虽然矩阵T在整个时间过程中保持不变,但
的动态变化赋予了
在时间维度上额外的复杂性。
2.3. Toeplitz类矩阵之和结构的方程组
对于一维变系数双侧空间PDE,对时间导数采用边值公式,空间导数采用四阶quasi-compact离散格式[29],得到数值求解框架:
(14)
其中,系数矩阵A的形式为:
(15)
K为三对角Toeplitz矩阵、J为对称Toeplitz矩阵、B和C均为块Toeplitz矩阵,系数矩阵的结构为Toeplitz类矩阵的组合。解矩阵U的定义为:
(16)
其中
。与2.1和2.2中的数值求解框架不同,此框架中矩阵U包含了所有时间层上各离散点的数值解,因此系数矩阵A是一个具有Kronecker积的大规模矩阵。由于其复杂的结构和庞大的规模,若直接使用Krylov子空间迭代法进行求解将面临较大的计算量。
3. 预处理方法
针对数值求解空间分数阶扩散方程中不同特点的结构化方程组,本节分别整理了对应的预处理方法,并从不同角度进行了对比分析。
3.1. 针对对角矩阵与Toeplitz矩阵相乘结构的方程组的预处理
3.1.1. 预处理形式及性质
关于方程组(10),忽略时间层面的影响,对每一步的方程组进行预处理,简写为:
(17)
此时系数矩阵为
(18)
Pan等人[27]通过近似系数矩阵的逆来构造预处理矩阵。记
,则
和
。定义
,显然所有的
都是Toeplitz矩阵。根据
,那么
,其中
表示单位矩阵的第i列,由于
是Toeplitz矩阵,因此可用循环矩阵来近似
。设C为矩阵T的循环近似,记
。由此得到了预处理矩阵
,其逆定义为:
(19)
然而,以
为预处理矩阵时,每次迭代的计算量为O(N)次FFT,为了减少计算成本,Pan利用插值方法构造了实用的预处理矩阵。设
为某实部为正的复数,
表示
的复共轭。定义函数
是基于
(
)个点的
分段线性插值,且
。
记,我们已知循环矩阵可被傅里叶矩阵对角化,即
,,其中。使用插值函数
来近似
,可得
其中
是插值系数,可以得到预处理矩阵
,其逆定义为:
(20)
其中,
,将
作用于任意向量,计算量仅为
。关于矩阵近似的理论分析表明,
可以被表示为小范数矩阵和低秩矩阵之和。
对于方程组(17),Huang等人[30]构造了含参的预处理矩阵。记
和
分别
为矩阵T的Hermitian部分和skew-Hermitian部分,则
。当
非奇异时,方程组(17)可改写为:
(21)
通过引入参数
,得到不平衡缩放对角和Toeplitz分裂(LSDTS)迭代:
(22)
LSDTS迭代可以等效地表述为标准的一步矩阵分裂迭代:
其中
(23)
(24)
(25)
为快速求解
,因H为对称Toeplitz矩阵,可用基于正弦变换的
矩阵来近似[31]-[34],得到预处理矩阵:
(26)
预处理矩阵
具有以下近似性质。
定理1 对
的特征值位于以(1, 0)为中心,半径为
的复平面圆盘内。
,
,其中
和
是矩阵H的最小和最大特征值。当
和
成立时,
。
3.1.2. 预处理对比与分析
通过对比分析,我们发现这两种预处理方法从不同的角度出发构造预处理矩阵。Pan等人基于近似矩阵逆的思想,利用“若两个矩阵同一行的元素相等,则其逆矩阵的同一行元素近似相等”的原理,构造了由N个Toeplitz矩阵的逆组成的逆预处理矩阵。为了减少计算量,对该逆预处理矩阵进行了逐步优化,最终得到了高效可用的预处理矩阵。而Huang等人则从直接近似系数矩阵的角度出发,基于矩阵分裂构造了具有对称Toeplitz结构的预处理矩阵,并进一步引入了
近似来提升算法效率。这两种方法的相同点在于,构造有效的预处理矩阵的关键都在于参数的合理选取,他们均利用了系数矩阵的特性以提高数值求解的效率。这两种预处理的构造方法和理论基础均不同,各具特色,各有优劣之处。
Pan的逐行逆近似预处理方法中随着插值点数量的增加,收敛所需的迭代次数虽然减少,然而形成和应用预处理矩阵的成本随插值点的数量成比例地增长。因此,在确定插值点的数量时需要进行权衡。Huang的预处理方法的有效性在很大程度上依赖于参数的选择。针对这一问题,我们提出一种直接的无参预处理方法,即利用矩阵分裂
,其中
,
,进而构造预处理矩阵
。Huang方法的特点在于对称Toeplitz结构的构造,对此我们的想法是通过求解
,得到近似A的对称Toeplitz矩阵H,进一步利用
近似得到预处理矩阵
。无论采用何种改进的构造方法,如何在近似程度和计算量之间实现平衡是较为关键的。
3.2. 针对对角矩阵与Toeplitz矩阵相加结构方程组的预处理
3.2.1. 预处理形式及性质
对于方程组(12),对某一时刻的方程组进行预处理,方程组简写形式同(17),此时系数矩阵为:
(27)
Yang等人[35]通过平均对角矩阵保证了系数矩阵的对称Toeplitz结构。即令
,这里
是指D的对角元素平均值,从而得到
,进一步用
矩阵近似,得到预处理矩阵
。
预处理矩阵
具有以下近似性质。
定理2
,其中
和
是矩阵D对角元素的最小、最大值。
Bai等人[36]提出了对角和Toeplitz分裂的预处理方法,寻求了有效的预处理矩阵。通过引入参数
(
),我们可以构造出A的两种分裂形式:
和
(28)
因此,可以通过两步迭代方法进行求解,即:
(29)
将上述的式子写成标准的一步迭代方法:
(30)
为快速求解
,用
矩阵近似T,得到预处理矩阵
(31)
预处理矩阵
具有以下近似性质。
定理3
的所有特征值都聚集在以(1, 0)为中心,半径为
的复平面圆内。
,
,
。其中
和
为对角矩阵D中的最小和最大元素值,
和
为矩阵T中的最小和最大特征值。
3.2.2. 预处理对比与分析
从近似思想来看,Yang从系数矩阵的整体出发,将对角矩阵近似为数量矩阵,这是一种相对简单的策略;而Bai则采用了基于矩阵分裂的较为复杂方法。从近似效果上看,Yang构造的预处理矩阵的有效性高度依赖于对角矩阵元素,而Bai的预处理方法能够确保预处理后方程组的系数矩阵的特征值聚集在1附近,从而保证了预处理的有效性。因此,相较之下,Bai的预处理方法更优。
Bai所构造的预处理矩阵同样涉及到参数的选取问题,可以研究最优参数的选择。此外,我们的想法是可以借鉴Pan的逐行逆近似预处理方法,亦或利用SMW公式来构造近似逆预处理矩阵。具体而言,使
,那么
。令
、
满足
,则
,其中
,
,
。其中,可令
,利用这种矩阵分解方法,我们可以得到系数矩阵逆的较为精确的近似。
3.3. 针对Toeplitz类矩阵之和结构方程组的预处理
3.3.1. 预处理形式及性质
Zhou等[29]对方程组(14),构造Kronecker积分裂(Kronecker product splitting)预处理。引入参数
,根据Kronecker积的性质,矩阵A允许如下的分裂:
(32)
和
(33)
通过交替迭代这两个分裂,可以建立KPS迭代:
我们可以去掉中间变量
,将KPS迭代写成标准形式
,其中
,
。
实际上,此迭代也可由
产生,其中
(34)
(35)
此外,
。
预处理矩阵
具有以下近似性质。
定理4 当
时,
,
,
的特征值完全包含在以(1, 0)圆心且半径小于1的圆中。
3.3.2. 预处理分析
Zhou基于矩阵分裂方法构造了预处理矩阵,从近似程度上看,可知预处理后的系数矩阵具有良好的谱性质。使用预处理Krylov子空间法求解时,主要的计算量在于预处理矩阵的逆和任一向量的乘积,但Zhou的方法中直接计算
的代价较高。为此,我们可以对
做进一步的近似。具体而言,矩阵B和C可以用Strang型块循环矩阵来近似,K和J同样可以用循环矩阵来近似。由此,预处理矩阵可表示为:
根据循环矩阵可以被傅里叶矩阵对角化,我们可得:
其中,
是由矩阵
的特征值构成的对角矩阵。由于系数矩阵A为Toeplitz类矩阵,我们的一个思路是利用生成函数构造近似逆预处理矩阵。具体而言,我们可以结合扩散系数和源项对矩阵A的生成函数提出近似。基于生成函数,我们可以估计出系数矩阵的特征值分布。进一步地,利用HNP过滤器或Tikhonov过滤器[37],并结合逆傅里叶变换(IFFT),可以构造出有效的循环近似逆预处理矩阵。
4. 总结
针对数值求解空间分数阶扩散方程中的结构化方程组,学者们围绕系数矩阵的结构和性质开展了一系列预处理方法的研究,显著提高了Krylov子空间迭代求解的效率。本文对近年来提出的预处理方法进行了整理,并从不同角度进行了对比分析。我们发现,对于任何结构的方程组,都可以通过两种途径来构造预处理矩阵:一是直接近似系数矩阵,二是近似系数矩阵的逆。在直接近似系数矩阵的方法中,典型的有矩阵分裂和平均对角矩阵。矩阵分裂方法通过引入参数,利用矩阵的不同分裂形式进行交替迭代,从而构造出可调控的含参预处理矩阵。平均对角矩阵法主要依赖于对角矩阵对系数矩阵的影响,因而不能确保得到高质量的近似。在近似系数矩阵逆的方法中,逐行逆近似能够有效地构造出系数矩阵的逆形式。然而,这一方法需要通过插值对计算过程进行优化,在此过程中,平衡好插值点的数量与形成预处理矩阵的成本是一个关键问题。结果表明,相比原有的方程组,以上预处理后的方程组的收敛性质明显改善,Krylov子空间迭代求解的速度显著升高。
关于空间分数阶扩散方程数值解中结构化方程组的预处理方法研究,如何使得预处理后系数矩阵的特征值更加聚集并减少计算成本,本文认为还可以从如下方面着手:
一、获得更有效的近似逆预处理矩阵:可以尝试结合扩散系数和源项,对矩阵元素序列进行傅里叶变换,从而得到系数矩阵生成函数的近似。进一步根据特征值的分布进行滤波,并结合IFFT构造循环近似逆预处理矩阵。此外,还可以应用 SMW公式,通过矩阵分解得到系数矩阵逆的精确形式。在构造过程中,需在近似程度与构建预处理矩阵的成本之间进行权衡。
二、构造更精确的对称Toeplitz近似矩阵:对于任意矩阵
,其对称Toeplitz近似矩阵H,可以尝试通过求解最小值问题
来获得。那么,我们可以从系数矩阵的整体或其关键部分出发,利用此最优问题构造出更精确的对称Toeplitz近似矩阵,进一步基于正弦变换得到预
处理矩阵。
基金项目
北京工商大学学科建设经费资助项目(项目编号:STKY202508)。
北京工商大学大学生创新创业训练计划项目(项目编号:X202410011027)。
NOTES
*通讯作者。