1. 问题背景
空间分数阶Cahn-Hilliard方程是经典Cahn-Hilliard方程的扩展,以空间分数阶导数代替了经典Cahn-Hilliard方程中的局部二阶拉普拉斯算子,通过其非局部积分特性刻画长程空间相互作用,描述反常扩散与复杂界面动力学。空间分数阶Cahn-Hilliard方程被广泛应用于生物学[1]、图像修复[2]-[4]和材料科学[5]等领域。
1.1. 空间分数阶Cahn-Hilliard方程
对于常系数双侧空间分数阶Cahn-Hilliard方程的初边值问题:
(1)
其中
为空间域,
,
,
为分数且
(
),
用于描述相场浓度,
是具有
的非线性双阱势,
为表示界面宽度的正常数。
通常表示为Riesz分数阶算子。
定义1 d维Riesz分数阶导数[6]:d维Riesz分数阶算子
定义为
(2)
其中
,左、右Riemann-Liouville分数阶导数定义为
1.2. 预处理
分数阶Cahn-Hilliard方程通常包含非线性项与非局部分数阶导数,这使得几乎不可能求解到严格的解析解,需要通过离散化过程构造近似的数值格式,在离散点上逼近原方程的解,从而获得近似的数值解。常见的数值算法:有限差分法[7] [8]、谱方法[9] [10]、有限元法[11]被广泛应用于众多文献中。
在得到空间分数阶Cahn-Hilliard方程的全离散格式后,可以将问题转化为求解一个线性方程组。由于空间分数阶Cahn-Hilliard方程将两个非局部积分–微分方程耦合在一起,所产生的线性系统的规模通常是大而稠密的,因此我们一般选择使用Krylov子空间法进行迭代求解[12]-[15]。然而,Krylov子空间法的收敛速度会依赖于线性方程组的系数矩阵的谱性质,特征值分布越聚集,Krylov子空间法的收敛速度越快,反之,收敛速度越慢甚至发散,因此对线性方程组进行预处理是关键。
不同结构的线性方程组取决于对原始空间分数阶Cahn-Hilliard方程采用不同的离散化方法,而不同的预处理方法取决于对方程组的构造与系数矩阵的近似,因此,学者们通常会基于此来构造不同的预处理器,从而提高Krylov子空间法的迭代求解效率[16]。针对数值求解一维和高维空间分数阶Cahn-Hilliard方程中产生的结构化方程组,本文介绍了近年来提出的不同预处理方法,并进行了对比分析与总结。
本文的具体结构如下:在第2部分,分别介绍了一维和高维空间分数阶Cahn-Hilliard方程在不同离散格式下对应的结构化方程组。在第3部分,整理并对比分析了关于这些方程组的预处理方法。最后,本文总结了数值求解一维和高维空间分数阶Cahn-Hilliard方程的预处理方法,并为进一步研究提供了建议。
2. 结构化方程组
2.1. 一维情况
2.1.1. 对称不定块系统
对于一维常系数双侧空间分数阶Cahn-Hilliard方程,结合SAV保结构技术,对时间导数采用二阶蛙跳格式进行离散化,对空间导数采用有限差分法进行离散化,数值求解框架中包含求解以下方程组[7]:
(3)
其中
为单位矩阵,
为对称正定的Toeplitz矩阵,
为对称负定的Toeplitz矩阵,从而使得整体系数矩阵在性质上是一个病态且不定的矩阵,在结构上是一个对称的块矩阵。对于不定系统,通常使用MINRES方法来处理。系数矩阵的病态性说明其条件数极大,从而会导致迭代收敛缓慢,且由于存在着稠密的Toeplitz矩阵,会导致求解方程组具有较高的计算复杂度。
2.1.2. 单位矩阵与“Toeplitz-Like”结构矩阵相加的系统
对于一维常系数双侧空间分数阶Cahn-Hilliard方程,结合稳定化技术[8],对时间导数采用Crank-Nicolson格式进行离散化,对空间导数采用有限差分法进行离散化,数值求解框架中包含求解以下方程组[17]:
(4)
其中,系数矩阵M的形式为:
(5)
为单位矩阵,
是由Toeplitz矩阵通过加法、乘法等运算组合而成的矩阵,即具有“Toeplitz-like”结构的矩阵。若系数矩阵
非对称,我们通常会选择将其对称化以便于后续使用共轭梯度法(CG)来高效求解,因此如何构造对称正定系统和解决Toeplitz矩阵的稠密性以降低计算复杂度成为了关键问题。
2.2. 高维情况
对称不定块系统:对于高维常系数双侧空间分数阶Cahn-Hilliard方程,采用SAV保结构技术,对时间导数采用二阶蛙跳格式进行离散化,对空间导数采用有限差分法进行离散化,数值求解框架中包含求解以下方程组[6]:
(6)
其中
为单位矩阵,
是由一维Toeplitz矩阵通过Kronecker积组合而成的对称正定块矩阵,使得整体系数矩阵在性质上是一个病态且不定的矩阵,在结构上是一个对称的块矩阵。其病态性与Toeplitz矩阵的稠密性会降低MINRES方法的迭代求解效率。
3. 预处理方法
针对上述数值求解一维和高维空间分数阶Cahn-Hilliard方程中不同特点的结构化方程组,本节分别整理了相应的预处理方法,并从不同方面进行了对比分析。
3.1. 针对一维情况的预处理
3.1.1. 针对对称不定块系统的预处理形式及性质
关于方程组(3),Huang等人[7]基于离散正弦变换与舒尔补精确分裂构造了一个对称正定预处理器。针对线性系统的系数矩阵
其中
(
或
)是将空间分数阶导数离散化所产生的对称负定的Toeplitz矩阵,通过基于离散正弦变换的
矩阵[18]来近似
,使得求其逆只需要
的计算复杂度,定义矩阵
由于对于任何
,
都是负定的,因此矩阵
是不定的,还不能直接用作预处理器。为了找寻一个正定预处理器,通过正弦变换将
对角化,记
和
为包含
和
所有特征值的对角矩阵,S为正弦变换矩阵,即
于是可以得到
的分裂形式
其中0是与S大小相同的零矩阵。再利用舒尔补,可以获得块对角矩阵的一种分解
经验证
为负,
为正,为得到一个正定的预处理器,以
替换
,记为矩阵P,被描述为如下对角化形式:
(7)
我们就得到了所需的对称正定块预处理器。
3.1.2. 针对对称不定块系统的预处理分析
通过分析,针对求解对称不定块系统一般以构造一个对称正定且容易求逆的预处理器为目标,加快MINRES方法的迭代求解效率。对于处理稠密的Toeplitz矩阵,通常选择使用基于离散正弦变换的τ近似来提升算法效率。
Huang等人[7]基于直接近似的思想,通过正弦变换对进行完τ近似的矩阵对角化并写成其分裂形式,使其正、负特征值的分布显露出来,在含有负特征值的对角矩阵前加负号,以实现矩阵的正定性。再利用舒尔补,将中间块矩阵进行精确分裂,所得块三角矩阵与块对角矩阵乘积的结构便于求逆。该预处理方法虽然通过数值实验证明了其有效性,但缺乏对于预处理矩阵的谱分析。其预处理方法还可以尝试使用循环矩阵近似代替τ矩阵近似,在某些情况下,特别是当矩阵近似平移不变时,循环近似的效果可能会更好,其可通过FFT实现快速对角化。
3.1.3. 针对单位矩阵与“Toeplitz-Like”结构矩阵相加系统的预处理形式及性质
关于方程组(4),Huang等人[17]针对一个非对称的线性系统,分别基于合同变换和右乘逆变换提出了两种对称化方法。在得到等价系统后,采用基于离散正弦变换的τ近似,获得最终预处理器。
原非对称系统的系数矩阵为
,其中
A是通过离散Riesz分数阶导数所得到的对称负定的Toeplitz矩阵,
,
是稳定系数,
B是通过离散拉普拉斯算子得到的对称负定的三对角Toeplitz矩阵。
和
都是对称正定的Toeplitz矩阵。
第一种对称化方法为:由于
是一个自然的τ矩阵,通过在原始系统两边左乘矩阵
可以得到一个对称Toeplitz系统,该系统的系数矩阵为
对
进行τ近似得到一个对称正定且可逆的预处理器:
(8)
第二种对称化方法为:将原始系数矩阵右乘
,得到一个对称系统,其系数矩阵
同样地,对
进行τ近似得到一个对称正定且可逆的预处理器:
(9)
预处理矩阵
和
具有以下谱性质。
定理1
的特征值满足以下不等式
定理2
的特征值满足以下不等式
3.1.4. 针对单位矩阵与“Toeplitz-Like”结构矩阵相加系统的预处理对比与分析
通过对比分析,Huang等人[17]的两种预处理方法都以将线性系统对称化以获得一个对称正定的系统为目标,再基于τ近似构造预处理器加速共轭梯度法(CG)的求解效率。从系统对称性的构造方式来看,第一种方法是利用
的对称正定性,以及
是
的合同变换,保证了
的对称正定性;第二种方法利用
和
各自的对称正定性,通过矩阵加法保证了
的对称正定性。从计算复杂度来看,带有预处理器
的PCG方法需要反复处理
,这导致在应用中调用多次DST,且初始化时还需计算
特征值的平方根。而有预处理器
的PCG方法只涉及
,其结构允许预处理器应用和矩阵乘法均通过DST实现,且调用次数更少,完全避开了开平方运算。数值实验也表明第二种方法的CPU更短,因此第二种对称化方法构造的预处理器计算量更小,整体效果更好。对于第一种方法
所带来的计算量,为避免显示构造平方根,我们建议可以在原系统两端左乘
,并利用
的Cholesky分解,其中
是一个稀疏的下三角双对角矩阵,记
,所得对称正定系统为,仍然基于τ近似构造预处理器。由于
稀疏且
可快速对角化,整体仍能保持接近O (MlogM)的计算复杂度,与原方法相比,减少了DST的调用次数。
3.2. 针对高维情况的预处理
3.2.1. 针对对称不定块系统的预处理形式及性质
关于方程组(6),Huang等人[6]基于线性近似与离散正弦变换构造了一个对称正定块预处理器。先将线性方程组进行等价变换,方便起见,我们将新系统简化为
(10)
其中
G是将多维空间分数阶导数离散化所产生的对称正定的块Toeplitz矩阵,记
,
,
,
。为找到一个正定的预处理器,首先将系数矩阵
进行平方运算,得到
其中0是与
大小相同的零矩阵。再对
进行开根操作,得到一个理论上与系数矩阵最接近的理想预处理器
理论分析表明
的特征值为±1。然而,
中存在平方根运算难以处理,因此Huang利用线性化近似来代替平方根运算,得到中间近似预处理器
通过理论分析可知
的所有特征值位于
,这说明
与
是谱等价的。但直接处理稠密对称Toeplitz矩阵
的运算(矩阵–向量乘法)的复杂度高达
,于是Huang采用基于离散正弦变换的
矩阵来近似
,因此其矩阵–向量乘法可在
次运算中得到,最终预处理器为
(11)
预处理器
可通过离散正弦变换求逆。记
,从而得到
其中
为每个
的特征值。对于任何向量
,将其拆分成
,其中
。计算
,
,该步骤可通过
维DST以
次运算实现。计算
,
,需要
次运算的线性复杂度。计算
,
,同第一步一样可通过
维DST以
次运算实现。最后输出
。因此对于计算
需要
复杂度。
预处理矩阵
具有以下谱性质。
定理3
的特征值满足
3.2.2. 针对对称不定块系统的预处理分析
Huang等人[6]基于直接近似的思想,采用对系数矩阵取平方再开根的方式,将原系数矩阵的不定性转化为正定性。利用线性近似、τ近似以及矩阵的块对角结构降低了计算复杂度。然而对中间预处理器的块对角部分采用了线性近似的操作,虽然从结构上对根号部分进行了简化,但是却引入了线性误差,这种近似方式比较粗糙,再加上后续对Toeplitz矩阵进行τ近似,还会放大近似误差。对此,可以采用有理逼近(如Chebyshev-Padé逼近或Zolotarev最优有理逼近)来近似平方根部分,会比一阶线性近似更准确地拟合平方根运算。
对于Chebyshev-Padé逼近,设
的特征值为
,且
,其中
,S为正弦变换矩阵。构造有理函数
,
,其中
由Chebyshev级数截断并配凑前
项系数得到。则预处理器为
其中
。若
解析,则误差阶
构造时需计算
(
)和有理函数值(
)。每步MINRES迭代应用
需两次DST (
)和一次对角缩放(
),使得总复杂度为
。
对于Zolotarev最优有理逼近,令
作变量替换
Zolotarev给出了次数为(n, n)的最优有理逼近
的显示形式:
其中
,
为Jacobi椭圆函数,
,
。则
的逼近为:
预处理器为
最大相对误差为
即指数收敛。其计算复杂度与Chebyshev-Padé相同,也为
。
4. 总结
针对数值求解一维和高维空间分数阶Cahn-Hilliard方程,学者们围绕系数矩阵的结构和性质提出了一系列的预处理方法,有效提高了Krylov子空间法的迭代求解效率。本文整理了近几年出现的预处理方法,并从不同角度进行了对比分析。我们发现,一维空间分数阶Cahn-Hilliard方程在经过不同的离散化方法的作用下,会形成两类结构化方程组,一类为对称不定块系统,另一类为系数矩阵为单位矩阵与“Toeplitz-like”结构矩阵之和的系统;而对于高维空间分数阶Cahn-Hilliard方程目前的研究方向主要集中在对称不定块系统。对于一维和高维情况的对称不定块系统,我们最终都要构造一个对称正定且容易求逆的块预处理器以提高MINRES方法的求解效率,因此通常会基于其系数矩阵的块结构来构造谱等价的具有块对角或块三角结构的矩阵作为预处理器,在构造过程中典型的方法有基于正弦变换的对角化和舒尔补分裂。对于一维情况下系数矩阵为单位矩阵与“Toeplitz-like”结构矩阵之和的系统,若该系统是对称正定的,需要构造一个对称正定的预处理器以加速共轭梯度法(CG)的求解。若该系统非对称,则可尝试将其对称化,最常用的对称化方法是合同变换。结果表明,相比原有的方程组,以上方法预处理后的方程组的线性收敛性显著提升,Krylov子空间法的迭代求解效率也有所提高。
然而,目前已发表的预处理方法有限,且其他格式在高维情况下的推广及相关预处理技术仍有待探索,值得进一步的研究与改进。关于空间分数阶Cahn-Hilliard方程数值求解中结构化方程组的预处理方法研究,本文认为还可以从以下方面进一步探索:
一、构造计算复杂度更低的对称系统:采用合同变换对系统进行对称化容易引入矩阵平方根,增加计算复杂度,可以尝试使用Cholesky分解,避免以上问题,以降低计算复杂度。
二、构造更精确的对称Toeplitz近似矩阵:尝试采用循环近似代替基于离散正弦变换的τ近似,当矩阵近似平移不变时,循环近似的效果可能会更好,且还可通过FFT实现快速对角化。
基金项目
北京工商大学学科建设经费资助项目(项目编号:STKY202508)。
北京市大学生创新创业训练计划项目(项目编号:S202510011019)。
NOTES
*通讯作者。