1. 引言
Sherman-Morrison公式是一种用于求解线性方程组描述的方法,以Jack Sherman和Winifred J. Morrison命名的,可用于计算机科学领域,特别是通信、网络和信号处理中。
由于矩阵之和的逆不一定可逆,即使可逆,也没有统一的公式,Sherman-Morrison公式 [1] [2] 在线性代数中用来求解逆矩阵的一种特殊方法,可逆矩阵与某个列乘行的矩阵之和是一定可逆的,并用公式直接得到逆矩阵。在最优化BFGS算法和循环三对角线性方程组的求解等方面有着重要的应用。
可以用于增量计算矩阵的逆,从而节省存储空间和计算时间。比如,当需要计算一个大型矩阵的逆时,对矩阵逐步添加向量,从而逐步计算出矩阵的逆。
设
为可逆方阵,
为列向量,
,需要求解线性方程
,考虑求解两个方程:
,有
,得
注意到
是一个数,令
,有
,两端左乘
,即
,故
,得
有
实际上,Sherman-Morrison公式在解线性方程有着重要的应用,即通过增加列向量来求解线性方程。
设
为可逆方阵,B是一个n维列向量,考虑线性方程
解为
令
,即在B的右侧增加一个n维列向量u,则线性方程变为
根据伴随矩阵,解为
其中
。将解
表示为
于是
可见,通过增加列向量u来解线性方程的解法。
2. Sherman-Morrison公式
设
为可逆方阵,
为列向量,则
可逆充要条件为
,且当
可逆时,有 [3] [4]
证明(充分性)当
时,
因此,当
时,有
(必要性)当
时,显然有
。当
时,用反证法证明该命题成立。假设
可逆时,但
时,有
因为
可逆,故
,又因为
可逆,故
,此与假设
矛盾。因此,当
可逆时,但
时,有
。
3. Sherman-Morrison公式的应用
1) 当
时的Sherman-Morrison公式
在Sherman-Morrison公式中,令
,则有
可逆充要条件为
,且当
可逆时,有
再令
,则
,因此,
可逆,且
2) Sherman-Morrison公式在BFGS算法中的应用
Sherman-Morrison公式在BFGS算法中的应用,可用来求解BFGS算法中近似Hessian矩阵的逆。
在BFGS算法中,得到递推公式
其中,
,
。
令
,注意到
,其中
为一个数,且
,因此利用Sherman-Morrison公式,有
对于
,再次利用Sherman-Morrison公式,有
将
的表达式代回
中,得到
3) Sherman-Morrison公式在循环三对角线性方程组的求解中的应用
下面介绍循环三对角线性方程组的求解。所谓循环三对角线性方程组,指的是系数矩阵为如下形式:
循环三对角线性方程组可写成
,其中
。
令
,
,且
,其中
为三对角矩阵。根据以上的理论知识,只需求解以下两个方程
这样就能根据
求出x。
总之,Sherman-Morrison公式给出了求矩阵之和的逆矩阵的一种特殊方法,在矩阵论中有着重要的应用,除此之外,在最优化BFGS算法和循环三对角线性方程组的求解等方面有着重要的应用。