1. 引言
线性系统是计算科学领域中一种很重要的数学模型。线性系统理论在航空航天、化学化工、机械研究等技术领域中都有着广泛的应用实例。超定线性系统是指方程个数大于变量个数的线性系统。研究表明,在数字信号处理和其他面向定量的学科中有许多问题最终都归结为超定线性系统求解的计算问题,最小二乘拟合算法的实质就是对超定线性系统进行求解。
多年来,对于超定线性系统求解问题的研究始终吸引着国内外的专家学者。Levitan等人 [1] 研究了针对特定抽象范数求解超定线性系统最优解的解决方案。Barroda和Roberts [2] 提出了能够解决线性数据拟合问题的有效算法,该算法是对线性规划单纯形法的一种改进,适用于
问题的初步表述。Cadzow [3] 提出了超定线性系统最小1、2和
范数近似解的解决方案。Demmel等人 [4] 研究了超定最小二乘问题精确迭代细化的算法、误差范围和数值结果,将线性系统优化算法应用于超定线性系统最小二乘问题的增强线性系统公式。Novoselac和Pavic [5] 研究了
范数中超定线性方程组的解性质,从而得到了该问题具有回归、尺度和仿射等变性质。Popa [6] 提出了超定线性系统最小二乘解的数值计算的两种迭代算法,这些算法在Kaczmarz迭代算法的基础上,可以收敛到最小二乘解的序列。Pelckmans等人 [7] 对超定线性系统的噪声观测进行了稀疏估计,提出了一种受高斯噪声干扰的线性方程估计未知参数的方法。Zhijun Zhang等人 [8] 为解决时变的超定问题,提出并设计了一种新颖的变参数收敛微分神经网络,通过研究表明,这种神经网络具有超指数收敛速度的最小二乘解。
近年来,很多学者着手研究超定系统最小二乘解的可信验证。Rump [9] 提出了一种不依赖于正规方程且适用于稀疏矩阵的新算法,该算法用于计算系数阵列满秩的最小二乘问题的最小二乘解和欠定线性系统的最小二范数解。Miyajima和Shinya [10] 在考虑了所有可能的舍入误差的情况下,给出了系数阵为列满秩的欠定系统最小二范数解和超定系统最小二乘解的验证算法,阐明了所获得的误差范围的大小与系数矩阵的条件数相关。Rump [11] 提出的快速算法的误差界是标量,而Miyajima提出的算法的误差界是向量。Miyajima [12] 总结提出了一种用于矩阵方程
的最小二乘解的高效能算法。
本文考虑系数矩阵为病态矩阵的超定线性系统的可信计算。计算给定超定线性系统的微小摄动区间系统,算法保证在输出的区间系统中存在系数阵精确秩亏的超定线性系统,并计算该系数阵精确秩亏的超定线性系统的最小二乘解的可信区间解。
2. 符号和预备知识
令
表示实数集合。设
,
表示由矩阵
的列合并得到的长列向量。对于满足条件
,
的正整数
,
表示由矩阵
的第
行到第
行所构成的子矩阵,
表示由矩阵
的第
列到第
列所构成的子矩阵,
表示由矩阵
的第
行到第
行,第
列到第
列所构成的子矩阵。令
表示
阶零矩阵,
表示
阶单位阵。
令
表示区间集合
,用
表示区间
的中点,用length表示区间长度,即
。区间向量
是分量为区间的
维向量,令
表示它的内部。区间矩阵
是分量为区间的矩阵。给定区间矩阵
,若区间矩阵
包含的所有实矩阵都是非奇异的,则称区间矩阵
非奇异。给定区间矩阵
,若区间矩阵
包含的所有实矩阵都是满秩的,则称区间矩阵
满秩。对于
,
是由矩阵
中每个分量中点对应的值构成的实矩阵,令
。
定义1:对于给定的阈值
,若所有与
的2-范数距离不超过
的
阶矩阵的最小秩为
,即
则称
的数值
-秩为
,记为
。
注1:给定矩阵
,其中
,对于阈值
,如果矩阵
的奇异值
满足
,
则
。
引理1:给定矩阵
,若
,其中
,则
均是非奇异矩阵。
定理1:对于给定的区间矩阵
和区间向量
,向量
满足
,若INTLAB工具箱中verifylss函数成功输出区间向量
,则区间矩阵
非奇异,且
满足条件
(1)
定理2:设矩阵
,
,向量
满足
,当输入区间矩阵
和区间向
量
时,若INTLAB工具箱中verifylss函数成功地输出区间向量,则区间矩阵
满秩。
定理3:设
并且
,其中
为连续可微函数。当
且
,
时,令
表示系统在区间
上的雅可比矩阵。设区间矩阵
满足条件
。若对矩阵
,有
(2)
则存在唯一的
使得
。
注2:INTLAB工具箱中verifylss函数利用定理3来验证非线性系统的解。
3. 主要结论
设
,其中
,令
表示
的奇异值分解。若
,则
和
的列向量分别张成矩阵
的近似
-左零空间和近似
-右零空间。定义变量矩阵
(3)
为了简便起见,用符号
表示向量
,用符号
表示矩阵
。
引理2:令
,其中
,且
,则矩阵
当
时非奇异。
引理3:令
,
,且
,则矩阵
(4)
当
时非奇异。
引入如下线性系统
(5)
其中矩阵
,
,
和
的行维数分别时是
,
,
和
。
定义矩阵
(6)
命题1:假设向量
满足如下条件:
(1)
,
(2)
,
(3) 矩阵
非奇异,
(4) 矩阵
. (7)
满秩,则
。
证明:易知
故矩阵
非奇异。若
,则
。由(6)式可得
,断言
满秩。事实上,如果
的列向量线性相关,则存在一个非零向量
使得
。由于
,所以
,这与矩阵
非奇异相矛盾。假设
,则存在一个向量
使得矩阵
满秩。定义非零向量
通过计算可知
上式与矩阵(7)满秩相矛盾。 □
由引理3可知,存在零向量的一个邻域,使得对这个邻域内的任何向量
,矩阵
均是非奇异的。因此,在这个邻域内,系统(5)的解的每一项对每个变量均可导。对系统(5)的两边关于变量求导,可得如下的线性系统
(8)
(9)
考虑如下约束优化问题
(10)
引入拉格朗日乘子
定义拉格朗日函数
(11)
经计算可知
的梯度为
(12)
的海森矩阵为
(13)
注3:数值部分利用牛顿迭代法
(14)
计算
的高精度近似解
,其中
,
可由求系统(8) (9)当
时的解得到。
注4:验证部分利用区间算法计算系统
近似解的可信误差界。对于任何
,
,利用verifylss函数求解当
时线性方程组(5) (8) (9)的解,从而得到
和
。利用定理3和verifylss函数的代码,验证部分计算区间向量
和
,其分别包含实向量
和
,
使得
。
算法 1
输入
,
,
,
;
输出
,
或者“Failure”。
步骤1计算满足条件(1)的正数
。
步骤2计算系统(11)的近似解
。
步骤3计算包含系统(11)精确解的区间向量
。
步骤4利用(6)式计算区间矩阵
。
步骤5利用定理2验证矩阵
是否非奇异,如果失败,则返回“Failure”。
步骤6利用定理3验证矩阵
是否秩亏,如果失败,则返回“Failure”。 □
若算法1成功地输出区间向量
,则由命题5可知,存在
,使得
。因此,存在
满足条件
的正整数序列
,使得区间矩阵
满秩,则考虑如下区间线
性系统
(15)
命题2:设
维向量
向量满足如下条件
(16)
若向量
满足
,则
是超定系统
的最小二乘解。
证明:假设存在向量
,使得
(17)
根据
,可知
满秩。因此,存在实向量
,使得
(18)
其中
。显然,区间系统(15)的解包含着下述系统
的解。由(17) (18)式可知,
而
是系数矩阵
和右端向量
的超定线性系统的唯一最小二乘解,故
因此
□
算法1
输入
,
;
,
;
输出
,
,
。
步骤1执行算法1。
步骤2利用verifylss函数解线性方程组(15)计算
,
。
步骤3确定指标集合
,使得
满秩。
步骤4利用(15) (16)式计算区间向量
。
步骤5令
,
。 □
由命题1和命题2可得如下定理。
定理4:若算法1成功输出
,
,
,则存在实矩阵
,实向量
使得
是超定线性系统
的最小二乘解,且
。
4. 应用实例
例1给定超定线性系统
,其中,
利用算法1可得
,
,
。

Table 1. The output results of Example 2
表1. 例2的输出结果
例2 系数矩阵为接近秩亏随机矩阵的超定线性系统
,表给出了不同的
取值,算法1的输出结果见表1。
NOTES
*通讯作者。