1. 引言
在控制理论的发展中,求解Riccati矩阵方程是非常重要的课题。从六十年代到如今,大量的研究成果设计出的最优控制器[1] [2]都与Riccati矩阵方程存在唯一正定解等价,因此,得到耦合Riccati矩阵方程的解是非常重要的。
Riccati矩阵方程是非线性矩阵方程,其常用的求解方法是迭代求解。文献[3]研究了Markov系统所得到的耦合Riccati矩阵方程的迭代算法,并提出将该方程变成Lyapunov矩阵方程来进行迭代求解。文献[4]使用牛顿法来获得Riccati矩阵方程的唯一正定解,给出在任意初始条件下所求的解都收敛于矩阵方程的唯一解。文献[5]根据矩阵特征值的性质,得到解的存在性并给出一种固定点迭代算法求解矩阵方程。文献[6]利用最新估计信息,给出带有权重因子的并行迭代算法,该方法对算法的收敛性能有显著的提高。考虑到离散耦合Riccati矩阵方程的特殊性,文献[7]利用一种保持结构的倍速算法对矩阵方程进行求解,讨论了保持结构倍速算法的收敛性,并通过引入最新估计信息对算法进一步改进。文献[8]通过处理一类非线性矩阵方程中的矩阵求逆运算,提出了一种近似替换的迭代算法。
基于以上研究,本文在文献[4]算法基础上提出求解离散耦合Riccati矩阵方程的无反演牛顿迭代算法,并对算法进行收敛性分析,最后通过数值例子来验证所提算法是有效的。
2. 主要问题和预备知识
本文主要研究如下的离散耦合Riccati矩阵方程:
(1)
其中
,
是有限集合,
,
,
,
是转移概率。
,
,
以及
是对称半正定矩阵,
是方程(1)的对称半正定解。
我们的目标是通过牛顿方法构造无逆的迭代算法,在介绍无反演牛顿迭代算法之前,有必要陈述一些需要使用到的结论。
引理2.1 [9]:设
,
是两个具有适当维数的非奇异矩阵,
,
是另外两个具有适当维数的矩阵,那么有
(2)
那么利用引理2.1中的矩阵反演等式,可以将方程(1)等价地表示为:
(3)
其中
。
引理2.2 [10]:假设
,
是具有相同阶的对称正定矩阵,那么
引理2.3 [11]:如果
,
是具有相同阶的对称正定矩阵,且
,那么
回顾一下牛顿法求解
的根的方法:
(4)
其中
。
根据等式(4),为了避免方程(3)的矩阵反演,本文提出以下迭代格式:
(5)
算法1:无反演牛顿迭代算法
步骤1 设置容许误差
,输入
,
,
,
,选择初始迭代矩阵
,
,
,其中
,
,
;
步骤2 令
,计算
其中
,
;
步骤3 如果
,则停止计算,否则
步骤4 令
,返回步骤3。
注释2.1 在算法1中,每次迭代中的多次矩阵乘法运算构成了主要的计算量。假设矩阵维度为
,根据矩阵运算复杂度理论,一次矩阵乘法的计算复杂度为
。设每次迭代执行矩阵乘法的次数为
,那么每次迭代的计算复杂度为
。
注释2.2 在算法1中,参数
和
对算法收敛性产生了影响,理论上,可以通过构建误差方程对迭代格式(5)进行敏感性分析,通过分析误差方程组的解随
和
变化的情况,推导
和
在不同取值下对矩阵序列收敛性的影响。
3. 无反演牛顿迭代算法的收敛性
定理3.1 在算法1中,设
,
是方程(1)的唯一正定解,记
,
,初始条件如下:
(6)
如果对所有
,当
,
时,有
,
,
(7)
那么由算法1生成的序列
,
,
是有界的,即对所有
有:
(8)
证明 我们使用数学归纳法来证明这个定理,首先证明
的情况。由
,
,有
,
,
可得到
,
, (9)
,
(10)
因此,对
有
则有
,
(11)
另外,对
有
(12)
因此,当
,
(8)成立。假设当
时(8)成立,即
(13)
根据(13)得到
由条件(7)有
(14)
根据引理2.3和(14)有
(15)
则有
(16)
故此,已证明
假设对
,有
(17)
成立。根据(13)和(17)得到
可得到
(18)
(19)
(20)
根据(17)~(20)和(17)对
成立,因此(17)对所有
成立。此外,根据(9) (11) (12)和归纳假设(13)可知(8)对任意
成立,则定理得证。
定理3.1揭示了算法1产生的矩阵序列
有上界
,
有下界
,
有上界
。
定理3.2 在算法1中,设
,
是方程(1)的唯一正定解,记
,
,如果对所有
记,当
,
时满足条件(7),那么由算法1生成的序列
,
,
,对所有
满足以下结论:
(21)
证明 我们使用数学归纳法来证明这个定理。根据迭代格式(5)有
这表明当
,
时(21)成立。我们要证当
时,对所有
,
(22)
成立。当
时已证,假设
时(22)成立。则可得到
(23)
(24)
(25)
(26)
因此,(22)对所有
均成立。假设(21)对
成立,即对所有
有
(27)
根据(27)可得
由条件(7)可知
,则
因此
(28)
根据引理3.3可知
,且由(8)可知
以及
,则有
(29)
(30)
根据(28)~(30)可知
(31)
对
成立。假设(31)对所有
均成立,根据(27)可得到
由条件(7)可知
,则
因此
(32)
根据引理2.3可知
,且由(8)可知
以及
,则有
(33)
(34)
根据(32)~(34)以及归纳假设可知,(31)对所有
成立。此外,结合(22) (27) (31)以及归纳假设,通过数学归纳可知(21)对任意
成立,则定理得证。
定理3.2揭示了算法1产生的
是单调递增序列,
是单调递减序列,
是单调递增序列。
定理3.3 设
,
为方程(3)的唯一正定解,记
。此外,对所有
,记
。如果选择
,
满足条件(7),那么算法1生成的矩阵序列
,
收敛于方程(3)的唯一解,即
证明 根据定理3.1和3.2,由算法1生成的矩阵序列
和
,
是单调递增且有上界,矩
阵序列
是单调递减且有下界,因此,矩阵序列
,
,
是收敛的,则有
,
,
,
。记
。
通过对(5)中第一个表达式的两边都取极限,可得到
,
(35)
通过对(5)中第二个表达式的两边都取极限,可得到
(36)
由(36)得到
。
另外,对(5)中第三个表达式的两边都取极限,可得到
(37)
由(37)有
(38)
最后,对(5)中第四个表达式的两边都取极限,得到
(39)
将
和(38)代入(39)得到
,
(40)
根据(35)中的形式,可以发现(40)相较于与方程(3)具有相同的形式。由于方程(3)有一个唯一正定解,因此
,
是方程(3)的正定解,则定理得证。
注释3.1 本文算法的收敛性依赖条件(7),对于算法中条件(7)的普适性分析,可基于矩阵性质推导研究矩阵
,
,
,
的特征值、特征向量与条件(7)的关系,探讨其如何改变条件(7)成立的可能性。
4. 数值例子
我们给出1个数值实例来辅助验证本文的结论。定义迭代误差为
,
定义如下:
,
其中
,
。
考虑以下矩阵方程组:
,
,
,
,
,
,
转移概率矩阵为:
,
,
,
,
,
,
,
,
,
,
,
,
,
,
图1表明,无反演牛顿迭代算法在选取不同
,
下能收敛到方程(1)的唯一解。因此,能有效说明本文提出算法是收敛的。与文献[8]相比,本文研究的问题更有针对性,提出的算法避免了直接矩阵求逆运算,是对传统牛顿迭代法的改进。
Figure 1. The convergence curve of algorithm 1 under different values with
,
图1. 算法1在不同
,
取值下的收敛曲线
5. 结论
本文利用矩阵反演等式得到离散耦合Riccati矩阵方程的等价形式,并利用牛顿求根方法构造无反演的牛顿算法来求解方程。此外,验证了无反演牛顿迭代算法具有收敛性。值得注意的是,初始矩阵的选取会影响到牛顿求根方法,如何选择初始矩阵将会是我们继续的研究对象。