1. 函数型Riccati方程的研究历史
在1720年,意大利数学家Riccati在研究曲线曲率半径仅依赖于纵坐标时导出了一个二阶常微分方程,作变量替换后,得到微分方程
。在与朋友Rizzetti的通信中提出了一阶微分方程
和
并进行了深入研究。更一般地,上述微分方程可以写为
后人把这类方程称为Riccati方程 [1]。显然齐次情形就是著名的Bernoulli方程。
在常微分早期发展史上,Riccati的工作值得重视,他不仅研究了二阶微分方程,还提出了变量代换、变量分离等思想方法 [2]。除了Riccati本人,包括Euler,Bernoulli兄弟和Liouville等许多著名数学家都研究过Riccati方程。如D. Bernoulli在1725年证明了Riccati方程系数为特定确定数时,可将其化成可变量分离的微分方程 [3] [4];D’Alembert在1763年则将这类方程命名为“Riccati方程” [5]。经长期研究,Liouville在1841年证明了Riccati方程一般不能用初等积分法求解 [3]。这一结果不仅表明Riccati方程极具挑战性且对常微分方程的发展产生了深远影响。这导致了人们将注意力转向Riccati微分方程定性理论、近似解、数值解等方面的研究,直接推动微分方程的研究进入一个新的阶段——定性理论阶段 [6]。
关于Riccati方程的研究一直方兴未艾。直到今天,许多学者仍在开展相关方面的研究。主要开展Riccati方程简化形式的精确解、数值解、近似解;具有某些解的条件;解的性质及其物理意义;利用Riccati方程的解求解其他方程以及在量子力学中的应用等。下面我们综述近期的一些研究概况。Gasull等人考虑了实系数和复系数的多项式Riccati方程 [7]。也有学者研究了分数阶Riccati方程以及数值算法。Lucas等研究了有限维赋范分裂代数上的Riccati方程,指出此时是欧几里德空间上共形Riccati方程的特殊情形,是与旋转群同构的矢量场李代数V的一条曲线 [8]。讨论Riccati方程在偏微方程中的应用也一直是热点。如Lou借助Riccati方程提出求解非线性系统的相容Riccati展开法,此方法适用于包括KdV方程、非线性Schröndinger方程、弥散水波方程等可积系统 [9]。Odibat基于Riccati方程提出一种方法以寻求非线性演化方程的行波解,获得了孤子解、扭结解和周期解,解的形式有双曲函数,三角函数和有理函数 [10]。Navickas等人研究了具有多项式系数的广义Riccati方程并获得了存在扭结孤立波解的充分必要条件 [11]。Malwe等应用Riccati方程映射获得了非线性传输线方程的行波解、三角函数解、双曲函数解和有理函数解等 [12]。Riccati方程在量子动力学的应用已有很长的历史,尤其近期更是大量的学者进行了深入研究。如Cruz等借助非线性复Riccati方程证明量子不确定性演化的敏感性是由初始条件的选择造成的,使得量子动力学得以重新描述,并将此方法应用于描述耗散量子系统 [13] [14]。Rosu等研究了缺少线性项的耦合Riccati方程组并将薛定谔方程对应的势转换为Riccati方程。特别地,在单参数族等谱势,基态的积分因子对应着Riccati方程的解,获得了单参数等谱势的广义Mielnik结构等 [15]。
此外,许多学者对Riccati方程与二阶微分方程之间的关系和解进行研究,如Riccati方程的可积性、解的个数、特殊形式及其解 [16] [17]。这些研究使得Riccati方程得到了推广与发展。成果虽然丰富,但仍未解决该方程。Riccati方程即无初等解法,又与许多理论问题和实际问题密切相关,尤其是在系统科学中鲁棒稳定性问题、控制科学中最优控制问题等。这使得Riccati方程及其应用一直是研究热点。
2. 算子型Riccati方程
尽管一般Riccati方程无显示解,但Riccati方程无论在理论上还是在应用领域都是极其重要,尤其是在现代控制论中扮演着重要角色。在经典变分问题中,人们注意到Riccati方程和变分问题之间存在某种联系。1960年,Kalman引入了Riccati方程,建立线性二次最优控制问题(LQ问题)的状态反馈最优控制 [18]。特别是最优控制理论诞生的标志性工作——Kalman最优线性反馈调节器理论,使Riccati方程从此大放异彩。
在有限维最优LQ控制理论中,有限时区和无限时区上的Riccati方程分别为微分型
(1)
和代数型
(2)
其经典结果是LQ问题对任意初始状态都惟一可解当且仅当Riccati方程(1) (或(2))有半正定对称解
(或对称解
)。这揭示了最优控制问题与微分方程的本质联系。不仅如此,还建立了两点边值问题与Riccati方程之间的等价关系。
随着控制论的发展,Riccati方程也被引入分布参数系统最优控制,并取得了丰硕的成果。在20世纪70年代,Lions研究了如下形式的无限维Riccati微分方程
(3)
其中
,
是Hilbert空间上的线性算子 [19]。由于算子A一般是无界的,讨论该方程的适定性是有一定难度。为了克服其困难,Lukes-Russell、Curtain-Pritchard先后导出了不但可以容纳更多情形而且也较为容易的积分型Riccati方程
(4)
并讨论了微分型Riccati和积分型Riccati方程的等价关系,其中
是由A生成的发展算子 [20] [21]。Gibson对(4)进行深入研究,引进最优控制问题并基于其问题的可解性获得Riccati方程解的存在唯一性 [22] [23]。显然此方法有一定的局限性。在1984年,You发现了最优反馈控制和Fredholm积分方程的关系 [24]。而1985年Chen直接研究了非线性Riccati方程与一个线性Fredholm积分方程
(5)
的等价关系:在适当条件下,Riccati方程(4)有解P当且仅当线性Fredholm积分方程(5)有解H,为彻底解决分布参数系统LQ最优控制问题奠定了基础 [25]。这里
Da Prato-Bensoussan也研究了Riccati方程 [26] [27]。1991年Lasiecka-Triggiani讨论了无限维Riccati方程解的存在唯一性的充分条件,进而考虑了抛物型、双曲型及其它类型偏微分方程带边界控制的LQ问题 [28]。1995年,在李训经与雍炯敏的专著中,综述了算子函数
满足的积分型Riccati方程,积分型Fredholm方程,以及代数型Riccati方程与最优控制之间的关系 [29]。
简而言之,无论是微分型的、代数型的还是积分型的Riccati方程在(最优)控制理论的应用方面均取得了令人惊叹的成果。因为LQ问题的可解性与相应的Riccati方程的可解性之间具有等价性,其LQ问题的最优解由Riccati方程解决定。可以说Riccati方程促进了最优控制的发展,反过来最优控制的发展使得Riccati方程无论在理论上还是应用方面均得到了充分的展现。
3. 均衡Riccati方程
现代最优控制问题的基本特征是符合Bellman最优性原理。也就是说,一旦在某个时刻做出最优决策,则该决策在此时刻后的任何时刻都是最优的,即该决策的最优性具有时间一致的特征。该结论成立的前提是决策环境和决策者的心态不纳入决策因素。但在金融、经济等领域,这个前提显然不符合客观事实。这使得现代控制理论成为解决许多应用问题强而有力的工具,但对许多经济问题却不适用,因为人们的经济行为是一个极其复杂的活动。如何发展现代控制论,使之成为能够解决经济、金融等领域的许多问题的强有力工具,是控制论发展的一个重要方向,即建立时间不一致控制问题的基本理论。为此建立相对简单的时间不一致LQ控制问题的基本理论理所当然就成为一个突破点。即推广Riccati方程,使得时间不一致LQ控制问题的可解性与该Riccati方程的可解性等价。正是在这一背景之下,人们引进了均衡Riccati方程。
2011年雍炯敏教授在研究了一类时间不一致最优控制问题时,引入时间一致均衡控制,运用非合作博弈,证明了均衡控制的存在性可由一个微分方程和一个倒向Riccati-Volterra积分方程的耦合方程组
(6)
来刻画,他将之称为均衡Riccati方程。上述微分方程中
是方程
的解且
,其中
为
上的分割 [30]。这是首次将Riccati方程引入时间不一致问题研究中,但此均衡Riccati方程解的存在唯一性在 [30] 中并未给出具体证明。他在2012年研究一类随机微分方程支配的时间不一致LQ问题时,定义均衡值函数,建立均衡值函数满足的均衡HJB方程。他从均衡HJB方程构造了时间一致闭环均衡控制,并推导得到了均衡Riccati方程
(7)
其中
虽然该方程是确定型微分方程,但是由随机微分方程推导出来的,并且他采用了“对角线”方法和不动点原理证明上述Riccati方程解的适定性 [31]。2017年他又研究了平均场随机微分方程支配的时间不一致LQ控制问题,获得了近似问题的时间一致均衡策略,并证明该策略的收敛性,从而得到了均衡Riccati方程组
(8)
他运用 [31] 中的“对角线”方法和齐次线性Volterra积分方程的性质证明了上述方程的适定性 [32]。
著名行为经济学家周迅宇教授等人于2012年也研究了一类随机微分方程支配的时间不一致LQ控制问题,他们引进开环均衡控制并得到了开环均衡控制存在的充分条件 [33]。随后,周教授等人证明了 [33] 中开环均衡控制存在的一个充要条件,其核心是均衡控制与某个由FBSDEs推导出的耦合Riccati方程组解的存在唯一性等价,证明了 [33] 中构造的显式开环均衡控制确实是唯一的。其中一个耦合Riccati方程组为
(9)
他们主要考虑了两种特殊情况下Riccati方程解的定性理论,存在性可运用截断方法验证,唯一性也是可以验证的。进而,提出一般时间不一致决策问题解的存在唯一性在连续时间条件下还不存在,即使能找到解,但很难找到参数不太苛刻的条件来保证解的存在 [34]。与 [33] 定义的解条件相比较, [34] 新定义的条件更弱也更恰当。
2018年,彭云飞教授等人在研究一类ODEs支配的时间不一致问题时,引入下列耦合Riccati方程
(10)
并证明了均衡控制的存在性等价于Riccati方程解的存在性 [35]。
关于时间不一致LQ问题的最新研究,可参阅文献 [36]。
4. 小结
基于解决时间不一致LQ控制问题,人们引入均衡Riccati方程。显然均衡Riccati方程是算子Riccati方程的推广,内容更加丰富。关于其研究尚处于初始探索阶段。研究其适定性不仅有助于解决时间不一致LQ控制问题,为建立一般时间不一致控制问题的基本理论奠定基础,也有助于研究动力系统、量子力学等许多系统的相关性质。
基金项目
本文获得国家自然科学基金项目(11661020),国家自然科学基金项目(12061021)资助。