1. 引言
在大多数关于动态优化问题的研究中,一个关键特征是所研究的模型是时间一致的,即昨天被认为是最优的决策对于今天来说仍然是最优的,并且明天也将继续是最优的。如果此特征被破坏或更改,则该问题称为时间不一致问题。关于时间不一致问题的研究可以追溯到1739年和1759年,Hume [1] 和Smith [2] 对时间不一致问题进行了定性分析。时间不一致性在社会系统和日常生活中无处不在,因此时间不一致问题也是经济学和金融学中广泛研究的问题。经济学家对时间不一致问题的研究可追溯到20世纪50年代的Strotz [3] 的工作,他首次对时间不一致决策问题进行了公式化。而关于数学方面的研究成果,可参照Ekeland [4] [5],Basak、Chabakauri [6],Bjork、Murgoci [7] [8] [9] 等人的工作。值得指出的是,2014年雍炯敏教授 [10] 在国际数学家大会上做了关于《时间不一致问题》的专题报告。截至目前,时间不一致问题的研究已经取得了一定的进展,但就进一步研究时间不一致问题而言,这些研究成果远远不够。
关于时间不一致问题的研究,根据其解的不同定义,主要分为以下三类:一是2012年雍炯敏教授通过对时间区间离散化,将时间不一致问题看作是时间一致问题的极限,从而引进的时间一致均衡控制。理论成果主要有雍炯敏教授通过非合作博弈研究的时间不一致LQ控制问题,及利用合作博弈研究的确定型时间不一致最优控制问题,同时雍炯敏教授还研究了随机情形下的时间不一致LQ控制问题;二是2012年周迅宇教授等人引进的开环均衡控制,同时雍炯敏教授也考虑了一类具有确定系数的平均场随机微分方程的LQ控制问题的开环均衡控制;三是经济学家期望的闭环均衡控制。理论成果主要有彭云飞教授等人得到的闭环均衡控制的存在唯一性,这一结果为后续研究时间不一致问题奠定了一定的基础。关于时间不一致问题的研究,其他学者也引进了不同于上述三种解的定义,并证明了一些结论。如张纪峰教授等人在对离散系统的时间不一致LQ控制问题进行研究时,引入了混合均衡的概念,并得到了混合均衡解的存在性;Huang-Zhou [11] 引入强均衡、弱均衡的概念,他们在假设状态过程是无限域上的马尔可夫链的情况下,推导出了强均衡和弱均衡的特征,并在附加紧性假设下,由Kakutani不动点定理得到了强均衡点和弱均衡点的一般存在性。He-Jiang [12] 研究了一般扩散框架中的弱均衡和强均衡,证明了策略成为强均衡的必要条件。此外,他们还引入了正则均衡的概念,给出了弱均衡策略成为正则均衡的充分条件,并证明了该条件适用于许多时间不一致的问题。
正如大部分研究结论表明:由于时间不一致问题的时间不一致性,不能对问题定义“最优解”,经典的最优解不再适用。因此,关于时间不一致问题的研究,首要需要解决的问题就是如何定义解?其次是怎样获得解的存在性或解的性质?围绕这些问题,大量专家学者从自己的研究兴趣出发,对时间不一致问题的解给出了不同的定义,并在该定义下证明了解的存在性或解的一些性质。本文对现有文献中关于时间不一致LQ问题解的定义进行梳理和分类,并对其研究成果进行概括,以便对时间不一致LQ问题进行更深一步的研究。
2. 时间不一致问题数学模型
设
,
是一个非空集,控制集定义为:
,考虑如下的控制系统:
(1)
目标泛函:
(2)
问题是找到一个
,使得目标泛函(2)极小化。目标泛函(2)中函数
和
依赖于初始对
,这源于人们的时间偏好和风险偏好。此外函数
关于期望是一个非线性函数,这意味目标泛函和控制系统会随着时间的变化而变化,因此对目标泛函(2)进行优化并不是简单地优化一个问题,而是需要优化一族、甚至是无穷不可数个问题,故传统的求最优解的方法不再适用,甚至经典最优控制理论中的动态规划原理也不再适用。
3. 几类时间不一致LQ问题的解
根据理论价值和实际应用的需求,不同的研究学者从自己兴趣和需求出发,对时间不一致问题进行了研究并给出了不同解的定义。他们的研究工作推动了时间不一致控制问题的进展,为进一步的研究奠定了基础。下面介绍几类时间不一致LQ问题的解。
3.1. 时间一致均衡控制
雍炯敏教授引进了如下的时间一致均衡控制:对
,
,定义
若
则称
为时间一致均衡控制。
雍炯敏教授 [13] 通过非合作微分博弈研究时间不一致LQ问题,随后通过合作微分博弈研究了确定型时间不一致LQ问题 [14],其核心思想是将时间不一致问题视为时间一致问题的极限,通过分割、迭代的方法,将时间不一致控制问题分割成无穷可数个时间一致问题,并通过微分博弈求解每个时间一致问题的解,最后取极限便获得了一类时间不一致控制问题的解。运用 [13] 中的思想,雍炯敏教授 [15] 研究了一类具有确定系数的时间不一致随机控制问题,在适当的条件下推导出了问题的均衡值函数的Hamilton-Jacobi-Bellman (HJB)方程,并构造了时间不一致问题的时间一致均衡策略,给出了LQ问题在广义Merton投资组合问题的应用。2017年,雍炯敏教授等人 [16] 研究了具有递归成本函数的时间不一致随机LQ控制问题,引入了时间一致的局部近似最优均衡策略,借助多人微分博弈构造了近似均衡策略族,导出了均衡HJB方程,并通过均衡HJB方程导出均衡值函数,从而获得了均衡策略;其次,他们在一定条件下推导了均衡HJB方程的适定性,并证明了一个验证定理;最后,他们给出了一个示例,并对不同定义的均衡策略进行了比较。2017年,雍炯敏教授 [17] 考虑了具有确定型的平均场随机时间不一致LQ控制问题,证明了闭环均衡解可由对应的Riccati方程推导出,并通过多人微分博弈得到了闭环均衡解(实际上应称为时间一致闭环均衡解)。2020年,吕琦教授等人 [18] 研究了无限维希尔伯特空间中时间不一致随机LQ控制问题,提出了一类时间一致闭环均衡策略,并通过多人微分对策方法证明了该策略的存在性。
3.2. 开环均衡控制
周迅宇教授等人引进的开环均衡控制:对
,
,
,定义
若
则称
为开环均衡控制。
周迅宇教授等人 [19] 在具有确定系数的情况下,通过将一个正倒向随机微分方程组简化为几个类似于Riccati的常微分方程,推导出了时间不一致LQ问题开环均衡控制的一般充分条件。2017年,周迅宇教授等人 [20] 在文章 [19] 的基础上将开环均衡控制的充分条件转化为充要条件,并在一维情形下证明了时间不一致LQ问题开环均衡控制的唯一性。此外,2017年,雍炯敏教授研究了具有确定型的平均场时间不一致随机LQ控制问题,证明了开环均衡解可由对应的Riccati方程推导出,并采用变分法得到了开环解。
3.3. 闭环均衡控制
经济学家期望的闭环均衡控制:对
,
,
,定义
若
则称
为闭环均衡控制。
2022年,彭云飞教授等人 [21] 考虑了如下由常微分方程系统支配的时间不一致LQ问题,并获得了闭环均衡控制的存在性。控制系统:
目标泛函:
若
满足下列不等式,则称
为均衡控制。
其中
此外,若存在一个函数
使得下列等式成立,则称
为线性均衡控制。
文章 [21] 得到了两个主要结果,一是证明了时间不一致控制问题、两点边值问题和积微分Riccati方程之间的等价关系;二是得到了时间不一致问题的线性均衡控制的存在性和唯一性。在文章中,彭云飞教授使用了不同于针状变分的方法,得到了一个不涉及时间参数的Riccati方程(该Riccati方程具有对称结构),并利用Banach不动点理论和延拓方法,证明了该Riccati方程解的存在唯一性。最后,彭云飞教授依据Riccati方程与控制问题可解性之间的等价关系,得到了时间不一致LQ问题均衡控制的可解性,进一步得到了线性均衡控制的存在唯一性。需要指出的是,文章中的唯一性结果仅适用于线性均衡和确定型的LQ问题,对于一般的时间不一致LQ问题(如随机LQ问题和一般均衡问题),唯一性结果仍然是不确定的。
3.4. 混合均衡解
2019年,张纪峰教授等人 [22] 引入了混合均衡解。他们针对时间不一致随机LQ问题提出了一种新的均衡解的定义——混合均衡解。混合均衡解由两部分组成:纯反馈策略部分和开环控制部分。他们利用正倒向随机差分方程的极大值原理,建立了混合均衡解存在的充要条件,并通过解耦正倒向随机差分方程,得到了混合均衡解的存在性。此外,他们还构造了一个对某些初始对既不存在开环均衡控制,也不存在反馈均衡策略,但对所有初始对都存在混合均衡解的示例,因此研究混合均衡解是必要的。
4. 展望
时间不一致问题普遍存在于生活中,也被广泛应用于经济和金融方面。尽管关于时间不一致问题的研究近几年来已经有一些新的成果和突破,但总的来说,目前对时间不一致问题的研究仍处于初步探索阶段,尚有许多问题需要解决,例如贴现因子依赖于状态变量的广义时间不一致LQ问题,对无穷时区上的时间不一致LQ问题的闭环均衡控制的存在性及其性质的研究。
基金项目
本文获得国家自然科学基金项目(12061021)资助。