不对称信息随机微分博弈的充要最大值原理及其在高频金融市场中的应用
Sufficient and Necessary Maximum Principles for Stochastic Differential Games with Asymmetric Information and Their Applications in High-Frequency Financial Markets
摘要: 本文研究了一类多人不对称信息下的非零和随机博弈问题,其中系统方程是由布朗运动驱动的随机微分方程来描述,博弈者获取信息存在延迟且不对称。利用凸变分推导了充分和必要最大值原理,给出了纳什均衡点的充要条件。进一步将理论结果应用于高频金融市场中算法交易商、一般交易商和做市商的不对称随机微分博弈。
Abstract: In this paper, we investigate a class of non-zero-sum stochastic differential games with asymmetric information for multiple players, where the system equations are described by stochastic differential equations driven by Brownian motion. The players experience delayed and asymmetric information acquisition. By employing convex variation, we derive sufficient and necessary maximum principles to provide optimal conditions for the Nash equilibrium. The theoretical results are further applied to asymmetric stochastic differential games for algorithm traders, general traders, and market traders in high-frequency financial markets.
文章引用:李莹, 王岩. 不对称信息随机微分博弈的充要最大值原理及其在高频金融市场中的应用[J]. 动力系统与控制, 2025, 14(2): 160-172. https://doi.org/10.12677/dsc.2025.142017

1. 引言

近年来,高频交易在国际金融市场中的作用日益凸显,全球各大交易所纷纷引入高速交易平台,以满足机构投资者及对冲基金等对快速执行交易策略的需求。然而,伴随而来的也有不少争议,如是否存在市场操纵、是否加剧了市场的不稳定等,因此高频金融市场的研究是学者们广泛关注的热点问题,例如:Aït-Sahalia和Sağlam在文献[1]中描述了高频金融市场中做市商如何利用速度和信息优势与低频交易者互动,研究最优策略和市场均衡;文献[2]利用高频交易数据和深度强化学习算法构建量化模型,以提高高频交易效果和企业盈利能力;文献[3]发现高频交易者通过永久性价格变化和暂时性定价错误方向交易,利用流动性需求订单促进价格效率,并且其交易方向与公共信息相关,从而能够据此预测短期内的价格变化;Saito和Takahashi在文献[4]中考虑高频金融市场中算法交易商、一般交易商和做市商的相互合作影响的交易行为,他们的目标各不相同且合作共赢,将其建模为一个完全信息下非零和的随机微分博弈问题。

文献[4]考虑的算法交易商和做市商获取的是完全信息,且用示性函数χt来表示一般交易商获取信息存在延迟,也就是说只考虑了[0, δ]时间区间的延迟,此后这三类交易者获取的信息是同步的情况,这不符合真实高频金融市场中一般交易商的特性。真实市场交易中,三者不可避免地获取信息都存在延迟,其中算法交易者和做市商是利用复杂算法和高速计算自动执行交易策略,算法交易者是非做市的程序化交易者,他们会在较大的价格波动中寻找交易机会,而做市商则是通过在买卖价差中获利的程序化交易者,他们同时挂出买入和卖出订单,并在紧邻的范围内执行这些订单;一般交易商包括私人和机构投资者的长期头寸,以及非自动化的对冲基金,这些基金采用趋势跟踪策略,手动买卖金融资产。他们的反应速度不如算法交易者和做市商快,并且在市场出现意外事件时,他们会被迫减少其风险资产。因此,本文发展了文献[4]的问题模型,考虑了真实市场交易中三类交易者获取信息都是存在延迟的,并且他们的延迟是不同步的,即控制过程适应于完全信息的不同子滤子流。

关于完全信息下的博弈问题,最常用的两种求解方法是用动态规划原理或最大值原理来刻画纳什均衡点。例如,Savku和Weber在文献[5]中基于行为金融框架,在连续时间马尔可夫机制转换环境下,应用随机博弈与动态规划,通过马尔可夫链建模经济状态与投资者心理,建立HJB-Isaacs方程并求得最优策略;Feng在文献[6]中研究了竞争布朗粒子的规律性之后,建立了上下值函数的动态规划原理,并证明了HJB方程具有唯一粘性解。另一方面,文献[7]利用随机最大值原理给出了一类具有马尔可夫跳跃和泊松跳跃的无穷时间区域随机微分对策满足的充要条件;Nie和Yan在文献[8]中基于控制域非凸且控制变量在扩散项的条件,研究了一类平均场型的部分信息非零和随机微分博弈问题,推导了最大值原理和凸域验证定理,并将其应用于线性二次标量交互模型分析;文献[9]研究了部分信息下含时滞和平均场的混合正则–奇异非零和随机微分博弈,建立了奇异方程解的存在唯一性及最大原理,求得纳什均衡与鞍点,并应用于模型不确定性的最优投资与分红策略。

对于控制过程基于部分信息的博弈问题,由于系统的非马尔可夫特性,使得贝尔曼最优性准则不成立,因此动态规划原理失效(见文献[10])。近年来,很多学者推导部分信息下最大值原理来解决这种类型的随机微分博弈问题,例如,文献[11]研究了一类在部分信息下向后随机微分延迟方程的新型微分博弈问题,通过偶性关系,提出了非零和博弈的最大原;Wu和Liu在文献[12]中研究了部分信息下的平均场型零和随机微分博弈,应用对偶方法和倒向平均场型随机微分方程得出充分和必要最大值原理,并将结果应用于投资组合中的博弈问题;Zhang在文献[13]中研究了具有离散分布时滞性的非零和随机微分博弈的最大值原理,通过对偶方法和倒向随机微分方程,建立了必要最大值原理,并应用于动态广告中的博弈问题;文献[14]研究了Stackelberg随机微分再保险–投资博弈,考虑到延迟对平衡策略的影响,推导最大值原理并得到了均衡策略。

本文考虑高频金融市场中算法交易商、一般交易商和做市商的非零和随机微分博弈,在模型中假设三类博弈者获取信息都存在延迟且不对称。文献[10]中,An和Øksendal推导了不对称信息下零和博弈的最大值原理框架,本文进一步发展和补充了文献[10]的理论结果,针对多人不对称信息下的非零和随机微分博弈,推导了必要和充分最大值原理来刻画纳什均衡点,并将理论结果应用于高频金融市场中的随机微分博弈。

2. 模型

( Ω,, { ˜ t } t0 ,P ) 是完备的滤子概率空间, W( t ) 是定义在此空间上的 m 维标准布朗运动,系统状态 X( t ) 满足如下的随机微分方程:

{ dX( t )=b( t,X( t ), u 1 ( t ), u 2 ( t ),, u n ( t ) )dt+σ( t,X( t ), u 1 ( t ), u 2 ( t ),, u n ( t ) )dW( t ),    t[ 0,T ], X( 0 )=x d ,                                              (1)

其中, b:[ 0,T ]× d × K 1 × K 2 ×× K n d σ:[ 0,T ]× d × K 1 × K 2 ×× K n d×m 是给定的函数,在这里 K i l i 的一个闭子集, i=1,2,,n

本文研究一类n个参与者组成的非零和随机微分博弈问题,控制 u i :[ 0,T ]×Ω K l i 代表的是参与者i的策略, i=1,2,,n 。假设参与者获取信息是存在延迟的,且延迟的时间 δ i 是不同步的,因此令 { t } t0 是由布朗运动 W( t ) 生成的滤子流,则有:

t δ i t ,t0,i=1,2,,n,

其中, t δ i 代表 t δ i 时刻系统包含的所有信息,要求 u i ( t ) 关于滤子流 t δ i 是适应的,以表示参与者获取信息存在延迟且延迟时间 δ i 不同步。

接下来定义容许控制集,首先我们定义容许控制 u i ( ),i=1,2,,n

定义2.1 一个控制 u i ( ),i=1,2,,n 。被称为是一个容许控制,如果

1) 在控制 u i ( t ):[ 0,T ]×Ω K l i 下,系统方程(1)存在唯一的解;

2) u i ( t ) { t δ i } t δ i 0 渐近可测的随机过程;

3) E[ 0 T | u i ( t ) | 2 dt ]<

所有容许控制组成的集合就是容许控制集,此处记 A i 为参与者i策略的容许控制集, i=1,2,,n

因为本文考虑的是非零和随机微分博弈问题,所以这n个参与者是合作式的,都有其各自的目标,定义参与者i的代价泛函为:

J i ( u 1 , u 2 ,, u n )=E[ 0 T f i ( t,X( t ),u( t ) )dt+ g i ( X( T ) ) ],i=1,2,,n. (2)

其中, f i :[ 0,T ]× d × K 1 × K 2 ×× K n g i : d 是给定的函数。

现在我们的目标是去寻找一组控制 ( u ^ 1 , u ^ 2 ,, u ^ n ) A 1 × A 2 ×× A n ,使得:

J 1 ( u 1 , u ^ 2 , u ^ 3 ,, u ^ n ) J 1 ( u ^ 1 , u ^ 2 , u ^ 3 ,, u ^ n ),    u 1 ( t ) A 1 , J 2 ( u ^ 1 , u 2 , u ^ 3 ,, u ^ n ) J 2 ( u ^ 1 , u ^ 2 , u ^ 3 ,, u ^ n ),   u 2 ( t ) A 2 , J n ( u ^ 1 , u ^ 2 ,, u ^ n1 , u n ) J n ( u ^ 1 , u ^ 2 , u ^ 3 ,, u ^ n ),   u n ( t ) A n . (3)

这一组控制 ( u ^ 1 , u ^ 2 ,, u ^ n ) A 1 × A 2 ×× A n 被称为是博弈问题(3)的纳什均衡点。

3. 不对称信息下非零和博弈问题的最大值原理

在求解博弈问题时,动态规划和最大值原理(见文献[15])是两种经典的方法。但在博弈问题(3)中,由于控制过程 u i ( t ),t[ 0,T ] 是关于 t δ i 适应的,而不是 t 适应的,故此问题不符合贝尔曼最优性准则,从而动态规划不适用,因此本文要推导最大值原理。事实上,在文献[10]中,已经给出了二人零和博弈问题的最大值原理,以及二人非零和博弈的充分最大值原理,本文将进一步发展和补充文献[12]的工作,推导多人非零和博弈问题(3)的充分最大值原理和必要最大值原理来刻画纳什均衡点。

对于博弈问题(3),定义哈密尔顿函数

H i :[ 0,T ]× d × K 1 ×× K n × d × d×m ×,i=1,2,,n,

H i ( t,x,u, p i , q i )= f i ( t,x,u )+ b T ( t,x,u ) p i +tr( σ T ( t,x,u ) q i ), (4)

其中, ( p i ( ), q i ( ) ) 满足下列伴随方程:

{ d p i ( t )= x H i ( t,X( t ),u( t ), p i ( t ), q i ( t ) )dt+ q i ( t )dW( t ), p i ( T )= g i ( X( T ) ), (5)

其中,T代表矩阵的转置, tr( A ) 代表矩阵A的迹, x φ( )= ( φ x 1 , φ x 2 ,, φ x d ) T 代表函数 φ: d x的梯度。

本文的研究基于以下假设:

假设3.1 (A1) 假设控制 β i ( s )=( 0,, β i j ( s ),,0 ) A i ,i=1,,n;j=1,, l i ,其中:

β i j ( s )= α i j χ [ t,t+h ] ( s ), (6)

其中, t,h 满足 0t<t+hT ,且 α i j 是有界 t δ i 可测的随机变量,此外 χ [ t,t+h ] ( s ) 代表示性函数。

(A2) 对于给定的 u i ( ) A i 和有界的 β i ( ) A i ,存在 δ>0 ,使得:

u i + y i β i A i , (7)

对于所有的 y i ( δ,δ ) 成立。

X u i +y β i ( t )= X ( u 1 ,, u i +y β i ,, u n ) ( t ) ,对于给定的 u i ( ) A i 和有界的 β i ( ) A i ,定义变分过程 Y u i ( t ) 为:

Y u i ( t )= d dy X u i +yβ | y=0 = ( Y 1 u i ( t ),, Y d u i ( t ) ) T ,i=1,2,,n, (8)

根据系统方程(1)可得:

d Y j u i ( t )= λ j u i ( t )dt+ k=1 m ξ jk u i ( t )d W k ( t ),j=1,2,,d, (9)

这里

λ j u i ( t )= x b j ( t,X( t ), u 1 ( t ), u 2 ( t ),, u n ( t ) ) T Y u i ( t )+ u i b j ( t,X( t ), u 1 ( t ), u 2 ( t ),, u n ( t ) ) T β i ( t ) (10)

ξ jk u i ( t )= x σ jk ( t,X( t ), u 1 ( t ), u 2 ( t ),, u n ( t ) ) T Y u i ( t )+ u i σ jk ( t,X( t ), u 1 ( t ), u 2 ( t ),, u n ( t ) ) T β i ( t ). (11)

假设3.2 对于 i=1,2,,n ,可积性条件

E[ 0 T Y u ^ i T ( t ) q ^ i ( t ) q ^ i ( t ) T Y u ^ i ( t )dt ]< (12)

E[ 0 T p ^ i T ( t ) ξ u ^ i ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) ξ u ^ i T ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) p ^ i ( t )dt ]< (13)

成立。

现在给出博弈问题(3)的必要最大值原理:

定理3.1 (必要最大值原理) 在假设3.1和假设3.2成立的条件下,如果 ( u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) 是博弈问题(3)的一个纳什均衡点,也就是说, ( 0,0,,0 ) 是函数

h i ( y 1 ,, y n )= J i ( u ^ 1 + y 1 β 1 , u ^ 2 + y 2 β 2 ,, u ^ n + y n β n ),i=1,2,,n (14)

的一个稳定点,即:

h i y j ( 0,0,,0 )=0

对于 j=1,2,,n 成立,那么 ( u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) 满足:

E[ u i H i ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ]=0, i=1,2,,n. (15)

证明:因为 h i ( y 1 ,, y n ) ( 0,0,,0 ) 处有一个稳定点,从而:

y i h( y 1 , y 2 ,, y n )| y i =0 =E [ 0 T x f ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) T Y ^ u ^ i ( t )dt                                           + 0 T u i f ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) T β i ( t )dt+g( X ^ ( T ) ) Y u ^ i ( T ) ]=0, (16)

根据方程(5)的终值条件,可得:

E[ g( X ^ ( T ) ) Y u ^ i ( T ) ]=E[ p ^ i T ( T ) Y u ^ i ( T ) ], (17)

然后,对 p ^ i T ( t ) Y u ^ i ( t ) 利用伊藤公式,并根据哈密尔顿函数的定义,可得:

   E[ p ^ i T ( T ) Y u ^ i ( T ) ]=E[ 0 T d( p ^ i T ( t ) Y u ^ i ( t ) ) ] =E [ j=1 d 0 T { p ^ i j ( t ) ( x b j ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) T Y u ^ i ( t )                  + u i b j ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) T β i ( t ) )                  + Y j u ^ i ( t )( x H i ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) )                  + k=1 m q ^ i jk ( x σ jk ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) T Y u ^ i ( t )                  + u i σ kj ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) T β i ( t ) ) }dt ], (18)

由于

x H i ( t,x, u 1 , u 2 ,, u n , p i , q i ) = x f( t,x, u 1 , u 2 ,, u n )+ j=1 d x b j ( t,x, u 1 , u 2 ,, u n ) p i j + j=1 d k=1 m x σ k,j ( t,x, u 1 , u 2 ,, u n ) q i k,j , (19)

式(16)可化为:

E [ 0 T j=1 l i { f u i j ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) )                k=1 d ( p ^ i k ( t ) b k u i j ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) β i j ( t )                + z=1 m [ q ^ i z,k ( t ) σ z,k u i j ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) ] ) β i j ( t ) }dt ]=0. (20)

又因为

u i H i ( t,x, u 1 , u 2 ,, u n , p i , q i ) = u i f( t,x, u 1 , u 2 ,, u n )+ j=1 d u i b j ( t,x, u 1 , u 2 ,, u n ) p i j + k=1 d j=1 m u i σ k,j ( t,x, u 1 , u 2 ,, u n ) q i k,j , (21)

(21)结合式(20)可得:

E[ 0 T u i H i ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) T β i ( t )dt ]=0. (22)

根据 β i ( t ) 的定义,有:

E[ t t+h u i j H i ( t, X ^ ( s ), u ^ 1 ( s ), u ^ 2 ( s ),, u ^ n ( s ), p ^ i ( s ), q ^ i ( s ) ) α j ds ]=0. (23)

(23)式两端同时对h求导,并令 h=0 ,可得:

E[ u i j H i ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) α j ]=0. (24)

进一步利用条件数学期望的性质,(24)可化为:

E[ E[ u i j H i ( t, X ^ ( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ] α j ]=0. (25)

因为 α j 是任意有界 t δ i 可测的随机变量,因此最大值条件(15)成立,定理得证。

定理3.1给出了纳什均衡点的必要性条件,下面考虑纳什均衡点的充分性条件。首先补充如下假设:

假设3.3 假设下列可积性条件成立:

E[ 0 T ( X ^ ( t ) X ( u i ) ( t ) ) T q ^ i ( t ) q ^ i ( t ) T ( X ^ ( t ) X ( u i ) ( t ) ) ]<, (26)

E[ 0 T p ^ i ( t ) T σ( t,X( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) σ T ( t,X( t ), u ^ 1 ( t ), u ^ 2 ( t ),, u ^ n ( t ) ) p ^ i ( t ) ]<. (27)

定理3.2 (充分最大值原理) ( u ^ 1 , u ^ 2 ,, u ^ n ) A 1 × A 2 ×× A n 满足:

E[ H i ( t, X ^ ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ] E[ H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ], u i ( t ) A i ,Pa.s. (28)

其中, X ^ ( t ) ( u ^ 1 , u ^ 2 ,, u ^ n ) 对应的系统状态,且 ( p ^ i ( t ), q ^ i ( t ) ) ( u ^ 1 , u ^ 2 ,, u ^ n ) 对应的伴随方程(5)的一组解, i=1,2,,n 。此外,对任意 t[ 0,T ] ,哈密尔顿函数 H i ( t,x, u 1 ( t ),, u i ( t ),, u n ( t ), p ^ i ( t ), q ^ i ( t ) ) 关于 x, u 1 , u 2 ,, u n 是凹的且 g i ( x ) 关于x是凹的。则 ( u ^ 1 , u ^ 2 ,, u ^ n ) 是博弈问题(3)的纳什均衡点。

证明:首先考虑:

    J i ( u ^ 1 ,, u ^ i ,, u ^ n ) J i ( u ^ 1 ,, u i ,, u ^ n ) =E [ 0 T { f i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) )         0 T f i ( t, X ( u i ) ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ) ) }dt+ g i ( X ^ ( T ) ) g i ( X ( u i ) ( T ) ) ], (29)

由于g关于x的凹性,从而:

E[ g i ( X ^ ( T ) ) g i ( X ( u i ) ( T ) ) ]E[ ( X ^ ( T ) X ( u i ) ( T ) ) T g i ( X ^ ( T ) ) ] (30)

伴随方程(5)的终值条件,可得:

E[ ( X ^ ( T ) X ( u i ) ( T ) ) T g i ( X ^ ( T ) ) ]=E[ ( X ( u ^ 1 ,, u ^ i ,, u ^ n ) ( T ) X ( u ^ 1 ,, u i ,, u ^ n ) ( T ) ) T p ^ i ( T ) ] (31)

( X ( u ^ 1 ,, u ^ i ,, u ^ n ) ( t ) X ( u ^ 1 ,, u i ,, u ^ n ) ( t ) ) T p ^ i ( t ) 用伊藤公式,可得:

   E[ ( X ( u ^ 1 ,, u ^ i ,, u ^ n ) ( T ) X ( u ^ 1 ,, u i ,, u ^ n ) ( T ) ) T p ^ i ( T ) ] =E [ 0 T ( X ^ ( t ) X ( u i ) ( t ) ) T ( x H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) )dt ]       + 0 T p ^ i T ( t ){ b( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) )       b( t, X ^ ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ) ) }dt       + 0 T tr [ σ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) )         σ ( t, X ^ ( t ), u ^ 1 ( t ),, u i * ( t ),, u ^ n ( t ) ) T q ^ i ( t ) ]dt ]. (32)

另一方面,根据哈密尔顿函数 H i 的定义,有:

   E [ 0 T { f i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) ) 0 T f i ( t, X ( u i ) ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ) ) }dt ] =E [ 0 T { H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) ) H i ( t, X ^ ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ) ) ]    E [ 0 T p ^ i ( t ){ b( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) )    b( t, X ^ ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ) ) }dt ]    E [ 0 T tr{ σ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ) )    σ( t, X ^ ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ) ) } T q ^ i ( t )dt ], (33)

对比(29)和(32)得到:

J i ( u ^ 1 ,, u ^ i ,, u ^ n ) J i ( u ^ 1 ,, u i ,, u ^ n ) =E [ 0 T { H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) H 1 ( t, X ( u i ) ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) }dt, (34)

根据哈密尔顿函数 H i 关于 x u i 的凹性,有:

    H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )    H i ( t, X ( u i ) ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) x H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) T ( X ^ ( t ) X ( u i ) ( t ) )   + u i H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) T ( u ^ i ( t ) u i ( t ) ). (35)

u i = u ^ i ( t ) 时, E[ H i ( t, X ^ ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ] 达到最大,并且 u i ( t ) u ^ i ( t ) t δ i 可测的,因此:

E[ u i H 1 ( t, X u i ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) T ( u ^ i ( t ) u i ( t ) )| t δ i ] =( u ^ i ( t ) u i ( t ) ) u i E[ H i ( t, X u i ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ]0, (36)

式(35)结合式(34),有:

E [ H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) H i ( t, X ( u i ) ( t ), u ^ 1 ( t ),, u i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) )| t δ i ] x H i ( t, X ^ ( t ), u ^ 1 ( t ),, u ^ i ( t ),, u ^ n ( t ), p ^ i ( t ), q ^ i ( t ) ) T ( X ^ ( t ) X ( u i ) ( t ) ). (37)

因此,式(33)可以写为:

J i ( u ^ 1 ,, u ^ i ,, u ^ n ) J i ( u ^ 1 ,, u i ,, u ^ n )0, (38)

因为式(37)对所有的 u i A i i=1,2,,n ,都是成立的,我们有 J i ( u ^ 1 ,, u ^ i ,, u ^ n )= sup u i A i J i ( u ^ 1 ,, u i ,, u ^ n ) ,即 ( u ^ 1 ,, u ^ i ,, u ^ n ) 是博弈问题(3)的纳什均衡点。

4. 不对称信息下非零和博弈问题在高频金融市场中的应用

本节研究一类高频金融市场,利用随机微分博弈对其中三类参与者的交易行为进行建模,这三类参与者分别是算法交易商、一般交易商和做市商。其中算法交易商利用复杂算法和高速计算自动执行交易策略,一般交易商手动买卖金融资产,交易频率和速度低于高频算法交易,做市商持续提供买卖价差盈利,且这三者合作寻求最大利润,是非对抗性的,因此这是一个非零和的随机微分博弈问题。这类问题在文献[4]中已经进行了深入的研究,给出了纳什均衡点的解析表达式。本文在文献[4]的基础上,考虑了三类参与者获取信息存在不同步的时间延迟,更加符合真实的市场交易情况。

X 1 ( t ), X 2 ( t ), X 3 ( t ) 分别表示t时刻算法交易商、普通交易商和做市商持有的头寸,且 X 0 ( t ) 是风险资产的中间价格过程,则 X( t )=( X 0 ( t ), X 1 ( t ), X 2 ( t ), X 3 ( t ) ) 满足如下的方程:

dX( t )=( d X 0 ( t ) d X 1 ( t ) d X 2 ( t ) d X 3 ( t ) )=( μ+( γ 1 u 1 ( t )+ γ 2 t u 1 ( t )+δ u 3 ( t ) ) u 1 ( t ) u 2 ( t ) ( u 1 ( t )+ u 2 ( t ) )+k u 3 ( t ) )dt+( σ t 0 0 0 )dW( t ),   t[ 0,T ], (39)

X( 0 )= ( x 0 0 x 2 0 ) T ,

其中,控制 u i ( t ):[ 0,T ]×Ω,i=1,2,,n 分别是三种博弈者的策略,算法交易商、普通交易商分别控制他们的交易速度,做市商控制交易价格与中间价格的距离; μ, γ 1 , γ 2 ,δ,k 是常数,这里 μ 表示了发生在市场之外的全球市场冲击,且在交易期间不断影响风险资产的中间价格;代表了交易速度对于中间价格的影响;当采取最佳出价订单时,订单被修改,然后下一个最佳出价和要价 γ 1 u 1 ( t )+ γ 2 u 1 ( t ) 订单是被最后一个中间价格的某一个点为中心。通过 δ u 3 ( t ) 来表示中间价格的转变; k u 3 ( t ) 间价格的是做市场错过的算法交易商、普通交易商与第三方的成交量, σ t 是一个确定的函数,具体表示为 σ t = σ 0 +vt

接下来,定义博弈者在 T 时刻的预期利润为他们的代价泛函 J i ( u 1 , u 2 , u 3 ),i=1,2,3 ,具体形式如下:

  • 算法交易商

J 1 ( u 1 ; u 2 , u 3 )=E [ 0 T u 1 ( t )( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ) dt+ X 1 ( T ) X 0 ( T )                             η 1 2 0 T ( X t 1 ) 2 σ t 2 dt 1 2 c 1 X 1 ( T ) 2 ] (40)

  • 一般交易商

J 2 ( u 2 ; u 1 , u 2 )=E [ 0 T u 2 ( t )( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ) dt+( X 2 ( T ) X 0 ( T ) X 2 ( 0 ) X 0 ( 0 ) )                             η 2 2 0 T ( X t 2 ) 2 σ t 2 dt 1 2 c 2 X 2 ( T ) 2 ] (41)

  • 做市商

J 3 ( u 3 ; u 1 , u 2 )=E [ 0 T ( ( u 1 ( t )+ u 2 ( t ) )+k u 3 ( t ) )( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ) dt                            + X 3 ( T ) X 3 ( T ) 1 2 c 3 X 3 ( T ) 2 ] (42)

其中, ( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ) 是最后实际的交易价格,第三项 λ( u 1 ( t )+ u 2 ( t ) ) 表示的是算法交易商和一般交易商单位时间的成交量使得价格下滑, 1 2 c i X i ( T ) 2 ,i=1,2,3 是持有的风险资产在时刻T的风险成本,无论在周期结束时的位置符号如何,它都是存在的;用成交总额的二次变差也就是 η i 2 X 0 X i ,i=1,2 来表示算法交易和一般交易商的风险厌恶。

现在我们的目标是去寻找纳什均衡点 ( u ^ 1 , u ^ 2 ,, u ^ n ) A 1 × A 2 × A 3 ,使得:

J 1 ( u 1 , u ^ 2 , u ^ 3 ) J 1 ( u ^ 1 , u ^ 2 , u ^ 3 ),    u 1 ( t ) A 1 , J 2 ( u ^ 1 , u 2 , u ^ 3 ) J 2 ( u ^ 1 , u ^ 2 , u ^ 3 ),   u 2 ( t ) A 2 , J n ( u ^ 1 , u ^ 2 , u 3 ) J n ( u ^ 1 , u ^ 2 , u ^ 3 ),   u n ( t ) A 3 . (43)

这就是高频金融市场中的一个不对称信息下非零和的博弈问题,接下来就用我们推导出的定理3.1来刻画博弈问题(43)的纳什均衡点。

具体来说,在这个高频金融市场中的博弈问题中,系统的系数矩阵为:

b( t,X( t ),u( t ) )=( μ+( γ 1 u 1 ( t )+ γ 2 u 1 ( t )+δ u 3 ( t ) ) u 1 ( t ) u 2 ( t ) ( u 1 ( t )+ u 2 ( t ) )+k u 3 ( t ) ) (44)

σ( t,X( t ),u( t ) )=( σ t 0 0 0 ). (45)

代价泛函中的过程效应如下:

f 1 ( t,X( t ),u( t ) )= u 1 ( t )( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ) η 1 2 ( X t 1 ) 2 σ t 2 , (46)

f 2 ( t,X( t ),u( t ) )= u 2 ( t )( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ) η 2 2 ( X t 2 ) 2 σ t 2 (47)

f 3 ( t,X( t ),u( t ) )=( ( u 1 ( t )+ u 2 ( t ) )+k u 3 ( t ) )( X 0 ( t )+ u 3 ( t )+λ( u 1 ( t )+ u 2 ( t ) ) ). (48)

终端效应分别为:

g 1 ( X( T ) )= X 1 ( T ) X 0 ( T ) 1 2 c 1 X 1 ( T ) 2 , (49)

g 2 ( X( T ) )=( X 2 ( T ) X 0 ( T ) X 2 ( 0 ) X 0 ( 0 ) ) 1 2 c 2 X 2 ( T ) 2 (50)

g 3 ( X( T ) )= X 3 ( T ) X 3 ( T ) 1 2 c 3 X 3 ( T ) 2 . (51)

P i =( p i,0 , p i,1 , p i,2 , p i,3 ),i=1,2,3,4 ,哈密尔顿函数(4)具体表示为:

H 1 ( t,X,u, p 1 , q 1 )= u 1 ( X 0 + u 3 +λ( u 1 + u 2 ) )+( μ+( γ 1 u 1 + γ 2 u 2 +δ u 3 ) ) p 1,0                               + u 1 p 1,1 + χ t u 2 p 1,2 ( u 1 + u 2 ) p 1,3 +k u 3 p 1,3 η 1 2 ( X 1 ) 2 σ t 2 , (52)

H 2 ( t,X,u, p 2 , q 2 )= χ t u 2 ( X 0 + u 3 +λ( u 1 + u 2 ) )+( μ+( γ 1 u 1 + γ 2 u 2 +δ u 3 ) ) p 2,0                                + u 1 p 2,1 + u 2 p 2,2 ( u 1 + u 2 ) p 2,3 +k u 3 p 2,3 η 2 2 ( X t 2 ) 2 σ t 2 (53)

H 3 ( t,X,u, p 3 , q 3 )=( ( u 1 + u 2 )+k u 3 )( X 0 + u 3 +λ( u 1 + u 2 ) )+( μ+( γ 1 u 1 + γ 2 t u 2 +δ u 3 ) ) p 3,0                                + u 1 p 3,1 + u 2 p 3,2 ( u 1 + u 2 ) p 3,3 +k u 3 p 3,3 . (54)

伴随方程(5)表示为如下的倒向随机微分方程组:

{ d P 1,0 ( t )= u 1 ( t )dt+ q 1,0 ( t )d W t ,     P 1,0 ( T )= X 1 ( T ); d P 1,1 ( t )= η 1 X t 1 σ t 2 dt+ q 1,1 ( t )d W t ,     P 1,1 ( T )= X 0 ( T ) c 1 X 1 ( T ); d P 1,2 ( t )= q 1,2 ( t )d W t ,     P 1,2 ( T )=0; d P 1,3 ( t )= q 1,3 ( t )d W t ,     P 1,3 ( T )=0; d P 2,0 ( t )= u 2 ( t )dt+ q 2,0 ( t )d W t ,     P 2,0 ( T )= X 2 ( T ); d P 2,1 ( t )= q 2,1 ( t )d W t ,     P 2,1 ( T )=0; d P 2,2 ( t )= η 2 X t 2 σ t 2 dt+ q 2,2 ( t )d W t ,     P 2,2 ( T )= X 0 ( T ) c 2 X 2 ( T ); d P 2,3 ( t )= q 2,3 ( t )d W t ,     P 2,3 ( T )=0; d P 3,0 ( t )=( ( u 1 ( t )+ u 2 ( t ) )+k u 3 ( t ) )dt+ q 3,0 ( t )d W t ,     P 3,0 ( T )= X 3 ( T ); d P 3,1 ( t )= q 3,1 ( t )d W t ,     P 3,1 ( T )=0; d P 3,2 ( t )= q 3,2 ( t )d W t ,     P 3,2 ( T )=0; d P 3,3 ( t )= q 3,3 ( t )d W t ,     P 3,3 ( T )= X 0 ( T ) c 3 X 3 ( T ). (55)

进一步根据倒向随机微分方程理论,由于终值条件满足:

p 1,2 ( T )= p 1,3 ( T )0, p 2,1 ( T )= p 2,3 ( T )=0, p 3,1 ( T )= p 3,2 ( T )=0, (56)

则可解出:

q 1,2 ( t )= q 1,3 ( t )0, q 2,1 ( t )= q 2,3 ( t )=0, q 3,1 ( t )= q 3,2 ( t )=0, (57)

从而伴随方程(54)可以简化为:

{ d P 1,0 ( t )= u 1 ( t )dt+ q 1,0 ( t )d W t ,      P 1,0 ( T )= X 1 ( T ); d P 1,1 ( t )= η 1 X t 1 σ t 2 dt+ q 1,1 ( t )d W t ,     P 1,1 ( T )= X 0 ( T ) c 1 X 1 ( T ); d P 1,2 ( t )=0,     P 1,2 ( T )=0; d P 1,3 ( t )=0,     P 1,3 ( T )=0; d P 2,0 ( t )= u 2 ( t )dt+ q 2,0 ( t )d W t ,     P 2,0 ( T )= X 2 ( T ); d P 2,1 ( t )=0,     P 2,1 ( T )=0; d P 2,2 ( t )= η 2 X t 2 σ t 2 dt+ q 2,2 ( t )d W t ,     P 2,2 ( T )= X 0 ( T ) c 2 X 2 ( T ); d P 2,3 ( t )=0,     P 2,3 ( T )=0; d P 3,0 ( t )=( ( u 1 ( t )+ u 2 ( t ) )+k u 3 ( t ) )dt+ q 3,0 ( t )d W t ,     P 3,0 ( T )= X 3 ( T ); d P 3,1 ( t )=0,     P 3,1 ( T )=0; d P 3,2 ( t )=0,     P 3,2 ( T )=0; d P 3,3 ( t )= q 3,3 ( t )d W t ,     P 3,3 ( T )= X 0 ( T ) c 3 X 3 ( T ). (58)

最后根据定理3.1得到最大值条件:

E[ -2λ u ^ 1 λ u ^ 2 u ^ 3 X 0 + γ 1 P 1,0 + P 1,1 | t δ 1 ]=0, (59)

E[ 2λ u ^ 2 λ u ^ 1 u ^ 3 X 0 + γ 2 P 2,0 + P 2,2 | t δ 2 ]=0 (60)

E[ 2k u ^ 3 +( 1kλ )( u ^ 1 + u ^ 2 )k X 0 +δ P 3,0 + k P 3,3 | t δ 3 ]=0. (61)

综合以上推导过程,我们总结定理如下:

定理4.1 在滤子概率空间 ( Ω,, { t } t0 ,P ) 中,建立随机博弈系统(1)~(3),可以得到此纳什均衡点 u ^ 满足正倒向随机微分方程组:

{ dX( t )=b( t,X( t ), u ^ ( t ) )dt+σ( t,X( t ), u ^ ( t ) )dW( t ), d p i ( t )= x H i ( t,X( t ), u ^ ( t ), p i ( t ), q i ( t ) )dt+ q i ( t )dW( t ), X( 0 )=x R n                p i ( T )= g i ( X( T ) ). (62)

其中控制 ( u ^ 1 ( t ), u ^ 2 ( t ), u ^ 3 ( t ) ) 满足如下式子:

{ u ^ 1 =1/2 λE [ λ u ^ 2 u ^ 3 X 0 + γ 1 P 1,0 + P 1,1 | t δ 1 ], u ^ 2 =1/2 λE [ λ u ^ 1 u ^ 3 X 0 + γ 2 P 2,0 + P 2,2 | t δ 2 ], u ^ 3 =1/ ( 2k ) E [ ( 1kλ )( u ^ 1 + u ^ 2 )k X 0 +δ P 3,0 +k P 3,3 | t δ 3 ]. (63)

5. 结论

本文推导了不对称信息下非零和随机微分博弈的充分和必要最大值原理来刻画纳什均衡点,并应用于高频金融市场中算法交易商、一般交易商和做市商的随机微分博弈。在理论上,我们补充和发展了文献[14]中的理论结果,得到了多人非零和随机微分博弈的最大值原理。在应用上,基于文献[3]的模型,进一步假设三类博弈者获取信息存在延迟且不同步,利用最大值原理将求解纳什均衡点的问题转化成求解FBSDE的问题,从而用FBSDE的解来刻画纳什均衡点。但是需要指出的是:由于FBSDE中存在条件数学期望,使得它不是一个线性的FBSDE,从而不能用经典的线性方法来直接求解,因此本文没有给出纳什均衡点的显示解,FBSDE以及纳什均衡点的求解方法将是我们接下来的研究方向。

NOTES

*通讯作者。

参考文献

[1] Aït-Sahalia, Y. and Sağlam, M. (2024) High Frequency Market Making: The Role of Speed. Journal of Econometrics, 239, Article ID: 105421.
https://doi.org/10.1016/j.jeconom.2022.12.015
[2] Li, Z. (2024) A Study of Quantitative Modeling and Capital Market Efficiency Enhancement in High Frequency Trading. Applied Mathematics and Nonlinear Sciences, 9, 1-16.
https://doi.org/10.2478/amns-2024-3449
[3] Brogaard, J., Hendershott, T. and Riordan, R. (2014) High-Frequency Trading and Price Discovery. Review of Financial Studies, 27, 2267-2306.
https://doi.org/10.1093/rfs/hhu032
[4] Saito, T. and Takahashi, A. (2019) Stochastic Differential Game in High Frequency Market. Automatica, 104, 111-125.
https://doi.org/10.1016/j.automatica.2019.02.051
[5] Savku, E. and Weber, G. (2020) Stochastic Differential Games for Optimal Investment Problems in a Markov Regime-Switching Jump-Diffusion Market. Annals of Operations Research, 312, 1171-1196.
https://doi.org/10.1007/s10479-020-03768-5
[6] Feng, X. (2017) Stochastic Differential Games with Competing Brownian Particles and Related Isaacs’ Equations. Optimal Control Applications and Methods, 39, 519-536.
https://doi.org/10.1002/oca.2356
[7] Hu, P., Ma, H., Yang, X. and Mu, Y. (2024) Pareto Efficiency of Infinite-Horizon Cooperative Stochastic Differential Games with Markov Jumps and Poisson Jumps. Mathematics and Computers in Simulation, 225, 480-494.
https://doi.org/10.1016/j.matcom.2024.04.036
[8] Nie, T. and Yan, K. (2025) Mean-Field Partial Information Non-Zero Sum Stochastic Differential Games. Applied Mathematics & Optimization, 91, Article No. 37.
https://doi.org/10.1007/s00245-025-10233-x
[9] Lu, J., Wu, J. and Yang, B. (2024) Optimal Strategies of Regular-Singular Mean-Field Delayed Stochastic Differential Games. Annals of Operations Research, 344, 175-216.
https://doi.org/10.1007/s10479-024-06399-2
[10] An, T.T.K. and Øksendal, B. (2008) Maximum Principle for Stochastic Differential Games with Partial Information. Journal of Optimization Theory and Applications, 139, 463-483.
https://doi.org/10.1007/s10957-008-9398-y
[11] Wu, S. and Shu, L. (2016) Non‐Zero Sum Differential Games of Backward Stochastic Differential Delay Equations under Partial Information. Asian Journal of Control, 19, 316-324.
https://doi.org/10.1002/asjc.1382
[12] Wu, J. and Liu, Z. (2017) Maximum Principle for Mean-Field Zero-Sum Stochastic Differential Game with Partial Information and Its Application to Finance. European Journal of Control, 37, 8-15.
https://doi.org/10.1016/j.ejcon.2017.04.006
[13] Zhang, Q. (2020) Maximum Principle for Non-Zero Sum Stochastic Differential Game with Discrete and Distributed Delays. Journal of Systems Science and Complexity, 34, 572-587.
https://doi.org/10.1007/s11424-020-9068-1
[14] Bai, Y., Zhou, Z., Xiao, H. and Gao, R. (2020) A Stackelberg Reinsurance-Investment Game with Asymmetric Information and Delay. Optimization, 70, 2131-2168.
https://doi.org/10.1080/02331934.2020.1777125
[15] Yong, J. and Zhou, X.Y. (1999) Stochastic Control: Hamiltonian Systems and HJB Equations. Springer.