1. 引言
期权是场外衍生品市场最重要的金融风险管理工具之一。个人投资者和机构投资者可以通过提前支付期权费用来锁定未来可能发生的损失上限。期权种类繁多,其中障碍期权因其价格低、灵活性强的特点,深受机构投资者和个人投资者青睐 [1]。目前市场中绝大部分结构性理财产品都内嵌了障碍期权。据南财理财通报告,截至2022年第一季度,我国共有8家理财公司发行116只结构性理财产品,其中56%的产品内嵌障碍期权,占据理财产品市场的半壁江山。障碍期权是奇异期权的一种。当价格达到障碍水平则期权敲入生效,否则期权敲出作废。由于期权的生效存在不确定性,因此障碍期权的期权费低于传统期权。根据看涨/看跌、向上/向下和敲出/敲入方式的不同,可将障碍期权八类。为与前人文献比较结果,本文以向上敲入看涨障碍期权为例研究其定价。
1973年Black和Scholes首次提出用几何布朗运动来刻画资产价格运动,建立了Black-Scholes期权定价模型(BS模型),为后续期权定价研究奠定了基础 [2]。但是市场中实际上存在许多金融“异象”无法被BS模型解释,比如资产价格的“尖峰厚尾”、投资者的非理性行为等等 [3]。在此背景下,如何更加准确刻画资产价格过程的动态变化,是非常值得探究的问题。行为金融学发现,股价并非完全由股票内在价值所决定,还受投资者的心理和行为影响,其主观认识和选择偏好会极大程度影响资产定价的效率 [4]。自2002年以来,行为金融学已有三次站在诺贝尔经济学的最高舞台上,学术界也开始思考从行为金融的视角出发能否碰撞出不一样的火花。在随机波动率模型中,波动率被认为是随机过程而不是常数。孙有发(2020)在随机波动率模型的基础上结合行为金融建立了行为资产定价模型,考虑了羊群效应、投资者理性程度等行为因素 [5]。因此,行为资产定价模型能更灵活地刻画市场股价过程,本文将以行为资产定价模型为基础展开期权定价研究。
目前关于障碍期权定价的文献已有很多。Merton基于价格服从几何布朗运动过程、波动率是常数的假设首次推导了向下敲出看涨障碍期权价格的解析解 [2]。后续研究又进一步将波动率是常数推广至波动率是随机变化的,当波动率服从马尔科夫体制转换过程时,李冰清提供了障碍期权价格的解析上下界 [6]。当价格过程服从跳扩散过程时,邢晓芳等人应用风险中性定价原理和Girsanov定理研究欧式障碍期权的定价问题,求解出八种彩虹障碍期权的定价 [7]。
前述关于障碍期权定价的研究对象都是欧式障碍期权。由于美式障碍期权相比欧式而言定价难度更大,目前还没有关于美式障碍期权价格的解析定价公式,研究大多采用蒙特卡洛模拟方法 [8]。林杨珺在随机波动率模型中,通过研究自对偶定理,推导了在不对称情形下具有一个障碍水平时的美式向上敲入看跌障碍期权的估值形式 [9]。张利花在跳跃扩散模型下,将总体最小二乘法与随机化的Faure序列结合,得到的美式障碍期权定价结果相比传统最小二乘蒙特卡洛而言结果更稳定、更高效 [10]。
2018年Han等人推导出BS模型的倒向随机微分方程,并利用深度学习逼近未知梯度项来求解美式期权定价问题。相比传统方法,深度学习方法能够避免因“维度爆炸”而无法给高维资产定价的问题 [11]。此后深度学习对美式期权的研究引起了国内外学者的关注 [12] [13] [14] [15]。后续研究中,Becker等人证明了用多层神经网络来预测期权的持有价值,能够在任意精度上逼近期权真实值 [16]。孙有发在Han等人的基础上,推导出行为期权的倒向随机微分方程,并通过深度学习逼近两个未知梯度项求解欧式期权定价问题 [5]。但是行为期权的美式期权定价问题未得到解决。受Becker等人的研究启发,本文将利用多层神经网络代替最小二乘法,通过预测最优停时策略来为美式行为期权定价。
本文结构安排如下,第二部分建立行为资产定价模型,采用深度学习方法对美式障碍期权进行建模,第三部分和第四部分是本文的数值实验和总结讨论。
2. 模型构建
2.1. 行为期权定价模型
在行为资产定价模型中,我们假设期权市场交易者遵从行为金融学说中的有限理性、有限认知、有限控制力以及有限自利等假设,此时,投资于金融市场的风险资产的价格
满足:
(1)
其中
,r为无风险利率,
为波动率,
和
是独立的布朗运动,且相关系数为
。
为有限理性和非理性投资者合计(简称非完全理性投资者)占总投资者的比例。a为投资者结构趋于稳定时非完全理性投资者的占比。b为投资者结构趋于稳定的速度。c为羊群效应程度。
为非理性程度,
。
2.2. 障碍期权定价
美式看涨向上敲入障碍期权的最优停时问题定义为
(2)
其中
(3)
(4)
n代表不同时刻,
,r代表贴现因子,代表价格过程的最高价,B是障碍价格,K是执行价格。令
,停时
定义为
(5)
2.3. 深度学习算法
神经网络
定义为
(6)
其中
(7)
I为网络深度,
为隐藏层节点数。激活函数
(LeakRelu函数)为
(8)
(Sigmoid函数)定义为
(9)
(Sigmoid函数)定义为
(10)
综上,我们构建了深度学习方法预测停时策略的行为期权定价模型。由于我们可以通过投资者行为参数
和
来刻画金融资产价格的变化情况,故下面我们将先探究参数
和
如何对金融资产收益率产生影响。
3. 数值实验
3.1. 蒙特卡洛模拟
图1(左)是沪深300自2005年以来的收益率分布,图1(右)是基于行为资产定价模型模拟得到的收益率分布。与图1(左)相似,图1(右)呈现出尖峰厚尾、有偏的分布(峰度:4.32、偏度:−0.07、Jarque统计量:732.7),说明行为资产定价模型能够很好地模拟现实市场的收益率分布。图2是行为资产定价模型中不同参数取值对收益率分布的影响。从图2我们可知,参数a、b和γ的取值越小,收益率分布越集中。由此可见,行为资产定价模型具有灵活性,可以通过改变行为参数来适应不同的市场类型。

Figure 1. CSI 300 yield distribution (left) and simulated yield distribution (right)
图1. 沪深300收益率分布(左)和模拟收益率分布(右)

Figure 2. Effects of behavioral asset pricing model parameters on yield distribution
图2. 行为资产定价模型参数对收益率分布的影响
由图1我们可以得到以下结论,当有限理性与非理性投资者的占比越大、非理性成分越多,由这些投资者驱动的资产价格收益分布更分散,股价更容易大涨或大跌。我们利用行为资产定价模型有助于刻画投资者理性构成处于不同程度的股票市场。当市场成熟度越低,非完全理性的投资者占比会越高;当市场成熟度越高,投资者的投资决策主要由理性驱动。
3.2. 神经网络构建
我们使用四层全连接神经网络进行期权定价。虽然更深层的网络能够学习到更多的特征,但是在本文中四层已经能够达到理想的精度要求。在输入层到隐藏层、隐藏层到输出层,我们使用批归一化进行数据缩放,以此来减少梯度爆炸的问题。激活函数采用LeakReLU。与激活函数ReLU相比,它对于小于0的输入具有更好的包容性。输出层采用sigmoid函数将数值投影到(0, 1)区间。
本文实验环境如下:处理器为Intel(R) i5-11320H,RAM为16 GB。神经网络结构如下:在单资产中,输入层神经元个数为1,隐藏层神经元个数为10,输出层神经元个数为1。在多资产中,输入层的神经元个数为M个标的资产数量,隐藏层神经元个数为10M,输出神经元个数为M。在参数优化过程中,采用Adam梯度优化算法,Adam对每个参数使用相同的学习率,并随着学习的进行而独立地适应。此外,Adam是基于动量的算法,利用了梯度的历史信息。
由于神经网络中的迭代次数和隐藏层节点数的个数会影响定价精度和效率,因此我们需要寻找合适的迭代次数和隐藏层节点数。由图4(左)可知,当迭代次数达到200次的时候,期权价格趋于稳定。由图4(右)可知,当隐藏层节点数为55个,期权的定价误差能够降低到0.005以下。在保证定价高效的情况下,我们将迭代次数和隐藏层节点数分别设置为200和55 (不同参数迭代次数不同)。

Figure 4. Number of iterations and option price (left) and number of hidden layer nodes and option pricing error (right)
图4. 迭代次数和期权价格(左)和隐藏层节点数和期权定价误差(右)
3.3. 期权定价
为了确保定价结果的准确性,我们通过比较现有的文献研究,参考孙有发学者的参数取值(表1)对美式看涨期权(非障碍期权)进行定价。由于美式看涨期权的价格和欧式看涨期权价格一致,我们采取欧式期权的定价方法(简称EOP)作为期权价格的真实值。我们采用对偶变量法来降低样本方差,其中单资产的路径模拟50,000次(25,000 + 25,000对偶路径)。

Table 1. Barrier option parameters table
表1. 障碍期权的参数表格
由表2可知,EOP法、最小二乘蒙特卡洛法(简称LSM)和深度学习法得到的期权价格分别为3.270、3.276和3.272,与孙有发学者的价格(3.271)十分接近,验证了数据和方法的准确性。LSM法由Longstaff (2001)提出,是美式期权最常用的定价方法。与LSM方法相比,深度学习需要更长的时间(252.37秒)进行定价。在单资产的情况下,深度学习法似乎较LSM法不具有更多的优势。但是在高维资产的情况下,深度学习的独特优势格外凸显。

Table 2. Comparison of American call option pricing methods under single asset
表2. 单资产下的美式看涨期权定价方法比较
注:时间单位为秒;括号内为重复执行30次计算的s.e。
当资产数量少的时候,LSM法与深度学习法在定价精度上没有明显差异,但前者用时更少。但是从表3可知,当资产数量逐渐增加,LSM法的用时呈指数增加,而深度学习法的用时呈线性增加。当资产数量达到100以上时,LSM法用时过长,本文此处略过。随着资产数量逐渐增多,LSM法的定价与基准值(EOP)差值也越来越大。而深度学习法无论在单资产抑或高维资产情况下,始终都能与基准值控制在4个百分点内的误差,因此深度学习法在高维资产的情况下具有精度高、定价效率快的独特优势。
由Chen (2019)的研究可知,LSM法和深度学习法需要的浮点数分别为
,
,时间复杂度分别为
,
。随着维度d增大,LSM法需要消耗更多的内存和计算资源,这与本文的研究结论一致。1

Table 3. Comparison between LSM method and deep learning method under high-dimensional assets
表3. 高维资产下的LSM法和深度学习法比较
注:1) 为了提高效率,后续可执行次数统一取10次;2) DIFF是深度学习与EOP定价的差值。
表4是在不同参数下的向上敲入美式看涨障碍期权的价格。从表3的1至3行可知,期权行使的可能性和期权价格随障碍价格增大而降低。通过对比不同参数下的期权价格,我们可知,当羊群效应c越大、投资者结构趋于稳定的速度b越快,非完全理性投资者稳定占比a越多、非理性程度b越大,期权价格也会越贵。这个结论与孙有发学者的研究发现一致。
这表明当非理性投资者在市场中占比越大、市场价格的非理性成分越高时,价格过程会出现暴涨暴跌、收益率聚集的特征,伴随着更大的不确定性。期权价格是对未来风险的预期,因此,成熟度低的市场往往会付出更高的期权成本。

Table 4. Barrier option prices with different parameters
表4. 不同参数下的障碍期权价格
4. 结论
本文在前人研究的基础上,进一步提出了行为期权的美式定价方法——深度学习法。数值实验结果表明,深度学习法在单资产和高维资产情形下都具有定价效率高、精度高的特点,有效解决了现实中期权由于挂钩标的多而无法定价的问题,有助于金融机构设计合适的期权产品,推动我国期权市场的产品创新与总体发展。并且,期权价格与市场成熟度相关,当市场成熟度较低,非理性的投资者占比更高时,卖方往往会索要更高的期权费用。这说明通过政府积极推动投资者教育纳入国民教育体系,有利于提高投资者综合素质,降低市场金融衍生品产品的交易成本。
NOTES
1N为可执行次数、M为单资产模拟路径数、d为标的数量、 为基函数数量。