1. 引言
1.1. 研究背景及意义
随着经济的发展和时代的进步,人们的收入除了用于日常消费外,还会将部分闲置资金投资于金融市场中,购买股票就是一种常见的投资方式。
根据中国证券登记结算有限责任公司发布的数据,截至2022年11月开立了A股账户投资者就达2.108亿,其中自然人(个人投资者)为2.103亿,占比达到99.77%。如果提供一些股票未来走势的预测参考,使广大投资者及时做出买入或抛出等决策,一方面能让人们充分发挥闲置资金的作用,投资成功将给投资者带来收益;另一方面能让企业的经营和融资过程更加顺利,给企业带动可观的利润,对市场发出正向的信号。从这两方面来看,股票对社会经济发展有一定作用,故研究和预测股票走势具有重要意义。
1.2. 研究方法
预测股票走势即研究股票价格波动并非容易之事。从国际和国内经济形势的宏观因素到个体投资者决策的微观因素,影响股票价格波动的变量很多,因此部分学者认为股票市场不可预测,便放弃了其研究工作,但是更多的国内外研究者和投资者提出了各种预测模型及理论,并得到了较好的预测效果。
早期的预测模型主要聚焦于线性回归领域,但是随着金融界理论的发展以及股票价格变化具有非线性的特征,1982年罗伯特·恩格尔提出了自回归条件异方差模型(ARCH模型)用于金融领域的预测,同时也解决了传统时间序列中方差恒定的问题,后来学者以此为基础提出了GARCH、ARCH-M、SV等随机波动模型;之后随着计算机算法的提升,提出了模糊神经网络、BP神经网络等机器学习类的预测模型,且精度有了明显的提高。近年来随着数学算法的发展以及强化学习的推进,作为其基石的Markov链及其相关理论引起了学者们的重视。
用Markov链预测股票价格,国内外学者有很多相关先例及其研究成果,陈嘉晋 [1] 等人曾运用Markov链预测2018年10月22日及23日伊利股份收盘股价区间;王鑫 [2] 用此方法预测了华联股票价格,并对养老基金运行提供有关建议。本文将随机过程领域的Markov链作为主要研究方法,先讲述其基础理论,再以华夏银行(600015)作为研究对象,具体说明Markov链在实际预测股票价格的应用过程。将预测结果与实际结果进行对比,说明其预测效果较好,并阐述Markov链在短期与中、长期预测中准确度不同的原因。
2. Markov链理论基础
Markov链由俄国数学家Андрей Андреевич Марков于1906年首次提出,是第一个从理论上被提出并加以研究的随机过程模型 [3],目前已在经济、医学、通信等领域具有广泛的运用。
假设
为随机变量长度为n的随机过程,对于
情况下,随机变量
的取值均在可数集I内,即
,
。
(1)
若满足式1,我们称
为Markov链,对于可数集I称为状态空间。式1体现了Markov链无后效性的特点,即对于下一阶段n + 1时的状态,只与本阶段n时的状态有关,与之前n − 1个任何阶段的状态均无关。
2.1. 转移概率矩阵
状态转移概率是指事物此时处于某一状态时,其下一时刻转移到其他状态的可能性。例如
是事物此时处于
状态,其下一时刻转移至
状态的概率。假设该事物有n个可能的状态,该事物下一阶段可能转移的状态有n种,逐个计算其转移概率,形成
的转移概率矩阵P
其具备如下两条性质 [4]:
非负性。根据概率论的基本知识,事物的任何概率均不可能为负,且均不大于1,转移概率也不例外,即
。
归一性。转移概率矩阵的行和始终为1。在事物所有状态已知的情况下,事物从当前状态转化成下一阶段的状态,只可能是n种状态的其中一种,因此行边缘概率为1,即
我们将
称为从状态
转化成
的一步状态转移概率。我们对其进行推广,
称为从状态
转化成
的n步状态转移概率,即状态转移并非一步完成,有中间的过渡状态,且之间相互独立,本文通过举例的方式推导n步状态转移概率的计算公式。
如图1所示,事物A的状态空间
,一步转移概率矩阵P已知。n (
)时刻事物A处于S1状态,若计算事物A在n + 2时处于S3状态的概率,通过观察发现共有三条路径能够实现,其概率为各条路径概率之和,由于各步之间相互独立,每条路径概率为各步概率乘积,即
(2)
将式2推广后,即为Chapman-Kolmogorov方程 [5] (以下简称“C-K方程”):
(3)
(4)
式3提供了n步转移概率的计算公式,n步状态转移概率的所有元素组成的矩阵称为n步状态转移概率矩阵
,根据C-K方程,能更简便的计算出n步状态转移概率矩阵
。

Figure 1. Two-step state transfer path diagram of thing A
图1. 事物A两步状态转移路径图
2.2. 马氏性检验
马氏性检验的目的是判断序列是否为Markov链,即检验该随机变量序列是否满足式1中的条件。如果未对序列进行马氏性检验或未通过马氏性检验,则得出预测结果的精准度有待考察,由此做出的投资建议将不具备合理依据。
该检验借助统计学中假设检验的知识和方法,构造出
统计量,在显著性水平
给定的情况下,通过比较统计量与临界值
的大小,若
,则该序列符合马尔可夫性,可以进行分析预测 [6],反之亦然。统计量表达式如下:
(5)
其中,
、
分别表示该事物从当期状态i下一阶段转移至状态j的历史频率和概率,均可通过被研究数据进行估算;
为列边缘概率,即无论该事物当期处于什么状态,下一阶段能转移至状态j的概率。
3. 实证分析
借助同花顺股票交易平台,本文收集和整理了华夏银行(600015)在2022年8月1日至2022年12月19日期间共95个交易日的每日收盘价格,参考图2实证分析过程,运用Markov链及其相关理论,预测该只股票未来几日价格走势。本文将每个交易日涨幅r作为划分状态的指标,涨幅r计算公式如下:
(6)
得到了序列长度为94的股票每日涨幅时间序列G,本文后续分析均基于此序列。
3.1. 确定波动状态
观察序列G发现涨幅最低为−2.39%,最高为2.95%,参考文献 [7] 和 [8],结合序列G的分布图与聚类情况,我们将94个收盘价波动分为四个状态:涨幅为(−10%, −1%]定义为下降、(−1%, 0%]定义为略微下跌、(0%, 1%]定义为略微上升、(1%, 10%]定义为上升,并分别用
表示以上四种状态,即状态空间为
,每日的波动状态见附表1。从统计情况来看,下跌状态(S1)共8次,略微下跌状态(S2)共44次、略微上升状态(S3)共32次、上升状态(S4)共10次。
3.2. 建立状态转移概率矩阵
设
为研究数据中从状态
经过一步转移到状态
的频数(
),可以组建出4 × 4状态转移频率矩阵f,该矩阵为后续计算各阶状态转移矩阵
以及序列马氏性检验做准备。
受篇幅限制,本文仅以下跌状态(S1)转移至略微下跌(S2)为例,说明矩阵f计算过程。序列中呈现下跌状态(S1)的总数共8次,其中从下跌状态(S1)转移至略微下跌(S2)有3次,即
,以此类推。矩阵f的计算结果如下:
我们将状态转移频数矩阵f中的所有元素除于该行元素总和,即
(7)
按式7可得到一步状态转移概率矩阵P:
图3为状态转移图,是直观表达转移概率的另一种方式。
根据C-K方程,二步、三步状态转移概率矩阵
、
如下:
我们可以通过各步状态转移矩阵和初始状态向量,计算出各阶段的状态转移向量,从而对股票未来状态进行预测。
3.3. 马氏性检验
在运用Markov链之前,我们需要对序列G进行马氏性检验,用于判断序列中的随机变量是否满足:下一阶段状态只与当前状态有关,而与之前阶段的状态无关。该检验是后续分析和预测的前提与基础。
通过计算式5中参数
情况下的统计量,来判断序列G是否具备马氏性。如不具备马氏性,则预测结果的参考价值不大。参考刘致谦 [9] 在检验招商银行长度为41序列的方法进行计算。
原假设H0:序列G不具备马氏性,备择假设H1:序列G具备马氏性
从表1可知,统计量
,在
显著水平下,查验
临界值表,
,统计量
,即拒绝原假设H0,认为序列G具备马氏性,预测结果具有一定参考价值。

Table 1. Calculation process and presentation of Markov property
表1. 马氏性检验计算过程及结果呈现
3.4. 基于状态转移概率矩阵的预测
由于2022年12月19日收盘价处于下跌状态(S1),则可以认为初始状态向量
。利用该向量和各步状态转移概率矩阵,从而预测2022年12月20日至2022年12月27日状态概率向量(非交易日除外)。
2022年12月20日状态概率向量:
2022年12月21日状态概率向量:
向量
、
的计算过程以此类推,计算结果整理后见表2。

Table 2. Daily state probability vector for 20 December 2022 to 27 Dec. 2022
表2. 2022年12月20日至2022年12月27日每日状态概率向量
从预测结果来看,2022年12月20日转移至S2状态的概率最大为37.5%,对应的预测涨幅区间为(−1%, 0%]。实际涨幅为−0.96%,在预测区间范围内;后续四个交易日的实际涨幅均落在预测涨幅区间范围内,2022年12月27日实际涨幅为1.17%未落在预测区间内,详细情况见表3。综合来看,预测效果较好。

Table 3. Contrast situation of forecast range and the actual increase
表3. 预测区间与实际涨幅对比情况
4. 结论与说明
从结果来看,华夏银行之后五个交易日的股票价格走势处于非上升的趋势,本文认为主要原因有两方面:一方面与当时的市场环境有关。根据每日经济新闻的消息,2022年12月19日上证指数收盘涨幅为−1.92%,随后两天的涨幅均为负数;另一方面与银行自身情况有关,近年来华夏银行的业绩增长乏力,不良贷款率高于业内平均水平,且该行出现多起大额处罚 [10],2022年的股票价格处于下跌趋势较多。
通过Markov链以及相关理论和对华夏银行的短期预测结果来看,Markov链对股票价格的走势预测具备一定的精准性,即短期预测结果能对投资者提供一定的参考价值,使其避免一些因盲目决策带来的损失 [11]。当然预测结果的精准程度也与观察序列的长度、确定状态指标的选取以及状态划分区间等因素有关。但是无论以上因素如何调整和变化,若将Markov链应用于对股票的中、长期预测时,会发现预测结果与实际结果偏差会增加,其精准度小于短期预测。这也是Markov链的弊端,究其根本在于状态转移概率矩阵不稳定。
在短时间内,影响股票走势的主要是与股票本身特点有关的内生变量,而外生变量在短时间内通常不会出现大规模的调整,市场环境可认为比较稳定,此时的状态转移概率矩阵不会有大的波动;在长时间内,由于外生变量的影响,例如货币政策的调整、经营遇到突发事件等情况,使市场环境发生改变,此时的状态转移概率矩阵将会改变,原先的状态转移概率矩阵代表性将会减弱,预测的参考性会降低。
致谢
本文所运用的方法大部分来自于随机过程的领域,很多方法和理论都是在大学生创业项目学到的。撰写本文既是对项目结束后的一次实际成果检验,亦是对本人2022年学习生活画下的圆满句号。从国际国内到个人,2022年注定是极不平凡的一年!奋进新征程,希望2023年能继续充实过好每一天!
附录

Table A1. The daily increase status for the period of 95 trading days from August 1, 2022 to December 19, 2022
附表1. 2022年8月1日至2022年12月19日期间95个交易日每日涨幅状态