1. 引言
股票市场是市场经济中最重要的资本市场,2021年9月3日北京证券交易所成立,标志着中国的股票市场自20世纪90年代初重新建立以来即将进入一个新的发展阶段,股票市场是企业直接融资的主要渠道,走市场化的经济发展道路,必须充分地规范发挥股票市场作用。股价预测方法有多种,多年来相关学者提出了各种预测方法,总结出来有三类:基于统计学方法的股票价格波动预测模型、机器学习预测模型和基于随机过程的预测模型 [1] 。考虑到经济环境是不断变化的,Markov模型正是通过对事物不同状态的初始概率与状态之间转移概率的研究,确定状态变化趋势,预测事物的未来。目前,马尔科夫模型主要应用于产品市场占有率、市场销售情况、期望利润等方面的预测,本文引入运用状态划分方法,借助C-K方程以及平稳分布,预测股价未来所处状态以及所处区间,并与真实数据进行对比,通过在实际股价预测中的应用,为投资者在实际决策中提供更为可靠的依据。
2. 理论基础
2.1. Markov链的定义
定义1 [2] :随机过程
称为Markov链,若它只取有限或可列个值,对任意
及任意状态
,有:
上式刻画了Markov链的特性,称为Markov性,也称无后效性,其是指事物在以后的状态只与本阶段的状态有关,而与以前任何阶段所处的状态均无关。
2.2. 转移概率
定义2 [2] :将
排成一个矩阵形式,令:
称P为转移概率矩阵,一般简称为转移矩阵。由于概率是非负的,且过程必须转移到某种状态,所以容易看出
有性质:
1)
,
;
2)
,
。
2.3. n步转移概率和C-K方程
定义3 [2] :n步转移概率:称条件概率
为Markov链的n步转移概率,相应的称
为n步转移矩阵。
C-K方程:对一切
有:
1)
2)
2.4. 平稳分布与极限分布
定义4 [3] :设
是齐次马尔可夫链,状态空间为I,转移概率为
,若:
即若概率分布为
,转移概率有
,称概率分布
为马尔可夫链的平稳分布。对于平稳分布有
。
称Markov链是遍历的,如果所有状态相通且均是周期为1的正常返状态,对于遍历的Markov链,极限
称为Markov链的极限分布。
3. 模型分析
3.1. 马氏性分析
股票价格、股票价格区间以及成交量的状态是一族依赖于时间t的随机变量,其变化过程是一个随机过程。且在时间t所处的状态只与在时刻t的状态有关,而与时刻t以前所处的状态无关,即具有无后效性。无论从什么时候开始,股票状态变化过程都保持一种时间历程的不变性,其一步转移概率只与时间差有关,而与时间起点无关,所以转移概率矩阵保持稳定不变。同时股票价格、股票价格区间以及成交量只能产生可列个状态,且用同一标准划分的各状态应相互独立,并包含全部可能出现的状况。因此股票价格、股票价格区间以及成交量变化过程符合马尔科夫过程,可用Markov模型来预测股票未来走势。
3.2. 股价分析
现考察一只股票在第n天的收盘价格
,则
,在
中插入m−1个分点
,分别记
和
为0和
,那么在
被分成m个区间,其中第i个区间为
,
只能落在m个区间中的某一个里。同时规定:
,当
时,我们称股价的状态为i。记
为股票从状态i经过一个时间间隔转移到状态j的概率,
表示状态i经过n步转移到状态j的概率。由此股票价格的一次转移概率为:
由C-K方程可知
述了股价从一个状态到下一个状态的概率分布状况,因此,通过计算
,我们可以预测n个交易日后的股价。即通过比较
中第i行各项值的大小就可以判断n个时间间隔后股价最可能达到的状态。
4. 股价运动马尔可夫链的实证分析
4.1. 以股票收盘价的状态为对象进行预测
以平安银行(SZ000001) 2022年3月01日至5月09日共45个收盘交易日的收盘交易价格资料为例,运用状态划分的方法,将各日的收盘价格分为上升、持平、下降三种状态进行分析预测,统计结果见表1。
Table 1. Statistics of Ping An Bank’s closing price
表1. 平安银行收盘价状态统计
表中可知,由上升转变为上升状态的次数为7次,则以概率代替频率,即由状态i1到状态i1的转移概率:
次数为11次,即
;由上升转变为持平状态的次数为1次 [4] ,即
;以此类推,可以得到
,
,
,
,
;
,将其各转移状态情况列成如下表2:
Table 2. Transfer state probability statistics
表2. 转移状态概率统计
由表2可以得到平安银行的收盘状态转移矩阵:
矩阵P中每行即为某一状态的各种转移概率,故有
,
。
根据表1,由于所统计数据最后一天5月09日处于下降状态,而后续无资料,所以可以认为其初始状态向量
利用该向量和状态转移概率矩阵来预测各个收盘日价格所处状态的概率:
第10日收盘价状态概率向量:
第11日收盘价状态概率向量:
。
第12日收盘价状态概率向量:
。
由第10日收盘价状态概率向量
的结果可知,收盘价落在i3状态的概率最大,为0.579,其该天的实际价格为14.55,的确处于下降状态。同理,在第11日收盘价状态概率向量
中,收盘价处于i3状态的概率最大,而事实上该天的实际价格为14.59,处于上身状态,与预测结果不服,因此投资者在实际决策中可以结合当天的实事来判断其所处的真实状态。
由于上述递推法计算量过大,在此不一一列出,但随着交易日的增加,在天数足够多时,状态概率会趋向于一个与初始值无关的值并稳定下来,因此利用平稳分布与极限分布,通过在稳定条件下进行分析决策。
按照马尔可夫链的稳定条件:
将该股的收盘价格状态向量
,其中
代表上升,
代表持平,
代表下降,将状态转移矩阵P带入上述式中:
由矩阵乘积得方程组:
解方程组得:
、
、
。
可以看出,由稳定状态计算出的收盘价格状态概率值与
、
的递推公式所推导的结论一致,即该股最终以41.55%的可能性处于上升状态,以4.52%的可能性处于持平状态,以54.33%的可能性处于下降状态,因此从短期来看,投资者应该在所预测的9日前,抛出这只股票相对比较安全。
4.2. 以各日收盘价格状态区间为对象进行预测
仍以平安银行(SZ000001)的收盘价格资料为例,将45个交易日的收盘价价格区间由低到高依次划分为4个价格状态区间,每个区间长度为0.75个单位,得到区间状态为
、
、
、
,对数据进行统计可得下表3:
Table 3. Classified statistical table of stock price interval
表3. 股价区间分类统计表
整理数据得出不同状态区间的一步转移频数表4:
Table 4. Frequency table of one-step transfer
表4. 一步转移频数表
由表4统计可知,状态转移概率分别为:
,
,
,
,
,
得状态转移矩阵:
根据原始资料可知,第45个交易日收盘价格为14.55,属于S2状态,而后续无转移状态,所以假设其初始状态向量
。则由马尔可夫链预测第45个交易日收盘价格状态概率向量:
可知,第45个交易日在S2状态的概率最大,即5月09日的股票价格大概在14.35到15.10之间,而事实上第45个交易日收盘价格为14.55,的确处于所预测的区间,因此所预测的结果是正确的。如果利用稳定条件下的平稳分布,所预测的最终结果与上述递推方式结果相同。
5. 结论
运用马尔可夫链建立的股价分析模型对了解股价运动以及预测股价走势有很大的帮助,通过数据直观地了解一只股票的行情,避免了很多因盲目而造成的损失。本文利用马尔可夫链,在连续观察股票收盘价格的基础上,以划分价格状态和价格区间两种方式为对象建立马尔可夫模型,在对模型中股票的“马氏性”分析和股价分析的基础上,对股票的价格走势进行了分析和预测,通过将部分预测结果与实际资料对比发现,两种划分方式下建立的马尔可夫模型所预测的结果均能与实际结果较好吻合,很好地说明了在股价预测上,该模型运用的可行性。但股市波动是一个复杂的非线性系统,股票价格的变化受到多种因素的影响,其包括利率、汇率、通货膨胀率、行业前景、预期心理、国家政策以及突发事件如新冠肺炎疫情等各个方面 [5] 。而股票市场环境的微小变化就可能导致股票价格的大幅度波动,因此不存在绝对的变化规律,所以没有任何一种预测方法可以准确地预测出股价每日的变化,运用马尔科夫预测法也不例外。
此外,本文对于初始状态向量与状态转移概率的确定,是基于其在分析过程中保持稳定不变,如果忽视此条件,在时间上进行较大跨度的外推,可能会产生较大的误差,解决这一问题需要结合实际情况对初始状态向量与状态转移概率进行不断调整,从而提高预测的可信度。由于长期下状态转移概率将发生变化,使得大样本不一定能带来预测结果的高准确率,因此进行预测时,要注意针对不同的股票选取合适的样本容量。同时要注意的是,模型所预测的结果只表明预测对象未来将以某一概率趋向于某种状态,而不是绝对地处于这种状态,因此预测结果仅提供一个进行决策参考的依据,投资者需结合实际情况做出正确抉择,并不能一味地信赖或依靠该模型,股市有风险,投资需谨慎!
基金项目
安徽省教学研究项目资助(2016jyxm0136)。
NOTES
*通讯作者。