ARIMA模型在股价预测上的应用——以中国银行为例
Application of ARIMA Model in Stock Price Prediction—Taking Bank of China as an Example
DOI: 10.12677/MOS.2023.124308, PDF, HTML, XML,   
作者: 陈德慧:上海工程技术大学管理学院,上海
关键词: ARIMA模型股价短期预测ARIMA Model Stock Price Short-Term Forecast
摘要: 随着我国资本市场的扩大开放,国外资本进一步流入我国股市,中国股市迎来新的挑战与机遇。金融市场股票的价格预测问题再次成为公众关注的热点。基于此,选取金融市场股票的历史收盘价数据,以R为实现工具,通过建立ARIMA模型来进行分析与预测,为股市投资者提供帮助。
Abstract: With the expansion and opening up of China’s capital market, foreign capital further flows into Chi-na’s stock market, and China’s stock market faces new challenges and opportunities. The price pre-diction of stocks in financial markets has once again become a hot spot of public concern. Based on this, this paper selects the historical closing price data of stocks in the financial market, and uses R as the realization tool to analyze and predict by establishing ARIMA model, so as to provide help for stock market investors.
文章引用:陈德慧. ARIMA模型在股价预测上的应用——以中国银行为例[J]. 建模与仿真, 2023, 12(4): 3360-3365. https://doi.org/10.12677/MOS.2023.124308

1. 引言

股票市场在金融领域中一直有着举足轻重的地位。股票价格的波动能够在一定程度上反映一个国家经济周期的变化。近年来随着经济的发展和疫情的冲击,股票的价格再次引发了大家广泛的关注。韩金磊等采用长短期记忆网络(LSTM)和灰色模型对股价进行预测研究 [1] ;荆思寒等基于A股上市公司股票交易数据建立了股票风险传染模型 [2] ;左川等记录了深度学习在股票投资领域中的应用 [3] 。

股票是经济的晴雨表,无论是对于国家还是对于投资者来说股价预测都具有重要的意义 [4] [5] 。股票价格往往对时间因素非常敏感,因此本文建立ARIMA时间序列模型对短期股票价格进行分析与预测。

2. 模型的建立

2.1. ARIMA模型的定阶方法

ARIMA模型的定阶方法主要是通过观察自相关图和偏自相关图,根据其系数的相关特性来判断阶数。若AC是拖尾的,PAC是p阶截尾的,则选择AR(p)模型;若PAC是拖尾的,AC是q阶截尾的,则选择MA(q)模型;若AC和PAC都表现为拖尾性,则选择ARMA(p,q)模型,然后通过模型的参数检验,进一步判断p、q的阶数。

由于样本具有随机性,相关系数并不会表现出完美截尾的情况,通常会呈现出小值振荡的情况,这就给模型的定阶带来了一定的困难。根据以往的经验,如果样本自相关系数或偏自相关系数在初始的d阶明显大于两倍标准差范围,其后几乎95%的自相关系数都在两倍标准差范围内,并且由非零自相关系数衰减为小值波动的过程非常突然,这时可以视为自相关系数或偏自相关系数d阶截尾。

2.2. ARIMA模型建模步骤

构建ARIMA模型的大致步骤有以下几个:

(一) 序列的平稳性。首先,需要观察原序列是不是平稳的 [6] 。当原序列不是平稳的情况时,可以选择一些合理的方法让原序列变成平稳的,如差分转化。

(二) 模型的定阶。通过软件能够计算得出序列特征的自相关系数与偏自相关系数等。ARIMA模型的滞后阶数p和q再利用其他方法确定。

(三) 模型的构建。构建该模型的残差序列是否是正态分布的也值得关注。残差序列的自相关图以及偏自相关图可以观察得出其结论,或运用检验序列相关的方法来测试残差序列的随机性。

(四) 模型的预测。经过了上面的步骤后就大致拟合出了模型,并可以在未来的短期时间里进行股价的预测 [7] 。

3. 关于股票价格的预测

选取中国银行(601988) 2022年4月10日至2023年4月10日的股票日开盘价数据。基于ARIMA模型的建模理论,建立阶数p = 0,d = 1,q = 1的ARIMA(0,1,1)模型对中国银行未来三天的股票日开盘价进行预测 [8] 。

3.1. 平稳性检验

3.1.1. 时序图检验

图1的折线图大概可以推测出该序列数据可能并不是平稳的。因为股票的开盘价数据为原始数据,该数据在短期内波动是比较大的,在长期的时间序列中也没有遵循显著的规律 [9] [10] 。

Figure 1. Timing diagram of opening price of China Bank

图1. 中国银行开盘价时序图

3.1.2. 单位根(ADF)检验

为了更加精准得确认该序列是不是平稳的,对序列做ADF单位根检验。在显著性水平下,该序列的P值大于0.05,因此该时间序列的数据不是平稳的。

对原始数据的时间序列进行一阶差分处理后,将一阶差分后的数据再次进行ADF检验。序列的p值小于显著性水平0.05,因此推断出该序列属于平稳的时间序列。对于一阶差分后的数据再进行白噪声检验,该序列为非白噪声系列。综上,对以上结果分析该序列为平稳非白噪声序列。

3.2. 序列的自相关图和偏自相关图并识别模型

在对时间序列数据进行平稳性处理之后,需要利用ACF、PACF图,如图2图3所示来识别模型形式,并确定滞后阶数p、q的值。

观察样本自相关图和偏自相关图,如图2图3所示。由图2可知自相关系数除了滞后一阶的数值较大,其他数值均在两倍标准差范围内做小值随机波动,并且相关系数衰减的过程非常突然,所以可以判断自相关系数为一阶截尾。由图3可知,偏自相关系数缓慢衰减且过程相当连续,呈现拖尾性质。

综上,决定建立ARIMA (0,1,1)模型来预测该序列,即模型的阶数p = 0,d = 1,q = 1。但此推测仍然具有一些主观性,所以需要进一步检验来验证 [11] 。

3.3. 模型的拟合性检验

完成上述参数估计步骤后,最关键的步骤就是要对该拟合模型的残差序列进行正态性检验 [12] 。我们

Figure 2. ACF diagram of first-order differential data

图2. 一阶差分后数据的ACF图

Figure 3. PACF diagram of first-order differential data

图3. 一阶差分后数据的PACF图

在做序列拟合的时候,Y应该是X的函数。但是现实并没有那么友善,往往会出现一些奇奇怪怪的事让X与Y不符合这个函数。比如对身高的影响,一对双胞胎,从小一块长大,但是他们身高不可能完全一样。所以把这种只有上帝才知道怎么回事的变化叫做随机误差项,它本身就是随机的、不可预测的。

我们所做的模型中的残差就是对这个随机误差的估计,残差如果不是随机的,那说明残差中的一部分还是与预测变量有关系,需要再继续拟合。如果它是随机的就可以认为它是对随机误差比较好的拟合,就可以认为你的可确定部分X提取了所有的可预测部分,证明你的模型是把所有的X提取全了。我们对文中所建模型的残差序列进行正态性检验,发现其残差符合正态分布。表明所建模型拟合程度较好,可以较为准确地预测未知数据。

3.4. 对开盘价进行预测分析

下面利用所构建的ARIMA模型对中国银行股票的日开盘价进行预测。由于ARIMA模型短期内预测的结果较为精确,因此本文只是对股票价格做出短期限内的预测,即2023年4月11日至2023年4月13日的开盘价。如表1所示:

Table 1. Opening price and forecast price results

表1. 开盘价与预测价结果

通过表1可以观察到,利用这个模型预测的中国银行股票2023年4月11日至2023年4月13日的开盘价分别是3.43、3.46、3.49,误差比分别为0.0816、0.0809、0.0716。我们发现实际值与预测值之间的误差比是比较小的,根据上述数据进一步证实了此次构建的模型是准确的。

4. 结语与建议

本文对中国银行股票开盘价这一时间序列进行ADF单位根检验,绘制该序列的自相关图和偏自相关图。建立了阶数p = 0,d = 1,q = 1的ARIMA(0,1,1)模型对股票开盘价进行预测。由于ARIMA模型不能精确拟合股票价格的长期趋势,只适用于短期预测。于是我们运用该模型预测中国银行未来三天的股票开盘价 [13] 。模型预测中国银行股票2023年4月11日至2023年4月13日的开盘价分别是3.43、3.46、3.49。真实值与预测值的误差比分别为0.0816、0.0809、0.0716。误差比较小,因此所构建的股票开盘价预测模型合理。

文末,给资本市场一些建议。

4.1. 健全信息披露机制

我国市场存在十分典型的羊群效应。捕风捉影投资方式大量存在,即股民们根据从各个渠道收集来的内幕消息买进卖出股票。若程度过大就将造成市场极大的波动,股民们对市场失去信心势必会影响家庭资本结构的变化,同时内需也得不到刺激。健全信息披露机制可以防止股市环境恶化,促进投资者进行理性投资。

4.2. 加强证券市场化建设

在供给侧改性改革背景下,政府对证券市场的干预不能太大,但减少投机行为的产生也是在当下的实际情况中所必要的。充分发挥市场作用、加强市场化建设是相关部门需要进一步完善的。

4.3. 对投资者的理性教育

股市中的投资者以散户居多,这导致市场中跟风投资的现象比较明显,所以对投资者进行理性教育是必不可少的。投资者在买卖证券时应该基于其实际情况进行选择。

参考文献

[1] 韩金磊, 熊萍萍, 孙继红. 基于LSTM和灰色模型的股价时间序列预测研究[J/OL]. 南京信息工程大学学报(自然科学版):1-22.
https://kns.cnki.net/kcms/detail/32.1801.N.20230105.1635.003.html, 2023-04-20.
[2] 荆思寒, 王振山, 隋聪, 马天一, 任昭诺. 股票间的风险传染——基于对股价崩盘风险的预测[J]. 系统工程理论与实践, 2022, 42(11): 3090-3104.
[3] 左川, 王宇, 李振. 深度学习在股票投资中的应用[J]. 郑州大学学报(哲学社会科学版), 2022, 55(2): 56-62.
[4] 周章元, 何小灵. 基于优化LSTM模型的股价预测方法[J]. 统计与决策, 2023, 39(6): 143-148.
[5] 王瑶, 冯晓晴, 侯德帅. 企业数字化转型能提高分析师预测准确度吗?——基于信息披露和信息挖掘的双重视角[J/OL]. 中南财经政法大学学报: 1-14.
https://doi.org/10.19639/j.cnki.issn1003-5230.20230130.003, 2023-04-12.
[6] 黄宇漩, 杨胜刚, 陈收, 朱琦. 证券分析师关注与投资-股价敏感性[J]. 系统工程理论与实践: 2023, 43(4): 1022-1043..
[7] 林虹, 张永, 杨兴雨, 黎嘉豪. 考虑组合预测股价的泛证券投资组合选择策略[J/OL]. 管理工程学报: 1-12.
https://doi.org/10.13587/j.cnki.jieem.2023.05.011, 2023-04-12.
[8] 王满, 张苗苗. 考虑高维宏观信息的波动率与股票价格预测[J]. 统计与决策, 2022, 38(20): 138-143.
[9] 牛桂草, 周绩宏, 马红燕, 杜晓东, 王俊芹. 基于ARMA模型的河北鸭梨价格预测及预警[J]. 山东农业科学, 2021, 53(11): 151-156.
[10] 王冠智, 粟晓玲, 张特, 姜田亮, 褚江东. 基于DWT-WFGM(1,1)-ARMA组合模型的农业用水量预测[J]. 灌溉排水学报, 2021, 40(11): 106-114.
[11] 黄卫, 刘升. 基于长期线性趋势的时间序列建模研究[J]. 统计与决策, 2021, 37(2): 30-33.
[12] 冯盼, 曹显兵. 基于ARMA模型的股价分析与预测的实证研究[J]. 数学的实践与认识, 2011, 41(22): 84-90.
[13] 谢赤, 喻欣欣, 李双飞. 双重上市公司A+H股价差时间序列描述与趋势预测[J]. 当代财经, 2008(5): 57-60.