1. 引言
在当前的金融科技时代,大数据和人工智能的应用正在革新股票市场分析和预测的方法。传统统计模型[1]与现代深度学习技术[2]的结合不仅提高了预测的精度,还加深了我们对市场动态的理解。对于股票价格预测[3]而言,不同算法的应用已经成为提升预测效率和准确性的关键。
在国际研究领域中,已有多篇论文展示了深度学习在股票市场预测中的有效性。例如,Urvashi Rahul Saxena等人[4]通过研究印度三大酒店股票在COVID-19期间的价格,显示了ARIMA和LSTM模型的强大预测能力。此外,S. Usmani等人[5]发展了一种基于加权分类新闻的LSTM股票预测模型(WCN-LSTM),该模型结合股票收盘价、交易量及各类新闻情感评分,展示了利用多源数据增强预测效果的潜力。
更进一步,Y. Ma等人[6]提出了一个多源聚合分类模型(MAC),该模型利用新闻嵌入、图卷积和双向长短期记忆网络(BiLSTM),为买卖点预测提供了新的视角。而Kinjal Chaudhari等人[7]在他们的研究中采用了k-means聚类和Top-M方法优化特征选择,通过BPNN,LSTM,GRU,CNN等模型处理多样化的市场数据,如开盘价、收盘价和技术指标等,进一步验证了深度学习在股票市场分析中的实用性。
此外,J. Zhang等人[8]将CNN和BiLSTM结合,并引入注意力机制,通过这种混合模型有效提取了股票数据的时间序列特征,从而提升了预测准确性。M. Lu等人[9]则设计了一个时间序列循环神经网络(TRNN),通过滑动窗口技术和数据压缩等方法改善了模型的运算效率和预测性能。K. Chaudhari等人[10]创造性地提出了将连续时间序列值转换为离散值的方法,用于股票预测研究。
这些研究不仅展示了各种机器学习模型在处理日线数据时的有效性,也为本研究提供了坚实的理论基础。本研究旨在进一步探索这些模型在高时间密度数据上的应用效果,特别是考察ARIMA、LSTM、RNN和CNN等模型在处理中信海直(股票代码:000099)的1分钟、15分钟和日线数据时的预测准确性。通过这一研究,我们期望揭示更细粒度时间尺度下股价预测的动态变化和潜在的预测优势,为投资者和市场分析师提供更精确的数据支持,从而做出更为明智的投资决策。
2. 方法
2.1. 数据来源与预处理
数据集由东方财富Choice金融终端中下载,包括中信海直(股票代码:000099) 2024年3月20日到4月15日1分钟交易数据4080条、2023年4月17日到2024年4月15日15分钟交易数据3856条以及日交易数据241条。数据特征包括开盘价、最高价、最低价、收盘价、涨跌额、涨跌幅、成交量、成交额及均价。其中,1分钟数据和十五分钟数据的开盘价和收盘价分别指该时间段开始时的价格和改时间段结束时的价格。数据预处理主要包括对。空值的填充,对不方便处理的字符的替换。
2.2. 模型介绍与参数设置
2.2.1. 自回归积分滑动平均模型(ARIMA)
ARIMA模型(自回归积分移动平均模型)是分析时间序列数据的标准方法,适用于预测具有时间依赖性的数据。本研究通过以下步骤使用ARIMA模型:
首先,时间序列的平稳性是应用ARIMA模型的前提,使用增强Dickey-Fuller(ADF)测试来检验序列的非平稳性,其计算公式如下:
(1)
其中,∆yt表示序列的差分,
是白噪声误差项。
此外,ARIMA模型的一般形式为
,其中p是自回归(AR)项的阶数,d是差分的次数,确保数据的平稳性,q是移动平均(MA)项的阶数。
自回归AR(p)的模型表达如下:
(2)
移动平均部分MA(q)的模型表达式如下:
(3)
其中,
和
分别是自回归和移动平均的多项式,L是滞后算子,
是时间序列的均值,At是白噪声。
最后,使用赤池信息准则(AIC)评估不同模型的效果,选择AIC值最小的模型,以确保模型的优越性与拟合效果。AIC的计算公式为:
(4)
其中,k是模型参数的数量,L是似然函数的最大值。
2.2.2. 递归神经网络(RNN)
递归神经网络(RNN)是一种适用于处理序列数据的神经网络,其独特之处在于网络能够在内部维持一个状态(或记忆),该状态允许网络根据先前的信息来影响当前的输出。RNN特别适合于时间序列数据分析,能够捕捉时间动态特性。
RNN模型由输入层,隐藏层和输出层构成。其中,输入层(x)在每个时间步t,网络接受输入Xt。隐藏层(h)由递归单元构成,其状态更新表达式为:
(5)
其中,ht是时间步t的隐藏状态,
和
分别是隐藏状态和输入到隐藏层的权值矩阵,
是偏置项,
是激活函数。
输出层的计算公式为:
(6)
其中,ot是时间步t的输出,Who是从隐藏层到输出层的权值矩阵,bo是偏置项。
RNN通过反向传播算法进行训练,特别是通过时间的反向传播(BPTT),这涉及到计算每个时间步的梯度并更新所有共享参数W和b。为了提高训练效率,采用序列到序列的训练方式,每个时间步的输出和目标值之间的误差都被计算并反向传播,这样可以在每个时间步向网络提供反馈,加快梯度下降过程。取批大小为32,学习率为0.01,激活函数选择tanh,使用Adam作为优化器。
2.2.3. 长短期记忆神经网络(LSTM)
长短期记忆网络(LSTM)是一种特殊类型的递归神经网络,能够学习和记忆长期依赖关系,特别适合处理和预测时间序列中间隔和延迟较长的重要事件。
LSTM模型由遗忘门、输入门、单元状态和输出门组成。这些组件共同作用,使得LSTM能够在避免传统RNN中梯度消失或爆炸问题的同时,有效地处理序列数据。
其中,遗忘门的计算公式为:
(7)
输入门的计算公式为:
(8)
(9)
其中,it是输入门的输入,
是侯选单元状态,
和
分别是输入门和候选单元状态的权值矩阵,
和
是偏置项。
单元状态更新的计算公式为:
(10)
其中,
是当前单元状态,
是前一个时间步的单元状态。
输出门的计算公式为:
(11)
(12)
其中,ot是输出门的输出,ht是当前时间步的隐藏状态,Wo是输出门的权重矩阵,bo是偏置值。
LSTM的训练包括使用反向传播通过时间(BPTT)算法来更新网络的权重。取学习率为0.01,批大小为32,优化器选用Adam用于自动调整学习率。
2.2.4. 卷积神经网络(CNN)
卷积神经网络(CNN)广泛应用于图像和视频处理,其结构也被成功应用于时间序列数据分析,如股票价格预测。CNN特别适合处理这类序列数据,因为它可以有效地提取时间序列的局部特征。
CNN模型由输入层、卷积层、池化层、归一化层和全连接层组成。
其中,卷积层的计算公式为:
(13)
其中,z[i]是输出特征图的第i个元素,x是输入数据,W是卷积核权重,M是卷积核的大小,b是偏置值,ReLU是激活函数。
池化层的计算公式为:
(14)
其中,y[j]是池化操作后的输出,K是池化窗口的大小,j是输出的索引。
全连接层的计算公式为:
(15)
其中,O是最终的输出,W是权重矩阵,y是扁平化后的特征向量,b是偏置项,σ是激活函数。
此外,使用WaveNet架构增强了CNN在处理时间序列数据时的能力,通过使用具有不同膨胀率的卷积层来学习不同时间尺度的数据模式:
膨胀卷积层的计算公式为:
(16)
其中,d是膨胀率,允许网络捕获更长范围内的时间依赖性。
CNN的训练参数卷积核大小M从2开始,d在WaveNet中逐层增加,K可选,用于降维,学习率为0.01,使用Adam作为优化器。
3. 模型结果与分析
本研究涉及四种不同的预测模型:ARIMA、CNN、LSTM和RNN,用以预测中信海直股票价格。这些模型被应用于1分钟、15分钟及日线数据的时间序列分析中,目的是捕捉不同时间尺度上的价格动态,并评估不同时间频率的数据在各模型预测上的差异,从而判断对于股票预测更适合用何种数据。
针对每种时间尺度(1分钟、15分钟、日线),本文生成了预测结果与实际值的对比图。这些图表直观展示了各模型的预测准确度,并帮助分析模型在特定时间尺度上的表现差异。
对于1分钟数据,预测结果如图1所示。
从图中可以明显看出,ARIMA模型在1分钟数据上的预测效果明显逊色于LSTM、RNN和CNN模型。对于这种高粒度的时间序列,三种深度学习模型显示出较高的预测匹配度。
15分钟数据的预测结果与实际值的对比如图2所示。
图中反映出,随着预测时间跨度的增加,CNN模型在记忆长期依赖性上的不足逐渐显现,导致预测效果下滑,而LSTM和RNN模型继续展现出较高的预测准确性。特别是LSTM,在处理较长时间序列数据时,其优越的时序信息处理能力得到了突出体现。
日线数据的预测结果与实际值的对比如图3所示。
结果显示,尽管ARIMA模型常用于时间序列预测,其在股票价格预测上的表现却远不如深度学习模型。对于数据密度较低的日线数据,CNN模型的预测性能进一步下降,而LSTM模型则明显展示出其处理时间序列的强大能力。图中可见,LSTM模型的预测结果与实际值紧密贴合,显示了其优异的性能。RNN模型的表现则介于CNN和LSTM之间。
此外,本文还记录了LSTM、ARIMA、RNN和CNN模型在训练过程中的评估指标,包括均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2),结果如表1所示。
Figure 1. 1-minute comparison between the predicted results of each model and the actual results
图1. 1分钟各模型预测结果与实际结果对比图
Figure 2. 15-minute comparison between the predicted results of each model and the actual results
图2. 15分钟各模型预测结果与实际结果对比图
Figure 3. Comparison between the predicted results of each model and the actual results
图3. 日线各模型预测结果与实际结果对比图
Table 1. Summary of model evaluation indicators
表1. 模型评估指标汇总表
|
RMSE |
MAE |
R2 |
1 min LSTM |
0.086 |
0.055 |
0.97 |
1 min ARIMA |
1.732 |
1.659 |
−11.028 |
1 min RNN |
0.093 |
0.058 |
0.966 |
1 min CNN |
0.089 |
0.115 |
0.968 |
15 min LSTM |
0.205 |
2.546 |
0.994 |
15 min ARIMA |
3.491 |
2.546 |
−0.711 |
15 min RNN |
0.205 |
0.116 |
0.994 |
15 min CNN |
0.638 |
0.426 |
0.943 |
daily LSTM |
0.806 |
0.606 |
0.901 |
daily ARIMA |
3.424 |
2.492 |
−0.709 |
daily RNN |
0.832 |
0.56 |
0.893 |
daily CNN |
1.462 |
1.015 |
0.67 |
在综合分析中信海直不同时间尺度(1分钟、15分钟、每日)上的股票价格预测结果时,可以观察到几个关键趋势:
(1) 深度学习模型与ARIMA模型的比较:实验数据显示,在所有考察的时间尺度上,基于深度学习的模型(LSTM、RNN、CNN)均明显优于传统的ARIMA模型。这一结果突出了深度学习模型在捕捉股票市场时间序列的非线性特征和复杂动态中的优势。
(2) 各模型在不同时间尺度上的表现:
1分钟数据:在最短的时间尺度上,LSTM和RNN显示了接近的高性能,明显优于ARIMA模型,有效预测了即时的价格波动。CNN虽然在决定系数R²上略低于LSTM和RNN,但其表现也明显优于ARIMA模型。
15分钟数据:在中等时间尺度上,LSTM和RNN继续表现出色,突显了它们在捕捉稍长时间周期的价格动态中的能力。尽管CNN的表现略有下降,它仍然优于ARIMA模型。
日线数据:在更长的时间尺度上,LSTM的性能尤其突出,R2值达到0.901,显著超过ARIMA模型。CNN和RNN尽管表现略逊于LSTM,但仍能展现出捕捉趋势的能力。
(3) ARIMA模型的局限性:在所有时间尺度上,ARIMA模型的表现均不理想,其R2值在多数情况下为负,这凸显了其在处理复杂的金融时间序列数据时的局限性。
(4) 模型选择建议:基于上述分析,LSTM和RNN是处理短期市场动态,尤其是在需要频繁和精准预测的场景中的理想选择。对于从大量历史数据中提取复杂模式的需求,CNN虽然在某些情况下表现下降,但在处理高频数据时的潜在优势仍不容忽视。
4. 总结
在本研究中,我们比较了ARIMA、LSTM、RNN和CNN四种模型在不同时间尺度(1分钟、15分钟和每日)上预测中信海直股票价格的效果。分析结果突显了高频数据(如1分钟和15分钟)在预测时提供了更多信息,使得模型能够更准确地捕捉市场的短期动态,从而显示出更好的预测效果。在所有考察的时间尺度中,基于深度学习的模型(LSTM、RNN和CNN)均优于传统的ARIMA模型,尤其是在捕捉复杂金融时间序列中的非线性依赖和动态变化方面表现出色。
特别是在短期预测方面,LSTM和RNN在1分钟和15分钟数据上显示出极高的适应性和精确性,明显优于ARIMA模型。CNN在处理1分钟数据时也表现良好,尽管在更长时间尺度的15分钟数据上表现略有下降,但仍然显著优于ARIMA模型。这进一步证实了在高频交易和短期市场分析中,使用深度学习模型能够提供更精确的预测。
与此同时,ARIMA模型在所有时间尺度的表现均不理想,尤其是在高频数据预测中的不足更为显著,这可能是由于其无法有效捕捉数据中的非线性依赖和快速变化。因此,这些发现强调了在金融市场预测中选择合适的模型的重要性,尤其是对高频数据进行准确预测的能力。对于需要捕捉短期市场动态的应用,推荐使用LSTM或RNN,而在需要从大量历史数据中提取复杂模式的场景中,综合使用多种深度学习模型将更为合适。这种方法不仅能为市场参与者提供更精确的决策支持,还有助于减少投资风险并增加潜在收益。
基金项目
感谢中国交通教育研究会2022~2024年度教育科学研究课题资助。
NOTES
*通讯作者。