1. 引言
1.1. 研究背景
随着金融市场的快速发展,股票价格波动的预测成为投资者和研究者关注的焦点。股价预测不仅影响投资决策,还对风险管理和金融产品定价具有重要作用。然而,股票市场受多种因素的影响,其价格波动具有高度的复杂性和不确定性,传统的统计方法在预测精度和适应性方面存在一定的局限性。
近年来,随着人工智能和机器学习技术的迅猛发展,神经网络、深度学习等方法在金融数据分析和预测中得到了广泛应用。特别是BP (反向传播)神经网络由于其强大的非线性建模能力,成为股价预测领域的一种重要工具。然而,BP神经网络在应用中常遭遇局部最优陷阱和缓慢的学习速度,这对其性能产生了负面影响。为克服BP神经网络的局限性,本研究引入了灰狼优化算法(GWO),通过GWO对BP神经网络的初始权重和偏置进行优化,从而提出一种基于GWO-BP神经网络的招商银行股价预测模型。该模型旨在提高股价预测的准确性,并为投资者提供更为科学的决策依据。本文的创新之处在于,传统BP神经网络模型对于股价预测方面存在着一些本身模型自带的权值与阈值优化问题,使得其最终的预测结果可能会存在较大的误差性,而本文结合灰狼优化算法与BP神经网络模型,对其网络性能以及其预测的准确度有了较大的提升,并且提高了BP神经网络模型的预测效率。
1.2. 股价预测方法
股价预测一直是金融领域的研究热点,国内外学者对此进行了广泛的研究。常规的股票价格预测手段涵盖了时间序列的处理(例如ARIMA模型)以及统计回归的分析等策略。这些方法虽然在一定程度上能够解释股价波动,但往往难以捕捉股票市场的非线性特征。
随着计算能力的提升,神经网络和深度学习逐渐成为股价预测研究的主流。BP神经网络由于其能够模拟复杂的非线性关系,被广泛应用于金融预测领域。然而,BP神经网络在参数初始化上的依赖性较强,常常会陷入到局部的最优状态,进而影响其预测的准确性。近年来,针对BP神经网络局限性的改进方法层出不穷,其中,结合群智能算法(如遗传算法、粒子群算法等)优化BP神经网络成为一大趋势。灰狼优化算法(GWO)作为一项新颖的群智能优化技术,凭借其操作简便、全局搜索能力卓越等优势,在多领域优化问题中得到广泛应用。
1.3. 研究内容
介绍BP神经网络的基本原理及其局限性,详细阐述灰狼优化算法的原理及其在优化问题中的应用,随后构建一个融合GWO-BP神经网络的股票价格预测系统。基于GWO-BP神经网络模型,对招商银行股价进行预测。包括数据预处理、模型训练、参数优化以及实验结果的分析与评价。总结研究成果,探讨GWO-BP神经网络模型在股价预测中的应用前景及未来研究方向。
从公开数据源中收集招商银行2022年1月4日到2024年8月31日的历史股价日度数据,执行数据清洗、标准化等前期处理步骤,以保障数据准确性和模型训练的品质。利用BP神经网络模型对股价进行初步预测,并引入灰狼优化算法对模型参数进行优化,形成GWO-BP神经网络模型。利用过往数据对该GWO-BP神经网络模型进行训练,并利用测试数据集评估模型的预测精度和稳定性。与传统的BP神经网络模型进行对比分析,验证GWO-BP模型在预测精度和训练效率方面的优势。
2. 理论基础与模型介绍
2.1. BP神经网络模型
2.1.1. 机器学习预测模型的定义
机器学习模型通过学习量化训练集中数据样本的特征值和标签值之间的关系,而具备对未来数据的预测能力[1]。单变量回归模型指仅用时间序列自身作为变量的回归模型,时间序列是指以恒定的采样频率按时间顺序采集到的一组观测数据[2] [3]。遍历理论(Ergodic theory)认为一维时间序列被视作是捕捉系统动态变化中所有变量轨迹的集合,它内含了系统的众多关键信息[4]。恰当的分析手段能够从系统内部挖掘出潜在的信息。作为人工智能及数据科学领域的关键技术,机器学习通过从经验中学习,自发地构建起“输入”与“输出”间隐含的驱动函数关系,进而形成计算模型。随着机器学习技术的诞生,它为当今社会各领域注入了强劲的动力。按照算法的作用差异,机器学习可以被归类为回归、分类、聚类、维数缩减以及集成等多种类型。这一技术的理论与应用在诸如医疗卫生、计算机图像处理、声音辨识以及网络搜索工具等多个行业实现了显著的成就。
2.1.2. BP神经网络的原理
BP神经网络作为一种多层级的前馈网络,其核心优势在于利用误差的逆向传播机制来优化权重与偏差,进而降低预测偏差。该网络结构一般涵盖输入层、若干隐藏层以及输出层。经过训练过程,BP神经网络可以掌握复杂的非线性映射,在函数逼近、模式识别和时间序列预测等领域得到了广泛应用。在BP神经网络的学习过程中,首先通过前向传播计算网络输出,然后通过反向传播算法计算误差,接着利用反向传播技术来估算误差大小,并依此误差来优化网络的权重参数。在反向传播技术中,一般使用梯度下降策略,以最小化误差函数为目标。传统的BP神经网络架构由层数、每层的神经元数量和激活函数等组成。详细可见图1所示。
层数:传统的BP神经网络是一个由三层组成的人工神经网络结构,包括输入层、隐含层和输出层。隐含层的主要作用是提升模型的泛化能。
每层中的神经元数量:在输入层,神经单元的个数与输入数据的特征维度相同。至于隐藏层,其神经单元数目一般会比输入层多,以提高收敛性,其计算方法为输入层神经元数量与输出层神经元数量的乘积再平方。输出层的神经元数量与网络的输出参数数量一致。
神经激活机制:Sigmoid函数因其非线性属性及易于求导的特性,在神经网络中广泛用于隐藏层与输出层的激活操作。随着神经元净输入从负转正,Sigmoid函数的输出将在0至1的区间内连续变动。
Figure 1. BP neural network topology
图1. BP神经网络拓扑结构
2.1.3. BP神经网络的优势与局限性
BP神经网络之所以备受青睐,主要得益于其卓越的非线性拟合特性,这使得它在应对繁杂的多因素问题时游刃有余。同时,该网络还拥有自我调整的能力,能够通过持续优化网络参数来提升预测的准确性[5]。然而,BP神经网络也存在一些局限性,如容易陷入局部最优解、训练速度慢以及对初始权重和学习率较为敏感等。这些局限性在某些复杂应用场景中会限制BP神经网络的实际应用效果。
2.2. 灰狼优化算法(GWO)
2.2.1. GWO算法的原理
受自然界中灰狼捕食行为的启迪,灰狼优化算法作为一种集体智能优化手段[6],在全局搜寻与迅速收敛能力上具备突出表现,它依据灰狼群体的狩猎活动构建了一种智能优化策略。这项算法由Mirjalili等人于2014年提出,模拟了灰狼捕猎过程中围攻、追捕和捕获猎物的行为。GWO算法通过对灰狼个体进行分类(领导狼
、
、
和跟随狼
) [7],并通过动态调整每个狼群个体的位置来实现全局最优解的搜索。GWO算法的核心思想是通过模拟捕猎过程中的追踪与包围行为来寻找最优解[8]。通过三种关键行为(包围、追踪和攻击),GWO能够有效地平衡全局搜索与局部搜索,从而提高优化算法的性能。
设X为狼的位置,XP为猎物的位置,DP为猎物与某只狼之间的距离,每只狼围捕猎物时的位置更新方式为:
其中,
是当前的迭代次数,
和
是由上式计算的系数向量。
其中,
、
是随机数,
,
是过渡参数,在迭代过程中从2线性递减为0,
是算法的最大迭代次数。在搜寻最优解(即可视作猎物的坐标)的过程中,由于对最佳解的具体位置一无所知,便假定那些距离猎物较近的
、
、
三类狼对猎物的藏身之处有更准确的把握。基于这一假设,
类狼便依据
、
、
狼的判断来不断调整自身的位置,以期成功追踪并捕捉猎物,位置更新公式如下:
,
,
分别对应
、
、
狼。
2.2.2. GWO算法的优化特性
GWO算法具有良好的全局搜索能力和收敛性能,能够在多维搜索空间中找到最优解。与传统启发式算法相比,GWO具有参数少、收敛速度高和计算成本低等优点,已广泛用于聚类、分类、回归和其它函数优化任务[9]。自2014年Mirjalili等提出GWO算法以来,其应用一直没有停止过,首次发表的GWO文章在短时间内被引用了5600多次。
也有大量的学者尝试对GWO算法进行改进,算法寻优能力得到不同程度的提升[10]。与其他群智能算法相比,GWO具有较强的探索与开发能力,在处理复杂优化问题时表现出色。此外,GWO算法参数设置简单,易于实现,适合于多种不同类型的问题场景。首先,对参数进行初始化操作,包括设定灰狼群体的数量以及个体的维度,同时标定搜索区域的界限,规定最大迭代次数,并随机生成种群成员的初始坐标。接下来,进行适应度评价,通过计算每只灰狼(即神经网络的权重与阈值)的表现来评估其适应度。在此基础上,挑选出适应度最高的三只灰狼作为群体的引导者。然后,进行位置更新,剩余的灰狼依据引导者的坐标来调整自身的位置(即对权重和阈值进行调整)。这个过程不断重复,包括评估、筛选和位置更新,直到达到迭代终止的条件如图2中所示过程。最后,将表现最优的灰狼的位置数据作为BP神经网络的最终权重配置。
Figure 2. Flowchart of GWO optimized BP neural network
图2. GWO优化BP神经网络流程图
2.3. GWO-BP神经网络模型
2.3.1. GWO-BP模型的构建
GWO-BP神经网络模型结合了GWO算法与BP神经网络的优点,通过使用GWO算法优化BP神经网络的初始权重和偏置,以提高网络的全局搜索能力和收敛速度。具体来说,在模型构建过程中,首先利用GWO算法对BP神经网络的初始参数进行优化,然后再通过BP算法进行反向传播训练。此策略显著解决了传统BP神经网络易于陷入局部最优解的问题。
2.3.2. GWO对BP神经网络的改进
通过将GWO算法与BP神经网络相结合,GWO-BP模型能够在初始阶段通过全局搜索找到更加合适的初始权重和偏置,从而提高BP神经网络的收敛性能。与传统的BP神经网络相比,GWO-BP模型在处理非线性问题时表现出更高的精度和更快的收敛速度。此外,GWO的引入减少了BP神经网络对初始条件的敏感性,使得模型在复杂的金融数据预测中具有更强的鲁棒性。
3. 数据处理
招商银行2022年1月1日到2024年8月31日股票数据预处理模块主要包括数据缺失值处理、异常值处理,数据标准化处理,数据的划分(即训练集、验证集和测试集之间的比例设定)等。
各输入特征通常含有不同的量纲与数量级,若直接利用这些原始特征,则会导致规模较大的特征占据主导地位,同时弱化规模较小的特征影响。所以,在构建模型之前,必须对原始数据进行规格化处理。常用的规格化手段包括基于离差的方法和基于均值的方法两种类型,本次研究选择应用基于离差的标准化的方式,见下式。
其中,
为归一化值,
为输入的样本值,
和
为样本的最大值和最小值。
预测结束后,模型输出的预测结果需进行反归一化处理,见下式,其中
代表预测取值,
为最终的预测值。
4. 实证分析及结论
4.1. 数据来源
本文使用招商银行股票2022年1月4日到2024年8月31日共646条数据进行了实证分析,这些数据涵盖了股票的基本价格信息,包括但不限于开盘价、最高价、最低价、成交量和收盘价,并对这些数据进行了一系列预处理工作。在构建模型时,本研究以开盘价、最高价、最低价、成交量作为输入特征,而将收盘价作为预测模型的输出目标。
在构建股价预测模型前,对股票数据进行了细致的预处理。这包括执行描述性统计分析以揭示数据的基本趋势,检查并处理缺失值以确保数据完整性,以及识别和剔除异常值以避免模型训练偏差。此外,通过归一化处理,我们统一了数据尺度,为模型训练准备了标准化的数据集。分析结果显示,目标股票的收盘价相对稳定,主要波动区间在26.82至52.76元,这为我们的模型提供了初步的市场行为理解。
4.2. 模型评估
当训练10次左右损失函数趋于稳定,减小的速度变缓(见图3)。
Figure 3. Optimal parameter model training set test set loss plot
图3. 最优参数模型训练集测试集损失曲线图
4.3. 评估指标与结果
分析工具涵盖可解释变异比率、平均绝对偏差、均方偏差、R²系数等关键参数。
从表1中观察,采用GWO算法优化的BP神经网络在股价预测模型中的R²系数高达0.9984,在测试集上的表现也相当出色,达到了0.9930。R²系数,即决定系数,用于评估模型的适配度,此处R²系数为0.9984意味着模型能够捕捉到目标变量约99.84%的变异,显示出模型在预测方面的卓越表现。
训练集均方误差为0.0550,测试集均方误差为0.0246。均方误差(Mean-Square Error,MSE)是衡量模型预测误差的指标,测试集均方误差等于0.0246,表示模型的平均预测误差较小。
数据集的平均平方误差在训练阶段为0.4818,而在验证阶段仅为0.0246。衡量预测准确性的关键指标——平均绝对百分比误差(MAPE),其测试阶段的数值为0.0246,揭示了模型预测的精确度相当高。
由图4可知,GWO优化BP神经网络的训练集预测值和真实值非常接近,并且预测值与实际值之间的偏差大多分布在正负0.2的范围内,这说明模型的训练效果非常好。
Figure 4. GWO-BP prediction model training set predicted and true value results
图4. GWO-BP预测模型训练集预测值和真实值结果
Table 1. Results of GWO-BP evaluation indicators
表1. GWO-BP评价指标结果
|
训练集 |
测试集 |
MAPE |
0.4818 |
0.3811 |
RMSE |
0.2345 |
0.1567 |
NRMSE |
0.0397 |
0.0843 |
MSE |
0.0550 |
0.0246 |
R2 |
0.9984 |
0.9930 |
MAE |
0.1761 |
0.1233 |
4.4. 真实值与预测值对比图
在本次实验中,我们选取了总数据量的30%,即161条记录,作为测试样本,对股票的实际收盘价与基于GWO-BP神经网络的预测值进行了对比分析,具体结果如图5所示。
观察图5,我们可以明显看到股票的实际收盘价与GWO-BP神经网络预测的曲线几乎完全一致,这充分表明了GWO-BP神经网络在预测股票收盘价方面的准确性和有效性,其预测结果对于投资者而言具有极高的参考价值。
Figure 5. Results of predicted and true values of the test set of GWO-BP prediction models
图5. GWO-BP预测模型测试集预测值和真实值结果
5. 结论
本研究利用灰狼优化策略对BP神经网络的回归参数进行了深度优化,并深入分析了不同隐层节点数对模型性能的具体影响。研究发现,经过优化的神经网络模型在预测能力上有了显著提高,特别适用于商品市场预测。尤其在股市领域,能够较为精确地预测股价的波动,这不仅有助于投资者形成高效的投资计划,也有利于维护资本市场的稳健发展。基于此,本文得出以下三个主要结论:
(1) 模型优化与应用:运用GWO算法对BP神经网络进行参数调整,探讨了不同隐层结构对模型性能的影响,最终构建了效果良好的回归模型。
(2) 实际应用效果:提出的模型在预测效果上表现优异,可有效应用于日常产品的预测,提供了稳定的预测结果。
(3) 股票预测的价值:精确预测股价波动对于投资者制定盈利策略极为关键,有助于维护资本市场的稳定运行。因此,开发高精度且稳定的股价预测模型具有显著的实际意义。