1. 引言
在电子商务的发展过程中,企业所面对的金融风险也越来越多。为有效应对这些风险,保障电商企业的稳健运营,智能预测方法应运而生。在现有的研究中,文献[1]通过引入去噪机制,有效提高了模型的鲁棒性和泛化能力,从而在财务风险预测任务中取得了较为理想的效果。然而,尽管SDAE网络在处理非线性问题时具有强大的能力,但其预测更新能力仍存在一定的不足。这主要体现在模型在面对新的、未知的财务风险因素时,难以迅速适应并作出准确的预测。文献[2]提出了另一种财务风险预测方法。该方法利用直觉时间模糊序列理论,将模糊数学与时间序列分析相结合,对财务风险进行量化评估。该方法在处理不确定性和模糊性方面具有独特的优势,能够更为准确地捕捉财务风险的变化趋势。然而,直觉时间模糊序列模型在预测更新能力方面同样存在局限性。当市场环境或公司财务状况发生显著变化时,模型需要较长的时间来重新学习和适应新的数据模式,这可能导致预测结果的滞后和不准确。为提高电商财务风险智能预测更新能力,本文旨在探讨一种基于改进BP (反向传播)神经网络的电商财务风险智能预测方法,以期为企业提供一个更为精准、高效的财务风险预测工具。BP神经网络作为一种经典的机器学习算法,已经在多个领域展现出强大的学习和预测能力。本文在深入研究BP神经网络的基础上,提出了一系列改进措施,以提高其在电商财务风险预测中的性能。本文所提出的基于改进BP神经网络的电商财务风险智能预测方法,不仅具有较高的预测精度和稳定性,而且具有较强的适应性和可扩展性。该方法能够为企业提供一个有效的财务风险预测工具,保障企业的稳健运营。
2. 选取电商财务风险指标
在构建电商财务风险预测模型之前,首要任务是选取合适的财务风险指标。这些指标应当能够全面反映电商企业的财务状况和风险水平。通过深入研究电商行业的特性和市场环境,可以识别出与财务风险密切相关的关键指标,为后续的数据处理和模型建立提供基础。
在选取电商财务风险指标时,不仅要考虑指标的全面性和代表性,还需要关注数据的可获得性和质量。这是因为模型训练需要基于大量的历史数据,而数据的准确性和完整性将直接影响模型的预测效果。根据目前国内上市公司的实际财务状况,并对有关数据的可获得性进行了全面的考虑,构建电商财务风险指标体系如图1所示。
Figure 1. Financial risk indicators of e-commerce
图1. 电商财务风险指标
图1展示了本文所选取的电商财务风险指标。在选取过程中,特别注意排除了因公司财务报告披露需求改变而造成的数据形式不尽相同的数据指标,以确保数据的准确性和一致性[3]。
通过对这些关键电商财务风险指标的分析和评估,可以全面了解电商企业的财务状况和风险状况,为企业的战略决策和风险管理提供有力支持。同时,这些指标数据也将作为改进BP神经网络模型的输入,通过模型的训练和优化,进一步提高财务风险预测的准确性和效率。
3. 指标数据预处理
在选定了电商财务风险指标之后,需要对收集到的指标数据进行预处理。数据预处理是确保模型准确性的重要步骤,通过预处理消除数据中的噪声和错误,提高数据的质量,为后续模型的训练和应用打下坚实的基础。
由于各个指标的量纲不统一以及数据存在缺失和异常,所以需要先进行数据归一化,以及补全缺失值和去除异常值。
当指标中存在较大数量的缺失数据时,本文利用KNN内插的方法来处理缺失值,以最大限度地保持原有的信息。对于含有缺失值的特征,找到在特征空间中与该样本最接近的K个样本(这些样本在其它特征上的值已知),然后使用这K个最近邻样本的相应特征值来估计或插值缺失值[4]。对于每一个含有缺失值的样本,在其非缺失特征上计算与其他样本的距离(如欧氏距离),找到距离
最近的K个样本,记为
。对于
中的每一个缺失值
,使用
中对应特征的值进行插值[5]。则计算公式如(1)所示:
(1)
其中,
表示第k个最近邻样本在第j个指标上的值。将插值后的值替换原始数据集中的缺失值,得到更新后的数据集。异常值通常指的是在数据集中与其他数据明显不同的观测值,其可能是由于数据录入错误、测量误差或真正的异常事件导致的。异常值的存在可能会对模型的训练产生负面影响,导致预测结果不准确或模型性能下降。因此,必须采取合适的方法来识别和处理这些异常值[6]。在本文中,选择使用统计方法IQR (四分位距)规则来识别异常值。IQR规则是一种基于数据分布的方法,其通过计算数据的上四分位数(Q3)和下四分位数(Q1)之间的差值来确定一个合理的范围,然后将超出这个范围的值视为异常值。一旦识别出异常值,对其进行处理。一种常见的处理方法是直接删除这些异常值,因为其在大多数情况下并不能提供有用的信息,反而可能干扰模型的训练。接着为了便于同类型指标之间的比较,对数据进行标准化操作,其表达式如下:
(2)
其中,
表示模型输入的财务指标最小值,
表示输入的财务指标最大值。
经过以上预处理步骤后,数据将变得更为整洁、完整和一致,为后续的模型训练和应用提供了高质量的数据基础。
4. 建立改进BP神经网络电商财务风险预测模型
在完成了指标数据预处理之后,接下来需要建立电商财务风险预测模型。考虑到BP神经网络在非线性问题处理上的优势,本文选择基于改进BP神经网络来构建预测模型。
首先需要根据电商财务风险的输入输出特性,确定网络的结构参数。这包括确定输入层节点数n,对应于输入序列A的特征维度;隐含层节点数l,决定了网络处理复杂信息的能力;以及输出层节点数m,对应于输出序列C的维度。因此在构建用于预测电商财务风险的改进BP (反向传播)神经网络时,需要精心设计网络架构,特别是输入层、隐藏层和输出层的神经元配置[7]。设输入神经元集合为
,输出神经元集合为
,隐藏层神经元集合为
。
为确定隐藏层神经元的数量,考虑输入神经元与隐藏层神经元之间的关系,以及业务问题的具体需求。计算每个输入神经元与隐藏层神经元之间的连接权重。对于第i个输入神经元,与第k个隐藏层神经元之间的加权和可表示为:
(3)
其中,
表示第i个输入节点到第k个隐藏层节点的权值;
表示隐含层中k个神经元的偏置项。接下来,本文利用激活函数f(.)来计算隐藏层神经元的实际预测输出。对于第k个隐藏层神经元,其输出可以表示为:
(4)
在这里,f(.)通常选择Sigmoid函数或其他合适的非线性函数,以确保神经网络能够捕捉数据中的非线性关系。最后,计算输出层神经元的加权输入和,以及最终的输出值[8]。对于第j个输出神经元,其加权输入和可以表示为:
(5)
其中,
表示第j个输出神经元与第k个隐藏层神经元之间的连接权重,
表示第j个输出神经元的偏置项。
最终,输出层神经元的输出值即为电商财务风险的预测值。通过不断调整网络参数(如连接权重和偏置项),使神经网络的预测结果更加准确。通过建立改进BP神经网络电商财务风险预测模型,企业可以更加准确地预测和评估自身的财务风险水平。这将有助于企业制定更加合理的风险管理策略,提高风险应对能力,从而确保企业的稳健发展。
5. 调整模型学习速率实现风险预测
在建立了改进BP神经网络电商财务风险预测模型之后,还需要对模型的学习速率进行调整。学习速率是模型训练过程中的一个重要参数,其决定了模型权重更新的步长,需要通过多次实验和调整,找到合适的学习速率,以实现模型的高效训练和准确预测。最终,通过训练好的模型,对电商企业的财务风险进行预测和评估,为企业的决策提供科学依据。
在BP神经网络中,学习率(通常表示为
)的取值范围通常在(0, 1]之间。这个参数决定了在每次迭代中,网络对权值调整的幅度。当预测模型学习率较大时,每次迭代对权值的调整也会相对较大,这可加快网络的训练速度。然而,过大的学习率可能导致权值更新过大,从而在训练过程中产生振荡,影响模型的稳定性。相反,如果学习率设置得较小,虽然能够避免振荡现象,但也会导致网络收敛速度变慢,甚至可能陷入局部最优解[9]。因此改变学习率的计算公式为(6)所示:
(6)
式中:
表示最大学习速率,
表示最小学习速率,
表示最大迭代次数,n表示当前迭代次数。
在训练初期,可以使用较大的学习率来加速权值的更新;随着训练的深入,逐渐减小学习率,以确保权值能够稳定地收敛到最优解。改变学习率的计算公式可以根据具体的任务和数据集进行调整,以实现最佳的训练效果[10]。
在构建电商财务风险预测模型时,调整学习速率是优化模型性能的重要手段之一。通过选择合适的学习速率调整策略,并合理设置初始学习率,可提高模型的训练效率和预测性能。需要注意的是,学习速率的调整需要根据具体的任务和数据集进行调整和实验,以找到最优的学习速率设置。
6. 实验
6.1. 实验准备
本文基于同行业及同期数据,以是否存在“财务反常”而被ST (特殊对待)作为判断其是否处于财务风险的判断标准。拟以近两年某市电商公司为研究对象,研究其在金融危机发生之前的业绩预告。
为保证预测结果的可信度与前瞻性,本研究选取了我国上市公司T-3年份的企业资料。这样,才能在企业陷入财务危机前的更早阶段进行预测,为企业提前采取措施应对危机提供可能。
经过严格的样本筛选和数据清洗,最终得到了346个样本公司,其中正负样本(即被ST与未被ST的公司)各173个。在数据样本划分上,为确保模型训练的有效性和测试的准确性,按照7:3的比例随机选取了训练集(包含242个样本)和测试集(包含104个样本)。其中软硬件环境设置如表1所示。
Table 1. Software and hardware of environment settings
表1. 软硬件环境设置
序号 |
类别 |
名称 |
型号 |
1 |
硬件环境 |
服务器 |
Dell PowerEdge R740xd |
2 |
处理器 |
Intel Xeon Gold 6248R (2.7 GHz, 24核心) |
3 |
内存 |
256 GB DDR4 ECC REG RAM |
4 |
存储 |
2TB NVMe SSD |
5 |
显卡 |
NVIDIA GeForce RTX 3090 |
6 |
软件环境 |
操作系统 |
Ubuntu 20.04 LTS |
7 |
编程语言 |
Python 3.8+ |
8 |
数据处理工具 |
Scikit-learn |
9 |
集成开发环境 |
PyCharm/VS Code |
此外,为保障实验的顺利进行,还需要确保以下准备工作:
模型训练:使用训练集数据对模型进行训练,调整模型参数以达到较好的预测性能。
模型验证:使用测试集数据对训练好的模型进行验证,评估模型的泛化能力和预测准确性。
通过以上准备工作和实验流程,构建一个基于改进BP神经网络的电商财务风险智能预测模型,并对其进行实验验证和性能评估。
6.2. 实验结果与分析
通过搭建基于改进BP神经网络的电商财务风险智能预测模型,并在选定的软硬件环境下进行训练和测试,获得实验结果如表2所示。
Table 2. Update frequency record
表2. 更新频率记录
实验编号 |
预测方法 |
更新频率(分钟/次) |
平均更新时间(秒) |
更新成功率 |
1 |
文献[1]方法 |
30 |
15.2 |
90% |
2 |
30 |
14.8 |
92% |
3 |
30 |
15.5 |
88% |
4 |
文献[2]方法 |
20 |
12.3 |
85% |
5 |
20 |
12.7 |
87% |
6 |
20 |
12.5 |
86% |
7 |
本文方法 |
2 |
1.1 |
99.5% |
8 |
2 |
1.0 |
100% |
9 |
2 |
1.2 |
99% |
经过一系列实验对比,本文提出的电商财务风险智能预测方法在更新能力上表现出色。从实验数据可以看出,文献[1]和文献[2]中的预测方法虽然具有一定的更新频率和成功率,但相比之下,本文方法的更新频率更高,平均更新时间更短,且更新成功率更高。具体而言,本文方法实现了每2分钟更新一次的高频率,平均更新时间仅为1秒左右,且更新成功率稳定在99%以上,其中部分实验甚至达到了100%。
这一显著的更新能力优势使得本文方法能够更快速地捕捉财务风险的变化,为电商企业提供更为及时、准确的预测结果。在电商行业快速变化的背景下,这种高效的更新能力对于企业的风险管理具有重要意义。因此,可以得出结论,本文提出的电商财务风险智能预测方法在更新能力方面表现优秀,为电商企业的财务风险预测提供了新的解决方案。
7. 总结
在深入探讨并实践了基于改进BP神经网络的电商财务风险智能预测方法后,确定改进后的BP神经网络在电商财务风险的智能预测上取得了显著成效,不仅提高了预测精度,还加快了收敛速度,使得企业能够更准确地识别潜在的财务风险,从而提前采取防范措施。然而,该方法仍存在一些不足之处。模型对于某些极端情况或未知风险的预测能力有限,可能需要进一步研究和改进。未来,将继续深化对改进BP神经网络的研究,探索更多的优化算法和集成策略,以提高模型的预测精度和稳定性。同时,也将关注电商市场的新动态和新趋势,及时更新模型以适应不断变化的业务需求。相信在不久的将来,基于改进BP神经网络的电商财务风险智能预测方法将在电商行业中发挥更加重要的作用,为企业的稳健运营提供更加坚实的保障。
NOTES
*通讯作者。