GRU-ARIMA与多元回归集成模型的应用——以五粮液为例的销售额预测研究

doi:10.12677/sa.2025.1411313

期刊菜单

GRU-ARIMA与多元回归集成模型的应用——以五粮液为例的销售额预测研究
Application of GRU-ARIMA and Multivariate Regression Integrated Model—A Study on Sales Forecasting of Wuliangye

DOI: 10.12677/sa.2025.1411313, PDF, HTML, XML,
作者: 周凼, 胡桔榕：重庆理工大学数学科学学院，重庆
关键词: 五粮液；多元回归分析；GRU神经网络；ARIMA；决策树回归；Wuliangye； Multiple Regression Analysis； GRU Neural Network； ARIMA； Decision Tree Regressio

摘要: 本研究以五粮液企业销售额为研究对象，深入探讨了影响其销售额的关键因素及GRU与时间序列集成模型的实证分析，旨在构建精准可靠的预测模型，帮助企业更好把握市场动态，优化销售策略。首先运用多元回归分析对五粮液销售额的影响因素进行系统分析。通过逐步回归筛选变量建立方程，发现显著变量归属净利润系数2.288和营业净利润率系数94.192，资产负债率系数0.021，反映了销售额与企业的成长能力和盈利能力呈正相关关系、与偿债能力呈负相关，还揭示了企业的经营能力和抗风险能力与以上能力存在共同作用，说明若企业若想提升销售额，则应提升企业本身的成长潜力以及盈利能力并降低企业负债。然后对五粮液2008年第四季度至2023年第三季度五粮液历史销售额数据的训练和验证。在模型预测准确性评估方面，采用了MAE、RMSE以及MASE等指标，与自适应ARIMA模型和决策树回归模型进行对比，发现集成模型的误差指标均最小，且拟合优度高达0.997，在预测五粮液销售额方面表现出色。

Abstract: Taking the sales of Wuliangye as the object of research, this study discusses in depth the key factors affecting its sales and the empirical analysis of GRU and time series integration model, aiming at constructing an accurate and reliable forecasting model to help the enterprise better grasp the market dynamics and optimize its sales strategy. Firstly, multiple regression analysis is applied to systematically analyze the influencing factors of Wuliangye’s sales. Through stepwise regression screening variables to establish the equation, found that the significant variables attributable to the net profit coefficient of 2.288 and operating net 222 profit margin coefficient of 94.192, the coefficient of the balance sheet ratio of 0.021, reflecting the sales and the enterprise’s growth and profitability are positively correlated with the negative correlation with the ability to pay off the debt, but also revealed that the enterprise’s operating ability and risk-resistant ability and the above ability to play a joint role in the above ability, that if the It also reveals that the operation ability and risk resistance ability of the enterprise work together with the above abilities, suggesting that if the enterprise wants to increase sales, it should improve its own growth potential and profitability and reduce its debts. Then the historical sales data of Wuliangye from the fourth quarter of 2008 to the third quarter of 2023 are trained and validated. In terms of model prediction accuracy assessment, indicators such as MAE, RMSE and MASE were used to compare with the adaptive ARIMA model and the decision tree regression model, and it was found that the integrated model had the smallest error indicators and the goodness of fit was as high as 0.997, which was excellent in predicting the sales of Wuliangye.

文章引用：周凼, 胡桔榕. GRU-ARIMA与多元回归集成模型的应用——以五粮液为例的销售额预测研究[J]. 统计学与应用, 2025, 14(11): 90-102. https://doi.org/10.12677/sa.2025.1411313

1. 引言

1.1. 研究背景及意义

随着全球经济一体化进程的加速与市场竞争日趋激烈，对企业销售数据进行精准预测与深入分析具有重要意义。在时间序列分析领域，传统统计方法(如移动平均、指数平滑等)虽可捕捉数据的趋势与季节性特征，但在处理复杂非线性序列时，其预测精度常显不足。神经网络作为一种强大的机器学习工具，在处理非线性关系方面表现突出，尤其是门控循环单元(GRU)作为循环神经网络(RNN)的变体，能够有效建模时间序列中的长期依赖关系，从而提升预测准确性。单纯依赖神经网络进行时间序列预测亦存在局限。神经网络虽善于拟合复杂非线性模式，但对确定性信息(如周期性、趋势性成分)的提取效率较低。时间序列分析方法则擅长识别此类确定性规律。因此，将时间序列分析与神经网络相结合构建集成模型，可充分发挥二者优势，提升整体预测性能。

本文提出一种基于GRU神经网络与时间序列分析的集成建模方法。该模型首先运用时间序列技术对五粮液销售额数据进行预处理与特征提取，以捕捉确定性信息；进而利用GRU网络对残差部分进行建模，以提取序列中的随机性成分。通过两者的有效结合，该集成模型在提升预测精度与稳健性方面展现出互补优势。

综上，神经网络与时间序列的集成建模研究兼具理论与应用价值。该模型可为五粮液等酒类企业的市场分析与决策制定提供科学依据，同时对推动时间序列分析与神经网络方法在融合方向上的进一步发展具有积极意义。

1.2. 研究现状

当前，白酒行业的销售预测研究主要基于对行业概况、市场环境、经济因素及竞争态势等多维变量的综合分析。在方法论层面，该领域涵盖了从传统定性分析到基于数据模型的定量分析等多种研究路径。近年来，依托历史销售数据、市场指标与消费者行为数据，采用回归分析、时间序列模型及机器学习算法构建预测模型，已成为该领域的主流研究方向，显著提升了预测的准确性。然而，白酒销售预测仍面临相当的不确定性与风险，其预测结果易受市场动态、政策调整以及消费者需求变化等多重因素的影响。因此，在开展预测工作时，需全面评估各类因素的潜在波动及其不确定性，并在此基础上审慎设定预测区间与置信水平。

2003年，人工神经网络逐渐成为传统线性预测方法中一种极具潜力的替代工具。ARIMA模型与人工神经网络在预测性能方面的优劣常被广泛比较，相关研究结论不一，既有积极评价，亦存在争议。G. Peter [1]提出了一种结合ARIMA与ANN的混合建模方法，旨在同时利用两者分别在线性和非线性结构建模中的独特优势。实际数据集的测试结果表明，该组合模型能够有效提升预测精度，是一种优于单一模型的预测策略。

在针对新能源汽车销售预测的研究中，刘炳春[2]基于中国新能源汽车推广政策的地区差异，构建了一种融合离散小波变换与双向长短时记忆网络的多因素预测模型，以新能源汽车销量为核心预测对象。符振涛[3]则提出了MAAR模型，该模型综合考量趋势影响、季节性波动及专家经验，并借助数字化工具开发了一套高精度的销售预测系统。

2008年，刘薇[4]基于时间序列分析方法对吉林省生产总值建立数学模型，以支撑其后十年的科学规划；桂思思等[5]则聚焦于汽车行业，通过结合ARIMA模型与线性回归，构建了针对单一品牌汽车销量的评估体系。

2022年，崔馨心[6]将深度神经网络引入股票时间序列预测，采用全连接网络结构构建了涵盖近3000支股票的通用预测模型，并利用2015~2017年数据进行训练与验证，实验结果显示模型准确率达58.5%。汪兰兰[7]探讨了灰色理论在新能源汽车市场趋势预测中的应用，指出通过改进背景值可有效提升模型预测精度。高纬光等[8]系统综述了安徽省白酒行业现状与发展趋势，重点分析了古井贡酒、宣酒等品牌的酿造工艺、制曲技术及风味成分与微生物研究进展，为该领域的深入探索提供了重要参考。陈光绪等[9]提出了一种融合卷积神经网络与门控循环单元的CNN-GRU混合模型，用于精确预测提高石油采收率过程中的产油量。综上所述，白酒行业销售额预测研究正呈现方法多样化与问题复杂化的趋势。随着数据技术的持续进步与应用，未来该领域的预测研究有望更加精准可靠，从而为行业决策与投资分析提供更有效的科学支撑。

1.3. 本文的思路与目的

本研究采用多元回归分析方法，识别并分析了成长能力、偿债能力、经营能力及抗风险能力等多维因素对五粮液销售额的具体影响，以揭示销售额变动的内在驱动机制。进一步地，构建一种融合门控循环单元神经网络与时间序列分析的集成预测模型。GRU模型能够有效捕捉时间序列数据中的长期依赖关系，而时间序列分析则有助于识别销售额的周期性波动与趋势特征。在模型构建后，利用历史销售数据对模型进行训练与验证，通过参数与结构优化提升其预测性能，并系统评估模型的准确性与实际应用可靠性。最后，基于所建模型对五粮液未来五个季度的销售额进行预测，并与ARIMA、决策树回归等常用预测模型进行比较，通过误差指标与精度度量综合评价模型优劣，从而为五粮液的销售策略制定与市场规划提供科学依据。本研究旨在通过上述方法系统识别影响销售额的关键因素，并构建高精度、稳健的集成预测模型，为企业决策提供理论支持与实证参考。

2. ARIMA与GRU神经网络及其混合模型

2.1. ARIMA模型

在自回归移动平均模型(ARMA)中，假设一个变量的未来值是几个过去观测值和随机误差的线性函数。也就是说，生成时间序列的底层过程具有以下形式：

$y_{t} = ϕ_{1} y_{t - 1} + ϕ_{2} y_{t - 2} + \dots + ϕ_{p} y_{t - p} + ε_{t} + θ_{0} - θ_{1} ε_{t - 1} - θ_{2} ε_{t - 2} - \dots - θ_{q} ε_{t - q}$ (1)

其中， $y_{t}$ 和 $ε_{t}$ 分别为 $t$ 时段的实际值和随机误差；而 $φ_{i} (i = 1, 2, \dots, p)$ 和 $θ_{j} (j = 1, 2, \dots, q)$ 为模型参数。 $p$ 和 $q$ 是整数，通常被称为模型的阶数。随机误差 $ε_{t}$ 被假定为独立和同分布，平均值为零，常数方差为 $σ^{2}$ 。

方程(1)包含了ARIMA模型族的几个重要特例。如果 $q = 0$ ，则(1)成为AR (p)模型。当 $p = 0$ 时，模型简化为MA (q)模型。ARIMA模型构建的一个中心任务是确定合适的模型阶数 $(p, d, q)$ ，其中 $d$ 是序列不平稳时的差分阶数。

Box与Jenkins [10]在Wold [11]研究基础上提出了一套构建ARIMA模型的实用方法，对该领域的研究与应用产生了深远影响。Box-Jenkins方法包含模型识别、参数估计与诊断检验三个迭代步骤。其核心思想在于，若时间序列由ARIMA过程生成，则应具备特定的理论自相关特征；通过将经验自相关模式与理论模式相匹配，可识别出一个或多个可能的模型结构。在此过程中，自相关函数与偏自相关函数被用作确定ARIMA模型阶数的重要工具。

2.2. 门控循环单元(GRU)神经网络

门控循环单元是一种常用于处理序列数据的循环神经网络架构。由两个门组成：重置门(reset gate)和更新门(update gate)。这两个门通过控制信息的流动来影响当前时间步的输出。候选状态是GRU中的一个中间状态，它结合了当前输入和通过重置门调控的前一时刻隐藏状态，并通过tanh函数进行非线性变换。当前状态是GRU的最终输出，它通过更新门融合了前一时刻的隐藏状态和候选状态，这种融合方式使得GRU能够灵活地记忆和遗忘信息，从而更好地处理序列数据中的长期依赖关系。GRU内部激活函数包括sigmoid函数和tanh函数，其结构如图1所示。与LSTM相比，GRU简化了单元的门结构，降低了计算复杂度。

Figure 1. Schematic diagram of GRU

图1. GRU结构图

其中，t时刻的外部输入 $x_{t}$ 和 $t - 1$ 时刻的神经元状态 $h_{t - 1}$ 为神经元的输入。重置门 $r_{t}$ 控制了 $t - 1$ 时刻的神经元状态向量 $h_{t - 1}$ ，决定有多少历史信息会在t时刻神经元的隐藏状态向量 $h_{t}$ 中使用。激活函数tanh的值域为[0, 1]，更新门 $z_{t}$ 通过加权平均形式控制 $h_{t}$ 和 $h_{t - 1}$ 输出神经元在t时刻的细胞状态 $h_{t}$ 。其中， $r_{t}$ 和 $z_{t}$ 通过式(2)计算得到：

$(\begin{matrix} r_{t} \\ z_{t} \end{matrix}) = {\begin{matrix} σ [w_{r} * (x_{t}, h_{t - 1}) + b_{r}] \\ σ [w_{z} * (x_{t}, h_{t - 1}) + b_{z}] \end{matrix}}$ . (2)

其中 $w_{r}$ 和 $w_{z}$ 分别表示 $r_{z}$ 和 $z_{t}$ 的权重向量， $b_{r}$ 和 $b_{z}$ 分别表示 $r_{z}$ 和 $z_{t}$ 的偏置向量。 $σ (\cdot)$ 表示sigmoid函数。神经元的隐藏状态 $h_{t}$ 可表示为：

$h_{t} = \tanh [w_{h} * (x_{t}, h_{t - 1} \otimes r_{t}) + b_{h}]$ . (3)

$w_{h}$ 为隐藏状态 $h_{t}$ 的权重向量， $b_{h}$ 为隐藏状态 $h_{t}$ 的偏置向量， $\otimes$ 为矩阵元素相乘运算。则得到 $t$ 时刻神经元的细胞状态 $h_{t}$ 为：

$h_{t} = h_{t - 1} \otimes z_{t} + h_{t} \otimes (1 - z_{t})$ . (4)

总的来说，GRU通过引入重置门和更新门，实现了对长期序列信息的选择性记忆和遗忘，从而提高了循环神经网络在处理序列数据时的性能[12]。

2.3. 集合模型

ARIMA和GRU模型都在各自的线性或非线性领域取得了成功。然而，它们都不是适用于所有情况的通用模型。ARIMA模型对复杂非线性问题的逼近可能是不够的。另一方面，使用门控循环单元神经网络对线性问题建模的结果好坏参半。Markham和Rakes [14]还发现，人工神经网络在线性回归问题中的表现取决于样本量和噪声水平。因此，盲目地将神经网络应用于任何类型的数据都是不明智的。由于在实际问题中完全了解数据的特征是不可能的，因此具有线性和非线性建模能力的混合方法可能是实际使用的好策略。通过组合不同的神经网络和时间序列模型，可以更好捕获底层模式的信息。可以合理地认为时间序列是由线性自相关结构和非线性分量组成的。也就是说，

$y_{t} = L_{t} + N_{t}$ (5)

其中 $L_{t}$ 表示线性分量， $N_{t}$ 表示非线性分量，这两个部分必须从数据中估计出来且

$y_{t} = α_{0} + \sum_{j = 1}^{q} α_{j} g (β_{0 j} + \sum_{i = 1}^{p} β_{i j} y_{t - i}) + ε_{t}$ (6)

首先，让ARIMA对线性分量进行建模，那么线性模型的残差将只包含非线性关系。设 $e_{t}$ 表示线性模型在 $t$ 时刻的残差，那么

$e_{t} = y_{t} + {\hat{L}}_{t}$ (7)

其中 ${\hat{L}}_{t}$ 是根据估计关系(6)对时间 $t$ 的预测值。残差于诊断线性模型的相关性层面极为重要。倘若残差中依旧存有线性相关结构，那么线性模型便非超前的。然则，残差分析无法探测到数据中的任一非线性模式。事实上，当下尚无通用的非线性自相关关系的诊断统计量。故而，即便模型通过了诊断检查，因非线性关系未得到恰当建模，该模型仍有可能是不充分的。残差中任何显著的非线性模式都表明ARIMA的局限性。利用门控循环单元神经网络对序列残差进行建模，可以发现非线性关系。对于n个输入节点，残差的GRU模型为

$e_{t} = f (e_{t - 1}, e_{t - 2}, \dots, e_{t - n}) + ε_{t}$ (8)

其中 $e_{t}$ 是由神经网络决定的非线性函数， $ε_{t}$ 是随机误差。如果模型 $f$ 不是一个合适的模型，则误差项不一定是随机的。将(8)的预测记为 ${\hat{N}}_{t}$ ，则综合预测为

${\hat{y}}_{t} = {\hat{L}}_{t} + {\hat{N}}_{t}$ (9)

综上所述，混合系统方法[1]包含两个步骤。第一步运用ARIMA模型去分析问题的线性部分，也就是依据序列确定性信息对序列确定型部分加以预测。在第二步中，构建GRU神经网络模型以对ARIMA模型的残差予以建模。鉴于ARIMA模型无法捕捉数据的非线性结构，线性模型的残差会涵盖非线性的信息。神经网络的结果可当作ARIMA模型误差项的预测。混合模型利用了ARIMA模型与GRU模型在确定不同模式方面的独特特征和优势。因此，采用不同的模型分别对线性和非线性信息进行建模。第三步，结合预测结果提高整体建模和预测性能。

在构建ARIMA和GRU模型时，通常需要对模型顺序和模型充分性进行主观判断。在混合方法中有可能使用次优模型。例如，Box-Jenkins方法的当前实践侧重于低阶自相关。如果低阶自相关不显著，则认为模型是适当的，即使高阶自相关仍然存在。这种次优性可能不会影响混合模型的有用性。Granger [15]指出，一个混合模型要产生更好的预测，成分模型应该是次优的。一般来说，已经观察到，将基于不同信息集的单个预测组合起来更为有效[16]。

2.4. 白酒销售额的影响因素

2.4.1. 影响因素研究现状

白酒作为中国独有的酒类制品，其产生与发展根植于独特的文化与历史背景。据中国产业经济信息网2014年发布的《中国白酒行业发展影响因素分析》，影响我国白酒行业的关键因素包括经济发展(ED)、国家政策(NP)、白酒特有文化(LC)、科技进步(TP)、健康意识(HI)及产业集中度(IC)等。多数相关市场分析报告亦指出该行业具有明显的季节性、区域性与节日效应。

杜旭雯等[17]进一步指出，宏观经济要素、消费者偏好变动及政策法规对白酒销量具有显著影响。目前，研究致力于将上述要素纳入销量预测模型，但仍面临数据质量与可靠性不足、模型可解释性有限等问题。牛勇革在《华夏酒都报》中探讨了政策因素对行业的影响；程铁辕分析了中国白酒出口国际市场的主要特征及其影响因素；在大数据技术推动下，数据分析领域已逐步实现更精细化的销量预测。然而，现有研究多聚焦于描述性分析，较少运用统计学方法对白酒销售额的影响因素进行建模与实证检验。因此，本文拟基于统计学视角，运用实际数据探究影响白酒销售额的关键因素。展望未来，随着技术的持续演进与数据资源的日益丰富，白酒销量预测研究将趋于精准与系统化，为企业战略决策提供更有效的科学支持。

2.4.2. 多元回归分析影响因素

Table 1. Naming of influencing factor variables

表1. 影响因素变量命名

	营业总收入(亿)	$Y$
成长能力	归属净利润(亿)	$X_{1}$
成长能力	资产总额(亿)	$X_{2}$
偿债能力	负债合计(亿)	$X_{3}$
偿债能力	资产负债率	$X_{4}$
经营能力	总资产周转率	$X_{5}$
盈利能力	营业净利润率	$X_{6}$
风险能力	权益乘数(杠杆系数)	$X_{7}$

基于研究现状以及五粮液2008年四季度至2025年二季度业绩报表(东方财富网)，分析影响企业销售额的重要变量及背后对应的五种能力能力。变量如表1。

通过逐步回归，筛选出归属净利润(亿) $X_{1}$ 、资产负债率 $X_{4}$ 、总营业净利润率 $X_{6}$ 这三项指标建立多元回归方程。凭借以上变量构建模型，以期望获取销售额与这三项变量之间的对应函数关系。在模型求解后，还需检验多元回归模型的多重共线性、自相关检验以及异方差检验，从而验证模型的可行性(表2)。

Table 2. Results of multiple linear regression analysis

表2. 多元线性回归分析结果

	非标准化系数		标准化系数	t	p	VIF	调整R²	F
	系数值	标准误	Beta	t	p	VIF	调整R²	F
常数	−36.506	7.725	0	−4.726	0.000^***	-	0.996	F = 2734.202 p = 0.000^***
$X_{1}$	2.288	0.058	0.963	39.699	0.000^***	4.845
$X_{4}$	−0.021	0.003	−0.112	−6.422	0.000^***	2.49
$X_{6}$	94.192	27.047	0.067	3.482	0.002^***	3.027

基于此结果，可以得到以下模型表达式：

$y = 2.288 x_{1} - 0.021 x_{4} + 94.192 x_{6} - 36.506$ . (10)

在显著性水平为0.05时拒绝原假设，进而可以推定这些自变量都能在一定程度上解释销售额的变动，并且模型的拟合度高达0.996，整体F值达到2734.202，对应p值接近0 (p < 0.05)，说明模型整体有较好拟合效果，显著性较高。

3. 基于ARIMA与GRU集成模型的五粮液销售额应用

3.1. STL + ARIMA (0, 1, 2)模型

在进行拟合模型之前，需要对序列进行预处理，这关乎到该序列是否值得进行时间序列分析的重要性。首先采用单位根检验进行平稳性检验，单位根检验的结果是判断模型的自回归系数多项式的根是否落在单位圆外。单位根检验的原假设为H₀：序列非平稳vs H₁：序列是平稳的。通过R计算出该序列的单位根结果为−0.7683，p值是0.5105，该结果落在单位圆内，在0.05水平下不拒绝原假设，因此判定该序列为非平稳序列。由于使劲按序列在不同滞后期数下的检验结果可能有差异，因此，本文选取了四个不同参数进行检验，分别为滞后6期、12、18以及24期。纯随机性检验的目的是判断序列是否含有有效信息，即是否为白噪声序列。若为白噪声序列则无进一步分析的必要。检验的原假设为H₀：序列为白噪声序列vs H₁：序列为非白噪声序列。发现所有滞后阶数的检验p值均小于0.05，因此在0.05水平下拒绝序列为白噪声的假设，即认为该序列为非白噪声序列，可以对数据进一步分析其有效信息。绘制销售额序列的时序图如下图2。

从图2可以看到，该序列存有显著的线性递增态势以及以季作周期的季节效应，未见较大的经济周期循环特点，亦无交易日的相关信息，故而能够明确这个序列受到三个要素的作用：长期趋势、季节效应及随机波动。分解序列因素信息：进一步探索这三个因素相互影响方式，图2显示随着时间的推移，趋势增加，同时每个季节的振幅也在增大，即周期波动范围随着趋势递增而扩大，这说明季节效应受到趋势的影响，故选择乘法模型进行拟合。带季节效应的乘法模型：

$X_{t} = T_{t} \times S_{t} \times I_{t}$ (11)

Figure 2. Time series plot of sales volume

图2. 销售额时序图

Figure 3. Factor decomposition plot

图3. 因素分解图

从图3可知，由于序列含有季节性、趋势以及随机因素，因此需要因素分解模型进行拟合。分解模型包含趋势效应提取以及季节效应提取和残差三部分。因为序列非平稳，因此对序列进行一阶差分，并对差分后的序列进行平稳性检验以及纯随机性检验，发现一阶差分后序列平稳且为非白噪声。绘制自相关和偏自相关图如下：

Figure 4. Autocorrelation plot and partial autocorrelation plot after first difference

图4. 一阶差分后自相关图与偏自相关图

由图4可知，采用乘法模型STL + ARIMA (0, 1, 2)拟合数据较为合适。该模型表示一个时间序列分解和预测的组合模型。参数解释：

STL：STL代表“Seasonal and Trend decomposition using Loess”，即使用Loess方法进行季节性和趋势分解。STL是一种常用的时间序列分解方法，通过将时间序列分解为季节性、趋势和残差三部分来揭示数据的结构。
ARIMA (0, 1, 2)：ARIMA是自回归移动平均模型的缩写，它描述了时间序列数据中的自相关和移动平均关系。在这里，ARIMA (0, 1, 2)表示模型中包含一个一阶差分( $d = 1$ )，以及一个零阶自回归项( $p = 0$ )和两个移动平均项( $q = 2$ )。这意味着模型考虑了一阶差分后的残差序列的自相关和移动平均特性。
模型中包含了趋势项的漂移。这意味着模型会考虑到时间序列中可能存在的趋势变化，并对其进行建模。

因此，这个乘法模型结合了STL分解、ARIMA模型和趋势漂移，可以更准确地分析时间序列数据的季节性、趋势和残差(非线性)部分，并进行未来的预测。使用R软件拟合STL + ARIMA(0, 1, 2)乘法模型，得到如下模型拟合结果：

Table 3. STL + ARIMA (0, 1, 2)

表3. STL + ARIMA (0, 1, 2)

STL + ARIMA (0, 1, 2) with drift
	MA (1)	MA (2)	Drift
系数	−1.466	0.927	3.498
系数标准误差	0.090	0.095	1.219
检验统计量	16.380	9.746	2.870
估计方差：444.5		对数似然值：−264.42
训练集预测误差	平均绝对误差MAE：15.903	均方根差RMSE：20.369	平均绝对比例误差MASE：1.030

根据表3可知，当显著性水平为0.05时，模型所有系数的检验统计量均大于1.96，即认为所有参数都是显著有效的。模型的检验主要检验模型的有效性，而时间序列模型是否有效主要是看它提取信息是否充分，通过观察残差序列中是否还残留着相关信息未被提取。因此，模型的显著性检验，就是检验残差序列是不是白噪声序列，是白噪声即模型有效。检验p值 = 0.1236 > 0.05，因此不拒绝原假设，认为残差序列为白噪声序列，即该模型在0.05显著水平下显著有效。

3.2. GRU神经网络模型

由于ARIMA模型不能捕捉数据的非线性结构，线性模型的残差将包含非线性的信息。神经网络的结果可以作为ARIMA模型误差项的预测。在构建ARIMA和GRU集合模型时，通常需要对模型顺序和模型充分性进行主观判断。在混合方法中有可能使用次优模型。因此，将STL + ARIMA (0, 1, 2)乘法模型(次优模型)作为组合模型的线性部分进行建模，但残差序列中的数据关系是非线性的，这就需要神经网络拟合非线性部分。

在神经网络模型训练过程中，“loss”是损失函数，通过最小化损失函数，神经网络能够学习如何调整其参数以改进预测准确性。而本文采取均方差损失函数衡量预测模型准确性，模型在每个训练步骤中进行参数更新，目标是减少loss值。设置训练模型的初始epoch为100，保证模型得到充分的训练；同时batch_size为32，较小的batch_size可以提供更好的泛化能力。

Figure 5. Training loss plot of GRU model

图5. GRU训练loss图

由图5发现，发现loss值在epoch = 20之后开始在0.02~0.04之间波动，且没有明显增加的趋势，当epoch = 49时loss = 0.0231，进一步修改模型epoch为49进行拟合，此时loss值最小，认为模型训练良好。得到如表4的模型参数：

Table 4. Parameter table of GRU model

表4. GRU模型参数表

Model: “sequential”
层(类别)	输出大小	参数
gru (GRU)	(None, 50)	7950
密集(Dense)	(None, 1)	51
参数总数：24,005 (93.77 KB)
可训练参数：8001 (31.25 KB)
优化器参数：16,004 (62.52 KB)

3.3. 集合模型预测序列

如前所述，在构建ARIMA和GRU模型时，在混合方法中有可能使用次优模型。这种次优性可能不会影响混合模型的有用性。Granger [13]指出，一个混合模型要产生更好的预测，成分模型应该是次优的。有了以上两部分模型以及对应的序列预测值，则可以进行模型组合并预测了。由于时间序列是由线性自相关结构和非线性分量组成的。也就是说，

$y_{t} = L_{t} + N_{t}$ (12)

其中， $L_{t}$ 表示线性分量， $N_{t}$ 表示非线性分量。这两个组成部分已经从已知数据中拟合出来，即采用不同的模型分别对线性和非线性模式进行建模，基于所得组合模型进行预测，然后将预测结果结合起来，得到结果如表5：

Table 5. Predicted values for the next five quarters of the sequence

表5. 序列未来五季度预测值

时间	线性预测 $L_{t}$	非线性预测 $N_{t}$	销售额预测值
2025Q3	198.6690	−28.1819	170.4871
2025Q4	266.4316	−54.6967	211.7349
2026Q1	294.8612	108.0361	402.8973
2026Q2	212.8042	−57.7861	155.0181
2026Q3	234.2180	−68.0877	166.1303

4. 常用预测模型比较

4.1. 自适应ARIMA模型及预测

Auto. ARIMA模型是R语言中用于时间序列分析的一个自动模型选择函数。基于该模型的特性，进行对五粮液季度销售额的拟合并预测。得到未来五个季度预测值如表6：

Table 6. Prediction results of ARIMA (1, 1, 1) (1, 1, 0) [4] component model

表6. ARIMA (1, 1, 1) (1, 1, 0) [4]成分模型预测结果

时间	2025Q3	2025Q4	2026Q1	2026Q2	2026Q3
预测值	174.6742	206.4927	375.8782	148.9845	178.1973

4.2. 决策树回归模型及预测

决策树回归是一种用于预测时间序列的常用方法。决策树回归模型在时间序列预测中具有一定的优势，因此，本文也采取该方法作为对比方法之一。

Table 7. Prediction results of decision tree regression model

表7. 决策树回归模型预测结果

时间	2025Q3	2025Q4	2026Q1	2026Q2	2026Q3
预测值	161.6849	237.8476	346.3579	160.9562	165.7546

表7展示了训练集及验证集和测试集的比较结果，通过指标衡量决策树预测性能。

4.3. 模型评价

计算STL + ARIMA (0, 1, 2) + GRU集合模型、ARIMA (1, 1, 1) (1, 1, 0) [4]模型以及决策树回归模型的MAE、RMSE、MASE评价模型预测性能。

Table 8. Prediction error metrics of various models

表8. 各模型预测误差指标

模型	MAE	RMSE	MASE	R²
STL + ARIMA (0, 1, 2) + GRU集合	2.9030	4.3690	0.1732	0.997
ARIMA (1, 1, 1) (1, 1, 0) [4]	6.2265	8.7403	0.4032	0.989
决策树回归	60.313	79.218	46.323	0.896

根据表8中的数据对比三个模型误差指标，STL + ARIMA (0, 1, 2) + GRU集合模型的MAE、RMSE以及MASE均最小，且拟合优度高达0.997，预测性能最好；而单独的带季节性ARIMA模型误差指标值次之，拟合优度为0.989；决策树回归误差最大，拟合优度最小，为0.896。将预测结果可视化如图6，可见决策树预测效果最差，集合模型与自适应ARIMA模型较为符合实际，但自适应对原始数据的趋势性提取不够充分，集合模型很好反映了原始数据的季节性及趋势性。

Figure 6. Time series plot of prediction results for various models

图6. 各模型预测结果

5. 总结

本研究采用R软件实现ARIMA模型构建，神经网络模型则基于Python语言开发。针对五粮液(WLY)数据的全部预测任务，仅对未来五个季度进行预测，并选取平均绝对误差(MAE)、均方根误差(RMSE)与平均绝对百分比误差(MAPE)作为模型预测性能的评估指标。通过构建并比较多种预测模型，发现STL-ARIMA (0, 1, 2)-GRU集成模型的预测性能最优，拟合优度(R²)达到0.997；自适应ARIMA模型表现次之，而决策树回归(DTR)效果最差。在0.05显著性水平下，自适应ARIMA模型相较于STL-ARIMA模型具有统计优势，但最终STL-ARIMA-GRU集成模型在所有对比模型中仍表现出最佳的预测精度与综合性能。结果表明，所提出的集成方法在预测任务中具有较高的有效性和实用性。

参考文献

[1]	Zhang, G.P. (2003) Time Series Forecasting Using a Hybrid ARIMA and Neural Network Model. Neurocomputing, 50, 159-175. [Google Scholar] [CrossRef]
[2]	Liu, B., Song, C., Wang, Q., Zhang, X. and Chen, J. (2022) Research on Regional Differences of China’s New Energy Vehicles Promotion Policies: A Perspective of Sales Volume Forecasting. Energy, 248, Article ID: 123541. [Google Scholar] [CrossRef]
[3]	符振涛, 李丽敏, 王莲霞, 等. 基于时间序列与CNN-GRU的滑坡位移预测模型研究[J]. 人民珠江, 2024, 45(2): 1-8.
[4]	刘薇. 时间序列分析在吉林省GDP预测中的应用[D]: [硕士学位论文]. 长春: 东北师范大学, 2008.
[5]	桂思思, 孙伟, 徐晓锋. 基于ARIMA与线性回归组合模型的汽车销量预测分析[J]. 计算机与数字工程, 2021, 49(8): 1719-1723.
[6]	崔馨心. 基于深度神经网络的经济时间序列预测模型[J]. 信息技术与信息化, 2018(11): 75-77.
[7]	汪兰兰. 改进的GM(1, 1)模型在新能源汽车销量预测中的应用[J]. 经济研究导刊, 2023(15): 46-50.
[8]	高纬光, 蒲顺昌, 杨建刚, 等. 安徽省白酒研究现状[J]. 中国酿造, 2022, 41(10): 13-17.
[9]	Chen, G., Tian, H., Xiao, T., Xu, T. and Lei, H. (2024) Time Series Forecasting of Oil Production in Enhanced Oil Recovery System Based on a Novel CNN-GRU Neural Network. Geoenergy Science and Engineering, 233, Article ID: 212528. [Google Scholar] [CrossRef]
[10]	Box, G.E.P. and Jenkins, G. (1970) Time Series Analysis: Forecasting and Control. John Wiley & Sons, 46-78.
[11]	龚晓春, 朱云, 李晟, 等. 基于门控循环单元神经网络的LED寿命预测方法[J]. 照明工程学报, 2022, 33(6): 93-101.
[12]	Markham, I.S. and Rakes, T.R. (1998) The Effect of Sample Size and Variability of Data on the Comparative Performance of Artificial Neural Networks and Regression. Computers & Operations Research, 25, 251-263. [Google Scholar] [CrossRef]
[13]	Granger, C.W.J. (1989) Invited Review Combining Forecasts—Twenty Years Later. Journal of Forecasting, 8, 167-173. [Google Scholar] [CrossRef]
[14]	Perrone, M.P. and Cooper, L. (1993) When Networks Disagree: Ensemble Method for Hybrid Neural Networks. In: Mammone, R.J., Ed., Neural Networks for Speech and Image Processing, Chapman & Hall, 126-142.
[15]	杜旭雯, 王章奕, 李泽宇, 等. 基于杜邦分析体系的企业经营业绩影响因素研究——以贵州茅台酒股份有限公司为例[J]. 商场现代化, 2021(6): 38-40.
[16]	牛勇革. 白酒市场增速将放缓, 竞争集中中档产品[N]. 华夏酒都报, 2013-03-28(6).
[17]	程铁辕. 烈性酒国际化经验对我国白酒出口启示[J]. 酿酒科技, 2020(1): 131-135.

为你推荐

友情链接