基于ARIMA模型的离散制造业能源消耗预测
Energy Consumption Prediction Based on ARIMA Model in the Discrete Manufacturing Industry
摘要: 离散制造业作为国民经济的重要支柱,其能源消耗问题关乎企业成本、环保与可持续发展。针对该行业生产多样化、定制化导致的能耗不稳定性问题,本研究旨在构建合适的精准能源预测模型,助力企业优化资源配置、提升效率与竞争力。基于北京地区典型离散制造企业2023年4月至2024年11月共20个月的月度真实运行数据,经严格数据清洗与特征工程,筛选出关键产品装配数量与工作天数作为核心输入特征。采用时间序列分析方法,构建ARIMA (2, 1, 0)能耗预测模型。实验结果表明,该模型在测试集上预测性能良好,验证了产能特征与工作天数特征组合在离散制造业能耗预测中的有效性及应用价值。研究表明ARIMA模型能够有效支持离散制造企业能耗的精准预测,为节能降耗与可持续发展决策提供量化依据。未来研究将融合大数据与人工智能技术,探索具备更高精度与泛化能力的先进预测模型。
Abstract: Discrete manufacturing industry acts as an important support for national economy and its energy consumption matters enterprise cost, environmental protection, and sustainable development. Aiming at the problem of energy consumption instability caused by the industrial production diversification and customization, a proper and precise energy prediction model was established in this paper to help enterprises optimize their resource allocation and enhance their efficiency and competitiveness. Based on the monthly practical operating data from a typical discrete manufacturing enterprise in Beijing from April 2023 to November 2024, the critical production assemblies and working days were screened out as the core input features after the strict data cleansing and featurization. Then based on the time series analysis method, an ARIMA (2, 1, 0) energy consumption prediction model was built. The experimental results revealed that the model performed well in prediction in terms of the test set, and verified the effectiveness and application value of the feature combination of capacity characteristics and working days in predicting the energy consumption of discrete manufacturing industry. The research proved that the ARIMA model worked efficiently in the precise prediction of energy consumption in the discrete manufacturing enterprises. It would provide a quantitative basis for any decision made on energy saving, cost reducing, and sustainable development. In the future, big data and AI technology will be fused in the research to explore the advanced prediction model with higher precision and generalization capability.
文章引用:肖卓挺. 基于ARIMA模型的离散制造业能源消耗预测[J]. 软件工程与应用, 2025, 14(4): 886-896. https://doi.org/10.12677/sea.2025.144078

1. 研究背景与意义

离散制造业,作为中国国民经济的坚强支撑,其能源消耗问题一直备受瞩目。能源消耗不仅是生产流程中不可或缺的一环,更与企业的生产成本、环境保护以及可持续发展等宏观议题紧密相连,同时因离散制造业生产多样化、定制化产品,且生产过程复杂多变的特点,能源消耗不稳定。因此,对离散制造业的能源消耗进行精确预测,具有深远的研究价值和实践意义。

首先,能源消耗预测[1]在优化资源配置、提升能源利用效率方面扮演着至关重要的角色。在离散制造业中,能源是推动生产的核心要素,其消耗量和利用效率直接关系到企业的生产成本和市场竞争力。通过精准的能源消耗预测,企业能够清晰地把握能源需求的变化趋势,从而科学规划生产计划、优化生产流程。同时,预测结果还能为企业提供节能降耗的决策依据,帮助企业准确识别能源消耗的瓶颈环节,采取针对性的改进措施,从而大幅提升能源利用效率,降低生产成本,增强产品竞争力,为企业的可持续发展注入强劲动力。

此外,能源消耗预测在推动节能减排、促进绿色发展方面也发挥着重要作用[2]。在全球气候变化和资源日益紧张的背景下,节能减排已成为全球共识。中国离散制造业作为能源消耗大户,其节能减排任务尤为艰巨。通过能源消耗预测,企业能够及时发现能源消耗中的不合理现象,为采取节能减排措施提供有力的数据支持。这不仅有助于企业降低运营成本、提升经济效益,还能为环境保护和可持续发展贡献力量,彰显企业的社会责任感。

值得注意的是,离散制造业的能源消耗构成复杂多样,涵盖了电力、燃料、热力等多个方面。其中,电力资源作为生产流程中不可或缺的要素,其合理利用与有效管理对于企业的生产效率、成本控制以及环境保护至关重要。因此,本文从众多能源中选取电力资源消耗作为典型进行预测分析。通过精确预测电力资源消耗,企业可以优化资源配置、提升用电效率,进一步促进节能减排和可持续发展。

本研究选取了北京地区典型离散制造企业的真实数据进行了实验验证。数据涵盖了2023年4月至2024年11月的典型产品装配数量与用电量。实验结果表明,所提出的基于产能与能源消耗模型在离散制造业能源消耗预测方面的准确率较高,残差近似于正态分布。这一成果不仅进一步验证了产能在能源消耗预测领域的应用潜力,也为该模型在实际生产环境中的推广应用奠定了坚实基础。未来,随着技术的不断进步和应用的深入推广,相信该模型将为离散制造业的可持续发展注入更多的活力和动力。

2. 离散制造业分析及数据准备

2.1. 离散制造业的特点及模型选择

离散制造业具有多样化、定制化、离散性、生产设备多样性和生产计划灵活性等特点。在选择能源消耗预测模型时,需要考虑数据的可用性、模型的复杂性和可解释性、计算效率和实时性以及模型的泛化能力等因素。通过选择合适的预测模型,离散制造业可以更有效地管理其能源消耗,提高生产效率、降低成本并促进可持续发展。

2.1.1. 离散制造业的特点

离散制造业是制造业的一个重要分支,相比流程行业其特点:一是产品多样化与定制化,离散制造业通常生产的是多种类型的产品,且这些产品往往需要根据客户的具体需求进行定制。这种多样化与定制化的生产方式使得生产流程复杂多变,能源消耗也呈现出不稳定性;二是生产过程的离散性;与流程制造业相比,离散制造业的生产过程更加离散。产品通常由多个独立的零部件组成,这些零部件在不同的生产线上进行加工和组装,最终形成完整的产品。这种离散性使得能源消耗的监控和预测更加困难;三是设备的多样性和计划的灵活性;离散制造业的生产设备种类繁多,生产计划通常需要根据市场需求、订单情况等因素进行灵活调整。这种灵活性使得能源消耗预测需要更加动态和实时。

2.1.2. 模型选择

离散制造业与流程制造业在能源消耗预测方面存在显著差异,主要体现在离散制造业的多样化、定制化生产方式、离散的生产过程、多样的生产设备、灵活的生产计划以及多样的能源消耗类型,这些因素使得其能源消耗预测变得复杂且难以通过简单的线性关系进行统计分析。

针对这些特点,本文提出了以下模型选择方向:首先,基于时间序列的预测模型,如ARIMA模型和指数平滑法,适用于处理具有时间序列特性的数据,能够捕捉时间序列中的趋势和季节性变化,从而提供准确的预测结果;其次,机器学习模型,如支持向量机(SVM)、随机森林和神经网络[3],能够处理复杂的非线性关系和高维数据,适用于捕捉能源消耗与产品类型、生产设备、生产时间等多种因素之间的复杂关系;最后,深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)及其变体(如LSTM),在处理时间序列数据和复杂关系方面具有更强的能力,能够捕捉生产过程中的深层特征,从而提高预测的准确性和稳定性。考虑到能源消耗的时间依赖性,本文采用时间序列分析方法,具体使用ARIMA模型来捕捉时间序列中的趋势、季节性和波动性,以实现对未来能源消耗的准确预测。

2.2. 能耗数据准备

在离散制造业能源消耗预测的研究中,数据收集与预处理以及数据分析与特征提取是至关重要的步骤。首先,数据来源主要依赖于现场安装的DTSD1352-KC型多功能电表(计量精度为0.5 S级),实时反馈用电量数据至厂区能耗监测平台,收集的用电量数据涵盖了多个维度,包括用电量、关键产品产量、法定工作日天数、额外假期、出勤人数、设备损坏天数、完工及时率、产品合格率以及生产有效工时比等。这些数据为后续分析提供了坚实的基础。在数据预处理阶段,对收集到的数据进行了清洗和整理,去除了异常值和缺失值,以确保数据的质量和可靠性。特别地,针对数据中包含的额外假期(如企业年休、展会停产假期等),将其与法定工作日天数合并为“工作天数”这一统一特征,同时删除了监控测试初期2个月的不稳定数据,以消除数据波动对分析结果的影响。

在数据分析与特征提取阶段,首先通过相关性分析[4],探究了生产产量与用电能源消耗因素之间的关系,确定了关键产品产量和工作天数是影响用电消耗的主要因素。基于这一分析结果,进一步提取了对用电量预测具有重要影响的特征变量,即关键产品产量和工作天数。经过处理后,得到的数据如表1所示:

Table 1. Statistical data table of energy consumption

1. 能耗统计数据表

Riqi (统计月份)

Zpsl (产品装配数量)

Gzts (工作天数)

Nyxh (能源消耗统计KWH)

2023/4/1

2048

20

175835.68

2023/5/1

2861

21

182252.73

2023/6/1

2699

21

111002.26

2023/7/1

2203

21

236132.1

2023/8/1

2630

23

162664.26

2023/9/1

2101

20

155655.81

2023/10/1

1868

19

133587.67

2023/11/1

2796

22

153491.97

2023/12/1

3462

21

149385.01

2024/1/1

2993

22

129924.05

2024/2/1

1968

18

86878.9

2024/3/1

3395

21

156211.99

2024/4/1

1857

22

125468.33

2024/5/1

1367

21

124013.6

2024/6/1

2339

19

144279.93

2024/7/1

2239

23

177632.11

2024/8/1

2167

24

140150.6

2024/9/1

2766

21

138333.14

2024/10/1

1743

19

105200.87

2024/11/1

3032

23

133222.5

3. 基于ARIMA算法的能耗预测模型

3.1. ARIMA算法原理

ARIMA算法[5],即自回归移动平均模型(Autoregressive Integrated Moving Average Model),是一种经典的时间序列分析和预测方法,广泛应用于经济学、金融学、气象学等领域,用于预测具有线性趋势和季节性变化的数据。ARIMA算法的原理可以分为三个部分:一是自回归(AR) [6],指时间序列数据之间存在一定的自相关性,即当前时刻的数据与过去时刻的数据相关。AR模型假设未来的值是过去值的线性组合,当前时刻的值与前面若干时间点的值有关。自回归阶数p表示当前时间点与前面p个时间点的值有关。AR模型可以表示为:

AR Y t =c+ φ 1 Y t1 + φ 2 Y t2 ++ φ p Y tp + ξ t

其中,Yt为当前时刻的值,c为常数,φ为参数,ϵt为误差项。差分(I)和移动平均(MA)。

二是差分是指通过对时间序列数据进行一阶或多阶差分,将非平稳时间序列转化为平稳时间序列。平稳时间序列的特点是均值和方差不随时间变化,这使得数据更易分析和预测。差分的目的是消除数据的趋势和季节性,使得数据更具有稳定性。差分阶数d表示需要对时间序列数据进行差分的次数。

三是移动平均(MA),指在时间序列数据中,当前时刻的值与前若干个历史误差项的线性组合相关。也就是说,当前时间点的值与前面若干时间点的误差有关。移动平均阶数q表示当前时间点与前面q个时间点的误差有关。MA模型可以表示为:

MA Y t =μ+ ϵ t + ϑ 1 ϵ t1 + ϑ 2 ϵ t2 ++ ϑ q ϵ tq

ARIMA模型将ARIMA模型结合起来[7],可以表示为ARIMA (p, d, q)模型。其中,p为自回归阶数,d为差分阶数,q为移动平均阶数。ARIMA模型的基本原理可以用以下公式表示:

ARIMA( p,d,q )=AR( p )+I( d )+MA( q )

该模型整体上可表示为ARIMA (p, d, q),其中三个参数含义如下:p为自回归模型阶数,d差分阶数,q为移动平均模型阶数,如果我们暂时不考虑差分(即假设d = 0),那么ARIMA模型可以被看作是AR模型和MA模型的直接结合,形式上看,ARIMA模型的公式可以表示为:

Y t =c+ φ 1 Y t1 + φ 2 Y t2 ++ φ p Y tp + ϑ 1 ϵ t1

公式中: Y t 是时间序列数据, φ 1 φ p AR模型的参数,用来描述当前值与过去p个时间点值之间的关系。 ϑ 1 ϑ p MA表示模型的参数,用来描述当前值与过去q个时间点的误差之间的关系。 ϵ t 是在t时间点的误差项。c是一个常数项。模型ARIMA (p, d, q)模型d为使时间序列平稳时所做的最小差分次数,差分的阶数不超过2。ARIMA模型通过对时间序列数据进行分析和拟合,估计出合适的模型参数,从而进行数据预测和建模。

3.2. ARIMA模型训练流程

Figure 1. Training flowchart

1. 训练流程图

首先对能源消耗数据进行单变量线性回归分析,以初步探索时间序列数据的线性趋势。通过构建能源消耗与时间之间的简单线性关系,为后续提供基础预测结果,并识别数据中的主要趋势特征。在单变量分析的基础上,引入多变量线性回归模型,将关键影响因素纳入预测框架。通过分析变量与能源消耗之间的线性关系,优化预测结果,验证多变量模型对预测精度的提升效果。为了确定ARIMA模型的参数(即差分阶数dd、自回归阶数pp和移动平均阶数qq),绘制能源消耗与时间以及相关变量的散点图,初步判断时间序列的平稳性以及模型的阶数范围。基于上述的参数,构建ARIMA模型[8],并对能源消耗时间序列进行拟合。通过模型训练,捕捉时间序列中的趋势、季节性和随机波动特征,同时利用残差分析验证模型的拟合效果。残差呈现白噪声特性,则表明模型具有良好的预测能力。最后,利用训练好的ARIMA模型对未来能源消耗进行预测。通过将预测结果与实际数据进行对比,评估模型的准确性和稳定性,并根据需要进一步优化模型参数或引入其他特征变量,以提高预测精度。如图1所示。

3.3. 能耗预测模型建立过程

为了验证上述研究方法的有效性,本研究选取某离散制造业企业作为研究对象,收集其能耗数据,并按照前述步骤进行预测分析[9]。通过对比预测结果与实际能耗数据,评估模型的预测性能,并根据预测结果提出相应的优化建议。首先,收集企业能耗数据,包括用电量、装配数量、工作天数等关键变量,并对数据进行清洗和预处理,去除异常值和缺失值,确保数据的完整性和可靠性。随后,使用时间序列线性模型来预测能耗需求量,以装配数量作为主要预测变量,构建线性回归模型,分析装配数量与能耗之间的线性关系,初步预测结果如图2所示。将预测结果与实际能耗数据进行对比,计算预测误差,评估模型的预测性能。若预测误差较大,则进一步优化模型或引入其他变量。根据预测结果和误差分析,提出优化建议,例如引入更多相关变量或采用更复杂的模型以提高预测准确性。图2展示了基于装配数量的能耗预测结果,从图中可以看出,预测值与实际值在某些时间段内吻合较好,但在其他时间段存在一定偏差,表明仅依赖装配数量作为预测变量可能无法完全捕捉能耗的复杂性。通过上述分析,验证了时间序列线性模型在能耗预测中的适用性,同时也为模型的优化提供了方向,为离散制造业企业的能源管理提供了科学依据,有助于实现更高效的能源利用和成本控制。

Figure 2. Prediction results of linear model

2. 线性模型预测结果

模型R-squared非常低,只有0.03428,说明模型的拟合效果很差。p-value:0.4345模型整体而言不够显著。残差的标准误差较大(32,620),说明模型的预测误差较大。残差序列存在自相关如图3所示。

加入工作天数变量后,R-squared提高到0.08904,p-value = 0.4526结果表明这是一个改进,但仍然不是很好的拟合效果。主要产品装配数量和工作天数的影响都显著,符合预期。残差的标准误降低到32,600,但仍然较高。残差序列的自相关仍然存在,模型仍需进一步改进。

Figure 3. Model analysis diagram

3. 模型分析图

引入了工作天数作为额外的预测变量。预测结果如下图4所示。

Figure 4. Prediction results of the linear model after adding variables

4. 增加变量后的线性模型预测结果

根据能源消耗的散点图,如下图5所示,根据其形状进一步推断可进一步考虑二阶模型,需要引入二次项需要再次改进模型。

Figure 5. Scatter plot of energy consumption

5. 能源消耗散点图

改用ARIMA对数据进行分析,如下图6所示,拟合结果很好。得出ARIMA (2, 1, 0)模型。残差序列是指训练数据原本的序列与拟合得到的序列之间的差值。为了确保模型确定的阶数合适,需要进行残差检验,从而推断模型对数据所包含信息的提取程度,提取的越充分代表模型拟合的越好。如果残差序列是随机正态分布的、不自相关的,这说明模型提取的信息充分;相反地,如果残差序列不满足上述条件,这说明拟合出的模型对数据信息提取的不够充分、不够有效。

Figure 6. Schematic diagram of ARIMA goodness of fit analysis

6. ARIMA拟合度分析图示

本案例残差检验的输出结果如图7图8所示,残差接近于正态分布;ACF和PACF图中几乎所有的点都在蓝线以内,所有逆根都在单位圆之内,说明拟合的模型是平稳且可逆的,说明残差无自相关性。因此,本文对一车间制丝用电量原始时间序列数据的一阶差分时间序列所建的ARIMA (2, 1, 0)模型是有效的,可以用该模型进行预测。

Figure 7. Analysis chart of ARIMA prediction

7. ARIMA预测分析图

Figure 8. Analysis chart of ARIMA fitting

8. ARIMA拟合分析图

基于所建立的ARIMA (2, 1, 0)模型对一车间制丝用电量进行预测,预测结果如图9所示,后续改值可进一步进行测试。

Figure 9. Energy prediction chart based on ARIMA model

9. 基于ARIMA模型能源预测图

4. 结论与展望

通过对离散制造业能耗预测研究,可以得出以下结论:合适的预测模型和方法能够实现对离散制造业能耗的精确预测。预测结果有助于企业优化能耗资源配置、提升能耗效率,实现可持续发展。未来,随着大数据、人工智能等技术的不断发展,可以进一步探索更加先进的预测模型和方法,以提高预测精度和泛化能力,为离散制造业的可持续发展提供更加有力的支持。

参考文献

[1] 刘飞, 周晓娜, 蔡维. 离散制造业产品能耗限额制定的复杂特性及制定策略[J]. 机械工程学报, 2015, 51(19): 138-145.
[2] 宫运启. 基于知识的大型机电产品制造能耗模型及预测的研究[D]: [博士学位论文]. 哈尔滨: 哈尔滨工业大学, 2009.
[3] 郑明贵, 于明, 范秋蓉, 等. 中国2025-2035年碳酸锂需求预测——基于灰色关联分析和ARIMA-GM-BP神经网络的组合模型[J]. 地球科学进展, 2023, 38(4): 377-387.
[4] 王翀. 基于模型组合法的我国能源消费需求趋势预测[J]. 统计与决策, 2018, 34(20): 86-89.
[5] 易杏花, 王笑笑, 成金华, 胡松琴. 清洁能源关键矿产加工产品供需预测及保供措施研究——以锂、钴、镍为例[J]. 资源与产业, 2025, 27(1): 63-76.
[6] 赵成柏, 毛春梅. 基于ARIMA和BP神经网络组合模型的我国碳排放强度预测[J]. 长江流域资源与环境, 2012, 21(6): 665-671.
[7] 赵瑞荣, 王琳, 董应明, 张珺峰, 张帅, 张笑雄. 基于模型融合的地铁生产工序能耗辨识和预测研究[J]. 今日制造与升级, 2024(1): 18-22.
[8] 张舒. 基于ARIMA-BP组合模型的管道耗电量预测技术研究[J]. 石油石化节能与计量, 2024, 14(11): 45-50, 57.
[9] 杨韵芳. 基于ARIMA模型的校园能耗监测与分析系统的设计与实现[J]. 延边大学学报(自然科学版), 2024, 50(3): 61-69.