1. 研究背景与意义
离散制造业,作为中国国民经济的坚强支撑,其能源消耗问题一直备受瞩目。能源消耗不仅是生产流程中不可或缺的一环,更与企业的生产成本、环境保护以及可持续发展等宏观议题紧密相连,同时因离散制造业生产多样化、定制化产品,且生产过程复杂多变的特点,能源消耗不稳定。因此,对离散制造业的能源消耗进行精确预测,具有深远的研究价值和实践意义。
首先,能源消耗预测[1]在优化资源配置、提升能源利用效率方面扮演着至关重要的角色。在离散制造业中,能源是推动生产的核心要素,其消耗量和利用效率直接关系到企业的生产成本和市场竞争力。通过精准的能源消耗预测,企业能够清晰地把握能源需求的变化趋势,从而科学规划生产计划、优化生产流程。同时,预测结果还能为企业提供节能降耗的决策依据,帮助企业准确识别能源消耗的瓶颈环节,采取针对性的改进措施,从而大幅提升能源利用效率,降低生产成本,增强产品竞争力,为企业的可持续发展注入强劲动力。
此外,能源消耗预测在推动节能减排、促进绿色发展方面也发挥着重要作用[2]。在全球气候变化和资源日益紧张的背景下,节能减排已成为全球共识。中国离散制造业作为能源消耗大户,其节能减排任务尤为艰巨。通过能源消耗预测,企业能够及时发现能源消耗中的不合理现象,为采取节能减排措施提供有力的数据支持。这不仅有助于企业降低运营成本、提升经济效益,还能为环境保护和可持续发展贡献力量,彰显企业的社会责任感。
值得注意的是,离散制造业的能源消耗构成复杂多样,涵盖了电力、燃料、热力等多个方面。其中,电力资源作为生产流程中不可或缺的要素,其合理利用与有效管理对于企业的生产效率、成本控制以及环境保护至关重要。因此,本文从众多能源中选取电力资源消耗作为典型进行预测分析。通过精确预测电力资源消耗,企业可以优化资源配置、提升用电效率,进一步促进节能减排和可持续发展。
本研究选取了北京地区典型离散制造企业的真实数据进行了实验验证。数据涵盖了2023年4月至2024年11月的典型产品装配数量与用电量。实验结果表明,所提出的基于产能与能源消耗模型在离散制造业能源消耗预测方面的准确率较高,残差近似于正态分布。这一成果不仅进一步验证了产能在能源消耗预测领域的应用潜力,也为该模型在实际生产环境中的推广应用奠定了坚实基础。未来,随着技术的不断进步和应用的深入推广,相信该模型将为离散制造业的可持续发展注入更多的活力和动力。
2. 离散制造业分析及数据准备
2.1. 离散制造业的特点及模型选择
离散制造业具有多样化、定制化、离散性、生产设备多样性和生产计划灵活性等特点。在选择能源消耗预测模型时,需要考虑数据的可用性、模型的复杂性和可解释性、计算效率和实时性以及模型的泛化能力等因素。通过选择合适的预测模型,离散制造业可以更有效地管理其能源消耗,提高生产效率、降低成本并促进可持续发展。
2.1.1. 离散制造业的特点
离散制造业是制造业的一个重要分支,相比流程行业其特点:一是产品多样化与定制化,离散制造业通常生产的是多种类型的产品,且这些产品往往需要根据客户的具体需求进行定制。这种多样化与定制化的生产方式使得生产流程复杂多变,能源消耗也呈现出不稳定性;二是生产过程的离散性;与流程制造业相比,离散制造业的生产过程更加离散。产品通常由多个独立的零部件组成,这些零部件在不同的生产线上进行加工和组装,最终形成完整的产品。这种离散性使得能源消耗的监控和预测更加困难;三是设备的多样性和计划的灵活性;离散制造业的生产设备种类繁多,生产计划通常需要根据市场需求、订单情况等因素进行灵活调整。这种灵活性使得能源消耗预测需要更加动态和实时。
2.1.2. 模型选择
离散制造业与流程制造业在能源消耗预测方面存在显著差异,主要体现在离散制造业的多样化、定制化生产方式、离散的生产过程、多样的生产设备、灵活的生产计划以及多样的能源消耗类型,这些因素使得其能源消耗预测变得复杂且难以通过简单的线性关系进行统计分析。
针对这些特点,本文提出了以下模型选择方向:首先,基于时间序列的预测模型,如ARIMA模型和指数平滑法,适用于处理具有时间序列特性的数据,能够捕捉时间序列中的趋势和季节性变化,从而提供准确的预测结果;其次,机器学习模型,如支持向量机(SVM)、随机森林和神经网络[3],能够处理复杂的非线性关系和高维数据,适用于捕捉能源消耗与产品类型、生产设备、生产时间等多种因素之间的复杂关系;最后,深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)及其变体(如LSTM),在处理时间序列数据和复杂关系方面具有更强的能力,能够捕捉生产过程中的深层特征,从而提高预测的准确性和稳定性。考虑到能源消耗的时间依赖性,本文采用时间序列分析方法,具体使用ARIMA模型来捕捉时间序列中的趋势、季节性和波动性,以实现对未来能源消耗的准确预测。
2.2. 能耗数据准备
在离散制造业能源消耗预测的研究中,数据收集与预处理以及数据分析与特征提取是至关重要的步骤。首先,数据来源主要依赖于现场安装的DTSD1352-KC型多功能电表(计量精度为0.5 S级),实时反馈用电量数据至厂区能耗监测平台,收集的用电量数据涵盖了多个维度,包括用电量、关键产品产量、法定工作日天数、额外假期、出勤人数、设备损坏天数、完工及时率、产品合格率以及生产有效工时比等。这些数据为后续分析提供了坚实的基础。在数据预处理阶段,对收集到的数据进行了清洗和整理,去除了异常值和缺失值,以确保数据的质量和可靠性。特别地,针对数据中包含的额外假期(如企业年休、展会停产假期等),将其与法定工作日天数合并为“工作天数”这一统一特征,同时删除了监控测试初期2个月的不稳定数据,以消除数据波动对分析结果的影响。
在数据分析与特征提取阶段,首先通过相关性分析[4],探究了生产产量与用电能源消耗因素之间的关系,确定了关键产品产量和工作天数是影响用电消耗的主要因素。基于这一分析结果,进一步提取了对用电量预测具有重要影响的特征变量,即关键产品产量和工作天数。经过处理后,得到的数据如表1所示:
Table 1. Statistical data table of energy consumption
表1. 能耗统计数据表
Riqi (统计月份) |
Zpsl (产品装配数量) |
Gzts (工作天数) |
Nyxh (能源消耗统计KWH) |
2023/4/1 |
2048 |
20 |
175835.68 |
2023/5/1 |
2861 |
21 |
182252.73 |
2023/6/1 |
2699 |
21 |
111002.26 |
2023/7/1 |
2203 |
21 |
236132.1 |
2023/8/1 |
2630 |
23 |
162664.26 |
2023/9/1 |
2101 |
20 |
155655.81 |
2023/10/1 |
1868 |
19 |
133587.67 |
2023/11/1 |
2796 |
22 |
153491.97 |
2023/12/1 |
3462 |
21 |
149385.01 |
2024/1/1 |
2993 |
22 |
129924.05 |
2024/2/1 |
1968 |
18 |
86878.9 |
2024/3/1 |
3395 |
21 |
156211.99 |
2024/4/1 |
1857 |
22 |
125468.33 |
2024/5/1 |
1367 |
21 |
124013.6 |
2024/6/1 |
2339 |
19 |
144279.93 |
2024/7/1 |
2239 |
23 |
177632.11 |
2024/8/1 |
2167 |
24 |
140150.6 |
2024/9/1 |
2766 |
21 |
138333.14 |
2024/10/1 |
1743 |
19 |
105200.87 |
2024/11/1 |
3032 |
23 |
133222.5 |
3. 基于ARIMA算法的能耗预测模型
3.1. ARIMA算法原理
ARIMA算法[5],即自回归移动平均模型(Autoregressive Integrated Moving Average Model),是一种经典的时间序列分析和预测方法,广泛应用于经济学、金融学、气象学等领域,用于预测具有线性趋势和季节性变化的数据。ARIMA算法的原理可以分为三个部分:一是自回归(AR) [6],指时间序列数据之间存在一定的自相关性,即当前时刻的数据与过去时刻的数据相关。AR模型假设未来的值是过去值的线性组合,当前时刻的值与前面若干时间点的值有关。自回归阶数p表示当前时间点与前面p个时间点的值有关。AR模型可以表示为:
其中,Yt为当前时刻的值,c为常数,φ为参数,ϵt为误差项。差分(I)和移动平均(MA)。
二是差分是指通过对时间序列数据进行一阶或多阶差分,将非平稳时间序列转化为平稳时间序列。平稳时间序列的特点是均值和方差不随时间变化,这使得数据更易分析和预测。差分的目的是消除数据的趋势和季节性,使得数据更具有稳定性。差分阶数d表示需要对时间序列数据进行差分的次数。
三是移动平均(MA),指在时间序列数据中,当前时刻的值与前若干个历史误差项的线性组合相关。也就是说,当前时间点的值与前面若干时间点的误差有关。移动平均阶数q表示当前时间点与前面q个时间点的误差有关。MA模型可以表示为:
ARIMA模型将AR、I和MA模型结合起来[7],可以表示为ARIMA (p, d, q)模型。其中,p为自回归阶数,d为差分阶数,q为移动平均阶数。ARIMA模型的基本原理可以用以下公式表示:
该模型整体上可表示为ARIMA (p, d, q),其中三个参数含义如下:p为自回归模型阶数,d差分阶数,q为移动平均模型阶数,如果我们暂时不考虑差分(即假设d = 0),那么ARIMA模型可以被看作是AR模型和MA模型的直接结合,形式上看,ARIMA模型的公式可以表示为:
公式中:
是时间序列数据,
到
是AR模型的参数,用来描述当前值与过去p个时间点值之间的关系。
到
是MA表示模型的参数,用来描述当前值与过去q个时间点的误差之间的关系。
是在t时间点的误差项。c是一个常数项。模型ARIMA (p, d, q)模型d为使时间序列平稳时所做的最小差分次数,差分的阶数不超过2。ARIMA模型通过对时间序列数据进行分析和拟合,估计出合适的模型参数,从而进行数据预测和建模。
3.2. ARIMA模型训练流程
Figure 1. Training flowchart
图1. 训练流程图
首先对能源消耗数据进行单变量线性回归分析,以初步探索时间序列数据的线性趋势。通过构建能源消耗与时间之间的简单线性关系,为后续提供基础预测结果,并识别数据中的主要趋势特征。在单变量分析的基础上,引入多变量线性回归模型,将关键影响因素纳入预测框架。通过分析变量与能源消耗之间的线性关系,优化预测结果,验证多变量模型对预测精度的提升效果。为了确定ARIMA模型的参数(即差分阶数dd、自回归阶数pp和移动平均阶数qq),绘制能源消耗与时间以及相关变量的散点图,初步判断时间序列的平稳性以及模型的阶数范围。基于上述的参数,构建ARIMA模型[8],并对能源消耗时间序列进行拟合。通过模型训练,捕捉时间序列中的趋势、季节性和随机波动特征,同时利用残差分析验证模型的拟合效果。残差呈现白噪声特性,则表明模型具有良好的预测能力。最后,利用训练好的ARIMA模型对未来能源消耗进行预测。通过将预测结果与实际数据进行对比,评估模型的准确性和稳定性,并根据需要进一步优化模型参数或引入其他特征变量,以提高预测精度。如图1所示。
3.3. 能耗预测模型建立过程
为了验证上述研究方法的有效性,本研究选取某离散制造业企业作为研究对象,收集其能耗数据,并按照前述步骤进行预测分析[9]。通过对比预测结果与实际能耗数据,评估模型的预测性能,并根据预测结果提出相应的优化建议。首先,收集企业能耗数据,包括用电量、装配数量、工作天数等关键变量,并对数据进行清洗和预处理,去除异常值和缺失值,确保数据的完整性和可靠性。随后,使用时间序列线性模型来预测能耗需求量,以装配数量作为主要预测变量,构建线性回归模型,分析装配数量与能耗之间的线性关系,初步预测结果如图2所示。将预测结果与实际能耗数据进行对比,计算预测误差,评估模型的预测性能。若预测误差较大,则进一步优化模型或引入其他变量。根据预测结果和误差分析,提出优化建议,例如引入更多相关变量或采用更复杂的模型以提高预测准确性。图2展示了基于装配数量的能耗预测结果,从图中可以看出,预测值与实际值在某些时间段内吻合较好,但在其他时间段存在一定偏差,表明仅依赖装配数量作为预测变量可能无法完全捕捉能耗的复杂性。通过上述分析,验证了时间序列线性模型在能耗预测中的适用性,同时也为模型的优化提供了方向,为离散制造业企业的能源管理提供了科学依据,有助于实现更高效的能源利用和成本控制。
Figure 2. Prediction results of linear model
图2. 线性模型预测结果
模型R-squared非常低,只有0.03428,说明模型的拟合效果很差。p-value:0.4345模型整体而言不够显著。残差的标准误差较大(32,620),说明模型的预测误差较大。残差序列存在自相关如图3所示。
加入工作天数变量后,R-squared提高到0.08904,p-value = 0.4526结果表明这是一个改进,但仍然不是很好的拟合效果。主要产品装配数量和工作天数的影响都显著,符合预期。残差的标准误降低到32,600,但仍然较高。残差序列的自相关仍然存在,模型仍需进一步改进。
Figure 3. Model analysis diagram
图3. 模型分析图
引入了工作天数作为额外的预测变量。预测结果如下图4所示。
Figure 4. Prediction results of the linear model after adding variables
图4. 增加变量后的线性模型预测结果
根据能源消耗的散点图,如下图5所示,根据其形状进一步推断可进一步考虑二阶模型,需要引入二次项需要再次改进模型。
Figure 5. Scatter plot of energy consumption
图5. 能源消耗散点图
改用ARIMA对数据进行分析,如下图6所示,拟合结果很好。得出ARIMA (2, 1, 0)模型。残差序列是指训练数据原本的序列与拟合得到的序列之间的差值。为了确保模型确定的阶数合适,需要进行残差检验,从而推断模型对数据所包含信息的提取程度,提取的越充分代表模型拟合的越好。如果残差序列是随机正态分布的、不自相关的,这说明模型提取的信息充分;相反地,如果残差序列不满足上述条件,这说明拟合出的模型对数据信息提取的不够充分、不够有效。
Figure 6. Schematic diagram of ARIMA goodness of fit analysis
图6. ARIMA拟合度分析图示
本案例残差检验的输出结果如图7、图8所示,残差接近于正态分布;ACF和PACF图中几乎所有的点都在蓝线以内,所有逆根都在单位圆之内,说明拟合的模型是平稳且可逆的,说明残差无自相关性。因此,本文对一车间制丝用电量原始时间序列数据的一阶差分时间序列所建的ARIMA (2, 1, 0)模型是有效的,可以用该模型进行预测。
Figure 7. Analysis chart of ARIMA prediction
图7. ARIMA预测分析图
Figure 8. Analysis chart of ARIMA fitting
图8. ARIMA拟合分析图
基于所建立的ARIMA (2, 1, 0)模型对一车间制丝用电量进行预测,预测结果如图9所示,后续改值可进一步进行测试。
Figure 9. Energy prediction chart based on ARIMA model
图9. 基于ARIMA模型能源预测图
4. 结论与展望
通过对离散制造业能耗预测研究,可以得出以下结论:合适的预测模型和方法能够实现对离散制造业能耗的精确预测。预测结果有助于企业优化能耗资源配置、提升能耗效率,实现可持续发展。未来,随着大数据、人工智能等技术的不断发展,可以进一步探索更加先进的预测模型和方法,以提高预测精度和泛化能力,为离散制造业的可持续发展提供更加有力的支持。