1. 引言
2020年,全国总发电量为76,264亿千瓦时,其中燃煤机组发电量为46,296亿千瓦时,占比为60.69%,同比2019年增长1.7%。报告显示,火力发电仍处于我国电力供应的重要地位 [1]。因此,为了实现碳减排,仍要推进燃煤机组运行优化,进一步提高燃烧效率、降低煤耗。
建立合理的锅炉燃烧系统模型是锅炉燃烧优化、提高燃烧效率的基础 [2] [3]。相比于根据传递机理建立模型,具有强耦合、非线性、输入输出时序性等特点的锅炉燃烧系统更适合使用智能算法对历史运行数据进行信息挖掘,建立系统模型。
目前,应用于燃烧系统建模的主要建模算法以经典的机器学习算法为主。例如,采用BP神经网络对锅炉飞灰含碳量进行预测 [4]、建立燃烧系统优化模型 [5] [6];王春林 [7] 等人对比分析支持向量机和BP神经网络对于锅炉氮氧化物排放预测模型的效果,发现基于遗传算法优化的支持向量机预测模型精度更高,但相比之下建模时间也越长,不适用在线优化;宋清昆 [8] 采用收敛速度快的径向基(RBF)神经网络对锅炉燃烧系统建模,但是单纯的RBF神经网络隐含层节点选取随机且泛化能力较差,王彪 [9] 提出结合遗传算法优化RBF神经网络的结构参数,无需反复试验即可快速得到精确的锅炉燃烧系统模型。
提取输入数据特征、选取递归神经网络是提高建模精度和速度的手段之一。采用核主元分析法 [10]、互信息“最小冗余最大相关”准则 [11] 进行数据降维,可减少模型输入数量,采用双向门控循环神经网络 [12] 建立模型,提高模型精度。
因此,文章提出一种基于主成分分析和长短期记忆神经网络的锅炉燃烧系统模型,选取给煤量、一次风量、二次风量等50个参数,将经主成分分析降维后的数据作为模型输入参数构建模型,并与传统循环神经网络(RNN)、LSTM模型对比发现,文章所建立的PCA-LSTM模型精度相对更高且运行速度更快。
2. 模型建立
2.1. 主成分分析法(PCA)
输入参数包括一次风量、各燃烧层给煤量、各风门开度等50个参数,这些参数之间可能存在关联关系,在建立模型时,可以通过数据降维的方法,保留高维度的数据最重要的一些特征,去除不重要的特征和噪声,以此来提升数据的处理速度。
主成分分析法是一种常用的降维方法,将原始数据通过正交向量投射到新空间,变换成一组互相不相关的新变量,转换后得到的综合性新变量被称为主成分,用于替代原始数据,实现数据降维,过程如下:
1) 有m组数据、每组数据包含n个变量,构成n × m矩阵
,记作M,计算矩阵M的协方差矩阵R:
(1)
2) 特征值
通过特征值分解公式及降序排列得到,特征向量
与特征值
对应;
(2)
(3)
3) 计算前k个特征值的累计贡献率con:
(4)
4) 选择累计贡献率超过80%时对应的k个主成分,将其作为能够代表原数据特征的新数据。
以湖北某电厂的一台1000 MW超超临界直流炉为研究对象,选其连续运行的36,000条数据,采样间隔时间为2 min。选择负荷、环境温度、入炉煤热值、给煤量等共50个参数作为输入,以排烟热损失(q2)和固体未完全燃烧损失(q4)2个参数代表锅炉热效率,作为模型的输出。输入参数数值大小存在差异,量纲不一致。在进行降维前,对原始数据进行归一化处理。
首先将归一化处理后的数据进行主成分分析,协方差矩阵特征值结果如表1所示。通过表格可以看出,10个主成分的累计贡献率已经超出了80%,因此用新生成的10个综合变量代表原始运行参数进行LSTM网络模型的建立。

Table 1. Results of principal component analysis
表1. 主成分分析结果
2.2. 长短期记忆神经网络(LSTM)
长短期时间记忆(LSTM)是一类特殊的循环神经网络,通过细胞状态和门限结构实现信息传递与增减 [13]。对于锅炉燃烧系统建模,输入变量在各时间点并非互相独立,与历史数据密切相关,采用LSTM能够取得较好的训练结果 [14]。
本文采用PCA算法对输入数据进行降维处理,并将新的综合指标作为LSTM模型的输入,采用平均绝对误差(MAE)作为评判标准对比测试数据的预测结果与实际结果,建立较为理想的锅炉燃烧系统模型。模型建立过程如图1所示。

Figure 1. Flow chart of PCA-LSTM model establishment
图1. PCA-LSTM模型建立流程图
将PCA降维处理后的数据80%作为训练数据,20%作为测试数据;确定LSTM网络模型结构,获得锅炉燃烧系统模型,将测试数据输入模型,得到预测结果,与实际结果进行分析对比,评估模型效果。多次试验得出,网络隐含层节点数设置为11,学习率为0.01时,模型误差最小,为4.898%,模型效果最好,对q2及q4的预测效果如图2和图3所示。

Figure 2. Prediction results of exhaust heat loss
图2. 排烟热损失预测结果

Figure 3. Prediction result of incomplete combustion loss of solid
图3. 固体未完全燃烧损失预测结果
表2为RNN、LSTM、PCA-LSTM模型之间的误差和计算时间的比较。从表中可以看出,PCA-SLTM模型结果在泛化能力和计算速度上均优于传统RNN模型,而对于未进行主成分分析的LSTM模型,模型准确度大致相等,但运算速度提高,对于具有滞后性的锅炉燃烧系统模型而言,越短的运算时间越有利于锅炉燃烧在线优化技术的发展。

Table 2. Results of principal component analysis
表2. 主成分分析结果
3. 总结
针对锅炉燃烧效率与锅炉系统多个变量有关以及运行数据的时序特性,文章通过主成分分析方法对机组历史运行数据进行降维处理,利用LSTM神经网络建立锅炉燃烧系统模型,以此反映燃烧特性,结果表明该方法相较于仅使用LSTM的燃烧系统模型而言,效果且速度更快,为后续进一步研究燃烧在线优化提供参考。