1. 数据驱动控制与数据驱动优化
近20年来,随着科学技术的快速发展,智能硬件与工业生产过程加速融合,产生了海量工业大数据。这些数据往往具备非线性、强耦合、时变以及大滞后现象,经典控制理论的机理建模方式已无法有效地对此类系统设备运行进行精准控制、预报和评价。因此,以数据驱动的控制和优化理论应运而生,数据驱动科学及其工程也在工程实践中迎来快速发展。
数据驱动科学与工程是数据科学、控制科学与工业领域科学的交叉学科。数据驱动科学与工程主要包括两个重要分支,数据驱动控制(Data-driven Control)以及数据驱动优化(Data-driven Optimization)。数据驱动控制[1]是直接从数据到控制器设计的控制理论和方法。当受控系统的全局数学模型完全未知时,或受控系统的模型的不确定性很大时,或受控过程结构变化很大时,很难用一个数学模型来表述;当建模成本与控制效益不好,或受控系统的机理模型太复杂,阶数太高,实际中不便分析和设计时,应考虑应用数据驱动控制理论和方法来解决实际的控制问题。
数据驱动优化的主要应用场景是受控系统的机理模型未知,且系统输入输出数据可获取的各种工业过程。数据驱动优化是指基于多源数据采用数据科学方法求解最优目标的优化过程。数据驱动优化并不改变原有的控制系统,它外挂于原有的控制系统、采集控制系统及其他系统的数据,将优化后的参数传输给原有的控制系统,以实现系统的优化。它将数据科学、控制系统、领域知识、数据通讯等多学科多领域的知识结合在一起。在处理智能制造、减碳降排等问题时,优化问题往往是具有非凸、多模态、大规模、高约束、多目标、限制条件不确定性大等特点[2]。此时,有针对性地采用智能优化算法,如遗传算法、粒子群算法、差分算法等可以有效地模拟迭代过程,求解种群演化最优解[3],从而降低工业试制成本。数据驱动优化的特点是:当对象模型未知时,仅应用系统运行的数据即可进行基于数据决策,也可利用领域知识,以及基于数据挖掘和数据处理得到的有用信息等。在实际应用中,数据驱动优化的应用领域主要包括节能优化、质量优化、工艺优化及调度优化。
2. 数据驱动优化的实施策略
基于工业生产过程中的大量在线和离线数据,数据驱动优化过程的实施策略主要分为数据预处理、数据特征工程、人工智能与优化算法选择、实施优化过程。数据驱动优化实施策略的主要流程如图1所示。
Figure 1. Main steps of data-driven optimization implementation strategy
图1. 数据驱动优化实施策略的主要步骤
第一步,数据预处理。生产过程中的离线数据往往作为训练集和测试集,在线数据可以作为测试集和验证集。所有数据标记时间戳后,存储在数据服务器上,其存储一般采用Hadoop等大数据处理架构。缺失数据一般采用插值法或均值法进行补齐,异常数据根据实际情况进行修正或删除。
第二步,数据特征工程。针对工业数据的大滞后现象,进行数据延迟滞后分析,确认滞后时长便于后续计算。皮尔森相关系数、动态时间规整等方法均可用来确认关键影响特征,输入属性的降维将加快建模和优化的速度。
第三步,算法选择。由算法工程师基于已有数据尝试算法的可行性,进行小规模的实验,进行多算法之间的比较,确定技术方案。
第四步,建模与实施优化。由数据工程师对机理模型尚不清楚的过程对象,采用数据驱动的建模方法来建立其软测量模型。该方法从历史的输入输出数据提取有用信息,构建主导变量和辅助变量间的数学关系,结合控制工程师提供的过程知识,实现通用的软测量建模方法[4]。基于数据驱动的建模方法有:主元分析法、部分最小二乘回归方法、人工神经网络方法、支持向量机方法、模糊建模方法和高斯过程建模方法等。完成建模后,执行优化过程,包括对输出结果的优化、对神经网络过程参数的优化等。如输出结果满足要求,则交由软件工程师进行项目部署和运维,否则重新执行优化过程,重新求解全局最优或局部最优解。
3. 在垃圾焚烧发电中的应用与实践
随着我国城镇化的快速发展,城市生活垃圾的产生量持续增加。据2021年数据显示,我国城市生活垃圾清运量已高达24,805万吨。为有效处理这些垃圾,我国不断增强垃圾焚烧设施的处理能力,其日处理规模已经达到24,159万吨/年。根据“十四五”规划,到2025年,垃圾焚烧产能需进一步提升至29,200万吨/年,预计从2020年到2025年,该行业将保持4%的年复合增长率。
垃圾焚烧发电技术通过在高温条件下燃烧生活垃圾,能将垃圾中的可燃物质转化为二氧化碳和水,在此过程中产生的余热被回收用于发电。同时,该技术还涉及废气和灰渣的无害化处理,确保环境友好。面对日益严重的“垃圾围城”问题,垃圾焚烧发电作为一种能有效实现垃圾减量化、无害化及资源化的处理方式,被视为解决城市生活垃圾问题的最佳方案。这种处理方式不仅减少了垃圾的体积和质量,还通过能源回收利用为城市提供了可持续的电力供应,实现了垃圾处理的环保与经济效益的双赢。
垃圾焚烧主要有两种焚烧方式,直接焚烧和热解气化焚烧。目前国内使用较多的依然是直接焚烧技术,主要包括马丁炉排焚烧炉、滚动炉排焚烧炉等,单炉最大处理能力可达600 t/d以上,但是存在烟气控制要求高、系统复杂、投资和运行成本高等缺点。在燃烧过程中,炉内垃圾呈水平状态或波动状态,移动中前着火区向后都存在扩散过程,且因为垃圾层厚度薄、局部含水过高、热值低,很容易造成熄火。因此,对垃圾焚烧过程的精准控制和优化是提升发电量的关键。
数据驱动优化通过精准分析历史和实时数据来提升垃圾发电量,进而增强焚烧厂的盈利能力。在固定处理能力下,提升每单位垃圾的发电效率是关键。如图2所示,垃圾焚烧发电厂的运作依赖于五个核心系统:贮存与转运、垃圾焚烧、热力回收、烟气净化以及飞灰与炉渣处理。这些系统紧密协作,涉及多个学科领域,构成了一个适用数据驱动优化技术的复杂工业系统。通过利用数据分析和细化操作,实现更优的资源分配和流程控制。例如,通过分析垃圾组成数据,调整焚烧参数以最大化热能回收;同时,优化烟气净化操作,减少能耗并降低排放。数据驱动的方法不仅提高了能源效益,还增强了环保性能,为垃圾焚烧发电厂的可持续发展提供了支持。
Figure 2. System composition of waste incineration power plant
图2. 垃圾焚烧发电厂系统组成
在高温焚烧炉的操作过程中,温度和流量传感器等关键部件偶尔会发生故障,导致监测数据中出现缺失值。为应对这一问题,可以采用前后均值补充的方法来填补这些缺失值,即利用故障发生前后的有效数据计算平均值来进行替换。对于异常值的检测,本案例采用了结合统计学和集成学习的多种方法。一方面,箱型图和3西格玛法则可用于识别和过滤掉那些极端的异常数据。例如,具体到数据为0的温度或流量测量值,这些通常会被视为异常而被剔除。另一方面,隔离森林等集成学习算法能够进一步识别更复杂的异常模式,将部分显著的离群点也作为异常值排除掉。
处理滞后特征是数据分析中的关键步骤,尤其在涉及时间序列数据时。在本文中提到的方法中,通过将特征序列沿时间轴向后移动,并计算每次移位后的互信息值,可以有效地识别特征与标签之间的时间延迟关系。互信息作为衡量两个变量相互依赖性的指标,其值在移位过程中达到最大时对应的移位数即为所求的滞后量。这种方法能够为后续的数据分析和建模提供准确的时间对准,从而揭示特征与标签之间可能存在的时间延迟关系。此外,也可以采用动态时间规整[5] (Dynamic Time Warping, DTW),它是一种用于比较两个序列之间相似性的技术,动态时间规整对序列长度的不同步率具有鲁棒性,并且可以处理非线性时间扭曲。因此,在时间序列数据分析的许多其他领域得到广泛应用。DTW算法中每个位置的最小累计距离可以通过以下递推关系计算:
式中,d(i, j)表示序列A中第i个元素与序列B中第j个元素之间的距离。
在具体应用中,例如计算输入数据与发电机功率之间的相关性时,可以采用皮尔森相关系数。从图3中可以看出,发电机功率与1#焚烧炉主蒸汽流量、2#焚烧炉主蒸汽流量、1#炉炉膛上部温度、2#炉炉膛上部温度具有较高相关性。这表明较大的主蒸汽流量和炉膛上部温度会带来更大的发电机效率。这四个变量在垃圾焚烧工艺中很大程度上反映了燃烧工况的安全稳定性,并作为可控变量需要对其进行预测[6],以便在优化过程中进行约束。由于垃圾焚烧工艺的约束条件(如垃圾处理量不能改变),通过调节风量以使垃圾充分燃烧,以获得更高的主蒸汽流量和炉膛上部温度,从而增加发电机功率。因此,设置风调节风门频率作为点控制变量是合理的。改变点控制变量会影响风量的变化,故需建立风量预测模型。在案例中,所需建立的模型如表1所示。这种方法的优势在于它能够准确地捕捉到数据之间的动态关系,并为实际操作中的优化决策提供科学依据。通过精确控制和预测关键变量,可以有效提升垃圾焚烧发电的效率和稳定性。
Figure 3. Correlation analysis diagram of generator power variables
图3. 发电机功率变量相关性分析图
Table 1. Prediction model in waste incineration system
表1. 垃圾焚烧系统中的预测模型
序号 |
预测模型名称 |
序号 |
预测模型名称 |
1 |
发电机功率 |
7 |
焚烧炉一次风流量 |
2 |
焚烧炉炉膛上部温度 |
8 |
焚烧炉燃烬炉排一段一次风流量 |
3 |
主蒸汽流量 |
9 |
焚烧炉燃烧炉排三段一次风流量 |
4 |
焚烧炉燃烬炉排二段一次风流量 |
10 |
焚烧炉燃烧炉排二段一次风流量 |
5 |
焚烧炉燃烧炉排一段一次风流量 |
11 |
焚烧炉二次风流量 |
6 |
焚烧炉干燥炉排一段一次风流量 |
|
|
以主蒸汽流量预测模型为例,采用SDP-LSTM算法模型、LSTM模型、SG-LSTM模型、SG-DTW-LSTM模型、SG-PSO-LSTM模型分别进行预测[7],各模型的预测结果对比如图4所示,各主蒸汽流量预测模型性能指标对比如表2所示。
Figure 4. Comparison of prediction results of each model
图4.各模型的预测结果对比
Table 2. Comparison of performance indicators of each prediction model
表2. 各预测模型性能指标对比
模型 |
LSTM |
SG-LSTM |
SG-DTW-LSTM |
SG-PSO-LSTM |
SG-DTW-PSO-LSTM |
MSE |
1.0509 |
0.9449 |
0.8692 |
0.6367 |
0.5954 |
MAE |
0.8241 |
0.8170 |
0.7779 |
0.6206 |
0.6540 |
R2 |
0.6988 |
0.7292 |
0.7509 |
0.8175 |
0.8294 |
由图4可以看出,各预测模型的预测曲线与实际值曲线的趋势基本一致,优化后的LSTM模型与传统的LSTM模型相比,其预测结果与实际值更加贴近,误差更小。表2显示SG-DTW-PSO-LSTM模型的MSE指标均低于其他模型,决定系数R2均高于其他模型。与传统的LSTM模型相比,MSE、MAE分别降低了43.3%及20.6%,R2提高了18.7%;与SG-LSTM模型相比,MSE、MAE分别降低37.0%及20.0%,R2提高了13.7%;与SG-DTW-LSTM模型相比,MSE、MAE分别降低31.5%及12.4%,R2提高了10.1%;与SG-PSO-LSTM模型相比,MSE降低4.1%,R2提高了1.5%。综合看来,结合了滤波、动态时间规整、PSO优化算法的LSTM算法(SG-DTW-PSO-LSTM)的预测效果最佳。
以发电机功率模型为例,其模型拟合效果图如图5所示。图5(a)为发电机功率实际值和预测值对比图,图5(b)为发电机功率实际值和预测值拟合图,当前发电机功率模型预测能力较好。图6表示了主蒸汽流量、炉膛上部温度与发电机功率之间的依赖关系,其中横纵坐标分别表示两个特征,即焚烧炉主蒸汽流量和炉膛上部温度,而颜色表示发电机功率大小,由紫到黄取值逐渐变大,由图可知,当1、2#焚烧炉主蒸汽流量和炉膛上部温度都取值较大时,发电机功率也较大。
Figure 5. Generator power model fitting effect diagram
图5. 发电机功率模型拟合效果图
完成数据建模后,接下来的优化过程采用了遗传算法、粒子群算法和模拟退火算法。这些算法被用于调整决策变量以优化目标函数。在垃圾焚烧发电的情境中,优化的目标是最大化发电机功率,同时考虑维持工况的稳定性。具体到模型的应用,表1中提到的8个风流量预测模型统称为入口一次风流量预测,它们的输入特征包括风机变频输出和调节风门开度。这些模型预测的结果将直接影响后续的主蒸汽流量模型和炉膛上部温度模型,这两个模型的输入特征则更为复杂,包括垃圾厚层压差、一次风流量、二次风流量、汽包水位、给水温度以及6段入口一次风流量等。这些模型的输出,即主蒸汽流量和炉膛上部温度,进而用来预测发电机效率。在优化过程中,风机变频输出和调节风门开度作为决策变量,它们是实际工况中需要通过数据驱动进行调整的设置点。优化的目标是在当前工况下寻找能使发电机功率最大的点变量组合。然而,改变这些点变量可能会影响整个系统的工况,因此需要加入约束条件来维持工况的稳定。这些约束条件通过对离线历史数据的分析得出,确保风机频率和风门开度的设置点变量在合理的区间内进行寻优。同时,对于主蒸汽流量和炉膛上部温度也设定约束,确保它们保持在合理的范围内。这种优化方法的优点在于它能够综合考虑多个因素,通过高效的搜索算法找到最优或接近最优的解决方案,从而实现发电机功率的最大化和系统工况的稳定。这种方法的应用不仅限于垃圾焚烧发电,还可以推广到其他需要精细控制和优化的工业过程中。
Figure 6. Dependence relationship of generator power on main steam flow and upper furnace temperature
图6. 发电机功率与主蒸汽流量、炉膛上部温度的依赖关系
通过数据驱动优化过程,选取100条在线数据进行验证,将优化后的结果和优化前的发电机功率作对比,经计算优化前后的发电机功率平均值,计算可提升6.1%的发电量,优化结果的对比如表3所示。
Table 3. Comparison chart of optimization results
表3. 优化结果对比表
最优发电量 |
目前发电量 |
提升率 |
最优发电量 |
目前发电量 |
提升率 |
最优发电量 |
目前发电量 |
提升率 |
11.244 |
11.23 |
0.1% |
11.322 |
11.03 |
2.7% |
11.419 |
11.08 |
3.1% |
11.208 |
10.41 |
7.7% |
10.762 |
8.66 |
24.3% |
11.118 |
10.75 |
3.4% |
10.889 |
10.36 |
5.1% |
11.017 |
10.95 |
0.6% |
11.223 |
11.48 |
−2.2% |
11.188 |
10.91 |
2.5% |
10.822 |
9.89 |
9.4% |
11.244 |
10.32 |
9.0% |
10.953 |
10.92 |
0.3% |
11.193 |
10.82 |
3.4% |
11.115 |
10.56 |
5.3% |
11.354 |
10.97 |
3.5% |
11.346 |
11.19 |
1.4% |
11.253 |
11.11 |
1.3% |
11.324 |
10.87 |
4.2% |
11.096 |
10.74 |
3.3% |
11.151 |
10.75 |
3.7% |
11.185 |
10.91 |
2.5% |
10.629 |
9.73 |
9.2% |
11.280 |
11.15 |
1.2% |
11.129 |
10.5 |
6.0% |
11.261 |
10.99 |
2.5% |
11.247 |
1041 |
8.0% |
11.151 |
10.47 |
6.5% |
11.418 |
11.39 |
0.2% |
11.170 |
10.88 |
2.7% |
续表
11.246 |
10.64 |
5.7% |
11.189 |
10.89 |
2.7% |
11.269 |
10.52 |
7.1% |
11.213 |
10.23 |
9.6% |
11.365 |
11.24 |
1.1% |
11.395 |
12.08 |
−5.7% |
11.184 |
11 |
1.7% |
11.158 |
10.23 |
9.1% |
11.260 |
11.03 |
2.1% |
11.161 |
10.33 |
8.0% |
11.082 |
9.06 |
22.3% |
11.190 |
11.54 |
−3.0% |
11.181 |
10.68 |
4.7% |
11.114 |
10.5 |
5.8% |
11.129 |
10.7 |
4.0% |
4. 结论
数据驱动控制和数据驱动优化是数据驱动科学与工程的两个重要分支。数据驱动控制理论已经在网络控制、工业过程、城市交通、风能发电等多个领域提供了理论支撑。本文主要介绍了数据驱动优化的主要特点和实施过程,并结合垃圾焚烧发电的项目案例介绍了数据驱动优化在节能减排、降耗提效等方面取得的良好效果。计算结果显示,经过优化后的垃圾焚烧发电机可提升约6%的发电量。在大数据与人工智能技术快速发展的时代,数据驱动优化必将在工业领域的数字化实践中扮演更重要的角色。