1. 引言
随着我国工业的不断发展,水污染问题日益严重 [1]。污水的处理与再利用,已成为“十三五”规划中,国家环境保护的重点工作之一 [2]。膜生物反应器(MBR)是一种由膜分离单元与生物处理单元相结合的新型态、高效能污水处理系统 [3]。膜生物反应器具有污水处理效率高、占地面积小、经济效益高等优点 [4],已广泛应用于城市污水处理、工业污水处理等领域。
在膜生物反应器的使用过程中,膜污染问题不可避免。膜污染会导致污水处理降低,工艺能耗增加,缩短中空纤维膜构件的使用寿命 [5]。正确预测膜通量的大小,从而判断膜污染的程度,及时对膜构件进行清洗、替换,能够提高膜生物反应器的工作效率、能耗比与使用寿命,具有极大的实际意义与应用价值 [6]。
在工业生产环境中,衡量膜污染程度的膜通量很难直接测量,需要根据膜生物反应器的其他运行参数进行预测。因为膜生物反应器处理污水是一个复杂的动态过程,各污染因子之间相互交叉相互影响,利用经典的数学模型难以直接建模并进行精确预测 [7]。将人工神经网络用于MBR污水处理过程仿真,是近年来进行膜污染预测的新途径 [8]。本文采用循环神经网络为算法主体,膜通量变化过程是一个随时间变化的连续过程,循环神经网络对时序变量的预测有着更好的适应性。同时利用差分进化算法对RNN的初始权值和阈值进行优化,可以提高模型的训练效率。研究发现,利用此模型可以准确地预测膜生物反应器的膜通量。
2. RNN神经网络(Recurrent Neural Networks)
循环神经网络(Recurrent Neural Network, RNN)是一类以序列数据作为输入变量,在序列的演进方向进行递归运算且所有节点(循环单元)按链式连接的递归神经网络 [9]。RNN在20世纪90年代提出,经过不断的发展与优化,在21世纪初成为深度学习的核心算法之一。
循环神经网络具有记忆性、参数共享性,因此在对序列的非线性特征进行学习时具有一定优势,其简单结构如图1所示。其中x是一个向量,它代表输入层的值;s是一个向量,它代表隐藏层的值;o是一个向量,它代表输出层的值;U是输入层到隐藏层的权重矩阵;V是隐藏层到输出层的权重矩阵;w是一个权重矩阵,将隐藏层上一次的值作为这一次的输入。RNN神经网络与全连接神经网络的区别在于,上一时刻隐藏层的输出,作为下一时刻隐藏层的输入变量之一参与运算。
其运算公式如下:
(1)
(2)
RNN网络在t时刻接收到
之后,隐藏层
的值取决于当前时刻输入的变量
和上一时刻隐藏层的值
。
3. 差分进化算法(Differential Evolution Algorithm)
差分进化算法(Differential Evolution Algorithm, DE)是一种采用浮点矢量编码进行随机搜索的高效的全局优化算法,对于具体问题条件限制的依赖性低。差分进化算法与遗传算法和粒子群算法相比,具有工作原理简单、控制参数少、容易实现等优点。
RNN神经网络的权重矩阵初始值的选择对于模型训练有着重要的意义。初始值选择不好,容易形成局部最优化,从而影响预测模型的精确度。用差分进化算法进行初始值的优化,有利于模型的训练。
DE算法采用实数编码,每一代的种群包含NP个维数为D的实数向量,其中个体表示为:
(3)
式中:NP表示种群规模;G表示当前进化代数;i表示个体在第G代种群中的位置标号。差分进化算法计算步骤如下:
1) 种群初始化
初始化种群,在边界约束条件下随机选择,采用下面表达式随机产生初始种群:
(4)
式中x表示存放初始种群的向量,D表示种群中个体的维数,NP表示种群规模,
表示种群中个体向量的上限,
表示种群中个体向量的下限,
表示分布在
区间内D行NP列的随机矩阵。
2) 变异操作
随机选取当代种群中两个不同向量生成变差向量,经变异算子F作用后与第三个向量结合生成变异向量,如公式(5)
(5)
其中r1、r2、r3为随机选择的序号且互不相同,F为变异算子,变异算子F通常在0到2之间取值。
3) 交叉操作
通过将第G代种群中的目标向量个体
与其变异向量个体
部分基因进行交叉操作产生试验向量
个体。
4) 选择操作
比较试验向量个体
和当前种群中的目标向量个体
,分析不同向量个体的适应度,若
的适应度更高,则选其作为子代,否则选
作为子代。
4. 基于DE-RNN的膜通量预测模型
4.1. 采用PCA进行MBR系统参数选取
主成分分析法(Principal Component Analysis, PCA)是一种统计分析方法,用于掌握事物主要矛盾变量,它通过对原始数据集进行线性空间投影来分析矩阵特征值,从多维数据集中解析出主要影响因素,从而达到对数据集降维,简化复杂的问题的目的。
膜生物反应器的运行参数众多,如果将全部运行参数作为输入变量通过RNN运算,不仅计算量庞大,而且影响预测模型的准确率。通过PCA算法,减少RNN输入变量的个数,从而提升模型的性能。
主成分分析法步骤为:
Step1:把初选的影响因子组成矩阵X。
Step2:对矩阵X进行标准化处理,得到标准化矩阵A。
Step3:计算出协方差矩阵S。
Step4:计算协方差矩阵S的特征值λ与相应的特征向量u,然后由特征值降序排列得到特征值矩阵V和特征向量矩阵U。
Step5:由特征值矩阵V计算出贡献率,确定主成分。
初选MBR系统的六个参数作为膜污染影响因子,分别为总阻力、MLSS、COD、PH、温度、操作压力,并以此作为RNN输入层的六个神经元。膜通量为RNN输出层的唯一神经元。
4.2. 建立基于DE-RNN的膜通量预测模型
循环神经网络RNN在应用时,网络权值和阈值的初始值选取不当,容易导致算法的局部最优化,从而影响网络识别的精度。本文采用差分进化算法对RNN的权值和阈值进行优化,以加快RNN的收敛速度和识别精度。
建立基于DE-RNN的预测模型。将RNN的参数作为种群的个体,RNN的计算结果作为判断标准,执行DE算法,得到满足精确度的种群个体,及经过优化的RNN权值和阈值的初始值。然后对经过优化的RNN进行训练,得到用于预测的DE-RNN模型。算法的程序流程图如图2所示。

Figure 2. Procedure flow chart of DE-RNN
图2. DE-RNN算法的程序流程图
具体实验步骤如下:
Step1:对RNN的参数编码,所有编码得到的基因位串称为一个个体。
Step2:初始种群随机产生,个体数量为20,构建初始的交配池。
Step3:执行RNN算法,将误差百分比作为衡量个体适应度的标准。个体间基因进行交叉和变异。
Step4:保留适应度高的个体,淘汰适应度低的个体。
Step5:回到(3)进行循环,直到得出最佳结果结束循环。
Step6:训练完毕,得到RNN权值和阈值的最优值,进行仿真实验。
5. 预测结果与实验结果对比分析
实验数据来自于石家庄市某污水处理厂,此污水处理厂采用MBR污水处理工艺,过滤膜为是孔径为0.2 μm的聚偏氟乙烯微滤膜。25组实验数据作为训练样本,5组实验数据作为校验用样本。
通过PCA算法选取的水质指标为6个:总阻力、MLSS、COD、PH、温度、操作压力,作为输入变量。本文使用的RNN的结构为的结构为6-10-1,使用快速梯度下降算法调整参数,输出单元为膜通量。进行实验,用RNN模型和DE-RNN模型分别预测膜通量并计算拟合度,DE-RNN模型预测数据和实际数据的对比结果如图3所示,RNN模型的预测拟合度如图4所示,DE-RNN模型的预测拟合度如图5所示。
对比实际数据和预测数据可知,预测数据的准确度在0.9以上,该模型具有较高的精确度,达到了准确预测膜通量的预期目标。对比RNN模型和DE-RNN模型的拟合度,RNN模型的拟合度最低为0.87,平均为0.94;DE-RNN模型的拟合度最低为0.91,平均为0.97。DE-RNN模型比RNN模型拟合度更高,误差更小。用DE算法优化RNN,对预测模型的准确度有着明显的提升。

Figure 3. Relationship between actual value of membrane flux and test value
图3. 膜通量的实际值与测试值关系图

Figure 4. Fit test experiment of RNN
图4. RNN拟合度测定实验图

Figure 5. Fit test experiment of DE-RNN
图5. DE-RNN拟合度测定实验图
6. 结论
MBR处理污水是一个复杂的动态过程,具有多流程、时变、不确定等特点,是一个运行非平稳的系统,用数学模型难以直接建模。本文在用主成分分析法简化MBR系统参数的基础上,用差分进化算法优化循环神经网络的初始权值和阈值,建立了DE-RNN仿真模型用以预测膜通量。实验结果表明,DE-RNN预测模型有着很高的精确度,该模型是有效的、可行的。DE-RNN模型与RNN模型相比拟合度更高,说明用DE算法优化RNN,对提高精确度,提高适应度有着积极的作用,对模型的优化是明显有效的。本文的研究有一定的理论价值和实践意义,对MBR膜通量预测可以起到积极的指导作用。
基金项目
国家自然科学基金项目(51378350);国家自然科学基金青年科学基金资助项目(50808130);国家自然科学基金青年科学基金项目(21506159)。