基于深度学习的超临界二氧化碳临界流模型研究
Research on Supercritical Carbon Dioxide Critical Flow Model Based on Deep Learning
DOI: 10.12677/NST.2024.121003, PDF, HTML, XML, 下载: 80  浏览: 589  国家自然科学基金支持
作者: 陈天生, 冯浩阳, 袁 园*, 周 源, 王俊豪, 查雨霆, 翟厚忠, 孟玉凯:四川大学物理学院,四川 成都
关键词: 深度学习超临界二氧化碳临界流量循环神经网络Deep Learning Supercritical Carbon Dioxide Critical Flow Recurrent Neural Network (RNN)
摘要: 破口处的临界流量决定了冷却剂丧失速度和一回路泄压速度,二氧化碳(CO2)在拟临界附近会发生物性畸变,而超临界二氧化碳(SCO2)反应堆的喷放过程涉及跨临界降压、不同相态喷放流量计算,现有研究缺乏宽参数范围高精度临界流模型。数据驱动方法可基于成长型的训练数据库提升精度,为了快速且精准地预测SCO2临界流,文章基于深度学习方法建立了SCO2临界流模型。通过敏感性分析确定了深度学习模型的特征输入;以循环神经网络(RNN)为框架,使用K折交叉验证、L2正则化得到了预测精度更高、泛化能力更强的临界流模型SCO2-RNN;基于遗传算法选取最优超参数,得到模型对预测结果平均相对误差为4.88%,最大相对误差为14.24%;对初见数据泛化的平均误差为5.73%,最大误差为20.45%;在使用迁移学习后,平均相对误差降低为1.75%,最大相对相对误差为4.15%。基于训练好的模型对新数据的泛化结果表明:深度学习模型在速度和精度方面均满足工程要求,可建立宽适用范围的高精度高效率临界流模型。
Abstract: The critical flow at the break determines the speed of coolant loss and the depressurization rate of the primary circuit. Carbon dioxide (CO2) reactor undergoes physical property anomalies near the pseudo-critical point, and the supercritical carbon dioxide (SCO2) discharge process involves cross-critical pressure reduction and calculation of discharge flow rates in different phases. Existing research lacks a high-precision critical flow model with a wide range of parameters. Data-driven methods can improve accuracy based on a growing training database. In order to quickly and accurately predict the critical flow of supercritical carbon dioxide, this paper establishes an SCO2 critical flow model based on deep learning methods. Through sensitivity analysis, the feature input of the deep learning model was determined; using the Recurrent Neural Network (RNN) as the framework, with K-fold cross-validation and L2 regularization, a critical flow model SCO2-RNN with higher prediction accuracy and stronger generalization ability was obtained. Then we selected the best hyperparameters were selected by the genetic algorithm. The average error of the predicted result of this model is 4.88%, and the maximum error is 14.24%; the average error of generalizing to unseen data is 5.73%, and the maximum error is 20.45%. After using transfer learning, the average error decreased to 1.75%, and the maximum error is 4.15%. This indicates that with the upgrade of database, there will be higher accuracy and better adaptability. The generalization results of new data based on the trained model show that: the deep learning model meets engineering requirements in terms of speed and accuracy, and can establish a high-precision and high-efficiency critical flow model with a wide range of applicability.
文章引用:陈天生, 冯浩阳, 袁园, 周源, 王俊豪, 查雨霆, 翟厚忠, 孟玉凯. 基于深度学习的超临界二氧化碳临界流模型研究[J]. 核科学与技术, 2024, 12(1): 19-26. https://doi.org/10.12677/NST.2024.121003

1. 引言

SCO2反应堆主回路系统运行参数高、换热能力较水差,破口引起的冷却剂丧失事故(LOCA),是SCO2反应堆安全分析的设计基准事故,其中的关键是临界流量的预测。目前已经有很多研究进行了临界流量相关实验,但数值计算较少。

陈江平 [1] 通过改变入口温度、出入口压力、短管内径、长径比以及倒角等参数探究了CO2的临界流量变化特性。Martin [2] 在不同短管长度工况下进行了SCO2的流动实验并且得出质量流量伴随着上游压力的增加和温度的降低而增加。李伟卿等人 [3] 在喷管直径2 mm,长径比1~20,压力7.4~9.5 MPa,温度15℃~55℃范围内进行了CO2的超临界流动实验,并且验证了热平衡通用模型的预测相对偏差均在10%以内。

SCO2的临界流模型大多基于水的临界流模型建立。John P. Edlebeck [4] 对比了HEM和分离流模型(SFM)在CO2两相区域孔口出口条件下的计算精度,发现当流量系数在0.81~0.87之间,SFM比HEM预测数据更加准确。Masahiro Ishigaki [5] 采用TRACE和FLUENT对喷管内两相临界流动进行了数值分析,虽然结果吻合较好,但是在使用液体饱和物性下的计算结果比实验结果低21%。赵民富 [6] 基于等熵流动和热平衡假设,导出了两相临界流模型并且给出了临界条件的计算方法。但现有的临界流模型适用范围较窄、精度较低,因此研究人员开始尝试利用机器学习建立临界流模型。

苏光辉 [7] 使用ANN模型和反向传播算法得到的模型预测的临界流量准确度在±10%。Hong Xu [8] 提出了基于遗传神经网络(GNN)的CFM临界流量模型,考虑临界压力,发现与传统的均匀平衡模型(HEM)和Moody模型相比,GNN模型能够以更高的精度预测临界流量。明杨 [9] 等人基于Modelica语言开发了一套瞬态分析程序,针对SCO2喷放过程中不同阶段的流动现象进行了建模与分析,与现有实验数据进行了对比验证,且得出的误差在20%以内。但以上模型同样存在计算区域窄,精度不够的问题。系统运行范围内CO2物性变化剧烈,导致不同位置处的临界流呈现多相态特性,压缩机进出口为两相临界流现象,回热器、堆芯附近为单相气体临界流现象。SCO2的喷放过程涉及跨临界的降压、不同热力学区域喷放流量计算,目前缺乏宽参数范围高精度CO2临界流模型。

本文基于RNN方法引入遗传算法对模型进行优化,并且使用K折交叉验证的方法增强泛化的效果,以此降低由于训练集数据较少产生的影响,同时为了避免模型过拟合问题引入L2正则化降低网络的复杂度,并进一步通过迁移学习探究了数据库增大对计算精度的影响。本研究建立的预测方法可为宽参数范围的临界流模型建立提供参考。

2. 深度学习模型的建立

2.1. 输入参数的确定

为明确深度学习临界流模型的特征变量,对临界流模型的关键参数进行了敏感性分析(图1)。图1(a)中的参数来源于JP Chen等人 [10] 的实验数据,并设置温度取值为308.35 K、破口直径为1.35 mm。图1(a)中黑点为质量流量在压力和长径比的共同作用下的分布,红点、蓝点和绿点分别是黑点在xoy平面、xoz和yoz平面的投影点。由红点以及蓝点可知,我们可以将黑点分成三组压力相同的点,观察组中的点在yoz平面的投影绿点表明:随着长径比的增加,质量流量减小。在xoy平面内可将红点分成六组平行于x轴的点,每组中的点长径比相同但压力不同,观察组中的点在yoz平面的投影绿点表明:随着压力的增大,质量流量变大。

图1(b)中的实验数据取自Guillaume等人 [11] 实验,表示在长径比168,压力10.1 MPa下,局部粗糙度3.8 um的情况下温度对质量流量的影响,显示了质量流量随着温度的降低而降低。在Guillaume的实验中 [9] 为了观察粗糙度效应,比较了2毫米钢管和2毫米石英管之间的临界流量数据。它们的相对粗糙度相差约3个数量级。在相同的初始停滞条件下,较粗糙的钢内壁引起了更多的摩擦,从而导致更高的压降和更低的质量流量。钢管的质量流量与石英管数据相差约15%。图1的参数都呈现单调变化趋势。综上所述,研究选取温度和压力作为输入量来表征热工参数对质量流量的影响,选取长径比、破口直径和局部粗糙度来表征破口形状对质量流量的影响。

最终,深度学习模型的训练集有282组数据,其中189组数据来源于汪杨乐等人的SCO2临界流实验研究 [12] ,其余数据则来源于李伟卿等人的SCO2临界流稳态试验研究及模型验证 [3] 以及JP Chen等人的R744短管两相流实验及相关分析 [10] 。

2.2. 网格结构的确定

RNN是一类以序列数据为输入,在序列的演进方向进行递归,对序列的非线性特征进行学习时具有一定优势的网格模型,因此研究选取RNN作为网格模型。由于获得的数据量少,使用传统RNN模型训练中发现训练集的平均相对误差为10.70%,而在泛化数据上的平均相对误差为37.23%,最大相对误差则达到了63.12%,易出现过拟合,为此,研究引入K折交叉验证方法。在引入K折交叉验证后,令K为3,不更改网格结构,训练平均相对误差为3.07%,泛化的平均相对误差降低到了18.54%,最大相对误差

(a) (b)

Figure 1. Sensitivity analysis of key thermal parameters to critical flow rate

图1. 热工关键参数对临界流量的敏感性分析

也成功降低到39.27%。尽管引入了K折交叉验证,泛化的误差依然较大,未达到理想的效果,过拟合现象依然存在,为此模型引入了L2正则化。L2正则化是在损失函数中添加一个对参数的L2范数惩罚项作为约束,通过减少参数平方的总和来减小误差,最终达到防止过拟合的目的。而通过夏凡的研究,L2也确实能够在一定程度上提升泛化性能 [13] 。取正则系数为4.0 × 10−6,训练集平均相对误差为4.80%,最大相对误差为14.63%,而泛化的平均相对误差降低到了10.27%,最大相对误差则降低到了21.32%,有了较大改善。

为得到更好网格结构,对RNN模型的隐藏层层数和节点数进行了敏感性分析,如表1所示。计算结果表明在一定范围内平均相对误差随隐藏层的增加而降低,当层数大于5后会随之增加,而最大相对误差尽管在隐藏层取5时可以得到最小值,但同2层隐藏层比较,二者的泛化平均相对误差和训练最大相对误差均相差不大,而后者的泛化最大误差小于前者,并是几组中最小的,再加之隐藏层数过多将导致过拟合化,综合考虑隐藏层数选取为2,对应的隐藏层节点数设置为22。

Table 1. Sensitivity analysis of RNN hidden layer and hidden node number

表1. RNN隐藏层与隐藏节点数敏感性分析

最终网格结构选取为批量大小为32;迭代次数为880;学习率为0.0008;K折数4;L2正则化权重衰减系数为4.0 × 10−6作为我们初期结构的超参数。

2.3. 模型的泛化

用于泛化训练的90组数据来源于Guillaume等人的SCO2临界流动实验研究 [11] ,其中共有67组长径比为168,破口直径为2 mm的数据,命名为A组;23组长径比为106,破口直径为3.175 mm的数据,命名为B组。为得到临界流对初见数据的泛化效果,将泛化以对角误差分布图输出,发现误差集非常明显的在质量流量125 g/s左右分为了两个部分(图2)。图2中,左侧质量流量较小的数据为A组,误差全部位于20%以内,而质量流量较大的B组数据中有五组数据误差位于20%以外。同时,A组的数据平均相对误差为8.63%,B组的数据平均相对误差为14.16%,有较大差异。考虑到训练集中,长径比的取值范围为1~40,破口直径的取值范围为1~2 mm,A组长径比离训练集距离更远,泛化效果理应更差,但是由于A组中的破口直径数据为2 mm,在训练集中多次出现,B组中的破口直径3.175 mm离训练集较远,综合导致B组误差较大。基于此泛化结果,对网格结构进行了进一步的优化。

Figure 2. Diagonal error distribution diagram (without genetic algorithm)

图2. 对角误差分布图(未使用遗传算法)

3. 遗传算法的优化超参数

遗传算法(Genetic Algorithm,以下简称GA)是用于解决最优化问题的一种搜索算法,可以为模型寻找最优的超参数,优化模型,提升泛化效果。在多个数据远离训练集的情况下,A、B组的泛化结果存在较大差异,B组泛化效果较差,为达到理想的泛化效果,模型优化引入了遗传算法来调整超参数。

在进行GA的学习时,将种群数设置为40,并根据之前调节超参数的经验将学习率以及隐藏节点数的范围分别调节为0.0001~0.01和1~40,隐藏层数保持为2不变,交叉概率设置为0.4,突变概率设置为0.2,迭代为50代。计算结果表明当迭代次数达到30次后,适应函数就不再有明显的降低,因此为了防止过拟合且同时提高训练效率而采用早停法,并将迭代次数更改为30。

经过遗传算法优化过的网络结构,使用K折交叉验证得到的训练集平均误差由4.80%上升到4.88%,最大误差由14.63%下降到14.24%,在训练集的表现几乎没有太大的变化。但是在泛化集上,平均误差由10.27%下降到5.73%,最大误差由21.32%下降到20.45%,虽然泛化集最大误差没有明显变化,但是平均误差明显降低。通过与之前的超参数敏感性分析结果比较,发现遗传算法的优化效果是显著的。

使用遗传算法后,图2中泛化的A组数据的平均相对误差也从8.63%降低为5.87% (图3),B组数据平均相对误差由14.16%降低为5.27%,发现B组的平均相对误差大幅度下降,A、B组的平均相对误差基本一致。误差大于20%的数据共两个,分别位于A、B组。引入遗传算法能够大幅提升泛化效果。

Figure 3. Diagonal error distribution diagram (using genetic algorithm)

图3. 对角误差分布图(使用遗传算法)

即使数据距离训练集较远,得到的相对误差仍然保持在一个较低的范围内,在获得更加全面的数据进行训练以后,得到的结果将会更加完善。为此,我们进一步研究了迁移学习。

4. 迁移学习

迁移学习是一种机器学习策略,它允许我们使用在原任务上训练的模型,然后将其应用到另一个不同但相关的任务。这种方法可以利用原任务已经训练好的模型基础,减少目标任务所需的训练数据量,提高学习效率,并在许多情况下提高模型的性能。

通过冻结不同的隐藏层层数对未使用遗传算法以及使用遗传算法进行优化得到的两个模型进行对比,得不同的训练结果,误差情况见表2图4为对角误差分布图,只有在冻结层数为两层时,使用遗传算法的结果中有9组数据的误差大于5%,未使用遗传算法的结果中有4组数据的误差大于5%。将结果最好的冻结0层隐藏层得到的模型和迁移学习前的泛化结果进行比较,使用遗传算法模型的平均误差由5.73%下降到1.75%,最大相对误差从20.45%下降到4.15%,未使用遗传算法模型的平均误差由10.27%下降到1.68%,最大相对误差由21.32%下降到4.85%,均得到了显著的降低。并且总体上使用遗传算法模型的误差低于未使用遗传算法模型,这也符合之前结论趋势。数据迁移导致的数据库升级,带来了更高的精度以及更好的适应性。

Table 2. Error after freezing different layers in transfer learning

表2. 迁移学习冻结不同层数的误差

通过冻结不同层数,研究发现总体上冻结的隐藏层层数越少,迁移学习得到的结果越好。这可能是由于原本泛化集输入量与原训练集输入量之间有较大的数值差异,导致原本学习到的特征并不能很好的运用于新的训练集中,所以我们需要训练更多的层来学习新的特征表示。

(a) (b)

Figure 4. Diagonal error distribution diagram after transfer learning

图4. 迁移学习后的对角误差分布图

5. 结论

本研究提出了一种基于CO2的RNN临界流模型,以实现对SCO2临界流高精度预测,模型的整体构建流程如图5所示。

Figure 5. Flowchart of RNN model construction

图5. RNN模型构建流程示意图

模型计算结果表明:

1) 基于K折交叉验证和L2正则化的SCO2临界流RNN模型能够很好地预测新数据中临界流量,且平均误差为10.27%;

2) 使用遗传算法优化的网络模型对新数据的预测更优秀,平均误差仅为5.73%;

3) 利用迁移学习,平均误差降仅为1.75%,模型拥有更高的精度以及更好的适应性。

与传统经验关系式模型相比,深度学习临界流模型通过大量的数据进行训练,可以适应复杂的输入和输出关系,能更好地捕捉临界流问题中各个变化量之间的非线性关系,且不需要事先假设和限制模型的形式,具有更低的误差,更宽参数适用范围。后续研究将进一步探讨基于物理机制的可解释型临界流模型的优越性。

基金项目

国家自然科学基金项目(12105192);广东省基础与应用基础研究区域联合基金–青年基金项目(2020A1515110512)。

NOTES

*通讯作者。

参考文献

[1] 陈江平, 刘军朴, 金纪峰, 陈芝久. 跨临界CO2节流短管流量特性实验研究[J]. 上海交通大学学报, 2005(8): 1214-1217.
[2] Martin, K., Reiberer, R. and Hager, J. (2006) Modeling of Short Tube Orifices for CO2. Proceedings of 2006 International Refrigeration and Air-Conditioning Conference at Purdue, West Lafayette, USA, 17-20 July 2006.
[3] 李伟卿, 张东旭, 赵民富. 超临界CO2临界流稳态试验研究及模型验证[J]. 原子能科学技术, 2022, 56(8): 1593-1598.
[4] Edlebeck, J., Nellis, G.F., Klein, S.A., et al. (2014) Measurements of the Flow of Supercritical Carbon Dioxide through Short Orifices. Journal of Supercritical Fluids, 88, 17-25.
https://doi.org/10.1016/j.supflu.2014.01.008
[5] Ishigaki, M., Watanabe, T. and Nakamara, H. (2011) Numerical Simulation of Two-Phase Critical Flow with the Phase Change in the Nozzle Tube. Journal of Power & Energy Systems, 6, 264-274.
https://doi.org/10.1299/jpes.6.264
[6] Zhao, M.F., Zhang, D.X. and Lv, Y.F. (2016) A General Thermal Equilibrium Discharge Flow Model. Journal of Energy and Power Engineering, 10, 392-399.
https://doi.org/10.17265/1934-8975/2016.07.002
[7] Su, G., Fukuda, K., Jia, D., et al. (2002) Application of an Artificial Neural Network in Reactor Thermohydraulic Problem: Prediction of Critical Heat Flux. Journal of Nuclear Science & Technology, 39, 564-571.
https://doi.org/10.1080/18811248.2002.9715235
[8] Xu, H., Tang, T., Zhang, B., et al. (2021) Application of Ar-tificial Neural Network for the Critical Flow Prediction of Discharge Nozzle. Nuclear Engineering and Technology, 54, 834-841.
https://doi.org/10.1016/j.net.2021.08.038
[9] 明杨, 方华伟, 刘凯, 等. 压力容器内超临界二氧化碳喷放特性分析及模型验证[J]. 原子能科学技术, 2023, 57(7): 1363-1372.
[10] Liu, J.P., Niu, Y.M., Chen, J.P., et al. (2004) Experimentation and Correlation of R744 Two-Phase Flow through Short Tubes. Experimental Thermal & Fluid Science, 28, 565-573.
https://doi.org/10.1016/j.expthermflusci.2003.08.004
[11] Mignot, G.P.H. (2008) Experi-mental Investigation of Critical Flow of Supercritical Carbon Dioxide. Ph.D. Thesis, The University of Wiscon-sin-Madison, Madison, USA.
[12] 汪杨乐, 周源, 王俊峰, 黄彦平. 超临界CO2临界流实验研究[J]. 核科学与技术, 2018, 6(3): 61-68.
https://doi.org/10.12677/NST.2018.63008
[13] 夏凡. 基于l2正则化的深度ReLU神经网络的泛化性能[D]: [硕士学位论文]. 武汉: 湖北大学, 2023.