1. 引言
C4烯烃是重要的基础化工原料,广泛应用于生产医药和化工产品。传统的生产方法以化石能源为原材料,由碳四馏分分离获得。鉴于化石能源存储量短缺以及对环境的污染,利用新型清洁能源制备C4烯烃越来越重要。乙醇来源广泛,绿色清洁,以乙醇为平台分子生产高附加值的C4烯烃具有良好的应用前景及经济效益。
在乙醇偶合制备C4烯烃的过程中,不同的温度和催化剂使用将对乙醇转化率和C4烯烃的选择性产生重大影响,而此二者的乘积便是C4烯烃的收率。因此通过设计最佳的温度和催化剂组合,探索乙醇催化偶合制备C4烯烃的条件对化工生产具有重要作用。
为探寻多因素下最优反应条件,需结合反应原理进行大量、多组实验数据。童刘 [1] 控制反应温度和乙醇浓度,得到了乙醇制备C4烯烃的优化条件;吕绍沛 [2] 采用Co-SiO2-HAP作为催化剂,通过综合控制温度和催化剂装料方式、装料比、Co负载量等反应条件,实现了对乙醇制备C4烯烃反应的优化。综上,反应温度、乙醇浓度、装料方式、Co/SiO2和HAP装料比、Co负载量等自变量的设置都对反应有着重要作用。
利用实验数据进行建模求解,可以较少的实验结果获得尽可能多的信息量,获得优化后的反应条件。本文以2021年全国大学生数学建模竞赛B题 [3] 所给数据为例进行了分析。为探究温度和催化剂多因素的综合影响,可作定性和定量分析,本文采用了Lasso回归剔除影响不显著的变量,分别得到多因素与乙醇转化率和C4烯烃选择性的定性关系,而后重新回归得到定量关系式;所得定量公式可以用于寻找收率的最大值,得到优化条件,在自变量多达7个的情况下,寻优计算量大,使用模拟退火算法可避免“维数灾难”;由于所得关系式只对现有数据的取值范围具有普适性,因而在此基础上做更优反应条件的预测还需设计实验验证和探究,多因素下设计正交试验做进一步探究可提高效率。
2. 分析催化剂与温度对反应影响
为研究不同催化剂组合及温度对乙醇转化率、C4烯烃选择性的影响,将催化剂组合拆分成HAP质量、乙醇浓度、是否加入石英砂(0代表不加入石英砂,1代表加入石英砂)、Co负载量、I II类总量(Co/SiO2和HAP总质量)、Co/SiO2和HAP装料比、装料方式(0表示装料方式II,1表示装料方式I)这些变量。将这些变量联合温度分别对乙醇转化率和C4烯烃选择性进行回归,变量的数量较多,采用Lasso回归。
下文公式中所用符号对应含义见表1。
Lasso回归是一种压缩估计,在最小二乘法的基础上,增加惩罚项以压缩部分回归系数。惩罚项可用于筛选变量,有选择性的把变量纳入模型,起简化模型作用。Lasso回归还能够通过改变参数控制模型复杂度,避免出现过度拟合。对于线性模型,模型复杂度与变量数之间存在直接关系。具体来说,变量数越多,模型复杂度越高。过多的变量可能导致过度拟合。
Lasso回归的方程式为:
(1)
Lasso回归模型通过参数
调整复杂度,
越大对变量多的模型惩罚力度越大,Lasso回归模型通过将某些回归系数压缩为零,实现变量的特征选择。Lasso回归的惩罚项等于各回归系数的绝对值之和乘以参数
。
通过最小化RSS与惩罚项的和求得变量回归系数。当参数
等于0时,Lasso回归与最小二乘法没有区别。随着
逐渐增加,模型开始将回归系数向0压缩,当
足够大时,所有变量的系数将都被压缩到0。随着参数
的变化,各变量的回归系数都会跟着改变 [4]。
2.1. 各因素对乙醇转化率的影响
为探究不同催化剂组合及温度对乙醇转化率的影响,在Stata中,以乙醇转化率为因变量,温度以及催化剂组合拆分得出的变量:HAP质量、乙醇浓度、是否加入石英砂、Co负载量、I II类总量、Co/SiO2和HAP装料比、装料方式为自变量,归一化后进行Lasso回归,设置种子。经Lasso回归筛选出有效变量后,得到的较为显著的自变量见表2。
表2是经Lasso回归筛选后,保留下的对乙醇转化率影响较大的变量,这种情况下取参数
(lopt)。利用保留下的变量进行多元线性回归(OLS),得到的结果如最后一列所示。综合分析两种回归,得到一致的结论:温度对乙醇转化率的影响明显高于其他变量。
为得到上述筛选出每种自变量对乙醇的具体影响情况,我们将每个变量的量纲纳入考虑范围,使用未归一化的数据进行回归,得到表3:
上表第一列显示了自变量每变化一个单位,因变量随变化的程度。如,温度每变化1℃,乙醇转化率上升约0.33%。其中,是否加入石英砂对乙醇转化率的影响不显著,应当剔除。其余变量在90%的置信概率下,可以认为其对乙醇转化率的影响显著。
重新回归,得到如下表达式:
(2)
2.2. 各因素对C4烯烃选择性的影响
为探究不同催化剂组合及温度对C4烯烃选择性大小的影响,以C4烯烃转化率为因变量,催化剂组合拆分出的变量联合温度T为自变量归一化后进行Lasso回归,得到的结果如表4:
这种情况下,参数
(lopt)。筛选出6个对C4烯烃选择性影响显著的自变量。
表5显示了考虑量纲后,6个自变量对C4烯烃选择性的具体影响:
其中,乙醇浓度和装料比对C4烯烃选择性的影响不显著,应当剔除或加以改进。其余变量在95%的置信概率下,可以认为其对C4烯烃选择性的影响显著。
由于某些自变量间存在约束关系,如装料比PⅠ Ⅱ和HAP质量mH共同影响着Co与SiO2的质量之和mⅠ Ⅱ,尝试添加相互作用因子
,同时对乙醇浓度CIII这一参数加以改进,取对数后再次进行回归,得到下式。
(3)
3. 模拟退火算法预测最佳反应条件
上文得出了不同催化剂组合和温度对乙醇转化率以及C4烯烃选择性大小的影响的两个方程,剔除所得方程中的不显著变量,再次进行回归分析,得到新的方程所有变量均显著。将两个方程相乘便得到催化剂组合与温度对C4烯烃收率的影响。对得到的方程利用模拟退火算法求解最大值。
确定目标函数为:
(4)
约束条件:
(5)
模拟退火算法源于固体退火,遵守Metropolis准则,以概率接受新状态。从某一确定初始值开始执行迭代过程,根据目标函数生成新解,以某一概率接受新解,直到求得目标函数的最值 [5] [6]。
设函数为
,接受新状态的概率为
,
为当前解,
为新解则有:
(6)
其中
为关于t递增的函数。
定义初始温度
,温度的下降
,
常取0.95,取
(7)
得:
(8)
终止条件通常取为连续若干个新解都没有被接受时终止算法。
模拟退火算法的流程图如图1所示:

Figure 1. Flowchart of simulated annealing algorithm
图1. 模拟退火算法流程图
当求解温度低于350℃,使得C4烯烃收率尽可能高的催化剂组合与温度时,将上(9)式中约束条件第一项改为:
(9)
其余条件不变。
模拟退火得出预测结果如表6:
上表中分别显示了温度上限分别为450℃和350℃时,使C4烯烃选择率最高的温度与催化剂组合预测结果。
4. 在450℃下设计正交试验
由表6,限制450℃为温度上限时,最佳温度为450℃,但实际数据中450℃下的实验数据仅有一组,故将最佳条件与仅有的一组实验的实验条件做对比分析,发现二者存在三个变量不同,即乙醇浓度、Co负载量、装料比(见表7)。故可以控制温度为450℃,HAP质量为200 mg,装料方式为A类,针对这三个变量,设计三因子、两变量的正交试验进一步探究最优解。

Table 7. Comparison of experimental data with optimal conditions
表7. 实验数据与最优条件对比
设计正交试验,需利用正交表来安排与分析多个试验变量。该方法并不会使用所有变量参数值组合来进行试验,而是挑选出部分具有代表性的参数组合进行试验,通过对部分试验结果分析了解全面试验的情况,从而找出最优的参数组合 [7]。通过此种方式设计实验探究多因素对某一变量的影响,可以减少实验次数,达到节省时间,节约材料等效果。试验相应的正交表见表8:
以上四组正交试验,及所预测的最优解组,构成五组实验来探究450℃下的更有利反应条件,其中加入预测最优解组的目的是验证所预测结果。
5. 结论
探究不同温度及催化剂条件下对于反应的影响时,将催化剂组合拆分成多个自变量并量化表示,联合温度,分别以乙醇转化率和C4烯烃选择性为因变量,进行可筛选有效变量的Lasso回归。利用筛选后的变量组合再进行多元线性回归,得出回归方程进行分析。得出自变量每变化一个单位,因变量的变化量。其中,温度对乙醇转化率和C4烯烃选择性的影响最大。但不足在于因数据量的限制,进行多元线性回归的拟合优度有待提高。
为预测最优化的反应条件,将求解得到的回归方程剔除不显著变量进行再次回归,所得回归方程作为目标函数,确定约束条件,进行模拟退火求解最优解,得到使得C4烯烃收率尽可能高的催化剂组合与温度。只需要在约束条件中加入温度小于350℃即可得出,温度低于350℃时,使得C4烯烃收率尽可能高的催化剂组合与温度。解决了多变量连续优化问题导致的“维数灾难”,出现局部最优解的可能较低。
450℃下的数据量过少,而最优条件的温度为450℃,这值得设计实验进一步探究。选取最优解作为其中一组,另外控制温度450℃、装料方式为A类、HAP质量200 mg,针对乙醇浓度、Co负载量、装料比,设计三因子、两变量的正交实验得到另外4组,设计使C4烯烃收率可能达最高的5组实验,以探究进一步优化反应的条件。
本文所建立的基于Lasso回归的产物收率模型、基于模拟退火算法的产物收率优化模型及多因素下的正交试验设计方法可推广至多种物质的生产之中,对解决其他化工生产优化问题,具有一定的参考意义和经济价值。