基于线性回归的乙醇偶合制备C4烯烃模型研究
Study on the Model of C4 Olefins Prepared by Ethanol Coupling Based on Linear Regression
DOI: 10.12677/MOS.2022.112032, PDF, HTML, XML,  被引量 下载: 423  浏览: 1,303  科研立项经费支持
作者: 岳 坤, 马俊杰, 庹明伟:上海理工大学光电信息与计算机工程学院,上海;谢素霞:上海理工大学机械工程学院,上海
关键词: C4烯烃最佳反应条件多元线性回归模型回归算法C4 Olefin Optimum Reaction Conditions Multiple Linear Regression Model Regression Algorithm
摘要: C4烯烃是一种重要的化工原材料,它广泛应用于药品行业的生产、化工产品的生成等众多领域。为探索乙醇催化偶合制备C4烯烃的工艺条件,本文提出了基于多元线性回归的乙醇偶合制备C4烯烃模型。该模型创新性地将回归算法引入传统的化学反应实验之中,将化学反应条件设置为虚拟变量,通过显著性检验和计算得到变量的回归系数,分析各变量和反应条件对制备C4烯烃的影响,从而找出最佳反应条件,并通过实验和算例验证了模型的有效性和准确性。
Abstract: C4 olefin is an important chemical raw material, and is widely used in the production of pharmaceutical industry, chemical products and many other fields. In order to explore the technological conditions for the preparation of C4 olefin by ethanol catalytic coupling, a model for the preparation of C4 olefin by ethanol coupling based on multiple linear regression was proposed. The model innovatively introduces the regression algorithm into the traditional chemical reaction experiment. We set the chemical reaction conditions as virtual variables, obtained the regression coefficients of the variables through significance test and calculation, analyzed the effects of various variables and reaction conditions on the preparation of C4 olefins, so as to find out the best reaction conditions, and verified the effectiveness and accuracy of the model through experiments and examples.
文章引用:岳坤, 马俊杰, 庹明伟, 谢素霞. 基于线性回归的乙醇偶合制备C4烯烃模型研究[J]. 建模与仿真, 2022, 11(2): 358-367. https://doi.org/10.12677/MOS.2022.112032

1. 引言

C4烯烃广泛应用于化工产品及医药的生产,乙醇是生产制备C4烯烃的原料。在制备过程中,C4烯烃的选择性和C4烯烃收率将受到催化剂组合(即:Co负载量、Co/SiO2和HAP装料比、乙醇浓度的组合)与温度的影响 [1]。因此通过对催化剂组合设计和温度的选择,探索乙醇催化偶合制备C4烯烃的工艺条件具有非常重要的意义和价值。

传统的方法是通过不断设计对照组,进行大量化学实验,并将得到的实验数据进行对比分析,逐步缩小实验测试范围,并不断进行实验,获得一个较好的工艺制备条件。这样的方法虽然最终能够得到一个较为准确有效的结果,但是其代价较大,需要花费大量时间和精力做实验,且对财力消耗也较大。此外,目前在已有的通过建立数学模型的方式来分析化学反应的方法中,还没有这种以催化剂组合和温度为变量建立回归模型来分析产率并找到最佳反应条件的方法,大多是在化学模型的基础上对化学反应进行数值分析。因此,本文提出一种基于多元线性回归的乙醇偶合制备C4烯烃模型,在已有的有限的实验数据上,通过数学模型的方法,从不同的温度和催化剂组合的选择对C4烯烃的选择性、乙醇转化率以及C4烯烃收率的影响的方向上分析,来探究乙醇催化偶合制备C4烯烃的工艺条件。

2. 多元线性回归模型的理论研究

2.1. 探究不同催化剂组合及温度对乙醇转化率以及C4烯烃选择性大小的影响

本文将不同催化剂组合以及温度考虑为自变量,乙醇转化率和C4烯烃的选择性考虑为因变量,通过实验数据,建立多元线性回归模型 [2],求解回归系数,定量探讨自变量对因变量的影响。

分别以乙醇转化率及C4烯烃选择性为因变量,不同催化剂组合及温度为自变量建立多元线性回归模型一和模型二如式(1)、式(2)所示。

Y 1 = α 0 + α 1 X + i = 1 n θ i A i (1)

Y 2 = β 0 + β 1 X + i = 1 n δ i A i (2)

其中:

Y 1 Y 2 分别为乙醇转化率及C4烯烃选择性;

α i β i δ i θ i 分别为对应变量的回归系数;

A i ( 1 ~ n ) 为n种催化剂组合。

对变量催化剂组合的处理:

为将催化剂组合引入模型,本文设置虚拟变量 [3]。为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1。即:

N i = N c 1 (3)

其中:

N i 为虚拟变量个数;

N c 为分类数。

对于n种催化剂组合,设置 n 1 个虚拟变量,另一个催化剂组合作为对照组。

其中虚拟变量 A 1 , A 2 , A 3 , , A n 1 , A n 的定义是:

A i = { 1 i 0 ( i = 1 , 2 , , n ) (4)

模型一和模型二中的变量说明如表1所示。

Table 1. Description of model 1 and model 2 variables

表1. 模型一和模型二变量说明表

2.2. 探究不同催化剂组合及温度对C4烯烃收率大小的影响

为获取C4烯烃的最大收率的反应条件,本文根据实验数据求得C4烯烃的收率在不同条件下的大小,并建立多元线性回归模型,求得回归系数,对照置信因子,进而分析不同反应条件对C4烯烃收率大小的影响,找到最佳反应条件。

以C4烯烃的收率作为因变量,不同催化剂组合及温度为自变量建立多元线性回归模型三如式(5),式(6)所示

Y 3 = γ 0 + γ 1 X + i = 1 n σ i A i (5)

Y 3 = Y 2 × Y 1 (6)

其中:

Y 3 分别为C4烯烃的收率;

γ i σ i 分别为对应变量的回归系数;

A i ( 1 ~ n ) 为n种催化剂组合。

为将21种催化剂组合引入模型,本文设置虚拟变量。为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1。即:

N i = N c 1 (7)

其中:

N i 为虚拟变量个数;

N c 为分类数。

为将催化剂组合引入模型,本文设置虚拟变量。为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1。即:

其中虚拟变量 A 1 , A 2 , A 3 , , A n 1 , A n 的定义是:

A i = { 1 i 0 ( i = 1 , 2 , , n ) (8)

对模型三中的变量进行说明,如表2所示。

Table 2. Description of model 3 variables

表2. 模型三变量说明表

3. 算例验证

3.1. 实验数据

本次研究所用实验数据包括两个:化学反应性能数据表和特定温度下某种催化剂组合的测试数据表。其中化学反应性能数据表中包括在21种催化剂组合和温度梯度250、275、300、325、350、400、450摄氏度的反应条件下,反应物乙醇的转化率,生成物中乙烯、C4烯烃、乙醛、碳数为4-12脂肪醇,甲基苯甲醛和甲基苯甲醇以及其它生成物的选择性的数据。特定温度下某种催化剂组合的测试数据表中则包括在反应时间20、70、110、163、197、240、273分钟下反应物乙醇的转化率和生成物中乙烯、C4 烯烃、乙醛、碳数为4-12脂肪醇,甲基苯甲醛和甲基苯甲醇以及其它生成物的选择性的数据。

3.2. 不同催化剂组合及温度对乙醇转化率大小影响的结果与分析

3.2.1. 模型一的显著性检验

通过Stata软件对模型一进行显著性检验,如表3示。

Table 3. Ethanol conversion variance analysis table

表3. 乙醇转化率方差分析表

原假设H0 α 0 = α 1 = θ 1 = = θ 20 = 0

表3可知,检验值F为31.68,P等于0,则该多元线性回归模型是显著的,通过显著性检验,拒绝原假设H0 α 0 = α 1 = θ 1 = = θ 20 = 0 ,即该模型是有意义的。

3.2.2. 模型一的拟合优度和调整后的拟合优度

引入的自变量越多,拟合优度会变大。但本文倾向于使用调整后的拟合优度,如果新引入的自变量对SSE的减少程度特别少,那么调整后的拟合优度反而会减小 [4]。

R 2 = 1 S S E S S T (9)

S S E = i = 1 n ( Y i Y ^ ) 2 (10)

R a d j u s t e d 2 = 1 S S E n k 1 S S T n 1 (11)

其中:

SSE是拟合数据和原始数据对应点的误差的平方和;

SST是原始数据和均值之差的平方和;

n是实验数据数;

k为调整值;

R 2 为拟合优度;

R a d j u s t e d 2 为调整后的拟合优度。

由式(9)、(10)、(11)得:

n = 114 k = 2 S S E = 7155.671 S S T = 51746.2302 R 2 = 0.8785 R a d j u s t e d 2 = 0.8508

可知拟合优度接近1,说明误差平方和接近0,本文模型的拟合效果越好,由于本文并不用于预测,拟合优度并不需要接近1。

3.2.3. 基于普通最小二乘法求解多元线性回归模型一

k ^ , b ^ = min k , b ( i = 1 n ( y i y ^ i ) 2 ) = min k , b ( i = 1 n ( y i k x i b ) 2 ) (12)

其中k、b为回归系数。

通过Stata进行标准线性回归 [5] 得到表4所示。

Table 4. Regression coefficients of Model 1

表4. 模型一回归系数表

***p < 0.01,**p < 0.05,*p < 0.1。

P值小于0.1,代表在90%置信水平下,回归系数显著的异于0的变量有A2~A7,A17,解得模型一为:

Y 1 = 90.192 + 0.334 X + 27.061 A 2 + 23.115 A 3 + 24.139 A 4 + 16.035 A 5 + 23.208 A 6 + 29.721 A 7 10.073 A 17 (13)

由于温度回归系数为0.334,同时样本取点温度范围绝大部份在250~400度,所以,在250度到400度的温度范围类,温度与乙醇转化率成正相关,且在其它条件不变的情况下,温度每升高一度,乙醇转化率平均增加0.334个百分点。

以催化剂组合B2为对照组,由于催化剂组合A2的回归系数为27.061,在其它条件不变的情况下,催化剂组合A2比B2的乙醇转化率平均高27.061个百分点,其它催化剂组合对乙醇转化率大小的影响也取决其回归系数,以此类推。

由显著性检验可知,催化剂组合A2~A7,B3对乙醇转化率平均有较显著的影响。

3.3. 不同催化剂组合及温度对C4烯烃的选择性大小影响的结果与分析

3.3.1. 模型二的显著性检验

通过Stata软件对模型二进行显著性检验 [6],如表5所示。

Table 5. Selective variance analysis of C4 olefins

表5. C4烯烃选择性方差分析表

原假设H0 β 0 = β 1 = δ 1 = = δ 20 = 0

由表可知,检验值F为31.68,P等于0,则该多元线性回归模型是显著的,通过显著性检验,拒绝原假设H0 β 0 = β 1 = δ 1 = = δ 20 = 0 ,即该模型是有意义的。

3.3.2. 模型二的拟合优度和调整后的拟合优度

由式(9)、(10)、(11)得:

n = 114 k = 2 S S E = 2074.37781 S S T = 18616.6328 R 2 = 0.8997 R a d j u s t e d 2 = 0.8769

可知拟合优度接近1,说明误差平方和接近0,本文的拟合效果越好,由于本文并不用于预测,拟合优度并不需要接近1。

3.3.3. 基于普通最小二乘法求解多元线性回归模型二

通过Stata进行标准线性回归得到表6所示。

Table 6. Regression coefficients of Model 2

表6. 模型二回归系数表

***p < 0.01,**p < 0.05,*p < 0.1。

P值小于0.5,代表在95%置信水平下,回归系数显著的异于0的变量有A1~A3,A10~A11,解得模型二为:

Y 2 = 43.296 + 0.188 X + 30.055 A 1 + 11.923 A 2 + 8.779 A 3 11.906 A 10 12.786 A 11 (14)

由于温度回归系数为0.188,同时样本取点温度范围绝大部份在250~400度,所以,在250度到400度的温度范围类,温度与C4烯烃选择性成正相关,且在其它条件不变的情况下,温度每升高一度,C4烯烃选择性平均增加0.188个百分点。

以催化剂组合B2为对照组,由于催化剂组合A2的回归系数为11.923,在其它条件不变的情况下,催化剂组合A2比B2的C4烯烃选择性平均高11.923个百分点,其它催化剂组合对C4烯烃选择性大小的影响也取决其回归系数,以此类推。

由显著性检验可知,催化剂组合A1~A3,A10~A11对C4烯烃选择性平均有较显著的影响。

3.4. 不同催化剂组合及温度对C4烯烃收率大小影响的结果与分析

3.4.1. 模型三的显著性检验

通过Stata软件对模型三进行显著性检验,如表7所示。

Table 7. Variance analysis of C4 olefins yield

表7. C4烯烃收率方差分析表

原假设H0 γ 0 = γ 1 = σ 1 = = σ 20 = 0

由表可知,检验值F为11.02,P等于0,则该多元线性回归模型是显著的,通过显著性检验,拒绝原假设H0 γ 0 = γ 1 = σ 1 = = σ 20 = 0 ,即该模型是有意义的。

3.4.2. 基于普通最小二乘法求解多元线性回归模型三

通过Stata进行标准线性回归得到表8所示。

Table 8. Regression coefficients of Model 3

表8. 模型三回归系数表

***p < 0.01,**p < 0.05,*p < 0.1。

根据表8结果显示,以催化剂组合A16 (催化剂组合B2)作为对照组,与温度相关性最大的催化剂组合为A8 (催化剂组合A3),且p < 0.01,可信度最高。温度相关性为正12.812,且p < 0.01具有很高的可信度。在一定的温度范围区间内(250℃~400℃),随温度增加C4烯烃的收率 [7] 呈显著增长。且A8 (催化剂组合A3)相关性最大,可信度最高。由此可得,催化剂组合A3在400℃的环境下C4烯烃的收率最高。

在低于350℃时,由表8可知,置信度最高的两组催化剂分别为催化剂组合A3 (p < 0.01)和催化剂组合A2 (p < 0.05),且上述两组同样为与温度相关性最大的两种组合。在低于350℃的条件下有理由相信A3与A2的插值拟合曲线 [8],如图1所示催化剂组合A2随温度增加,且效果最为显著。

Figure 1. Interpolation fitting of C4 olefin yield of 21 catalyst combinations at different temperatures

图1. 21种催化剂组合在不同温度下C4烯烃收率的插值拟合

在温度控制在低于350℃的条件下,重新采用如上述多元线性回归,如表9所示,以A2 (催化剂组合A10)作为对照组,与温度相关性最大的组别为催化剂组合A2且置信度高,与温度呈正相关。由此推断,在低于350℃时,在一定温度范围内(250℃~350℃)随温度增大催化剂组合A2的C4烯烃收率越高。

综上所述,低于350℃条件下,催化剂组合A2最优且温度越高越好。

Table 9. Regression coefficients below 350 degrees of model 3

表9. 模型三350度以下的回归系数表

***p < 0.01,**p < 0.05,*p < 0.1。

4. 结论

本文对已有实验数据建立数学模型探究乙醇催化偶合制备C4烯烃的工艺条件。通过建立多元线性回归模型,引入虚拟变量,探究不同催化剂组合及温度对乙醇转化率、C4烯烃选择性以及C4烯烃收率大小的影响,得出催化剂组合和温度的最优区间。本文在已知的实验数据中,通过模型求解,得到了催化剂组合为A2,即200 mg 1 wt% Co/SiO2,200 mg HAP,乙醇浓度0.9 ml/min,温度为425℃时C4烯烃的收率最高,与实验验证结果一致。

本文所提出的模型能极大程度减少实验次数和简化实验数据处理的复杂程度,为今后寻找最佳实验条件提供一个较为准确和简洁的思路。

基金项目

本论文由上海市级大学生创新创业训练计划项目资助(编号:SH2021131)。

参考文献

[1] 李韶伟, 王宇杰, 熊浪, 黄圣淇. 乙醇偶合制备C4烯烃的优化模型[J]. 台州学院学报, 2021, 43(6): 26-32+77.
https://doi.org/10.13853/j.cnki.issn.1672-3708.2021.06.004
[2] 金浩, 高素英. 最佳多元线性回归模型的选择[J]. 河北工业大学学报, 2002, 31(5): 10-14.
[3] 章晓英. 虚拟变量在线性回归模型中的应用[J]. 重庆工业管理学院学报, 1998(2): 84-88.
[4] 刘京娟. 多元线性回归模型检验方法[J]. 湖南税务高等专科学校学报, 2005, 18(5): 49-50+60.
[5] 连玉君, 杨柳. Stata中因子变量的使用方法[J]. 郑州航空工业管理学院学报, 2018, 36(2): 90-103.
https://doi.org/10.19327/j.cnki.zuaxb.1007-9734.2018.02.008
[6] 鲍贵, 席雁. 统计显著性检验: 问题与思考[J]. 南京工程学院学报(社会科学版), 2010, 10(4): 27-32.
https://doi.org/10.13960/j.issn.1671-3753.2010.04.006
[7] 吕绍沛. 乙醇偶合制备丁醇及C4烯烃[D]: [硕士学位论文]. 大连: 大连理工大学, 2018.
[8] 于亚龙, 穆远彪. 插值算法的研究[J]. 现代计算机(专业版), 2014(5): 32-35.