基于贝叶斯优化XGBoost的制丝过程关键品质质量预测
Bayesian-Optimized XGBoost for Predicting Key Quality Indicators in Cigarette Manufacturing Process
摘要: 随着机器学习技术的发展,其在工业生产质量预测中的应用日益增多。本研究针对制丝生产过程,特别是在预测出口阶段水分含量的关键质量指标上,应用并优化了XGBoost模型。通过贝叶斯优化(BO)技术对模型的关键超参数进行系统调整,并采用十折交叉验证来评估模型的稳定性和准确性。结果表明,优化后的XGBoost模型在测试集上的决定系数(R²)达到了0.959,均方根误差(RMSE)为0.02573,平均绝对误差(MAE)为0.02015,显著优于随机森林(RF)、支持向量回归(SVR)等传统机器学习模型。本研究不仅提升了制丝生产质量预测的准确性,还展示了数据驱动模型在提高工业生产效率和产品质量方面的实际应用价值,也为其他流程工业提供了参考。
Abstract: With the advancement of machine learning technology, its application in predicting industrial production quality has increasingly grown. This study specifically applies and optimizes the XGBoost model for predicting critical quality indicators, particularly the moisture content at the export stage of the cigarette manufacturing process. The model’s key hyperparameters were systematically adjusted using Bayesian Optimization (BO) and evaluated for stability and accuracy through 10-fold cross-validation. The results demonstrate that the optimized XGBoost model achieved a coefficient of determination (R²) of 0.959, a root mean square error (RMSE) of 0.02573, and a mean absolute error (MAE) of 0.02015 on the test set, significantly outperforming traditional machine learning models such as Random Forest (RF) and Support Vector Regression (SVR). This study not only enhances the accuracy of quality prediction in cigarette manufacturing but also showcases the practical value of data-driven models in improving industrial production efficiency and product quality, providing a reference for other process industries.
文章引用:叶孝生, 叶春明. 基于贝叶斯优化XGBoost的制丝过程关键品质质量预测[J]. 运筹与模糊学, 2024, 14(4): 273-285. https://doi.org/10.12677/orf.2024.144396

参考文献

[1] Wang, J., Xu, C., Zhang, J. and Zhong, R. (2021) Big Data Analytics for Intelligent Manufacturing Systems: A Review. Journal of Manufacturing Systems, 62, 738-752. [Google Scholar] [CrossRef
[2] 陈龙, 刘全利, 王霖青, 等. 基于数据的流程工业生产过程指标预测方法综述[J]. 自动化学报, 2017, 43(6): 944-954.
[3] 李潇睿, 班晓娟, 袁兆麟, 等. 工业场景下基于深度学习的时序预测方法及应用[J]. 工程科学学报, 2022, 44(4): 757-766.
[4] 刘继辉, 许磊, 马晓龙, 等. 基于随机森林回归的制丝过程参数影响权重分析[J]. 烟草科技, 2017, 50(2): 63-71.
[5] 冯寅, 贾宏涛, 杨震强, 等. 基于CNN-LSTM的输电线路故障诊断方法研究[J]. 电网与清洁能源, 2023, 39(11): 59-65.
[6] 阴艳超, 洪志敏, 顾文娟, 等. 融合多通道CNN-BiGRU与时间模式注意力机制的多工序工艺质量预测方法[J/OL]. 计算机集成制造系统: 1-19.
http://kns.cnki.net/kcms/detail/11.5946.TP.20230802.0948.002.html, 2024-05-08.
[7] 付国忠, 杜华, 张志强, 等. 基于注意力机制和CNN-BiLSTM模型的滚动轴承剩余寿命预测[J]. 核动力工程, 2023, 44(S2): 33-38.
[8] 丁敬国, 郭锦华. 基于主成分分析协同随机森林算法的热连轧带钢宽度预测[J]. 东北大学学报(自然科学版), 2021, 42(9): 1268-1274, 1289.
[9] 何彦, 肖圳, 李育锋, 等. 使用CNN-SVR的汽车组合仪表组装质量预测方法[J]. 中国机械工程, 2022, 33(7): 825-833.
[10] 王献志, 曾四鸣, 周雪青, 等. 基于XGBoost联合模型的光伏发电功率预测[J]. 太阳能学报, 2022, 43(4): 236-242.
[11] 朱晓峰, 徐曼菲, 刘治红, 等. 集成主成分分析与随机森林模型的关键工装寿命预测方法[J]. 工业工程, 2023, 26(5): 149-158.
[12] 杜海娜, 孟令峰, 王松峰, 等. 基于机器学习的密集烘烤过程烟叶失水率预测模型对比[J]. 烟草科技, 2022, 55(9): 81-88.
[13] 邢卓冉, 张凯, 刘旭东, 等. 基于随机森林特征优选的雪茄烟叶晾制过程含水率预测[J/OL]. 农业工程学报: 1-12.
https://link.cnki.net/urlid/11.2047.s.20240426.1621.039, 2024-05-08.
[14] 金发岗, 王雅琳, 张鹏程, 等. 随机森林和DE-ELM的烘丝机入口含水率预测[J]. 控制工程, 2020, 27(3): 532-539.
[15] 马强, 高雅, 王红, 等. 基于电价形成机制与XGBoost的单轨制电力现货市场的电价预测[J/OL]. 系统科学与数学: 1-25.
http://kns.cnki.net/kcms/detail/11.2019.O1.20240428.1454.002.html, 2024-05-08.
[16] Chen, T. and Guestrin, C. (2016) XGBoost: A Scalable Tree Boosting System. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, 13-17 August 2016, 785-794. [Google Scholar] [CrossRef
[17] 徐明, 康雅晶, 马斯斯, 等. 基于贝叶斯优化的XGBoost模型预测路基回弹模量[J]. 公路交通科技, 2023, 40(11): 51-60.