面向未来状态预警的多模态疲劳识别与连续预测研究
Research on Multimodal Fatigue Recognition and Continuous Prediction for Future State Early Warning
DOI: 10.12677/csa.2025.1512334, PDF,   
作者: 黄冬梅*, 蔡洁云:西安电子科技大学数学与统计学院,陕西 西安;崔悦佟:西安电子科技大学人工智能学院,陕西 西安
关键词: 疲劳识别多模态融合状态预警深度学习长短期记忆网络(LSTM)Fatigue Recognition Multimodal Fusion Early Warning Deep Learning Long Short-Term Memory (LSTM)
摘要: 为解决传统疲劳检测方法主观性强、实时性不足的问题,本研究提出了一种面向未来状态预警的多模态疲劳识别与连续预测框架。该框架融合了基于光电容积描记(PPG)信号的生理指标与基于面部图像的行为特征,旨在实现对个体疲劳状态的精准动态监测与预测。研究首先利用集成学习构建了PPG信号三分类(清醒、中度疲劳、高度疲劳)模型,准确率达到98%。同时,设计了结合时序卷积(TimeDistributed CNN)与长短期记忆网络(LSTM)的视觉模型,以捕捉动态面部特征。在此基础上,本文提出一种基于标签对齐的后期融合策略,通过逻辑回归模型自适应加权各模态贡献,有效提升了分类鲁棒性。为实现状态预警,进一步构建了多变量LSTM联合预测模型,以预测关键生理指标的未来趋势。实验结果表明,该多模态框架能够准确识别不同疲劳等级,并为实现从“事后识别”到“事前干预”的智能疲劳管理提供了有效的方法论支持。
Abstract: To address the subjectivity and real-time limitations of traditional fatigue detection methods, this study proposes a multimodal fatigue recognition and continuous prediction framework for future state early warning. The framework integrates physiological indicators from photoplethysmography (PPG) signals with behavioral features from facial images, aiming to enable accurate dynamic monitoring and prediction of individual fatigue states. Initially, an ensemble learning model was developed to classify PPG signals into three states (awake, moderate fatigue, and severe fatigue), achieving 98% accuracy. Concurrently, a visual model combining a TimeDistributed Convolutional Neural Network (CNN) and a Long Short-Term Memory (LSTM) network was designed to capture dynamic facial features. Building on this, a late fusion strategy based on label alignment is introduced, which uses a logistic regression model to adaptively weight the contributions of each modality, effectively enhancing classification robustness. To enable early warning, a multivariate LSTM model was further constructed to forecast the future trends of key physiological indicators. Experimental results demonstrate that the proposed multimodal framework can accurately identify different levels of fatigue and provides effective methodological support for transitioning from post-hoc recognition to proactive intervention in intelligent fatigue management.
文章引用:黄冬梅, 蔡洁云, 崔悦佟. 面向未来状态预警的多模态疲劳识别与连续预测研究[J]. 计算机科学与应用, 2025, 15(12): 187-198. https://doi.org/10.12677/csa.2025.1512334

参考文献

[1] 中华人民共和国应急管理部. 疲劳驾驶安全事故典型案例分析[R]. 北京: 应急管理部, 2021.
[2] 世界卫生组织. 道路交通事故预防报告[R]. 日内瓦: 世界卫生组织, 2023.
[3] 刘炯圳. 基于多模态信号融合的飞行员疲劳状态监测技术研究[D]: [硕士学位论文]. 成都: 电子科技大学, 2023.
[4] 董占勋, 孙守迁, 吴群, 徐娟芳. 心率变异性与驾驶疲劳相关性研究[J]. 浙江大学学报(工学版), 2010, 44(1): 46-50.
[5] 李壮. 基于脑电信号的疲劳状态检测方法研究[D]: [硕士学位论文]. 秦皇岛: 燕山大学, 2020.
[6] 郭永彩, 李文涛, 高潮. 基于PERCLOS的驾驶员疲劳检测算法[J]. 计算机系统应用, 2009, 18(8): 54-57.
[7] 马召宾. 融合眼部特征及头部姿态的实时疲劳驾驶检测技术研究[D]: [硕士学位论文]. 济南: 山东大学, 2016.
[8] 杨硕, 丁建清, 王磊, 等. 卷积神经网络在脑疲劳检测中的研究[J]. 信号处理, 2019, 35(4): 704-711.
[9] Canaria, R.F., et al. (2018) PPG Heart Beat for Cognitive Fatigue Prediction. Kaggle.
[10] Nasri, I., Karrouchi, M., Snoussi, H., Kassmi, K. and Messaoudi, A. (2021) Detection and Prediction of Driver Drowsiness for the Prevention of Road Accidents Using Deep Neural Networks Techniques. In: Lecture Notes in Electrical Engineering, Springer Singapore, 57-64. [Google Scholar] [CrossRef
[11] 高绮煌, 谢凯, 贺正方, 等. 复杂环境下多模态特征融合的疲劳驾驶检测[J]. 电子测量技术, 2023, 46(6): 106-115.
[12] 徐敬一, 田瑾, 刘翔, 等. 基于注意力机制改进的疲劳驾驶检测方法[J]. 传感器与微系统, 2024, 43(4): 115-118.
[13] 方亚南, 汪晓红, 丁一. 基于残差神经网络和表面肌电信号的肌肉疲劳监测研究[J]. 沈阳工程学院学报(自然科学版), 2025, 21(1): 71-77.
[14] 丁晓彬. 贝叶斯网络分类器的参数学习算法研究与实现[D]: [硕士学位论文]. 南京: 南京航空航天大学, 2020.
[15] 马鑫鑫, 苏新华, 葛焕敏. 基于混合LSTM-Transformer的运动疲劳检测[C]//中国体育科学学会.第五届全民健身科学大会论文摘要集——专题报告(三). 北京: 北京体育大学, 2024: 303-304.
[16] 张利伟. 基于视觉的驾驶疲劳实时检测系统研究[D]: [硕士学位论文]. 长沙: 中南大学, 2025.
[17] 牛寅, 高扬, 李涛, 等. 基于网格搜索优化的LSTM多轴疲劳寿命预测方法[J]. 失效分析与预防, 2024, 19(4): 242-249.