1. 引言
疲劳是一种最常见的亚健康状态,它极大地影响着人体的身体状况。疲劳在普通人群中所占比例非常高,疲劳对个体的工作能力具有负面影响,是使工作效率降低的一个重要因素,对个体的社会生活和身体健康也会产生不良影响 [1]。疲劳有多种症状,人体的疲劳可能造成机体反应迟缓,判断、决策能力下降等,严重时可能导致理解力下降,失去对事物的综合判断能力,甚至对一些日常举动无法做出反应或对一些状况无法做出判断。随着疲劳加深,许多慢性疾病随之而来影响着人们的生理健康。近年来,对于人体疲劳状态的研究正逐渐成为热点。
行为、语言一级表现均可反映出一个人的疲劳状态,但对于人体生理信号的测量能够更加准确地反应人体最真实的疲劳状态。国外对于此项研究开始较早,Mohammadi等人 [2] 使用离散小波变换将ECG信号分解成不同的频带,然后提取相应的特征用于疲劳识别。Singh等人 [3] 以皮肤电反应的特征作为研究对象,提出了一种基于诱发压力的方法,并对其进行了统计以及时频域分析,最后通过递归神经网络算法进行心理压力的识别。
近年来,国内也开始重视利用生理信号识别疲劳,且不断地在进行研究与探索。兰州大学的马永昊团队 [4] 开展了基于心电的非接触精神疲劳监测系统的设计与研究,提出了基于耦合心电和心冲击图两种方式的非接触式精神疲劳检测方法,能够准确地利用模型预测精神疲劳状态。
本研究为探究人体疲劳状态与心率变异性之间的关系,基于心电检测和信号处理技术,在设计并开展疲劳监测实验的基础上,建立不同疲劳等级的生理信号数据库,对心电信号与疲劳状态之间的量化关系进行研究,在信号处理部分中首先对采集的心电信号进行滤波预处理,进而提取心率、心率变异性的时域、频域、以及非线性特征,再通过统计方法和机器学习工具建立HR、HRV参数与人体疲劳状态间的映射关系,最终构建人体疲劳状态的监测及预警系统。实时监测人体疲劳状态,过度疲劳时发出预警,在驾驶、医护、科研等行业中有重要意义,以避免例如武汉抗疫工作者因过劳而心脏骤停等不幸的发生。
2. 研究内容
2.1. 实验设计与心电信号处理
2.1.1. 实验设计
本研究对18位在校大学生进行开展做题形式的实验,18位受试者均为身体健康无疾病的在校学生。在身体状态良好的情况下进行试验,实验全程受试者佩戴心电采集设备见图1,实验场景见图2。
实验受试者依次完成不同类型的题目,首先进行10组文字找不同,每组2分钟(共20分钟),随后完成4篇阅读理解,每篇5分钟(共20分钟),最终观看8段视频并回答有关视频内容的问题(共55分钟),整个实验总计95分钟。实验流程见图3。
其中在说明文结束、阅读理解结束、以及视频内三个时间节点,根据受试者个人感受填写五次主观量表,主观量表设计分为五级疲劳程度,记录受试者主观疲劳程度感受。
2.1.2. 心电信号预处理
心电信号具有幅值小,频率低,个体差异大等特点,而且在采集心电信号的同时在环境中也存在着大量干扰,如电极噪声、静电干扰、无线电波及高频设备干扰等 [5]。本研究在提取HRV之前采用小波变换(如(1)式所示)对于采集到的人体心电信号进行预处理。
(1)
其中
为原时域心电信号,
为通过对母小波和父小波进行缩放和平移后集合形成的小波基 [6]。通过小波变换对心电信号在多个尺度上进行分解,保留有用信号的系数,最后通过提取的小波系数重构信号,从而降低噪声干扰 [7],有利于后续QRS波群检测。
2.2. 提取心率变异性特征值
Pan-Tompkins算法是Jia Pu Pan和Wills J.Tompkins于1985年发表的《A Real-Time QRSDetection Algorithm》中提出的一种用来检测心电图中QRS波群信息的算法,由于其能够实现实时检测,精度较高,成为检测心电信号中QRS波群相关信息的一种经典算法,该算法包括带通滤波、微分、平方、积分、阈值更新等步骤。本研究选用该算法 [8],能够较好提取R峰峰值等用于HRV研究的心电信息。为准确提取心率变异性特征参数奠定基础。原始心电信号见图4,经过PT算法之后标记了R峰的信号见图5。

Figure 5. Signals marked with R-peak after processing by the algorithm
图5. 算法处理后标记了R峰的信号
2.3. 统计学分析
为筛选出相关性更强的特征值,从受试者的心电信号中提取出33个心率变异性特征参数,并使用SPSS22.0分析软件进行统计分析,统计内容包括不同疲劳度HRV参数的样本数、平均值、标准误差等。采用单因素方差分析法分析各HRV参数在3个不同程度疲劳度的差异性,以P < 0.05代表具有显著性差异。最终选取6个特征参数用于建模,SDNN、SDANN、SDNNi、meanHR、LF/HF、Max-min。见下表表1为常用特征参数举例,见下表表2为清醒,轻度疲劳,重度疲劳(嗜睡)三种类型的疲劳度与各HRV参数比较结果。可以发现,这三种疲劳类型的特征值在不同疲劳度的差异性具有统计学意义(P < 0.05),而pNN5、RMSSD、LFn、HFn在不同疲劳度的差异性无统计学意义(P > 0.05)。其中SDANN和LF/HF为P值最小,相关性最大的特征参数。

Table 1. HRV characteristic parameters
表1. HRV特征参数

Table 2. Comparison of different degrees of fatigue and HRV parameters
表2. 不同程度疲劳度与各HRV参数比较
注:*P < 0.05,具有统计学意义。
2.4. 机器学习建立模型
支持向量机(supportvector machine, SVM)是一种在分类与回归分析中对数据进行分析的的监督式学习(supervised learning)模型与相关的学习算法。本研究为对疲劳等级进行分类,采用机器学习方法,因其特征值较多且数据样本量不大,采用监督学习中的SVM算法,它的决策边界是对学习样本求解的最大边距超平面。采用两两分类将轻度疲劳、重度疲劳(嗜睡)统一划分为疲劳,与正常等级进行特征值的二分类比较,分类精确度为75.56%。在二维线性二分类过程中,其原理见图6,线性可分SVM应对能将数据正确划分并且间隔最大的直线。
其间隔等于两个异类支持向量的差在w上的投影,即
(2)
经推导,间隔最大化后可得
(3)
即
(4)
对于更多的分类情况,可以将多个分类面的参数求解合并到一个最优化问题中,也通过组合多个二分类器来实现多分类器的构造,对于线性不可分的数据,采用非线性变换,(3)式的对偶问题为
(5)
可求解得
(6)
其中
为核函数,在实际应用中,通过挑选不同的核函数,可以获得更好的分类结果。
SVM的最终决策函数由少量的支持向量所确定,通过支持向量的数目,而不是样本空间的维数决定计算的复杂性,从而排除了大量无关的样本数据,且具有较好的鲁棒性 [9]。因此,在本研究中可以通过较简便的操作获得较好的心电数据处理结果。
3. 结果分析
本研究对于实验采集的心电信号预处理后提取33个心率变异性特征参数,通过已有研究 [10] 和本研究中对于HRV特征值选取的优化,在SVM中挑选与疲劳等级有较强相关性的6个特征值,按照实验设计的正常、轻度疲劳、重度疲劳(嗜睡)三级疲劳等级进行分类。选取其中8组受试者数据共116段心电作为训练集,2组受试者数据共29段心电作为测试集,6个特征值作为数据集。
由于SVM模型训练过程中的参数设置将对分类结果产生较大的影响,本研究采用了网格参数寻优的方法寻求更好的参数,其中影响较大的参数是核函数的参数gamma (-g)和惩罚参数cost (-c)。
在核函数类型(-t)采用默认值2-RBF核的条件下,首先利用meshgrid函数生成网格矩阵,然后采用交叉验证法选择最佳参数c与g。进行模型训练,在对6个特征值进行三级疲劳等级分类的过程中,其寻得的最优c值为1.4142,最优g值为4。
以此进行SVM训练得到的模型中,SVM文件转换为二次规划求解得到的最小值obj为−48.413006,判决函数的偏置项rho为−48.413006,标准支持向量个数(
) nSV为78,边界上的支持向量个数(
) nBSV为27,支持向量总个数Total nSV为114。得到精确度为51.72% (15/29),分类效果一般,为提高分类精确度,将33个特征值全部放入数据集,再次进行分类,精确度为55.17% (16/29)效果仍然不好。
为进一步探寻不同疲劳程度间HRV的变化,分别研究三种不同疲劳等级之间选取6个特征值和33个特征值作为数据集直接进行两两之间分类。得到如下结果见表3。

Table 3. Accuracy of two-category between different levels of tireness
表3. 两两疲劳等级进行分类精度比较
由上述尝试的分类精度可知,两两分类时,直接对正常与重度疲劳(嗜睡)直接进行分类效果最好,但由于现实生活中,不可能由正常直接进入重度疲劳状态,因此我们更应该关注轻度疲劳与重度疲劳(嗜睡)两个疲劳等级之间的关系。同时选取33个特征值得到的分类效果会比选取6个特征值的更好,但以33个特征值为数据集,SVM分类的运行时间会大幅度增长,因此应该在需要快速获取分类结果的场合使用关联程度较大的6个特征值,在不计时间追求更高精确度时选取更多特征值。三分类时,对数据进行处理后效果更好但提升精度不大,后期将进一步扩充样本数据并提高识别精度。
4. 结论
本研究探究了人体在不同疲劳程度下心率变异性特征值变化,首先通过实验采集做题时长不同状态下的心电并对其进行分类识别。采集到18位受试者进行95分钟时长的实验时的心电信号,采用小波变换的方法进行预处理得到准确的QRS波;随后使用SPSS进行统计学分析,选取6个相关性最大的特征参数以减小个体差异;最终使用支持向量机建立分类模型,经过不断优化算法得到精度高于80%的分类结果。针对本研究的分类结果,未来希望对以下方面开展进一步的研究:改进更高精度的分类模型和建模手段;增加受试者数据量,加大研究样本;不断优化算法,细化疲劳等级提高识别精度等。本研究可以运用到日常生活中,有助于对人的主观状态进行客观化评价,在医学监护或高压工作者健康监护等方面具有重要的研究意义和应用前景。
基金项目
天津市科技计划项目(20YDTPJC00570);天津市教委科研计划项目(2019KJ023);教育部高等教育司“人因与功效学”产学合作协同育人项目(202001S·Z03)。
NOTES
*通讯作者。