1. 引言
工业5.0的到来标志着制造业范式的关键转变——从工业4.0纯粹技术驱动的效率模式,转向以人为本、可持续且具有韧性的生产模式。根据欧盟委员会[1]的定义,工业5.0旨在通过增强生产韧性并将工人福祉置于生产流程核心,实现“超越就业与增长的社会目标”。相较于强调自动化、互联互通及数据驱动决策的前代模式,工业5.0着重构建三大核心支柱:以人为本、可持续发展与韧性增强。图1显示了工业1.0到工业5.0的发展变化,在此背景下,技术系统不再是人类劳动力的替代品,而是协作伙伴——它们增强人类创造力、判断力与能力,而非完全取代人类。
Figure 1. The evolution from industry 1.0 to industry 5.0
图1. 工业1.0到工业5.0的发展变化
在制造业领域,尤其在印刷业等高精度行业,这种以人为本的转变意义深远。印刷厂并非仅由自主运行的机器序列构成,而是人类操作员与智能机器、传感器及控制系统协同运作的社会技术生态系统。在此类环境中,工人的状态——如注意力、疲劳度和心理负荷——直接影响生产质量、错误率、安全性和吞吐量。传统自动化方案往往低估或忽视操作员的认知与注意力动态,将其视为系统的确定性输入,而非精神状态会波动并影响结果的能动主体。
认知与注意力监测的整合仍未得到充分探索。近期系统性综述强调,虽然以人为本是明确的理想目标,但实践中许多制造系统仍忽视人类如何实时思考、感受并保持投入[2]。换言之,“操作员5.0”仍常被视为生产链中的被动环节,而非受主动监测、赋能且具备适应性的参与者。要实现工业5.0的愿景,必须通过感知、解读并响应人类认知状态的方法来丰富制造系统——从而闭合人机系统间的闭环。
在印刷行业,此类以人为本的认知监测需求尤为迫切。印刷作业要求持续专注力、精细动作精度,以及在色彩对位、套准精度或缺陷检测等环节严格控制质量偏差。在智能生产环境中,操作员注意力波动或认知参与缺失可能直接导致错印、次品批次、返工、设备故障甚至安全事故。因此,嵌入实时注意力波动监测机制与工业5.0的人本化目标高度契合:既赋能工人、保障精密操作,又促进人机协同适应性发展。
新兴神经人体工程学研究日益证实,脑电图(EEG)技术为工业场景的实时认知监测提供了可行路径。例如神经人体工程学研究表明,可穿戴式脑电设备即使在非结构化环境中也能量化注意力与工作负荷变化[3]。此外,工作场所脑监测技术正逐步具备商业可行性,虽亟需伦理与实践框架规范,却也为提升工人自主性与系统效能开辟了新路径[4]。在此背景下,本研究提出一种基于脑电图的新型实时注意力监测算法,该算法适用于印刷行业,同时与以人为本的工业5.0愿景高度契合。
Figure 2. Printed smart factory model based on EEG attention detection technology
图2. 基于脑电注意力检测技术的印刷智能工厂模型
具体而言,不同于传统只考虑频段特征的注意力检测算法,本研究将振荡功率比(β/(α + θ))与谱熵这一度量频谱信息分布均匀性与复杂度的重要指标相结合,能够敏锐地检测传统频段功率指标可能遗漏的注意力波动。我们通过与传统功率指标的对比验证,证明该算法具备更高的灵敏度和实时可行性。该方法能够实现精准、低成本且可解释的实时注意力监测,图2为本研究提出的印刷智能工厂应用脑电注意力检测技术的框架模型,本研究提出的算法在注意力检测阶段能够发挥更大效能,充分说明本研究能够进一步支持工业5.0印刷环境的核心运营目标与以人为本理念:构建更安全、更适应性强、更高效的生产体系,并将人类操作员置于核心位置。
在此背景下,本研究提出一种面向印刷工业场景的基于脑电图的实时注意力监测算法,该方法在传统频段功率比特征的基础上引入谱熵这一刻画频谱整体结构与复杂度的指标。不同于仅依赖局部频段能量变化的注意力检测方法,所提出的融合策略能够在保持计算简洁与可解释性的同时,对注意力状态的时间稳定性进行约束。通过在相同脑电数据条件下与基线方法进行对比实验,并结合配对统计检验进行定量分析,验证了谱熵特征在降低注意力估计波动性、提升时间一致性方面的工程有效性。本研究通过特征层面的优化与工业应用验证,为在智能印刷环境中实现可落地的人本化认知监测提供一种轻量、可靠的技术方案。
2. 脑电注意力检测研究现状与应用缺口
2.1. 脑电图与注意力检测的基本原理及方法演进
脑电图(EEG)通过记录头皮电位变化来反映大脑皮层神经元的同步电活动,以其毫秒级的高时间分辨率、非侵入性及成本相对较低的优势,成为研究动态认知过程(如注意力)的重要工具[5] [6]。注意力作为一种有限认知资源的分配过程[7],其神经机制与EEG信号的振荡活动密切相关。通常,EEG信号在频域被分解为δ (0.5~4 Hz)、θ (4~8 Hz)、α (8~12 Hz)、β (13~30 Hz)和γ (>30 Hz)等标准频段[8]。研究表明,α频段功率的降低常与注意力投入增加相关,反映特定脑区功能抑制的减弱[9];θ频段活动与认知控制和持续注意相关,尤其在需要监控的任务中其额叶功率会增强[10];β频段则常被视为警觉性和主动认知处理的指标[11]。
基于上述神经生理学基础,传统的注意力检测方法主要依赖对特定频段功率或其比值的分析。功率谱密度(PSD)分析及其衍生的特征(如α/β功率、θ/β比值等)因计算简便、可解释性强而被广泛使用[12] [13]。例如,β/(α + θ)比值已成为评估警觉性和注意力水平的常用指标[14]。为进一步追踪注意力的动态变化,短时傅里叶变换(STFT)和小波变换等时频分析方法也被引入,以提供更高时间分辨率的频带能量信息[15]。
然而,传统基于固定频带功率的方法存在局限性。首先,它们主要关注振荡幅度,而忽略了EEG频谱的整体分布形态和信号的复杂性,这些特性可能蕴含重要的认知状态信息[16]。其次,注意力是高度动态且非平稳的过程,其细微波动未必表现为预定义频段功率的显著变化,导致传统方法可能遗漏重要的瞬态认知事件[17]。此外,不同任务、个体间的神经振荡模式存在差异,这使得基于通用频段假设的指标普适性受限[18]。这些局限性推动了对更丰富、更敏感特征描述符的探索。
2.2. 脑电图注意力检测的跨领域应用现状
基于EEG的注意力监测技术已在多个非工业领域得到验证和应用,证明了其技术可行性与实用价值。
医疗与临床应用:EEG注意力指标被用于评估和诊断注意力缺陷多动障碍(ADHD)、痴呆、创伤性脑损伤等神经认知障碍[19]。在脑机接口(BCI)和神经康复领域,持续的注意力是有效交互的关键,相关应用推动了在复杂条件下实时处理算法的发展[20]。
教育与学习环境:研究利用EEG监测学生的课堂注意力与认知负荷,发现其与学习表现存在关联[21]。可穿戴EEG设备使得在自然教学环境中进行评估成为可能,并催生了能根据实时注意力反馈动态调整内容的自适应学习系统[22]。
驾驶与交通系统:该领域关注利用EEG检测驾驶员疲劳与注意力分散,是应对运动伪影和环境噪声挑战的典型场景,相关成果已集成至驾驶辅助预警系统中[23]。
上述应用共同表明,基于EEG的注意力监测方法学已相对成熟,能够实现实时、灵敏的认知状态评估,并支持闭环的人机系统交互。然而,这些应用主要聚焦于健康监护、教育效果或交通安全,其核心目标在于诊断、教学优化或风险规避,而非直接提升工业生产环境下的操作绩效与质量。
2.3. 工业应用缺口与本研究的定位
尽管相关方法体系已较为完善,基于脑电信号(EEG)的注意力状态监测在高精度制造场景中的应用研究仍相对匮乏。在工业5.0倡导以人为中心的制造范式背景下,操作人员的持续注意水平对产品质量一致性、工艺过程稳定性及生产运行安全具有重要影响。因此,针对该类复杂工业场景构建高时效性与高可靠性的认知状态在线监测方法具有显著的理论价值与现实需求。
现有研究与本工作的差异主要体现在:第一,多数现有方法提供的是注意力状态的定性或分类评估,缺乏连续、定量化的精细度量。第二,对注意力瞬时、细微波动的捕捉能力有限。第三,未能充分利用EEG信号中超越简单功率谱的复杂信息。
为此,本研究引入谱熵(Spectral Entropy)作为核心特征之一。谱熵通过量化功率谱分布的均匀性来测量信号的规则性与复杂性,已显示出表征神经状态的潜力[24]。本研究创新性地将谱熵与传统频带功率特征相结合,构建一个多维、定量化的注意力评估指标。该方法旨在克服传统方法的不足,以更高的灵敏度捕捉注意力的动态波动,并为印刷智能工厂等工业环境提供一种可实现实时、精准注意力监测的解决方案,从而将人因因素深度融入自动化生产系统。
3. 研究方法
针对印刷智能工厂等复杂工业环境下脑电(EEG)信号非平稳性强、噪声干扰多以及操作人员注意力状态动态变化的特点,本研究提出一种融合频域功率与谱熵的脑电注意力检测算法。
Figure 3. Algorithm flowchart
图3. 算法流程图
该算法以实时采集的原始EEG信号为输入,通过预处理、特征提取与融合、以及时间平滑等步骤,输出一个在[0, 2.5]范围内连续变化的注意力量化值,得分越高表示注意力越集中。整体流程如图3所示,其性能将通过与传统频域方法对比进行验证。
3.1. 数据预处理与特征提取框架
在工业生产现场环境下采集的EEG通常具有显著的非平稳性、较低的信噪比以及对外界干扰高度敏感等特点[25]。为确保分析可靠性,首先对原始信号进行规范化预处理。设原始信号为离散时间序列
,采样频率为
。预处理包括:
(1) 筛选并剔除过短的无效数据片段;
(2) 将有效片段按时间顺序拼接为连续序列
;
(3) 采用固定长度
的滑动窗口对
进行短时分帧,以近似满足局部平稳性假设,得到信号帧集合
,其中
。
此过程为后续稳定的频域特征计算奠定了基础。特征提取旨在从每个信号帧
中量化表征注意力状态的特征,本研究融合了传统的频带功率特征与谱熵特征。
3.1.1. 频带功率比特征
对每帧信号进行离散傅里叶变换(DFT):
,
得到功率谱
计算与注意力相关的经典频段(如θ:4~8 Hz,α:8~12 Hz,β:13~30 Hz)的平均功率
。构建注意力相关的频带功率比(RP)特征,其形式借鉴了经典的警觉性指标:
其中
为极小正数防止除零。该特征反映了与警觉性正相关的β波段相对于和放松/分心相关的α、θ波段的相对强度。
3.1.2. 谱熵特征
为弥补功率特征对信号复杂度信息捕捉的不足,引入谱熵(Spectral Entropy)。首先将功率谱归一化为概率分布:
。计算该帧信号的香农熵:
并将其归一化到[0, 1]区间:
,其中
为频率点数。归一化谱熵
衡量频谱能量分布的均匀性:值越低表明能量越集中、信号越有序;值越高则表明能量越分散、信号越复杂。研究表明,高注意力状态常伴随神经活动同步化增强,表现为较低的谱熵[26]。因此,构建注意力一致性谱熵特征:
,使其值随注意力集中而增大。
3.2. 特征融合与注意力评分生成
为综合利用频带能量分布和信号整体复杂度信息,将上述两类特征进行线性融合,生成每帧的融合注意力特征值
:
其中,
和
分别为功率比特征和谱熵特征的权重系数,
为尺度因子,用于调节两类特征在数值量级上的匹配。此融合策略使算法既能感知特定频段的能量转移,又能响应全局频谱结构的规律性变化,从而提升对细微注意力波动的敏感性。
由于脑电信号的瞬时波动可能包含噪声,直接使用帧级特征
会导致注意力曲线剧烈抖动。为此,采用滑动窗口平均进行时间平滑,以得到稳定、连续的注意力评分序列
:
其中
为平滑窗口长度。此步骤抑制短期伪波动,保留注意力状态的渐进变化趋势,输出最终可用于实时监测的连续注意力曲线。
3.3. 算法效果验证
验证方式
为验证所提基于脑电波的注意力检测算法在复杂工业环境中的有效性与改进效果,在相同实验条件下使用同一脑电波数据集进行了对比分析。验证使用公开数据集eegRaw.json。该数据集包含单通道、采样率为512 Hz的连续EEG原始信号及其预计算的各频段功率,适合进行时序分析与算法测试。此外,本研究采用了该项目提供的原始注意力检测算法作为性能基准(下称“基线算法”)。基线算法采用经典的注意力检测流程(如图4所示),其核心是仅依赖于上述频带功率比
作为注意力指标[27]。
Figure 4. Baseline algorithm flowchart
图4. 基线算法流程图
为确保对比公平,EEG信号采用固定长度滑动窗口进行处理。由于数据过多,本文以前25 s内的注意力变化情况为例进行结果分析与统计检验。考虑到注意力得分来源于脑电信号的频谱特征,其统计分布不满足正态性假设,且比较对象为同一时间点下不同算法输出,本文采用Wilcoxon符号秩检验对两种方法的帧级注意力得分进行配对统计分析,同时引入rank-biserial correlation作为效应量指标,以刻画差异的实际影响程度。通过对比,旨在实证谱熵特征的引入能否有效提升注意力监测的精准度与动态跟踪能力。
4. 研究结果
在相同EEG数据集与统一实验参数条件下,对原始基于频段功率比值的注意力检测算法与本文提出的融合谱熵的改进算法进行对比分析,得到前25 s内注意力得分如图5和图6所示,注意力得分越高代表注意力越集中。图7则展示了两种方法注意力得分的箱线图分布。
4.1. 注意力检测结果曲线分析
通过对图5与图6的直接对比,可以清晰地看出两种算法在注意力检测结果上的显著差异,新方法对脑电图注意力信号中微小快速变化更具敏感性。基线算法输出的注意力曲线整体波动剧烈,而改进算法在保留轨迹中的主要峰值(如约3~4秒和约10秒处的大事件)的基础上表现出更加平滑且趋势明确的时间序列特征。从箱线图也可以看出:基线方法的分布范围较宽,存在明显长尾现象;改进方法的分布更加集中,离散程度显著降低;中位数与均值高度一致,说明改进方法输出结果具有较好的稳定性与一致性。
进一步从时间轴变化特征进行分析,在注意力相对集中的时间段内,改进算法能够形成稳定的高注意力区间,而基线算法在同一时间段内仍表现出较大的随机波动。这说明改进算法在维持高注意力状态评估方面具有更强的稳定性。表1总结了两种算法在注意力检测结果表现方面的定性对比。
Figure 5. Baseline algorithm detection of attention score results
图5. 基线算法检测注意力得分结果
Figure 6. This study’s algorithm detects attention score results
图6. 本研究算法检测注意力得分结果
4.2. 描述性统计分析与统计显著性检验
表2给出了前25 s内两种方法注意力得分的描述性统计结果。可以观察到:(1) 改进方法的平均注意力得分显著高于基线方法,表明其对注意力状态的响应更为明确;(2) 基线方法的标准差明显更大,说明其输出结果波动性较强,易受瞬时频谱变化影响;(3) 改进方法在保持较高均值的同时,标准差显著降低,体现出更好的时间稳定性。
Figure 7. Distribution of attention scores for two algorithms in box plots
图7. 两种算法注意力得分箱线图分布
Table 1. Performance comparison of attention detection results across different algorithms
表1. 不同算法注意力检测结果表现对比
对比指标 |
基线算法 |
改进算法 |
注意力曲线整体形态 |
波动剧烈 |
连续、平滑 |
相邻时间窗变化 |
幅度较大 |
幅度收敛 |
异常尖峰 |
频繁出现 |
明显减少 |
注意力趋势可读性 |
较差 |
明显提升 |
注意力高值维持能力 |
不稳定 |
稳定区间明显 |
结果解释一致性 |
易受干扰 |
更符合认知规律 |
进一步对两种方法的帧级注意力得分进行Wilcoxon符号秩检验,结果显示,统计量为50.0,p值小于0.001,表明两种方法在统计意义上存在极显著差异。与此同时,效应量结果显示rank-biserial correlation 的值为−0.960,绝对值接近1,说明该差异不仅具有统计显著性,同时在工程应用层面也具有较强的实际影响。需要指出的是,RBC的符号方向反映了改进算法在绝大多数时间帧上取得更高注意力得分,进一步验证了其在时间一致性上的优势。
Table 2. Attention score descriptive statistics
表2. 注意力得分描述性统计
|
基线算法 |
改进算法 |
均值 |
0.329 |
1.130 |
标准差 |
0.335 |
0.248 |
中位数 |
0.226 |
1.130 |
最小值 |
0.008 |
0.513 |
最大值 |
2.148 |
1.696 |
4.3. 结果讨论
总体而言,实验结果从时间序列形态、分布特性及统计显著性检验三个层面验证了本文所提出注意力检测算法的改进策略具有良好的实际有效性和工程应用价值,所提出的方法在不显著增加计算复杂度的前提下,实现了对注意力状态更稳定且可解释的实时评估。上述差异与两种算法的建模方式密切相关。如表3所示,基线算法仅基于β、α和θ频段功率之间的相对关系构建注意力模型,对EEG频谱整体结构缺乏约束。当信号频谱因噪声或非平稳性发生扰动时,注意力得分容易出现放大效应。相比之下,改进算法在频段功率比值的基础上引入谱熵特征,并通过加权融合方式对注意力得分进行修正。这一改进对于印刷等高精度连续作业场景具有直接工程意义,因为在此类场景中,系统更关注注意力状态的稳定区间与持续性变化趋势,而非由瞬态干扰引起的局部尖峰响应。
Table 3. Comparison of core algorithm differences
表3. 算法核心差异对比
对比维度 |
基线算法 |
改进算法 |
核心特征 |
频段功率比值β/(α + θ) |
频段比值 + 谱熵 |
特征维度 |
局部频段能量关系 |
频段能量关系 + 频谱整体结构 |
对非平稳信号适应性 |
较弱 |
较强 |
对瞬态噪声敏感性 |
较高 |
明显降低 |
注意力建模方式 |
单一比值模型 |
多特征加权融合模型 |
在印刷工业场景中,环境噪声不仅来自脑电生理信号内部的眼电、肌电等伪迹,还可能叠加外部机械噪声、设备运转产生的电磁干扰以及振动噪声。这些噪声源在频谱上表现为不同频率成分的干扰——例如工厂机械震动可在低频至中频范围内造成持续背景干扰,而电动设备的电磁辐射往往会引发高频成分的叠加噪声,导致原始EEG信号的频谱能量分布遭到破坏。EEG信号本身幅度微弱,常因这些频率干扰而使固定频带功率比指标(如β/(α + θ))对注意力状态的估计产生较大偏差,因为这些指标主要依赖对预定义频段能量的直接比值计算,而这种比值在噪声干扰下容易引入显著误判。EEG信号噪声类型与频谱特性有系统综述指出,不仅眼电、肌电伪迹等广泛存在,而且外部噪声会影响功率谱估计的准确性,要求在特征设计上具有更强鲁棒性才能实现可靠监测[28]。
与单一功率比特征不同,谱熵作为衡量频谱整体复杂度与能量分布均匀性的指标,具有固有的统计描述能力。谱熵并不依赖某一特定频段的能量值,而是将整个功率谱归一化为概率分布,并计算该分布的无序程度,从而间接反映信号整体组织结构。已有研究表明,在注意力相关EEG分析中,相比传统的频谱方法,复杂性与熵类方法能够获取传统频谱所未能提供的信息,并在一定程度上“包容”频谱中微小波动与杂散能量成分,从而增强特征对注意力状态的区分能力。具体而言,复杂性度量有助于补充单一频带分析的局限性,使得注意力特征能够更好地响应真实神经活动的变化而非偶发噪声的影响[29]。此外,在噪声鲁棒性分析中也有证据表明,包括谱熵在内的熵特征在含噪条件下比某些功率特征更能维持分类或检测性能,这为我们在工业噪声干扰下采用谱熵作为辅助特征提供了理论支持[30]。结合本章结果可以认为,谱熵通过对频谱整体结构的刻画,在一定程度上削弱了外界机械与电磁噪声对固定频带功率比的放大效应,从而使注意力时序曲线更平滑、更具判别力。
需要指出的是,本章结论仍受限于数据来源与场景逼近方式,尚未在真实印刷生产线上进行系统验证。尽管如此,基于噪声机理与复杂性理论的分析表明,将谱熵与传统频带特征进行加权融合,属于“工程优化 + 工业应用探索”的合理路径,其价值体现在提升噪声鲁棒性、稳定性与可解释性的综合权衡上。后续工作将面向印刷设备运行噪声频谱的实测数据进行针对性建模,并引入任务事件标注以检验模型在真实工况中的有效性,从而进一步缩小实验环境与工业应用场景之间的差距。
5. 总结与展望
本研究通过实验验证了融合谱熵与频段功率特征的脑电注意力监测算法在模拟印刷工业场景下的有效性。与传统仅依赖频带功率比的方法相比(取前25 s数据为例进行对比),改进算法在注意力评估中表现出更高的时间稳定性和一致性,其注意力得分差异经配对统计检验验证具有显著性,且具有较强的实际效应。结果表明,引入谱熵作为对频谱整体结构的约束,有助于抑制由非平稳性和瞬态噪声引起的异常波动,从而在动态响应能力与抗干扰稳定性之间取得更合理的平衡。
从神经生理机制看,谱熵有效刻画了EEG频谱结构的复杂度。注意力集中时,神经活动趋于同步与有序,表现为较低的谱熵值;注意力分散或疲劳时,信号复杂性增高,谱熵值上升。将这一全局复杂度特征与反映特定频段能量转移的功率比特征相结合,使算法不仅能敏感捕捉认知资源的瞬时动员,更能从信号演化规律上避免对瞬态噪声的过敏感,从而实现对操作员注意力状态更精准、更具可解释性的量化描述。
这一技术进步直接呼应了工业5.0构建“以人为本”制造体系的核心诉求。本研究提出的算法框架,通过实现“感知–解读”的实时认知反馈,为将操作员转化为适应性生产核心提供了关键技术赋能。它并非旨在替代人力,而是作为一种认知增强工具,使系统能够理解并适应操作员的负荷状态,体现了技术系统开始具备“人感”属性的转变。在印刷智能工厂等高精度场景中,这种鲁棒的注意力监测能力尤为重要,它有助于通过及时预警注意力下降来降低次品率、优化流程,从而增强生产系统的整体韧性、安全性与适应性。
当然,本研究也存在局限性。目前基于单通道EEG的设计虽有利于可穿戴与实时性,但牺牲了对脑功能空间拓扑信息的捕捉;算法中部分参数(如谱熵缩放因子)的设置仍具有一定经验性,其在不同个体与工况下的泛化能力需进一步验证;此外,在实际部署中必须审慎考虑员工隐私保护等伦理挑战。
未来研究可在以下方向深入:一是探索多模态融合,结合眼动、心率等信号构建更全面的操作员状态模型;二是发展自适应参数调整机制,实现算法的个体化校准;三是在此精准监测基础上,研究并验证有效的闭环人机协同干预策略。本研究通过在保持模型轻量化与可解释性的前提下实现鲁棒的注意力监测,不仅为印刷业的智能化升级提供了具体技术方案,也为更广泛的高认知负荷人机协作系统提供了可参考的方法路径。