1. 引言
动脉血压(ABP)作为人体最重要的生理指标之一,一旦出现异常就会成为心血管疾病(CVD)最重要的诱因之一 [1] 。然而在大多数情况下,血压出现异常并不会有明显的症状或体征,导致了患者无法及时了解自身病情并得到有效的治疗。想要准确的获取血压,现在广泛使用的还是侵入式血压计与袖带式血压计:前者能准确且连续的监测血压,但需要直接侵入患者动脉;后者使用繁琐的同时也无法完成对血压的连续测量 [2] 。
鉴于传统血压监测技术存在如上所述的缺点,现代临床医学亟需一种具有高准确性的连续无创血压监测技术。为此,研究者们将目光投向了通过光电容积脉搏波(PPG)、心电信号(ECG)和动脉血压(ABP)之间的相关性建立数学模型的连续无创血压监测方法。1981年,Gedes等 [3] 首先验证了从PPG、ECG信号中获取的脉搏波传输时间(PWTT)与血压的线性关系。2005年,Payne等 [4] 通过实验确认了PWTT与血压的线性关系,并且发现其与收缩压的相关性明显高于舒张压。Shin等 [5] 发现从PPG信号交叉点和切割点提取的PWTT与血压的相关性最高。Gan [6] 则通过传感器采集指尖脉搏波计算PWTT,并以此建立较为可靠的血压预测模型。随着人工智能算法的兴起,研究者们将机器学习的方法引入血压预测。Khalid等 [7] 从单一的PPG信号中提取特征,并使用决策树回归等算法进行了预测血压的研究。Mark等 [8] 使用了多个支持向量回归机器组成的集成学习框架进行血压预测,具有良好的效果。Kachuee等 [9] 研究了PTT与血压之间的关系,发现许多人体生理指标也与血压有关。Thambiraj [10] 等人则从ECG、PPG信号中手动提取了特征输入采用随机森林算法的机器学习模型中,证明了同时使用ECG、PPG信号要优于单独使用PPG信号。
与基于机器学习的传统血压测量方法相比,深度学习模型可以学习高维特征。该方法对复杂非线性系统具有较强的建模能力。Slapnivcar等 [11] 使用ResNet模型在大型公共数据集上进行实验,以预测血压,并取得了良好的结果。Wang等 [12] 还提出了一种基于特征的血压预测方法。在他们的论文中,提出了多种不同的特征提取方法,但该方法需要大量时间来提取特征。Wu等 [13] 基于信号波形特征和个人生理信息特征的组合建立了模型,该模型可以通过ECG信号和PPG信号学习与血压相关的隐藏特征。Baker等 [14] 提出了一种使用ECG、PPG原始信号作为输入的CNN-LSTM网络,通过提取ECG、PPG信号中的时序信息完成血压预测。Meng Rong [15] 等人建立了一种手动从PPG信号中提取多模态信息,然后以深度神经网络进行特征融合的方法,取得了优秀的结果,但该方法使用的特征融合方法较为简单,没有应用在别的研究领域已经出现的特征融合方法,在特征融合过程中可能出现信息丢失的情况。
基于以上背景,我们提出了一种基于多传感器信号特征融合的三输入深度学习血压预测模型。该模型提取PPG信号及ECG信号的特征,二者的波形特征加上脉搏波传输时间(PWTT)这三类特征被设计过的深度学习模型融合以预测血压。
2. 基本原理及背景知识
多输入单输出的神经网络模型很重要的一个组成部分便是将多路信号特征融合的融合模块,在血压预测领域中,前人往往采用简单的拼接网络进行融合工作,本文旨在引入其他领域先进的特征融合方法的思想以规避特征融合时产生的信息丢失与网络视野减小。
多跳问答推理是自然语言处理(NLP)领域中被设计出来用以解决在多个相关文档中检索以实现对复杂问题的理解并回答的方法。模型需要具备从多文档文本描述和问题推理出相应回答的能力。本文基于多跳问答推理解决多文档复杂问答问题的思想,设计了如图1所示的神经网络结构用于融合多传感器信号输入,旨在规避网络训练时对单一输入信号产生的路径依赖,以增强神经网络预测的泛化性及准确性。

Figure 1. GRU-Attention feature fusion network diagram
图1. GRU-Attention特征融合网络结构图
3. 基于特征融合的血压预测方法
3.1. 模型整体结构
本文设计的模型结构简图如图2所示,为更有效地利用多传感器信号输入的优势,将输入的多传感器信号分为三路输入网络模型,先通过Transformer模块提取高维时序特征,然后通过多跳GRU-Attention融合网络融合多路信息,以实现对血压的预测,输出所预测心动周期的舒张压及收缩压。

Figure 2. Flow chart of blood pressure prediction
图2. 血压预测流程简图
3.2. 多传感器输入信号
本文所采用多传感器信号包括ECG信号及PPG信号。心电(ECG)信号暨心脏在每个心动周期中,由起搏点、心房、心室相继兴奋,伴随着生物电的变化,通过心电描记器从体表引出多种形式的电位变化的波形。光电容积脉搏波(PPG)信号是利用光电容积描记(PPG)技术进行人体运动心率的检测是红外无损检测技术在生物医学中的一个应用。
研究者通过研究发现PPG信号及ECG信号的波形特征与人体血压呈一定的关系,而传统的Moens-Korteweg (MK) [16] 方程建立起脉搏波速度与血压的关系,如下所示:
其中
、
是因人而异的校准常数,而脉搏波传输速度(PAT)则可以通过ECG、PPG信号获得的(PWTT)获得,故将脉搏波传输时间作为PPG信号与ECG信号的共同特征与PPG信号、ECG信号各自提取出的波形特征输入深度神经网络。
3.3. 数据预处理
3.3.1. 数据来源及预处理
本文所用数据皆来自于UCI无袖带血压数据集,收集了12,000组来源于不同年龄段和性别受试者的数据,数据包含了采集频率皆为125 Hz的侵入性动脉血压(ABP)信号,光电容积脉搏波(PPG)信号和心电(ECG)信号。本文筛选出2000组数据用于研究,血压值分布情况如图3所示。
本文使用的数据集信号包含了噪声、基线漂移和异常波形,若不做处理会导致预测结果出现巨大误差,所以为了使神经网络能准确提取出数据特征,本文通过小波变换实现进行去噪。然后我们将长数据通过窗口截取长度相等的数据段,并确保每个段包含多个脉搏波周期。再从这些数据段中提取感兴趣的波形特征作为预测模型的输入。

Figure 3. Blood pressure distribution histogram
图3. 血压分布直方图
3.3.2. 特征提取与选择
1) PPG信号的波形特征
PPG (Photoplethysmography)信号是一种通过测量皮肤组织的光吸收和反射来检测心跳和血液流动的无创测量技术。PPG信号的波形特征可以用于评估心血管系统的功能和状态。PPG波形与血压之间有很强的相关性
如图4所示,本文提取了PPG信号上升肢及下降肢各处宽度波形高度、波宽等共计15种波形特征,以及上升及下降斜率、峭度三种形态特征,共计18种特征用于血压预测。

Figure 4. Schematic diagram of PPG signal waveform characteristics
图4. PPG信号波形特征示意图
2) ECG信号的波形特征
心电图(ECG)是利用心电图机从体表记录心脏每一心动周期所产生的电活动变化图形的技术。一个正常的心电信号在一个周期内,是由P波,QRS波群以及T波组成
如图5所示,本文提取了ECG信号R-R峰长度、Q-R峰、R-S峰长度及高度等共计5种波形特征用以进行对血压的预测。

Figure 5. Schematic diagram of ECG signal waveform characteristics
图5. ECG信号波形特征示意图
3) 脉搏波传输时间(PWTT)
脉搏波传递时间是指脉搏波在两个动脉部位之间传播的时间间隔。脉搏波传递时间与血压有着密切的联系,当血压升高时,血管壁收缩,使得脉搏波传递速度加快,PWTT减小;当血压降低时,血管扩张,脉搏波传递速度降低,PWTT增加;是求解血压的重要参数。通常,把同一时段心动周期的ECG信号的R波波峰作为PWTT起点,取脉搏波的主波波谷、波形上升段中点或波峰作为PWTT的终点。如图6所示,本文所采用的便为ECG信号R波顶点至PPG信号上升段波谷、中点、波峰共计3种特征信息作为PPG信号、ECG信号共同特征输入网络。

Figure 6. Schematic diagram of common features of PPG signal and ECG signal
图6. PPG信号、ECG信号共同特征示意图
3.4. 模型建立
传统的使用多传感器信号进行血压预测的网络只是用一个通道,无法发挥多传感器信号的优势,并且训练网络时容易因为视野过小难题提取特征中的高维信息。为了解决这一问题,本文提出了一种用于血压预测的多特征融合神经网络,该网络由两部分组成,第一部分是分别提取多类特征输入时序信息的Tranformer网络,第二部分则基于多跳问答推理的思想设计了多跳GRU-Attention网络用以融合来自不同传感器的特征信息。
3.4.1. Transformer网络模块
在我们设计的网络中,用同样的网络结构分别提取三类26维输入信号的高维信息。该网络结构模块主要由五层包含了多头注意力模块的Transformer网络模块及残差网络构成。相较于其他网络,Transformer对时序信息输入的信息特征提取能力突出且能更好的进行并行运算,拥有高性能的同时占用了更少的运算能力,其内部具体结构如图7所示。
3.4.2. 多跳GRU-Attention融合网络模块
前人应用的特征融合方法较为简单,往往由一个拼接层或再加上一层注意力就完成了对特征信息的融合,在这一过程中容易发生对输入信号信息的丢失,导致网络预测性能的下降,为此我们设计了一种多跳GRU-Attention融合网络以更好地融合多路输入信号的特征,其通过注意力机制实现对单一输入信号的权重分配,再通过GRU模块记忆权重,逐一加入其他传感器信号计算权重并记录,以完成特征融合。这一网络旨在更好地发挥出多传感器信号输入具有的多维信息优势,提高模型整体的泛化性及准确性。

Figure 7. Deep neural network structure diagram
图7. 深度神经网络结构图
3.5. 模型训练参数
使用预处理后的3类26个波形信号特征参数构造深度神经网络输入,使用对应心动周期的DBP、SBP数据作为输出,将数据的60%为训练集,20%为测试集,20%为校验集训练神经网络。
经过多次尝试,确定将神经网络激活函数设置为ReLU;优化器选择AdamW优化器;神经网络学习率采用指数型衰减策略,指数型衰减策略先使用较大的学习率来快速得到一个较优的解,然后随着迭代的继续,逐步减小学习率,使得模型在训练后期更加稳定,所使用的学习率衰减策略具体如下所示:
4. 实验结果与分析
4.1. 与国际标准进行合规对比
在本节中,我们将本文提出的模型与两个广受国际认可的血压监测标准相比较,BHS标准是根据不同误差范围的比例。这标准以平均绝对误差为指标,分为误差小于5 mmHg、小于10 mmHg、小于15 mmHg三个评价标准,并分有A/B/C三个等级。如表3所示,本文提出的模型达到了英国高血压协会(BHS)标准A级要求。
同时医疗仪器促进协会(AAMI)标准要求平均误差(ME)小于5 mmHg,标准差(STD)小于8 mmHg,如表1及表2所示,本模型预测结果皆满足了这一标准。

Table 1. British Hypertension Society (BHS) criteria
表1. 与英国高血压协会(BHS)标准对比

Table 2. Association for the Advancement of Medical Instrumentation (AAMI) Standards
表2. 与医疗仪器促进协会(AAMI)标准对比
4.2. Bland-Altman一致性评价分析
在本节中,我们通过血压预测值的Bland-Altman分析对实验结果进行了进一步评估。本文提出的模型预测得到的SBP/DPB 预测值和标准值的Bland-Altman一致性分析结果如图8所示。本文提出的模型对舒张压(DBP)预测值中,有95.70%的数据误差绝对值小于1.6 SD;在对收缩压(SBP)的预测值中,95.11%的误差绝对值小于1.6 SD。说明该模型预测值与实际值吻合度良好,满足了医学一致性要求。

Figure 8. Linear regression graph/Bland-Altman graph of DBP/SBP prediction results
图8. DBP/SBP预测结果的线性回归图/Bland-Altman图
4.3. 与简单特征融合方法对比

Figure 9. Simple feature fusion network structure diagram
图9. 简单特征融合网络结构图
本节将采用简单融合方法,如图9所示,得到的预测结果与本文模型相对比,预测结果有了较大的提升,以此证明了本文提出的多跳GRU-Attention融合网络较传统融合方法的优势。

Table 3. Comparison with the simple feature fusion network model
表3. 与简单特征融合网络模型的预测结果与对比
4.4. 与其他研究者工作对比

Table 4. Comparison with network model results that emerged from previous work
表4. 与前人工作中出现的网络模型结果对比
以上几种模型预测的平均绝对误差MAE以及英国高血压协会(BHS)标准要求的比较结果如表4所示。可以看出,本文提出的模型较前人的研究在各项指标上均有所提升,表明了本文所使用方法的有效性。
5. 结论
本文基于前人融合多传感器信号特征对血压预测的研究,引入NLP领域多跳问答推理思想优化特种融合网络,对提取的高阶特征进行特征融合以加强血压预测模型的检测精度,经过大量的模型训练和实验对比可以得出,引入了问答推理机制的血压预测模型平均绝对误差满足小于5 mmHg的要求,并与袖带式血压计测量方法具有更高的一致性,较前人研究有较大的提升。