1. 引言
高血压是心血管疾病(Cardiovascular disease, CVD)的主要危险因素,据世界卫生组织统计,高血压并发症每年导致1080万人死亡[1]。医学界为了评估患者预后情况、指导治疗,根据患者的血压水平、心血管疾病危险因素、靶器官损伤情况和相关临床症状,深入研究高血压患者危险程度分级,设立了高血压危险分层统一标准[2]。在临床实践中,医生需花费大量时间询问患者情况,查看患者过往病史,以此来判断患者处于何种危险层级。为了探寻高血压诊断与分级的效率,相关学者对临床医学数据进行整理、分析,将分析结果作为先验知识,建立统计学模型进行风险计算。徐月贞[3]采用多元韦伯(Weibull)回归模型分析弗莱明翰(Framingham)高血压发病风险预测模型中涉及的危险因素与新发高血压的关系,并对Framingham模型回归系数与Weibull回归调整系数进行比较分析,提出新的统计学模型,相比于Framingham模型,AUC提高了0.021。由淑萍[4]等运用Framingham及其改良模型,以研究对象基本特征、影响高血压的生活方式、血常规指标作为预测因子,实现了高血压发病率的预测,改良后的模型相比于Framingham模型,AUC提高了0.131。樊星[5]采用Framingham模型,以研究对象的一般资料、生化指标以及新增的颈动脉内中膜厚度(carotid intima-media thickness, CIMT)作为预测因子,实现了高血压患者危险分级的重新评估。但是,统计学模型二次建模困难,灵活性与泛用性差,对年轻高血压患者等特殊人群适应性差[6]。
近年来,人工智能技术快速发展,相关研究表明,相比于统计学模型,机器学习模型能够识别并纳入新的预测因子,具有更高的预测精度与泛化能力。胡静[7]采用轻量级梯度提升机(Light GBM)模型,以3个影响高血压的常见因素(年龄、性别、身高体重指数)、22个生物标志物、与血压调控有关的602个单核苷酸多态性(Single Nucleotide Polymorphism, SNP)位点作为预测因子,实现了高血压患病状态预测,Accuracy为0.834,AUC为0.914。陈娇[8]通过决策树(Decision Tree, DT)、引导聚集算法(Bootstrap Aggregating, Bagging)、随机森林(Random Forest, RF)、提升法(Boosting)以及支持向量机(Support vector machines, SVM) 5种数据挖掘方法,以人口统计学相关变量、慢性病相关变量、地区发展水平相关变量、环境相关变量这4个维度信息作为预测因子,对我国老年人高血压进行建模预测,RF预测效能最好,Accuracy为0.746,并且作者以是否患高血压为被解释变量,通过逻辑回归(Logistic Regression, LR)模型进行参数估计,并根据分析结果构建我国老年人高血压的危险评分体系。但是,单个机器学习模型的复杂度有限,难以充分学习多维度信息特征,造成模型欠拟合,限制了模型预测精度。崔伟锋[9]等通过DT、RF、SVM和人工神经网络(Artificial Neural Networks, ANN)算法,以人口社会学资料、病情病史特征、实验室指标、血管功能及心功能检查指标、中医证候等相关基线指标作为预测因子,建立原发性高血压的预后预测模型,SVM预测效能最好,Accuracy为0.735。但是,模型涉及的预测因子过多,且具有一定的获取难度,限制了模型在实际推理中的泛用性。方艳[10]等通过多因素LR模型,以生化及血常规指标作为预测因子,建立了妊娠期高血压疾病(Hypertensive disorders of pregnancy, HDP)预测模型,并分析危险因素。但是,作者并未对比其它机器学习方法,选择最优预测模型,可能尚未取得最优预测效果。关雨婷[11]等通过RF、DT、SVM、最邻近(K-Nearest Neighbor, KNN)、多层感知机(Multilayer Perceptron, MLP)、LR模型,以研究对象的一般资料及实验室资料作为预测因子,建立老年原发性高血压发病风险预测模型,RF预测效能最好,Accuracy为0.828。为此本文提出了基于DS证据理论的多模态融合模型PpsldNet,实现高血压危险分层自主预测,本文的贡献如下。
(1) 构建一个长短期记忆网络,实现无超参数的脉搏波特征提取,降低特征提取成本,提高特征区分度。
(2) 使用三种不同的机器学习方法分别对脉搏波、理化、证素特征进行分类,并采用基于树结构估计的贝叶斯优化算法优化机器学习模型超参数,降低超参数优化成本。引入DS证据理论,实现多模态特征决策级信息融合,提高模型预测精度与泛化性能。
(3) 研究脉搏波、理化、证素特征与高血压危险分层的相关性,挖掘潜在的风险因素,为高血压临床诊断提供有效参考。
2. 基于DS证据理论的多模态融合模型
2.1. 脉搏波特征提取
传统的脉搏波特征提取方法通常提取具有明确生理意义的时域参数和具有频域与能量分布信息的频域参数作为样本特征[12]。Jiekee Lim等[13]运用特征点法和脉冲图面积法提取脉搏波时域特征,结合中医临床指标采用递归特征消除交叉验证(Recursive feature elimination cross validation, RFECV)进行特征选择,运用极端随机树(Extremely randomized trees, ET)、RF、SVM、极限梯度提升树(extreme Gradient Boosting, XGBoost)监督学习分类器,实现了多囊卵巢综合征(Polycystic Ovary Syndrome, PCOS)诊断。但是,时域参数往往由医学领域学者根据脉搏波波形特点及临床经验确定,无法精确地、全面地表达原始脉搏波信息,且时域特征提取易受噪声影响,对脉搏波的采集精度及滤波效果要求极高。U. Bialonczyk a等[14]采用离散傅立叶变换(Discrete Fourier Transform, DFT)将时域脉搏波信号转换为频域,选取时间序列谐波量、参数与传统风险因素(如年龄、身体质量指数等)作为特征,使用广义线性模型进行多变量分析,采用逐步变量算法选择最佳预测变量,构建一个由5个连接函数构成的回归集成模型,实现慢性肾病内侧血管钙化检测。频域参数的提取过程十分复杂,要求学者拥有大量信号处理经验,且需花费大量时间进行超参数调试,费时费力。本文提出了一种新的脉搏波特征提取方法,其无需进行超参数设定,采用层叠LSTM模型自动对脉搏波进行全面的特征提取,其结构图如图1所示。
Figure 1. Structure diagram of pulse wave feature extraction method
图1. 脉搏波特征提取方法结构图
本文构建了一个长短期记忆(Long Short Term Memory, LSTM)神经网络自动提取脉搏波深层特征,其结构包含5个LSTM模块[15],2个FC层。5个LSTM模块依次对脉搏波不同维度信息进行提取和分析,并依次将处理后的信息输出模型,由此,本文可得到5组处理后的脉搏波特征信息,即5个LSTM模块的输出,但过浅的网络由于对信息提取与分析的不充分,会导致模型欠拟合,而过深的网络由于对信息提取与分析的过度,会导致模型过拟合,为此本文通过实验,确定了该模型第4个LSTM模块的输出最佳,这表示脉搏波信号在经过4个LSTM模块后,神经网络提取出的信息刚好能够全面地描述脉搏波包含的浅层与深层信息。因此,本文以第四组脉搏波特征信息作为样本特征,供后续网络训练。
2.2. 决策级信息融合
在临床医学诊断中,医生通常将患者一般资料、生化指标、影像学报告等多维度信息结合起来诊断,受此启发,一些学者尝试使用决策级融合方法,对不同数据模态经不同模型后的分类结果进行信息融合,以此得到综合性判断,提高模型准确率与泛化性。常用的决策级融合方法包含投票法(Voting)、堆叠法(Stacking)、Boosting。韩红娟[16]等采用SVM、RF、LR和KNN作为初级学习器,逻辑回归作为次级学习器,加权投票集成策略构建Stacking多分类诊断模型,实现了对阿尔茨海默病(Alzheimer’s disease, AD)计算机辅助诊断。但Stacking方法的引入增加了计算复杂度且模型更易出现过拟合。莫有桦[17]等选择基于Boosting梯度提升决策树(Gradient-Boosted Decision Trees, GB-DT)和XGBoost两种模型,实现了矿工非致命性职业伤害严重等级预测。但Boosting方法构建的模型对异常值比较敏感,且训练过程复杂,需要仔细调整参数。
本文引入DS证据理论(Dempster-Shafer evidence theory),构建了一种新的决策级信息融合方法,结构简单,可解释性强,能够有效协同利用多源信息,提高模型准确率与泛化性能,且DS理论本身不引入任何可学习参数,对计算复杂度影响小。DS证据理论是一种推理不确定性的数学框架,它提供了一种从多个来源综合证据并得出结论的方法,即使信息不完整或相互矛盾[18]。其具体合成规则如下:
Figure 2. Schematic diagram of DS evidence theory
图2. DS证据理论示意图
设
是一个识别框架,对于
,
上的有限个mass函数
的Dempster合成规则为:
(1)
其中,K为归一化常数
(2)
在多模态特征融合中,DS证据理论定义统一的假设空间,使得不同模态的数据能够共享相同的分类框架。为每个模态计算基本概率分配(Basic Probability Assignment, BPA),将每种模态的特征转换为信任度度量,应用DS理论融合规则,解决冲突并合成最终的信任度。基于融合后的BPA进行推理和决策,选出最可信的假设或类别。DS理论的优势在于它能够处理复杂的多模态数据,不仅能够融合信息,还能有效管理不确定性和冲突,在各种模糊和不确定的情境下,提供可靠的决策支持。有效地综合各机器学习算法输出的证据来做出更合理的诊断。图2展示了DS证据理论针对某一患者样本的详细计算流程,本文将脉搏波数据、理化数据、证素数据这三种不同模态的数据通过不同的机器学习算法进行训练、分析,并将模型输出的分类概率通过DS证据理论进行计算,充分利用各模态特征相关性,消解各模型预测冲突,获得更为准确的预测结果。
2.3. 超参数优化
机器学习模型通常具有数个或数十个超参数,超参数的设置对模型预测精度影响极大,但人工进行超参数调整需要耗费大量时间,为了提高超参数调整效率,相关学者开发出了众多超参数优化算法:网格搜索(Grid search, GS)、随机搜索(Random Search, RS)、贝叶斯优化(Bayesian Optimization, BO) [19]等,贝叶斯优化因其优化速度快、效率高的特点,被广泛应用于复杂黑盒函数优化问题,图3展示具体流程。
基于高斯过程(Gaussian Processes, GP)的BO [20]和基于树结构估计(Tree-structured Parzen Estimator, TPE)的BO [21]是贝叶斯优化算法分支中最常用的两种算法。基于GP的BO直接对给定输入x与输出y的后验概率分布
进行建模。在这种方法中,通过计算训练数据集中的数据点之间的协方差矩阵来定义一个高斯分布,从而建立起输入与输出之间的联合概率分布。该方法优点在于可以自适应地学习输入与输出之间的复杂关系,并且可以提供不确定性估计,因此,该方法更适用于低维空间的连续变量优化。基于TPE的BO分别对条件概率分布
和边缘概率分布
进行建模,然后通过贝叶斯公式计算后验概率分布
。这种该方法优点在于可以更灵活地对不同的因素进行建模,并且可以更好地处理缺失数据和噪声,因此,该方法更适用于高维空间的具有明确变量关系的混合变量优化。本文采用临床医学数据属于高维空间混合变量,包含连续变量(脉搏波),又包含离散变量(症状信息与检验指标),变量之间具有明确的分组关系。因此本文选择基于TPE的BO作为机器学习超参数优化算法。
Figure 3. Gaussian Bayesian hyperparameter optimization based on TPE
图3. 基于TPE的高斯贝叶斯超参数优化
2.4. 多模态融合模型体系结构
图4为高血压危险分层实现总流程示意图,其具体步骤:首先对脉搏波信号、理化数据、证素数据进行预处理,去除脉搏波信号中噪声,去除理化数据与证素数据中的异常值。然后将预处理后的脉搏波信号投入LSTM神经网络训练,并提取第4个LSTM模块的输出作为脉搏波特征。接下来依次将脉搏波特征、预处理后的理化特征与证素特征,投入KNN、SVM、XGBoost模型中训练。再运用基于树结构估计TPE的BO算法对KNN、SVM、XGBoost模型进行超参数优化。最后运用DS证据理论,将KNN、SVM、XGBoost模型的预测概率进行重构,并分类输出。
Figure 4. Schematic diagram of the overall process for implementing hypertension risk stratification
图4. 高血压危险分层实现总流程示意图
3. 评估标准与数据集描述
本文高血压危险分层数据集来自于上海中医药大学附属中西医结合医院体检中心、第七人民医院体检中心、上海岳阳中西医结合医院体检中心、上海中医药大学附属曙光医院、上海市中医医院、中西医结合医院心内科住院部,共计793例样本,其中男性病例372例(占46.91%),女性病例421例(占53.08%)。该数据集包含了中低风险、高风险、很高风险样本。其中,中低风险病例116例,占总病例的14.62%;高风险病例有328例,占比41.36%;很高风险病例有349例,占比44.01%。该数据集包含了三种模态的患者信息:脉搏波、理化、证素,详见本文讨论部分。本文使用宏平均(Macro-averaging)方法计算高血压危险分层三分类任务评估参数,包括0-1损失(Zero-one Loss)、对数损失(Logarithmic Loss, Log Loss)、汉明损失(Hamming Loss)、准确度(Accuracy)、平均精准率(Macro Precision)、平均召回率(Macro Recall)、平均特异度(Macro specificity)、平均F1值(Macro F1-score)、平均AUC值(ROC曲线与横轴围成面积)与平均AP值(PR曲线与横轴围成面积)。
4. 实验结果与分析
4.1. 数据预处理
脉搏波的噪声来源主要为肌电干扰、基线漂移和工频干扰。其中,肌电干扰主要由受试者肢体活动产生,反映在信号波形上,会让波形显示出快速不规则的变化,其频率范围很宽,一般分布在[5, 2000] Hz区间内;基线漂移主要由受试者呼吸产生,其频率一般分布在[0, 0.5] Hz区间内,表现为变化缓慢的类正弦曲线,反映在信号波形上表现为波形缓慢的上下漂移;工频干扰主要来源于工频电源以及器件周围环境中的传输线辐射出的电磁场,其频率范围在50 Hz以上,反映在信号波形上会导致波形上呈现规律性的细小毛刺[22]。图5展示了脉搏波波形图及其频谱图。其中,图5(a)为原始脉搏波图,图5(b)为基于原始脉搏波快速傅里叶变换[23] (Fast Fourier Transform, FFT)后的幅度谱。根据图5(a)可见,该脉搏波波形未含有明显快速不规则的变化,无需针对肌电干扰噪声进行去除,而红框处可见波形具有明显缓慢的上下漂移现象,需针对基线漂移噪声进行去除。根据图5(b)该脉搏波信息集中分布于0~10 Hz频段,而分布于这一频段的噪声仅有基线漂移和肌电干扰,无需针对工频干扰噪声进行去除。
Figure 5. Pulse waveform and its spectrum
图5. 脉搏波波形图及其频谱图
Figure 6. Comparison of waveforms before and after removing baseline drift using different filtering methods
图6. 不同滤波方法去除基线漂移前后波形对比图
本文尝试了3种不同的滤波方法针对基线漂移噪声进行去除,分别为:中值滤波[24] (Median Filtering, MF)、巴特沃斯低通滤波[25] (Butterworth Low-Pass Filtering, BLPF)和小波滤波[26] (Wavelet filtering, WF)。图6展示了不同滤波方法去除基线漂移前后波形对比图。
分析可知,中值滤波去噪效果最好,其既维持了原始波形的形态,又较为有效地去除了基线漂移;而经巴特沃斯低通滤波后的波形出现了较大的形变,这是因为脉搏波中的有效信息和基线漂移都集中在0~2Hz频段,使用低通滤波会同时去除基线漂移和有效信息,造成有效信息的损失;而小波滤波的核心思想是将信号分解成多个不同尺度的子信号,并通过分析不同尺度的子信号,将被判定为噪声的子信号去除,以达到滤波效果,但由于基线漂移和有效信息高度叠加耦合,导致无法分离出仅含噪声的子信号,所以滤波效果也不理想。故本文采用中值滤波算法去噪基线漂移。
本文将滤波后的脉搏波降采样至6000个采样点,以节省存储成本和计算量,并将理化数据与证素数据中的空缺值与异常值所在的样本删除,防止其对模型的特征学习产生影响。预处理后的数据集共包含748个样本,其中,中低风险病例有98例,高风险病例有301例,很高风险病例有349例。
4.2. 消融实验
4.2.1. 脉搏波特征信息提取位置
为了确定脉搏波特征信息在LSTM模型中的最佳提取位置,本实验以脉搏波作为输入,分别从LSTM模型的第一、第二、第三、第四、第五个LSTM模块的输出端提取数据,并送入SVM模型,对比模型评估指标。图7展示了不同脉搏波特征信息提取位置模型评估指标。
Figure 7. Evaluation indicators for extracting location models of different pulse wave feature information
图7. 不同脉搏波特征信息提取位置模型评估指标
分析可知,相比于第一、二、三、五个LSTM模块输出作为SVM模型输入,第四个LSTM模块输出作为SVM模型输入时,模型的Zero-one Loss分别降低0.047、0.0436、0.0134、0.0504;Log Loss分别降低0.0203、0.0191、0.0082、0.0215;Hamming Loss分别降低0.0313、0.0291、0.009、0.0336;Accuracy分别增加0.047、0.0436、0.0134、0.0504;Recall分别增加0.0129、0.0176、0.0173、0.0372;F1-score分别增加0.0373、0.0334、0.0151、0.0482,这是因为第四个LSTM模块的脉搏波特征信息刚好能够全面地、精确地描述脉搏波信号包含的浅层特征信息与深层特征信息,能够让模型学习到尽可能多的脉搏波特征信息且保证模型不会过拟合。
4.2.2. 各模态机器学习模型选择
为了确定针对于脉搏波数据、理化数据、证素数据的最佳机器学习模型,本实验以提取后的脉搏波特征信息、理化数据、证素数据作为输入,以KNN、LR、RF、高斯朴素贝叶斯(Gaussian naive bayes, GNB)、SVM、XGBoost作为机器学习模型,对比模型评估指标。图8展示了不同机器学习模型评估指标。分析可知,对于脉搏波特征,KNN模型Accuracy、Recall、F1-score、AUC、AP均最大,这是因为KNN的基本原理是通过测量不同样本之间的距离来进行分类或预测,对于脉搏波数据,其本质上是一种时间序列数据,相似的脉搏波形态通常代表相似的生理状态,KNN模型通过计算不同脉搏波数据样本之间距离,找到与待分类或预测样本最相似的K个邻居。
Figure 8. Evaluation indicators for different machine learning models
图8. 不同的机器学习模型评估指标
对于理化数据而言,SVM模型的Accuracy、Recall、F1-score、AUC、AP均最大,这是因为理化数据通常是高维的,包含多种物理和化学属性,SVM 在处理高维数据方面具有优势。它通过核函数将高维数据映射到更高维的特征空间,使得在原始空间中复杂的非线性关系在高维空间中能够被线性划分;对于证素数据而言,XGBoost模型的Accuracy、Recall、F1-score、AUC、AP均最大,这是因为证素是中医辨证的基本要素,其数据可能涉及症状、体征、舌象、脉象等多个方面,对于证素数据中的复杂交互,如脉象的细弱与舌象的淡白可能共同指向“血虚”证素,XGBoost可以通过决策树的分支结构逐步挖掘这些关系,从而更准确地对证素进行建模。故本文选择使用KNN模型训练脉搏波特征信息;SVM模型训练理化数据;XGBoost模型训练证素数据。
4.2.3. 基于DS理论的决策级融合
为了确定最佳的决策级融合算法,本实验针对于提取后的脉搏波数据作为输入的KNN模型,理化数据作为输入的SVM模型,证素数据作为输入的XGBoost模型,采用Voting、Stacking、Boosting、DS理论进行决策级信息融合,对比模型评估指标。图9展示了不同的决策级融合算法模型评估指标。分析可知,与Voting、Stacking、Boosting模型相比,DS理论模型的Accuracy分别增加0.0067、0.0302、0.0168;Recall分别增加0.005、0.0299、0.0125;F1-score分别增加0.0049、0.027、0.0123;AUC分别增加0.0108、0.0246、0.0053。这是因为DS理论拥有更强的处理不确定性能力,能够有效融合冲突信息,而临床医学数据维度高,且由于采样干扰,易出现异常值,常出现模型输出证据冲突这一情况,而DS理论能够较好地处理这一情况。故本文采用DS理论实现多模态信息融合。
Figure 9. Evaluation indicators for different decision level fusion algorithm models
图9. 不同的决策级融合算法模型评估指标
4.2.4. 超参数调优
本文针对提取后的脉搏波数据作为输入的KNN模型,理化数据作为输入的SVM模型,证素数据作为输入的XGBoost模型,采用GS、RS、基于GP的BO、基于TPE的BO方法进行超参数优化,对比模型评估指标。表1展示了不同的超参数调优方法模型评估指标。分析可知,对于脉搏波特征信息而言,采用BO(TPE)方法调优的模型Accuracy、Recall、F1-score均为最大,搜索空间和搜索时间均为最小;对于理化数据而言,采用BO(TPE)方法调优的模型Accuracy、Recall、F1-score均为最大,搜索空间和搜索时间均为最小;对于证素数据而言,采用BO (TPE)方法调优的模型Accuracy、Recall、F1-score均为最大,搜索空间和搜索时间均为最小。这是因为本文采用的临床医学数据属于高维空间的混合变量,且变量之间具有明确的分组关系,基于TPE的BO算法更能发挥其优势。故本文采用BO (TPE)方法对KNN、SVM、XGBoost模型进行超参数调优。
Table1. Evaluation indicators of models using different hyperparameter tuning methods
表1. 不同的超参数调优方法模型评估指标
数据集 |
Methods |
Accuracy |
Recall |
F1-score |
搜索参数量 |
搜索时间(s) |
脉搏波特征 |
GS |
0.8322 |
0.8072 |
0.8346 |
100 |
100.8 |
RS |
0.8523 |
0.8442 |
0.8642 |
50 |
50.68 |
BO(GP) |
0.8523 |
0.8442 |
0.8642 |
25 |
32.52 |
BO(TPE) |
0.8523 |
0.8442 |
0.8642 |
25 |
12 |
理化数据 |
GS |
0.8533 |
0.7946 |
0.8222 |
1000 |
982.5 |
RS |
0.8466 |
0.8232 |
0.8413 |
500 |
571.95 |
BO(GP) |
0.86 |
0.8013 |
0.8342 |
100 |
347.55 |
BO(TPE) |
0.88 |
0.8636 |
0.8754 |
100 |
125.1 |
证素数据 |
GS |
0.7333 |
0.6436 |
0.6438 |
1000 |
987.06 |
RS |
0.74 |
0.6641 |
0.6648 |
500 |
535.1 |
BO(GP) |
0.7266 |
0.6058 |
0.6073 |
100 |
397.29 |
BO(TPE) |
0.7533 |
0.6697 |
0.6792 |
100 |
237.69 |
4.3. 与典型高血压预测模型对比
本文采用5折交叉验证方法,对高血压危险分层数据集进行3分类预测实验。表2显示了5折交叉验证后各模型的平均预测性能评估指标。图10展示了各模型F1-score、AUC、Precision、Recall对比。分析可知,与Framingham、Light GBM、AdaBoost [27]、DenseNet121 [28]、EfficientNetB0 [29]相比,PpsldNet的平均Accuracy、Precision、Recall、Specificity、F1-score、MAP、AUC均为最高,这是因为PpsldNet通过LSTM网络同时提取脉搏波浅层和深层特征,提高特征区分度,且PpsldNet引入DS理论,有效利用高血压患者多源信息,实现了决策级信息融合,提高模型准确率与泛化性能。
Table 2. Average evaluation indicators of each model after 5-fold cross validation
表2. 5折交叉验证后各模型的平均评价指标
Models |
Accuracy |
Precision |
Recall |
Specificity |
F1-score |
MAP |
AUC |
Framingham |
0.873 ± 0.027 |
0.846 ± 0.026 |
0.840 ± 0.068 |
0.931 ± 0.014 |
0.841 ± 0.045 |
0.939 ± 0.015 |
0.952 ± 0.012 |
Light GBM |
0.813 ± 0.019 |
0.761 ± 0.054 |
0.754 ± 0.036 |
0.898 ± 0.014 |
0.751 ± 0.036 |
0.894 ± 0.021 |
0.921 ± 0.020 |
AdaBoost |
0.877 ± 0.023 |
0.836 ± 0.035 |
0.853 ± 0.045 |
0.936 ± 0.012 |
0.839 ± 0.028 |
0.943 ± 0.018 |
0.954 ± 0.011 |
DenseNet121 |
0.869 ± 0.031 |
0.879 ± 0.049 |
0.833 ± 0.063 |
0.923 ± 0.018 |
0.850 ± 0.058 |
0.926 ± 0.025 |
0.952 ± 0.022 |
EfficientNetB0 |
0.856 ± 0.029 |
0.826 ± 0.062 |
0.837 ± 0.049 |
0.925 ± 0.018 |
0.827 ± 0.051 |
0.933 ± 0.021 |
0.955 ± 0.018 |
PpsldNet |
0.909 ± 0.010 |
0.891 ± 0.030 |
0.893 ± 0.029 |
0.949 ± 0.009 |
0.891 ± 0.025 |
0.958 ± 0.008 |
0.977 ± 0.004 |
分析可知,与Framingham、Light GBM、AdaBoost、DenseNet121、EfficientNetB0相比,PpsldNet的F1-score中位数分别增加0.055、0.148、0.056、0.064、0.056;AUC中位数分别增加0.023、0.05、0.021、0.014、0.015;Precision中位数分别增加0.039、0.132、0.062、0.04、0.055;Recall中位数分别增加0.063、0.134、0.038、0.076、0.03。这表明该模型对于高血压危险分层样本具有更好的分类精度和泛化性能。
Figure 10. Comparison of evaluation indexes of each model after 5-fold cross-validation
图10. 5折交叉验证后各模型的评价指标对比
5. 讨论
如图11所示,本文通过时域分析法提取传统脉象时域参数、移动平均线特征、主波上升时值特征和相邻主波上升支差异特征[30],共72个,并采用KNN算法进行特征贡献度分析。图12展示了脉搏波时域特征与SHAP特征重要性排名。本文还增加58名健康人员的样本作为健康对照组,表3给出了针对脉搏波时域特征(排名前5)的样本均值、样本标准误差与95%置信区间,及其与健康对照组的时域特征P值。分析图12(b)、表3可知,特征重要性排名前五的指标分别为as/ad (95% CI:3.545~4.689, P < 0.01)、De (95%CI: 2.284~2.503, P < 0.001)、t4/t_max (95%CI: 2.731~2.822, P < 0.05)、t5/t_max (95%CI: 3.326~3.437, P < 0.01)、t5/t1 (95%CI: 3.391~3.514, P < 0.05)。as/ad与De特征重要性明显大于其余时域特征,且p值均小于0.01。as/ad为脉搏波收缩期面积与舒张期面积的比值,其反应了收缩期时长、平均脉压与舒张期时长、平均脉压之间的比值,心脏的收缩周期和舒张周期比例受心率影响较大,如心率增快,心动周期缩短,虽然收缩期和舒张期均缩短,但舒张期的缩短更为显著,因此心率增快时,心肌工作时间相对延长,休息时间则相对缩短,as/ad值会增大;De为脉图中前后两段主波上升支数据之间的欧氏距离,其反映了心率变异性的情况,如心率增快,心动周期缩短,De减小。as/ad与De特征均与心率有关,提示心率异常在高血压危险分层时可能为重要危险因素。快静息心率与高血压互为因果,快静息心率可导致高血压的发生发展,高血压患者也常伴有快静息心率,并且长期的压力负荷增高会导致诸多靶器官损伤,如左心室肥厚和扩张,脑血管发生缺血变性等[31] [32]。
Figure 11. Characteristics analysis of Time-domain pulse wave
图11. 时域脉象特征分析
Figure 12. Time domain characteristics of pulse wave and SHAP feature importance ranking chart
图12. 脉搏波时域特征与SHAP特征重要性排行图
Table 3. Time domain feature significance test results
表3. 脉搏波时域特征显著性检验结果
Frequency-domain Features |
Mean value |
Standard error |
0.95 (l) |
0.95 (h) |
P-value |
as/ad |
4.117 |
0.291 |
3.545 |
4.689 |
<0.01 |
De |
2.393 |
0.055 |
2.284 |
2.503 |
<0.001 |
t4/t_max |
2.776 |
0.023 |
2.731 |
2.822 |
<0.05 |
t5/t_max |
3.382 |
0.028 |
3.326 |
3.437 |
<0.01 |
t5/t1 |
3.453 |
0.031 |
3.391 |
3.514 |
<0.05 |
6. 结论
本文提出了一种基于DS理论的高血压危险分层分类模型。该模型构建了一个长短期记忆网络,实现无超参数的脉搏波特征提取,降低特征提取成本,提高特征区分度。使用三种不同的机器学习方法分别对脉搏波、理化、证素特征进行分类,采用基于树结构估计的贝叶斯优化算法,对各机器学习模型超参数进行优化,降低超参数优化成本。并引入DS证据理论,充分利用特征相关性,消除各模型预测冲突,提高模型预测精度与泛化性能。在高血压危险分层数据集上进行危险分层预测的实验表明,所提出的模型优于目前现有的先进方法,拥有更高的准确率与泛化性能。此外,本文深入研究脉图参数相关性,as/ad、De、t4/t_max、t5/t_max、t5/t1这五项脉图参数对高血压危险分层预测影响最大,为高血压危险分层和中医四诊客观化研究提供一种有力支持。
基金项目
国家自然科学基金(81973749),中国中医科学院科技创新工程重大攻关项目(CI2021A01503)。
NOTES
*通讯作者。