1. 引言
在心血管疾病中,急性心梗(AMI)是一种由冠状动脉急性、持续性缺血缺氧引起的心肌坏死疾病,具有高致死率。《心血管健康与疾病报告2023》指出,自2005年起,AMI死亡率呈逐年快速上升趋势,目前已占心血管病致死率的21.31%。其显著特征包括:1) 男性高发且病发呈年轻化趋势;2) 复发率高且病发诱因不明确;3) 临床表现缺乏特异性;4) 突发危重死亡率高。目前,降低AMI突发危重死亡率的最有效途径是通过病发预警和及时治疗。心音信号(HS,如图1)为医生和专业人员提供了重要的临床信息,可用于分析心脏异常、评估心血管系统及其他器官的生理状态,并实现即时预警[1]-[7]。然而,不同类型的心脏疾病和生理状态导致的心脏结构差异,会表现为心率变化、特定频域内能量成分减少,以及心动周期中病理性额外心音的出现[8]。此外,心音记录过程中的意外噪声同样会影响心音分割的准确性,进而影响分类性能[9]。基于心音听诊实现AMI病发即时响应的关键在于心音特征异常监测的准确性。然而,患者病发状态的不确定性导致心音成分分割准确度较低,特征提取难度较大。因此,本研究提出一种基于短时修正希尔伯特变换(STMHT)的自适应分割方法(ASTMHT),以实现心音自适应分割并提升特征提取的准确性。
Figure 1. The schematic diagram for the normal heart sound
图1. 正常心音的示意图
近年来,许多提出的分割方法主要针对给定的心音包括两个步骤:1) 检测候选峰值;2) 识别心音周期。Xu等使用了标准化的平均香农能量进行PCG信号处理,并根据合并和删除操作标准选择S1和S2 [10]。Xiang等通过将每段文件的最小数据长度设为2秒(s)来分割心音,以确保分割效果的质量[11]。Youness等使用了基于先验知识的香农能量和标准来分割主要的S1和S2 [12]。这一标准基于心音的包络,时间间隔少于50毫秒(ms),且均方根能量大于其他部分的40%,从而保留更高能量的成分。
然而,由于忽略了心脏结构的差异,这些使用固定参数的方法在检测心音S1和S2时并不实用。因此,为了避免这种差异的影响,本文首次提出了一种基于短时修正希尔伯特变换(STMHT)的自适应分割方法(ASTMHT),用于在给定的心音上分割S1和S2。其简单流程如图2所示。ASTMHT的性能在一个公开数据集以及来自121名18~30岁大学生的心音上进行了评估。
Figure 2. The flowchart of the proposed method
图2. 所提出分割方法流程图
本文的其余部分组织如下。第2节介绍ASTMHT分割方法。第3节描述性能评估。最后,第4节给出结论。
2. 方法
该方法对应的三个阶段可以总结如下:1) 心音信号预处理,包括降采样和去噪;2) 使用ASTMHT分割给定的心音;3) 基于ASTMHT自适应心脏结构的差异,自动提取S1和S2。
2.1. 心音预处理
首先,原始心音信号以Fₛ = 2000赫兹(Hz)进行重复采样[10] [13]。经过多次实验,为了防止局部噪声对全局心音周期分割的影响,最终确定使用Daubochies 10 (Db10)小波分解生成滤波后的心音(记为
),分解层数从第6层到第10层[14]。最终,降噪后的信号段被标准化到1至1的范围:
(1)
2.2. ASTMHT分割
由于STMHT使用固定参数:每个心音周期的邻域带宽(
)为0.06秒(s),移动窗口的奇数长度N (
)被设定为0.006秒(s) [13] [15],因此不适合在给定的心音上进行分割,因为存在心脏结构的差异。因此,本文提出了一种新颖的ASTMHT分割方法,具体描述如下。
1)
提取:
为了定位分割点并确定几何中心峰值,首先基于Viola积分方法提取心音
的包络(记为
) [13] [15]。STMHT已被提出用于提供足够的心音分割性能[13] [14]。基于生成包络
和ASTMHT曲线(记为
)的方法分别描述如下。
给定一个N点的滤波心音HSp (HSp [m],
),其中M表示
的点数,移动窗口
具有
,
通过以下公式计算:
(2)
其中,在时间m的
内,称为宽度时间尺度(
,其中
),包络
通过以下公式获得:
(3)
以及
(4)
在本研究中,参数
直接影响心音成分的包络提取。当该数值增大时,包络覆盖范围扩大,更容易提取高能量成分,如图3(a)所示。相反,当该数值减小时,包络覆盖范围收缩,更易提取低能量成分,如图3(c)所示。参数
影响曲线
的下降趋势。当该数值增加时,曲线与
之间的角度E增加,缓慢趋近零值,从而覆盖低能量成分,如图3(d)所示。当该数值减小时,曲线与
之间的角度减小,曲线快速收敛至零,主要捕获高能量成分并抑制无关分量干扰,如图3(f)所示。研究结果表明,参数
与
之间存在反比关系。
Figure 3. The different parameters
and
. (a)~(c) The
curve after
in different
and 0.02, (d)~(f) The
curve after
in different
and 101
图3. 不同参数
和
的影响。(a)~(c) 固定
时,不同
值(0.06、0.04和0.02)下的
曲线;(d)~(f) 固定
时,不同
值(201、151和101)下的
曲线
2) 最佳参数确定:
由于不同的心脏结构中的心音周期性不同,本文可以根据周期性和参数之间的关系来确定最佳参数,如公式(5)所示,曲线
的周期性可通过计算
或
上变异系数(
)的时间间隔(TIs)来表征。
(5)
其中,
设为0.5,
(6)
(7)
其中,
和
分别表示从
到
的时间间隔(记作
)和从
到
的时间间隔(记作
),
和
为
和
的数量,i表示第i个时间间隔
的索引。由于该方法设计为完全无监督模式,因此在最终分割心音信号前,需一次性自适应确定参数
与
的全局最优值。
首先,必须确定参数
和
的合适取值范围。这可以通过对大量心音样本进行统计分析来实现,统计结果如表1所示。基于先前的STMHT方法,并确保区间包含最优参数,最终确定参数范围为
,且
并取奇数值。
Table 1. The statistical analysis of parameters
and
.
表1. 参数
与
的统计分析结果
Parameters |
Lower bound |
Upper bound |
|
|
|
|
|
0.0259 |
0.0080 |
0.0478 |
0.0098 |
|
58.1250 |
7.3018 |
101.2500 |
27.7597 |
其次,如图3所示,这两个参数之间存在特定的反比关系。本方法采用网格搜索法计算并寻找式(8)中的最优值,同时引入二分搜索思想以提升搜索速度,并结合两参数间的相互关系进行优化。搜索过程中还添加了以下两个约束条件:1) 参数搜索时,若
取值较小,则需对应选择较大的
,反之亦然;2) 由于心音成分的能量通常高于杂音,应尽可能取较大的
值和较小的
值,以确保对给定心音信号的最优分割效果。最终通过多组
和
参数组合计算其对应的变异系数
。
因此,基于网格搜索法,通过分析
与
在合理范围内的相互关系及其对应的变异系数
,最终确定的最优参数
和
可通过式(8)计算得出:
(8)
subject to
. (9)
其中,收敛阈值
设为0.0001,k表示第k组参数组合。
最终,当变异系数
收敛至最小变化率时,系统将自适应确定最优曲线
(记为
),该曲线精确对应于全局最优参数
和
,其中
。此时,最优包络
可通过
推导获得。
2.3. S1与S2的自动提取
在
上的分割特征已在研究[14] [15]中成功应用,其特性可归纳如下(如图4(b)和图4(c))所示):
1) 负向转正向点曲线(记为N2Ps),对应
和
的峰值点(分别用
和
标记);
2) 正向转负向点曲线(记为P2Ns),对应
与
之间、
与
之间的分割点(分别用
和
标记)。
的时间间隔始终小于
的时间间隔。因此,通过自动优化选取N2Ps和P2Ns即可实现
和
的分割与判定。ASTMHT分割方法的性能验证详见第三节。
Figure 4. Experimental result of 5 s recording “LgyRuningP2.wav” obtained from Hnist database. (a) The analysis results used ASE, (b) The analysis results used STMHT, (c) The analysis results used ASTMHT
图4. 实验结果展示(基于Hnist数据库中5秒录音“LgyRuningP2.wav”):(a) 采用ASE方法的分析结果,(b) 采用STMHT方法的分析结果,(c) 采用ASTMHT方法的分析结果
3. 新能评估
3.1. 数据采集
数据采集自湖南理工学院(HNIST dataset) 121名正常受试者的肺动脉瓣听诊区(Pulm)。其中101名处于静息状态(女性21人,男性80人),年龄18至30岁,均值 ± 标准差为20.51 ± 2.96岁;另有20名非静息状态受试者(女性6人,男性14人),年龄18至26岁,均值 ± 标准差为21.85 ± 3.56岁。心音数据采用3MTM Littmann®电子听诊器采集,采样率44.1千赫兹(kHz),音频以.wav格式存储,记录时长14至40秒不等。心音数据采集流程如图5所示。
3.2. 性能指标
该性能指标用于衡量分割方法对心音主成分(
和
)的定位效果。具体计算给定数据集中
与
分割的准确率公式如下:
Figure 5. The evaluation results of the ASTMHT, STMHT and ASE in Hnist dataset (Quite state, Non-quiet state) in Pulm position acquisition, and Michigan heart sound datasets in Aortic, Pulm and Apex position acquisition
图5. ASTMHT、STMHT和ASE方法在HNIST数据集肺动脉瓣区采集数据(静息状态与非静息状态)和密歇根心音数据集(主动脉瓣区、肺动脉瓣区及心尖区采集数据)中的评估结果
. (10)
其中,TP表示正确分割的心音周期数量,FN表示错误分割心音周期数量。
3.3. 结果
ASTMHT、STMHT和平均香农能量(ASE)三种方法的性能在三个心音数据集上进行了评估,包括:HNIST数据集肺动脉瓣位置采集数据(分别为静息状态和非静息状态)和Michigan心音数据集(包含不同疾病类型,分别在主动脉瓣、肺动脉瓣和心尖区位置采集)评估结果如表2所示,对比示例如图4所示。研究结果表明,所提出的自适应方法平均准确率达到95.21%,显著优于常见分割方法(ASE: 72.00%, STMHT: 63.39%),如图5所示。
Table 2. Comparison results of STMHT, ASE and ASTMHT methods
表2. STMHT、ASE与ASTMHT方法的对比结果
Datasets |
Cycles |
Methods |
ASE 2022 |
STMHT 2024 |
ASTMHT |
Hnist dataset (Quiet state) |
40,384 |
88.17% |
91.64% |
97.46% |
Hnist dataset (Non-quiet state) |
3478 |
38.31% |
15.69% |
92.26% |
Michigan dataset (Quiet state) |
1487 |
89.51% |
82.85% |
95.90% |
4. 结论
针对引言中提出的急性心梗(AMI)病发即时响应需求,本文提出了一种新型心音分割方法ASTMHT。该方法通过自适应确定STMHT分割参数,克服了患者病发状态不确定性及心脏结构差异带来的挑战,实现了异常心音分割、状态检测及AMI预警功能。ASTMHT基于STMHT算法和心音成分时间间隔分析,能有效适应心率变化、低能量成分及病理性额外心音等复杂情况,并减少意外噪声对分割准确性的干扰。实验结果表明,ASTMHT、STMHT和ASE的平均分割准确率分别为95.21%、63.39%和72.00%,其中ASTMHT展现出显著的分割性能优势,为提升AMI特征提取准确性提供了有力支持。未来工作将聚焦于开发基于心音信号本质特征直接确定STMHT参数的算法体系,以进一步优化分割性能。本研究为基于心音听诊的AMI早期诊断和风险预测提供了重要技术基础,有助于降低AMI突发危重死亡率。
基金项目
本研究获湖南省大学生创新创业重点项目(No. S202410543068)、教育厅重点项目(No. 21A0403, No. 21A0405)、湖南省自然科学基金项目(No. 2022JJ30282, No. 2023JJ30283)、教育部产学研合作项目(No. 202102211006, No. 230806093021436)基金项目资助。