面向AMI病发即时响应的自适应心音分割方法
An Adaptive Heart Sound Segmentation Method for Immediate Response to Acute Myocardial Infarction
摘要: 基于心音听诊急性心梗(AMI)病发即时响应的关键在于心音特征异常监测精准率,然而由于患者病发状态的非确定性导致基于心音成分分割准确度的特征提取难度较差。鉴于此,本研究提出一种新的基于短时修正希尔伯特变换(STMHT)的自适应分割方法(ASTMHT)实现心音自适应分割以确保提取特征的准确性。实验通过对比平均香浓能量(ASE)算法和STMHT算法在AMI临产数据以及不同状态心音数据集的分割精度分析。对比结果表明,ASTMHT方法识别效果优于平均香农能量ASE方法和STMHT方法,尤其是在非安静状态数据集上,分割准确率比平均香农能量提高了53.95%,比STMHT提高76.57%。进而可为AMI特征提取提供保障。
Abstract: The key to immediate response in acute myocardial infarction (AMI) diagnosis through heart sound auscultation lies in the precision of abnormal heart sound feature detection. However, the uncertainty of patients’ conditions leads to challenges in achieving accurate feature extraction based on heart sound segmentation. To address this, this study proposes a novel adaptive segmentation method (ASTMHT) based on short-time modified Hilbert transform (STMHT) to ensure precise feature extraction through adaptive heart sound segmentation. Experimental analysis compared the segmentation accuracy of the average Shannon energy (ASE) algorithm and the STMHT algorithm on AMI clinical data and heart sound datasets under various conditions. Results demonstrate that the ASTMHT method outperforms both the ASE and STMHT methods, particularly on non-quiet state datasets, with segmentation accuracy improvements of 53.95% over ASE and 76.57% over STMHT, thereby providing a robust foundation for AMI feature extraction.
文章引用:邓琪, 陈金博, 刘广宇, 莫胜美, 刘东壅, 张一卓, 刘熠辉, 蒋灿, 匡文帮, 孙树平. 面向AMI病发即时响应的自适应心音分割方法[J]. 计算机科学与应用, 2025, 15(8): 260-269. https://doi.org/10.12677/csa.2025.158216

1. 引言

在心血管疾病中,急性心梗(AMI)是一种由冠状动脉急性、持续性缺血缺氧引起的心肌坏死疾病,具有高致死率。《心血管健康与疾病报告2023》指出,自2005年起,AMI死亡率呈逐年快速上升趋势,目前已占心血管病致死率的21.31%。其显著特征包括:1) 男性高发且病发呈年轻化趋势;2) 复发率高且病发诱因不明确;3) 临床表现缺乏特异性;4) 突发危重死亡率高。目前,降低AMI突发危重死亡率的最有效途径是通过病发预警和及时治疗。心音信号(HS,如图1)为医生和专业人员提供了重要的临床信息,可用于分析心脏异常、评估心血管系统及其他器官的生理状态,并实现即时预警[1]-[7]。然而,不同类型的心脏疾病和生理状态导致的心脏结构差异,会表现为心率变化、特定频域内能量成分减少,以及心动周期中病理性额外心音的出现[8]。此外,心音记录过程中的意外噪声同样会影响心音分割的准确性,进而影响分类性能[9]。基于心音听诊实现AMI病发即时响应的关键在于心音特征异常监测的准确性。然而,患者病发状态的不确定性导致心音成分分割准确度较低,特征提取难度较大。因此,本研究提出一种基于短时修正希尔伯特变换(STMHT)的自适应分割方法(ASTMHT),以实现心音自适应分割并提升特征提取的准确性。

Figure 1. The schematic diagram for the normal heart sound

1. 正常心音的示意图

近年来,许多提出的分割方法主要针对给定的心音包括两个步骤:1) 检测候选峰值;2) 识别心音周期。Xu等使用了标准化的平均香农能量进行PCG信号处理,并根据合并和删除操作标准选择S1S2 [10]。Xiang等通过将每段文件的最小数据长度设为2秒(s)来分割心音,以确保分割效果的质量[11]。Youness等使用了基于先验知识的香农能量和标准来分割主要的S1S2 [12]。这一标准基于心音的包络,时间间隔少于50毫秒(ms),且均方根能量大于其他部分的40%,从而保留更高能量的成分。

然而,由于忽略了心脏结构的差异,这些使用固定参数的方法在检测心音S1S2时并不实用。因此,为了避免这种差异的影响,本文首次提出了一种基于短时修正希尔伯特变换(STMHT)的自适应分割方法(ASTMHT),用于在给定的心音上分割S1S2。其简单流程如图2所示。ASTMHT的性能在一个公开数据集以及来自121名18~30岁大学生的心音上进行了评估。

Figure 2. The flowchart of the proposed method

2. 所提出分割方法流程图

本文的其余部分组织如下。第2节介绍ASTMHT分割方法。第3节描述性能评估。最后,第4节给出结论。

2. 方法

该方法对应的三个阶段可以总结如下:1) 心音信号预处理,包括降采样和去噪;2) 使用ASTMHT分割给定的心音;3) 基于ASTMHT自适应心脏结构的差异,自动提取S1S2

2.1. 心音预处理

首先,原始心音信号以Fₛ = 2000赫兹(Hz)进行重复采样[10] [13]。经过多次实验,为了防止局部噪声对全局心音周期分割的影响,最终确定使用Daubochies 10 (Db10)小波分解生成滤波后的心音(记为 H S F ),分解层数从第6层到第10层[14]。最终,降噪后的信号段被标准化到1至1的范围:

H S F [ m ]= H S F [ m ] max( | H S F [ m ] | ) (1)

2.2. ASTMHT分割

由于STMHT使用固定参数:每个心音周期的邻域带宽( B W )为0.06秒(s),移动窗口的奇数长度N ( W N )被设定为0.006秒(s) [13] [15],因此不适合在给定的心音上进行分割,因为存在心脏结构的差异。因此,本文提出了一种新颖的ASTMHT分割方法,具体描述如下。

1) E STMHT 提取:

为了定位分割点并确定几何中心峰值,首先基于Viola积分方法提取心音 H S F 的包络(记为 E T ) [13] [15]。STMHT已被提出用于提供足够的心音分割性能[13] [14]。基于生成包络 E T 和ASTMHT曲线(记为 E ASTMHT )的方法分别描述如下。

给定一个N点的滤波心音HSp (HSp [m], m=0,1,,M1 ),其中M表示 H S F 的点数,移动窗口 W M [ m ]( m= ( W N 1 )/2 , ( W N 1 )/2 +1,, ( W N 1 )/2 ) 具有 W N E STMHT 通过以下公式计算:

E ASTMHT [ n; W N , L T ]= m=n W N 1 2 n+ W N 1 2 E T [ m; L T ] W M [ mn ] W E [ m( n M1 2 ) ] (2)

其中,在时间m B W 内,称为宽度时间尺度( L T  = F s B W ,其中 m= L T , L T +1,,M1 L T ),包络 E T [ m ] 通过以下公式获得:

E T [ m; L T ]= 1 2 L T +1 k=m L T m+ L T ( H S F [ k ] k=m L T m+ L T H S F [ k ] 2 L T +1 ) 2 (3)

以及

W E [ i ]={ cos( M12i 2M π )cos( M12i 2 π ) Msin( M12i 2M π ) , i=0,1,,M1 0, i= M1 2 (4)

在本研究中,参数 B W 直接影响心音成分的包络提取。当该数值增大时,包络覆盖范围扩大,更容易提取高能量成分,如图3(a)所示。相反,当该数值减小时,包络覆盖范围收缩,更易提取低能量成分,如图3(c)所示。参数 W N 影响曲线 E ASTMHT 的下降趋势。当该数值增加时,曲线与 E T =0 之间的角度E增加,缓慢趋近零值,从而覆盖低能量成分,如图3(d)所示。当该数值减小时,曲线与 E T =0 之间的角度减小,曲线快速收敛至零,主要捕获高能量成分并抑制无关分量干扰,如图3(f)所示。研究结果表明,参数 B W W N 之间存在反比关系。

Figure 3. The different parameters B W and W N . (a)~(c) The E STMHT curve after W N =251 in different B W =0.06,0.04 and 0.02, (d)~(f) The E STMHT curve after B W =0.06 in different W N =201,151 and 101

3. 不同参数 B W W N 的影响。(a)~(c) 固定 W N =251 时,不同 B W 值(0.06、0.04和0.02)下的 E STMHT 曲线;(d)~(f) 固定 B W =0.06 时,不同 W N 值(201、151和101)下的 E STMHT 曲线

2) 最佳参数确定:

由于不同的心脏结构中的心音周期性不同,本文可以根据周期性和参数之间的关系来确定最佳参数,如公式(5)所示,曲线 E ASTMHT 的周期性可通过计算 S 1 S 2 上变异系数( C V TI )的时间间隔(TIs)来表征。

C V TI =ωC V TI S 1 +( 1ω )C V TI S 2 (5)

其中, ω 设为0.5,

C V TI S 1 = N 1 ( TI S 1 ( i ) 1 N 1 i=1 N 1 TI S 1 ( i ) ) 2 i=1 N 1 TI S 1 ( i ) (6)

C V TI S 2 = N 2 ( TI S 2 ( i ) 1 N 2 i=1 N 2 TI S 2 ( i ) ) 2 i=1 N 2 TI S 2 ( i ) (7)

其中, TI S 1 TI S 2 分别表示从 S 1 S 2 的时间间隔(记作 S 12 )和从 S 2 S 1 的时间间隔(记作 S 21 ), N 1 N 2 TI S 1 TI S 2 的数量,i表示第i个时间间隔 TI( i ) 的索引。由于该方法设计为完全无监督模式,因此在最终分割心音信号前,需一次性自适应确定参数 B W W N 的全局最优值。

首先,必须确定参数 B W W N 的合适取值范围。这可以通过对大量心音样本进行统计分析来实现,统计结果如表1所示。基于先前的STMHT方法,并确保区间包含最优参数,最终确定参数范围为 B W [ 0.01,0.06 ] ,且 W N [ 51,251 ] 并取奇数值。

Table 1. The statistical analysis of parameters B W and W N .

1. 参数 B W W N 的统计分析结果

Parameters

Lower bound

Upper bound

μ LB

σ LB

μ UB

σ UB

B W

0.0259

0.0080

0.0478

0.0098

W N

58.1250

7.3018

101.2500

27.7597

其次,如图3所示,这两个参数之间存在特定的反比关系。本方法采用网格搜索法计算并寻找式(8)中的最优值,同时引入二分搜索思想以提升搜索速度,并结合两参数间的相互关系进行优化。搜索过程中还添加了以下两个约束条件:1) 参数搜索时,若 B W 取值较小,则需对应选择较大的 W N ,反之亦然;2) 由于心音成分的能量通常高于杂音,应尽可能取较大的 B W 值和较小的 W N 值,以确保对给定心音信号的最优分割效果。最终通过多组 B W W N 参数组合计算其对应的变异系数 C V TI

因此,基于网格搜索法,通过分析 B W W N 在合理范围内的相互关系及其对应的变异系数 C V TI ,最终确定的最优参数 B W opt W N opt 可通过式(8)计算得出:

( B W opt , W N opt )= argmin B W , W N C V TI ( B W , W N ) (8)

subject to | C V TI ( k+1 ) C V TI ( k ) C V TI ( k ) |<ε . (9)

其中,收敛阈值 ε 设为0.0001,k表示第k组参数组合。

最终,当变异系数 C V TI 收敛至最小变化率时,系统将自适应确定最优曲线 E ASTMHT (记为 E ASTMHT [ W N opt , L T opt ] ),该曲线精确对应于全局最优参数 B W opt W N opt ,其中 L T opt = F s B W opt 。此时,最优包络 E T [ L T opt ] 可通过 E ASTMHT [ W N opt , L T opt ] 推导获得。

2.3. S1S2的自动提取

E ASTMHT E T 上的分割特征已在研究[14] [15]中成功应用,其特性可归纳如下(如图4(b)图4(c))所示):

1) 负向转正向点曲线(记为N2Ps),对应 S 1 S 2 的峰值点(分别用标记);

2) 正向转负向点曲线(记为P2Ns),对应 S 1 S 2 之间、 S 2 S 1 之间的分割点(分别用标记)。

S 12 的时间间隔始终小于 S 21 的时间间隔。因此,通过自动优化选取N2Ps和P2Ns即可实现 S 1 S 2 的分割与判定。ASTMHT分割方法的性能验证详见第三节。

Figure 4. Experimental result of 5 s recording “LgyRuningP2.wav” obtained from Hnist database. (a) The analysis results used ASE, (b) The analysis results used STMHT, (c) The analysis results used ASTMHT

4. 实验结果展示(基于Hnist数据库中5秒录音“LgyRuningP2.wav”):(a) 采用ASE方法的分析结果,(b) 采用STMHT方法的分析结果,(c) 采用ASTMHT方法的分析结果

3. 新能评估

3.1. 数据采集

数据采集自湖南理工学院(HNIST dataset) 121名正常受试者的肺动脉瓣听诊区(Pulm)。其中101名处于静息状态(女性21人,男性80人),年龄18至30岁,均值 ± 标准差为20.51 ± 2.96岁;另有20名非静息状态受试者(女性6人,男性14人),年龄18至26岁,均值 ± 标准差为21.85 ± 3.56岁。心音数据采用3MTM Littmann®电子听诊器采集,采样率44.1千赫兹(kHz),音频以.wav格式存储,记录时长14至40秒不等。心音数据采集流程如图5所示。

3.2. 性能指标

该性能指标用于衡量分割方法对心音主成分( S 1 S 2 )的定位效果。具体计算给定数据集中 S 1 S 2 分割的准确率公式如下:

Figure 5. The evaluation results of the ASTMHT, STMHT and ASE in Hnist dataset (Quite state, Non-quiet state) in Pulm position acquisition, and Michigan heart sound datasets in Aortic, Pulm and Apex position acquisition

5. ASTMHT、STMHT和ASE方法在HNIST数据集肺动脉瓣区采集数据(静息状态与非静息状态)和密歇根心音数据集(主动脉瓣区、肺动脉瓣区及心尖区采集数据)中的评估结果

Accuracy= TP TP+FN % . (10)

其中,TP表示正确分割的心音周期数量,FN表示错误分割心音周期数量。

3.3. 结果

ASTMHT、STMHT和平均香农能量(ASE)三种方法的性能在三个心音数据集上进行了评估,包括:HNIST数据集肺动脉瓣位置采集数据(分别为静息状态和非静息状态)和Michigan心音数据集(包含不同疾病类型,分别在主动脉瓣、肺动脉瓣和心尖区位置采集)评估结果如表2所示,对比示例如图4所示。研究结果表明,所提出的自适应方法平均准确率达到95.21%,显著优于常见分割方法(ASE: 72.00%, STMHT: 63.39%),如图5所示。

Table 2. Comparison results of STMHT, ASE and ASTMHT methods

2. STMHT、ASE与ASTMHT方法的对比结果

Datasets

Cycles

Methods

ASE 2022

STMHT 2024

ASTMHT

Hnist dataset (Quiet state)

40,384

88.17%

91.64%

97.46%

Hnist dataset (Non-quiet state)

3478

38.31%

15.69%

92.26%

Michigan dataset (Quiet state)

1487

89.51%

82.85%

95.90%

4. 结论

针对引言中提出的急性心梗(AMI)病发即时响应需求,本文提出了一种新型心音分割方法ASTMHT。该方法通过自适应确定STMHT分割参数,克服了患者病发状态不确定性及心脏结构差异带来的挑战,实现了异常心音分割、状态检测及AMI预警功能。ASTMHT基于STMHT算法和心音成分时间间隔分析,能有效适应心率变化、低能量成分及病理性额外心音等复杂情况,并减少意外噪声对分割准确性的干扰。实验结果表明,ASTMHT、STMHT和ASE的平均分割准确率分别为95.21%、63.39%和72.00%,其中ASTMHT展现出显著的分割性能优势,为提升AMI特征提取准确性提供了有力支持。未来工作将聚焦于开发基于心音信号本质特征直接确定STMHT参数的算法体系,以进一步优化分割性能。本研究为基于心音听诊的AMI早期诊断和风险预测提供了重要技术基础,有助于降低AMI突发危重死亡率。

基金项目

本研究获湖南省大学生创新创业重点项目(No. S202410543068)、教育厅重点项目(No. 21A0403, No. 21A0405)、湖南省自然科学基金项目(No. 2022JJ30282, No. 2023JJ30283)、教育部产学研合作项目(No. 202102211006, No. 230806093021436)基金项目资助。

参考文献

[1] Ren, Z., Chang, Y., Nguyen, T.T., Tan, Y., Qian, K. and Schuller, B.W. (2024) A Comprehensive Survey on Heart Sound Analysis in the Deep Learning Era. IEEE Computational Intelligence Magazine, 19, 42-57.
https://doi.org/10.1109/mci.2024.3401309
[2] Jia, W., Wang, Y., Chen, R., Ye, J., Li, D., Yin, F., et al. (2024) Zchsound: Open-Source ZJU Paediatric Heart Sound Database with Congenital Heart Disease. IEEE Transactions on Biomedical Engineering, 71, 2278-2286.
https://doi.org/10.1109/tbme.2023.3348800
[3] Bi, X., Tang, S., Xiao, B., Li, W., Gao, X. and Liò, P. (2025) A Systematic Review of Heart Sound Detection Algorithms: Experimental Results and Insights. IEEE Transactions on Instrumentation and Measurement, 74, 1-16.
https://doi.org/10.1109/tim.2025.3547082
[4] Ameen, A., Fattoh, I.E., Abd El-Hafeez, T. and Ahmed, K. (2024) Advances in ECG and PCG-Based Cardiovascular Disease Classification: A Review of Deep Learning and Machine Learning Methods. Journal of Big Data, 11, Article No. 159.
https://doi.org/10.1186/s40537-024-01011-7
[5] Monteiro, S.M. and Silva, H.P.d. (2023) A Novel Approach to Simultaneous Phonocardiography and Electrocardiography during Auscultation. IEEE Access, 11, 78224-78236.
https://doi.org/10.1109/access.2023.3298109
[6] Tatulli, E., Souriau, R. and Fontecave-Jallon, J. (2025) Unsupervised Segmentation of Heart Sounds from Abrupt Changes Detection. Computers in Biology and Medicine, 186, Article ID: 109712.
https://doi.org/10.1016/j.compbiomed.2025.109712
[7] Kahankova, R., Mikolasova, M., Jaros, R., Barnova, K., Ladrova, M. and Martinek, R. (2023) A Review of Recent Advances and Future Developments in Fetal Phonocardiography. IEEE Reviews in Biomedical Engineering, 16, 653-671.
https://doi.org/10.1109/rbme.2022.3179633
[8] Chen, J., et al. (2023) A Robust Deep Learning Framework Based on Spectrograms for Heart Sound Classification. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 21, 936-947.
[9] Xiong, W., Zhang, G., Yan, D., Cao, L., Huang, X. and Li, D. (2025) Multichannel Feature Fusion Network-Based Technique for Heart Sound Signal Classification and Recognition. Expert Systems with Applications, 273, Article ID: 126839.
https://doi.org/10.1016/j.eswa.2025.126839
[10] Xu, W., Yu, K., Ye, J., Li, H., Chen, J., Yin, F., et al. (2022) Automatic Pediatric Congenital Heart Disease Classification Based on Heart Sound Signal. Artificial Intelligence in Medicine, 126, Article ID: 102257.
https://doi.org/10.1016/j.artmed.2022.102257
[11] Xiang, M., Zang, J., Wang, J., Wang, H., Zhou, C., Bi, R., et al. (2023) Research of Heart Sound Classification Using Two-Dimensional Features. Biomedical Signal Processing and Control, 79, Article ID: 104190.
https://doi.org/10.1016/j.bspc.2022.104190
[12] Arjoune, Y., Nguyen, T.N., Doroshow, R.W. and Shekhar, R. (2024) A Noise-Robust Heart Sound Segmentation Algorithm Based on Shannon Energy. IEEE Access, 12, 7747-7761.
https://doi.org/10.1109/access.2024.3351570
[13] Sun, S., Tong, Y., He, P., Song, W., Li, X., Liu, G., et al. (2024) A Novel GMM-Based Estimated Splitting Coefficient of Second Heart Sound for Diagnosing Aortic Septal Defect. IEEE Sensors Journal, 24, 16299-16315.
https://doi.org/10.1109/jsen.2024.3375850
[14] Sun, S., Song, W., Tong, Y., Li, X., Zhao, M., Deng, Q., et al. (2023) A Novel Methodology for Evaluation of S2 Wide Split via Estimated Parameters. Computer Methods and Programs in Biomedicine, 242, Article ID: 107777.
https://doi.org/10.1016/j.cmpb.2023.107777
[15] Sun, S., Tong, Y., Zhang, B., Yang, B., Yan, L., He, P., et al. (2022) A Novel Adaptive Methodology for Removing Spurious Components in a Modified Incremental Gaussian Mixture Model. International Journal of Machine Learning and Cybernetics, 14, 551-566.
https://doi.org/10.1007/s13042-022-01649-w