基于功率谱密度的打呼噜声提取研究

doi:10.12677/OJAV.2020.81004

期刊菜单

基于功率谱密度的打呼噜声提取研究
Power Spectrum Density-Based Snore Sound Extraction Research

DOI: 10.12677/OJAV.2020.81004, PDF,
作者: 孙树平^*, 庞宏祥, 黄婷婷, 张弼强, 李肖航, 王楠：南阳理工学院，河南南阳
关键词: 呼噜声信号；小波变换；功率谱密度函数；呼噜声成分；Snore Signal； Wavelet Transform； Power Spectral Density Function； Snoring Components

摘要: 为确定鼾声的特征，定义并提取了基于频率域的功率谱密度的鼾声特征，对正常和异常鼾声进行了评价。本研究分为三个阶段：首先，通过微信号采集和预处理，利用小波分解方法去除噪声。其次，利用功率谱密度函数(PSD)结合阈值法提取频域特征。最后，对十三名健康学生的三十二小时正常呼吸声和三名患者的十一小时异常鼾声进行了研究。分析结果表明，异常呼吸声对应的两个主成分分别分布在10~300 Hz和500~800 Hz范围内，比从正常呼吸声中提取的主成分高。

Abstract: To character the characteristics of snore sounds, the power spectrum density (PSD)-based snore sound features in the frequency-domain are defined and extracted to discriminate the normal and abnormal snore sounds. This study is generally divided into three stages: firstly, the snoring signal is collected via micro-recorder and is preprocessed to denoise the unexpected noise via wavelet decomposition method. Secondly, PSD combined with threshold line is employed to extract features in the frequency-domain. Finally, thirty-two hours normal breathing sounds from thirteen health students and eleven hours abnormal sounds from three patients are analyzed. The analysis results show that the two principal components corresponding to the abnormal sounds, greater than those extracted from normal sounds, are distributed in the range of 10~300 Hz and 500~800 Hz, respectively.

文章引用：孙树平, 庞宏祥, 黄婷婷, 张弼强, 李肖航, 王楠. 基于功率谱密度的打呼噜声提取研究[J]. 声学与振动, 2020, 8(1): 26-32. https://doi.org/10.12677/OJAV.2020.81004

1. 引言

打呼噜是睡觉时的呼吸噪音，这是所有年龄层和男女都存在的一个常见问题，《中国卫生健康统计年鉴2019》 [1] 有关于全国耳鼻喉疾病研究报告资料统计指出，我国大约有40% (见图1(A))的人群(年龄段在5至70岁)患有严重打呼噜的症状，其中年龄在5~12岁的孩子占15% (见图1(B))，12~22岁青少年占有30%，22~50岁的青年及中年人占30%，50~70岁人群占25%。习惯性打呼噜引起的阻塞性睡眠呼吸暂停综合征发病率也在逐年增长，年龄也趋向于偏小化 [2]。儿童阻塞性睡眠呼吸暂停的特点是在睡眠中反复出现完全或部分上气道阻塞 [3]，表现为间歇性低氧血症、高碳酸血症、破坏人体神经调节功能、频繁觉醒和断裂性睡眠，这种症状不利于儿童的生长发育，患有严重打呼噜的儿童其生长发育是远远落后于同龄儿童，并且对其智力发育、行为习惯等都会造成影响，比如学习能力差，注意力很难集中，自控意识差，社会适应能力差等。

Figure 1. The proportion of people who snore and the age distribution

图1. 打呼噜人数比例与年龄分布

目前诊断和评估阻塞性睡眠呼吸暂停综合症的主要技术手段是多导睡眠图，也称为睡眠研究。多导睡眠技术能测量睡眠过程中发生的生物生理变化，测试在夜间睡眠实验室进行。通过对睡眠中阻塞性呼吸的评估和对呼吸暂停低通气指数(Apnea-Hypopnea Index, AHI)的评分来确定患病的严重程度。它要求患者在睡眠实验室过夜，并且需要在患者身体连接很多生理传感器 [4]。完整的多导睡眠图诊断麻烦，而且整个检测价格昂贵，实际检测过程繁琐，耗费大量时间。这也降低了其临床应用的价值。相对于多导睡眠图技术检测诊断，呼噜声的声学分析是一种非侵入性诊断技术，成本低，对呼噜声信号的采集具有安全、简单、经济的特点，具有极大的潜力和广阔前景 [5]。因此近年来国内外许多研究者对呼噜声的声学特性进行研究，试图从呼噜声中提取有价值的信息，找到一种通过分析呼噜声特征对病症进行诊断的方法 [5] [6]，利用呼噜声分析技术对阻塞性睡眠呼吸暂停综合症进行评估和分析的研究得到快速发展。

对呼噜声进行声学分析，可以作为临床上由打呼噜造成健康问题的一种评估参考，同时对治疗呼噜相关科学研发具有一定的启迪作用。针对具有病变特征的呼噜声，研究首先对呼噜声信号降噪，并将降噪后的信号与原始呼噜声信号进行比较，确定最合适的降噪参数(小波族和阈值类型)。本研究实验结果也表明了分解层次和阈值类型是影响呼噜声降噪效果的最重要参数。之后基于功率谱从能量和频率两个角度对呼噜信号定性分析。本研究基于功率谱分析从频率和能量两个角度对呼噜声信号分析，并对此进行研究。

2. 呼噜声信号的采集及预处理

2.1. 呼噜声信号的采集

采集呼噜声信号的方法有两种：1) 采用室内麦克风(即环境麦克风)，将微型麦克风悬挂于患者仰卧位时的口部之上，与口部距离15~50 cm [7] [8] [9]，也有研究将其置于甲状软骨旁1 cm，距皮肤表面1 cm处 [10]；2) 采用接触式麦克风，将微型麦克风固定于颈前、胸壁皮肤等位置，如胸骨上窝旁 [11] 、胸骨上切迹的气管前壁 [12] 、胸骨柄 [9] 等处。综合考虑到数据可实时分析特性及采集的便携性，本研究提出一种可穿戴式颈带麦克风采集打呼音信号(如图2)，该颈带麦克风主要参数如表1所示。

Figure 2. Neck band microphone

图2. 颈带麦克风

Table 1. Main parameters of microphone

表1. 麦克风主要参数

2.2. 基于小波变换的呼噜声信号预处理

由于小波分解具有多分辨率、窗口化等特性，且具有较好的信号降噪特性，其被广泛应用于生物信号处理领域，如心音信号、心电信号、脑电波等预处理。对应小波变换原理公式(1)的小波分解结构图如图4所示，本文采用dB系列中dB10为母小波的小波变换对呼噜声信号进行降噪处理，保留信号的有效频带范围为62.5~1000 Hz。小波分解结构图如图3所示。关于打呼噜音实际降噪效图如下：图4为采集到的呼吸音信号，图5为图4中所选取部分的降噪效果图。

(1)

Figure 3. Wavelet decomposition structure flowchart

图3. 小波分解结构流程图

Figure 4. Gathering snore signals

图4. 采集的呼噜声信号

Figure 5. Noise reduction effect drawing

图5. 降噪效果图

2.3. 基于功率谱分析的特征提取

信号会产生一定的功率，波的功率与频率之间的关系就被称之为功率谱。功率谱密度函数(PSD)通常是用来表述或者分析功率信号的，他的曲线一般横坐标是用频率表示，纵坐标是由功率表示。因为功率和频率没有负值单位的，所以功率谱曲线上的横纵坐标也没有负数值，频谱图像处于第一象限，并且功率谱曲线所覆盖的面积在数值上等于信号的总功率。它显示了哪些频率变化是强的，哪些频率变化是弱的，即信号功率在频域的分布状况 [12]。单位是每个频率(宽度)的能量(方差)，也可以通过对该频率范围内的PSD进行积分来获得特定频率范围内的能量。本研究对所采集的信号进行功率频谱分析，在处理过的呼噜声信号的频域和时域上分析其特征。在对呼噜声信号特征提取时，我们采用包络线提取的方法，虽然还有许多其他的方法，但是使用这些方法不利于分析频率组件，因为它们有很多相同的频率组件 [13]。包络线法是以提取呼噜声信号频率域特征的有效方法。式(2)、(3)即为包络线法对呼噜声信号进行特征提取的原理。

$E [k] = \frac{1}{2 M_{i j}} \sum_{M = K - M_{i j}}^{k + M_{i j}} | X_{F i j} [m] |, K = M_{i j}, \dots, N_{i j} - 1 - M_{i j}, j = 1, 2, 3$ (2)

$X_{i j} [m] \sum_{n = 1}^{N_{i j} - 1} X_{τ i j} [n] e^{(- j \frac{2 π}{N_{i j} n m})}$ $M = 0, 1, 2, \dots, N_{i j} - 1$ (3)

式(4)是对呼噜声频率域包络线的提取。

$S E_{i j} [k] = \frac{1}{2 S M_{i j} + 1} \sum_{M = K - S M_{i j}}^{K + S M_{i j}} | E_{i j} [m] |, K = S M_{i j}, \dots, N_{i j} - 1 - S M_{i j}, j = 1, 2, 3$ (4)

在对呼噜声信号作率谱分析时采用包络线方法不仅可以减少呼噜声信号的频率分量，还可以保证频率分量在局部区域基本上是对称的。因此可以用包络线法对呼噜声的频率成分进行自动定位，并用于提取呼噜声信号的频率特征。

2.4. 呼噜声信号特征提取

特征提取方法如图6所示，即为基于功率谱，利用阈值线(Thv)得出呼噜声音的频率域特征提取方法。例如对于图6中的呼噜音(见图6(A))，其对应的分析结果为图6(B)所示，由图6(B)可知：对于Thv = 0.5，其提取出的呼噜音心音频率分布分别为：384 Hz和395 Hz；对于Thv = 0.6，其提取出的呼噜音心音频率分布分别为：310 Hz和289 Hz；对于Thv = 0.7，其提取出的呼噜音心音频率分布分别为：269 Hz和203 Hz；对于Thv = 0.8，其提取出的呼噜音心音频率分布分别为：228 Hz和96 Hz；音能量主要集中在10~300 Hz和500~800 Hz。结合阈值分析可以得出阈值线所对应的频率分别为：0.4——(394.26 ± 76.98) Hz和0.8——(201.68 ± 92.14) Hz，0.4——(459.86 ± 142.09) Hz和0.8——(150.76 ± 120.15) Hz。

Figure 6. Envelope-based features definition over a given threshold line

图6. 基于包络线结合阈值线特征定义图

2.5. 数据分析

通过对十三名健康学生1.5小时/每人共计三十二小时的正常呼吸声和三名患者分别2.5小时、5.5小时、4小时共计11小时的鼾声进行对比分析，可知正常呼吸声信号能量整体较低，趋于稳定的状态；而由两种主成分构成的呼噜音，其能量相对于正常呼吸声更高。结合阈值分析可以得出阈值线所对应的频率分别为0.4——(394.26 ± 76.98) Hz和0.8——(201.68 ± 92.14) Hz，0.4——(459.86 ± 142.09) Hz和0.8——(150.76 ± 120.15) Hz。如表2。

Table 2. Frequency range and threshold line correspond to frequency table

表2. 频段范围与阈值线对应频率表

3. 总结

用功率谱结合阈值线方法提取呼噜声特征，并对呼噜音特征进行评定。首先，基于微型音频采集器采集呼噜声及基于小波对呼吸音进行降噪预处理。然后，基于功率谱分析结合阈值线方法提取呼吸音信号特征数据。最后通过所提特征对正常与异常呼噜声进行定性分析。由于本研究中特征提取方法依赖于手动设置阈值，势必为医护人员或使用者带来诸多不便。鉴于此，后续会对如何自动提取呼吸音特征、如何提取更为有效特征进行研究，进而为医患用户提供更为直接、更有价值的关于打呼噜的健康诊断信息。

参考文献

[1]	国家卫生健康委员会. 中国卫生健康统计年鉴2019 (中国卫生和计划生育统计年鉴2019) [Z]. 国家卫生健康委员会, 2019.
[2]	徐庆庆, 李向阳. 阻塞性睡眠呼吸暂停低通气综合征研究进展[J]. 实用医院临床杂志, 2016, 13(1): 138-141.
[3]	杜常欣, 朱敏, 于倩, 徐淑桦, 胡嘉忻. 儿童阻塞性口呼吸的诊断[J]. 中国临床新医学, 2018, 11(11): 1065-1071.
[4]	Yadollahi, A., Moussavi, Z., Yadollahi, A. and Moussavi, Z. (2005) Measuring Minimum Critical Flow for Normal Breath Sounds. Annual International Conference of the IEEE Engineering in Medicine and Biology Society. IEEE Engineering in Medicine and Biology Society, 3, 2726-2729.
[5]	Koo, S.K., Kwon, S.B., Kim, Y.J., et al. (2017) Acoustic Analysis of Snoring Sounds Recorded with a Smartphone According to Obstruction Site in OSAS Patients. European Archives of Oto-Rhino-Laryngology, 274, 1735-1740. [Google Scholar] [CrossRef] [PubMed]
[6]	王璨. 阻塞性睡眠呼吸暂停低通气综合征患者的呼噜声分析与识别研究[D]: [硕士学位论文]. 广州: 华南理工大学, 2017.
[7]	Hara, H., Murakami, N., Miyauchi, Y., et al. (2006) Acoustic Analysis of Snoring Sound by a Multidimensional Voice Program. Laryngoscope, 116, 379-381. [Google Scholar] [CrossRef] [PubMed]
[8]	Agrawal, S., Stone, P., Meguinness, K., et al. (2002) Sound Frequency Analysis and the Site of Snoring in Natural and Induced Sleep. Clinical Otolaryngology and Allied Sciences, 27, 162-166. [Google Scholar] [CrossRef] [PubMed]
[9]	Perez-Padillla, J.R., Slawinski, E., Difrancesco, L.M., et al. (1993) Characteristics of the Snoring Noise in Patients with and without Occlusive sleep Apnea. The American Re-view of Respiratory Disease, 147, 635-644. [Google Scholar] [CrossRef] [PubMed]
[10]	Fiz, J.A., Jand, R., Solfi-Soler, J., et al. (2010) Continuous Analysis and Monitoring of Snores and Their Relationship to the Apnea-Hypopnea Index. Laryngoscope, 120, 854-862. [Google Scholar] [CrossRef] [PubMed]
[11]	Dalmasso, F. and Prota, R. (1996) Snoring：Analysis, Measurement, Clinical Implications and Applications．European Respiratory Society, 9, 146-159. [Google Scholar] [CrossRef] [PubMed]
[12]	Azarbarzin, A. and Moussavi, Z. (2012) A Comparison between Recording Sites of Snoring Sounds in Relation to Upper Airway Obstruction. Annual International Conference of the IEEE Engineering in Medicine and Biology Society, San Diego, August 2012, 4246-4249. [Google Scholar] [CrossRef]
[13]	郑君里, 应启珩, 杨为理. 信号与系统(第二版)上册[M]. 北京: 高等教育出版社, 2000: 349-353.

为你推荐

January 3-5, 2017
Bangkok, Thailand

友情链接