一种改进的小波阈值函数语音信号降噪方法
An Improved Wavelet Threshold Function Method for Speech Signal Denoising
DOI: 10.12677/aam.2025.143095, PDF, HTML, XML,    国家自然科学基金支持
作者: 韩 鎏, 曾金芳, 陈 晨, 高 瞻:湘潭大学物理与光电工程学院,湖南 湘潭
关键词: 语音信号小波变换阈值函数信号降噪Speech Signal Wavelet Transform Threshold Function Signal Noise Reduction
摘要: 为了减少带噪语音信号的噪声含量,本文根据小波阈值函数降噪法,提出改进型阈值函数和名为newshrink阈值的改进型阈值对带噪语音信号进行降噪处理。在MATLAB平台上设定四组不同信噪比的带噪语音,利用不同的小波基函数、阈值和阈值函数对语音信号降噪,并以信噪比和均方误差评价小波降噪效果。实验结果表明,以9层小波分解层数、db6小波基函数、newshrink阈值以及改进型阈值函数为小波变换参数的降噪组合,提高了语音信号信噪比,降低了均方误差,改善了降噪效果。
Abstract: To reduce the noise content in noisy speech signals, this paper proposes an improved wavelet threshold function and a new threshold named “newshrink” for speech signal denoising. Four sets of noisy speech with distinct signal-to-noise ratios are established on MATLAB, and diverse wavelet basis functions, thresholds, and threshold functions are employed to denoise the speech signal. The signal-to-noise ratio (SNR) and the mean square error (MSE) are utilized to assess the effectiveness of wavelet denoising. The experimental results demonstrate that the denoising combination of a 9-level wavelet decomposition level, the db6 wavelet basis function, the newshrink threshold and the improved threshold function as the parameters of wavelet transformation enhances the SNR of the speech signal, reduces the MSE, and enhances the noise reduction effect.
文章引用:韩鎏, 曾金芳, 陈晨, 高瞻. 一种改进的小波阈值函数语音信号降噪方法[J]. 应用数学进展, 2025, 14(3): 92-106. https://doi.org/10.12677/aam.2025.143095

1. 引言

在日常生活中,语音信号常常受到噪声的污染,在进一步对语音信号进行处理之前需要采用降噪技术进行去噪处理,它是语言信号处理的开端。传统的语音降噪方法有谱减法、子空间法等,这些方法降噪后会残留许多噪声,且突发性噪声抑制能力很差,难以适应复杂多变环境。为了解决以上降噪缺点,小波变换被引入语音降噪领域。

对于非线性、非平稳的语音信号来说,传统的傅里叶分析无法同时提取信号的时频特性,它主要适用于平稳信号,而小波变换具有对信号进行时频局部分析、信号局部特征提取和时变滤波等特点,所以它被广泛应用于非线性、非平稳领域中。赵晓燕[1]基于二进小波变换,在Sigmoid函数基础上,提出一种参数可调新型阈值函数,提高了六种噪声信号滤波效果。董胡[2]等提出了一种改进的小波阈值函数语音增强方法,对清浊音信号进行判断,接着采用变化的阈值对清浊音信号的小波系数进行不同的阈值处理,结果表明改进的方法非常适用于强噪声背景下的语音增强。卢勇[3]使用改进的小波阈值函数和贝叶斯阈值法获得的阈值来对语音进行增强,仿真结果表明,该算法可得到较高的信噪比和较小的均方误差,能够有效降低信号失真和抑制信号噪音。Xing [4]等介于硬阈值和软阈值之间采用指数函数对阈值函数进行了改进,克服了硬阈值函数和软阈值函数在小波系数中为零时较小、软阈值存在恒定偏差的缺点,与传统的语音降噪算法相比,新的阈值函数得到了一定程度的改进。Zhong [5]等分析了语音识别系统中的去噪要求和硬、软阈值函数,提出了一种改进的小波阈值去噪算法,对算法的去噪效果进行验证表明,对常规语音信号去噪效果较好,并对在真实环境中采集到的带噪语音进行去噪处理,最终也得到较高的系统自评估参数。Liu [6]等在贝叶斯框架下推导出新的非线性阈值函数,且数据分析表明该方法能够更有效地去除白噪声,获得较好的边缘保持效果,减少环境噪声的影响。

国内外学者的探索极大地推动了语音信号降噪处理的发展。本文基于传统的硬阈值函数和软阈值函数,提出一种改进型小波阈值函数。该方法解决了硬软阈值函数的固有缺陷,对带噪语音信号消噪处理进行了优化,提高了信噪比,降低了均方误差。

2. 小波变换理论基础

2.1. 小波变换的原理

小波,微小区域的波,可沿时间轴平移、伸展和压缩,以获取低频和高频小波[7]。处理信号的高频部分时,小波变换在时间处细分,处理信号的低频部分时,在频率处细分,从而体现出对信号的自适应性[8]。小波变换可分为连续小波变换和离散小波变换。

当任意函数 ψ( t ) L 2 ( R ) ,其傅里叶变换 ψ ^ ( ω ) 满足条件:

C ψ = + | ψ ^ ( ω ) | 2 | ω | 1 dω <+ (1)

则称 ψ( t ) 为一个基本小波函数或母小波函数。接着将一个基本小波进行伸缩变换和平移变换得到下式:

ψ a,b ( t )= 1 a ψ( tb a ),a>0,bR (2)

其中,a称作伸缩因子,b称作平移因子,将 ψ a,b ( t ) 称作依赖于参数 a,b 的小波基函数。

将任意 L 2 ( R ) 空间中的函数 f( t ) 在小波基下展开,将这种展开叫做函数 f( t ) 的连续小波变换,其表达式为: ψ( t ) L 2 ( R )

W T f ( a,b )= f( t ), ψ a,b ( t ) = a 1 2 R f( t ) ψ ¯ ( tb a )dt (3)

其中, W T f ( a,b ) 叫做 f( t ) 的连续小波变换, ψ ¯ ψ 的共轭。

为了减少连续小波变换存在信息表达的冗余性,通常需要将连续小波变换中的伸缩因子a和平移因子b离散化[9]。在实际的信号去噪方面的问题上,离散小波变换有更好的效果,所以更加被广泛使用[10]

若函数 f( t ) L 2 ( R ) ψ( t ) L 2 ( R ) a 0 >1 j,kZ ,把函数 f( t ) 进行离散化得到函数 f( n )( n=0,1,,N1 ) 则:

W T f ( j,k )= a 0 j 2 n=0 N1 f( n )ψ( a 0 j nk ) (4)

W T f ( j,k ) 称为函数 f( t ) 的离散小波变换。

2.2. 小波阈值函数降噪法

小波阈值函数降噪法利用其特有的多分辨率特性,把含噪信号分解到多尺度中,并在每一尺度下限定阈值,将属于噪声的小波系数去除,保留属于信号的小波系数,最后重构出小波消噪后的信号[11]。小波阈值函数降噪法去噪的流程图如图1所示。

Figure 1. Flow chart of wavelet threshold function denoising method

1. 小波阈值函数降噪法流程图

阈值去噪中,阈值函数是对超过和低于阈值的小波系数的处理策略,是修正小波系数的规则,是阈值去噪中关键的一步,不同的阈值函数体现了不同的处理小波系数的策略。最常用的阈值函数是硬阈值函数和软阈值函数[12]

ω 为旧小波系数, ω 1 为新小波系数, λ 为给定阈值, sgn( ω ) 为符号函数。

(1) 硬阈值函数[13]

ω 1 ={ ω, | ω |λ 0, | ω |λ (5)

(2) 软阈值函数[14]

ω 1 ={ sgn( ω )( | ω |λ ), | ω |λ 0, | ω |<λ (6)

硬阈值函数虽然能够很好保留信号的特征,但其缺陷在于重构后的信号不平滑。经软阈值函数降噪后的信号整体连续性较好,但软阈值函数的缺点在于新旧小波系数存在固有偏差。在前人的基础上,并且为了解决前期的那些缺点,唐鹏[15]等提出了一种改进的阈值函数,公式如下所示。

y j,k ={ sgn( ω j,k )( ω j,k λ 1+α γ ω j,k 2 λ 2 ), | ω j,k |>λ sgn( ω j,k ) α 1+α e 10( | ω j,k |λ ) | ω j,k |, | ω j,k |λ (7)

其中, λ 是每层分解小波系数中设定的阈值, α 是可调参数, ω j,k 是带噪信号小波系数, y j,k 是输出小波系数。

公式(7)虽然解决了硬阈值函数在阈值处的不连续问题和软阈值存在的系数误差,但是这个方法算法复杂度较高,且存在两个可调参数,该函数的不确定性大大增加,需要计算量较大。

3. 阈值函数的改进

3.1. 改进型阈值函数

本文根据硬阈值函数和软阈值函数的优点,提出一种新型的改进阈值函数,改进阈值函数如下:

ω 1 ={ sgn( ω )[ | ω |( 1A )λe e 2| ω |2λ 1 e ω 2 λ 2 ], | ω |λ sgn( ω )A| ω | [ e ( | ω |λ )/2 ] 6 , | ω |<λ (8)

A接近0时,阈值函数趋于硬阈值,当A接近1时,阈值函数趋于软阈值。因此,A的最佳取值应在两者之间平衡。所以, 0<A<1

该函数曲线较为光滑,通过参数A来调节函数曲线的变化,具有可变性,增加处理不同信号的能力,面对含有不同噪声类型的信号,例如高斯白噪声或者粉红噪声,参数A的取值是不同的,在本文实验中,经过大量重复性试验验证可得,针对高斯白噪声,参数A的取值为0.5,针对粉红噪声,参数A的取值为0.54。该阈值函数优化了阈值处的不连续问题,减少了信号重建时的震荡,也优化了新 ω 和旧 ω 的偏差问题,减少了信号的失真。

下面证明改进的小波阈值函数的连续性和趋近性。

(1) 证明改进型小波阈值函数连续性

由于是奇函数,所以只需证明在定义域右半边部分连续即可。当 | ω |λ 时,

lim w λ sgn( ω )A| ω | [ e ( | ω |λ )/2 ] 6 =Aλ (9)

lim w λ + sgn( ω )[ | ω |( 1A )λe e 2| ω |2λ 1 e ω 2 λ 2 ]=Aλ (10)

lim ω λ = lim ω λ + =Aλ (11)

得出在 λ 处所提出的阈值函数是连续的,同理可知在 λ 处函数也是连续的。

(2) 证明改进型小波阈值函数趋近性

由于新的阈值函数也是奇函数,所以,只需证明在定义域右边半部分连续即可。当 ω+ 时,

lim w+ sgn( ω )[ | ω |( 1A )λe e 2| ω |2λ 1 e ω 2 λ 2 ] ω =1 (12)

趋近于硬阈值函数,所以不存在新旧小波系数固定偏差。

当小波系数的阈值取±1,改进阈值方法的参 ±λ A取值为0.5,参考文献[15]中的阈值函数参数取值为 α=0.5 γ=0.3 时,将改进阈值函数(Improved threshold function)、参考文献阈值函数(Literature threshold function)、软阈值函数(Soft threshold function)、硬阈值函数(Hard threshold function)图像绘在同一个坐标轴上,如图2所示。从图中可以看出改进阈值函数在阈值处是连续的,不存在间断点;其次在趋向于两端时,函数图像无限趋近于硬阈值函数,解决了新旧小波系数存在固定误差的问题,且将右上角局部放大之后(见图3)可看出,改进阈值函数曲线相比参考文献方法更加趋近于硬阈值函数,说明算法更优。

Figure 2. The image theory of four threshold functions

2. 四种阈值函数图像

Figure 3. The zoomed image of the four threshold functions located at the top right

3. 四种阈值函数右上角放大图像

3.2. 阈值的优化以及分解层数的选择

直接影响小波阈值函数去噪效果的一个重要因素是阈值的选择,不同的阈值选择有不同的去噪效果。小波变换使信号的能量在小波域集中在一些大的小波系数中,而噪声的能量却分布于整个小波域内[16]。经小波分解后,信号的小波系数幅值大于噪声的系数幅值。一般认为幅值比较大的小波系数是信号,而幅值比较小的系数是噪声。于是,采用阈值的办法可以把信号系数保留,大部分噪声系数减小至零,即含噪信号在各尺度上进行小波分解,设定一个阈值,幅值低于该阈值的小波系数置为0,高于该阈值的小波系数或者完全保留,或者做相应的收缩处理[17]。目前主要有visushrink阈值、heursure阈值、rigrsure阈值、sqtwolog阈值、minimaxi阈值等[18]

根据小波分解存在的规律,随着分解层数的增加,每一层的小波系数都会减小,如果此时的阈值仍然是固定不变的,那么就会造成很大误差,所以要给出一个相对灵活的阈值,阈值也要随着分解层数的增加而减小。

visushrink阈值是小波阈值去噪法中一个常用的阈值,其公式为:

λ=δ 2ln( N ) (13)

其中,N为信号的长度, δ= median( ω j ,k ) 0.6745 为估计的噪声方差, median 为中值函数, ( ω j ,k ) 为第1次分解处理后的小波系数,j为分解层数,0.6745为噪声标准差的调整系数。

在visushrink阈值的基础上,本文提出一种新的阈值,称作newshrink阈值,其公式为

λ= 1 2ln( j+1 ) δ 2ln( N ) (14)

从该阈值公式可以看出随着分解层数j的增加,阈值 λ 随之减小,这符合小波系数逐层减小的特性,这样的阈值在实际应用中更加具有适应性。

大量实验表明,不同信号、不同信噪比下都存在一个去噪效果最好或接近最好的分解层数。分解层数对消噪效果的影响极大,分解层数过多或过少都无法达到最佳去噪效果。分解层数过多,对各层小波空间的系数进行阈值处理会造成信号的信息丢失严重,消噪后的信噪比反而会降低,运算量大大增加,不利于工程计算[19]。而分解层数过少则会导致去噪效果不理想。小波变换在分解信号的过程中分解过程需要进行↓2的下采样,即每次分解后的系数长度会降为原来的二分之一,分到最后只剩长度为1时就不能再分。一般而言,信号长度逐渐增加的过程中,所需的小波分解层数也是逐渐增多。本文实验所用到的语音信号数据长度为21,801,最多可经过14次下采样。经多次重复性试验可得,在分解层数从1到14的实验过程中发现,分解层数在9之后效果虽有提升但很微弱,而且计算机计算量大大增加。故本文的分解层数定为9。

4. 语音信号去噪实验

4.1. 语音信号的说明及降噪评价指标

为了验证改进阈值函数的降噪特性,本文基于MATLAB R2020a平台进行语音信号仿真降噪实验。该实验选择NOIZEUS语音数据库作为纯净语音信号的来源,在NOIZEUS数据库中选择sp06.wav语音作为本实验的样本语音条,其数据长度为21,801,单通道,采样位数为16 bit,采样频率为8000 Hz。

评价去噪效果的好坏,通常用信噪比(SNR)与均方误差(MSE)来判断[20]。设 x( i ) 是理想信号, x ¯ ( i ) 是去噪后的估计信号,下面是两个指标的计算公式。

(1) 信噪比

SNR=10lg i=0 i=n x 2 ( i ) i=0 i=n [ x( i ) x ¯ ( i ) ] 2 (15)

(2) 均方误差

MSE= 1 n i=0 i=n [ x( i ) x ¯ ( i ) ] 2 (16)

SNR越大、MSE越小,说明估计信号跟理想信号的差距越小,去噪效果越好。

在纯净语音信号上叠加高斯白噪声,将带噪语音信号初始信噪比分别设定为10 dB、5 dB、0 dB、−5 dB上,然后用不同的阈值函数、不同的阈值、不同的小波基函数进行含噪语音信号降噪处理,通过对比信噪比和均方误差的值来分析不同方法降噪效果的优劣。

4.2. 不同小波基函数对语音信号降噪处理

对信号进行小波分解选择合适的小波基函数同样也是很重要的一个环节,分别采用bior2.2、bior2.4、sym1、sym5、db4、db6这六种小波基函数对含噪语音信号进行降噪处理,在纯净语音信号上叠加高斯白噪声,将信号的初始信噪比分别设定在10 dB、5 dB、0 dB、−5 dB,实验得出的输出信噪比和均方误差计算结果分别如表1表2所示。

Table 1. Output SNR after noise reduction by different wavelet basis functions

1. 不同小波基函数降噪后的输出信噪比

初始信噪比

bior2.2

bior2.4

sym1

sym5

db4

db6

10 dB

9.9602 dB

10.464 dB

9.7031 dB

11.074 dB

10.9902 dB

11.2121 dB

5 dB

7.3282 dB

7.779 dB

7.0954 dB

8.2614 dB

8.2133 dB

8.3418 dB

0 dB

4.807 dB

5.1027 dB

4.6383 dB

5.4875 dB

5.4835 dB

5.5662 dB

−5 dB

2.3412 dB

2.5919 dB

2.3808 dB

2.8629 dB

2.8487 dB

2.8958 dB

Table 2. The MSE after noise reduction by distinct wavelet basis functions

2. 不同小波基函数降噪后的均方误差

初始信噪比

bior2.2

bior2.4

sym1

sym5

db4

db6

10 dB

0.00021311

0.00018977

0.00022611

0.0001649

0.00016812

0.00015974

5 dB

0.00039067

0.00035215

0.00041218

0.00031513

0.00031864

0.00030935

0 dB

0.00069812

0.00065217

0.0007257

0.00059688

0.00059743

0.00058616

−5 dB

0.0012317

0.0011626

0.0012205

0.0010923

0.0010959

0.0010841

显而易见,根据表1可得,四组不同的输入信噪比的带噪信号经过db6小波基函数降噪后的信号的信噪比的值都要比另外五种小波基函数要高,而根据表2可得,经db6小波基函数处理后的信号的均方误差对比其余五种小波基函数都呈现出更低的数值表现,这表明db6小波基函数具有更佳的降噪表现,故本文选择db6小波基函数。

4.3. 不同阈值对语音信号降噪处理

在纯净语音上叠加高斯白噪声,将信号的初始信噪比分别设定在10 dB、5 dB、0 dB、−5 dB,接着在每组实验当中分别利用heursure阈值、rigrsure阈值、sqtwolog阈值、minimaxi阈值、visushrink阈值、newshrink阈值这六种阈值对带噪语音信号进行降噪分析,将输出信噪比和均方误差分别记录在表3表4中。

Table 3. Output SNR after noise reduction by different thresholds (White Gaussian Noise)

3. 不同阈值降噪后的输出信噪比(高斯白噪声)

初始信噪比

heursure

rigrsure

sqtwolog

minimaxi

visushrink

newshrink

10 dB

−0.00099926 dB

1.1562 dB

−0.00099927 dB

−0.00099891 dB

10.1418 dB

11.2121 dB

5 dB

−0.0031309 dB

1.0833 dB

−0.0031309 dB

−0.0031305 dB

7.2502 dB

8.3418 dB

0 dB

−0.0098445 dB

0.93232 dB

−0.0098445 dB

−0.0098442 dB

4.5477 dB

5.5662 dB

−5 dB

−0.030971 dB

0.69642 dB

−0.030971 dB

−0.030971 dB

2.2275 dB

2.8958 dB

Table 4. The MSE after noise reduction for distinct thresholds (White Gaussian Noise)

4. 不同阈值降噪后的均方误差(高斯白噪声)

初始信噪比

heursure

rigrsure

sqtwolog

minimaxi

visushrink

newshrink

10 dB

0.0021122

0.0016181

0.0021122

0.0021122

0.00020438

0.00015974

5 dB

0.0021132

0.0016455

0.0021132

0.0021132

0.00039775

0.00030935

0 dB

0.0021165

0.0017037

0.0021165

0.0021165

0.00074108

0.00058616

−5 dB

0.0021268

0.0017988

0.0021268

0.0021268

0.0012644

0.0010841

根据表3可得,当输入信噪比分别为10 dB、5 dB、0 dB、−5 dB时,newshrink阈值相比于visushrink阈值,信噪比分别提升了1.0703 dB、1.0916 dB、1.0185 dB、0.6683 dB,这表明针对visushrink阈值存在的问题进行改进后得到的newshrink阈值具有更好的降噪表现,这也从侧面印证了newshrink阈值的作用,且newshrink阈值相比于heursure阈值、rigrsure阈值、sqtwolog阈值以及minimaxi阈值降噪后的信号信噪比有一个巨大幅度的提升,大大改善了降噪效果,而从表4可以观察到,newshrink阈值降噪后的均方误差有一个大幅度的降低。

本次实验的结果如图4所示。

Figure 4. Waveform of speech signal denoising at different thresholds. (a) Raw signal. (b) Signal with initial SNR of 5 dB. (c) Waveform of denoising with heursure threshold. (d) Waveform of denoising with rigrsure threshold. (e) Waveform of denoising with sqtwolog threshold. (f) Waveform of denoising with minimaxi threshold. (g) Waveform of denoising with visushrink threshold. (h) Waveform of denoising with newshrink threshold

4. 不同阈值语音信号降噪波形图 (a) 原始纯净信号 (b) 信号初始信噪比5 dB (c) heursure阈值降噪波形图 (d) rigrsure阈值降噪波形图 (e) sqtwolog阈值降噪波形图 (f) minimaxi阈值降噪波形图 (g) visushrink阈值降噪波形图 (h) newshrink阈值降噪波形图

图4可知,经heursure阈值、sqtwolog阈值、minimaxi阈值降噪后的信号波形图都有一个共同的缺陷那就是无法体现原本语音信号的波形趋势,而rigrsure阈值降噪后的信号波形图虽然能体现出一些原始信号波形图的信号幅值的强弱,但也跟原始信号相差甚远,newshrink阈值相比于visushrink阈值对信号的还原度要更高,这也验证了newshrink阈值的效果。

在纯净信号基础上叠加粉红噪声,将含噪信号初始信噪比分别设定在10 dB、5 dB,随后利用六种阈值进行降噪处理。将输出信噪比和均方误差分别记录在表5表6中。

Table 5. Output SNR after noise reduction by different thresholds (Pink Noise)

5. 不同阈值降噪后的输出信噪比(粉红噪声)

初始信噪比

heursure

rigrsure

sqtwolog

minimaxi

visushrink

newshrink

10 dB

−0.13877 dB

1.0481 dB

−0.13877 dB

−0.13877 dB

10.0996 dB

10.5076 dB

5 dB

−0.42451 dB

0.6164 dB

−0.42451 dB

−0.42451 dB

6.4303 dB

6.4477 dB

Table 6. The MSE after noise reduction for distinct thresholds (Pink Noise)

6. 不同阈值降噪后的均方误差(粉红噪声)

初始信噪比

heursure

rigrsure

sqtwolog

minimaxi

visushrink

newshrink

10 dB

0.0021803

0.0016589

0.0021803

0.0021803

0.00020638

0.00018787

5 dB

0.0023285

0.0018323

0.0023285

0.0023285

0.0004804

0.00047848

根据表5表6可得,当输入信噪比分别为10 dB、5 dB时,newshrink阈值相比于heursure阈值、rigrsure阈值、sqtwolog阈值、minimaxi阈值、visushrink阈值降噪后的信号信噪比的值是最高的,均方误差的值是最低的,这表明newshrink阈值也可有效处理粉红噪声。

4.4. 不同阈值函数对语音信号降噪处理

将小波基函数设为db6,将阈值设定为newshrink,采用9层小波分解层数,然后叠加高斯白噪声,把带噪语音信号的初始信噪比分别设定为10 dB、5 dB、0 dB、−5 dB,对不同信噪比的带噪信号进行四种阈值函数降噪处理。

Table 7. Output SNR after noise reduction by different threshold functions (White Gaussian Noise)

7. 不同阈值函数降噪后的输出信噪比(高斯白噪声)

初始信噪比

Hard threshold function

Soft threshold function

Literature threshold function

Improved threshold function

10 dB

9.7994 dB

6.3699 dB

9.7226 dB

11.2121 dB

5 dB

7.013 dB

4.1629 dB

7.2187 dB

8.3418 dB

0 dB

4.0946 dB

2.2519 dB

4.7709 dB

5.5662 dB

−5 dB

1.3218 dB

0.85796 dB

2.3949 dB

2.8958 dB

Table 8. The MSE after noise reduction for distinct threshold functions (White Gaussian Noise)

8. 不同阈值函数降噪后的均方误差(高斯白噪声)

初始信噪比

Hard threshold function

Soft threshold function

Literature threshold function

Improved threshold function

10 dB

0.00022115

0.00048712

0.0002251

0.00015974

5 dB

0.00042007

0.00080973

0.00040065

0.00030935

0 dB

0.00082257

0.0012573

0.00070394

0.00058616

−5 dB

0.0015576

0.0017331

0.0012166

0.0010841

通过表7可得,在四组不同初始信噪比实验中都存在一个现象,即经过改进阈值函数降噪后的信号的信噪比都是最高的,且对于10 dB、5 dB、0 dB、−5 dB初始信噪比来讲,其信噪比分别提升了1.2121 dB、3.3418 dB、5.5662 dB、7.8958 dB,这也表明了改进阈值函数在高强度含噪信号降噪方面具有良好的效果,善于处理低信噪比语音信号,而且相比于参考文献函数降噪后的信噪比分别提升了1.4895 dB、1.1231 dB、0.7953 dB、0.5009 dB,这意味着改进阈值函数降噪效果要优于参考文献函数。表8描述的是四种不同初始信噪比含噪信号,经过不同阈值函数降噪后的信号的均方误差,改进阈值函数在四组当中的均方误差都是最低的,这也从另外一个角度说明改进阈值函数降噪的优良性。

本次实验的结果如图5所示。

Figure 5. Waveform of speech signal denoising at different threshold functions. (a) Raw signal. (b) Signal with initial SNR of 5 dB. (c) Waveform of denoising with hard threshold function. (d) Waveform of denoising with soft threshold function. (e) Waveform of denoising with literature threshold function. (f) Waveform of denoising with improved threshold function

5. 不同阈值函数语音信号降噪波形图 (a) 原始纯净信号 (b) 信号初始信噪比5 dB (c) 硬阈值函数降噪波形图 (d) 软阈值函数降噪波形图 (e) 文献阈值函数降噪波形图 (f) 改进型阈值函数降噪波形图

图5可得,经硬阈值函数、软阈值函数和参考文献阈值函数降噪后的语音波形,相比于原始纯净信号的幅值有一个大幅度的减小,这表明丢失了许多原本的语音信息,这一点在软阈值函数上体现得最明显。经过改进型阈值函数降噪后的信号波形图是最接近原始无噪信号波形图的,是最还原的,验证了改进型阈值函数的作用。

在纯净信号上叠加粉红噪声,将含噪信号初始信噪比分别设定在10 dB、5 dB,随后利用四种阈值函数进行降噪处理。将输出信噪比和均方误差分别记录在表9表10中。

Table 9. Output SNR after noise reduction by different threshold functions (Pink Noise)

9. 不同阈值函数降噪后的输出信噪比(粉红噪声)

初始信噪比

Hard threshold function

Soft threshold function

Literature threshold function

Improved threshold function

10 dB

9.137 dB

6.8149 dB

9.4132 dB

10.5076 dB

5 dB

5.3485 dB

4.0323 dB

5.9123 dB

6.4477 dB

Table 10. The MSE after noise reduction for distinct threshold functions (Pink Noise)

10. 不同阈值函数降噪后的均方误差(粉红噪声)

初始信噪比

Hard threshold function

Soft threshold function

Literature threshold function

Improved threshold function

10 dB

0.00025759

0.00043969

0.00024172

0.00018787

5 dB

0.00061629

0.00083444

0.00054126

0.00047848

根据表9表10可得,当输入信噪比分别为10 dB、5 dB时,改进型阈值函数相比于硬阈值、软阈值函数、参考文献阈值函数降噪后的信号信噪比的值是最高的,均方误差的值是最低的,这表明改进型阈值函数对粉红噪声的降噪效果也是可观的。

5. 结论

本文提出了一种改进型小波阈值函数语音信号降噪方法,该方法解决了硬软阈值函数存在的缺点。基于MATLAB平台进行仿真降噪实验,首先,对不同小波基函数的对比分析表明,db6的处理效果最好。其次,通过对visushrink阈值的优化增强,提出了newshrink阈值,并通过对比实验验证了该阈值的优良性。最后,分别利用硬阈值函数、软阈值函数、参考文献方法和改进阈值函数进行带噪信号降噪实验,通过对比可得,改进型阈值函数在每一种输入信噪比下的输出信噪比都是最高的,均方误差都是最小的,其波形图也是最还原的,验证了改进型小波阈值函数具有更好的语音降噪效果。

基金项目

本研究得到国家自然科学基金资助(批准号:62071411)。

参考文献

[1] 赵晓燕. 改进的小波阈值函数滤波分析[J]. 噪声与振动控制, 2013, 33(2): 117-122, 127.
[2] 董胡, 谭乔来. 基于改进的小波阈值函数语音增强方法[J]. 计算机系统应用, 2015, 24(8): 160-164.
[3] 卢勇. 改进小波阈值函数在语音增强中的应用[J]. 信息技术与网络安全, 2019, 38(8): 38-41.
[4] Xing, W.L. and Zhang, B.H. (2014) An Improvement Based on Wavelet Transform Speech Denoising Threshold Function. Advanced Materials Research, 998, 828-832.
https://doi.org/10.4028/www.scientific.net/amr.998-999.828
[5] Zhong, X., Dai, Y., Dai, Y. and Jin, T. (2018) Study on Processing of Wavelet Speech Denoising in Speech Recognition System. International Journal of Speech Technology, 21, 563-569.
https://doi.org/10.1007/s10772-018-9516-7
[6] Liu, K., Cheng, J.Z. and Cheng, L. (2013) Locally Adaptive Wavelet Thresholding for Speech Enhancement. Applied Mechanics and Materials, 380, 3618-3622.
https://doi.org/10.4028/www.scientific.net/amm.380-384.3618
[7] Sun, J., Zhang, X., Tang, Q., Wang, Y. and Li, Y. (2023) Knock Recognition of Knock Sensor Signal Based on Wavelet Transform and Variational Mode Decomposition Algorithm. Energy Conversion and Management, 287, 117062.
https://doi.org/10.1016/j.enconman.2023.117062
[8] Wang, X. (2022) Electronic Radar Signal Recognition Based on Wavelet Transform and Convolution Neural Network. Alexandria Engineering Journal, 61, 3559-3569.
https://doi.org/10.1016/j.aej.2021.09.002
[9] Lu, Y., Huang, Y., Xue, W. and Zhang, G. (2018) Seismic Data Processing Method Based on Wavelet Transform for De-noising. Cluster Computing, 22, 6609-6620.
https://doi.org/10.1007/s10586-018-2355-0
[10] Yao, W.P., Yao, W.L., Wu, M., et al. (2016) R Wave Extraction Based on the Maximum First Derivative plus the Maximum Value of the Double Search. China Medical Devices, 31, 1-4, 12.
[11] Jing-yi, L., Hong, L., Dong, Y. and Yan-sheng, Z. (2016) A New Wavelet Threshold Function and Denoising Application. Mathematical Problems in Engineering, 2016, Article ID: 3195492.
https://doi.org/10.1155/2016/3195492
[12] Yang, Y., Li, S., Li, C., He, H. and Zhang, Q. (2022) Research on Ultrasonic Signal Processing Algorithm Based on CEEMDAN Joint Wavelet Packet Thresholding. Measurement, 201, Article ID: 111751.
https://doi.org/10.1016/j.measurement.2022.111751
[13] Zhong, L., Wang, H., Xu, W., Liu, Y., Wu, G., Liu, C., et al. (2020) The Application of Power Quality Signal De-Noising Based on the Improved Wavelet Threshold Function. IOP Conference Series: Materials Science and Engineering, 768, Article ID: 062021.
https://doi.org/10.1088/1757-899x/768/6/062021
[14] Tong, Y., Li, J., Xu, Y. and Cao, L. (2020) Signal Denoising Method Based on Improved Wavelet Threshold Function for Microchip Electrophoresis C4D Equipment. Complexity, 2020, Article ID: 6481317.
https://doi.org/10.1155/2020/6481317
[15] 唐鹏, 郭宝平. 改进型阈值函数寻优法的小波去噪分析[J]. 信号处理, 2017, 33(1): 102-110.
[16] Liu, L., Huan, H., Li, W., Mandelis, A., Wang, Y., Zhang, L., et al. (2021) Highly Sensitive Broadband Differential Infrared Photoacoustic Spectroscopy with Wavelet Denoising Algorithm for Trace Gas Detection. Photoacoustics, 21, Article ID: 100228.
https://doi.org/10.1016/j.pacs.2020.100228
[17] Laha, S.K., Swarnakar, B., Kansabanik, S. and Ray, S. (2022) A Novel Signal Denoising Method Using Stationary Wavelet Transform and Particle Swarm Optimization with Application to Rolling Element Bearing Fault Diagnosis. Materials Today: Proceedings, 66, 3935-3943.
https://doi.org/10.1016/j.matpr.2022.07.386
[18] Qi, T., Wei, X., Feng, G., Zhang, F., Zhao, D. and Guo, J. (2022) A Method for Reducing Transient Electromagnetic Noise: Combination of Variational Mode Decomposition and Wavelet Denoising Algorithm. Measurement, 198, Article ID: 111420.
https://doi.org/10.1016/j.measurement.2022.111420
[19] Zhang, D., Zhao, H. and Yang, J. (2020) Signal Denoising of Double-Beam and Double-Scattering Laser Doppler Velocimetry Based on Wavelet Layering. Optik, 202, Article ID: 163545.
https://doi.org/10.1016/j.ijleo.2019.163545
[20] Jenkal, W., Latif, R., Toumanari, A., Dliou, A., El B’charri, O. and Maoulainine, F.M.R. (2016) An Efficient Algorithm of ECG Signal Denoising Using the Adaptive Dual Threshold Filter and the Discrete Wavelet Transform. Biocybernetics and Biomedical Engineering, 36, 499-508.
https://doi.org/10.1016/j.bbe.2016.04.001.