1. 引言
信号检测是统计信号处理领域的基本问题。在进行信号检测时,首先需要对接收机检测到的样本数据进行处理,并根据预先设定的判定规则确定样本数据是否包含所需的信息。这项技术被广泛应用于雷达、声纳和通信等领域。在早期的信号检测研究中,由于硬件设备和电子技术的限制,研究主要集中在单通道数据上。然而,随着科技的不断进步,数据呈现形式逐渐向多通道(矩阵)发展。例如相控阵雷达[1],多通道水下声纳系统[2]等。因此,信号处理技术也迅速向多通道方向发展。在此背景下,传统的单通道信号检测方法已无法满足实际需求,基于多通道数据的检测理论和算法[3]应运而生。
信号检测的核心任务是利用数学模型模拟真实场景中的噪声过程,并设计相应的检测算法以识别目标信号。目前,已有多种信号检测方案,例如基于循环平稳性的检测[4]、基于特征值的检测[5]、基于拟合优度测试的检测[6]等。然而,这些方案大多假设背景噪声是高斯白噪声(White Gaussian Noise,简称WGN)。在实际信号检测中,由于硬件设备的辐射干扰和环境噪声的干扰,背景噪声通常具有脉冲性和通道间的相关性。因此,在实际应用中,需要对含有脉冲性和通道相关性的背景噪声进行更为准确地建模。目前,α-稳定分布[7]模型、Middleton Class A (MCA)分布[8]模型是模拟脉冲噪声数据的常见数学模型。研究表明,作为MCA模型的特例,高斯混合模型(Gaussian Mixture Model,简称GMM)能够很好地近似不同的高斯分量下的α-稳定分布和MCA分布。GMM不仅可以模拟噪声的脉冲性,还能模拟通道间相关性,已成为脉冲噪声模拟领域中最受欢迎的模型之一[9]。
随着研究的深入,学者们提出了多种适用于脉冲噪声环境的信号检测器。在已知信号或者背景噪声的先验信息条件下,最优检测器(Optimal Detector,简称OD)、局部最优检测器(Locally Optimal Detector,简称LOD)及局部次优检测器等方法被提出[10]。这些检测器在已知待检信号和背景噪声先验信息的情况下接近最优性能。然而,在实际应用中,获取先验信息通常非常困难。为解决这一问题,研究人员提出了许多不依赖先验信息的检测器,如低阶矩检测器[11]、核检测器[12]和秩相关检测器[13]。低阶矩检测器具有计算简便和定义明确的优势,核检测器能够有效地抑制脉冲噪声中的异常值,减小其对检测性能的负面影响,但两者通常都需要依赖经验选择参数,其性能表现也较为不稳定。其中,匹配滤波器(Matched Filter Detector,简称MFD)在高斯噪声环境下表现出最优的检测性能,但在脉冲噪声环境下其性能会显著下降,甚至完全失效。其中,极性重合相关器(Polarity Coincidence Correlator,简称PCC)则在脉冲噪声下具备一定的鲁棒性。秩相关检测器是一种基于非参数统计原理的性能优化技术,它利用数据项的相对排序信息替代直接的观测值。其核心优势在于对数据分布的无偏性,使其在处理不符合传统正态分布假设的数据时,仍能保持高度的准确性和可靠性。通过分析秩次信息,该检测器能够精确捕捉变量间的相关性,为信号检测领域提供了一种有效的统计工具,特别适用于对数据分布特性有严格要求的应用场景。此外,该检测器在信号缺失时,因其零分布对杂波类型不敏感,能够确保恒定的虚警概率。肯德尔秩相关系数(Kendall’s Tau,简称KT)检测器是秩相关检测器的典型代表。文献[14]推导了在GMM下KT的数学期望和方差,证明了KT在脉冲噪声环境下比PCC具有更好的鲁棒性。然而,在具有相关性的脉冲噪声环境中,KT的性能仍有待提升。为此,本文对KT检测器进行了改良,增设了可调节阈值功能。用户可以通过调整阈值,有效提高主信号的检测概率,并显著提升接收机工作特性(ROC)曲线下的面积[15]。蒙特卡罗模拟结果表明,只要通道间存在相关性,该检测器在高斯噪声下和脉冲噪声下都优于传统的PCC和KT检测器。本文的后续部分将这种改进后的检测器称为改良肯德尔秩相关系数(Improved Kendall’s Tau, IKT)。
本文其余部分结构如下:第一节介绍双通道信号检测的数学建模,以及IKT、GMM的详细定义,并给出相关的重要引理。第二节推导GMM下IKT的期望和方差的封闭解析形式。第三节建立在随机信号检测中虚警概率和检测概率的表达式。第四节通过蒙特卡罗模拟分析,比较不同阈值下IKT在ROC曲线上的检测性能,以及与MFD、PCC和KT的检测性能的差异。同时对本文的工作进行了总结。
2. 问题形成
2.1. 双通道随机信号数学模型
在信号检测中,采用适当的数学模型对实际场景中的噪声和信号进行建模是实现精确检测的首要步骤。由于信号在产生、传输和接收过程中不可避免地受到干扰和噪声影响,因此实际系统观测到的信号通常是发射信号与干扰噪声的叠加。加性噪声模型是目前描述观测信号的主流模型之一。通常情况下,双通道随机信号检测问题可以表述为:
(1)
其中
是n采样时刻的双通道观测信号的集合;
和
分别对应发送器和接收器之间的信道增益。
为待检测的随机信号,通常为具有服从
的独立同分布高斯随机信号。假设
是服从以下GMM分布的噪声对,文献[16]证明其概率密度函数为:
(2)
其中
表示背景噪声中的高斯分量,参数
,
,
表示脉冲分量出现的概率,
和
用于模拟脉冲分量的大方差,
和
分别表示通道间高斯噪声和脉冲噪声的相关性。
对于给定加性噪声模型,双通道信号检测的目标是判断两个通道中高斯信号
是否存在,即:
当
和
时,文献[17]表明
服从以下分布:
(3)
其中
。此时,检测问题可转化为以下二值假设检验:
(4)
2.2. IKT的定义
令
表示从具有连续联合分布的二元总体中提取的n组独立同分布数据对。IKT定义如下:
(5)
其中:
(6)
且
为阈值参数。当
时,
将为退化为符号函数,
将退化为KT。
2.3. 重要引理
引理1:令
表示四个相互独立的正态随机变量。为了简便表示,进一步定义:
(7)
文献[18]推导了下面结果:
(8)
引理2:根据谢泼德定理和文献[18]的推导结论有:
(9)
3. GMM下IKT的统计性质
IKT的均值和方差
定理1:假设
为模型(1)生成的独立同分布的样本。令:
,
,
,
,
当
和
时,IKT的均值和方差如下:
(10)
(11)
其中
为四元高斯累积分布函数,
为四元正态随机变量标准化后行向量,
为四元正态分布相关矩阵,
和
为相应加权因子,具体数值如表1和表2所示,
。
定理1证明:
根据式(6)中
和阶跃函数
的关系:
(12)
代入式(5)化简可得:
(13)
其中:
,
,
,
由上式可得:
(14)
根据独立同分布假设,定义
为
的联合概率密度函数,满足下式:
(15)
其中
和
分别表示式(3)中第一个和第二个正态分布的概率密度函数。令
,
,
,
,且:
(16)
四个随机变量
和
分别服从四个正态二元分布,相关系数分别为:
(17)
其中
和
,
和
为式(2)中噪声间相关性。
Table 1. As
and
approaches infinity, the required amount of
increases
表1. 当
和
趋近于无穷大时
的所需量
|
|
|
|
代表项 |
相关系数矩阵(
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
R1 |
|
|
|
|
|
|
|
1 |
|
|
1 |
|
2 |
R2 |
|
|
|
|
|
|
|
1 |
|
|
1 |
|
3 |
R3 |
|
|
|
|
|
|
|
1 |
|
|
1 |
|
4 |
R4 |
|
|
|
|
|
|
|
-1 |
|
|
-1 |
|
5 |
R5 |
|
|
|
|
|
|
|
-1 |
|
|
-1 |
|
6 |
R6 |
|
|
|
|
|
|
|
-1 |
|
|
-1 |
|
7 |
R7 |
|
|
|
|
|
|
|
|
|
|
|
|
8 |
R8 |
|
|
|
|
|
|
|
|
|
|
|
|
9 |
R9 |
|
|
|
|
|
|
|
-1 |
|
|
-1 |
|
10 |
R10 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
11 |
R11 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
12 |
R12 |
|
|
|
|
|
|
|
|
|
|
|
|
13 |
R13 |
|
|
|
|
|
|
|
|
|
|
|
|
14 |
R14 |
|
|
|
|
|
|
|
|
|
|
|
|
15 |
R15 |
|
|
|
|
|
|
|
1 |
|
|
1 |
|
16 |
R16 |
|
|
|
|
|
|
|
|
|
|
|
|
17 |
R17 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
18 |
R18 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
19 |
R19 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
20 |
R20 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
21 |
R21 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
22 |
R22 |
|
|
|
|
|
|
|
0 |
0 |
0 |
0 |
|
注:
是相关矩阵的缩写。符号
表示相关矩阵
,
。
表示由式(3)的高斯分量产生,
表示由式(3)的脉冲分量产生,
,
,
。
由式(16)和式(17)可得:
(18)
当
和
时,根据式(9)和式(14)可得:
,
,
,
。
其中
为二元高斯累积分布函数。
与
只有
不同,分别为:
,
,
。
类似地,分别求出
代入式(14)化简可得式(10)。
根据方差的定义:
(19)
其中:
,
。
对于
有:
(20)
对于
有:
(21)
根据均值可求得
,现只需要求
。以
为例,令:
,
基于独立同分布假设,可以将
展开为:
其中:
,
,
。
显然,
是
形式的项的四重求和,可以改写为22个四变量正交概率的线性组合,即:
(22)">
进一步地,根据概率密度函数定义有:
(23)">
则:
(24)">
其中
,
为相应的加权常数因子、
为加权子集基数,
为四元正态分布相关矩阵,取值如表1所示。
取值如表2所示。同理对于
中的其他项,表1相同,只有表2中的均值项不同,由此可求得
等项概率和,代入式(10),结合式(19)和式(21)化简可得式(11)。
4. 虚警概率和检测概率表达式
虚警概率和检测概率表达式推导
根据中心极限定理,当样本量足够大时,
分布近似为正态分布。因此,给定检测阈值
,虚警概率和检测概率如下式:
(25)
(26)
其中,
和
为零假设下
的均值和方差;
和
为备择假设下
的均值和方差;高斯累积分布函数
定义为:
(27)
若规定虚警概率
,则可通过式(25)求得相应的阈值
为:
(28)">
通过式(26)进一步计算相应的检测概率
为:
(29)">
5. 数值实验与结论
5.1. 数值实验
Table 2.
represents the values of the quadrivariate standard normal row vector
表2.
代表项对应的四元正态变量标准化行向量的值
代表项 |
均值
|
标准差
|
R1 |
h |
h |
h |
h |
|
|
|
|
R2 |
h |
h |
h |
h |
|
|
|
|
R3 |
h |
h |
h |
h |
|
|
|
|
R4 |
h |
h |
h |
h |
|
|
|
|
R5 |
h |
h |
h |
h |
|
|
|
|
R6 |
h |
h |
h |
h |
|
|
|
|
R7 |
h |
h |
h |
h |
|
|
|
|
R8 |
h |
h |
h |
h |
|
|
|
|
R9 |
h |
h |
h |
h |
|
|
|
|
R10 |
h |
h |
h |
h |
|
|
|
|
R11 |
h |
h |
h |
h |
|
|
|
|
R12 |
h |
h |
h |
h |
|
|
|
|
R13 |
h |
h |
h |
h |
|
|
|
|
R14 |
h |
h |
h |
h |
|
|
|
|
R15 |
h |
h |
h |
h |
|
|
|
|
R16 |
h |
h |
h |
h |
|
|
|
|
R17 |
h |
h |
h |
h |
|
|
|
|
R18 |
h |
h |
h |
h |
|
|
|
|
R19 |
h |
h |
h |
h |
|
|
|
|
R20 |
h |
h |
h |
h |
|
|
|
|
R21 |
h |
h |
h |
h |
|
|
|
|
R22 |
h |
h |
h |
h |
|
|
|
|
本节旨在1) 通过蒙特卡罗模拟验证式(10)和式(11)的正确性。2) 在双通道随机信号检测的背景下,比较不同阈值下IKT与KT的ROC曲线。3) 比较IKT、MFD、PCC和KT的ROC曲线,并使用trapz函数计算ROC曲线下面积,以进行量化分析。为了不失一般性,信号采用由标准正态分布生成的高斯信号,噪声的均值为零,脉冲参数
。
图1验证了小样本零假设下定理1的正确性,左边为零假设下均值,右边为零假设下的方差值,其中虚线代表理论值,实心点代表仿真值,实验参数
,
,
,
,
。由图1可以看出观测值与定理1的理论结果吻合得很好。
图2验证了大样本备择假设下定理1在模型(1)下的正确性,左边为备择假设下均值,右边为备择假设下的方差值,其中虚线代表理论值,实心点代表仿真值,实验参数
,
,
,
,
。由图2可以观察出观测值与定理1的理论结果吻合得很好。
Figure 1. Verification of Theorem 1 under the null hypothesis
图1. 零假设下定理1的验证
Figure 2. Verification of Theorem 1 under the alternative hypothesis
图2. 备择假设下定理1的验证
图3为IKT在阈值
下和KT在高斯噪声下ROC曲线比较,其中参数
,
,
,
,
。由图3可以得出在高斯噪声下IKT的ROC曲线优于KT。
图4为IKT在阈值
下和KT、MFD在脉冲噪声下ROC曲线比较,其中参数
,
,
,
,
。由图4可以得出在脉冲噪声下MFD完全失效(ROC曲线近似为对角线),IKT的ROC曲线优于KT。
Figure 3. Comparison of ROC Curves under impulsive noise
图3. 高斯噪声下ROC曲线比较
Figure 4. Comparison of ROC Curves under mixed gaussian noise
图4. 脉冲噪声下ROC曲线比较
图5为IKT在高斯噪声和脉冲噪声环境下与MFD、PCC和KT的ROC曲线比较。左图为高斯噪声下四种检测器的性能比较,右图为脉冲噪声下四种检测器的性能比较。其中参数
,
,左图
,右图
,
。蒙特卡罗次数为106次,信号强度为
。由图5可以得出IKT在含相关性高斯噪声的信号检测中相较于PCC和KT在ROC曲线上的表现有显著提升。在含相关性脉冲噪声的信号检测中,IKT同样优于PCC和KT,进一步验证了其优越性。
表3为图5四种检测器通过trapz函数计算ROC曲线下面积(AUC)值。
Table 3. AUC values of the four detectors under Gaussian noise and impulse noise
表3. 四种检测器在高斯噪声和脉冲噪声下AUC值
|
MFD |
PCC |
KT |
KTF |
高斯噪声 |
0.91230 |
0.74625 |
0.82743 |
0.87615 |
脉冲噪声 |
0.50025 |
0.83203 |
0.90434 |
0.92030 |
Figure 5. Comparison of ROC curves for four detectors
图5. 四种检测器ROC曲线比较
5.2. 结论
本文基于高斯混合模型(GMM),在KT的基础上引入了硬限幅函数,提出了一种具有可调节阈值的统计量IKT,并建立了IKT均值和方差的封闭表达式,该检测器在脉冲噪声环境下的双通道信号检测中表现出显著的应用价值,并在实际应用中具有广泛的实用性。此外,本文还比较了IKT与PCC、KT和MFD的接收机工作特性(ROC)曲线及其曲线下面积(AUC)方面的表现,探讨了IKT在双通道随机信号检测中的可行性。理论推导和实验结果表明,当噪声存在相关性时,IKT在高斯噪声环境下优于PCC,而在脉冲噪声环境中,其检测性能比MFD、PCC和KT更为出色。这一发现不仅在相关分析领域,尤其在存在脉冲噪声的随机信号检测领域,提供了与经典MFD互补的新方法和新视角。
基金项目
本文研究工作由国家自然科学基金项目(62171141, 2024A1515011803)资助。
NOTES
*通讯作者。