深度学习驱动的盲信号分离:技术进展与展望
Deep Learning-Driven Blind Signal Separation: Technical Advances and Perspectives
摘要: 盲信号分离(BSS)旨在无需先验信息的前提下,从混合信号中提取独立源信号。传统方法如独立成分分析(ICA)和非负矩阵分解(NMF)受限于线性假设与统计依赖性,难以应对复杂场景中的非线性混合、动态环境适应及高噪声鲁棒性问题。近年来,深度学习技术通过数据驱动策略与非线性建模能力,显著提升了BSS的性能,尤其在时频域分离(如卷积神经网络CNN)、全局特征建模(如Transformer架构)及多模态融合中取得突破。然而,模型泛化能力不足、计算复杂度高、可解释性缺失及隐私安全风险仍是主要挑战。本文系统梳理了深度学习赋能BSS的技术路径,分析了现存瓶颈,并展望了多模态深度融合、自监督学习及边缘计算部署等未来方向,为推动BSS在医疗、通信等领域的实用化提供参考。
Abstract: Blind Signal Separation (BSS) aims to extract independent source signals from mixed signals without a priori information. Traditional methods such as Independent Component Analysis (ICA) and Nonnegative Matrix Factorization (NMF) are limited by linear assumptions and statistical dependencies, which make it difficult to cope with nonlinear mixing, dynamic environment adaptation, and high-noise robustness problems in complex scenes. In recent years, deep learning techniques have significantly improved the performance of BSS through data-driven strategies and nonlinear modeling capabilities, especially making breakthroughs in time-frequency domain separation (e.g., convolutional neural network CNN), global feature modeling (e.g., Transformer architecture), and multimodal fusion. However, insufficient model generalization capability, high computational complexity, lack of interpretability, and privacy and security risks are still the main challenges. In this paper, we systematically sort out the technical paths of deep learning-enabled BSS, analyze the existing bottlenecks, and look forward to the future directions of deep multimodal fusion, self-supervised learning, and edge computing deployments, which will provide references to promote the utility of BSS in the fields of healthcare, communication, and so on.
文章引用:林兴俊, 刘佳慧, 石荣欣, 何选森. 深度学习驱动的盲信号分离:技术进展与展望[J]. 光电子, 2025, 15(3): 47-55. https://doi.org/10.12677/oe.2025.153005

1. 引言

图1所示[1],盲信号分离(Blind Signal Separation)作为信号处理领域的关键研究课题,其核心目标是在缺乏源信号先验信息及系统混合机制的前提下,从未知混合过程中提取出相互统计独立的原始信号分量。

传统方法依赖于信号统计独立性或非负性等强假设,但在实际复杂场景中面临三大局限:1) 对非线性混合过程的建模能力不足;2) 依赖先验知识难以适应动态环境;3) 高噪声环境下鲁棒性显著下降[2]

正是传统方法在非线性建模能力、环境适应性及噪声鲁棒性方面存在的固有缺陷,促使研究者将目光转向了深度学习。深度学习技术凭借其强大的非线性映射能力[3]、数据驱动[4]的学习范式以及自动特征提取[5]的优势,能够有效克服传统方法的局限性,为复杂场景下的BSS问题提供了新的解决思路。

Figure 1. Target for blind signal separation

1. 盲信号分离的目标

当前深度学习赋能的BSS技术沿着两大技术路径发展,分别是生成式模型驱动的分离框架[6]、判别式模型[7]的架构创新。但是其依然面临许多瓶颈,如实际场景泛化能力不足[8]、计算复杂度与实时性需求存在矛盾[9]、多模态信号联合分离机制尚未突破[10]等。

尽管如此,深度学习技术在盲信号分离方面依然展现出卓越的性能,盲信号分离技术未来的发展前景非常可观。

2. 盲信号分离的理论基础

自Herault和Jutten提出开创性理论以来[11],盲信号分离领域已涌现出大量创新性研究成果,学者们从多维视角提出了众多具有实用价值的分离算法。

独立分量分析(Independent Component Analysis, ICA)是常用的盲信号分离算法。它基于原始信号相互独立的假设,通过优化目标函数找到合适的分离矩阵,进而实现将混合信号分解为独立源信号的功能[12]

主成分分析(Principal Component Analysis, PCA)仅利用二阶统计量(协方差矩阵),假设成分间线性不相关而非独立,其优势在于降维和去噪[13]。然而,PCA无法分离非高斯分布的源信号,因为它忽略高阶统计信息[14]

在盲信号分离领域,高阶统计量(Higher-Order Statistics, HOS)算法占有重要地位。事实上,BSS算法的早期工作是从高阶统计量算法开始的。这类算法利用源信号高阶统计量的性质来分离信号,除了要求源信号具有统计独立性外,还要求源信号中最多只能有一个高斯信号,即利用源信号的非高斯性。而对于源信号的非白特性及非平稳特性没有做任何考虑[15]

综上所述,ICA、PCA、HOS等经典BSS方法虽然在特定条件下有效,但其对线性混合模型和强统计独立性(或非负性)假设的依赖,以及在处理高噪声干扰时的显著不足[16],严重制约了其在复杂现实场景中的应用。这些理论和方法论上的瓶颈,正是深度学习技术凭借其数据驱动[4]的非线性建模能力[3]得以在BSS领域取得革命性进展的关键背景。

3. 基于深度学习的盲信号分离方法

正是因为经典盲信号分离方法的局限性共同制约了在复杂环境下的适用性,研究人员开始寻求更强大、更有效的技术来突破这种困境,而这时,深度学习凭借其强大的自动特征学习能力、对复杂数据模式的高度适应性[18],成功突围。深度学习中的卷积神经网络、循环神经网络等技术,能够自动学习信号的复杂特征,有望克服传统方法的不足,实现更精准、高效的盲信号分离,这也促使了深度学习在盲信号分离领域的广泛探索与应用。

3.1. 时频域分离技术

时频域分离技术在处理具有时间与频率双重特性的信号时,能够有效地将信号分解到不同的时频区域,从而更好地理解和分析信号的特性[19]

卷积神经网络(Convolutional Neural Networks, CNN)是深度学习的代表算法之一。在时频域分离技术的应用场景中,CNN可以被用来自动学习信号在不同时间点和频率段上的特征表示[20]

通过将信号转换为时频图,再利用CNN进行训练,模型可以学会识别出特定的音素、乐器声或其他有意义的模式。这种能力使得CNN不仅能够实现平移不变分类,还能适应信号在时频域内的各种变化,从而提高识别的准确性和鲁棒性[21] [22]

此外,CNN的深层结构允许它捕捉到更复杂的特征组合,这对于解决实际应用中的复杂问题尤为重要。比如,在医疗领域,通过对心电图(ECG)信号进行时频域分析,并使用CNN进行特征学习和分类,可以帮助医生更准确地诊断心脏疾病[23]

综上所述,卷积神经网络凭借其强大的表征学习能力和对空间结构数据的处理优势,在时频域分离技术中发挥着不可替代的作用,推动了相关领域的研究和应用不断向前发展。

3.2. 全局特征建模与Transformer架构

基于Transformer的全局特征建模技术彻底改变了传统序列数据处理范式,其核心在于通过自注意力机制突破传统模型的局部感知局限[24]。在Vaswani等学者提出的原始Transformer架构中,自注意力网络通过计算序列元素间的相关性权重,实现了任意位置间的直接信息交互。这种全连接式的关联建模,使得模型能够捕捉长距离依赖关系,建立起覆盖整个输入序列的全局特征表征[25]

Figure 2. SepFormer architecture

2. SepFormer架构

经典卷积网络由于局部感知野的本质特性,存在空间信息捕获范围的局限性,通常需要构建深层架构拓展其感知域[26]。相比之下,基于注意力机制的Transformer架构在单层计算中即可建立跨时序的长程依赖关系,虽然带来输入序列长度的平方级运算开销,但成功构建了真正意义上的全局交互网络[27]。这种技术特性在语音识别领域表现出显著优势,比如SepFormer架构(如图2所示)结合CNN的局部特征提取和Transformer的全局建模能力,能够有效提取混合音频中多说话人的全域声学指纹特征,最终达成高精度的语音流分离效果[28]

这种全局建模能力使Transformer在时序数据处理中展现出显著优势。相较于循环神经网络的串行计算模式,Transformer的并行计算架构大幅提升了训练效率。更重要的是,全局特征建模突破了传统模型对数据局部性的依赖,在自然语言处理、语音识别、生物序列分析等领域都展现出更强的上下文理解能力[27]。比如在语音识别任务中,SepFormer达到SOTA性能(如表1所示),验证了Transformer架构在处理复杂声学场景中的有效性[28]

Table 1. The experimental results of each model on the WSJ0-3mix dataset

1. 各模型在WSJ0-3mix数据集上的实验结果

Model

SI-SNRi

SDRi

参数量

ConvTasnet

12.7

13.1

5.1 M

DualPathRNN

14.7

n.a

2.6 M

VSUNOS

16.9

n.a

7.5 M

Wavesplit

17.3

17.6

29 M

Wavesplit + DM

17.8

18.1

29 M

Sepformer

17.6

17.9

26 M

Sepformer + DM

19.5

19.7

26 M

3.3. 深度学习模型性能的理论对比

深度学习模型凭借其强大的非线性建模能力[3]和数据驱动[4]的学习范式,已显著推动了盲信号分离(BSS)技术的发展。然而,不同的深度学习架构在核心性能指标(如分离精度、泛化能力)上展现出不同的理论特性。本小节旨在从理论层面系统对比主流深度学习模型(以CNN、Transformer为代表)的性能特征。核心性能指标的理论对比见表2

Table 2. Theoretical comparison of core performance indicators

2. 核心性能指标的理论对比

模型

核心 性能指标

CNN

Transformer

分离精度 (Separation Accuracy)

卷积神经网络的核心优势在于其局部连接和权值共享特性,使其理论上非常擅长捕捉信号在时频域上的局部相关性和空间/频谱模式。其通过多层卷积和池化操作构建的层级特征表示,能够有效建模线性或轻度非线性卷积混合过程,在噪声环境下也表现出较强的局部特征鲁棒性。然而,标准CNN的感受野受限于卷积核尺寸和网络深度,难以有效建模信号中存在的长时程依赖关系,在处理此类问题时分离精度可能受限[29]

Transformer架构的核心在于自注意力机制(Self-Attention Mechanism)。该机制理论上允许模型直接计算序列中任意两个元素之间的关联权重,从而实现对全局上下文信息的高效建模。这使得Transformer在处理需要强长时依赖关系的信号时,理论上能提供比CNN更优的分离精度,尤其能避免因感受野不足导致的分离结果片段化问题。其强大的特征表示能力也有助于建模更复杂的非线性混合。但自注意力机制的计算复杂度与输入序列长度的平方成正比,在处理高分辨率和频谱图或长序列信号时,计算负担显著增加[30]

泛化能力(Generalization Capability)

CNN的泛化能力高度依赖于训练数据的充分性和多样性。其参数较多,在训练数据有限或与测试环境差异较大时,容易出现过拟合风险,导致泛化性能下降。迁移学习和数据增强技术可以在一定程度上缓解此问题[31]

Transformer强大的表示能力使其理论上具有学习更通用特征的潜力。然而,这种能力也使其对数据分布的变化更为敏感。如果预训练数据或目标任务数据不能充分覆盖应用场景的多样性,其泛化能力可能反而不如结构更简单的CNN。其庞大的模型容量也增加了在小样本或领域偏移情况下过拟合的风险。自监督学习被理论认为是提升Transformer泛化能力的重要方向,因为它能利用大量无标签数据学习信号的本质表示[32]

4. 技术挑战与现存问题

虽然基于深度学习的盲信号分离技术在语音增强[33]、通信系统优化[34]等领域展现出巨大潜力,但其发展仍面临多重技术瓶颈与理论挑战。当前研究的核心矛盾集中于模型复杂性与泛化能力的博弈,同时计算效率、可解释性、安全性、数据依赖性等问题共同构成技术突破的多维障碍。

4.1. 模型复杂性与泛化能力的矛盾

深度神经网络的性能提升通常依赖于模型深度与参数规模的扩展。然而,参数数量的指数级增长与模型泛化能力之间存在显著矛盾[35]。一方面,复杂网络结构通过增加基函数数量和函数嵌套层次提升特征表达能力,但过深的网络会导致梯度消失、训练不稳定等问题[36]。实验表明,在总参数量固定的情况下,过度增加低层参数会降低模型测试准确率,而高层参数的合理扩展更有利于性能提升[37]。另一方面,盲信号分离任务中普遍存在数据稀疏性问题[38]

4.2. 可解释性缺失与理论瓶颈

当前深度学习驱动的盲信号分离方法存在严重的“黑箱”特性。传统盲信号分离理论基于独立分量分析(ICA)、稀疏表示等可解释性较强的数学模型[39],而深度网络通过多层非线性变换实现特征隐式学习,其决策机制难以追溯[40]

4.3. 隐私安全与鲁棒性挑战

复杂模型带来的隐私泄露风险在敏感领域应用中不容忽视。盲信号分离技术常用于医疗信号分析[41]等场景,其训练数据包含大量隐私信息。研究发现,深度神经网络的记忆特性可能导致训练数据重构攻击[42],而分布式训练中的参数更新过程存在信息泄露通道[43]。此外,对抗样本攻击对深度分离模型构成严重威胁:微小扰动即可破坏相位谱重构过程[44],导致语音信号出现不可逆失真。

4.4. 数据依赖与标注瓶颈

虽然深度学习是数据驱动,但高质量、大规模、标注精确的多通道混合信号数据集(尤其是真实场景、多模态数据)的获取极其困难且成本高昂。监督学习依赖标签(理想源信号),而无监督学习以及自监督学习虽然前景广阔,但其在BSS中的性能和稳定性仍需大幅提升[45]-[47]

5. 结论与展望

盲信号分离作为信号处理的核心课题,致力于从混合数据中提取独立源信号,其应用贯穿医疗[48]、安防[49]等多个领域。传统方法如独立成分分析受限于线性假设与统计依赖性,在复杂场景中表现乏力[2]。深度学习的引入革新了BSS范式,通过数据驱动[4]策略与非线性建模能力[3],显著提升了动态环境下的分离精度与鲁棒性,尤其在多模态融合中展现出跨模态协同的独特优势[50]

为了突破现有瓶颈并创造更高学术价值,亟需在以下具体技术路径上进行创新算法设计与理论探索,本文的提议见表3

Table 3. The proposal in this article

3. 本文的提议

提议

目标与动机

创新设想

潜在优势

面向动态环境与未知场景的自适应元学习框架

针对模型泛化能力不足、难以适应动态环境(如未知说话人数、变化的噪声/混响条件)的核心挑战。

探索基于元学习(Meta-Learning)的自适应BSS框架。该框架在训练阶段学习一个“学习策略”,使其能够在仅接触少量新场景样本后,快速调整模型参数或分离策略。

减少对新场景标注数据的依赖,实现快速在线适应,解决传统模型在新场景下性能骤降的问题。

融合信号先验的可解释轻量级Transformer架构

同时应对计算复杂度高和可解释性缺失的挑战,特别是在资源受限的边缘设备部署场景。

设计深度信号先验(Deep Signal Priors)嵌入的轻量化Transformer变体。

在保持或接近SOTA性能的同时,大幅降低计算开销和内存占用,并提升模型决策透明度,便于故障诊断与模型优化。

基于跨模态对比学习的多模态自监督预训练

深化多模态融合方向,并缓解数据稀疏性/标注成本高的问题,为多模态BSS提供强大的通用特征提取器。

提出面向多模态BSS的自监督对比预训练范式。利用大规模未配对的多模态数据,设计新颖的跨模态对比学习(Cross-Modal Contrastive Learning)代理任务。

有效利用海量无标签多模态数据,学习对下游任务有益的鲁棒跨模态对齐表示,减少对昂贵标注数据的依赖,提升多模态分离的性能上限。

展望未来,BSS技术需协同信息论[51]、微分几何[52]等理论工具,发展轻量化架构与自适应算法,推动声学分离[53]、生物医学解析[48]等场景的实用化。随着深度学习与多模态感知的持续演进,BSS有望成为智能系统的核心使能技术,为跨领域应用提供更精准、高效的解决方案。

致 谢

本研究得以顺利完成,离不开通讯作者何选森教授的悉心指导与无私教诲。何教授以渊博的学识为课题指明方向,以严谨的治学态度为团队树立标杆,其言传身教令全体成员受益匪浅。衷心感谢林兴俊同学在数据分析及论文撰写过程中提供的专业指导,您作为科研引路人的智慧与热忱,始终是我们攻坚克难的基石。

本研究团队由一群初入科研殿堂的新人组成。在实验室的无数个日夜中,我们曾因数据波动而彻夜难眠,也因突破瓶颈而击掌相庆。从仪器操作的生疏到独立完成实验的从容,从文献阅读的困惑到学术思维的逐渐成型,每一步成长都凝聚着团队成员间的互帮互助与执着坚持。这段并肩作战的经历,让我们深刻体会到科研不仅是探索真理的旅程,更是携手同行的修行。

最后,谨以“木人石腹,不忘初心。此生无二,之死靡她”与诸君共勉——愿我们始终怀揣对科学的赤诚,如木石般坚定沉稳,在求索之路上矢志不渝。

基金项目

这篇论文受到了以下资金的资助:

1) 广东省科技创新战略专项资金(No. pdjh2022b0598);

2) 广东省科技创新战略专项资金(No. pdjh2024a467);

3) 广东省教育厅普通高校特色创新项目(自然科学) (No. 2024KTSCX131)。

NOTES

*通讯作者。

参考文献

[1] Dian 何岭松. 《数字信号分析理论与实践》教学案例集之: 信号的盲源分离和ICA独立成分分析[EB/OL].
https://zhuanlan.zhihu.com/p/692594809, 2025-05-06.
[2] 何丹丹, 刘润杰, 申金媛, 陈园园. 盲信号分离算法综述[J]. 光电子学, 2011(1): 1.
[3] Kurisu, D., Fukami, R. and Koike, Y. (2022) Adaptive Deep Learning for Nonlinear Time Series Models.
https://arxiv.org/abs/2207.02546
[4] Reichstein, M., Camps-Valls, G., Stevens, B., Jung, M., Denzler, J., Carvalhais, N., et al. (2019) Deep Learning and Process Understanding for Data-Driven Earth System Science. Nature, 566, 195-204.
https://doi.org/10.1038/s41586-019-0912-1
[5] Hemanth, D.J. (2021) Automated Feature Extraction in Deep Learning Models: A Boon or a Bane? 2021 8th International Conference on Electrical Engineering, Computer Science and Informatics (EECSI), Semarang, 20-21 October 2021, 3.
https://doi.org/10.23919/eecsi53397.2021.9624287
[6] Reddy, P., Wisdom, S., Greff, K., Hershey, J.R. and Kipf, T. (2023) AudioSlots: A Slot-Centric Generative Model for Audio Separation.
http://arxiv.org/abs/2305.05591
[7] 王景景, 李爽, 杨星海, 吴承安, 郑轶, 鄢社锋, 乔钢, 施威, 张祥光, 郭瑛, 李海涛. 基于机器学习和FFT的盲源分离信源数目并行估计方法[P]. 中国, CN112861066B. 2022-05-17.
[8] 邱媛媛, 王皓辰. 基于深度学习的领域自适应目标检测算法研究[J]. 人工智能与机器人研究, 2024, 13(3): 503-514.
[9] Thompson, N.C., Greenewald, K., Lee, K. and Manso, G.F. (2022) The Computational Limits of Deep Learning.
http://arxiv.org/abs/2007.05558
[10] Li, Y., Daho, M.E.H., Conze, P.H., Zeghlache, R., Boité, H.L., Tadayoni, R., et al. (2024) A Review of Deep Learning-Based Information Fusion Techniques for Multimodal Medical Image Classification.
http://arxiv.org/abs/2404.15022
[11] Detection de grandeurs primitives dans un message composite par une architeture de calcul neuromimetique en apprentissage non supervise.
https://www.researchgate.net/publication/27606213_Detection_de_grandeurs_primitives_dans_un_message_composite_par_une_architeture_de_calcul_neuromimetique_en_apprentissage_non_supervise
[12] Jain, S. and Rai, D. (2012) Blind Source Separation and ICA Techniques: A Review. International Journal of Environmental Science and Technology, 4, 1490-1503.
[13] 苗水清, 闫文耀, 张静, 吴梦蝶. 基于FFT和PCA的图像压缩方法研究[J]. 佳木斯大学学报(自然科学版), 2022, 40(3): 29-32.
[14] 殷玉玲, 罗兰花. 高维数据降维算法综述[J]. 电脑知识与技术, 2025, 21(6): 12-14, 26.
[15] Sadkhan, S.B. and Abbas, N.A. (2009) Higher Order Statistics and Their Roles in Blind Source Separation (BSS). MASAUM Journal of Computing, 1, 227-234.
[16] Lv, S. and Zhang, C. (2014) Blind Signal Separation for Speech Signals with Noise. 2014 IEEE International Conference on Mechatronics and Automation, Tianjin, 3-6 August 2014, 1850-1855.
https://doi.org/10.1109/icma.2014.6885983
[17] 陆维, 吴锡. 基于深度学习的复杂天气场景交通标志检测[J]. 软件导刊, 2025, 24(6): 175-184.
[18] 深度学习: 数据特征与复杂模式的探索[EB/OL]. 百度开发者中心.
https://developer.baidu.com/article/details/1847863, 2025-06-10.
[19] 沈越泓, 苏巧, 袁志刚, 简伟, 黄葆华, 魏以民. 一种分离时频域混合信号的方法[P]. 中国, CN103870875A. 2014-06-18.
[20] 毛琳, 任凤至, 杨大伟, 张汝波. 时频域联合全景分割卷积神经网络及应用[P]. 中国, CN113536905A. 2021-10-22.
[21] Gao, X. and Gao, R. (2025) Music Signal Recognition Aids Based on Convolutional Neural Networks in Music Education. Systems and Soft Computing, 7, Article ID: 200219.
https://doi.org/10.1016/j.sasc.2025.200219
[22] 孙林慧, 王春艳, 张蒙. 基于全卷积神经网络多任务学习的时域语音分离[J]. 信号处理, 2024, 40(12): 2228-2237.
[23] 李端, 张洪欣, 刘知青, 黄菊香, 王田. 基于深度残差卷积神经网络的心电信号心律不齐识别[J]. 生物医学工程学杂志, 2019, 36(2): 189-198.
[24] Li, J., Yan, Y., Liao, S., Yang, X. and Shao, L. (2021) Local-to-Global Self-Attention in Vision Transformers.
http://arxiv.org/abs/2107.04735
[25] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L. and Polosukhin, I. (2023) Attention Is All You Need. Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach, 4-9 December 2017, 6000-6010.
http://arxiv.org/abs/1706.03762
[26] 周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251.
[27] 赖鸣姝. 基于Transformer的自然语言处理模型综述[J]. 人工智能与机器人研究, 2023, 12(3): 219.
[28] Subakan, C., Ravanelli, M., Cornell, S., Bronzi, M. and Zhong, J. (2021) Attention Is All You Need in Speech Separation.
http://arxiv.org/abs/2010.13154
[29] Fan, C., Yuan, X. and Zhang, Y. (2019) CNN-Based Signal Detection for Banded Linear Systems. IEEE Transactions on Wireless Communications, 18, 4394-4407.
https://doi.org/10.1109/twc.2019.2924424
[30] Ranganath, A., Muñoz, J.O., Smith, R., Singhal, M. and Marcia, R. (2024) Image Separation Using Transformer Attention Models. 2024 IEEE International Conference on Future Machine Learning and Data Science (FMLDS), Sydney, 20-23 November 2024, 331-336.
https://doi.org/10.1109/fmlds63805.2024.00066
[31] Wang, H., Wu, X., Huang, Z. and Xing, E.P. (2020) High Frequency Component Helps Explain the Generalization of Convolutional Neural Networks.
http://arxiv.org/abs/1905.13545
[32] Alijani, S., Fayyad, J. and Najjaran, H. (2024) Vision Transformers in Domain Adaptation and Domain Generalization: A Study of Robustness. Neural Computing and Applications, 36, 17979-18007.
https://doi.org/10.1007/s00521-024-10353-5
[33] Guo, P., Yu, M., Shen, L., Lin, Z., An, K. and Wang, J. (2024) Single-Channel Blind Source Separation in Wireless Communications: A Complex-Domain Deep Learning Approach. IEEE Wireless Communications Letters, 13, 1645-1649.
https://doi.org/10.1109/lwc.2024.3384813
[34] Guo, P., Yao, F., Yu, M., Li, C., Tang, Y. and Ning, Z. (2025) Single-Channel Blind Source Separation Empowered Joint Transceiver Optimization for Wireless Communications Using Deep Learning. Digital Communications and Networks.
https://doi.org/10.1016/j.dcan.2025.04.008
[35] 刘学博, 户保田, 陈科海, 张民. 大模型关键技术与未来发展方向——从ChatGPT谈起[J]. 中国科学基金, 2023, 37(5): 758-766.
[36] 陈建廷, 向阳. 深度神经网络训练中梯度不稳定现象研究综述[J]. 软件学报, 2018, 29(7): 2071-2091.
[37] Yue, X.B. (2015) The Influence of the Amount of Parameters in Different Layers on the Performance of Deep Learning Models. Computer Science and Application, 5, 445-453.
https://doi.org/10.12677/csa.2015.512056
[38] 李宁, 陈海庭. 欠定条件下弱稀疏源信号混合矩阵盲估计[J]. 数据采集与处理, 2015, 30(4): 793-801.
[39] Ruiz, H., Jarman, I.H., Martin, J.D., Ortega-Martorell, S., Vellido, A., Romero, E., et al. (2012). Towards Interpretable Classifiers with Blind Signal Separation. The 2012 International Joint Conference on Neural Networks (IJCNN), Brisbane, 10-15 June 2012, 1-7.
https://doi.org/10.1109/ijcnn.2012.6252783
[40] 化盈盈, 张岱墀, 葛仕明. 深度学习模型可解释性的研究进展[J]. 信息安全学报, 2020, 5(3): 1-12.
[41] 解元, 张旭, 邹涛, 马鸽, 孙为军. 面向带混响和噪声环境的心肺音混合信号盲分离[J]. 信息与控制, 2025, 54(1): 150-160.
[42] 汪旭童, 尹捷, 刘潮歌, 徐辰晨, 黄昊, 王志, 张方娇. 神经网络后门攻击与防御综述[J]. 计算机学报, 2024, 47(8): 1713-1743.
[43] 周纯毅, 陈大卫, 王尚, 付安民, 高艳松. 分布式深度学习隐私与安全攻击研究进展与挑战[J]. 计算机研究与发展, 2021, 58(5): 927-943.
[44] 王文萱, 汪成磊, 齐慧慧, 叶梦昊, 张艳宁. 面向深度模型的对抗攻击与对抗防御技术综述[J]. 信号处理, 2025, 41(2): 198-223.
[45] Webster, M.B., Lee, D. and Lee, J. (2025) Self-Supervised Autoencoder Network for Robust Heart Rate Extraction from Noisy Photo-Plethysmogram: Applying Blind Source Separation to Biosignal Analysis.
http://arxiv.org/abs/2504.09132
[46] Mosqueira-Rey, E., Hernández-Pereira, E., Bobes-Bascarán, J., Alonso-Ríos, D., Pérez-Sánchez, A., Fernández-Leal, Á., et al. (2023) Addressing the Data Bottleneck in Medical Deep Learning Models Using a Human-in-the-Loop Machine Learning Approach. Neural Computing and Applications, 36, 2597-2616.
https://doi.org/10.1007/s00521-023-09197-2
[47] Obradovic, D. and Deco, G. (1997) Unsupervised Learning for Blind Source Separation: An Information-Theoretic Approach. 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol. 1, 127-130.
https://doi.org/10.1109/icassp.1997.599567
[48] 杨轩, 王子颖, 张力, 赵恒, 洪弘. 基于盲源分离的多人呼吸信号检测方法[J]. 雷达学报(中英文), 2025, 14(1): 117-134.
[49] 徐光辉, 侯芳芳. 一种用于安防的图像识别方法、系统、终端及存储介质[P]. 中国, CN111832478A. 2020-10-27.
[50] 刘建伟, 丁熙浩, 罗雄麟. 多模态深度学习综述[J]. 计算机应用研究, 2020, 37(6): 1601-1614.
[51] 杨维娜, 裴以建, 蔡光卉, 肖敏. 基于信息论的盲源信号分离[J]. 云南大学学报(自然科学版), 2008, 30(5): 460-464, 471.
[52] Levin, D.N. (2008) Using State Space Differential Geometry for Nonlinear Blind Source Separation. Journal of Applied Physics, 103, Article ID: 044906.
https://doi.org/10.1063/1.2826943
[53] Wang, T., Yang, F. and Yang, J. (2022) Convolutive Transfer Function-Based Multichannel Nonnegative Matrix Factorization for Overdetermined Blind Source Separation. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 30, 802-815.
https://doi.org/10.1109/taslp.2022.3145304