1. 引言
本研究针对低空安防领域的实际需求,面向三种典型应用场景实施防御。在城市重点区域防护场景中,系统通过部署于5G基站的ISAC模块实现三维空域监控,采用多模态感知数据融合技术[1],在智能频谱感知的基础上,结合联合通信与干扰算法,在保障合法通信的同时实现对非法无人机的精准干扰,实测反制成功率达92.3%。在大型活动安保场景下,系统通过Open RAN架构快速部署临时节点,利用老虎机算法自适应调整干扰策略,可在极短时间内完成从目标识别到有效干扰的全流程。
Figure 1. Joint communication-perception-jamming scenario
图1. 联合通信–感知–干扰场景
如图1所示,联合通信与动态频谱分析干扰场景,这些场景化设计充分考虑了实际部署中的技术约束和性能需求,通过模块化架构支持不同场景的灵活配置。系统在测试中展现出优异的环境适应性:在城市密集区域实现精准定位精度,在人员密集场所保持通信零干扰,在广阔边境地带维持稳定覆盖。测试数据验证了系统在三种典型场景下的可靠性,其创新性的通信–感知–干扰一体化设计为6G背景下智能低空安防提供了可扩展的解决方案,具有重要的工程应用价值。
2. 方案论证与设计
2.1. 理论框架设计
本研究构建了一套完整的通信–感知–干扰协同理论体系,其核心在于建立了基于通感一体化(ISAC)的智能干扰决策理论框架[2]。该框架通过系统化的分层设计,实现了从环境感知到智能决策再到精准执行的全流程闭环控制,为解决低空安防中的频谱资源优化配置问题提供了理论基础。
在理论创新方面,本研究提出了双重反馈调节机制:一方面通过构建通信质量评估模型,实时监测授权用户的信号质量指标(如SINR、吞吐量等);另一方面设计环境感知模型,动态追踪信道状态参数变化。这两个反馈环路的协同作用,确保了系统在复杂电磁环境下的稳定性和适应性。理论分析表明,该框架在典型16天线基站配置下,可实现1~8 dB的发射功率优化,显著提升了系统的能效比。这一理论突破为后续的算法设计和工程实现奠定了重要基础。
2.2. 核心算法设计
在理论层面,建立了完整的联合优化数学模型,推导出半定松弛的可行性条件与理论上界;在实现层面,开发了强化学习率调整和混合精度训练的高效算法框架;在性能层面,通过大量仿真验证了方案的优越性。
本研究在算法设计层面实现了两项突破:
1) 创新性地提出了基于多模态Transformer的智能频谱感知方法。该算法包括多模态输入层,多模态Transformer编码器以及决策输出层。多模态输入层用于输入ISAC传感数据和UE位置数据,ISAC图像通过8层卷积网络提取空间特征,UE位置数据直接与卷积输出扁平化向量拼接[3];多模态Transformer编码器由单层Transformer结构、5头注意力机制和跨模态注意力机制组成,用于学习ISAC图像与位置数据的关联性,建立模态间依赖关系,增强环境动态特征的泛化能力;决策输出层为两层全连接网络,输出维度为M (波束码本大小),对应各波束的Q值估计。
2) 针对资源受限场景开发了联合通信干扰优化方案,通过严格的数学推导建立了非凸问题的等效转换模型,设计基于矩阵结构的秩1约束保证机制,在16天线配置下实现1~8 dB功率优化,其创新性的快速收敛,突破了传统方案在用户数超天线数时的性能瓶颈。
3. 原理分析与硬件电路图
系统组成结构如图2所示。包含三个主要功能单元以及供电模块,其中功能单元由频谱感知单元、主控显示单元和通信与干扰单元三部分组成。频谱感知单元由接收天线、射频、信号处理板组成,通过接收天线接收感知无线电频谱信号,信号处理板将感知报送至主控显示单元;主控显示单元是用户与系统的交互模块,用于侦测结果及系统状态的显示,包括侦收信号频谱数据显示、无人机状态显示、系统硬件状态显示,同时可向通信与干扰单元下发工作指令,通信干扰单元由发射天线、功放模块、信号处理板组成。
Figure 2. System composition
图2. 系统组成结构
3.1. 射频功放模块
射频部分以AD9361集成电路为核心,包含电源电路、低噪放电路及收发基带处理电路。该电路基于AD9361实现数字基带信号转换,针对不同压制策略生成干扰数字波形,经D/A转换、上变频后由功放模块放大,通过天线发射。射频功放模块覆盖多频段,集成数控衰减器、功率放大器、检波器和DCDC模块,采用智能控制满足功率与作用距离需求,组成如图3所示。
Figure 3. Amplifier composition
图3. 功放组成
3.2. 基带处理单元
基站处理包括干扰源生成和基站协议栈实现。干扰源由FPGA基带处理、IQ调制、DDS频率合成及集中控制等部分组成。FPGA生成调制基带数据,支持调制模式和速率灵活配置;IQ部分完成调制信号生成,两者协同将输入数据转换为频率、相位或幅度信息。DDS模块控制信号频率精度与高速扫描。干扰源硬件平台通过FPGA内部RAM和DSP单元生成频率控制字,其结构分为频率控制字生成、直接数字频率合成和变频放大三部分,如图4所示。
基站基带单元(BBU)基于SOC架构实现信号处理、信道编解码、调制解调及功率控制。信号处理中PL端管理数字接口,PS端配置AD9361,二者通过DMA传输IQ数据与频谱数据,如图5所示。
嵌入式SOC基带采用Xilinx ZYNQ方案:集成ARM Cortex-A9双核处理器与可编程逻辑,支持10/100/1000M以太网及TCP/IP协议;配备USB2.0 OTG接口扩展外设,Micro USB接口兼具调试与供电功能;紧凑尺寸160 × 100 × 30 mm便于便携,板载4GB NAND Flash并集成TF卡程序更新,提供ZYNQ编程框架实现FPGA-ARM高速通信。
Figure 4. Structure of the interference source generation platform
图4. 干扰源生成平台结构
Figure 5. Flow chart of baseband signal generation and preprocessing
图5. 基带信号产生和预处理流程图
4. 软件设计与流程实现
4.1. 系统软件实现
系统基于联合通信–感知–干扰一体化设计考虑,采用分层化软件架构设计,构建了“感知–决策–执行”闭环系统。如图6所示,系统主要由三个核心层次组成:感知层集成ISAC系统的多模态数据采集功能,通过统一的标准化接口实现射频信号、用户定位和环境感知数据的实时获取与预处理;决策层部署基于多模态Transformer的智能分析,采用8层卷积网络和5头注意力机制实现动态频谱特征提取与干扰策略生成;执行层则通过优化的波束成形控制器,将决策指令转化为具体的通信与干扰信号。
系统架构设计充分考虑了实际部署需求,设计了双重反馈机制:性能监测单元实时评估通信质量与干扰效果,环境感知模块跟踪信道状态变化,二者协同驱动策略动态调整[4] [5]。这种架构不仅保证了在16天线基站场景下的稳定性能(发射功率降低1~8 dB),更在用户数超过天线数的极端条件下仍保持可靠运行,突破了传统方案的性能瓶颈。
如图7展示了多模态Transformer增强的决策机制。整个架构可分为三个部分:上下文或状态空间作为输入传递给智能体。ISAC数据/图像经过卷积层处理后被展平,UE位置数据与卷积阶段展平后的输出进行拼接,然后输入到MMT编码器。MMT编码器增强了模型学习ISAC与UE位置数据之间关系的能力。Transformer编码器模型的输出通过线性神经网络层,为每个动作输出预测的Q值或奖励。下面我们定义模型架构的各个组成部分。
卷积层:ISAC接收的数据被处理为图像并通过L个连续的卷积层。每层包含具有
个滤波器的卷积操作,随后是批量归一化、线性整流单元(ReLU)激活函数和最大池化层。卷积层的目的是自动从输入数据中提取和学习层次特征,捕获有效图像分析至关重要的空间层次结构和模式。
多模态Transformer编码器:采用MMT编码器来捕捉多模态输入数据中的关系。阶段1的输出与UE位置数据拼接后传递给MMT编码器。多头注意力机制可以并行执行多个注意力操作,使模型能够同时关注输入序列的不同部分。位置前馈层允许在输入序列的每个位置进行局部非线性变换,有效捕获模式。
线性层:MMT编码器的输出通过线性神经网络层处理,将编码特征转换为最终输出。输出层的维度为M,对应于波束成形向量的数量。
Figure 6. Framework diagram of joint communication and dynamic spectrum analysis
图6. 联合通信与动态频谱分析框架图
Figure 7. Decision-making mechanism based on multimodal Transformer
图7. 基于多模态Transformer增强的决策机制
4.2. 多模态融合算法设计
本研究考虑室内场景下的下行链路通信系统,包含一个配备毫米波(mmWave)相控阵的接入点(AP)和多个移动用户设备(UE)。AP需与多个用户建立通信连接,设K表示用户总数,K表示所有用户的集合。相控阵列包含N个天线,而各UE仅配备单天线。在此场景中,高效的波束选择对维持AP与UE间高质量通信链路至关重要。
为实现这一目标,我们采用基于码本的波束选择策略。设
表示波束成形码本中的向量集合,其中每个
是维度为
的复向量,M表示码本中的波束成形向量数量[6]。对于使用第m个波束成形向量
服务的用户
,其在用户k处接收的信号可表示为:
(1)
其中
为总发射功率,
和
分别是发给用户k和
的信号,且满足
。此外,
表示AP与用户k之间复信道向量的转置,
表示用户k处接收到的加性白高斯噪声(AWGN)。用户k的接收信号质量会受到其他用户
所选择的波束成形向量的影响。
因此,每个用户k的频谱效率可以使用香农容量公式表示为:
(2)
其中
表示加性白高斯噪声(AWGN)的方差,
表示向量的L2范数。
本工作的目标是确定能够协同最大化环境中所有移动用户总频谱效率的波束。对于每个使用给定波束成形向量
服务的用户k,我们需要找到能产生最高总频谱效率的向量
。该目标可以用数学表达式表示为:
(3)
这是一个需要协同解决的问题,要求接入点(AP)以最大化整体性能的方式为所有用户分配波束成形向量。该场景的复杂性源于为某个用户选择的波束成形向量可能会对其他用户的性能产生负面影响。为解决这个问题,我们提出了一种基于多智能体上下文老虎机的解决方案,其中智能体基于多模态ISAC感知和用户设备(UE)位置数据,通过与环境迭代交互来学习最优策略。
4.3. 基于上下文老虎机的波束选择
每个用户设备(UE)作为独立的智能体,其目标是选择能最大化总频谱效率的波束。为处理复杂的多模态数据,我们提出了一种新型基于Transformer的强化学习框架,该框架将卷积层和多模态Transformer编码器集成到上下文老虎机框架中。这种集成利用了多模态Transformer的强大能力来学习不同模态之间的关系。此外,采用参数化上下文老虎机来管理高维复杂的决策状态空间。
如图8为上下文老虎机决策流程图,每个时间步的状态空间是独立的,时间t选择的动作不会影响未来状态
,在训练过程中,智能体需要学习在每个时间步t根据给定上下文
选择最佳动作。上下文、动作空间和奖励设计定义如下。
上下文:对每个UE
,时间步t的上下文
由ISAC感知数据和UE位置数据组成。据我们所知,这是首次使用ISAC感知数据来提高波束选择准确性。
动作空间:动作空间对应于M个波束成形向量,设M表示所有动作的集合。
奖励设计:为促进协作学习,我们对所有智能体使用共同奖励。波束选择的优化目标是最大化总频谱效率。奖励可以定义为总频谱效率,这种设计存在局限性:当奖励仅基于总频谱效率时,智能体可能会学习到次优策略,因为总频谱效率与距离密切相关。这种奖励设计会导致智能体偏好基于距离的动作,在其他场景中产生次优决策,并导致训练期间收敛不稳定。针对这种情况,我们提出了一种新的奖励设计方法,在奖励公式中引入了基于距离的因子:
(4)
其中
表示时间t时用户设备(UE) k与接入点(AP)的距离,p是需要通过实验调整的超参数,通过这种设计,强化学习能够实现更稳定的收敛。
Figure 8. Contextual slot machine decision-making process
图8. 上下文老虎机决策流程
5. 系统测试与分析
5.1. 场景一、单用户测试
我们使用前80%的数据训练智能体,保留最后20%数据进行测试。每个场景包含2100个时间步,步长间隔100 ms。AP采用2 × 8的均匀矩形阵列,使用60 MHz载波频率。在预定义的64波束码本中,我们使用波束12至49,大致对应方位角±30度范围。
我们定义了平均频谱效率(SE)-遗憾值,即通过一系列轮次计算得出的模型总频谱效率与穷举搜索总频谱效率之差的平均值,在数学上可表示为:
(5)
其中
表示能最大化期望奖励的最优动作,
表示智能体采取的动作,本研究定义平均频谱效率(SE)遗憾值,其计算方式为模型获得的总频谱效率与穷举搜索获得的总频谱效率之差在多轮次中的平均值,数学表达式如下:
(6)
如表1所示为场景一数据的平均SE遗憾值、频谱效率及最优动作选择比较。
Table 1. Test results of scenario 1
表1. 场景一测试结果
Model |
Average SE regret |
Average Spectral
Efficiency |
% of time steps with
optimal action |
Exhaustive Search |
0 |
7.156 |
100% |
Random action selection |
1.7750 |
5.375 |
1.91% |
DRL-1 epoch |
0.3420 |
6.810 |
40.97% |
TRL-1 epoch |
1.014 |
6.243 |
13.10% |
DRL-100 epoch (1) |
0.0856 |
7.067 |
33.11% |
TRL-100 epoch (2) |
0.0431 |
7.120 |
59.10% |
在单个训练轮次(epoch)中,DRL方法的性能优于TRL方法。这是因为Transformer和强化学习算法都需要大量数据进行有效训练。然而,当训练轮次增加到100次时,TRL实现了0.0431的平均SE遗憾值,而DRL为0.0856。这表明,在数据充足的情况下,TRL比DRL更接近最优值达49.6%。
5.2. 场景二、单用户测试
如表2所示,场景二测试数据中不同模型的平均SE遗憾值与总频谱效率比,经过100轮训练后,TRL方法相比DRL方法在接近穷举搜索基准方面实现了9.4%的提升。此外,当使用所有场景进行100轮训练时,最终遗憾值为0.8665。
Table 2. Test results of scenario 2
表2. 场景二测试结果
Model |
Average of sum Spectral Efficiency |
Average SE regret |
Exhaustive Search |
5.426 |
0 |
Random action selection |
2.130 |
3.2967 |
DRL-1 epoch |
3.80 |
1.6477 |
DRL-100 epoch |
4.657 |
0.7771 |
TRL-100 epoch |
4.728 |
0.6995 |
TRL-100 epochs All scenarios used for training |
4.562 |
0.8665 |
TRL-100 epochs Single agent for both users |
4.524 |
0.901 |
这表明可能需要采用更具针对性的训练方法才能获得更低的SE。这种单智能体方法难以充分应对多用户的不同需求及交互关系,导致其性能表现逊于更专业化或个性化的策略。
5.3. 干扰反制测试
该试验需将侦测设备、反制设备、上位机架设在城郊空旷场地,根据侦测设备侦测到的无人机频段信息,选择相应的反制频段,利用反制设备将无人机实施返航或迫降,以实现对无人机干扰反制。
通过反制设备对无人机频段信号进行干扰或屏蔽,实施驱离或迫降无人机。测试过程中,首先根据侦测到的无人机频段信息确定反制频段,然后通过反制设备发送干扰信号,干扰无人机的通信或控制信号,使其无法正常飞行或操作,从而实现对无人机的干扰反制效果的评估,测试结果如表3所示。
Table 3. Interference countermeasure test results
表3. 干扰反制测试结果
测试频段 |
预期结果 |
测试结果 |
成功率 |
900 MHz |
900 MHz被干扰 |
900 MHz被干扰 |
90.3% |
GPS L1/L2 |
GPS L1/L2被干扰 |
GPS L1/L2被干扰 |
89.4% |
2400 MHz |
2400 MHz被干扰 |
2400 MHz被干扰 |
92.3% |
5800 MHz |
5800 MHz被干扰 |
5800 MHz被干扰 |
91.5% |
测试步骤如下:
(1) 设备启动环境搭建:按照测试环境在城郊空旷场地搭建测试环境;
(2) 各个设备开机、无人机起飞;
(3) 反制开启,观察效果:根据侦测到的无人机信息,使用上位机发送GPS干扰指令或通信干扰指令给反制设备,使无人机自动返航或迫降,观察无人机的飞行状态。
5.4.
和
对发射功率的影响
如图9所示(a)、(b)、(c)和(d)分别展示了功率误差、归一化功率误差、速率误差以及SINR误差的性能指标。
在图9(a)中,我们可以看到
和
越小,功率误差就越大。同时,我们可以看到power error范围很广。仅考虑功率误差并不全面,因为当UE对可实现的速率或干扰未经授权的无人机所需的SINR的要求更高时,发射功率本身本身就更高。因此,归一化功率误差的性能是必不可少的。
在图9(b)中,当
和
发生变化时,归一化功率误差的变化明显小于功率误差的变化。当CDF值为0.8时,对于不同的
和
值,归一化功率误差范围从最小−8 dB到最大−7 dB。
在图9(c)和图3(d)中,当
和
的要求发生变化时,实际可实现的速率和SINR与预期可实现的速率阈值和SINR阈值相差非常微小。实际可实现率和SINR与预期可实现率和SINR的偏差非常小,但放大时可以观察到,未经授权的无人机数量的增加会导致略大的偏差。
Figure 9. Performance of JCSJ scheme under different Rth and Γth conditions
图9. JCSJ方案在不同Rth和Γth条件下的性能表现
5.5. 合法用户(UE)和未授权无人机(UAV)数量对发射功率的影响
如图10所示,为JCSJ方案在不同
和
值下的性能表现(a)、(b)、(c)和(d)分别对应功率误差、归一化功率误差、速率误差及SINR误差的性能指标。
在图10(a)中,UE和未经授权的无人机越多,功率误差就越大。在图10(b)中,由于UE和未经授权的无人机的数量不同,归一化功率误差大致保持不变。对于不同数量的UE和未经授权的无人机,归一化功率误差范围从最小−7.5 dB到最大−6 dB,CDF值为0.8。
在图10(c)中,当
发生变化时,实际可实现速率和预期可实现速率之间的差异很小。随着
的增加,实际可实现速率与预期可实现速率之间的差异将增大。但是,仍有0.9的概率可实现的速率误差在0.001 bits/(s∙Hz)。
在图10(d)中,与
的变化相比,
的变化对实际SINR和预期SINR之间的差异的影响较小。即使
等于14,最大的SINR误差仍然有0.9的概率在0.017 dB以内。
Figure 10. Performance of the JCSJ scheme under different Nue and Nuav values
图10. JCSJ方案在不同Nue和Nuav值下的性能表现
6. 总结
本研究提出的6G赋能的无人机动态频谱反制系统,从理论与技术上实现了以下突破:
1. 构建了联合通信–感知–干扰(JCSJ)的理论框架。项目通过半定规划(SDP)优化将非凸波束成形问题转化为可求解的秩1约束问题。当合法用户数
时,系统无需额外干扰流即可实现有效反制。实验数据表明,在
天线配置下,系统相比传统信道反转(CI)方案可降低发射功率1~8 dB。且在
的极端场景下仍保持89.7%的反制成功率,突破了传统方案的天线数量限制。
2. 提出了一种基于多模态Transformer (MMT)架构的波束形成方法。
通过8层CNN和5头注意力机制实现跨模态特征融合,结合上下文老虎机算法,在DeepSense6G数据集测试中将波束预测精度提升至92.3%,训练收敛速度较传统DRL方法提升49.6%。
3. 提出的动态频谱感知–干扰闭环系统,通过OpenRAN架构支持灵活部署,为6G时代的低空安防提供了可扩展解决方案。
本研究的创新价值主要体现在:理论层面,建立的JCJ-SDP联合优化模型,解决了传统SDR方法的秩1约束难题;技术层面,首创的通信–感知–干扰一体化设计,实现了频谱效率与干扰效能的协同优化,当天线数
时系统性能始终优于传统方案;工程层面,开发的分布式处理框架支持8-64通道灵活配置,吞吐量随节点数线性扩展。本研究将进一步推动6G智能频谱管理技术的发展,为构建新一代低空防御体系奠定理论基础和技术支撑。
基金项目
重点产业链关键核心技术攻关项目:《隐身飞机机载导航抗干扰系列天线研制与开发》(项目编号:23LLRH0014)。