基于SSAE-LSTM的无人机时–空域频谱预测研究
Research on Spatio-Temporal Spectrum Prediction for UAVs Based on SSAE-LSTM
DOI: 10.12677/hjwc.2025.153006, PDF, HTML, XML,    国家自然科学基金支持
作者: 李鹏达, 陈佳美, 王宇鹏:沈阳航空航天大学电子信息工程学院,辽宁 沈阳;周晓达:中国航空工业集团公司沈阳飞机设计研究所,辽宁 沈阳
关键词: 无人机频谱预测时–空域频谱预测堆叠稀疏自编码器长短期记忆网络UAV Spectrum Prediction Temporal-Spatial Spectrum Prediction Stacked Sparse Auto-Encoder Long Short-Term Memory Network
摘要: 无人机等用频设备的激增使得本就有限的频谱资源变得更加稀缺。采用认知无线电技术,认知无人机如果可以在频谱感知之前进行准确的频谱预测,则可以很大程度提高频谱利用率。现有的针对固定节点的预测方法不能反应高度动态的无人机频谱预测的空间变化属性。本文提出一种基于堆叠稀疏自编码器(SSAE)与长短期记忆网络(LSTM)的无人机时–空域频谱预测方法(SSAE-LSTM),使用真实测量的频谱数据集进行频谱预测。首先,建立时–空域系统模型,将无人机历史实际测量的频谱数据作为底层数据输入SSAE逐层训练,获取频谱隐藏特征表达。然后,将提取的特征序列输入到LSTM网络中进行无人机频谱的长期预测。实验结果表明,所提出的方法能够有效预测认知无人机通信环境中的频谱使用情况,在预测精度和预测误差方面优于现有的无人机频谱预测方法。
Abstract: With the proliferation of frequency-using devices such as unmanned aerial vehicles (UAVs), the already limited spectrum resources have become even scarcer. By employing cognitive radio technology, cognitive UAVs can significantly improve spectrum utilization if they can accurately predict the spectrum before spectrum sensing. Existing prediction methods for fixed nodes fail to capture the spatial variation attributes of highly dynamic UAV spectrum prediction. This paper proposes a temporal-spatial spectrum prediction method for UAVs based on Stacked Sparse Auto-encoder (SSAE) and Long Short-Term Memory (LSTM) networks (SSAE-LSTM), using real-measured spectrum datasets for spectrum prediction. Firstly, a temporal-spatial system model is established, the historical and actual spectrum data measured by UAVs is input into the SSAE for layer-by-layer training to obtain the hidden feature representation of the spectrum. Then, the extracted feature sequences are input into the LSTM network for long-term spectrum prediction for UAVs. Experimental results demonstrate that the proposed method can effectively predict the spectrum usage in cognitive UAV communication environments, outperforming existing UAV spectrum prediction methods in terms of prediction accuracy and prediction error.
文章引用:李鹏达, 陈佳美, 周晓达, 王宇鹏. 基于SSAE-LSTM的无人机时–空域频谱预测研究[J]. 无线通信, 2025, 15(3): 45-58. https://doi.org/10.12677/hjwc.2025.153006

1. 引言

在6G通信技术中,为了全面挖掘和利用各种频段的频谱资源,提出了包括空中、地面和太空在内的全方位互联互通的愿景。无人机作为这一体系中不可或缺的一环,其与通信网络的高效整合变得至关重要。无人机的高效通信能力对于实现6G时代的智能万物互联具有决定性的作用[1] [2]。无人机的普及给救灾、紧急救援、交通和监测等带来了新的解决方案。同时,也带来了严峻的技术挑战。无人机的数量急剧增加,导致本就有限的频谱资源变得更加稀缺。无人机主要在L频段、S频段以及工业、科学和医疗(Industrial Scientific Medical, ISM)频段上进行通信。这意味着,它们需要在多个热门技术领域内与其他设备共享频谱资源,例如与WiFi、蓝牙以及IEEE 802.15.4等网络技术争夺频段使用权[3] [4]

认知无线电与无人机的集成是解决频谱短缺和赋予无人机高度智能的有效措施。无人机的部署灵活、机动性高、视距通信链路强,被认为是对天地一体化信息网络的重要补充[5]。然而,无人机作为认知用户进行通信仍然面临几个问题。首先,频谱共享和动态频谱接入被认为是提高频谱使用效率的有前途的解决方案[6],而准确感知频谱状态是实现这两者的关键步骤。然而,实际的硬件条件,例如感知灵敏度和感知能量有限,限制了频谱感知的速度与范围。此外,在一些特殊场景,如自然灾害中,快速的频谱感知过程变得极为重要。因此,为了加快感知速度,降低感知能量消耗,无人机频谱预测被提出,它能够有效利用历史频谱数据中的可用信息,通过预测主用户的频谱使用模式和频谱占用趋势,避免在主用户活跃时与其使用相同的频段,减少潜在的频谱冲突,从而提高频谱感知性能,提高整个网络容量[7]

现有的无人机频谱预测研究一般可以分为模型驱动方法和数据驱动方法。代表性的模型驱动方法包括自回归、动态规划等方法。例如,文献[8]使用自回归与移动平均方法进行频谱预测,通过分析时间序列中过去值与未来值的线性关系来预测未来频谱值。文献[9] [10]提出了自回归移动平均与自回归积分移动平均方法来进一步提高预测精度,该模型结合两个平均方案的特点,通过同时考虑频谱中的过去值和误差项来提高预测精度。同时,该模型增加了差分操作使其在预测时能更好地适应数据变化。然而,这些模型驱动方法的频谱数据是基于理论假设生成的,换句话说,是频谱数据之间的关系是预先被设定好的,这就导致算法的准确性受限于模型假设与现实世界的吻合度。同时,这种方法大多实现一步预测,多步预测性能不高。

近年来,许多频谱监测实验的进行使得大量的频谱数据得以被获取。这为使用数据驱动方法学习频谱数据之间的真实关系提供了可能性。越来越多的研究人员开始利用真实获取的频谱数据,进行频谱数据的隐含信息挖掘,同时开发数据驱动方法进行更加符合实际环境的频谱预测。数据驱动方法主要包括传统机器学习(Machine Learning, ML)方法与深度学习(Deep Learning, DL)方法。与模型驱动方法相比,ML方法提供了更加灵活的解决方案。文献[11] [12]使用支持向量机(Support Vector Machine, SVM)和支持向量回归(Support Vector Regression, SVR)进行频谱预测,通过在高维空间中寻找最佳的超平面来预测连续的频谱值。此外,文献[13]使用了基于隐马尔可夫模型(Hidden Markov Model, HMM)的预测方法,这是一种平稳方法。主要是针对静止或低速移动的地面用户设计的。在此基础上,利用隐二元马尔可夫模型(Hidden Bilingual Markov Model, HBMM)和高阶隐马尔可夫模型对隐马尔可夫模型进行改进[14]。以上方法虽然属于数据驱动且能够进行多步预测,但往往针对地面用户设计,地面用户的位置通常被认为固定不变,即只需要捕获时间上的频谱依赖性。换言之,上述大多数方法都只基于一维时域分析。事实上,无人机用户是运动的,信道特性具有复杂的时间–空间依赖性,应该同时捕获这两方面的频谱特征,即信道的状态应该是时间–空间相关的[15],单纯的一维模型对于高度动态的无人机频谱预测存在缺陷。

深度学习作为数据驱动方法中的一种,是机器学习的分支,可以较好解决频谱数据高维特征捕获问题。例如,文献[16] [17]使用长短期记忆网络(Long Short-Term Memory, LSTM)来学习频谱的时间依赖性。此外,高玉龙等人文献[18]中引用了LSTM和Seq-to-Seq建模,并设计了多频道多步频谱预测模型,通过使用Seq-to-Seq的编码器和解码器架构来实现序列到序列的频谱预测。然而,单纯的LSTM,其针对无人机快速动态位置变化的长期频谱预测能力有限。无人机的快速移动使得其在多种不同位置产生海量频谱数据信息,数据量巨大,特征提取困难。同时,无人机的快速动态移动性导致其频谱环境具有高度动态和非平稳特性,即频谱数据是非线性的,单纯的LSTM在捕获非线性隐藏特征方面能力不足[19]

基于此,本文利用真实频谱数据,开发一种数据驱动的SSAE-LSTM (Stacked Sparse Auto-encoder and Long Short-Term Memory)方法,挖掘无人机频谱动态非平稳时间–空间依赖性,实现认知无人机用户的长期频谱预测。本文的主要贡献如下:

1) 考虑到无人机认知用户的快速移动特征会导致信道特性具有复杂的时间–空间依赖性,为同时捕获这两方面的频谱特征,提出一种新的基于二维时–空特征的频谱预测模型,考虑时间和位置之间的相关性,解决一维信息不能充分表示无人机动态频谱特性的问题。与一维模型相比,该模型具有更好的预测效果。

2) 提出基于SSAE-LSTM方法的长期认知无人机动态频谱预测方法。堆叠稀疏自编码器(Stacked Sparse Auto-encoder, SSAE)作为特征提取器可以将高维海量频谱数据降维,输出的低维特征在包含原频谱数据本质特征的同时去除高维信号中的干扰部分,最终逐层提取频谱数据的非线性隐藏特征。LSTM能够处理长期时间依赖问题从而能够预测未来很长一段时间内的频谱使用情况。SSAE与LSTM的结合能够使得频谱数据的时间–空间原始相关性不会被破坏,并且保持非线性复杂度,进而对动态无人机认知用户进行更好的长期频谱预测。

3) 考虑到理论假设生成的频谱数据与实际频谱数据吻合度低,影响算法性能验证,本文使用真实的无人机测量的频谱数据进行大量实验,采用数据驱动方法验证算法性能。结果表明,相对于传统算法,所提SSAE-LSTM方法可以更好预测认知无人机环境中未来的频谱使用情况。

2. 系统模型与问题描述

在某目标区域,考虑一个由A个主用户和D个无人机认知用户形成的认知无线电网络。多个基站同时提供服务,无人机被用于执行特定任务,例如监测、勘察、紧急救援等。基站频谱资源有限,无人机需要通过使用认知无线电技术来预测和获取可以使用的频谱资源,如图1所示。

Figure 1. Cognitive UAV network system model

1. 认知无人机网络系统模型

无人机在执行任务时位置会随之改变,假设无人机在历史时段 T={ 1,,t,,T } 所经历的位置为集合 S={ 1,,s,,S } ,可以占用的频道集合为 F{ 1,,f,,F } ,则 p ( t,s ) ( f ) 表示无人机在t时刻第s个位置上测得的频道f的功率值,其实际上是一个以dBm为单位的三维功率值表达。根据已经测量到的大量历史频谱数据信息,可以预测无人机下一个时刻 T+Δt 在下一个位置 S+Δs 的频谱信息。因此,基于认知无线电的无人机频谱预测问题可以定义为:

p ( T+Δt,S+Δs ) ( f )= argmax p ( T+Δt,S+Δs ) ( f ) P( B ) (1)

其中,

B=( p ( T+Δt,S+Δs ) ( f )| p ( 1,1 ) ( f ),, p ( t,s ) ( f ),, p ( T,S ) ( f ) ) (2)

T是历史频谱数据的总长度,S是历史频谱数据的无人机总位置数, p ( 1,1 ) ( f ),, p ( t,s ) ( f ),, p ( T,S ) ( f ) 是历史测得的频谱功率值, p ( T+Δt,S+Δs ) ( f ) 表示预测的为无人机在T之后 Δt 时刻在位置 S+Δs 的功率值, Δt 为预测步长。

值得注意的是,本文所有的频谱相关数据集均来自北卡罗来纳州立大学的真实频谱监测实验,该数据集记录了无人机在不同位置时的频谱数据,频谱监测高达6 GHz。

3. SSAE频谱数据特征提取

自动编码器(Autoencoder, AE)是由输入层、隐含层、输出层组成的3层对称神经网络,包含编码与解码部分,如图2所示。编码函数将输入数据进行编码,将J维原始数据 X= [ x 1 , x 2 ,, x J ] T J 映射为Y维隐藏向量 H= [ h 1 , h 2 ,, h Y ] T Y 。这是个降维的过程,解码器再将隐藏层的表示逆映射成原始数据,得到重构信号 X ^ = [ x ^ 1 , x ^ 2 ,, x ^ J ] T J 。考虑到无人机所处的环境属于动态强噪声的复杂工作环境,传统AE会出现过拟合现象,因此对隐藏层加入稀疏限制,形成稀疏自编码器(Sparse Auto-encoder, SAE)来控制隐藏层激活单元数,如图3左下方子图所示,被激活的隐藏单元用彩色表示,其他未被激活的隐藏单元用灰色表示。

Figure 2. Schematic diagram of autoencoder (AE)

2. 自动编码器AE原理图

SSAE就是将单独训练的每个SAE的隐藏层堆叠起来,从而学习频谱数据的内部非线性相关性和潜在特征。我们的目标是最小化输出数据与输入数据之间的误差。假设无人机在t时刻与位置s测量的F频段内的频谱测量值 p ( t,s ) 可以表示为:

p ( t,s ) = [ p ( t,s ) ( 1 ), p ( t,s ) ( 2 ),, p ( t,s ) ( F ) ] T (3)

其中, [ · ] T 为转置操作。

T个时隙内所有位置集合 S 的历史频谱数据为:

P={ p ( 1,1 ) , p ( 2,2 ) ,, p ( t,s ) ,, p ( T,S ) } (4)

F 频段内要预测的频谱为:

p ( T+Δt,S+Δs ) = [ p ( T+Δt,S+Δs ) ( 1 ), p ( T+Δt,S+Δs ) (2),, p ( T+Δt,S+Δs ) ( F ) ] T (5)

由于在每个时刻无人机位置均不同,因此ts是同步变化的,即ts数值相等。将该数据作为输入到第一个SAE的初始值,如图3所示,通过编码得到隐藏层作为下一个SAE的输入。依次类推,将M个SAE的隐藏层堆叠起来,形成多层SSAE。假设第 m{ 1,2,,m,,M } 个SAE的输入层节点数为 J m { J 1 ,, J m ,, J M } ,隐藏层的节点数为 Y m { Y 1 ,, Y m ,, Y M } ,则第m个SAE的输入为:

X m = [ x m,1 , x m,2 ,, x m, J m ] T Q m × J m (6)

其中, Q m { Q 1 ,, Q m ,, Q M } 是第m个SAE输入数据集的大小。第m个SAE的编码函数 H m 为:

H m =θ( W m X m + b m ) (7)

其中, θ( · ) 为编码激活函数, W m b m 分别为第m个SAE中编码器的权值和偏重,可以得出隐藏层为:

H m = [ h m,1 , h m,2 ,, h m, Y m ] T Q m × Y m (8)

然后,将 H m 由以下解码函数 X ^ m 映射回原始维度:

X ^ m = θ ( W m H m + b m ) (9)

其中, W m b m 为第m个解码器的权重与偏差, θ ( · ) 为解码激活函数。这里编码和解码激活函数均采用sigmoid激活函数。从而得到重构信号:

X ^ m = [ x ^ m,1 ,, x ^ m,q ,, x ^ m, Q m ] T Q m × J m (10)

单独训练每个SAE的目的是通过不断更新编码器和解码器的权重与偏差来最小化 X m X ^ m 之间的差值,定义损失函数为:

L= m=1 M X m X ^ m 2 +γKL( ρ ρ y m )+λ W 2 (11)

为避免过拟合现象,对隐含层加入稀疏限制,即限制隐藏单元的激活比例。其中, γ 为稀疏系数, KL( ρ ρ y m ) ρ ρ y m 之间的KL散度,能够限制隐藏单元的激活,如图3所示,具体计算如下:

KL( ρ ρ y m )=ρlog ρ ρ y m +( 1ρ )log 1ρ 1 ρ y m (12)

其中, ρ 为目标激活比例, ρ y m 是隐藏层第 y m { 1,2,, y m ,, Y m } 个单元的经验平均激活比例, W={ W m , W m }

Figure 3. Architecture diagram of SSAE-LSTM

3. SSAE-LSTM结构图

按照上述步骤训练每个SAE,并将每个训练好的隐藏层堆叠为下一个SAE的输入层,这样会得到最后一个即第M个SAE的隐藏层:

H M = [ h M,1 , h M,2 ,, h M, Y M ] T (13)

其中, H M Q M × Y M Q M Y M 为第M个SAE的输入数据集的大小以及隐藏层节点数。 H M 中包含频谱数据的隐藏特征,这些特征被输入到LSTM中来进行预测。

4. LSTM频谱预测方案

经过SSAE提取出来的频谱数据特征,通过LSTM预测器来进一步挖掘其潜在关系。LSTM是一种特殊的循环神经网络(Recurrent Neural Network, RNN),它解决了RNN中存在的梯度消失和梯度爆炸等问题。相比于传统的RNN,LSTM通过引入门控单元,能够更好地捕捉和处理序列数据中的长期依赖关系。同时,LSTM引入了更为复杂的结构来维护和更新其内部状态,即细胞状态,结构见图3中的LSTM部分。整个模型包含LSTM层和全连接层,其中,LSTM层包括遗忘门、输入门与输出门。

特征提取器SSAE的输出 H M 作为预测器LSTM的输入,首先经过遗忘门:

g t =θ( W g ·[ h t1 , H M ]+ b g ) (14)

其中, g t 是遗忘门的激活值。 θ( · ) 依然是sigmoid激活函数, h t1 表示LSTM上一个时间步的隐藏状态, W g b g 为当前遗忘门的权重和偏差。经过遗忘门后进入输入门,输入门中包括sigmoid层和tanh层:

i t =θ( W i ·[ h t1 , H M ]+ b i ) (15)

C ˜ t =tanh( W C ·( h t1 , H M )+ b C ) (16)

其中, i t C ˜ t 分别为输入门的激活值与候选记忆单元状态, W i W C 分别为sigmoid层和tanh层的权重, b i b C 分别为sigmoid层和tanh层的偏差。输入门决定什么样的新信息被存放在细胞状态中,细胞状态的更新方法为:

C t = g t C t1 + i t C ˜ t (17)

该式表示前一刻的细胞状态 C t1 被更新为 C t 表示每个元素逐个相乘。

输出门首先经过一个sigmoid层,其激活值为:

o t =θ( W o ·[ h t1 , H M ]+ b o ) (18)

其中 W o b o 是sigmoid层的权重和偏差。然后经过tanh层:

h t = o t tanh( C t ) (19)

其中, h t 是最终的隐藏状态。最后,在每个时间步t,LSTM层将隐藏状态传递到全连接层,即 h t 被送入全连接层,得到:

p ( T+Δt,S+Δs ) = h t ω q + b q (20)

其中, p ( T+Δt,S+Δs ) 是得到的频谱预测值, ω q 是全连接层的权重, b q 是偏差变量,具体算法如表1所示。

对整个模型进行训练后,认知无人机用户就可以使用此模型对未来的频谱情况进行预测。与传统的方法相比,SSAE-LSTM更加适合应用于现实情况,用于训练预测模型的频谱数据同时包含了频谱的时间与无人机的空间位置两方面信息。鉴于自编码器的特性,不再需要手动设置标签就可以实现模型的训练,并且SSAE-LSTM不需要频谱的先验信息,更加贴合实际环境。

Table 1. Algorithm: SSAE-LSTM-Based spectrum prediction method for cognitive UAVs

1. 算法:基于SSAE-LSTM的认知无人机频谱预测方法

算法

1:输入:历史频谱数据 P

2:输出:无人机下一时刻 T+Δt 下一位置 S+Δs 的频谱预测数据: p ( T+Δt,S+Δs )

3:参数设置:滑动窗口长度 T ,SAE的数量 M ,SAE隐藏节点数 Y m ,LSTM的数量 N ,LSTM隐藏节点数 K n ,迭代次数 τ ,学习率 η ,微调迭代 τ σ ,微调率 η σ ,预测未来步长数 Δt

4:for 1il do

5: 构建具有 L α 个节点的输入层和 L β 个节点的隐藏层的SAE;

6: if i=1 then

7: L α =T L β = Y 1

8: else

9: L α = J m L β = Y m

10: 前一层的隐藏单元 H m1 设置为当前层 H m 的输入。

11: end if

12:end for

13:初始化SAE,生成 W m , W m , b m = b m =0

14:for 1nτ do

15: 得到编码函数 H m H m =f( W m X m + b m )

16: 计算解码器的输出: X ^ m = f ( W m H m + b m )

17: 计算误差并更新 W m , W m , b m , b m

18:end for

19:将SSAE的输出用作预测器的输入。

20:for 1n τ σ do

21: 计算预测器的输出;

22: 计算误差;

23: 调节 η σ 来更新权重与误差。

24:end for

25:end

5. 实验结果与分析

本节使用来自北卡罗来纳州利大学频谱监测实验测量的无人机通信频谱数据来评估SSAE-LSTM方法的性能。该数据集是在城市环境中进行的频谱监测实验。无人机每天飞至400英尺的高空,从中午至下午九点,频谱监测高达6 GHz,每次扫描大约需要1分钟,并且由GPS日志生成无人机的位置信息,以9:1的比例对频谱序列进行网络训练和测试。为了使得算法能更好的学习到频谱之间的依赖关系,利用Z-score归一化方法将原始数据集归一化为均值为0且方差为1的数据集。在结果评估中,将预测值反归一化为正常值。

SSAE-LSTM的超参数设置为:SAE的数量,隐藏层节点数分别为256与128,LSTM隐藏层层数为3,隐藏节点为{256, 128, 64},最大迭代次数为400,每个批次包含的样本数为350,学习率为0.001,使用Adam优化器用于提高模型的收敛速度。将所提SSAE-LSTM与以下三种方法进行对比:

1) RNN:循环神经网络,用于[20]中的频谱预测模型。

2) LSTM:一种RNN的变体,用于多通道多步频谱预测[21]

3) COVNLSTM:具有卷积结构的LSTM [18]

为了评估SSAE-LSTM方法的预测性能,本文使用以下评估指标:平均绝对误差(Mean Absolute Error, MAE),平均绝对百分比误差(Mean Absolute Percentage Error, MAPE),均方根误差(Root Mean Squared Error, RMSE),其定义分别如下:

MAE( Δt )= 1 Δt k=1 Δt | p ^ k ( f ) p ( T+Δt,S+Δs ) k ( f ) | (21)

MAPE( Δt )= 100% Δt k=1 Δt | p ( T+Δt,S+Δs ) k ( f ) p ^ k ( f ) p ^ k ( f ) | (22)

RMSE( Δt )= 1 Δt k=1 Δt | p ^ k ( f ) p ( T+Δt,S+Δs ) k ( f ) | 2 (23)

其中, p ^ k ( f ) p ( T+Δt,S+Δs ) k ( f ) 分别是 Δt 范围内的真实频谱测量值与预测频谱数据值。

Figure 4. Curve of MAE performance with prediction time

4. MAE性能随预测时间变化曲线

Figure 5. Curve of MAPE performance with prediction time

5. MAPE性能随预测时间变化曲线

Figure 6. Curve of RMSE performance with prediction time

6. RMSE性能随预测时间变化曲线

图4~6分别显示了RNN,LSTM,COVNLSTM与SSAE-LSTM四种算法在30 mins~180 mins内的频谱预测性能MAE、MAPE与RMSE的比较结果。可以看出,RNN算法的MAE、MAPE与RMSE性能均为最差,这是由于RNN的参数是共享的,在多次连乘之后会出现梯度消失或者梯度爆炸问题,因此RNN在处理长序列时难以捕捉到长期依赖关系,因此性能不佳,尤其在180 mins时性能更差。相比之下,其它模型的性能相对稳定。LSTM理论上比较擅长挖掘长期依赖关系,但在实践中,当输入序列太长且存在冗余时,LSTM学习能力受其模型本身限制难以较好训练模型。COVNLSTM在LSTM基础上通过其内置的卷积操作,能够有效捕获来自多个维度的信息,从而学习多维特征。尽管COVNLSTM结合了多种先进技术,具有强大的学习能力,但其复杂的网络结构同时也带来了处理高维数据时的高计算成本。与卷积不同,SSAE采用逐层训练方法,可以在不破坏原始频谱数据相关性的情况下提取隐藏特征。通过获取的特征,同时结合LSTM预测器可以完全捕获准确的频谱特征信息。因此,SSAE-LSTM在三个误差指标方面都显示出最好的泛化性能。

Table 2. Performance comparison of different methods

2. 不同方法的性能比较

方法

MAE (db)

MAPE

RMSE (db)

RNN

0.3118

0.27%

0.4608

LSTM

0.2727

0.24%

0.4445

CONVLSTM

0.2813

0.24%

0.4325

SSAE-LSTM

0.2404

0.21%

0.3792

具体的,表2列出了SSAE-LSTM算法与其它三种经典预测方法在预测范围 Δt=180mins 时MAE、RMSE与MAPE的具体数值,预测带宽为60 MHz。可以看出,SSAE-LSTM比其它方法在预测误差指标方面有着更好的性能。相比于RNN与LSTM,SSAE-LSTM的RMSE分别下降了17.7%与14.6%。与COVNLSTM相比,SSAE-LSTM的MAE下降了14.5%,RMSE下降了12.3%,MAPE下降了10.6%。SSAE-LSTM的性能得到明显改善的系统模型设置方面的原因在于,前面三种经典算法只考虑捕获数据的时间依赖关系,没有考虑到无人机位置之间的空间依赖性。事实上,无人机用户的运动性导致其在不同位置的频谱特性是不同的,即信道状态是时–空相关的,如果只单一考虑频谱的时间相关性将不能完全体现无人机信道的频谱变化特征。尤其是COVNLSTM算法在经过第一次卷积操作之后,数据中的时间相关性也随之消失,从而影响了其预测性能。与之相比,SSAE-LSTM方案构建了一种二维时–空预测模型,考虑时间和位置之间的相关性,能在不破坏原始频谱数据的前提下充分提取数据的潜在特征,因此,与一维模型相比,其取得了更好的预测效果。

图7~9分别给出了SSAE-LSTM算法在 Δt=120mins 时不同频率下的MAE、MAPE与RMSE值。可以看出,三种性能均可以达到96%的值在不同频率下均保持稳定,这表明SSAE-LSTM的预测性能是稳定可信的。这种稳健性的增强源自SSAE的融入,它弥补了单一LSTM在捕获复杂非线性潜在特征方面的局限。具体而言,无人机的高速动态特性导致其频谱环境极为多变且非平稳。尽管LSTM模型在处理具有长期时间依赖性的数据时表现出色,但在应对非平稳信号及提取非线性潜在特征方面却力不从心。此外,无人机快速移动过程中在不同位置生成的频谱数据量庞大,单独使用LSTM难以从这些海量数据中有效提取关键特征。通过引入SSAE,可以将高维且庞大的频谱数据降维处理。SSAE的输出是低维特征,这些特征不仅保留了原始频谱数据的本质信息,还能够去除高维信号中的冗余和干扰成分。这样,SSAE与LSTM的结合能够逐层深入,有效提取出频谱数据中的非线性潜在特征。简而言之,SSAE的加入为处理无人机频谱数据的复杂性和动态性提供了一个强有力的工具,使得模型能够准确捕获和分析数据中的关键信息,从而使得算法在长期预测中仍然具有良好的稳定性。

Figure 7. MAE performance in different frequency bands

7. 不同频段下的MAE性能

Figure 8. MAPE performance in different frequency bands

8. 不同频谱信道的MAPE性能

Figure 9. RMSE performance in different frequency bands

9. 不同频段下的RMSE性能

Figure 10. Predicted vs. true values at different frequency bands for Δt=120mins

10. Δt=120mins 不同频段下的预测值与真实值对比

图10所示为 Δt=120mins 时的SSAE-LSTM频谱预测值与实测频谱数据值的比较情况。本文使用真实的无人机测量频谱数据进行大量实验。实测频谱数据中包含各种不确定性和噪声。由图9可以看出SSAE-LSTM频谱预测值与实测频谱数据值在不同频率下的长时间统计结果吻合度均比较高,表明SSAE-LSTM频谱预测算法能够快速学习如何适应和应对这些不确定性。同时,图9中的实测数据验证真实地反映出SSAE-LSTM算法在实际应用中的表现,避免了由于模型假设与现实世界不符而导致的算法性能高估或低估,进而增强了算法的可信度和说服力。

6. 结论与未来工作

本文提出基于SSAE-LSTM的深度学习神经网络,通过捕获无人机认知用户所处环境中频谱数据的时间与空间位置之间的依赖关系来解决长期频谱预测问题。SSAE-LSTM通过SSAE以无监督的方式提取隐藏特征,然后利用LSTM预测器根据基本特征实现无人机认知用户的频谱预测。与模型驱动方法不同,SSAE-LSTM不需要任何频谱的先验信息,也不需要任何外部特征提取算法,而是通过融合SSAE的监督学习与LSTM的无监督学习,在不增加手动标记数据的劳动力成本情况下提高算法预测性能。实验结果表明,SSAE-LSTM方法相比于其它算法性能更优。另外,在无人机需要跨越不同通信场景时,频谱数据的分布可能会发生改变,这种情况下所提出的长期频谱预测可能会失败。未来的工作可以考虑将迁移学习与所提算法相融合,当无人机需要跨不同场景时,迁移学习可以相应调整模型参数来适应不同频谱场景。

基金项目

国家自然科学基金(61501306)、辽宁省教育厅基金(LJKMZ20220519, LJKMZ0220526)、沈阳市自然科学基金专项(23-503-6-18)、学校科研基金(2019-1-ZZLX-07)。

参考文献

[1] 中国工信部IMT-2030(6G)推进组. 6G总体愿景与潜在关键技术白皮书[R/OL].
https://www.caict.ac.cn/kxyj/qwfb/ztbg/202106/P020210604552572072895.pdf, 2021-06-04.
[2] Laghari, A.A., Jumani, A.K., Laghari, R.A. and Nawaz, H. (2023) Unmanned Aerial Vehicles: A Review. Cognitive Robotics, 3, 8-22.
https://doi.org/10.1016/j.cogr.2022.12.004
[3] Ding, R., Zhou, F., Wu, Q. and Ng, D.W.K. (2024) From External Interaction to Internal Inference: An Intelligent Learning Framework for Spectrum Sharing and UAV Trajectory Optimization. IEEE Transactions on Wireless Communications, 23, 12099-12114.
https://doi.org/10.1109/twc.2024.3387980
[4] Umebayashi, K., Kasahara, Y., Iwata, H., Al-Tahmeesschi, A. and Vartiainen, J. (2023) Spectrum Occupancy Prediction Based on Adaptive Recurrent Neural Networks. 2023 IEEE Wireless Communications and Networking Conference (WCNC), Glasgow, 26-29 March 2023, 1-6.
https://doi.org/10.1109/wcnc55385.2023.10118623
[5] Fan, B., Li, Y., Zhang, R. and Fu, Q. (2020) Review on the Technological Development and Application of UAV Systems. Chinese Journal of Electronics, 29, 199-207.
https://doi.org/10.1049/cje.2019.12.006
[6] Liu, L., Shafiq, M., Sonawane, V.R., Murthy, M.Y.B., Reddy, P.C.S. and Reddy, K.M.N.C.K. (2022) Spectrum Trading and Sharing in Unmanned Aerial Vehicles Based on Distributed Blockchain Consortium System. Computers and Electrical Engineering, 103, Article ID: 108255.
https://doi.org/10.1016/j.compeleceng.2022.108255
[7] Luo, H., Cao, K.T., Qian, P. and Deng, F. (2020) Research Progress of Spectrum Prediction Techniques in Cognitive Radio Networks. Journal of Technology, 20, 71-78.
[8] Mosavat-Jahromi, H., Li, Y., Cai, L. and Pan, J. (2021) Prediction and Modeling of Spectrum Occupancy for Dynamic Spectrum Access Systems. IEEE Transactions on Cognitive Communications and Networking, 7, 715-728.
https://doi.org/10.1109/tccn.2020.3048105
[9] Liu, J., Isufi, E. and Leus, G. (2019) Filter Design for Autoregressive Moving Average Graph Filters. IEEE Transactions on Signal and Information Processing over Networks, 5, 47-60.
https://doi.org/10.1109/tsipn.2018.2854627
[10] Ozyegen, O., Mohammadjafari, S., Kavurmacioglu, E., Maidens, J. and Bener, A.B. (2020) Experimental Results on the Impact of Memory in Neural Networks for Spectrum Prediction in Land Mobile Radio Bands. IEEE Transactions on Cognitive Communications and Networking, 6, 771-782.
https://doi.org/10.1109/tccn.2019.2958639
[11] Wang, Y., Zhang, Z., Ma, L. and Chen, J. (2014) SVM-Based Spectrum Mobility Prediction Scheme in Mobile Cognitive Radio Networks. The Scientific World Journal, 2014, Article ID: 395212.
https://doi.org/10.1155/2014/395212
[12] Shuiping Ni, and Shuqun Shen, (2011). Frequency Spectrum Access Mechanism of Cognitive Radio Based on Spectum Prediction. IET International Conference on Communication Technology and Application (ICCTA 2011), Beijing, 14-16 October 2011, 556-560.
https://doi.org/10.1049/cp.2011.0730
[13] Radhakrishnan, N., Kandeepan, S., Yu, X. and Baldini, G. (2021) Performance Analysis of Long Short-Term Memory-Based Markovian Spectrum Prediction. IEEE Access, 9, 149582-149595.
https://doi.org/10.1109/access.2021.3125725
[14] Luo, S., Zhao, Y., Xiao, Y., Lin, R. and Yan, Y. (2021) A Temporal-Spatial Spectrum Prediction Using the Concept of Homotopy Theory for UAV Communications. IEEE Transactions on Vehicular Technology, 70, 3314-3324.
https://doi.org/10.1109/tvt.2021.3062462
[15] Zhang, Q.X., Luo, S., Liu, H.B. and Lin, R.P. (2022) A Spectrum Prediction Method Based on Two-Dimensional Hidden Markov Model for UAV Communications. 2022 19th International Computer Conference on Wavelet Active Media Technology and Information Processing (ICCWAMTIP), Chengdu, 16-18 December 2022, 1-5.
https://doi.org/10.1109/iccwamtip56608.2022.10016483
[16] Wang, X., Peng, T., Zuo, P. and Wang, X. (2020) Spectrum Prediction Method for ISM Bands Based on LSTM. 2020 5th International Conference on Computer and Communication Systems (ICCCS), Shanghai, 15-18 May 2020, 580-584.
https://doi.org/10.1109/icccs49078.2020.9118535
[17] Lin, F., Chen, J., Sun, J., Ding, G. and Yu, L. (2020) Cross-band Spectrum Prediction Based on Deep Transfer Learning. China Communications, 17, 66-80.
https://doi.org/10.23919/jcc.2020.02.006
[18] Gao, Y., Zhao, C. and Fu, N. (2021) Joint Multi-Channel Multi-Step Spectrum Prediction Algorithm. 2021 IEEE 94th Vehicular Technology Conference (VTC2021-Fall), Norman, 27-30 September 2021, 1-5.
https://doi.org/10.1109/vtc2021-fall52928.2021.9625078
[19] Pan, G., Wu, Q., Ding, G., Wang, W., Li, J., Xu, F., et al. (2023) Deep Stacked Autoencoder-Based Long-Term Spectrum Prediction Using Real-World Data. IEEE Transactions on Cognitive Communications and Networking, 9, 534-548.
https://doi.org/10.1109/tccn.2023.3254524
[20] Khunteta, S. and Chavva, A.K.R. (2021) Recurrent Neural Network Based Beam Prediction for Millimeter-Wave 5G Systems. 2021 IEEE Wireless Communications and Networking Conference (WCNC), Nanjing, 29 March-1 April 2021, 1-6.
https://doi.org/10.1109/wcnc49053.2021.9417509
[21] Zuo, P., Wang, X., Linghu, W., Sun, R., Peng, T. and Wang, W. (2018) Prediction-Based Spectrum Access Optimization in Cognitive Radio Networks. 2018 IEEE 29th Annual International Symposium on Personal, Indoor and Mobile Radio Communications (PIMRC), Bologna, 9-12 September 2018, 1-7.
https://doi.org/10.1109/pimrc.2018.8580726