两种基于自适应投影次梯度的多址MIMO非线性均衡算法设计
Design of Two Multi-Access MIMO Nonlinear Equalization Algorithms Based on Adaptive Projected Subgradient
摘要: 多输入多输出(MIMO)系统是现代通信技术的核心组成部分,其中多址MIMO信道的研究具有关键意义。在多址MIMO信道中,发射端与接收端的多天线配置虽有效提升了传输速率和系统容量,但信号传输过程中存在的多用户干扰等问题,导致信道呈现显著的非线性特性,这给MIMO系统的非线性均衡带来了极大挑战。现有基于自适应投影次梯度法的核自适应多元回归算法,虽能一定程度上应对上述问题,却存在稀疏处理能力不足、计算复杂度偏高的缺陷。为此,本文聚焦多址MIMO系统均衡需求,以QPSK调制信号为研究载体,提出两种算法。首先针对传统回归算法的参数耦合问题,引入二元分类思想,将信道均衡问题转化为信号类别判别问题,进而提出多址MIMO核自适应二元分类算法。该算法突破传统回归范式的桎梏,显著提升计算效率,验证了回归转分类思路的可行性。进一步针对该算法依赖核矩阵运算的瓶颈,引入随机傅里叶特征近似传统核计算,提出多址MIMO基于随机傅里叶特征的自适应二元分类算法。该算法实现非线性问题的线性化转换,进一步降低计算复杂度。两种算法通过复值信号预测向实部与虚部类别判别的转化,既保留了核方法对信道非线性的拟合能力,又规避了传统回归算法的参数耦合问题,为QPSK调制下的多址MIMO系统信号均衡提供了新的解决方案,奠定了实验基础。实验结果表明,所提两种算法相较于现有方法均显著提升计算效率,且后者进一步缩减字典规模。这一结果验证了算法的有效性与优越性。
Abstract: Multiple-Input Multiple-Output (MIMO) systems are a core component of modern communication technologies, among which the research on multiple-access MIMO channels holds critical significance. In multiple-access MIMO channels, the multi-antenna configurations at the transmitter and receiver effectively improve the transmission rate and system capacity; however, issues such as multi-user interference during signal transmission lead to significant nonlinear characteristics of the channel, posing great challenges to the nonlinear equalization of MIMO systems. Existing kernel adaptive multivariate regression algorithms based on the adaptive projection subgradient method can address the aforementioned issues to a certain extent, but they suffer from deficiencies, including insufficient sparse processing capability and high computational complexity. To this end, focusing on the equalization requirements of multiple-access MIMO systems and using QPSK-modulated signals as the research carrier, this paper proposes two algorithms. First, to address the parameter coupling issue of traditional regression algorithms, the concept of binary classification is introduced to convert the channel equalization problem into a signal class discrimination problem, thereby proposing a multiple-access MIMO kernel adaptive binary classification algorithm. This algorithm breaks the constraints of the traditional regression paradigm, significantly improves computational efficiency, and verifies the feasibility of the idea of converting regression to classification. Furthermore, to tackle the bottleneck of this algorithm that relies on kernel matrix operations, random Fourier features are introduced to approximate traditional kernel calculations, leading to the proposal of a multiple-access MIMO adaptive binary classification algorithm based on random Fourier features. This algorithm realizes the linearized transformation of nonlinear problems and further reduces computational complexity. By converting complex-valued signal prediction into class discrimination for the real and imaginary parts, both algorithms not only retain the fitting ability of kernel methods for channel nonlinearity but also avoid the parameter coupling problem of traditional regression algorithms, providing a new solution for signal equalization in multiple-access MIMO systems under QPSK modulation and laying the experimental foundation. Experimental results demonstrate that the two proposed algorithms significantly improve computational efficiency compared with existing methods, and the latter further reduces the dictionary size. This result verifies the effectiveness and superiority of the proposed algorithms.
文章引用:贾佳冰, 宋爱民. 两种基于自适应投影次梯度的多址MIMO非线性均衡算法设计[J]. 图像与信号处理, 2025, 14(4): 398-411. https://doi.org/10.12677/jisp.2025.144037

1. 引言

在现代通信技术体系中,多输入多输出(MIMO)系统凭借在频谱效率与可靠性方面的显著优势,已成为无线通信领域的核心技术之一。多址MIMO信道作为复杂通信场景下的关键研究对象,涉及多个发射端借助多天线,同时向配备多天线的接收端传输信号,以此满足持续增长的通信需求。这种配置大幅提升了数据传输速率与系统容量,但也带来了一系列难题。例如多用户干扰问题,即不同发射端发出的信号在接收端相互干扰,严重妨碍信号的正确接收[1] [2]

在再生核希尔伯特空间(RKHS)理论持续发展的背景下,研究者专注于探索处理复杂通信问题的有效算法。在文献[3]提出了基于自适应投影次梯度法(APSM)的在线核自适应多元回归算法。APSM是一种能在在线学习等场景中,通过投影次梯度更新策略,实现参数迭代优化的算法[4]-[6],可用于处理如多址MIMO信道信号处理等问题,助力提升系统性能。文献[3]中的算法主要专注于预测连续值信号,通过不断优化回归模型来逼近真实信号值。该过程极为繁琐,且计算复杂度颇高。本文把此问题转化为相对简单的二元分类问题,更着重于信号的类别判断。

此外,在随机傅里叶特征(RFF)的发展脉络下,相关算法针对核方法的计算复杂度瓶颈问题,逐步实现技术突破:在随机傅里叶特征(RFF)的研究脉络中,相关算法已围绕核方法的复杂度与适应性难题持续突破:2019年,Xiong与Wang提出在线随机傅里叶特征共轭梯度(RFFCG)算法,将RFF与共轭梯度法结合,通过固定维度映射解决核共轭梯度算法的稀疏化依赖问题,降低了计算与存储复杂度且保持较高滤波精度[7]。2021年,Anand等人将RFF应用于大规模MIMO可见光通信,提出随机傅里叶特征–核最小均方(RFF-KLMS)后失真算法,解决了传统RKHS方法的字典增长问题,在固定内存预算下实现了与字典式核方法相当的误码率性能并大幅降低计算复杂度[8]。2023年,Gao等人提出自适应随机傅里叶特征高斯核LMS (ARFF-GKLMS)算法,通过在线调整RFF参数,显著优化了非平稳场景中的收敛率、稳态误差控制与跟踪性能[9]。文献[3]中的算法采用闭球约束与投影映射实现参数稀疏化,结合滑动窗口技术仅留存最近的核函数系数,以此控制模型规模。然而,此类稀疏方法依赖特定参数配置,存在过度剔除重要信息的风险,进而影响模型精度。为此,本文引入RFF近似传统核计算:基于Bochner定理,从高斯核对应分布采样频率向量,通过三角函数变换构造随机特征向量,使随机特征空间内的内积逼近高斯核计算,摆脱对稀疏化参数的强依赖。

本文聚焦多址MIMO系统均衡需求,以QPSK调制信号为研究载体,创新体现在两方面:一方面,针对传统回归算法的参数耦合问题,突破核自适应多元回归范式,通过将连续复值信号的回归预测转化为实部与虚部的类别判别,提出多址MIMO核自适应二元分类算法,既保留核方法对信道非线性的拟合能力,又显著提升处理效率,验证了回归转分类思路的可行性;另一方面,针对该算法在大规模场景下依赖核矩阵运算的效率瓶颈(数据量增大时,矩阵求逆复杂度随样本量呈指数级增长),引入随机傅里叶特征近似传统核计算,提出多址MIMO基于随机傅里叶特征的自适应二元分类算法,实现非线性问题的线性化转换以进一步降低复杂度。实验以误分类率为核心指标验证表明,所提算法较现有方法计算效率显著提升,后者还能压缩字典规模,为多址MIMO信道均衡提供了全新解决方案。

本文后续章节安排如下:第二章介绍多址MIMO信道模型,后续研究均基于该模型展开;第三章先回顾传统核自适应回归算法,鉴于其计算效率较低,本文从信号类别判断角度切入,提出多址MIMO核自适应二元分类算法;第四章为进一步降低计算复杂度,引入随机傅里叶特征近似核函数,提出多址MIMO基于随机傅里叶特征的自适应二元分类算法;第五章通过仿真实验,验证所提算法的性能优势;第六章总结全文结论。

2. 多址MIMO信道模型

在通信领域,多址MIMO信道问题备受关注。本文所研究的多址MIMO信道模型包含 P 个用户或发射机(Tx),每个发射机配备 N 根天线,接收机(Rx)配备 M 根天线(符号定义如表1所示)。在传输过程中,发射端采用特殊编码策略,如正交空时分组码(OSTBC),充分利用天线分集提升系统性能[10] [11]。具体而言,在每个时间瞬间 n ,发射端将信息编码为符号块后经信道传输。信息编码向量 s p ( n ):= [ s p1 ( n ),, s pK ( n ) ] t K ,经编码器 C 编码后得到 C: K T×N : s p ( n )C( s p ( n ) ) 的符号块,接收端接收到的信号 X( n ) 由公式

X( n )= p=1 P C( s p ( n ) ) H p +V( n ) T×M ,n (1)

确定,其中 H p N×M 为信道矩阵, V( n ) 为噪声。不同方法在编码策略和对信道信息的依赖上存在差异。线性技术通常遵循OSTBC编码策略,且部分或完全依赖信道信息;而本文所提的非线性核方法采用简单编码策略, K:=T:=1 ,每个天线发送相同符号,并且不依赖信道信息。

在接收端,为简化运算并统一符号表示,对接收信号进行预处理。通过定义映射 M _ :=vect M ,其中 vect 表示标准的列堆叠操作, M 是任意矩阵。基于接收信号 X _ ( n ),n 得到 2TM 维实向量 X 1 ( n ) X 2 ( n ) X 1 ( n ) X 2 ( n ) 分别包含 X _ ( n ) 的实部和虚部信息。预处理为

n, X 1 ( n ):=[ ( X _ ( n ) ) ( X _ ( n ) ) ], X 2 ( n ):=[ ( X _ ( n ) ) -( X _ ( n ) ) ],

其中 ( ) ( ) 表示复向量的实部和虚部。

Table 1. Notation table

1. 符号表

符号

定义

n

时间索引

P

用户/发射机数量

N

每个发射机的天线数量

M

接收机的天线数量

K

编码前的符号数量

T

每个天线发送的符号块数量

R=K/T

编码速率

s p ( n ) K

时刻 n 待编码的 K 个符号组成的向量

C

编码器

C( s p ( n ) ) T×N

编码后的符号块

{ H p } p=1 P N×M

信道矩阵

L

感兴趣用户/发射机数量

M _

矩阵 M 列堆叠得到的向量

3. 多址MIMO问题的核自适应二元分类算法设计

鉴于传统核自适应多元回归算法在多址MIMO场景中存在计算效率偏低的局限,本章将先对该算法进行简要回顾,进而展开核自适应二元分类算法的设计与推导。

3.1. 回顾传统核自适应多元回归算法

文献[3]提出了一个适用于在线监督多元回归任务的通用框架,该框架构建于无限维RKHS之上,并应用于资源受限且无信道先验信息的多址MIMO信道均衡场景。此框架将回归问题建模在无限维RKHS中,可覆盖线性模型及多种非线性多元回归模型,允许使用任何凸的、连续的、不一定可微的函数作为损失函数,只需其次梯度具有解析形式。考虑到后续仿真实验需引用该算法,为降低文本冗余,本文将其命名为“多址MIMO问题的核自适应多元回归算法(Kernel Adaptive Multivariate Regression Algorithm,简记为KAMR)”。引入笛卡尔积空间 := 1 × 2 ×× L ,其元素 f:= [ f 1 , f 2 ,, f L ] t ,且 f i i 。通过正定矩阵 P=[ p ij ] L×L 定义内积为

f 1 , f 2 := i,j=1 L p ij f 1i , f 2j , f 1 , f 2 (2)

相应的, 中的诱导范数定义为 | |:= , 。该算法中接收端定义为映射

f: 2TM KL : 2M L ( K:=T:=1 ):xf( x ):= [ f 1 ( x ),, f L ( x ) ] t (3)

其中每个分量 f i 属于RKHS。目标信号为 S _ ( n ) 。接收端处理后的信号为 f( X 1 ( n ) )+if( X 2 ( n ) ) 。目标是找到 f 使得 f( X 1 ( n ) )( S _ ( n ) ),f( X 2 ( n ) )( S _ ( n ) ) 足够小。通过最小化损失函数,可以使接收端处理后的信号尽可能接近原始发送信号,从而提高信号恢复的准确性。算法的大致过程为:初始化阶段选择非负参数 ε0 和窗口大小 q ,构建 ε -不敏感损失函数 l ε ( ξ ):=max{ 0,l( ξ )ε } ξ L ,仅对超出容忍度的误差施加惩罚,从而增强模型鲁棒性。算法通过滑动窗口 J n := max{ 0,nq+1 },n ¯ 动态选取最近 q 个时间步的训练数据,并对每个数据点 j J n 计算损失函数 ε,j ( f n ) 关于 f n 的次梯度 ε,j ( f n ) (形式依 1 -范

数)。定义活跃索引集 n :={ j J n : ϵ,j ( f n )0 } ,为活跃损失函数分配归一化权重 { ω i (n) } i n (0,1] ,按以下公式更新多元回归估计值

f n+1 := f n μ n i n ω i ( n ) ϵ,i ( f n ) | ϵ,i ( f n ) | 2 ϵ,i ( f n ). (4)

该算法通过不断迭代,逐步调整多回归器,使其在处理在线多元回归问题时能够更好地适应数据变化,渐近最小化损失函数序列。

针对在线核方法中内存和计算负载随时间增长的问题,文献[3]采用了闭球投影与滑动缓冲区稀疏策略。在本文中我们将这个带有稀疏策略的算法称作“基于闭球投影与滑动缓冲区稀疏的多址MIMO核自适应多元回归算法(Kernel Adaptive Multivariate Regression Algorithm Based on Sparsity via Closed Ball Projection and Sliding Buffer,简记为KAMR-CBP-SB)”。在执行稀疏化操作时,就可能错误地将对模型精度起关键支撑作用的重要信息过度剔除,破坏数据内在关联,使模型对输入的拟合与预测出现偏差,降低整体精度。与此同时,传统核自适应多元回归算法在仿真实验中,暴露出计算效率低下的显著缺陷,当数据规模扩大时,难以满足高效计算的实际需求。鉴于此,需探索更具效能的解决方案。

3.2. 多址MIMO问题的核自适应二元分类算法

传统核自适应多元回归应用于多址MIMO问题时,聚焦于连续值信号预测,需通过不断优化回归模型,经历复杂的迭代计算来逼近真实信号值。但在实际场景中,像区分不同用户发送的信号、识别不同调制方式的信号这类任务,更核心的需求是对信号类别进行判断。相较于连续值预测的繁琐过程,直接将其转化为二元分类问题处理,可大幅简化流程并显著提升处理效率。

假设存在 L 个RKHS 1 , 2 ,, L ,笛卡尔积空间为 := 1 × 2 ×× L 。在这样的空间架构下,本文所研究的分类器可以巧妙地建模为笛卡尔积空间 中的元素,即

f:= [ f 1 , f 2 ,, f L ] t , f 1 1 ,, f L L ,

1 , 2 ,, L 相关联的正定核分别是 κ 1 ( , ), κ 2 ( , ),, κ L ( , ) ,每个正定核都对应着一个特定的核宽度 σ 1 , σ 2 ,, σ L ,且 ( ) t 表示向量/矩阵转置。受文献[3]启发,结合本文研究中无限维再生核希尔伯特空间的内积构造需求,现将内积与范数定义为如下形式:

f 1 , f 2 := i=1 L f 1i , f 2i i . (5)

相应的, 中的诱导范数定义为 | |:= ,

在笛卡尔积空间的基础上,我们进一步探索其中的半空间结构。半空间的研究对于解决分类问题中的边界划分和优化求解具有重要意义。在实际的分类任务中,为了衡量分类结果与真实标签之间的差异,我们定义损失函数为:

l x,y,ρ ( f )::f ( ρ i=1 L y i f i ( x ) ) + (6)

其中 ( ) + 表示取非负值。定义 中的半空间为:

(7)

κ( x, )= [ κ 1 ( x, ),, κ L ( x, ) ] t ,其中 a x,y :=yκ( x, ) 表示法向量,这里的符号 是哈达玛积,即对于两个相同尺寸的矩阵/向量 A B AB 表示在 A B 相同位置上的元素相乘的结果。

值得一提的是,半空间与损失函数之间存在着紧密的内在联系,这种联系在后续的算法设计和优化过程中起着关键作用,它能够帮助我们更好地理解分类问题的本质和优化方向。下面介绍两个命题。

命题1设笛卡尔积空间 := 1 × 2 ×× L 中,定义其内积为(5)式,诱导范数为 | f |:= f,f

给定半空间,其中 a x n , y n := y n κ( x n , ) 为法向量。那么对于任意 f n ,其在半空间 x n , y n ,ρ + 上的投影为:

P x n , y n ,ρ + ( f n )= f n + ( ρ f n , a x n , y n ) + | a x n , y n | 2 a x n , y n . (8)

由于

| a x,y | 2 = | yκ( x, ) | 2 = yκ( x, ),yκ( x, ) = i=1 L y i κ i ( x, ), y i κ i ( x, ) = i=1 L κ i ( x,x ) =L.

则有

P x n , y n ,ρ + ( f n )= f n + 1 L ( ρ f n , a x n , y n ) + y n κ( x n , ). (9)

证明:设投影后的向量为 f x n , y n ,ρ + 我们的目标是最小化 f n f 的距离,即最小化 | f n f | 2 ,同时满足约束条件 f, a x n , y n ρ 。根据 中诱导范数的定义 | |:= , ,则优化问题可表示为:

min f x n , y n ,ρ + f n f, f n f s.t. f, a x n , y n ρ0.

f n 已经满足约束 f, a x n , y n ρ0 ,那么 f n 本身就是该优化问题的最优解,也就是说, P x n , y n ,ρ + ( f n )= f n ;若 f n 不满足约束,为了处理约束条件,引入非负拉格朗日乘子 λ0 ,构建拉格朗日函数:

( f,λ )= f n f, f n f λ( f, a x n , y n ρ ).

根据内积定义将 f n f, f n f 展开得:

f n f, f n f = i=1 L f n,i f i , f n,i f i i = i=1 L ( f n,i , f n,i i 2 f n,i , f i i + f i , f i i ) .

所以拉格朗日函数可进一步写为:

( f,λ )= i=1 L ( f n,i , f n,i i 2 f n,i , f i i + f i , f i i ) λ( i=1 L f i , a i i ρ ).

其中 a i 表示 a x n , y n 的第 i 个分量。对 f 的每个分量 f i ( i1,2,,L ) 求偏导数且令偏导数为0,有

( f,λ ) f i =2 f n,i +2 f i λ a i =0.

对于每个 i1,2,,L ,都有

f i = f n,i + λ 2 a i .

则向量 f 可表示为:

f= f n + λ 2 a x n , y n .

λ 求偏导并令其为0,可以得到

f, a x n , y n ρ.

f 代入,得到

f n + λ 2 a x n , y n , a x n , y n ρ.

结合内积与范数定义,得到

f n , a x n , y n + λ 2 | a x n , y n | 2 ρ.

解得

λ= 2 ( ρ f n , a x n , y n ) + | a x n , y n | 2 .

λ 代入到 f 表达式,最终得到投影公式:

P x n , y n ,ρ + ( f n )= f n + ( ρ f n , a x n , y n ) + | a x n , y n | 2 a x n , y n .

命题2在再生核希尔伯特空间的分类问题中,闭半空间 x n , y n ,ρ + 与软边际损失函数 l x n , y n ,ρ ( f n ) 的所有极小值点的集合是一致的。即:

argmin f n l x n , y n ,ρ ( f n )= x n , y n ,ρ + . (10)

证明:由于 x n , y n ,ρ + 是一个闭半空间,其相关的度量投影映射 P x n , y n ,ρ + ( f n ) 为:

P x n , y n ,ρ + ( f n )= f n + 1 L ( ρ f n , a x n , y n ) + y n κ( x n , ).

由距离函数的定义

d( f,S ):=inf{ | f f ^ |: f ^ S }

假设 为再生核希尔伯特积空间,其中 S 的子集。对于任意 f ,有

d( f n , x n , y n ,ρ + )=| f n P x n , y n ,ρ + ( f n ) |

因此

d( f n , x n , y n ,ρ + )=| f n P x n , y n ,ρ + ( f n ) |=| 1 L ( ρ f n , a x n , y n ) + y n κ( x n , ) | = 1 L ( ρ f n , a x n , y n ) + y n κ( x n , ), y n κ( x n , ) = 1 L ( ρ f n , a x n , y n ) + L= l x n , y n ,ρ ( f n ).

这表明最小化损失函数 l x n , y n ,ρ ( f n ) 的问题等价于最小化 d( , x n , y n ,ρ + ) 。然而, d( , x n , y n ,ρ + ) 的所有极小值点的集合是 x n , y n ,ρ +

基于上述命题,本节提出多址MIMO问题的核自适应二元分类算法(Kernel Adaptive Binary Classification Algorithm,简记为KABC),其依托自适应投影次梯度法(APSM)实现。APSM支持在每个时刻对多个数据进行并行处理以提高收敛速度。具体而言,在时刻 n ,并非仅处理单个数据对 ( x n , y n ) ,而是处理集合 { ( x n , y n ) } j J n ,其中指标集 J n nq+1,n ¯ ( q >0 用于界定先前时刻接收的数据对范围)。为简化研究,假设再生核希尔伯特空间满足 1 = 2 == L ,且各空间均采用实高斯核函数 κ ,其表达式为 κ ( x i , x j )=exp( x i x j 2 2 σ 2 ) ,记由 L 个该核函数组成的向量为 κ( , )= [ κ ( , ), κ ( , ),, κ ( , ) ] L t 。针对每个数据对 ( x n , y n ) 及指标 j J n ,定义半空间 Π x j , y j ,ρ + ,为简化符号,统一记为 Π j,n + ,其形式为:

Π j,n + :={ f n : f n , a x j , y j ρ } (11)

每个半空间 Π j,n + 都与一个度量投影映射 P Π j,n + 相关联,表达式为:

P Π j,n + ( f n )= f n + ( ρ f n , a x j , y j ) + | a x n , y n | 2 y j κ( x j , ). (12)

在每个迭代轮次 n ,一旦接收到 ( x n , y n ) ,将来自先前迭代的可用估计投影到子空间 Π j,n + 上,并通过适当的权重组合这些投影。为简化权重设计假设输出的 L 维共享同一权重。为每个 j J n 关联一个权重 w j ( n ) 0 ,满足 j J n w j ( n ) =1 。考虑初始分类器点 f 0 ,并通过以下方式生成 中的分类器序列:

f n+1 := f n + μ n ( j J n w j ( n ) P Π j,n + ( f n ) f n ),n 0 , (13)

其中外推系数 μ n [ 0,2 n ] ,且

n :={ j J n w j ( n ) | P Π j,n + ( f n ) f n | 2 | j J n w j ( n ) P Π j,n + ( f n ) f n | 2 , f n j J n Π j,n + , 1,                                         . (14)

这里 n 1,n 0 ,所以外推系数 μ n 可以取大于或等于2的值。对于 j J n ,n 0 ,定义

β j ( n ) := ( ρ f n , a x j , y j ) + w j ( n ) | a x n , y n | 2 y j = ( ρ f n , a x j , y j ) + w j ( n ) L y j , (15)

其中 y j = [ y 1j ( n ) , y 2j ( n ) ,, y Lj ( n ) ] t 。将式(11)与式(12)代入到式(13)中可以得到:

f n+1 := f n + μ n ( j J n w j ( n ) P Π j,n + ( f n ) f n ),n 0 = f n + μ n ( j J n w j ( n ) [ f n + ( ρ f n , a x j , y j ) + | a x n , y n | 2 y j κ( x j , ) ] f n ) = f n + μ n ( j J n w j ( n ) f n + j J n w j ( n ) ( ρ f n , a x j , y j ) + | a x n , y n | 2 y j κ( x j , ) f n ) = f n + μ n ( j J n w j ( n ) f n + j J n ( ρ f n , a x j , y j ) + w j ( n ) | a x n , y n | 2 y j κ( x j , ) f n ) = f n + μ n ( f n + j J n ( ρ f n , a x j , y j ) + w j ( n ) | a x n , y n | 2 y j κ( x j , ) f n ) = f n + μ n ( j J n β j ( n ) κ( x j , ) ) = f n + μ n j J n β j ( n ) κ ( x j , ).

那么算法的迭代更新公式可以等价地写为:

f n+1 = f n + μ n j J n β j ( n ) κ ( x j , ). (16)

经过适当的代数运算,参数 n 取以下形式:

n :={ j J n w j ( n ) | ( ρ f n , a x j , y j ) + | 2 κ( x j , x j ) i,j J n β i ( n ) β j ( n ) κ( x i , x j ) , f n j J n Π j,n + , 1,                                                      .

4. 基于随机傅里叶特征的多址MIMO非线性算法设计

4.1. 随机傅里叶特征理论基础

为降低核方法的计算复杂度,考虑引入随机傅里叶特征(Random Fourier Features, RFF)。其核心思想是利用有限维随机特征向量,对高斯核的无限维映射进行近似,从而将核方法的高复杂度计算转化为低维空间的线性运算。对于高斯核 κ( x, x )=exp( x x 2 2 σ 2 ) 这一平移不变核,根据Bochner定理(正定核可分解为随机频率向量的三角函数期望),其可展开为

κ( x, x ) E ω,b [ cos( ω t x+b )cos( ω t x +b ) ],

其中随机频率向量 ω~N( 0, σ 2 I ) ( N( 0, σ 2 I ) 表示均值为0、协方差为 σ 2 I 的多元正态分布),相位 b~Uniform( [ 0,2π ] ) (均匀分布于 [ 0,2π ] )。通过随机采样 D 组独立样本 { ( ω i , b i ) } i=1 D ,构造特征映射:

z Ω ( x )= 2 D [ cos( ω 1 t x+ b 1 ),cos( ω 2 t x+ b 2 ),,cos( ω D t x+ b D ) ] t .

符号 Ω={ ω 1 , b 1 ,, ω D , b D } ,即随机特征的参数集合(含随机频率 ω k 和相位 b k k=1,2,,D )。最终高斯核的内积运算可近似为低维特征映射的内积:

κ( x, x ) z Ω ( x ) t z Ω ( x ).

4.2. 基于随机傅里叶特征的多址MIMO算法

本节提出多址MIMO基于随机傅里叶特征的自适应二元分类算法(Adaptive Binary Classification Algorithm Based on Random Fourier Features,简记为RFF-ABC)。首先通过随机傅里叶特征,将无限维函数映射到有限维参数空间。构造随机特征映射 z Ω ( x ) 为:

z Ω ( x )= 2 D [ cos( ω 1 t x+ b 1 ) cos( ω 2 t x+ b 2 ) cos( ω D t x+ b D ) ], (17)

其中, ω k ~N( 0, σ 2 I ),k=1,2,,D ,服从均值为0、协方差 σ 2 I 的高斯分布, σ 是核宽度参数; b k ~Uniform( [ 0,2π ] ) (随机相位,均匀分布在 [ 0,2π ] ); D 是随机特征维度,通过该映射, z Ω : d D ,把输入数据映射到 D 维欧氏空间。

假设分类器为 f:= [ f 1 , f 2 ,, f L ] t L ,利用RFF的有限维近似,假设 L 维空间的随机特征映射完全相同,每个空间函数可表示为

f k = W k t z Ω ( )

其中 W k D 为系数列向量, z Ω ( ) D 为特征映射列向量。进一步,将系数列向量 { W k } k=1 L  按列拼接为系数矩阵:

W:=[ W 1 , W 2 ,, W L ] D×L ,

此时,分类器可紧凑表示为如下形式:

f( )= W t z Ω ( ). (18)

由于采用随机傅里叶特征近似核方法,将无限维再生核希尔伯特空间(RKHS)的非线性问题转化为欧氏空间的线性化框架,因此基于随机傅里叶特征的有限维映射,将内积定义为:对任意 W 1 , W 2 D×L ,设其第 k 列分别为 W 1,k , W 2,k D ,则内积为:

W 1 , W 2 := k=1 L W 1,k t W 2,k . (19)

对应范数为:

W := k=1 L W k t W k . (20)

假设分类标签为 y= [ y 1 , y 2 ,, y L ] t L ,满足 | y k |=1 ,特征映射为 z Ω ( x ) D ,分类器系数矩阵 W D×L (其第 k 列为 W k D )需满足的半空间约束为:

(21)

其中,法向量矩阵为: a ˜ x,y :=[ y 1 z Ω ( x ), y 2 z Ω ( x ),, y L z Ω ( x ) ] D×L ,其第 k a ˜ k = y k z Ω ( x ) D 对应第 k 维的法向量分量。对于任意系数矩阵 W D×L 其在该半空间上的投影可表示为:

P x,y,ρ + ( W n )= W n + ( ρ k=1 L W k t a ˜ k ) + a ˜ x,y 2 a ˜ x,y . (22)

式中分子的 ( ) + 表示取非负值,分母 a ˜ x,y 2 是法向量矩阵的范数平方,利用 | y k |=1 ,即 y k 2 =1 ,该范数平方可简化推导为:

a ˜ x,y 2 = k=1 L a ˜ k t a ˜ k = k=1 L ( y k z Ω ( x ) ) t ( y k z Ω ( x ) ) = k=1 L y k 2 z Ω ( x ) t z Ω ( x ) = k=1 L z Ω ( x ) t z Ω ( x ) =L z Ω ( x ) t z Ω ( x ).

在线学习场景中,对于每个时刻 n 0 都关联着一对 ( x n , y n ) 。每个时刻并行处理来自先前 q 长度时间窗口的数据集 { ( x n , y n ) } j J n ,其中指标集 J n nq+1,n ¯ ,为简化权重设计假设输出的 L 维共享同一权重。为每个 j J n 关联一个权重 w j ( n ) 0 ,满足 j J n w j ( n ) =1 。定义投影系数:

β j ( n ) := ( ρ k=1 L W k t a ˜ k ) + w j ( n ) a ˜ x j , y j y j = ( ρ k=1 L W k t a ˜ k ) + w j ( n ) L z Ω ( x j ) t z Ω ( x j ) y j , (23)

其中标签 y j = [ y 1j ( n ) , y 2j ( n ) ,, y Lj ( n ) ] t ,法向量矩阵为 a ˜ x j , y j :=[ y 1j ( n ) z Ω ( x j ), y 2j ( n ) z Ω ( x j ),, y L j ( n ) z Ω ( x j ) ] D×L ,其第 k a ˜ k ( j ) = y kj ( n ) z Ω ( x j ) D 对应第 k 维的法向量分量,范数 a ˜ x j , y j =L z Ω ( x j ) t z Ω ( x j ) 。系数矩阵更新遵循如下规则:

W n+1 = W n + μ n j J n ( β j ( n ) z Ω ( x j ) t ) t (24)

式中外推系数 μ n [ 0,2 n ] ,其自适应调整机制为:

n :={ j J n w j ( n ) | P Π j,n + ( W n ) W n | 2 | j J n w j ( n ) P Π j,n + ( W n ) W n | 2 , W n j J n Π j,n + , 1,                                           .

该机制通过投影误差动态调控 n ,保证更新步长合理性。

5. 仿真实验

5.1. 实验参数

数据与验证设置:加载MIMO系统数据集,设定训练数据量为3000个,测试数据量为50个;实验重复10次,以此确保结果稳定;采用固定间隔验证策略,每50个训练样本进行一次验证,验证点数量为训练数据量与验证间隔的比值。

MIMO系统参数配置:用户/发射机数量 P 为4、每个发射机天线数量 N 为2、接收机天线数量 M 为2、感兴趣用户/信号数量 L 为2、发射机每次编码前待编码符号块复符号数量 K 为1、每个天线发送的符号块数 T 为1。每个发射端的源符号 s p ( n ) 的各分量等概率地取 ±1 ±i 这些复数值。信道矩阵 H p 的每个分量都是复值随机变量,其实部和虚部均服从均值为0、方差为1的正态分布。并且同一信道矩阵内的不同分量相互独立,不同信道矩阵的分量之间也相互独立。

5.2. 实验结果

仿真实验结果如下图所示。

基于图1的仿真结果可知:核自适应二元分类算法(KABC)相较于核自适应多元回归算法(KAMR),计算复杂度降低显著,相同任务下运行耗时远低于KAMR;且从误分类率指标来看,KABC的分类性能未因复杂度优化而衰减,实现了计算复杂度与分类性能的协同保持。需说明的是,KABC因未引入稀疏化策略,在字典规模上存在固有局限。进一步分析随机傅里叶特征(RFF)近似的RFF-ABC:其相较于KABC进一步缩减字典规模与计算复杂度,且在同等字典规模约束下,耗时低于采用闭球投影–滑动窗稀疏策略的KAMR-CBP-SB;但局限性在于,相较于未引入稀疏机制的KABC,其误分类率呈小幅上升趋势。对于RFF-ABC的核心参数(维数D)的选取,若需在RFF-ABC现有复杂度基础上进一步降低计算复杂度,需减小维数D,但D的进一步缩减会导致误分类率升高;反之,若要提升误分类性能,则需增大D,而D增大又会推高计算复杂度,二者存在权衡制约关系。

Figure 1. Simulation experiment result diagrams of this paper

1. 本文仿真实验结果图

6. 结论

本文围绕多址MIMO系统的信号处理问题,以QPSK调制信号为研究对象,借助自适应投影次梯度法开展研究:一方面,将传统聚焦于连续值预测的复值信号处理,转化为实部与虚部的类别判别,既保留核方法对信道非线性的拟合能力,又规避传统回归算法的参数耦合问题,摒弃复杂的连续值预测流程、提升计算效率,验证了回归转分类的可行性;另一方面,引入随机傅里叶特征近似传统核计算,通过构造随机特征映射将高斯核非线性问题转化为线性问题,在降低计算复杂度、减小字典规模的同时实现较低误分类率,优化模型性能。仿真结果表明,两种方法均显著提升计算效率,其中随机傅里叶特征方案可进一步压缩字典规模,为QPSK调制下的多址MIMO系统信道均衡提供了新的解决方案。

NOTES

*通讯作者。

参考文献

[1] Shahbazpanahi, S., Beheshti, M., Gershman, A.B., Gharavi-Alkhansari, M. and Wong, K.M. (2004) Minimum Variance Linear Receivers for Multiaccess MIMO Wireless Systems with Space-Time Block Coding. IEEE Transactions on Signal Processing, 52, 3306-3313.
https://doi.org/10.1109/tsp.2004.837442
[2] Cavalcante, R.L.G. and Yamada, I. (2008) Multiaccess Interference Suppression in Orthogonal Space-Time Block Coded MIMO Systems by Adaptive Projected Subgradient Method. IEEE Transactions on Signal Processing, 56, 1028-1042.
https://doi.org/10.1109/tsp.2007.907896
[3] Slavakis, K., Bouboulis, P. and Theodoridis, S. (2012) Adaptive Multiregression in Reproducing Kernel Hilbert Spaces: The Multiaccess MIMO Channel Case. IEEE Transactions on Neural Networks and Learning Systems, 23, 260-276.
https://doi.org/10.1109/tnnls.2011.2178321
[4] Slavakis, K., Theodoridis, S. and Yamada, I. (2008) Online Kernel-Based Classification Using Adaptive Projection Algorithms. IEEE Transactions on Signal Processing, 56, 2781-2796.
https://doi.org/10.1109/tsp.2008.917376
[5] Slavakis, K., Yamada, I., Ogura, N. and Yukawa, M. (2004) Adaptive Projected Subgradient Method and Set Theoretic Adaptive Filtering with Multiple Convex Constraints. Conference Record of the Thirty-Eighth Asilomar Conference on Signals, Systems and Computers, 2004, Pacific Grove, 7-10 November 2004, 960-964.
https://doi.org/10.1109/acssc.2004.1399281
[6] Fink, J., Cavalcante, R.L.G. and Stańczak, S. (2023) Superiorized Adaptive Projected Subgradient Method with Application to MIMO Detection. IEEE Transactions on Signal Processing, 71, 1350-1362.
https://doi.org/10.1109/tsp.2023.3263255
[7] Xiong, K. and Wang, S. (2019) The Online Random Fourier Features Conjugate Gradient Algorithm. IEEE Signal Processing Letters, 26, 740-744.
https://doi.org/10.1109/lsp.2019.2907480
[8] Anand, P.K., Jain, S., Mitra, R. and Bhatia, V. (2021) Random Fourier Features Based Post-Distortion for Massive-Mimo Visible Light Communication. 2020 International Conference on Communications, Signal Processing, and their Applications (ICCSPA), Sharjah, 16-18 March 2021, 1-6.
https://doi.org/10.1109/iccspa49915.2021.9385752
[9] Gao, W., Chen, J., Richard, C., Shi, W. and Zhang, Q. (2023) Adaptive Random Fourier Features Kernel LMS. 2023 IEEE International Conference on Signal Processing, Communications and Computing (ICSPCC), Zhengzhou, 14-17 November 2023, 1-6.
https://doi.org/10.1109/icspcc59353.2023.10400238
[10] Alamouti, S.M. (1998) A Simple Transmit Diversity Technique for Wireless Communications. IEEE Journal on Selected Areas in Communications, 16, 1451-1458.
https://doi.org/10.1109/49.730453
[11] Tarokh, V., Jafarkhani, H. and Calderbank, A.R. (1999) Space-Time Block Codes from Orthogonal Designs. IEEE Transactions on Information Theory, 45, 1456-1467.
https://doi.org/10.1109/18.771146