1. 引言
高光谱图像具有光谱分辨率高、成像波段多的特点,使其在地物分类、反演、目标识别等方面有着巨大的优势。传统的分类方法在高光谱分类中效果不理想,会出现维数灾难(Hughes)现象,给高光谱图像分类问题带来了挑战 [1] 。
针对高光谱图像分类的挑战,国内外利用机器学习领域的算法展开了高光谱图像分类的研究,例如:支撑向量机(SVM) [2] [3] [4] [5] 、粒子群算法 [6] 、人工免疫算法 [7] 等。其中,支撑向量机方法因核函数的计算不受训练样本维数的影响,并且分类精度较高,在高光谱图像分类中具有一定优势 [2] 。然而该算法也存在局限性:如支持向量的数量随着训练样本的增长而增加,导致计算时间长;模型参数较多,计算复杂;无法得到概率预测;核函数有一定限制,必须满足Mercer条件等 [8] 。文献 [8] [9] 提出了基于卷积神经网络的高光谱图像分类算法,但是上述算法都是基于光谱特征实现的图像分类。文献 [10] 提出融合图像的邻域信息进行非监督分类,用高分辨率城市遥感影像进行了实验,提高了非监督分类的精度;Benediktsson等利用形态学方法提取图像的空间信息,采用神经网络方法进行分类,并且针对城市高光谱图像进行了实验,取得了良好的效果 [11] [12] 。文献 [13] 将图像的光谱特征和空间特征叠加,采用SVM方法分类,提高了该方法的分类精度。
RVM是一种基于稀疏贝叶斯理论的算法 [14] 。RVM算法具有如下优势:相关向量的数量小,核函数的选择无需满足Mercer条件,能够给出概率预测等。RVM提出后逐渐应用于目标识别 [15] 、图像分类 [16] 等领域。Demir [17] 于2007年将RVM应用于高光谱遥感影像分类,并与SVM方法进行了对比。文献 [18] 采用mahalanobis核函数构造RVM分类器,通过高光谱图像分类实验证明了该方法的精度和鲁棒性。文献 [19] 提出一种改进型相关向量机的高光谱图像分类方法,然而上述RVM分类方法都只采用了高光谱图像的光谱特征构造RVM分类器。
为提高图像分类精度,本文提出一种组合核函数RVM分类方法。根据核函数理论设计了组合核函数,使用多尺度形态学方法提取高光谱图像的空间特征,用组合核函数融合图像的光谱特征和空间特征,训练RVM分类器,基于高光谱图像进行了实验,从精度、训练时间等方面将本文方法与已有的基于光谱特征的RVM分类方法进行了对比分析和精度评价。实验证明与基于光谱特征的RVM分类器相比,本文方法精度更高,并且能以较少的样本取得更高的分类精度。
2. 算法原理
2.1. RVM分类模型
RVM方法假定训练样本集为
,
,
,根据概率论,假设目标值含有误差
,则目标值
可以表示为 [9] :
(1)
其中,误差
是独立的,且服从零均值Gauss分布,方差为
,即
。
采用基函数的线性组合来计算,即:
(2)
其中,
为核函数,
为权重系数。
假设训练样本独立同分布,根据Bernoulli分布的定义,训练样本集的似然函数可以表示为:
(3)
其中,
为训练样本标号,
,是
维设计矩阵,
是定义在训练样本点上的核函数。
RVM的权值向量
为服从均值为0方差为
的Gauss条件概率分布:
(4)
其中,
,
是N + 1维超参数向量。
RVM模型为每一个权值w定义一个独立的超参数。由于超参数
的超先验概率分布服从自动相关判定先验分布。在模型迭代计算的过程中,大部分超参数会趋近于无限大,其对应的权值w为0,使得RVM模型具有很高的稀疏特性。本文使用Trring提出的快速边缘似然最大化方法 [20] 来估计超参数
。
RVM模型最初是用于解决两类分类问题的,而遥感图像分类属于多类分类问题,可以通过分解成一系列两类分类问题求解。本文采用一对一法(One Against One, OAO)解决RVM多类分类问题。
2.2. 组合核函数RVM
基于核函数的分类器的性能,核函数的选择起着关键作用 [21] 。本文根据核函数理论构造组合核函数分类器,由Mercer定理的推论 [20] :设
和
是定义在
上的核,
,
,
是定义在X上的一个实值函数,
,那么下列函数仍然是核函数:
(5)
(6)
(7)
根据Mercer定理及其性质,上述三种核函数,可以作为一种新的核函数来训练分类器 [22] 。
根据上述理论,构造了三种组合核函数融合图像的空间特征和光谱特征。定义样本的光谱特征为
,空间特征
,相应的光谱特征与空间特征的核矩阵分别为Ks和Kw。根据核函数的性质,分别定义两个非线性变换
和
,可以分别将样本的光谱特征和空间特征变换到Hilbert空间H1和H2中。本文分别定义了基于加法和基于乘法的组合核函数来结合图像的光谱特征和空间特征。基于加法运算的组合核函数的数学表达如下:
(8)
在此的基础上可以构造基于加权加法的组合核函数,其数学表达如下:
(9)
其中,
,它控制着两个核函数的权重。
基于乘法运算的组合核函数:
(10)
光谱核Ks与空间核Kw的基函数均采用径向基核函数计算。光谱核矩阵的具体计算方法如下:
(11)
其中,
为光谱特征向量。
空间核矩阵的计算公式如下:
(12)
其中,
为空间特征向量。
相关向量机使用的核函数不必满足Mercer条件 [9] ,本文仍然采用满足Mercer条件的核函数来构造组合核函数。常用的核函数包括:1) 线性核函数
,2) 多项式核函数
与3) 径向基核函数
。其中,
为径向基核函数参数,控制着核函数的宽度。本文使用径向基核函数作为RVM分类器的基函数。
2.3. 基于多尺度形态学的空间特征提取
数据形态学基于结构元素对图像进行腐蚀、膨胀、开启(Opening)和闭合(Closing)运算提取出图像的空间信息。本文采用一系列半径逐渐增大的结构元素作为模板,对图像重复进行开启和闭合运算,从而提取出一组特征向量,称为图像的多尺度形态学特征 [22] 。
设
和
分别表示对图像做腐蚀运算和膨胀运算。基于膨胀和腐蚀重建运算的定义,可以得到基于膨胀的开重构运算的表达式为:
(13)
基于腐蚀的闭重构运算的表达式为:
(14)
设
是开重构算子,
是通过开重构运算得到的形态学特征,则
的数学表达式为:
(15)
设
是闭重构运算算子,由闭重构运算得到的形态学特征
的数学表达式为:
(16)
其中,根据形态学的定义,当
时,
。
经过开重构与闭重构运算之后,利用相邻两幅形态学特征图像的差值可以得到的图像的多尺度形态学特征,其数学表达式为:
(17)
其中,n为开闭运算的次数,
。
对高光谱图像的每个波段都进行上述多尺度形态学运算,就得到图像的空间特征向量。
3. 实验与结果分析
3.1. 实验数据
本文实验采用AVIRIS传感器于1992年拍摄的Indian Pine地区高光谱图像 [23] 。该图像大小为145 × 145,共有220个波段,覆盖的波长范围为0.4~2.5 μm。该地区的多种地物光谱较为相似、分类难度大,是高光谱分类算法性能测试的标准数据。实验之前预先去除该数据的水吸收波段和低信噪比波段,剩余169个波段。该图像共包含16种地物类别,本文的实验采用9种典型地物,共包含9345个样本点。样本分布情况如表1所示。

Table 1. Ground information satatictal form of Indian Pine experimental region
表1. Indian Pine实验区图像典型地物信息统计表
实验采用的计算机硬件环境为Intel Core2双核CPU,1.58 GHz/3.25 GB内存,软件环境为Microsoft Windows XP、Matlab R2008a。
实验环节从精度、计算效率方面比较了基于单一特征的RVM分类器与组合核函数RVM分类器的性能。
3.2. 实验过程
通过多尺度形态学运算可以有效地提取图像的空间特征,但是将导致数据量急剧增大,因此本文首先使用PCA变换(Principal Components Analysis, PCA)对图像进行降维,得到训练样本集的特征向量
,
,
。其中,N是训练样本集的样本个数。
表示第k个样本。
是与样本k相对应的标签。然后针对主成分图像采用多尺度形态学算法提取图像的空间特征。
如表2所示,实验区图像经过PCA变换的前三个主成分的信息量占整个图像的99%以上。实验选取PCA变换的前3个主成分计算图像的多尺度形态学特征。因此本文实验中采用方形结构元素。迭代次数n设为5。

Table 2. PCA transform result of Indian Pine experimental region image
表2. Indian Pine实验区图像主成分变换结果
利用主成份分析结果的第一个分量提取出来的多尺度形态学特征如图1:

Figure 1. Multi-scale morphological profile from first principal components of experimental region image
图1. 实验区图像第一分量多尺度形态学特征图
将各类样本按数量随机等分成两部分作为训练样本和测试样本。各类别取50%作为训练样本,剩余的数据作为测试样本。RVM的核函数参数通过交叉验证的方法获得。本文实验中核函数参数取1。采用五种组合核函数的分类结果如图2所示。图中,Ks和Kw分别表示基于光谱特征的核函数和基于空间特征的核函数。Ksum是基于加权加法的组合核函数,Kproduct是基于乘法的组合核函数,Kweight是基于加权加法的核函数,其权重取值0.8。
3.3. 分类精度
为了验证本文算法性能,本文采用总体精度(Overall Accuracy, OA)、Kappa系数(Kappa Coefficient, KC)、训练时间和基函数数量4个指标作为分类器性能的评价标准。
实验区图像基于五种核函数的RVM分类器性能比较如表3和表4所示。表中,Ks和Kw分别表示基于光谱特征的核函数和基于空间的特征核函数。其中,Ksum是基于加法的组合核函数,Kproduct是基于乘法的组合核函数,Kweight是基于加权加法的核函数,其权重取0.8。

Figure 2. Classification result of four classification methods. (a) Classification result of the spectral kernel, Ks RVM; (b) Classification result of the summation kernel, Ksum RVM; (c) Classification result of the product kernel, Kproduct RVM; (d) Classification result of the weighted summation kernel, Kweight RVM
图2. 四种方法的分类结果图。(a) 基于光谱核函数Ks的RVM分类结果;(b) 基于加法核Ksum的组合核函数RVM分类结果;(c) 基于乘法核Kproduct的组合核函数RVM分类结果;(d) 基于加权加法Kweight的组合核函数RVM分类结果
表3和表4是每类50%作为训练样本5种核函数RVM分类器的实验结果。从图2可以直观地看出,基于光谱特征的RVM分类器针对C3、C4、C5和C9四类农作物精度较高,而针对C1、C2、C6、C7和C8五种农作物误分率略高。结合表3可以看出,三种组合核函数对于几乎所有地物类别的分类精度均有所提升。尤其是对于C1、C2、C6、C7和C8五种基于光谱特征较难分的农作物,组合核函数RVM的分类精度提升最明显,说明在RVM分类器中引入图像的空间特征能够有效改善分类器的性能。

Table 3. Classification accuracy of different methods
表3. 不同方法的分类精度
结合表3可以看出,基于光谱特征的RVM分类器针对C3、C4、C6、C9这几个类别分类精度高,而基于空间特征的RVM分类器针对C5、C8两个类别的分类精度高。说明图像的光谱特征和空间特征具有一定的互补性,而本文提出的组合核函数的分类方法综合了光谱特征和空间特征的优势,利用地物的结构特征丰富了图像分类的有效信息,因此总体分类精度高于单一特征的RVM分类器。

Table 4. Classification performance comparison of different methods of experimental region
表4. 实验区图像基于不同分类方法的性能对比
从表4可以得出以下结论:
1) 分类精度方面,与基于光谱特征的RVM相比,组合核函数RVM分类器的总体精度OA与Kappa系数均有了明显提高。基于乘法核函数的RVM分类器的总体精度OA与Kappa系数分别提高了4.2%和5.05%。基于加权加法核函数的RVM分类器总体精度OA与Kappa系数分别提高了4.24%和4.78%。基于加法核函数的组合核函数对总体分类精度的提升最明显,总体精度OA与Kappa系数较光谱核函数RVM分类器分别提高了4.52%和5.11%。
2) 效率方面,与基于单一特征的RVM分类器相比,组合核函数RVM分类器的训练时间没有显著增加。其中,基于乘法核函数的RVM训练时间与单一特征的RVM相当。基于乘法核的RVM分类器的训练时间略高于光谱核RVM。
3.4. 算法稳定性
为了分析本文方法的稳定性,从训练样本集中随机选取占总样本20%,30%,40%,50%的样本作为训练样本,而测试数据集保持原有的样本不变。采用5折交叉验证方法确定径向基核函数的参数。表5列出了不同数量训练样本下,基于光谱的RVM以及三种组合核函数RVM方法的总体精度。表5中,Ks表示基于光谱特征的核函数,Ksum是基于加法的组合核函数,Ksum是基于乘法的组合核函数,Kweight是基于加权加法的核函数,权重取0.8。

Table 5. Overall accuracy of different methods with different training sample size
表5. 选取不同数量的训练样本时不同方法分类的总体精度
从表5可以看出:随着训练样本的增加,三种形式的组合核函数RVM方法的分类精度都比单一特征的RVM分类器有所提升。尤其是加法核函数RVM分类器,在训练样本数量仅有20%时,仍然能取得较高的分类精度。然而当训练样本占总样本的比例超过40%之后,三种形式的组合核函数RVM分类器对分类精度的提升趋于稳定。
4. 结论
本文针对现有的高光图图像分类方法存在的问题,基于核函数的理论设计了基于乘法、加法和加权加法三种形式的组合核函数RVM分类器,融合光谱特征和空间特征进行分类。通过高光谱图像分类实验表明,组合核函数RVM分类器的性能优于单一特征的RVM分类器。与使用单一特征的RVM分类器相比,组合核函数RVM分类器的训练时间没有显著增加,而总体分类精度OA和Kappa系数均有明显提高,能获得更高的分类精度。总体来看,组合核函数RVM方法能够用较少的训练样本取得较高的分类精度,在高光谱图像分类问题中具有实用价值。
对于如何选取RVM的核函数以及相应的参数,可以进一步优化。另外,本文采用了形态学方法提取图像的空间特征,还可以进一步提取出图像的形状特征和其他特征,一起构造组合核函数,进行高光谱图像分类。
基金项目
本文受中国兵器工业集团有限公司科技开发费项目(JM2021005)资助。
NOTES
*第一作者。