1. 引言
随着航天航空技术以及遥感技术的发展,获得大面积长时间序列的高分遥感影像成为可能,相对于中低空间分辨率的遥感影像,高分辨率遥感影像中混合像元对分类精度的影响减弱了,更加重视对邻近像元。高分辨率遥感数据具有光谱信息较少但纹理、空间几何结构、形状等信息丰富的特点,这些信息对提升分类精度有很大作用。近年来,以Wordview-2/3、IKONOS、Quick Bird等为主的国外高空间分辨率遥感影像已在城市绿地信息提取中被广泛应用 [1] [2] [3]。而国产卫星的不断发展也使我国高空间分辨率遥感影像的自主供给能力得到提升,“高分二号”(GF-2)卫星是迄今为止中国自主研制的空间分辨率最高的民用遥感卫星,GF-2影像已广泛地应用于矿山资源监测、土地利用现状解译、城市规划检测评价、交通规划等行业和领域 [4] [5] [6] [7]。传统的基于遥感技术的林地分类方法众多,如基于植被指数、决策树、监督分类及神经网络等方法 [8] - [15],不同的分类方法对不同的土地类型、适用的区域都有一定的优势。基于像元的分类方法忽略图像的空间特征及上下文关系,易产生分类效果差、空间数据冗余等现象,已不能满足高分辨率遥感影像的分类需求。与传统的分类技术不同,面向对象的信息提取方法,是基于对象的操作,不仅能够充分地利用地物的光谱、纹理及空间等信息,还能有效的避免分类结果的“椒盐”现象,具有很大的优越性。本文利用面向对象的方法,基于云南省西双版纳傣族自治州勐海县的Wordview-3数据,充分利用高分辨率影像的光谱、纹理及空间等信息 [16],根据全国土地利用现状(GB/T 201010)一级分类标准对影像土地利用类型进行分类。
2. 研究区与数据
2.1. 研究区概况
本研究的研究区为勐海县的一个山区(图1),勐海县,位于云南省西南部、西双版纳傣族自治州西部,地处东经99˚56'~100˚41'、北纬21˚28'~22˚28'之间。东接景洪市,东北接思茅市,西北与澜沧县毗邻,西和南与缅甸接壤。国境线长146.6公里。东西横距77公里,南北纵距115公里,总面积5511平方公里,其中山区面积占93.45%,坝区面积占6.55%,最高海拔2429米,最低海拔535米。总人口331,850人(2010年),政府驻地勐海镇。勐海县属热带、亚热带西南季风气候,冬无严寒、夏无酷暑,年温差小,日温差大,依海拔高低可分为北热带、南亚热带、中亚热带气候区。年平均气温18.7℃,年均日照2088小时,年均降雨量1341毫米,全年有霜期32天左右,雾多是勐海坝区的特点,平均每年雾日107.5~160.2天。
勐海县境内土壤分7个土类、18个亚类、52个土属、85个土种,各类土壤随海拔高低垂直分布。海拔600~800米以内的属砖红壤;海拔800~1500米的属砖红壤性红壤(赤红壤),分布在低山和中山地区;海拔1500~2400米的属红壤土类,分布于山的中部或山顶平缓地;水稻土主要分布于海拔600~1500米之间的坝区,共有47.7万亩。
Figure 1. Distribution of study area and sample points
图1. 研究区及样本点分布图
2.2. 研究数据与预处理方法
本研究以勐海县为例,选用了2016年1月19日的World-view3卫星遥感影像,包括2.0 m的多光谱影像数据和0.5 m的全色影像数据,其中多光谱数据有四个波段,分别为红波段(630 mm~690 mm)、绿波段(510 mm~580 mm)、蓝波段(450 mm~510 mm)和近红外(770 mm~895 mm)波段。数据预处理包括辐射定标、大气校正、图像融合。大气校正选用FLAASH模型,图像融合选用的是NNDiffuse Pan Sharpening算法,图像融合后最终得到0.5 m的多光谱数据。
3. 研究方法
本研究影像的地物分类研究技术流程如图2所示,总体上是一个基于面向对象分类方法,主要包括三大部分,第一部分为数据获取及预处理;第二部分为获取影像对象和特征提取,即基于WorldView-3多尺度分割得到影像对象和空间纹理特征提取以及;第三部分为基于样本用SVM分类器分类和采用混淆矩阵对分类精度进行评价。
3.1. 归一化植被指数(NDVI)的计算
随着科技的发展,植被指数广泛应用于植被覆盖度的定性、定量估算指标。植被指数有很多种,归一化植被指数对土壤背景的变化十分敏感,它随着绿色植被覆盖度的增大而迅速增大,所以也是最常用的一种方法。归一化植被指数(Normalized Difference Vegetation Index),是反映植被生长状况及分布情况的重要参数,对植被监测的灵敏度相对较高。不仅间接反映了地表植被生长的状况,还与植被的覆盖分布密度存在线性相关关系。归一化植被指数(NDVI),是遥感影像中近红外波段的反射率值(NIR)与红波段的反射率值(R)之差与两者之和的比值,归一化植被指数英文缩写为NDVI,计算公式为:
(1)
3.2. 基于eCognition的影像分割
影像分割的目的是将影像中类似的像元集合并成对象单元,是面向对象分类的基础,因此影像分割结果将直接影响到分类的精度。文章 [17] 对形状因子、紧致度因子、分割尺度做了如下的撰述:① 分割尺度对分割的影响最大,形状指数次之,紧致度最小;② 形状指数取值偏小,紧致度取值偏大,对分割效果好;③ 加入面积权重因子提高分割评价函数的稳定性;④ 改进的方法与现有的方法相关性显著,因此适宜作为评价的标准;⑤ 影像分辨率不同不会对参数的选择产生显著影响。本文采用eCognition Developer中集成的多尺度分割方法实现了影像的分割和对象的获取。在利用多尺度分割方法获取对象时需要对形状因子、紧致度因子、分割尺度参数等进行设定,其中形状因子、紧致度因子等对分割结果影8响较小,通过试错法获得;而分割尺度的选择是多尺度分割中的核心问题 [18],若分割尺度过大会导致单个对象包含多种地物,易形成欠分割现象;若尺度过小,使得地物对象过于零碎而对象纹理和结构信息不足。由于研究区地物负责多样,经过多次分割实验并结合最终选择效果最好的分割尺度为220,光谱因子权重为1,形状因子权重0.4,紧致度为0.5。
3.3. 基于灰度共生矩阵纹理特征的提取
20世纪70年代,由Haralick提出的灰度共生矩阵(Grey-Level Co-occurrence Matrix, GLCM)算法 [10] 是用来分析纹理特征的经典统计分析方法。纹理是局部窗口内,像元灰度级的空间分布及空间相互关系 [19],可以用在某个方向上间隔一定距离的一对像元灰度出现的概率来表示图像中的纹理。GLCM就是建立在估算图像二阶组合条件概率密度函数基础上的一种灰度组合分布。灰度共生矩阵可以很好地描述区域纹理,但是,GLCM不能直接用来提取图像的纹理特征,因此,研究者们在此基础上提生出了多个可以定量分析、评价纹理的特征量。Haralick曾提出14种统计量来提取GLCM反映的纹理特征,这些统计量从不同的方面反映图像的纹理特征,同时,他们之间也存在一定的相关性。本文采用均值、同质度和相关性来描述纹理特征,平均值反映了窗口内灰度平均值,反映了图像分布平滑性,是用来衡量灰度共生矩阵的元素在行或列方向上的相似程度,窗口的大小取值为5 × 5。
3.4. 样本点的选择
本文以《土地利用现状分类》国家标准(标准号GB/T21010-2007)为基础,根据研究的目的性、科学性以及遥感技术的可分性等原则,结合研究所用WorldView-3影像的特点以及研究区的实际状况来建立研究所采用的分类体系。最终确定裸地、园地(茶园)、林地、建筑用地四大类。本文一共选取618个点,林地138个点,茶园178,裸地236个点,建筑用地66个点,训练样本与验证样本的比为1:1,并对样本点做了缓冲区,林地、耕地、裸地缓冲10米,建筑用地缓冲3米。样本点统计如表1:
Table 1. Statistical table of sample point selection
表1. 样本点选择统计表
3.5. 面向对象分类
面向对象方法是以由若干同质性像元组成的“对象”为处理单元,并综合分析、提取对象的光谱、纹理、形状、空间关系等多种属性信息用于分类,因而能在较大程度上解决基于像元方法难以克服的光谱混淆、混合像元等问题,也可以减小分类结果中由于景观内部异质性大而引起的“椒盐效应”,从而有效提高分类精度 [12]。本文以勐海为研究对象,利用Wordview-3数据进行面向对象分类,分类器采用最支持向量机。
在图像分类中,分类器是一个关键工具,目前已经有很多比较成熟的分类器,如最大似然、神经网络、支持向量机。由于遥感影像的复杂性,目前还没有一种普适的、高效的分类算法。本文选用效果较好且应用较广泛的支持向量机分类器。SVM把样本通过非线性映射投影到高维特征空间,以结构风险最小化原理为原则,在高维特征空间构造VC维尽可能低的最优分类超平面作为分类面 [20],使分类风险上限最小化,从而使分类器具有最优的推广能力。目前,SVM中常用的且效果比较理想的核函数主要有线性核函数、多项式核函数、Sigmoid核函数、高斯径向基核函数,本文选用的是高斯径向基核函数,对于参数的设置,核函数和惩罚函数与分类精度相关性较强,本试验中核函数设置为0.25,惩罚函数设置为 100,以保证分类器的泛化能力。
3.6. 基于混淆矩阵的精度评价
选用混淆矩阵对提取结果进行验证。基于混淆矩阵,可以统计一系列评价指标对分类提取结果进行评价,基本的评价指标如下:
1) 总体分类精度(Overall Accuracy)
总体分类精度等于被正确分类的像元总和除以总像元数。被正确分类的像元数目沿着混淆矩阵的对角线分布,总像元数等于所有真实参考源的像元总数
2) Kappa系数(Kappa Coefficient)
它是通过把所有真实参考的像元总数(N)乘以混淆矩阵对角线(XKK)的和,再减去各类中真实参考像元数与该类中被分类像元总数之积之后,再除以像元总数的平方减去各类中真实参考像元总数与该类中被分类像元总数之积对所有类别求和的结果。
3) 制图精度(Producer’s Accuracy)
制图精度或生产者精度是指分类器将整个影像的像元正确分为A类的像元数(对角线值)与A类真实参考总数(混淆矩阵中A类列的总和)的比率。
4) 用户精度(User’s Accuracy)
用户精度是指正确分到A类的像元总数(对角线值)与分类器将整个影像的像元分为A类的像元总数(混淆矩阵中A类行的总和)比率。
4. 结果与分析
4.1. 分割结果
经过多次分割实验并结合最终选择效果最好的分割尺度为220,光谱因子权重为1,形状因子权重0.9,紧致度为0.1,分割的过分割和欠分割都在可接受范围内,分割细节图3如下所示:
Figure 3. Segmentation result detail diagram
图3. 分割结果细节图
4.2. 基于GLCM的纹理特征提取结果(图4)
二阶概率统计用一个灰色调空间相关性矩阵来计算纹理值,这是一个相对频率矩阵,即像元值在两个临近处理窗口(由特定距离和方向分开)中的出现频率,该矩阵显示了一个像元和它的特定邻域之间关系的发生数,本研究选用的二阶概率矩阵为3 × 3窗口,灰度量化级别为64。
4.3. 精度评价结果评价
本文选用混淆矩阵对影像进形分类结果评价,评价结果如表2:
Table 2. Evaluation of accuracy evaluation results
表2. 精度评价结果评价
下面主要对林地、茶园、裸地以及建筑用地等四种地类的面向对象分类结果进行分析。在仅基于光谱信息和NDVI,不加入纹理特征的分类方案中,分类总体精度为80.41%,Kappa系数为0.76。其中林地被错分的现象较少,其制图精度达到了95.43%,其次是裸地和建筑用地,制图精度分别为79.89%和81.26%,茶园的分类精度较低,制图精度为53.83%。加入纹理特征后,分类精度明显提高,林地制图精度达到95.40%,建筑用地达到92.91%,裸地达到87.67%,茶园达到73.92,分别提高了,−0.03%、20.09%、7.78%、11.65%,将两种方案进行对比,总体加入GLCM的纹理特征比不加入纹理特征的总体精度提高了7.05%,kappa系数提高了0.11。
5. 结论
本文以勐海县研究区,采用Wordview-3高空间分辨率遥感影像,基于多尺度分割后,用GLCM纹理特征计算对象的值,再采用SVM分类方法提取地物类型,总体分类精度达到87.46,总体精度比基于像元NDVI的分类提高了7.05%,Kappa系数提高了0.11。此外,面向对象分类结果能够更加清楚地展示地物形状特征。多尺度分割面向对象分类方法更适合的Wordview-3地物信息提取,具有较高的精度和更好的分类效果。在多尺度分割面向对象分类中,多尺度分割使影像对象的尺寸适合于不同的地物目标,面向对象的分类方法可以相对快速准确地从高空间分辨率遥感影像中提取地物特征。
高分数据的应用还有非常广阔的前景,特别是地物识别研究,具有非常重要的意义,所以,还需要在算法和应用方面不断加强。另一方面,地物的分类是非常复杂的,而且目前地物分类的精度要求越来越高,所以,基于Wordview-3数据的图像处理、分割尺度以及分类算法等研究还有待加强。