1. 引言
随着遥感技术的迅速发展,高空间分辨率遥感影像数据已成为快速获取地表信息的重要数据源。高空间分辨率遥感影像数据不仅能反映出一个地区的地形地貌和空间分布,更能清楚地反映出实际地物的几何形状、纹理特征等细节信息。传统的基于像素的分类方法是以遥感影像中的单个像元作为基本处理单元,仅利用了其光谱特征,且在地物光谱差距非常明显的情况下,才会得到较好的分类结果。而高空间分辨率遥感影像的光谱分辨率并不高,往往其几何纹理信息丰富,影像上地物景观的结构、形状、纹理等细节信息都非常突出 [1]。因此,如果利用传统的基于像素的分类方法对高空间分辨率遥感影像进行分类研究会造成空间数据的大量冗余 [2],导致分类结果精度低,分类效率不高。针对高空间分辨率遥感影像的特点,Baatz等提出了面向对象的分类方法 [3]。众多实际应用表明,面向对象的分类方法能够充分利用高空间分辨率遥感影像丰富的形状和纹理信息,实现高精度、高效率的地物分类。黄瑾在四川省松潘县土地利用信息的提取中采用面向对象的分类方法,取得了较好的结果,并与传统的分类方法进行了比较,证明该方法分类效率更高 [4]。宋晓阳等采用面向对象技术对西双版纳河流域国家级自然保护区土地利用分类结果表明,该算法总体精度达80%以上 [5]。
面向对象的高空间分辨率遥感影像分类方法已逐渐成为一种主要的地物分类方法,并随着分类技术的改进,形成了较为系统的流程架构。本文以研究区高空间分辨率遥感影像数据为基础,结合面向对象技术和机器学习C5.0决策树算法,对研究区土地覆盖进行分类研究,以提高影像分类的精度、效率和自动化水平。
2. 研究区域与数据预处理
2.1. 研究区域
本文选取浙江省舟山岛作为研究区,舟山岛位于我国东南沿海,地处29˚94'~30˚19'N,121˚93'~122˚34'E之间,土地总面积502.65平方公里,是中国第四大岛 [6]。其地貌以山地丘陵为主,集中在岛屿中部,整体呈西北—东南走向,海岸线蜿蜒曲折,四周为冲积平原,是典型的海岛地形。研究区土地覆盖类型主要为水体、林地、农田、建筑物等,其中林地面积约占50%,各类地物交错分布,便于进行土地覆盖分类的相关实验研究。
2.2. 数据预处理
本文选取2016年第一季度的GF-1卫星高空间分辨率遥感影像作为主要数据源,影像清晰、色彩真实,空间分辨率可达2 m,包括蓝色、绿色、红色以及近红外四个波段。利用ArcGIS软件对初始数据进行预处理,主要包括:影像的几何校正、正射校正,以及匀色、镶嵌、裁剪等数据处理操作,其中影像RGB合成绘制采用432组合。经过预处理后的舟山岛高空间分辨率遥感影像如图1所示。

Figure 1. High spatial resolution remote sensing image of Zhoushan Islan
图1. 舟山岛高空间分辨率遥感影像
3. 研究方法
基于高空间分辨率遥感影像的特点,本文设计了面向对象的高空间分辨率遥感土地覆盖分类算法流程,具体流程如图2所示。面向对象的分类方法通过对高空间分辨率遥感影像进行分割,生成由相邻同质像元合并而成的影像对象(不规则多边形图斑),再根据分类目标综合分析影像对象的光谱、形状、纹理等特征信息,应用影像分类算法,选取适当特征,并以每个影像对象作为基本处理单元计算相应的特征值,并以此为依据实现高空间分辨率影像的土地覆盖分类。面向对象的分类方法核心是影像分割和影像分类。该方法不再是以单个像素作为基本处理单元,而是以相邻的同质像元合并而成的影像对象作为基本处理单元,因此影像分割是影像分类的基础和先决。

Figure 2. Flow chart of classification method
图2. 分类方法流程图
3.1. 影像分割
影像对象的适度分割是精确分类的基础。综合利用高空间分辨率遥感影像的光谱和丰富的形状、纹理等特征信息进行影像的分割操作,将一副影像划分为若干互不交叠的不规则多边形图斑,以分离和表示相关地物目标。较为经典的影像分割方法有边缘检测法和区域分割法 [7]。本文采用其中的一种基于区域生长合并的分割方法。该算法分割过程中,在确保合并后对象的异质性小于设定好的尺度参数的前提下,将相邻的同质像元合并成一个影像对象。循环进行,直至最小的异质性大于设定的尺度参数,则停止分割。因此,影像多尺度分割参数的设置直接决定着分割结果的好坏。
分割参数主要包括尺度参数、光谱参数、形状参数。光谱参数和形状参数共同构成像元同质性的标准。形状参数又由紧致度和光滑度进行描述。通过调节各参数的权重,实现不同尺度的影像分割。尺度参数则是判断单个像元是否可以合并到相邻对象的阈值标准。如果尺度过大,影像中的小地物可能被合并到大地物中,导致分类简单;如果尺度过小,则影像中的大地物可能会被分成非常多形状破碎的图斑,即“椒盐现象”。一般来说,各参数的设定主要基于先验经验,通过不断调整各参数值,并综合分类目标,目视判读分割效果,选择最优参数值。研究区影像分割的局部细节图如图3所示。

Figure 3. A part of segmentation details
图3. 影像分割细节
3.2. 特征分析与提取
影像分割生成一系列影像对象,这些影像对象作为基本处理单元同样包含光谱、形状、纹理等特征信息。针对高空间分辨率遥感影像特点,通常光谱特征不足以完整反映地物对象,而形状和纹理特征则越来越显示出其不可忽视的辅助甚至主导作用,能够有效解决“同谱异物”和“同物异谱”问题 [8]。在选择特征时,并非所选特征越多,分类效果越好,而是应当有针对性地选择分类最显著的特征进行分类训练。过多的特征会造成大量冗余数据,降低计算效率,甚至产生“过拟合”问题,严重影响分类精度。
基于研究区舟山岛植被覆盖广、农田与城镇集中等海岛地区特点,本文主要提取对象的光谱(均值、标准差等)、形状(长宽比等)、纹理(同质性、相异性等) 3类简单特征。表1列举了3类特征中较常选取的特征参数。为了进一步提高特征针对性,减少计算冗余,将所选对象特征输入后结合机器学习C5.0决策树算法进行特征分析和优选,筛选提取出最优特征组合。
3.3. 土地覆盖分类
土地覆盖分类即是对每个影像分割对象进行识别,划分为不同的地物类型。研究区土地覆盖类型为水体、林地、建设用地、农用地、裸地、草地。水体除包括岛上河流湖泊外,还包括岛屿四周海洋;居民地、工厂、道路等较为集中,统一归为建设用地。由于每种地类不是由单一种类的地物组成,而是包含许多语义上类似的地物,因此在采集训练样本时,要尽量实现对各种地物样本的均匀覆盖,保证所选样本纯净,并给每个训练样本赋予相应的类标签(以1,2,3,4,5,6代替)。
依据训练样本的对象特征和类标签,采用恰当的影像分类算法训练获得判别函数或分类规则,并以此为依据对每个影像对象进行识别分类。现在采用较多的是最近邻分类算法,该算法统计各地类训练样本的特征,并以此为特征中心建立特征空间,通过计算各未分类对象的特征与样本特征中心的距离,将该未分类对象划分到距离最近的样本所对应的类别中 [9]。该算法实现简单,但分类耗时较长、容易受到噪声影响。本文综合分类目标及实际成像情况,选用机器学习C5.0决策树算法进行样本训练及影像分类。C5.0决策树算法是在C4.5算法基础上改进而成的最新决策树算法,具有训练速度快,规则易理解,适用性强等特点。决策树算法的基本原理如图4所示:从根节点(T)开始,以不同对象特征为依据生成新的叶子点(T1, T2, T3)进行二叉分支,直至到达叶结点(A, B, C, D, E),从上至下构建树状结构 [10]。该算法通过样本训练获得相应叶子点的分类特征,并根据这些特征将未分类对象一步步细分到不同类别中。C5.0决策树算法根据信息增益率(信息熵的下降速度)来选择最优特征构建分支,并通过“剪枝”技术,即对决策树各叶子点进行裁剪或合并来减少叶结点数量,最终选取目标分类结果最显著的特征构建决策树 [11]。这使得特征优选、样本训练的客观性和效率大大提高。同时,C5.0决策树算法融合了Boosting技术,通过综合考虑被错分、漏分的数据来构建多个决策树,提高最终的分类精度。

Figure 4. Basic principle of decision tree algorithm
图4. 决策树算法基本原理
3.4. 分类结果与精度评价
依据本文设计的面向对象的高空间分辨率遥感土地覆盖分类算法,舟山岛土地覆盖分类结果如图5所示。图6则展示了研究区局部分类结果的细节情况。可以看出,舟山岛主要地物类别为林地,主要分布在岛屿中部,呈西北–东南走向;农用地、建设用地交错分布在岛屿四周的平原上,建设用地主要集中在岛屿东南部。林地、水体、农用地、建设用地分类效果较好,内部完整,较好克服了“椒盐现象”,林地与农用地能够很好地区分出来,道路、桥梁等也能够很好地提取出来。总的来说,分类结果形状较为规整,边界区分明显,接近实际地物。

Figure 5. The map of land cover classification in Zhoushan Island
图5. 舟山岛土地覆盖分类图

Figure 6. Part of land cover classification details in Zhoushan Island
图6. 舟山岛土地覆盖分类图细节
对算法进行精度评价是检验算法可行性、有效性的重要手段。本文使用混淆矩阵进行分类结果的精度评价,按照均匀分布的采样原则,随记选取了1000个样本点进行验证。通过目视解译与分类结果比对,由此计算出混淆矩阵如表2所示。从表2可以看出,林地、水体、建设用地、农用地的分类精度较高,裸地和草地的分类精度较低。这是因为,裸地和草地所占面积较小且零星分布在建设用地、农用地、林地之间,使得影像分割时较难形成规则完整的对象,同时训练样本较少,分类训练时较难生成高精准的判别函数或分类规则,从而面向对象的分类方法实质上退化成传统的基于像素的分类方法。同时在分类过程中,也存在着低覆盖度林地与农用地难以区分,建设用地与裸地难以较好区分的问题。可以考虑借助DEM数据辅助分类或分区分类的一些方法来尝试解决。总体上看,面向对象的分类结果总体精度达到91%,Kappa系数达到0.87,充分说明了本文设计算法流程的可行性、有效性及分类结果的可靠性。
4. 结论
本文基于高空间分辨率遥感影像特点,采用面向对象的方法进行土地覆盖分类研究,重点分析了影像分割、特征分析与提取、监督分类等关键技术,并结合机器学习C5.0决策树算法对特征选取和对象分类进行了优化。通过浙江省舟山岛土地覆盖分类的实例研究表明,面向对象的高空间分辨率遥感土地覆盖分类算法能较好地消除少数像元引起的“椒盐现象”,较大程度地利用高空间分辨率遥感影像丰富的形状、纹理等细节特征,克服“同物异谱”和“同谱异物”问题。特别是结合C5.0决策树算法,减少了特征选取的主观性,提高了分类自动化水平,基本实现了高精度、高效率的土地覆盖分类。面向对象的高空间分辨率遥感土地覆盖分类方法的通用性和有效性较好,但还需改进。多尺度分割参数对影像分割及分类至关重要,但主要依靠先验经验选取,具有较大的主观性,如何科学设置最优分割参数需进一步研究;同时C5.0决策树算法对样本依懒性强,如何选择和纯化样本,以建立更精准的判别函数和分类规则,提高分类整体精度和效率也是下一步研究的方向。
致谢
感谢长安大学吴田军副教授提供的高空间分辨率遥感影像数据和对本文的指导帮助!