1. 引言
无人机航拍相对于传统航拍具有机动灵活、环境适应性强、作业成本低的优势,能快速准确获取飞行困难地区的高分辨率影像,已经成为航空摄影测量的重要手段之一 [1] [2] [3] 。无人机影像不仅能克服传统遥感手段在多云雾地区难以获取数据的缺陷,其获取的高分辨率数据具有更加明显的地物几何特征和纹理特征,包含更丰富的空间信息,从而能够更加容易地获取地物类别属性信息 [4] 。传统的基于像素的分类方法主要利用遥感影像丰富的光谱特征,且地物间的光谱差异非常明显。而普通无人机提供的高分辨率影像通常只包含较少的波段,光谱信息单一。因此,如果利用传统的基于像素的分类方法进行无人机影像的分类将会造成空间数据的大量冗余,分类精度低。Baatz M等提出面向对象的高分辨率遥感影像分类方法 [5] 。面向对象的分类方法能够充分应用无人机高分辨率影像的空间信息,已经在无人机影像地物分类中取得了较为准确的结果。如何少林等利用面向对象的方法对无人机影像进行了土地利用信息的提取研究 [6] 。董梅等结合无人机遥感影像和面向对象方法较为准确地提取了烟草的种植面积 [7] 。许燕等对无人机影像分类的结果表明,面向对象分类方法的总体精度在80%以上,明显高于最大似然分类 [8] 。
eCognition软件采用基于目标信息的遥感信息提取方法,它集合了面向对象的分割方法以及大量的分类规则,适用于高分辨率遥感影像的解译。目前已有学者采用eCognition面向对象方法进行遥感影像分类的研究,并取得了较好的结果 [9] [10] [11] 。无人机影像包含丰富的空间信息,应用eCognition面向对象方法进行无人机影像分类能够快速、准确的获取地物信息。因此,本文利用eCognition面向对象的分类方法对无人机影像进行地物分类。
2 研究区域与数据
2.1. 研究区域及无人机影像获取
以具有代表性的贵州省贵阳市某城乡结合部作为实验区,采用Phantom 4 DJI无人机对实验区进行拍摄,影像获取的时间为2017年12月,拍摄高度为100m,选用的数据大小为6000×5000像元。无人机影像包含红、绿、蓝三波段。实验区域包含菜地、裸地、道路、房屋、水体、废弃建材用地、灌丛、树木等。
2.2. 无人机正射镶嵌影像生成
利用ENVI OneButton生成无人机正射镶嵌影像。ENVI OneButton是ENVI新增的无人机图像处理工具,利用先进的摄影测量和计算机视觉算法,采用空三加密和区域网平差技术快速得到高精度、具备标准地理参考、无缝镶嵌的正射影像。ENVI OneButton对影像的正射处理主要包含影像匹配、空三计算、正射影像生产和镶嵌匀色等步骤。生成的无人机正射影像无明显拼接痕迹(图1),颜色色调平衡,影像边界无明显畸变,可用于地物分类。
3. 面向对象的地物分类
eCognition软件的提取对象是基于影像分割后的多边形,综合影像空间和波谱信息,对影像进行分类。进行面向对象分类的核心流程包含是对象分割和分类。eCognition在对象分割后,选择参加分类的对象特征,并按照对象在特征空间中的距离及相应的分类规则进行分类。
3.1. 影像分割
3.1.1. 多尺度分割
对象分割是分类的基础,分类的精度很大程度上取决于分割的效果。eCognition中的多尺度分割是用的最多、最有效、速度最慢的一种分割方式。多尺度分割通过合并相邻的像素或小的分割对象,在符合对象异质性标准前提下,进行区域合并,实现影像分割 [12] 。
多尺度分割的参数设置决定着对象间的差异,也影响着对象的数量和面积的差异。多尺度分割是一个合并与判断算法是否终止的反复过程,并不对原始影像提取与知识相关的任何信息。在多尺度分割过程中,光谱、紧致度、平滑度等作为度量是否同质或者异质的标准。分割时,将具有相同或者相近的特征性质的像素组合成一个对象。不同的对象间的像素则具有明显的特征差异。在已分割的对象层基础上,

Figure 1. Orthographic image of experimental area
图1. 实验区正射镶嵌影像
通过比较相邻对象间的异质标准,当其小于定义的尺度参数则继续合并为同一个对象。
多尺度分割的三个主要参数分别为尺度参数、颜色参数和形状参数。颜色参数和形状参数用来表示对象的同质性,两者的权重之和为1。形状参数由光滑度和紧致度来表示,二者的权重之和为1。同一幅影像在不同的分割参数设置下生成的影像对象及其包含的特征不同,分割产生的对象将直接影像分类的精度和效率。因此在分类前,要选取合适的尺度参数,才能在分类时充分利用对象特征。最优分割应保证对象内部同质性最大,不同对象间的异质性尽可能大。
3.1.2. 最适分割参数确定
分别设置不同的尺度参数、形状参数和紧凑度参数,通过对比分割对象来确定最适应的分割参数。将形状参数和紧凑度参数分别为软件默认值0.1和0.5,将尺度参数设置为50、100、150、200、250、300,来对比不同尺度参数对分割结果的影响(图2)。

Figure 2. Segmentation results in different scale parameters
图2. 不同尺度参数下的分割结果
尺度参数用来衡量不同对象间的最大异质性。尺度参数越大,对象生成过程中合并的次数越多,产生的差异越多。从图2中可以看出,分割尺度越小,产生的对象斑块越小,产生的对象数越多,分割结果越破碎。当分割尺度设置为100以下时,分割的结果过于破碎,相同地物被分成为多个对象,这样可能导致在分类时同一地物不能被分为同一类。当分割尺度在250以上时,地物出现欠分割,不同的地物类型被划分成同一个对象,如农田中的空地没有从农田中分割出来,裸地中的植被也没有被分割出来。因此,认为最适宜的尺度参数为150~200左右。
固定尺度参数和紧凑度参数分别为150和0.5,设置形状参数分别为0.1、0.3、0.5、0.7,来对比不同形状参数的分割结果(图3)。
在设置形状参数的同时,也定义了颜色参数,即定义了影像层光谱值用于整体一致性准则的比例。形状参数能制约对象形状的发展,形状参数越大,分割后的对象形状越平滑,更符合视觉习惯。当形状参数大于0.9,影像的光谱信息在分割计算中应用的比例少,分割的对象与光谱信息无关,无法充分利用其光谱信息。且形状参数过大时,产生的对象形状越规整,无法反应真实的地物形状。从图3中可以看出,形状参数越大,产生的对象斑块面积越大,其形状大小的差异越少,且对象数越少,对象的形状更加规则平滑。形状参数大于0.5后,虽然道路、房屋等规则形状的地物能更好的被分割,但在农田,植被及裸地区域出现过分割的现象。形状参数设为0.3时,分割的效果较好。
固定尺度参数和形状参数分别为150和0.3,设置紧凑度分别为0.1、0.3、0.5、0.7,分割结果如图4。
形状因子包含光滑度和紧凑度,确定紧凑度后,光滑度也随之确定。光滑度的权重较高,则分割后的对象边界较光滑;若紧致度权重较高,分割后的对象形状较为紧密且接近矩形。紧凑度参数是利用形状准则,考虑整体性,对影像对象结果进行优化。从图4可以看出,紧致度参数设置越大,分割对象的

Figure 3. Segmentation results in different shape parameters
图3. 不同形状参数下的分割结果

Figure 4. Segmentation results in different compactness parameters
图4. 不同紧致度下的分割结果
面积越大,形状越紧密,且较接近规则形状。
综合对比不同尺度参数、形状、紧致度参数的分割效果,当尺度参数为150,形状参数和紧致度参数分别为0.3,0.5时,分割的效果较好。如道路,房屋等地物形状较为规则,水体、农田边界清晰。农田中的空地也能较好地从农田中分割出来,裸地中的植被也能较好地从裸地中分割出来。同一对象包含同种地物,不同地物类型被分割到不同的对象中。
3.2. 影像分类
3.2.1. 特征选择
对象分割后会产生一系列的对象特征,生成的对象特征不仅包含光谱信息、还包含形状、纹理和上下文的信息,从而弥补了对象在合并过程中光谱均质化所造成的信息丢失,这些特征都可以用做影像分类。eCognition针对所选的分类特征和样本对象,形成描述类的模糊逻辑函数。
通过目视解译,在本实验中建立道路、建筑、水体、农田、裸地、灌丛等8个类别,并选择三波段的灰度值以及最大差分、几何特征中的长宽比、形状参数中的紧凑度和密度,纹理特征中的灰度共生矩阵的均质性作为特征进行分类。在选择纹理特征时要谨慎选择,多增加一个纹理特征,eCognition计算的时间会增加较多。参加分类的特征越多,精度不一定越高。分类特征过多会造成特征冗余,增加计算量,降低计算效率,甚至降低分类精度。
eCognition具有分类特征选择优化的功能,在人工选择的特征的基础上进行优化选择,并计算每种类别间的距离矩阵。优化结果显示当选择面积、灰度共生矩阵相关性,最大差分,灰度共生矩阵熵以及红波段灰度作为分类特征时,可分性最大,可分性最小的为废弃建材用地与落地,最小可分距离为1.5592 (表1)。
3.2.2. 最近邻分类
eCognition提供的最近邻分类法,根据人工选定的分类对象特征和训练样本样本,自动建立特征空间,并分配不同特征的权重,计算样本与对象的距离,从而进行分类,是一种监督分类方法。一个对象特征对应该特征空间中的一个维度,在建立特征空间后,对各地物类型选取若干的样本。对象特征在特征空间中都对应一个确定的特征值,选择样本后,样本在特征空间中的特征值也随之确定。最邻近分类在特征空间中计算待分类影像对象与各地类训练样本之间的距离,将该待分类对象归属到最近样本对象所在的类别。
从最近邻分类结果(图5)可以看出,水体的分类效果较好,水体内部完整,边界清晰;农田中的裸地

Table 1. Distance matrix between different classes
表1. 类别间距离矩阵

Figure 5. Nearest-neighbor classification
图5. 最近邻分类结果
以及裸地中的灌丛都能够被提取出来,道路旁边的废弃建材堆积用地也能得到较好的区分。eCognition面向对象的分类结果克服了传统像素分类的“椒盐”问题和由于细微的光谱差异,混合像元造成的碎斑现象;同一地物内部更加完整,边界清晰;分类结果具有丰富的语义信息,便于解释和理解。
4. 精度评价
分类精度是检验分类方法是否可行的首要指标 [13] 。易康软件提供基于样本和基于对象的评价方式。在进行精度评价前,新建测试样本,并保证测试样本在影像中随机分布且与训练样本不重复。利用新建的测试样本对分类结果进行精度评价。精度评价的结果包含混淆矩阵、单一类别的精度分析结果和总体精度分析结果。对每类地物选择测试样本,利用测试样本对分类结果进行精度评价。
从混淆矩阵(表2)中可以看出,水体、灌丛的分类结果较好,一部分建筑被错分为道路,道路也有一部分被错分为建筑和农田,农田一部分被错分为树木和裸地,小部分的树木被错分为农田,灌丛有一部分被分为树木。部分建筑的材质与水泥道路非常相近,在影像上的光谱显示非常接近,容易产生错分现象。沟渠中长有水生植物,且沟渠与农田的形状相近,呈长条状,因而与农田产生错分。农田中,生长稀疏的部分明显能观察到裸地,也容易被分类为裸地。总体来说,分类的精度较好,所有类别的生产者精度在0.65以上,总体精度和Kappa系数分别为83%和0.80 (表3)。
5. 结论
本文利用eCognition软件采用面向对象的分类方法对无人机正射影像进行地物分类。通过选择合理的分割尺度以及分类特征,采用最近邻分类方法,较好地区分出实验区的8类地物,分类总体精度和Kappa

Table 3. Classification accuracy of different classes and overall accuracy
表3. 各类别分类精度和总体精度
系数分别达到83%和0.8。利用无人机影像作为数据源,采用面向对象的分类方法,能够同时在效率和精度上取得较好的效果。面向对象的分类方法不仅能利用影像的光谱信息,还能综合考虑地物的形状,纹理等信息,有效地避免基于像元分类方法产生的“椒盐”现象。面向对象分类的基础是对象分割,分类的依据是对象的特征,分类结果精度很大程度上取决于分割对象。多尺度分割参数的选取对面向对象的分类至关重要,需要进行更加深入的研究。
基金项目
贵州省科技计划项目“铜仁汞污染地区农田系统治理与修复关键技术与工程示范”(黔科合支撑[2017]2967);贵州省科技计划项目“喀斯特山区草地生产力监测数字化管理技术研究与应用”(黔科合支撑[2017]2594);贵州省科技计划项目“高光谱遥感技术评价牧草饲用价值的研究”(黔科合支撑[2018]2371);“贵州牧草资源产业化开发及生态畜牧业科技支撑行动”(黔科合平台人才[2016]5713)。
NOTES
*通讯作者。