1. 引言
遥感作为一种重要的技术手段,广泛应用于全球范围内,用于采集地球及其变化的数据和信息。遥感技术发展迅速,其宏观性及快速性等特点不断提升,使其进入一个能够精准有效地提供海量自然资源监测数据及应用研究的新阶段,遥感技术的快速发展使其成为自然资源动态监测的重要手段[1]。
监督分类是遥感图像分类重要方法之一。随着遥感影像处理技术的深入研究,国内外学者提出了多种经典的监督分类算法,包括最大似然法、马氏距离法、最小距离法和二值编码分类法等。虽然这些监督分类方法都是基于地物的光谱特征统计进行计算机分类,但由于算法差异,它们展现出不同的分类精度和特点。
本文以某县为研究区,选取哨兵Sentinel-2多光谱影像,利用多种监督分类方法进行遥感分类,基于全样本对分类结果进行精度评价,对分类所得的每个像元逐个分析,获取监督分类实验结果相较于基准数据的误差转移矩阵,并计算多个精度指标,从而定量化分析分类结果,探究不同监督分类方法的分类精度及其特点。
2. 研究区概况
研究区域总面积1821平方千米,南北长约75.6千米,东西宽约37.4千米。其地势北高南低,地形复杂多样,四周环绕山脉,中央则是丘陵、平原与洼地交织。温带季风气候,地类齐全。
3. 研究方法
本文以某县为研究区域,选取哨兵Sentinel-2多光谱影像为实验影像,利用多种监督分类方法进行分类,并将2021年国土变更调查数据作为标准数据,采用全样本定量评价方法检验不同分类方法的精度及特点。
3.1. 监督分类
监督分类,一种以统计学习原理为基础的识别策略遥感分类技术,常被称为训练分类法。其核心机制依赖于典型训练样本的进行分类,即通过对已确定地类区域的样本进行选择性利用,获取关键特征参数,以此构建能够精准区分各类别的决策函数。这种方法巧妙地融合训练数据的特性,提升分类准确性和泛化能力。
3.1.1. 最大似然分类法
最大似然分类法,是一个采用了贝叶斯标准法的图像统计监督与分级技术,具有简单、实施方便等优点,比较适合用于波段较少的多波段数据。它根据了统计学的极大似然估计定理,也是监督分析中最常见的方法之一。该技术的核心理念在于:利用从模拟系统中随机提取的n组样本的数据,对样本数量进行参数估计,以便寻找可以最有几率地生成观察样本的系统事件发生树。
其主要过程如下:
(1) 确定研究区域和影像波段及特征;
(2) 依旧实地调查资料,在图像上选择训练样本;
(3) 计算训练样本特征参数,依据各类训练样本图像数据,计算和确定先验概率密度函数,建立一个判别函数集;
(4) 像元分类,将训练区以外的图像像元逐个逐类代入公式,通过比较每个像元对各类别的归属概率,将其分配到概率最大的类别中[2]-[4];
(5) 生成分类结果图,通过对各类别赋予特定值,通过类别映射将数据集中的像素值替换为相应的类别值,这一过程最终生成了一幅富有主题特征的映射图像,它清晰地展示了各类别的分布特征。
(6) 分类结果检查,若分类结果不佳,重新选择训练样本并重复以上步骤,直至获取到满意的分类结果。
值得注意的是,最大似然分类法的前提是遥感影像的地物光谱特征必须呈多变量正态分布。如果训练区样本的光谱特征分布不符合这一假设,那么分类结果的精度可能会受到影响。因此,在应用该方法时,需要对数据分布进行充分的评估和调整,以确保分类的准确性。
3.1.2. 支持向量机
支持向量机分类算法产生自机器学习领域,由Vapnik等人在1995年提出,是一种广泛用于数据分类和回归的监督学习模型或算法。其基础思想是采用非线性映射方法,将原始数据域提升至一个高度复杂的特征领域,目的是在这个新型维度中构筑出能有效解析原数据域内非线性区分逻辑的线性决策模型。该算法寻求的最优分离超平面旨在最大化分类间隔值[5] [6],从而确保样本的正确分类。
支持向量机分类算法原理基于统计学习理论中的结构风险最小化原则,通过寻找一个最优的超平面来实现数据的分类。它在处理小规模数据集时展现出高效的学习能力,通过有效约束模型的复杂度,得以显著降低泛化误差的界限,从而显著提升模型在实际应用中的稳健性和适应性。
近年来,SVM在目标检测、深度学习、数据分析等领域获得许多成就。在SVM分类应用中,常利用影像分类训练样本提取的图像纹理特征进行分类。对于多分类问题,常见策略包括一次性求解多个分类面的参数,以及构建并组合多个二分类器。其中,二分类器的组合方式有一对一和一对多两种。
3.1.3. 面向对象分类
面向对象分析方法通过整合邻域像素单元构建目标,其核心在于有效利用高级别的全彩和多光谱图像数据,特别是空间、纹理和光谱特征,旨在实现精细的分类精度,常以矢量形式输出详尽的结果。这一分类过程主要划分为两个关键步骤:向对象构建和对象的分类。在对象构建阶段,常用的技术包括多尺度分割、基于纹理、基于知识、基于分水岭和基于灰度的分割算法。面向对象的分类方法最小分类单元为单一对象,该方法通过整合形态学和拓扑学属性,强化了与空间分布无关的数据信息。同时,它致力于实现真实世界实体与图像元素之间的高度对应,从而在分类过程中减少了不连续的噪声干扰,提升了分类结果的整体性。面向对象分类技术涵盖了影像分割、特征提取、分类规则建立和信息提取等关键步骤。现今,面向对象的影像分类方法在多种遥感软件中实现,简译遥感解译软件简化分类的操作步骤,降低了用户使用面向对象的分类方法的上手难度,易康软件提高了高空间分辨率影像的分类精度。
3.2. 精度分析评价指标
3.2.1. 总体精度
总体精度是一个衡量自然资源分类结果准确性的重要指标。它指的是在随机抽取的样本中,分类结果与实际地物类型一致的栅格单元数占全部抽取栅格单元数的比例。这一指标能够体现遥感影像分类结果与检验样本中实际地物相同的概率,从而评估分类结果的可靠性。公式为:
(1)
其中,
表示总体精度,
表示检验样本中与分类正确的栅格数总和,
为分类类型个数;
表示样本栅格总数。
3.2.2. Kappa系数
Kappa系数是检验分类结果精度的重要指标之一,Kappa系数的计算是基于混淆矩阵的,具体计算公式为:
(2)
是混淆矩阵对角线元素之和与整个混淆矩阵元素之和的比值,即总体精度,
是所有类别分别对应的“实际与预测数量的乘积”之总和,与“样本总数的平方”的比值。
通常Kappa值落在0-1间,数据越趋近于1,代表分类结果一致性越好。
3.2.3. 用户精度
用户精度是分类精度评估中的一个重要指标,反映了分类结果中某一类别被正确分类的比例。公式为:
(3)
其中,
指用户精度,
指第类自然资源类型正确分类像元数,
采用全样本的精度评价方
法,能够对所有像元逐个精度验证,相较于抽样的方法具有显著优势。此类方法通过计算遥感影像分类结果相对于检验数据的误差转移矩阵,进一步得到多种定量化指标,从而更准确地评估分类结果。
我们采用了栅格计算技术,利用ArcGIS 10.2对已验证的栅格数据集与分类栅格数据集进行了空间上的复合分析。具体的计算公式为:
(4)
其中
为栅格计算值,
验证栅格数据值,
为分类结果栅格数据值。
通过这一计算,我们可以得到一个新的文件图层,其中每个栅格的值都代表了验证数据与分类数据的组合。我们采用了一种编码系统来评估土地覆盖类型的分类准确性。十位数数字与个位数数字一致为分类正确的结果。具体而言,数字11代表的是,原本属于耕地的区域在遥感图像分析中被准确地识别为耕地;而数字12则意味着,原本的耕地区域被错误地划分为林地。通过这种方式,我们能够精确地衡量分类算法的性能,并且能够详细地展示每种土地类型在分类过程中的错误分配和遗漏情况。
综上所述,采用全样本对所有分类像元进行逐个精度验证分析评价的方法,结合误差转移矩阵的计算,为我们提供了一种更全面、准确的评估遥感影像分类结果精度的方法。
4. 实验结果与分析
本文选用遥感卫星哨兵Sentinel-2多光谱影像,在可见光、近红外和短波红外光谱范围中共有13个波段,不同波段空间分辨率不同,有10 m、20 m、60 m三种,覆盖某县,影像拍摄时间是2021年10月13号,图1用波段4,3,2模拟真彩色图像,合成RGB进行显示,如图1所示。
Figure 1. Remote sensing image of a certain county
图1. 某县遥感影像
根据原始遥感影像的光谱特征,分别利用ArcGIS软件最大似然分类方法,ENVI软件最大似然法、支持向量机法,简译软件面向对象的分类方法进行分类;将某县2021年度国土变更调查数据栅格化处理,作为验证不同监督分类方法分类精度的标准数据,对所有分类像元逐个进行精度验证分析评价。表1为不同监督分类方法分类精度表,表2不同监督分类方法各类别分类精度表。
Table 1. Classification accuracy of different supervised classification methods
表1. 不同监督分类方法分类精度
分类方法 |
总体分类精度(%) |
Kappa系数 |
用户精度(%) |
最大似然法(ArcGIS) |
83.1913 |
0.7909 |
88.56 |
最大似然法(ENVI) |
83.2393 |
0.7601 |
85.95 |
支持向量机(ENVI) |
80.1665 |
0.7439 |
89.28 |
面向对象(简译) |
82.1829 |
0.7250 |
85.56 |
Table 2. Classification accuracy of different supervised classification methods for each category
表2. 不同监督分类方法各类别分类精度
分类方法 |
最大似然法(ArcGIS) |
最大似然法(ENVI) |
支持向量机(ENVI) |
面向对象(简译) |
耕地 |
类别精度(%) |
85.3152 |
85.0850 |
82.5677 |
80.6528 |
林地 |
81.2393 |
83.9623 |
81.9559 |
79.5268 |
草地 |
55.1665 |
48.2158 |
62.2865 |
61.5236 |
建设用地 |
69.1829 |
65.9634 |
72.5632 |
77.6521 |
续表
水体 |
|
84.6951 |
85.6864 |
80.2154 |
93.5632 |
其他用地 |
45.1263 |
53.6981 |
52.2136 |
53.2187 |
总体精度(%) |
|
83.1913 |
83.2393 |
80.1665 |
82. 6829 |
通过表格可知,基于ArcGIS的最大似然分类方法总体分类精度最高,基于ENVI的最大似然分类方法总体分类精度次之,两个平台最大似然分类方法总体相差不大;基于ENVI的支持向量机的整体对各地类分类效果较为均衡;面向对象的分类方法在高分辨率遥感影像分类中优势较为突出,Sentinel-2多光谱影像分辨率为10 m,存在大量混合像元存在,基于简译的面向对象的分类方法分类精度与传统分类方法难以拉开差距。
5. 结论
本文以某县为研究区域,选取哨兵Sentinel-2多光谱影像为实验影像,利用多种监督分类方法进行分类,并将2021年国土变更调查数据作为标准数据,检验不同分类方法的精度及特点,经实验证明,基于ArcGIS的最大似然分类方法总体分类精度最高,基于ENVI的最大似然分类方法总体分类精度次之,两个平台最大似然分类方法总体相差不大;基于ENVI的支持向量机的整体对各地类分类效果较为均衡;面向对象的分类方法在高分辨率遥感影像分类中优势较为突出,Sentinel-2多光谱影像分辨率为10 m,存在大量混合像元存在,基于简译的面向对象的分类方法分类精度与传统分类方法难以拉开差距。