1. 引言
卫星遥感具有大范围探测、实时性高、信息丰富等优点,已经成为提取江河湖库等水体的位置、面积、轮廓(边界)及水位的一种有效手段。利用卫星遥感数据进行水体信息提取的数据源主要包含雷达遥感数据、光学遥感数据以及两者结合的数据。在可见光范围内,水体的反射率总体上比较低,不超过10%,一般为4%~5%,并随着波长的增大逐渐降低。在红外波谱段,水体吸收了近红外及短波红外谱段内绝大部分的入射能量,反射能量很少;而其它地物所吸收的能量较小,具有较高的反射率,这使得水体在红外波波谱段与植被、土壤、城市建筑等地物有明显区别,遥感影像水体提取正是利用目标地物在不同波谱段表现出不同的反射或辐射特性来确定水体的位置、面积和边界等。水体信息提取采用了低、中、高不同分辨率的卫星遥感手段,中低分辨率遥感具有良好的现势性和宏观性,高分辨率遥感影像解译质量高,但高分影像获取周期长、时间分辨率较低,低分影像可以监测到水体每日的变化情况,时间分辨率较高,不同分辨率影像能够在空间、时间上互补。
在基于光学的多光谱、高光谱遥感水体提取研究方面,目前应用最多的水体提取方法包括基于像元分类的阈值法、基于目标/区域分类的分类器法和不同方法的集成法三类。阈值法多应用于中、低分辨率影像,包括单波段法,多波段法的谱间关系法、比值法、水体指数法等 [1] [2] [3] [4]。分类器法更适用于地物细节信息丰富的中、高分辨率影像的水体提取,主要包括支持向量机、决策树、面向对象的方法,以及基于浅层学习和基于深度学习的方法 [2] [3] [4] [5]。集成法融合了阈值法、分类器法,以克服采用统一的全局性模型提取各个不同水体单元所存在的不足 [6]。多年来有关遥感影像水体信息提取的研究,尽管已形成了许多有效的方法,但由于地表覆盖类型复杂、水体类型多样、浅滩/潮汐带/湿地等区域的水陆交叉、水体细小等,加上水体与山体等阴影混淆、污染水体和浮游植物引起的光谱差异、城市水系中水面漂浮物影响、空间分辨率受限下混合像元以及同物异谱和同谱异物现象等干扰因素,水体精细化提取方法的普适性和泛化能力还有待进一步提高 [1] [2] [6]。
遥感影像中的光谱、纹理、局部结构、形状、颜色等特征信息是水体提取的关键要素,也是从背景中分割感兴趣目标/区域(统称为“图形”)以及辨识地物属性的重要依据。从计算机图像处理与模式识别的角度来看,水体提取所涉及的图像分割和“图形–背景(figure-backgrounds, FB)”分辨这一逆问题的求解,现有的诸如基于对象机理的动力学方程建模、数据驱动建模、基于学习方法受限于有限样本数据训练的建模等仍然解决不了求解的不适定(病态的)问题。模型与对象之间在在系统响应上难以做到“等价”,直接影响到图形–背景辨识的“精度”和水体信息的高质量解译。
大自然为从复杂背景中分辨感兴趣目标/区域提供了丰富的灵感来源。蝇类昆虫–果蝇复眼视觉系统的高适应性和高可靠性是一种自然特性,与灵长类动物的视觉系统相比,复眼分辨力和视觉计算资源尽管有限,对于视觉杂乱场景中(且噪声干扰条件下)“图形”的分辨和跟踪过程,在本质上却是良态和适定的 [7] [8]。受复眼视觉过程的启发,本文提出一种仿蝇视觉“图形–背景”分辨的遥感影像水体提取方法,探索独立于背景建模、先验信息以及不依赖于样本数据训练隐式模型的研究策略,为改进现有水体信息提取方法的局限性提供一种新途径。本文的主要贡献概括如下:
1) 借鉴复眼视觉系统的功能优势,基于最新的昆虫生理学研究发现,建立了一种新的仿生蝇视觉“图形–背景”分辨的遥感影像水体提取模型(water body extraction model from remote sensing images based on bionic drosophila vision of FB discrimination,简称WBEM-BDV),模拟了视网膜–薄板–髓质–小叶视神经纤维网对于杂乱背景中“图形”的分割和辨识的神经计算过程。
2) 在对薄板单极细胞LMCs中一类L1、L5,髓质Tm3/Mi1等神经元(ON通道),以及L2、L4、Tm1/Tm1(OFF通道)分别向下游层小叶投射的传递路径中,引入二级侧抑制机制,对被薄板分解成两条平行的ON和OFF通道的视觉信号,分别做二次视觉滤波(secondary visual filtering, SVF),有效增强了杂乱背景下对“图形–背景”分辨的抗噪性能。
3) 通过模拟小叶及小叶板中小叶柱细胞LCs和小叶板切向细胞LPTCs对特征参数的提取和“图形–背景”辨识表现出的显著选择性神经过程,设计的光谱特征与空域特征交叉相关的多光谱遥感影像特征提取算法,经实验测试,验证了其在城市湖泊地区综合复杂特性背景下对于ON和OFF通道信号的整合,以及对于水体分割和辨识具有的敏感响应偏好和精细化的信息提取性能。
2. 复眼视觉信息加工的神经通路和“图形–背景”分辨机制
蝇类昆虫–果蝇(drosophila)的头部有一对复眼,三只小的单眼(用于导航)和一对触角。复眼(compound eye)的形状呈曲面型,由小眼(ommatidium)成簇排列而成。单侧复眼大约有750~800小眼。每只小眼中包含8个感光细胞(即小眼视网膜细胞)和视紫红质(photopigment rhodopsin, Prh)等色素细胞,感光细胞R1~R8中,R1~R6负责大范围光谱的色觉 [8] [9],R7和R8具有区分不同光谱的敏感性,R7对紫外光线敏感,R8对蓝、绿光敏感,主要负责感知偏振光和色觉 [9] [10]。场景光场被不同小眼中的不同感光细胞所感受,并产生各像点物像的光电转换响应,来自不同小眼的各像点物像在复眼视网膜上镶嵌聚集。感光细胞发送传像信号通向蝇脑内两侧的薄板(lamina),薄板对各个小眼光感/传像信号进行整合,其功能特征类似视觉“胶片”。薄板与下游的髓质(medulla)、小叶(lobula)和小叶板(lobula plate)神经节层连续依次相连,而后汇聚到腹外侧原脑区VLP (ventrolateralprotocerebrum),最后到达中央脑(central brain)的各个脑结构,形成复眼视觉信息加工处理的神经通路 [7] [9]。复眼感光部将获取到的光强、光谱、时间、空间等复合光信息传递给薄板–髓质–小叶组成的视叶(optic lobe)神经纤维网进行加工,提高成像的敏感度、信噪比以及静/动特征参数提取能力,实现“图形–背景”的分割和辨识。
复眼感光部和神经元线路结构遵循神经叠加原理,视叶的每层神经纤维网是对应于每个小眼六角形晶格的柱状组件重复排列 [11]。视叶的柱状组织结构是从果蝇视野中每一个像素所对应的薄板层的每一个柱状组件开始,直接接受来自R1~R8感光细胞的投射,形成一个单一的柱状视觉单元(即所谓薄板弹药筒(laminar cartridges)结构形式),然后,延伸至髓质、进入小叶和小叶板。薄板层的每一个柱状组件主要包含薄板单极细胞LMCs (lamina monopolar cells),LMCs中L1~L5对接受的光信号能够选择性地调节信号的强度和频率分布,相近神经元彼此之间的侧抑制(lateral inhibition)现象使对比的差异增强、突出边缘,且具有显著的光照亮度适应性和对图像的细微间断处进行拟合以及聚类效应。L1~L5在将视觉信号传递给下游层之前,被分解成两条平行的ON (打开)和OFF (关闭)信号通道 [12]。ON通道,对由暗变亮、亮色增强做出响应、对有光的边缘敏感,OFF通道,对由亮变暗、亮色衰减做出响应、对无光的边缘敏感。髓质层包括髓质固有细胞Mi (medullaintrinsic cells)、跨髓细胞Tm (transmedulla cells)、末稍髓质细胞Dm (distalmedulla cells)、跨层细胞(translamellar cells)以及位于髓质和小叶板间的传出细胞(centrifugal cells) C2、C3等类型。来自R1~R6的信号经薄板L1到髓质Mi1、Tm3再汇集于T4,形成ON通道的信号最强连接。类似的,从薄板L2、L3 (包括L2与L4的层内连接)到髓质Tm1,Tm2、Tm4和Tm9组成向下游小叶传递的另一OFF通道 [10] [13]。ON/OFF通道中各神经元对信号的处理存在时间差异,这种信号延迟线会对图形亮/暗色边缘分割以及亮/暗边移动的检测产生作用。R7/R8经薄板分别延伸至髓质层,并向小叶投射,小叶参与了光谱偏好、颜色和偏振光视觉 [10]。小叶和小叶板是髓质的正下游层。小叶中小叶柱细胞(lobula columnar cells) LCs覆盖了绝大部分的小叶,与小叶板切向细胞LPTCs (lobula plate tangential cells)一起,它们的轴突大多数投射到原脑区或与颈及足、翅运动有关的神经元 [7] [11]。
有关复眼的组织学和神经生理学研究已有一个多世纪的历史。当今,其视觉系统也已成为研究计算机视觉与模式识别问题的重要模型 [7] [14] [15]。特别是近十多年来,又取得了许多新的研究发现 [9] [10] [12] [13] [16]。例如,在10年前,对于果蝇的ON、OFF信号通道还是未知的,对于“图形–背景”分辨机制更多的是猜测,而现在,有关ON、OFF通道的神经元细节和信号传导,LPTCs及其亚群对特征参数的提取和图形–背景辨识表现出的显著选择性等神经计算机理也越来越清晰,这为建立精细化的人工复眼视觉信息加工神经网络模型奠定了生物学基础。
3. 仿蝇视觉“图形–背景”分辨的遥感影像水体提取模型(WBEM-BDV)
构建的仿生蝇视觉“图形–背景”分辨的遥感影像水体提取模型(简称WBEM-BDV模型),设有视网膜层计算层、薄板层计算、髓质层计算层、小叶和小叶板层计算四个层级 [17]。WBEM-BDV模型框架如图1示意。
1) 视网膜层计算
基于复眼感受光场和光谱的刺激,模拟视网膜感光细胞光电转换响应。设计“重叠捆绑”的三个3 × 3小观察窗口,构建“仿小眼感受野”,来近似一个小眼的采样(x, y, k),分别代表仿小眼感受野中心“像元”的坐标和k波段的采样。采用“仿小眼感受野”遍历地滑动扫描的方式,读取“光强–光谱”遥感影像信息,形成对遥感影像输入的网格化读取处理,模仿小眼感光传像信号的投射,在薄板层形成视觉“胶片”。
2) 薄板层计算
薄板层计算包括初级视觉滤波和半波整流,初级视觉滤波由模拟薄板单极细胞LMCs空域带通滤波和侧抑制滤波二个部分组成,其初级视觉滤波机制的核心是基于中心–周围对抗(centre-surrounding antagonism)的互抑制现象。薄板单极细胞LMCs中L1、L2~L5,每个神经元可以作为一个带通滤波器,带通滤波器由仿小眼感受野的采样输出和带通滤波器
卷积得到 [16] [18] [19] [20] [21]。LMCs相近神经元彼此之间的中心–周围对抗互抑制可由下式解析:
(1)
式中,
代表中心正高斯的兴奋信号,
代表周围负高斯的抑制信号。
采用半波整流方式,将视网膜感光传像信号分解成两条平行的ON和OFF通道进行处理:
ON通道:
(2)
OFF通道:
(3)

Figure 1. WBEM-BDV model framework
图1. WBEM-BDV模型框架
3) 髓质层计算与二次视觉滤波(ON-SVF、OFF-SVF)
髓质层对于ON和OFF通道信号的二次视觉滤波(secondary visual filtering, SVF)是通过二次侧抑制实现的,设像元坐标为
和相邻像元坐标为
,经侧抑制的输出信号为 [16] [21] [22]:
(4)
(5)
上式中,
为侧抑制核函数,其定义如下 [16] [22]:
(6)
(7)
其中,
为高斯函数A和B均为常量。
4) 小叶和小叶板层计算
大多数计算机视觉的图形–背景辨识方法通常是静态空域特征和动态时域特征分别处理的,很少考虑两类特征之间的交互作用,而蝇视觉的“图形–背景”分辨却是基于动态时域特征和静态空域特征综合作用的结果 [23]。利用光谱特征与空域特征交叉相关的多光谱遥感影像特征提取算法设计,是实现仿蝇视觉“图形–背景”分辨的遥感影像水体提取的关键。
选择空间相邻两个像元的光谱强度值作为光谱与空域交互的特征提取算法流程的输入,采用对称交叉相乘的处理方式 [20] [21],由下式表示:
(8)
上式的
为
波段与
波段在水平方向上间隔为
距离的光谱强度交叉相关后相减的结果。式中,
表示像元的空间位置,
为特征提取算法的输出,
和
分别是
、
波段在空间位置
上的光谱强度值,
是
波段在水平方向上与第
个像元间隔
距离处的光谱强度值,
也同理。
利用欧几里得距离可计算出空间位置点
上的特征信息 [20],支持“图形–背景”的分割和辨识。当像元间隔
时,
反映了
像元处的光谱强度变化,即,
(9)
式中,
,
是
像元分别在水平和垂直方向上的特征信息。
4. 实验与分析
4.1. 实验数据
城市中的湖泊地区大多存在综合复杂特性:1) 地表覆盖(也包含各类人工绿化区块)的类型复杂;2) 水体与城市建筑物阴影混淆;3) 浅滩等水陆交叉且水体细小;4) 水体富营养化和浮游、浮叶植物引起的光谱差异;5) 空间分辨率受限下混合像元影响严重。使得水体信息的精细化提取(特别是基于中分辨率遥感影像)需要解决综合复杂性背景下的图像分割和解译。南京市百家湖地区具有上述城市湖泊地区综合复杂特性的典型性。实验中采用相同时期的法国SPOT-5以及美国Landsat-7遥感数据,并对实验结果做出人工目视判读评价,以及与地面测量数据进行对比分析。
4.2. 基于SPOT-5近红外谱段影像的水体提取
1) SPOT-5数据
法国SPOT-5卫星上载有2台高分辨率几何成像装置(HRG)、1台高分辨率立体成像装置(HRS)、1台宽视域植被探测仪(VGT)等。HRG的观测参数示于表1。图2给出了2003年7月27日SPOT-5的HRG在近红外谱段获取的南京市百家湖遥感影像示例。

Table 1. HRG observation parameters carried by SPOT-5
表1. SPOT-5搭载HRG的观测参数

Figure 2. SPOT-5 near infrared image of Baijia Lake area in Nanjing
图2. 南京市百家湖地区SPOT-5近红外影像
2) 基于SPOT-5近红外(near IR)影像的水体提取
图3(a)~(c)分别是传统的单波段阈值方法、决策树模型法 [2] [6] 和本文所提出的基于WBEM-BDV模型的新方法对水体提取的结果。实验中,单波段阈值法对影像进行二值化分割的上限阈值取98,下限阈值取86。由目视判读比较可看出,湖水水体也能够较准确地自动提取出来,只有少量部分的水体漏提、误提。相比较,单波段阈值法水体提取效果较差,分析原因是,岸边与水体过渡区域是由混合像元组成,单一阈值较难准确划分混淆的地物,影响细小水体提取效果。相比较,决策树模型法和WBEM-BDV新方法是较优的,这与人工目视判读分析是一致的。
(a) 单波段阈值
(b) 决策树
(c) WBEM-BDV新方法
Figure 3. Water body extraction results of Baijia Lake by SPOT-5 remote sensing
图3. SPOT-5遥感百家湖水体提取结果
以靠近百家湖白龙桥(白龙桥是横跨湖心的桥,东西走向)北侧和南侧,岚湾桥(南北走向)西侧和东侧处分别设置地面测量点。根据地面实测数据的湖面宽度作为参照对比,基于相对误差RE和平均相对误差ARE指标,做客观评价,评价结果列于表2。从表中可看出,WBEM-BDV新方法的平均相对误差较小(ARE = 3.540%),或者说遥感水体提取得到的湖面宽度与地面实测湖宽最为接近,决策树模型法的平均相对误差ARE = 3.541%,而单波段阈值法的平均相对误差最大(ARE = 4.448%)。说明WBEM-BDV新方法对水体信息精细化提取是有效的。

Table 2. Objective evaluation for water body extraction of Baijia Lake based on SPOT-5 remote sensing
表2. SPOT-5遥感百家湖水体提取的客观评价
4.3. Landsat-7与SPOT-5遥感数据融合及水体提取
1) Landsat-7数据
美国Landsat-7卫星载有增强型专题制图仪(Enhanced thematic mapper,简称ETM+)传感器。ETM+共有8个光谱波段,相比较Landsat-4、Landsat-5,增加了一个全色波谱段。ETM+的观测参数见表3所示。选用ETM+中的第2 (绿光)、第4 (近红外)、第5 (短波红外)波谱段(即ETM+542三个波谱段的百家湖地区假彩色合成影像)和第8波谱段的全色影像,经ETM+542与全色影像数据融合及合成后再进行水体提取实验。

Table 3. ETM+ observation parameters carried by Landsat-7
表3. Landsat-7搭载ETM+的观测参数
2) 基于Landsat-7 ETM+数据融合的水体提取
通过第8波段全色波段与Landsat-7 ETM+542波谱段假彩色合成影像的数据融合处理,得到兼有全色影像的空间高分辨率和多光谱彩色信息的合成影像,在此基础上进行水体信息的提取。基于数据融合的水体信息提取流程如图4示意。

Figure 4. Water body extraction process based on remote sensing data fusion
图4. 基于遥感数据融合的水体提取流程
ETM+542合成影像和全色影像的配准精度均在0.5个像素内,考虑到全色影像与ETM+542合成影像有不同的频率范围,可能造成同一场景中的同一地物会有不同的辐射响应,在融合之前还需要采用直方图匹配进行影像配准。传统的ETM+多光谱与全色影像融合方法在不同程度上存在一定的局限,考虑到均衡融合结果中的空间细节信息和光谱信息二项特征指标,实验中采用Choquet模糊积分选择小波变换系数的融合方法得到合成影像 [24]。
分别采用归一化差异水体指数(normalized difference water index, NDWI)模型、改进的归一化差异水体指数(modified NDWI, MNDWI)模型、决策树模型法 [2] [6]、支持向量机SVM分类法 [2] 和WBEM-BDV新方法的实验结果见图5。客观评价指标列于表4。

Table 4. Objective evaluation of water body extraction based on ETM+ data
表4. 基于ETM+数据的水体提取的客观评价
实验中NDWI、MNDWI的阈值取值大于0.3。NDWI和MNDWI模型公式分别为:
,(G~绿光;NIR~近红外) (10)
,(G~绿光;SWIR~短波红外) (11)
从表中可看出,相比较水体指数法,决策树模型法、SVM分类法和WBEM-BDV新方法,水体提取的湖面宽与地面实际测量宽度最为接近,但决策树模型和SVM分类法的平均相对误差ARE稍劣于WBEM-BDV新方法,说明WBEM-BDV新方法具有一定的优势。
5. 结论
本文基于最新的昆虫生理学研究成果,在分析复眼视觉信息加工处理的神经通路基础上,建立了一种新的仿生蝇视觉“图形–背景”分辨的遥感影像水体提取模型(简称WBEM-BDV模型),模拟了视叶神经纤维网对于杂乱背景中“图形”的分割和辨识的神经计算过程。设计了初级视觉滤波、二次视觉滤波(SVF)和光谱特征与空域特征交叉相关的多光谱遥感影像特征提取算法。经SPOT-5和Landsat-7遥感百家湖水体信息提取的实验测试,并与传统的单波段阈值法、归一化差异水体指数NDWI模型、决策树模型和支持向量机SVM分类法等比较分析,人工目视判读和与地面实测的相对误差指标客观评价结果表明了本文所提出的WBEM-BDV新方法具有优越性。
基金项目
本文得到南京工程学院科研基金(项目编号:ZKJ201907)的资助。