适用于多目标图像分割的改进BVF Snake模型
Improved BVF Snake Model for the Segmentation of an Image with Multiple Targets
DOI: 10.12677/JISP.2023.123021, PDF, HTML, XML, 下载: 178  浏览: 439  科研立项经费支持
作者: 田原嫄, 史伟秋:东北电力大学机械工程学院,吉林 吉林;郭海涛*:海南热带海洋学院海洋科学技术学院,海南 三亚
关键词: 图像分割SnakeBVF SnakeImage Segmentation Snake BVF Snake
摘要: 参数活动轮廓模型(Snake)在计算机视觉和图像处理领域有着广泛的应用。传统的Snake算法存在许多不足,包括计算量大和当存在多目标时不能收敛到特定目标。虽然边界向量场(Boundary Vector Field, BVF) Snake减小了计算量强度,但是当存在多目标时仍然不能收敛到特定目标。本文通过力场分析,确定了BVF Snake不适用于多目标图像分割的原因;通过改进,提出一种改进的方向BVF (directional BVF, DBVF) Snake模型;在该模型中,通过在特定目标内部增加一个点,得到一个方向向量场,来确定Snake的收敛方向,使其在存在多目标时可以收敛到特定目标。本文对DBVF Snake在增大捕捉范围、添加不同噪声两个方面和常见的Snake模型进行了对比分析,同时对声呐图像进行了分割,实验结果证明了本文提出的模型(方法)对多目标图像分割的有效性。
Abstract: The parametric active contour model (Snake) has a wide range of applications in the field of computer vision and image processing. The traditional Snake model has many shortcomings, including high computational effort and failure to converge to the specific target when multiple targets exist. Although the boundary vector field (BVF) Snake reduces the computational intensity, it still fails to converge to the specific target when there are multiple targets. In this paper, the force field is inspected to determine the reasons why the BVF Snake is not applicable to the segmentation of an image with multiple targets, and improvements are made to propose an improved directional BVF (DBVF) Snake model. In this model, a directional vector field is obtained by adding one point inside a specific target to determine the convergence direction of the Snake, so that it can converge to a specific target in the presence of multiple targets. In the paper, the DBVF Snake model is compared with the common Snake models in two aspects of increasing the capture range and adding different noises, and the sonar images are segmented and segmented results show that the DBVF Snake model is valid for the segmentation of an image with multiple targets.
文章引用:田原嫄, 史伟秋, 郭海涛. 适用于多目标图像分割的改进BVF Snake模型[J]. 图像与信号处理, 2023, 12(3): 211-225. https://doi.org/10.12677/JISP.2023.123021

1. 引言

活动轮廓或可变形模型在计算机视觉和图像处理的许多应用中得到了广泛的应用 [1] [2] 。1987年M. Kass等人提出了Snake模型 [3] ,Snake模型是一种能量最小化的样条,由外部约束力引导,并受图像力的影响,将其拉向诸如线条和边缘等特征。一般来说,活动轮廓模型分为两种,一种为参数活动轮廓模型 [4] ,另一种为几何轮廓模型 [5] [6] 。本文主要研究的是参数活动轮廓模型。

在传统Snake模型中,初始位置非常重要,由于其捕捉范围有限,初始位置必须在目标边界,这不利于其实现自动分割。1993年L. Cohen等人基于欧几里得距离定义的距离势力提高了捕获范围 [7] 。然而,在这样的外力作用下,距离势能Snake并不能收敛到凹陷边界。Xu等人 [8] 在1997年提出了一种新的活动轮廓外力,很大程度上解决了初始化和对凹陷边界的不良收敛相关的问题。这种外力,称之为梯度矢量流(Gradient Vector Flow, GVF),GVF模型的引入很大程度上解决了捕捉范围小和很难进入凹陷区域的问题。在1998年,Xu等人 [9] 为改善主动轮廓收敛到长而薄的边界凹陷边界,同时保持了GVF的其他期望属性,例如扩展的捕获范围,将GVF公式推广为包括两个空间变化的加权函数,称之为广义梯度矢量流(Generalized Gradient Vector Flow, GGVF),原始GVF是其模型的一个特例。在2005年,Li等人 [10] [11] 开发了一种新的方法来克服传统参数Snake在初始化和拓扑变化方面的限制,外力场首先被分割,然后分割的轮廓用于Snake的自动初始化和分割。这种自动初始化或分割产生多条Snake,每条Snake都在与图像中的对象相关联的上限范围内,并将进化到对象边界。利用图论方法可以有效地实现外力场的分割。还提出了一种边缘保持梯度矢量流(Edge-Preserving Gradient Vector Flow, EPGVF)作为Snake的外力场。EPGVF克服了与GVF和GGVF相关的边界拖尾的缺点,同时保持了它们的其他期望特性。该模型在捕捉多个目标边界时具有自动初始化和分割Snake的能力。在2007年Ning等人 [12] 在分析GVF扩散过程的基础上,提出了一种改进的外力场(Normal direction Gradient Vector Flow, NGVF)。NGVF通过扩散项与GVF相区别,也可以认为是GVF力场的一个特例,去掉了切向方向的外力。一般而言,NGVF和GVF在很多情况下具有相似的性质。即使在切线方向没有扩散,NGVF仍然对噪声不敏感。此外,与GVF相比,NGVF可以进入细长的凹陷边界。在某些情况下,更大的时间步长使得NGVF比GVF更有效。NGVF模型是各向异性的,因为它只保持沿等照度线法线方向的扩散;然而,它对噪声敏感,能够擦除弱边界。在2010年,Wang等人 [13] 针对Snake模型提出了法向偏置GVF (Normal Bias Gradient Vector Flow, NBGVF)外力,该外力保持了等照度线切向方向的扩散和法向方向的偏置。偏置权重在边界处趋近于零,在均匀区域为1。因此,NBGVF Snake在保持GVF和NGVF Snake的其他优点(如扩大捕获范围、对初始化不敏感、收敛于U型凹陷边界)的同时,能够保持弱边缘和平滑噪声。在2013年Qin等人 [14] 确定了GVF/GGVF中收敛问题背后的原因,即,将Snake拉向LTI底部所需的方向一致的外力分量在一些像素上明显小于它们的正交对应物,这些像素在扩散过程中容易受到干扰或在基于矢量的归一化中被消除。为了解决困扰GGVF的闭塞问题,他们提出了分量归一化GGVF (Component-Normalized Generalized Gradient Vector Flow, CN-GGVF),它相对于其自身的大小分别归一化初始GGVF向量的每个分量。实验表明,与GGVF snakes相比,所提出的CN-GGVF能够以更快的收敛速度捕捉LTIs,并且在矢量归一化中实现更低的计算复杂度以及在真实摄影图像测试中更好的性能。在2016年Zhu等人 [15] 提出了一种新的广义梯度矢量流Snake模型,采用最小曲面函数代替拉普拉斯算子来解决分割精度低的问题,还使用基于分量的归一化方法代替传统的基于矢量的归一化方法,以提高Snake曲线收敛到细长凹陷边界的能力。在2021年,陈海燕等人 [16] 针对活动轮廓模型利用图像局部信息分割灰度不均图像时演化曲线易陷入局部最优的问题,提出一种结合图像局部与全局信息的混合活动轮廓模型,所提出的混合活动轮廓模型分割精度更高,且对初始轮廓不敏感。在2023年,郭宝军等人 [17] 提出了一种对称全局局部混合活动轮廓模型,解决了很难较好地处理非匀质图像问题。

然而,然而这些改进的GVF模型的迭代方式相同,需要很大的计算量,为了解决迭代计算量大的问题,一种利用差值来代替迭代的算法被提出即BVF Snake [18] ,但是对于存在多目标的图像,不能收敛到目标。

本文针对BVF Snake 模型不能收敛到多目标问题对其进行了改进,通过在目标内部增加一个点,生成一个方向矢量场,来确定Snake的收敛方向,从而使其可以正确的收敛到目标边界。

本文在第二节介绍了传统Snake、GVF Snake和BVF Snake,在第三节提出了改进的BVF Snake,在第四节给出了本文方法的捕捉范围分析和抗噪声分析,在第五节给出了声呐图像的分割实验结果并进行了定量和定性分析,在第六节给出了结论。

2. 背景

传统的Snake模型是在内力和外力影响下的一条开或闭曲线 [3] 。内力用于施加分段光滑性约束。外力将Snake推向图像目标。曲线 c ( s ) = [ x ( s ) , y ( s ) ] s [ 0 , 1 ] s为弧长参数,曲线通过最小化能量函数在空间内运动:

E snake = 0 1 E int ( c ( s ) ) + E ext ( c ( s ) ) d s (1)

第一项积分是内力,是曲线本身代表的约束力,主要是用来确保曲线的平滑与连续。第二项积分代表外力,外力是从图像中导出的,因此在感兴趣的特征处,例如边缘处,外力的值更小。给定灰度图像 I ( x , y ) ,将其视为连续位置变量 ( x , y ) 的函数,内力可以写为:

E int = 0 1 1 2 [ α | c ( s ) | 2 β | c ( s ) | 2 ] d s (2)

样条能量由被α控制的第一项和被β控制的第二项组成。αβ分别代表了弹性与刚性权重系数。 c ( s ) c ( s ) 表示 c ( s ) 相对于s的一阶导数和二阶导数,主要控制曲线的变形。若在某个点上,β为0,允许Snake二阶不连续,并且可以形成角。

设计用于引导Snake走向台阶边缘的外力的典型示例如下:

E ext ( x , y ) = | [ G σ ( x , y ) I ( x , y ) ] | 2 (3)

其中 G σ ( x , y ) 是具有标准差的二维高斯函数,σ为标准差,θ是梯度算子。从这些定义中很容易看出,较大的σ会导致边界变得模糊。然而,为了增加活动轮廓的捕捉范围,这种大的σ通常是必要的。

为了寻找能量泛函E的最小值,根据变分原理与梯度下降流可知,给定的曲线必须满足如下欧拉–拉格朗日方程:

α c ( s ) β c ' ' ' ' ( s ) + E ext ( c ( s ) ) = 0 (4)

为了解决欧拉–拉格朗日方程的求解问题,引入关于时刻的变量t使得初始泛函沿着梯度的反方向不断迭代,从而找到泛函的极小值。即通过将c作为时间ts的函数 c ( s , t ) ,来使Snake变得动态变化。然后将 c ( s , t ) 关于t的偏导数设为等于公式(4)的左边,如下所示:

c t ( s , t ) = α c ( s , t ) β c ' ' ' ' ( s , t ) + E ext ( c ( s , t ) ) (5)

当解 c t ( s , t ) 稳定即上式等于0时,得到公式(4)的解。

针对Snake模型对初始位置要求高,收敛性差的问题,Xu等人 [8] 提出了一种新型的静态外力,即GVF模型,它不随时间变化,也不依赖于Snake本身的位置。GVF定义为将Snake推入物体凹陷的外力。它是一个使下列目标函数最小化的二维向量场 v ( s ) = [ u ( s ) , v ( s ) ]

E GVF = μ ( u x 2 + u y 2 + v x 2 + v y 2 ) + | f | 2 | v f | 2 d x d y (6)

其中,uxuy分别是是u关于xy的导数,vxvy分别是是v关于xy的导数,μ控制GVF场的平滑度,噪声越大μ越大,而 f 是边缘图的梯度。

这种变分公式遵循一个标准原则,即在没有数据的情况下使结果平滑。特别地,当 | f | 小时,能量由向量场的偏导数的平方和支配,产生一个缓慢变化的场。另一方面,当 | f | 较大时,第二项支配被积函数,并通过设置 v = f 使其最小化。这产生了期望的效果,当它很大时,保持v几乎等于边缘映射的梯度,但迫使场在均匀区域中缓慢变化。

利用变分法求解以下欧拉方程得到GVF,并将归一化后的GVF作为Snake的静外力。

μ 2 u ( u f x ) ( f x 2 + f y 2 ) = 0 (7)

μ 2 v ( v f y ) ( f x 2 + f y 2 ) = 0 (8)

其中 2 是拉普拉斯算子。

这些方程提供了GVF公式背后的进一步现象。在一个齐次区域(其中 I ( x , y ) 是常数),每个公式中的第二项是零,因为 f ( x , y ) 的梯度是零。因此,在这样一个区域内,uv都由拉普拉斯方程确定,并且从该区域的边界插值得到的GVF场,反映了边界向量之间的一种竞争。

由于GVF采用了经典的光流公式 [19] ,其基本原理是将边缘信息从物体边界扩散到图像的其余部分。GVF的生成是迭代的,计算量很大。

为了解决GVF计算量大的问题,K. W. Sum等人提出了参数活动轮廓的边界向量场(BVF),这种外力是由一种新的插值方案产生的。

BVF根据势函数的梯度定义了两个二维边界向量场,如下所示:

Φ 1 = [ Ψ x , Ψ y ] (9)

Φ 2 = [ 1 2 ( Ψ x y + Ψ y x ) , 1 2 ( Ψ x y Ψ y x ) ] (10)

其中ΨxΨy分别是水平和垂直差值幅值,ΨxyΨyx对角线方向插值幅值,通过使用二值化边缘图 F B ( x , y ) ,在四次独立扫描中使用逐行插值独立生成,插值使用两种类型的边界点来完成,它们分别是对象边界和图像边界。

BVF分为BVF1和BVF2,BVF1的向量场即Φ1是由水平和垂直势函数定义的,而BVF2的向量场即Φ2是由对角势函数定义的。如上所示,BVF计算简单,生成势函数只需四次扫描,不需要迭代优化过程。在传统Snake模型的基础上,通过逐个施加两个BVFs作为外力,定义了一个新的Snake模型,即BVF Snake模型:

E e x t ( x , y ) = Φ ( x , y ) (11)

先应用BVF1,并进化Snake直到它收敛。然后,我们应用BVF2,并进化Snake到最终结果。然而BVF Snake不能适用于有多目标的图像。

3. 方向BVF

3.1. BVF Snake收敛多目标问题

在BVF Snake中,只使用梯度幅值来计算梯度矢量流。因此,BVF Snake 可能会被吸引到相对于预定边界具有相反梯度方向的强边缘。如图1所示,大小为64*64像素,图1(a)有两个目标,分别是椭圆和直线,椭圆是分割目标,图1(b)是BVF Snake场,图1(c)是BVF Snake场中直线附近的局部放大图,可以看到直线上方的Snake场方向指向下方,没有指向椭圆,所以会有部分收敛到直线,图1(d)是使用BVF Snake模型分割的结果,红色线条是分割结果,可以明显看出,没有完全收敛到椭圆,有一部分被直线吸引了。

(a) 椭圆和直线 (b) BVF Snake场 (c) BVF Snake场的局部放大图 (d) 分割结果

Figure 1. BVF Snake segmentation effect

图1. BVF Snake分割效果

3.2. 改进方法

假设一个目标的中心是 ( m , n ) ,它定义为:

m = 1 N i = 1 N x i , n = 1 N i = 1 N y i (12)

其中 ( x i , y i ) ( i = 1 , 2 , , N ) 是目标中像素的坐标,N是目标中像素的数目。设 I ( x , y ) 为位置 ( x , y ) 处的像素值。从 ( x , y ) 指向物体中心 ( m , n ) 的方向向量 d ( x , y ) = ( d x , d y ) 可以用以下方程求得:

d x = m x ( m x ) 2 + ( n y ) 2 (13)

d y = n y ( m x ) 2 + ( n y ) 2 (14)

对于图像中的每个像素,我们可以得到一个方向矢量。因此,对于整个图像,我们得到一个方向向量场。图2(b)示出了图2(a)的方向矢量场。

(a) 椭圆及其中心 (b) 方向向量场

Figure 2. Circle and its direction vector field

图2. 圆与其方向向量场

为了收敛到目标边界时利用方向信息,我们使用包含方向信息的 d ( x , y ) = ( d x , d y ) ,当水平和垂直差值幅值的梯度 Ψ x Ψ y d ( x , y ) = ( d x , d y ) 方向相反时,Snake会收敛到错误的方向,我们使其等于0,即

u d b v f ( x , y ) = { 0 , Ψ x d x < 0 Ψ x , (15)

v d b v f ( x , y ) = { 0 , Ψ y d y < 0 Ψ y , (16)

定义这种改进的BVF为方向BVF (Directional BVF, DBVF)。DBVF可以重写为

V d b v f ( x , y ) = [ u d b v f ( x , y ) , v d b v f ( x , y ) ] (17)

用DBVF场 V d b v f ( x , y ) 代替公式(4)中的标准外力 E ext ( s ) ,我们可以得到相应的DBVF Snake方程:

α c ( s ) β c ' ' ' ' ( s ) + V d b v f ( x , y ) = 0 (18)

4. 本文方法的捕捉范围分析和抗噪声分析

4.1. 仿真图像实验

为了说明所提出的DBVF Snake的优势,我们比较传统Snake、GVF Snake、距离势能、BVF Snake和DBVF Snake的收敛效果。我们对所有Snake采用α = 1和β = 0,在变形过程中动态重新参数化,以保持轮廓点分离在0.5~1.5像素内 [20] 。对于每个测试图像,使用相同的初始轮廓和参数值。活动轮廓中使用的所有边缘映射都归一化到范围[0, 1]。实验采用图3(a)的图像。实验结果如图3所示,图3(b)、图3(c)、图3(d)和图3(e)都没能正确地收敛于椭圆图形上,而图3(f)则正确地收敛于椭圆图形。也就是,本文提出的DBVF Snake可以分割出多目标图像中的特定目标,而传统Snake、GVF Snake、距离势能和BVF Snake都无法分割出多目标图像中的特定目标。图3实验说明了本文提出方法的可行性。

(a) 椭圆和直线 (b) 传统Snake (c) GVF分割结果 (d) 距离势能 (e) BVF分割结果 (f) DBVF分割结果

Figure 3. Simulation image segmentation results of different Snake methods

图3. 仿真图像的不同Snake方法分割结果

4.2. 捕捉范围分析

本实验采用含有椭圆和直线两个目标的图来测试改进的模型是否具有较大的捕捉范围,测试图像大小变为164*164像素,但是椭圆和直线的大小不变,目标是收敛到椭圆,所选对比实验为传统Snake模型、GVF Snake模型、距离势能Snake模型、BVF Snake模型和DBVF Snake模型。

实验结果如图4所示,图4(a)是分割对象,红色线条是初始Snake,图4(b)是传统Snake分割结果,图4(c)是GVF-Snake分割结果,图4(d)是距离势能Snake分割结果,图4(e)是BVF Snake分割结果,图4(f)是DBVF Snake分割结果。

从图像中可以看出,传统Snake没能收敛;GVF、距离势能、BVF一部分收敛到了椭圆一部分收敛到了直线,并没有完全收敛到目标;只有DBVF Snake收敛到了椭圆。

(a) 初始Snake (b) 传统Snake (c) GVF (d) 距离势能 (e) BVF (f) DBVF

Figure 4. Capture range performance test

图4. 捕捉范围性能测试

4.3. 抗噪声分析

4.3.1 . 抗高斯噪声分析

本实验采用增加高斯噪声(均值为0,方差为0.01)的含有椭圆和直线两个目标的图来测试改进的方法是否对噪声有较好的鲁棒性,测试图像大小为64*64像素。所选对比实验为传统Snake模型、GVF Snake模型、距离势能Snake模型、BVF Snake模型和DBVF Snake模型。实验结果如图5所示,图5(a)是分割对象,红色线条是初始Snake,图5(b)是传统Snake分割结果,图5(c)是GVF Snake分割结果,图5(d)是距离势能Snake分割结果,图5(e)是BVF Snake分割结果,图5(f)是DBVF Snake分割结果。从图中可以看出,传统Snake模型不能收敛到目标对象边界;GVF Snake、距离势能Snake和BVF Snake都可以一部分收敛到椭圆边界,但是都有一部分被直线吸引,收敛到了直线;而改进的DBVF Snake模型完全收敛到了椭圆边界,没有被直线所吸引,证明了该方法对高斯噪声具有很好的鲁棒性并且能够收敛到目标边界。

(a) 初始Snake (b) 传统Snake (c) GVF (d) 距离势能 (e) BVF (f) DBVF

Figure 5. Gaussian noise performance test

图5. 高斯噪声性能测试

4.3.2 . 抗散斑噪声分析

为了更好地验证提出的方法对噪声是否有更好的鲁棒性,通过添加散斑噪声(均值为0,方差为0.05)的含有椭圆和直线的两个目标的图来进行分割对比,测试图像大小为64*64像素。所选对比实验为传统Snake模型、GVF Snake模型、距离势能Snake模型、BVF Snake模型和DBVF Snake模型。实验结果如图6所示,图6(a)是分割对象,红色线条是初始Snake,图6(b)是传统Snake分割结果,图6(c)是GVF Snake分割结果,图6(d)是距离势能Snake分割结果,图6(e)是BVF Snake分割结果,图6(f)是DBVF Snake分割结果。从图中可以看出,传统Snake模型不能收敛到目标对象边界;GVF Snake、距离势能Snake和BVF Snake都可以一部分收敛到椭圆边界,但是都有一部分被直线吸引,收敛到了直线;而改进的DBVF Snake模型完全收敛到了椭圆边界,没有被直线所吸引,证明了该方法对散斑噪声具有很好的鲁棒性并且能够收敛到目标边界。

(a) 初始Snake (b) 传统Snake (c) GVF (d) 距离势能 (e) BVF (f) DBVF

Figure 6. Speckle noise performance test

图6. 散斑噪声性能测试

5. 声呐图像分割结果与分析

为了更进一步评估DBVF模型的性能,本实验将使用潜艇声呐图像 [21] (将两张潜艇声呐图形拼接在一起)来测试该方法的可行性,此实验的分割对象为左侧潜艇亮区。主要比较传统Snake、GVF Snake、距离势能Snake、BVF Snake和DBVF Snake的收敛效果。我们对所有Snake采用α=0.05和β = 0,方差σ = 1.5,μ = 0.2,ω = 1,T = 0.78。在变形过程中动态重新参数化,以保持轮廓点分离在0.5~1.5像素内。对于每个测试图像,相同的初始轮廓和参数值相同。实验结果如图7所示。

图7来看,传统Snake因为初始位置没有在潜艇附近,所以没有可驱使的外力使其收敛到潜艇亮区;GVF左侧大致收敛到了目标潜艇亮区,但是右侧被另一个图像吸引,没有完全收敛到目标边界;距离势能只有很少的一部分收敛到了目标潜艇亮区,更多的被别的物体所吸引;BVF也是只有一部分收敛到了目标潜艇亮区,有很大一部分别别的物体所吸引,尤其右侧部分曲线在两个潜艇亮区之间来回收敛;本文提出的DBVF大体上收敛到了目标潜艇亮区,没有被右侧潜艇亮区吸引,验证了本章提出的算法的可行性。

(a) 潜艇声呐图像 (b) 边缘图 (c) 初始Snake (d) 传统Snake (e) GVF (f) 距离势能 (g) BVF (h) DBVF

Figure 7. Submarine bright area segmentation experiment

图7. 潜艇亮区分割实验

为了更好的判断图像分割结果,本文采用两个定量分析算法:假阳性率 [22] (False Positive Rate, FPR)和交并比 [23] (Intersection over Union, IoU)。

表1来看,GVF和距离势能需要的迭代次数最多,分别达到了200次和250次,同时也是需要时间最久的两个Snake模型,分别为28.815秒和32.924秒,而BVF和DBVF分别需要100次和80次迭代即可,时间分别只用了10.064秒和9.017秒,近似为GVF和距离势能的三分之一,算法的时间效益上来看,BVF和DBVF最好。

表2来看,传统Snake、距离势能、GVF和BVF的IoU偏低,FPR偏高,两项指标都不理想;DBVF的IoU达到了0.88以上,FPR在0.1左右,两项指标很理想。整体客观数据来看,对于潜艇亮区,本章提出的DBVF效果最好。

Table 1. Iteration times and time of different segmentation methods for submarine bright area

表1. 潜艇亮区不同分割方法的迭代次数和时间

Table 2. Quantitative evaluation of submarine bright area image segmentation

表2. 潜艇亮区图像分割的定量评价

综上所述,分割质量评价一致,对于潜艇亮区,本文提出的DBVF效果最好。

为了分割出潜艇暗区,将阈值T调整为0.9,可以分割出潜艇暗区和亮区的整体,去掉分割出来的潜艇亮区,可以间接分割出潜艇暗区。实验结果如图8所示。

图8来看,传统Snake因初始位置距离潜艇较远,没有受到驱使的外力使其收敛到潜艇;距离势能、GVF和BVF分割效果相似,都是一部分收敛到左侧潜艇一部分收敛到右侧潜艇,没能完成目标的分割;本章提出的DBVF大致上收敛到了潜艇边界,并且没有被右侧潜艇图像吸引。从结果来看,本章提出的DBVF效果最好。

(a) 潜艇声呐图像 (b) 边缘图 (c) 初始Snake (d) 传统Snake (e) GVF (f) 距离势能 (g) BVF (h) DBVF

Figure 8. Submarine bright and dark area segmentation experiment

图8. 潜艇亮区和暗区整体分割实验

表3来看,GVF和距离势能需要的迭代次数最多,分别达到了150次和200次,同时也是需要时间最久的两个Snake模型,分别为26.107秒和30.064秒,而BVF和DBVF分别需要80次和70次迭代即可,时间分别只用了8.017秒和8.395秒,少于GVF和距离势能的三分之一,算法的时间效益上来看,BVF和DBVF最好。

表4来看,传统Snake、距离势能、GVF和BVF的IoU偏低,FPR偏高,两项指标都不理想;DBVF的IoU达到了0.88以上,FPR在0.1左右,两项指标很理想。从图像分割定量评价指标来看,对于潜艇亮区和暗区整体,本文提出的DBVF效果最好。

综上所述,分割质量评价一致,对于潜艇亮区,本文提出的DBVF效果最好。

Table 3. Iteration times and time of different segmentation methods of submarine bright area and dark area

表3. 潜艇亮区和暗区整体不同分割方法的迭代次数和时间

Table 4. Quantitative evaluation of the whole image segmentation of submarine bright and dark areas

表4. 潜艇亮区和暗区整体图像分割的定量评价

6. 结论

本文研究了BVF Snake在有多个目标时不能正确收敛于目标边界的问题,确定了BVF中收敛问题背后的原因,并提出了DBVF (方向BVF)。实验表明,与BVF Snake相比,DBVF Snake能够收敛于指定目标的边界,即DBVF Snake适用于多目标图像的分割。

致谢

本文使用了参考文献 [21] 中的图像,在此对该论文作者表示感谢。

基金项目

海南省自然科学基金资助(420CXTD439);国家自然科学基金项目(61661038)。

NOTES

*通讯作者。

参考文献

[1] Jaffino, G. and Jose, J.P. (2022) Contour- and Texture-Based Analysis for Victim Identification in Forensic Odontology. Data Technologies and Applications, 56, 146-160.
https://doi.org/10.1108/DTA-03-2021-0075
[2] Yang, Y., Hou. X. and Ren, H. (2021) Accurate and Efficient Image Segmentation and Bias Correction Model Based on Entropy Function and Level Sets. Information Sciences, 577, 638-662.
https://doi.org/10.1016/j.ins.2021.07.069
[3] Kass, M., Witkin, A. and Terzopoulos, D. (1988) Snakes: Active Contour Models. International Journal of Computer Vision, 1, 321-331.
https://doi.org/10.1007/BF00133570
[4] Li, B. and Acton, S.T. (2006) Vector Field Convolution for Image Segmentation Using Snakes. Proceedings of 2006 International Conference on Image Processing, Atlanta, 8-11 October 2006, 1637-1640.
https://doi.org/10.1109/ICIP.2006.312619
[5] Matikainen, L., Lehtomaki, M., Ahokas, E., et al. (2016) Remote Sensing Methods for Power Line Corridor Surveys. ISPRS Journal of Photogrammetry and Remote Sensing, 119, 10-31.
https://doi.org/10.1016/j.isprsjprs.2016.04.011
[6] 黄征. 几何活动轮廓图像分割模型的算法研究[D]: [硕士学位论文]. 昆明: 昆明理工大学, 2022.
[7] Cohen, L.D. and Cohen, I. (1993) Finite-Element Methods for Active Contour Models and Balloons for 2-D and 3-D Images. IEEE Transactions on Pattern Analysis and Machine Intelligence, 15, 1131-1147.
https://doi.org/10.1109/34.244675
[8] Xu, C. and Prince, J.L. (1998) Snakes, Shapes and Gradient Vector Flow. IEEE Transactions on Image Processing, 7, 359-369.
https://doi.org/10.1109/83.661186
[9] Xu, C. and Prince, J.L. (1998) Generalized Gradient Vector Flow External Forces for Active Contours. Signal Processing, 71, 131-139.
https://doi.org/10.1016/S0165-1684(98)00140-6
[10] Li, C., Liu, J. and Fox, M.D. (2005) Segmentation of External Force Field for Automatic Initialization and Splitting of Snakes. Pattern Recognition, 38, 1947-1960.
https://doi.org/10.1016/j.patcog.2004.12.015
[11] Li, C., Liu, J. and Fox, M.D. (2005) Segmentation of Edge Preserving Gradient Vector Flow: An Approach Toward Automatically Initializing and Splitting of Snakes. Proceedings of 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Diego, 20-25 June 2005, 162-167.
https://doi.org/10.1109/CVPR.2005.314
[12] Ning, J., Wu, C., Liu, S. and Yang, S. (2007) NGVF: An Improved External Force Field for Active Contour Model. Pattern Recognition Letters, 28, 58-63.
https://doi.org/10.1016/j.patrec.2006.06.014
[13] Wang, Y., Liu, L., Zhang, H., et al. (2010) Image Segmentation Using Active Contours With Normally Biased GVF External Force. IEEE Signal Processing Letters, 17, 875-878.
https://doi.org/10.1109/LSP.2010.2060482
[14] Qin, L., Zhu, C. and Zhao, Y., et al. (2013) Generalized Gradient Vector Flow for Snakes: New Observations, Analysis, and Improvement. IEEE Transactions on Circuits and Systems for Video Technology, 23, 883-897.
https://doi.org/10.1109/TCSVT.2013.2242554
[15] Zhu, S. and Gao, R. (2016) A Novel Generalized Gradient Vector Flow Snake Model Using Minimal Surface and Component-Normalized Method for Medical Image Segmentation. Biomedical Signal Processing and Control, 26, 1-10.
https://doi.org/10.1016/j.bspc.2015.12.004
[16] 陈海燕, 张华清, 甄霞军. 一种初始轮廓位置鲁棒的混合活动轮廓模型[J]. 华中科技大学学报(自然科学版), 2021, 49(11): 53-57+63.
[17] 郭宝军, 张晓冬, 崔金龙, 等. 利用改进的对称活动轮廓模型分割非匀质图像[J]. 计算机仿真, 2023, 40(1): 227-233+483.
[18] Sum, K.W. and Cheung, P.Y.S. (2007) Boundary Vector Field for Parametric Active Contours. Pattern Recognition, 40, 1635-1645.
https://doi.org/10.1016/j.patcog.2006.11.006
[19] Horn, B. and Schunck, B.G. (1981) Determining Optical Flow. Artificial Intelligence, 17, 185-203.
https://doi.org/10.1016/0004-3702(81)90024-2
[20] Lobregt, S. and Viergever, M.A. (1995) A Discrete Dynamic Contour Model. IEEE Transactions on Medical Imaging, 14, 12-24.
https://doi.org/10.1109/42.370398
[21] Zhu, Z., Xu, X., Yang, L., et al. (2014) A Model-Based Sonar Image ATR Method Based on SIFT Features. Proceedings of Oceans 2014, Taipei, 7-10 April 2014, 1-4.
https://doi.org/10.1109/OCEANS-TAIPEI.2014.6964476
[22] 罗琴, 王艳. 无需初始轮廓的图像分割模型[J]. 计算机应用, 2021, 41(4): 1179-1183.
[23] 黄涛, 李华, 周桂, 等. 实例分割方法研究综述[J]. 计算机科学与探索, 2023, 17(4): 810-825.