基于改进沙猫群优化算法的Otsu图像分割
Enhanced Sand Cat Swarm Optimization for Otsu Image Segmentation
DOI: 10.12677/jisp.2025.144036, PDF, HTML, XML,   
作者: 周 辰:河北地质大学信息工程学院,河北 石家庄
关键词: 图像分割沙猫群优化算法Otsu阈值法Image Segmentation Sand Cat Swarm Optimization Otsu’s Method
摘要: 图像分割作为计算机视觉领域的关键预处理步骤,其效果直接影响后续分析与理解。Otsu算法因其原理清晰、计算高效而在全局阈值分割中被广泛应用,但其存在计算复杂度较大,分割精度较低等问题,单一全局阈值往往难以获得理想的分割效果。为克服传统Otsu算法的局限并提升其性能,本文提出了一种基于改进沙猫群优化算法(SCSO-DOGA)的Otsu图像分割算法。针对原始沙猫群优化算法(Sand Cat Swarm Optimization, SCSO)在解决高维优化问题时可能存在的收敛速度慢、易陷入局部最优等不足,本文设计了改进策略,包括加入动态反向学习策略以及与雁群算法相融合,提升了算法性能和收敛效率。改进后的Otsu算法与其他图像分割算法作实验对比,选取ACC、Jaccard等作为评估指标,验证算法的性能。实验结果表明基于改进沙猫群优化算法的Otsu图像分割法能够更加准确地解决图像分割问题。
Abstract: Image segmentation serves as a critical preprocessing step in computer vision, directly impacting subsequent analysis and interpretation. While Otsu’s method is widely adopted for global threshold segmentation due to its conceptual clarity and computational efficiency, it suffers from high computational complexity and limited segmentation accuracy, often failing to achieve satisfactory results with a single global threshold. To overcome these limitations and enhance performance, this paper proposes an Otsu image segmentation algorithm based on an improved Sand Cat Swarm Optimization algorithm (SCSO-DOGA). Addressing the slow convergence and susceptibility to local optima observed in the original Sand Cat Swarm Optimization (SCSO) algorithm for high-dimensional optimization problems, this study introduces two key enhancements: a dynamic opposition-based learning strategy and hybridization with the Duck Optimization Algorithm. These improvements significantly boost algorithmic performance and convergence efficiency. The proposed Otsu algorithm is experimentally compared against other segmentation methods using evaluation metrics such as Accuracy and Jaccard index. Results demonstrate that the Otsu method based on the improved SCSO-DOGA algorithm resolves image segmentation problems with superior accuracy.
文章引用:周辰. 基于改进沙猫群优化算法的Otsu图像分割[J]. 图像与信号处理, 2025, 14(4): 387-397. https://doi.org/10.12677/jisp.2025.144036

1. 引言

图像分割是图像处理与分析中的基础性、关键性步骤,旨在将图像划分为具有相似属性(如灰度、纹理、颜色)的互不重叠的区域,为后续的目标识别、场景理解、医学诊断等高层任务提供可靠依据。阈值分割法因其实现简单、计算量相对较小而成为最常用的分割技术之一。其中,由大津展之提出的Otsu方法[1]因其基于图像灰度直方图统计特性、以最大化类间方为目标自动确定最优阈值而备受青睐,被广泛应用于二值化分割场景。

传统Otsu方法具有局限性,当应用于高分辨率或需要快速处理的场景时效率较低。对于低对比度、光照不均、存在噪声污染的图像,单一全局阈值难以准确区分目标与背景,容易导致过分割或欠分割。虽然可以扩展为多级阈值分割,但计算复杂度会急剧上升,难以实用。为了克服Otsu算法的计算效率瓶颈并提升其在复杂图像上的分割性能,研究者们将目光投向元启发式智能优化算法。[2]提出了改进的雁群算法应用于Otsu阈值图像分割,加入了混沌映射等改进点。[3]提出了基于人工鱼群算法的二维Otsu图像分割,算法能够准确地找到最佳阈值。[4]提出了一种基于Levy-人工蜂群算法的三维Otsu阈值分割算法,针对传统一维Otsu法仅依赖灰度直方图的局限性,建立由像素灰度值、邻域均值与邻域中值构成的三维特征空间,显著提升对图像纹理及空间信息的表征能力。[5]提出了改进被囊群算法,基于折射反向学习初始化种群,采用精英反向学习重新选择优势个体,结合学生分布协调全局和局部搜索能力。[6]提出了改进Otsu算法,引入二阶振荡粒子群优化算法多次调整灰度阈值,利用最优的灰度阈值进行分割。

沙猫群优化算法(SCSO) [7]是近些年提出的一种新颖的元启发式算法,灵感来源于沙猫对猎物的探测和攻击行为。它有参数少、原理简单、易于实现等优点。然而,原始SCSO在处理复杂优化问题时(如Otsu阈值优化问题),也可能表现出收敛精度不足、易陷入局部最优解、后期收敛速度放缓等共性问题,限制了其在图像分割任务中的潜力。

本文提出一种改进的沙猫群优化算法(SCSO-DOGA),并将其应用于Otsu图像分割中。针对原始SCSO的不足以及提升Otsu方法在复杂图像上分割性能的需求,提出对SCSO算法的改进策略:加入了动态反向学习策略,提升寻优精度和效率。将沙猫群优化算法与雁群算法相融合,构建基于SCSO-DOGA的Otsu图像分割框架。在基准函数上进行测试,SCSO-DOGA算法展现更好的性能。并与经典Otsu方法及其他群智能优化算法(PSO-Otsu [8],ACO-Otsu [9],GWO-Otsu [10],原始SCSO-Otsu)的分割方法进行比较。实验结果表明改进后的算法分割后的准确率、Jaccard等指标都优于其他算法。

2. 沙猫群优化算法

沙猫群优化算法是一种受自然界沙猫行为而设计的元启发式算法。模拟沙猫的行为将算法主要分为两个阶段,一个是觅食(搜索)阶段,另一个是捕食(开发)阶段。

沙猫对猎物的搜索依赖于低频噪声的释放,沙猫可以感知0到2 khz的噪声,设沙猫的听觉灵敏度范围 r G 随着迭代的进行从2线性下降到0。

r G = S M S M ×ite r c ite r max (1)

式中 S M 为最大灵敏度,设置为2。 ite r c 为当前迭代次数, ite r max 为最大迭代次数。

每一只沙猫有不同的灵敏度 r ,其表示为

r= r G ×rand( 0,1 ) (2)

式子中 rand( 0,1 ) 表示0至1之间的随机数。沙猫根据参数 R 来控制搜索阶段和开发阶段,即

R=2× r G ×rand( 0,1 ) r G (3)

| R |>1 时,算法处于搜索阶段,每只沙猫根据最佳候选位置 Po s bc 和当前位置 Po s c 及其灵敏度 r 来更新自己的位置,位置更新为

Pos( t+1 )=r×( Po s bc ( t )rand( 0,1 )×Po s c ( t ) ) (4)

| R |<1 时,算法处于开发阶段,沙猫攻击猎物。如公式(5),利用最佳位置和当前位置生成一个随机位置 Po s rnd ,随机位置可以确保沙猫靠近猎物。假设沙猫的灵敏度范围是一个圆,用轮盘赌的方式给沙猫选择角度 θ ,最后通过公式(6)实现攻击猎物。

Po s rnd =| rand( 0,1 )×Po s bc ( t )Po s c ( t ) | (5)

Pos( t+1 )=Po s bc ( t )r×Po s rnd ×cos( θ ) (6)

3. 改进的沙猫群优化算法

3.1. 动态反向学习策略

动态反向学习策略(Dynamic Opposition-Based Learning, DOBL)是一种增强优化算法全局搜索能力的有效方法[11]。通过在每次迭代中生成当前解的反向解,并与当前解进行竞争,可以避免算法陷入局部最优,同时提高收敛速度。

动态反向学习策略的核心是生成当前解的反向解[12]。设当前解为 X i =[ x i1 , x i2 ,..., x id ] ,其动态反向解 X i opp 的计算公式为:

X i opp =lb+ub X i (7)

其中 lb 代表搜索空间的下界, ub 代表搜索空间的上界。

为了增强动态性,引入动态边界调整机制:

l b d =max( lb, X i k×( ublb ) ) (8)

u b d =min( ub, X i +k×( ublb ) ) (9)

其中 k 是一个随机因子, k[ 0,1 ] 。最终的反向解为:

X i opp =l b d +u b d X i (10)

在每一次的迭代中,动态反向学习策略的具体步骤如下:

1) 对当前解 X i 生成反向解 X i opp

2) 计算反向解的适应度 f( X i opp )

3) 如果 f( X i opp )<f( X i ) ,则反向解替代当前解。

3.2. 雁群协同机制

受雁群V字编队启发,本算法将种群划分为领导雁(当前最优解)与跟随雁[13]:领导雁沿目标函数梯度方向进行定向开发,利用局部梯度信息引导种群跟随雁通过线性组合方式同步领导雁位置与随机差分向。该机制在开发阶段引入梯度信息加速局部收敛,同时通过随机差分避免早熟收敛。

1) 领导–跟随模型

领导者更新:

X lead ( t+1 ) = G best +α×f( G best ) (11)

跟随者更新:

X i ( t+1 ) = X I ( t ) +β×( X lead ( t ) X i ( t ) )+γ( X r1 ( t ) X r2 ( t ) ) (12)

其中 α 为梯度步长系数, β 为领导跟随强度, γ 为随机扰动因子, r1 r2 为随机个体索引。

2) 梯度辅助机制

f( G best )= f( G best +ε )f( G best ε ) 2ε (13)

式中 G best 表示当前全局最优解位置, f( G best ) 表示目标函数在最优解的梯度, ε 表示扰动半径。

使用中心差分法估计全局最优解邻域梯度,扰动半径 ε 与解空间规模成正比:

ε= 10 6 × ublb (14)

3.3. 改进沙猫群优化算法流程

本文改进后的沙猫群优化算法具体流程如下:

步骤1:初始化种群位置,计算初始适应度,确定全局最优解和最优适应度值。

步骤2:动态反向学习策略:生成反向种群,选择原种群和反向种群中更优的解。

步骤3:雁群飞行模式更新,根据全局最优解和相邻个体更新位置,具体是式11和式12。

步骤4:根据参数R决定算法处于开发或探索阶段,参数R由式3所得,计算新位置的适应度值,并更新全局最优解。

步骤5:结果输出。

图1所示。

4. 实验结果与分析

基准函数测试

为全面评估所提出算法的性能,选取了10个基准函数进行实验验证,如表1所示,单峰函数(F1~F2),多峰函数(F3~F9),混合函数F10。将本文提出的改进算法与原始沙猫群优化算法,粒子群算法,

Figure 1. Improved SCSO algorithm flowchart

1. 改进后沙猫群优化算法流程图

灰狼算法,蚁群算法进行对比分析。为确保实验的公平性与统计可靠性,所有算法均采用统一的实验设置,每个算法种群数量为30个,每个算法独立运行30次,最大迭代次数为100次。实验对比选用标准差,平均值,迭代收敛作为评估指标,平均值反映算法在多次独立运行中获得的平均寻优水平和收敛精度。标准差衡量算法多次运行结果的离散程度,用于评估算法的寻优稳定性和鲁棒性。

Table 1. Test function

1. 测试函数

名称

函数

F1

Shifted and rotated bent cigar function

F2

Shifted and rotated Zakharov function

F3

Shifted and rotated rosenbrock’s function

F4

Shifted and rotated rastrigin’s function

F5

Shifted and rotated expanded scaffer’s F6 function

F6

Shifted and rotated lunacek Bi_rastrigin function

F7

Shifted and rotated non-continuous rastrigin’s function

F8

Shifted and rotated levy function

F9

Shifted and rotated schwefel’s function

F10

Hybrid Function 1 (N = 3)

表2可知,本文提出的SCSO-DOGA算法在测试函数上的结果优于原始SCSO和其他算法。改进后算法的运行后的平均值与标准差都小于其他算法,说明改进后的算法性能更加好,不易受输入数据波动的影响,有更强的稳定性。

Table 2. Benchmarking results

2. 基准函数测试结果

函数

指标

SCSO-DOGA

SCSO

GWO

ACO

PSO

F1

标准差

1.0597e−29

1.2791e−27

5.8257e+02

4.8585e+03

2.4724e−03

平均值

2.7033e−30

2.7227e−28

3.5845e−03

6.8817e+04

2.9929e+03

F2

标准差

1.1498e−15

3.6393e−15

5.7435e−02

5.3692e+42

3.4119e+26

平均值

1.1545e−16

5.2307e−16

1.5995e−01

3.1736e+42

1.7913e+26

F3

标准差

1.3540e−19

7.5766e−18

8.2883e+01

1.4110e+04

4.7085e+03

平均值

1.0931e−18

4.7917e−17

1.3297e+02

9.0644e+04

1.8025e+04

F4

标准差

1.4823e−12

5.9830e−11

3.3361e−01

4.3237e+00

2.8934e+00

平均值

1.4450e−13

2.9601e−12

3.2449e−01

3.3920e+00

2.6063e+00

F5

标准差

3.3387e−01

5.1451e−01

9.0107e−01

4.1555e+07

3.8633e+05

平均值

2.6426e+08

2.8164e+01

3.1319e+01

2.7616e+01

9.2815e+05

F6

标准差

1.8314e−03

4.4306e−01

7.2002e−01

7.4531e+03

7.6590e+02

平均值

1.1956e+00

4.7923e−03

2.4473e+00

6.9541e+04

3.0205e+03

F7

标准差

1.1771e−03

1.5079e−03

8.8021e−01

2.2784e+01

8.8021e−01

平均值

1.1880e+02

1.4387e−03

5.2257e−02

1.4306e−03

9.4626e−01

F8

标准差

1.1585e+03

9.4361e+02

5.2950e+02

4.4145e+02

7.1323e+02

平均值

−8.6915e+03

−5.6599e+03

−3.6867e+03

−4.8417e+03

−5.6836e+03

F9

标准差

0

0

5.1503e+00

2.7431e+01

2.1481e+01

平均值

0

0

1.6571e+0

4.2483e+02

2.3636e+02

F10

标准差

1.2283e−15

5.7253e−13

4.5950e−03

1.5628e−0

7.8038e−01

平均值

1.1284e+01

8.3785e−15

1.3300e−02

2.0583e+01

1.2731e−15

图2展示了SCSO-DOGA算法与其他算法在基准函数上的收敛曲线,选取了F1 (单峰函数),F3和F6以及F9 (多峰函数)。在基准函数的迭代曲线中,SCSO-DOGA的收敛速度更快,而且能够更好地找到最优值。

(a) F1 (b) F3

(a) F6 (b) F9

Figure 2. Convergence curves of benchmark functions

2. 基准函数的收敛曲线

5. Otsu多阈值图像分割

5.1. 实验设计

第一步,选用BSDS 500数据集中的图片对算法进行初步测试,再选用ISIC数据集测试改进后的算法(SCSO-DOGA)用于Otsu图像分割的效果,实验时与SCSO-Otsu,PSO-Otsu,GWO-Otsu,ACO-Otsu,传统Otsu进行对比。算法的种群规模为30,运行次数为20。

5.2. 评估指标

实验采用准确率、Jaccard、Dice、PSNR、SSIM作为评估指标。

PSNR是一种基于像素值差异的客观评价指标,通过计算原始图像与失真图像之间的均方误差(MSE)与最大像素值的对数关系来量化图像质量。值越高,表示图像质量越好,失真越小。

SSIM是一种基于人类视觉感知的图像质量评价方法,综合考虑亮度、对比度和结构三个维度。SSIM值范围在[−1, 1]之间,值越接近1,表示图像质量越好,失真越小。

Dice系数是一种广泛应用于医学图像分割任务的评价指标,用于衡量预测分割结果与真实标签之间的重叠程度。A是预测结果(二值图像),B是真实标签。计算公式如下:

Dice= 2| AB | | A |+| B | (15)

Jaccard系数,也称为交并比(Intersection over Union, IoU),是另一种衡量两个集合相似度的指标,广泛应用于图像分割任务中。计算公式如下:

Jaccard= | AB | | AB | (16)

准确率是分类任务中最常用的指标之一,在图像分割中用于衡量模型预测的像素类别与真实标签的匹配程度。计算公式如下:

Accuracy= TP+TN TP+TN+FP+FN (17)

TP (True Positive):正确预测为正类的像素数量。

TN (True Negative):正确预测为负类的像素数量。

FP (False Positive):错误预测为正类的像素数量。

FN (False Negative):错误预测为负类的像素数量。

5.3. BSDS 500数据集分割结果

实验选用BSDS 500 [14]数据集中的图片进行初步测试,选用了PSNR和SSIM作为评估指标,以下是实验结果。

Table 3. Experimental evaluation metrics across algorithms

3. 各算法的实验后指标

图片

指标

SCSO-DOGA-Otsu

SCSO-Otsu

PSO-Otsu

GWO-Otsu

ACO-Otsu

Otsu

1

PSNR

23.85

18.43

19.10

10.31

19.90

7.77

SSIM

0.8301

0.8160

0.7912

0.6817

0.8235

0.4407

2

PSNR

24.86

8.30

13.14

7.54

11.75

7.53

SSIM

0.8403

0.6653

0.7056

0.7063

0.7300

0.5974

3

PSNR

22.39

20.99

21.47

19.98

22.20

9.95

SSIM

0.9014

0.8743

0.8857

0.8097

0.8885

0.3739

表3中所示,改进后的算法(SCSO-DOGA)在BSDS 500数据集中的图片分割中,与其他算法相比PSNR和SSIM指标更为优秀。从图3中所示,SCSO-DOGA算法在分割中,其分割结果在细节保留度与边界精确度上均实现了提升,雁群协同机制能够更有效地探索解空间,从而实现了对细微边缘和内部复杂结构更精细地分割。动态反向学习策略的动态适应性确保了算法在追求更高精度的同时,不会因过度扰动而破坏已找到的优质解,提升了分割边界的平滑性。所以结果表明改进后的算法在Otsu图像分割中提升了分割效果。

5.4. ISIC数据集分割结果

ISIC数据集(International Skin Imaging Collaboration)国际皮肤影像协作组织提供的皮肤病变图像数据集,主要用于皮肤癌检测和分类研究。

(a) SCSO-DOGA (b) SCSO

(c) PSO (d) GWO

(e) Otsu (f) ACO

Figure 3. Comparison of segmentation results across algorithms

3. 各算法分割结果对比

表4中所示,SCSO-DOGA算法的准确率等指标都优于其他算法,有更好的分割效果,但在Dice系数、Jaccard指标中仍有提升的空间。

Table 4. Quantitative evaluation metrics on the ISIC dataset

4. ISIC数据集上的实验指标

算法

Dice

Jaccard

准确率

SSIM

SCSO-DOGA

0.7860

0.6808

0.8760

0.8410

SCSO

0.7550

0.6525

0.8298

0.7953

GWO

0.5717

0.4654

0.6594

0.6273

PSO

0.7310

0.6141

0.7891

0.7668

ACO

0.7700

0.6649

0.8480

0.8297

传统Otsu

0.1768

0.1167

0.1491

0.1237

图4所示,相比较之下SCSO-DOGA算法具有更好的分割效果。SCSO-DOGA算法减少了边界像素的错分,并且较为完整地提取了整个色素病变区域。虽然改进后的算法能取得较为不错的分割结果,但在复杂皮肤病影像中的分割仍然面对着挑战。

(a) SCSO-DOGA (b) SCSO

(c) GWO (d) PSO

(e) ACO (f) 传统Otsu

Figure 4. Segmentation results of various algorithms on the ISIC dataset

4. 各算法在ISIC数据集上的分割结果

6. 结语

本文提出了基于SCSO-DOGA的Otsu阈值图像分割方法,通过在算法中加入了动态反向学习策略,提高搜索能力,又将雁群算法中的协同机制引入算法中,进一步提高算法的寻优能力。在10个基准函数的测试中,SCSO-DOGA算法展现了更快的收敛速度,相比于其他算法,在标准差和平均值的指标上更为优秀。在BSDS 500数据集和ISIC数据集上,SCSO-DOGA算法有更好的分割效果。

在未来的工作中,可以将算法应用于更广的领域,比如医学图像处理领域[15],将图像分割与群智能算法相结合,提高图像分割的效果和精度。此外在红外图像[16]、显微图像[17]等领域都能有应用。

参考文献

[1] Cheng, Y. and Li, B. (2021). Image Segmentation Technology and Its Application in Digital Image Processing. 2021 IEEE Asia-Pacific Conference on Image Processing, Electronics and Computers (IPEC), Dalian, 14-16 April 2021, 1174-1177.
https://doi.org/10.1109/ipec51340.2021.9421206
[2] 郭业才, 赵涵优. 基于改进雁群算法的Otsu多阈值图像分割[J]. 中国电子科学研究院学报, 2024, 19(7): 622-633+646.
[3] 潘喆, 吴一全. 二维Otsu图像分割的人工鱼群算法[J]. 光学学报, 2009, 29(8): 2115-2121.
[4] 黄翠玲, 孔韦韦, 李萌, 等. 一种基于Levy-人工蜂群的三维Otsu阈值分割算法[J]. 电讯技术, 2021, 61(3): 263-268.
[5] 董维振, 陈燕. 基于改进被囊群算法的图像多阈值分割方法[J]. 计算机工程与设计, 2023, 44(7): 2093-2102.
[6] 马栎, 冯占荣. 基于改进Otsu算法的金属器件镀锌表面缺陷识别方法[J]. 电镀与精饰, 2025, 47(2): 46-53.
[7] Seyyedabbasi, A. and Kiani, F. (2023) Sand Cat Swarm Optimization: A Nature-Inspired Algorithm to Solve Global Optimization Problems. Engineering with Computers, 39, 2627-2651.
https://doi.org/10.1007/s00366-022-01604-x
[8] 魏瑶坤, 康运江, 王丹伟, 等. 融合混沌映射和麻雀搜索的PSO图像分割算法[J]. 制造业自动化, 2025, 47(1): 121-128.
[9] Qin, J., Shen, X., Mei, F. and Fang, Z. (2019) An Otsu Multi-Thresholds Segmentation Algorithm Based on Improved Aco. The Journal of Supercomputing, 75, 955-967.
https://doi.org/10.1007/s11227-018-2622-0
[10] 大连海事大学. 一种基于灰狼与粒子群协同优化算法的Otsu阈值分割方法[P]. 中国专利, CN202310284482.7. 2023-07-14.
[11] 张莉, 张小庆, 孙民民, 等. 蝴蝶搜索与动态反向学习柯西变异的白鲸优化算法[J]. 计算机工程与应用, 2025, 61(10): 96-110.
[12] 贾鹤鸣, 刘庆鑫, 刘宇翔, 等. 融合动态反向学习的阿奎拉鹰与哈里斯鹰混合优化算法[J]. 智能系统学报, 2023, 18(1): 104-116.
[13] 刘浩然, 崔静闯, 卢泽丹, 等. 一种改进的雁群扩展粒子群算法研究[J]. 计量学报, 2019, 40(3): 498-504.
[14] Shekar, B.H. and Bhat, S.S. (2024) Edge Detection in Gray Scale Images Using Partial Sum of Second Order Taylor Series Expansion. In: Lecture Notes in Computer Science, Springer, 22-31.
https://doi.org/10.1007/978-3-031-12700-7_3
[15] 王豪, 凌基伟, 陈昊, 等. 基于改进非洲秃鹫优化算法的脑MRI图像分割[J]. 重庆邮电大学学报(自然科学版), 2024, 36(4): 687-696.
[16] 赵文博, 向东, 王玖斌, 等. 基于改进黏菌算法与Tsallis熵的电力设备红外图像分割[J]. 计算机与现代化, 2024(6): 70-75+120.
[17] 王梦菲, 王卫星, 徐琨, 等. 增强型金枪鱼群优化指数熵的砂粒显微图像分割[J]. 光学精密工程, 2024, 32(8): 1199-1211.