1. 引言
在基于视觉的户外边坡监测领域,确保对边坡进行精准监测是至关重要的任务。然而,户外环境的复杂性和多变性使得边坡上的自然特征点受到环境因素的影响而变化,因此无法提供可靠的监测参考。为了克服这一挑战,我们需要采取额外的措施,即人为引入明显的标志物来实现精确定位。圆形标志物是一种理想的选择,因为它们具备旋转不变性和出色的稳定性。这些特性使得它们成为广泛应用于大型户外环境测量领域的人工标志物。通过在边坡上布置这些圆形标志物,并运用高级的计算机视觉技术,我们能够实现对它们的精确定位,从而实现对户外边坡的高精度监测目标。
基于视觉的圆形特征标志定位中,目前定位的方法主要包括Hough变换及其相应的改进算法 [1] [2] ,质心法及其相关改进方法 [3] 以及基于边缘检测和边缘拟合结合的方法 [4] 。其中基于Hough变换及相关改进方法求解参数多,计算量大,降低了算法的效率。边缘检测和质心法相结合的方法虽计算简单,但由于采集图像时几何形状受仿射变换等的影响,定位结果会有较大的偏差,从而影响定位的精度。基于边缘检测和边缘拟合的方法由相应的边缘检测方法得到圆形边缘信息,再通过边缘拟合方法精确拟合边缘信息,从而获取高定位中心而被广泛研究。
而边缘检测作为中心定位过程中的关键步骤,直接影响着圆形标志的定位精度。其中长用的像素级边缘检测算法包括基于一阶微分算子的方法Sobel算子、Roberts算子、Prewitt算子 [5] [6] [7] 和基于二阶微分算子的方法Laplacian算子和Canny算子 [8] [9] 。常用的亚像素边缘检测算法主要分为矩方法、插值法和拟合法 [10] [11] [12] 。为了提高边缘检测的精度,目前研究者利用像素边缘检测算法和亚像素边缘检测算法相结合的方法获取亚像素边缘信息来实现高精度定位。文献 [13] 利用Canny算子及形态学滤波等相结合的方法提取边缘信息并细化,再利用空间矩提取亚像素边缘从而实现亚像素定位。文献 [14] 利用Sobel算子和Zernike矩相结合的方法实现亚像素定位。文献 [15] 利用Canny算子和改进的Zernike方法对圆形标志进行高精度定位。其中基于Zernike矩方法是亚像素边缘检测研究中的热点,被广泛应用,Ghosal和Mehrotal首先提出利用Zernike矩来检测亚像素边缘的方法 [16] ,并在该算法中建立了理想阶跃灰度模型,但基于Zernike矩法边缘提取因其人工选取判定边缘的阈值,也降低了边缘检测的准确性和实效性,并且因理想阶跃灰度模型和实际边缘模型存在差异,使得获得的亚像素边缘存在伪边缘信息,从而影响中心定位精度。
因此,针对上述问题,本文提出了一种基于Zernike矩的圆形标志高精度定位方法。本文方法主要包含以下3个方面内容:首先利用HSI颜色空间和形态学滤波方法对基于颜色的圆形标志进行自动识别处理,提取圆形标志特征,再利用Canny算子对圆形标志进行像素级边缘提取。其次通过Zernike矩方法提取亚像素边缘,利用大津法获取最佳阶跃灰度阈值判定亚像素边缘,再利用基于灰度梯度优化方法对亚像素边缘细化。最后通过最小二乘椭圆拟合法对获得的亚像素边缘信息进行拟合来实现圆形标志的高精度定位。具体流程如图1所示。

Figure 1. Flowchart of the method in this paper
图1. 本文方法流程图
2. 圆形标志像素级边缘提取
在定位之前需要对采集到的图像进行识别,首先通过颜色特征作为提取的标准,采用基于HSI颜色空间对图像进行二值化分割,对圆形标志物从背景分离出来,再利用形态学滤波即开运算和闭运算组合的方法进行背景噪声消除。以便后续的边缘检测和中心定位。
由图1所示,然后利用圆形标志特征提取限制条件获取只含圆形标志点的边缘;圆形标志点检测采用由像素级至亚像素级的方法进行精确提取。其中针对像素级边缘圆形轮廓提取是采用Canny算子整像素检测圆形标志点的边缘信息。
Canny算法是基于高斯函数提出的一种边缘检测方法,是目前应用比较广泛的基于最优准则的一种像素级边缘提取算法,相比较其他像素级边缘检测方法,该方法平衡了噪声对于边缘检测的影响,能够很好的达到去噪的目的。因此本文采用了改进的Canny算法 [17] 提取像素级边缘。然后利用改进的Zernike矩获取圆形标志的亚像素级边缘。下面具体阐述改进的Zernike矩的亚像素提取方法。
3. 圆形标志亚像素级边缘提取
3.1. 基于Zernike矩亚像素边缘检测原理
Zernike矩算法的基本思想是通过计算四个参数来判断该点是否为边缘上的点 [18] ,图2为Zernike矩的理想边缘阶跃模型 [16] 。其中包括h为背景灰度值,k为灰度阶跃值、l为模板中心到边缘的垂直距离,
为边缘与x轴的夹角。
根据上述四个参数,通过转换公式,令
表示图像
的Zernike矩,根据其旋转不变性的理论,则有
(1)
其中
为归一化因子;
为原点到像素点
的矢量距离;
为
与x轴的夹角 [15] 。如果将图像旋转
角度,则旋转后图像
的Zernike矩
满足下面关系式
(2)
根据上述公式,对原始图像Zernike矩
、
、
进行计算,得到旋转后图像的Zernike矩
、
、
满足如下关系式
(3)
Zernike矩亚像素边缘的4个参数h、k、l和
的计算公式如下
(4)
采用N × N的Zernike矩模板 [19] ,其中N = 7,根据上述公式计算的参数,得到第i个亚像素边缘点
,其计算公式为
(5)
3.2. 改进Zernike矩高精度提取边缘信息
通常基于Zernike矩算法亚像素边缘点的阈值判断条件为
,其中
为距离阈值,通常
,N为模板大小,这里取值为7。
为灰度阶跃阈值,其对边缘信息影响显著;不同图像的边缘灰度阶跃阈值一般不同,在检测图像边缘时通常需要人工调节
值,当
取值较小时,则边缘会存在很多伪边缘信息;当
取值较大时,则可以有效地抑制伪边缘,但同时也会造成圆形标志边缘信息的丢失。因此为保证Zernike矩对圆形标志亚像素边缘检测的高精度及稳定性,需要对阈值的选取进行优化改进。因此本文提出基于大津法对边缘灰度阶跃阈值
进行优化选取。
大津法的判定准则为边缘区域和背景区域的类间方差 [20] ,取得最大类间方差时取的最佳阈值。设在N个像素点的图像中,梯度幅值为i的像素点个数为
。则梯度幅值i出现的概率为
。阈值
t将图像分为前景边缘和背景两类,其出现的概率分别为
,其均值为
与
,其均值为
,平均梯度幅值为
,则得到两类的类间方差为
(6)
当方差
为最大时,前景边缘和背景的差异为最大,即分割准确率最高,此时的灰度阈值
为最佳取值。
根据最佳灰度阈值
和距离阈值
对基于Zernike矩亚像素边缘进行计算,最终得到亚像素边缘点
,将其存放边缘点集
中。
图3中,传统Zernike矩方法推导亚像素边缘公式时,将理想阶跃模型作为边缘模型来计算,如图3(a)所示。但在实际应用中其边缘存在着中间过渡区,如图3(b)所示。
(a) 理想边缘 (b) 实际边缘
Figure 3. Grey scale step edge model
图3. 灰度阶跃边缘模型
因此,只利用理想阶跃模型检测边缘时会存在着伪边缘现象,有可能对后续的圆形标志点的中心定位产生影响。本文利用基于灰度梯度中心优化方法来对亚像素边缘进行细化。该方法利用边缘点沿梯度方向灰度的一阶导数为高斯分布,则该分布中心值就是该梯度方向变化最大的位置,即边缘所在之处,从而可以找到细化后精确的边缘点。
首先在通过基于改进的Zernike矩算法提取亚像素边缘后,利用最小二乘拟合法对所有边缘点进行拟合中心,即得到圆形标志物粗定中心。根据粗定中心与粗定边缘,得到每一边缘像素点对应的径向直线方程为
(7)
其中
(8)
式中,
为粗定位中心坐标;
为每一边缘点坐标,选择某一边缘点沿其径向方向计算灰度沿梯度方向的一阶导数高斯函数求其中心灰度值。高斯函数为
(9)
b即为梯度灰度一阶导数高斯分布的中心值,
即细化后的的边缘点所在位置。直至对所有边缘点进行细化。
综上所述,本文所提出基于改进Zernike矩亚像素边缘检测方法其实现步骤描述如下。
步骤1:根据Zernike矩公式求出模板系数,利用Zernike矩模板系数对像素级边缘进行卷积计算A00,A11,A20。
步骤2:基于大津法,选取类间方差为最大时,图像前景边缘与背景的分割达到最大时,获取最佳灰度阈值
。
步骤3:取某一像素级边缘点计算参数k、l和
,并根据边缘点阈值判断条件
,判断该点,直至计算完所有亚像素边缘点。
步骤4:基于灰度梯度中心优化方法来对亚像素边缘进行细化。直至得到所有细化后的亚像素边缘点
。
4. 最小二乘椭圆拟合法定位中心
在图像采集过程中,由于圆形标志物在经过透视投影变换后一般为平面椭圆 [21] ,将上述得到的亚像素边缘点集
,利用最小二乘椭圆拟合法定位圆形标志物圆心。椭圆的一般方程为
(10)
通过最小二乘椭圆拟合法对边缘点进行拟合可解得参数b、c、d、e、f,则椭圆中心点坐标计算公式为:
(11)
最终得到圆形标志物中心点坐标为
。
5. 实验及结果分析
为了验证本研究方法在圆形标志中心定位方面的稳定性和精度,我们分别进行两组实验:对本文方法与质心法以及参考文献 [13] 进行对比分析验证。在稳定性对比实验中,我们使用模拟生成的圆形标志图像来评估本研究方法在不同噪声条件下的稳定性。在精度对比实验中,我们采用在真实室外环境中采集的图像,以评估本文方法的定位精度。
5.1. 稳定性实验
模拟生成一副理想的圆形图像,该图像尺寸为100像素 × 100像素,中心像素坐标为(50,50),半径为25像素,如图4所示。
分别加入方差为(σ = 0.005, 0.01, 0.02, 0.025)的高斯噪声和密度为(d = 0.002, 0.004, 0.01)的椒盐噪声进行实验,采用质心法、文献 [13] 和本文方法进行中心定位实验,最后将得到的中心定位坐标与坐标真值求取均方根误差即RMSE值进行对比分析,定位误差结果如表1所示。

Table 1. Comparison of centre positioning error results of various methods under different categories of noise
表1. 不同类别噪声下各类方法中心定位误差结果对比
从表1可以看到,模拟圆形图像在不同噪声条件下三种方法的中心定位结果,随着高斯噪声和椒盐噪声的逐渐增大,上述三种方法的RMSE值也随之增大,说明这些方法一定程度受高斯噪声和椒盐噪声影响,但其中心定位RMSE值均能达到亚像素级别。本文受高斯噪声影响相对较小,不同类别噪声条件下,本文方法RMSE值微小于文献 [13] ,本文方法和文献 [13] 的RMSE值总体大于质心法。
5.2. 精度实验
本实验在室外环境下搭建小型斜坡模拟边坡,通常红色最容易识别,所以在斜坡上布设四个直径为670 mm的红色圆形标志点,编号为1~4号,使用KS1A552-D型号双目相机对红色圆形标志点进行图像采集,分辨率为720像素 × 1280像素,拍摄距离约为3 m~4 m,采集图像如图5所示。

Figure 5. Collected circular landmark images
图5. 采集的圆形标志物图像
本文通过对采集圆形标志物图像进行中心定位对比实验,分别用质心法,文献 [13] 与本文方法对4个圆形标志进行中心定位,4个圆心像素坐标RMSE结果对比如图6所示。

Figure 6. Comparison of RMSE results for centring of circular signs
图6. 圆形标志中心定位RMSE结果对比
从图6可以看到,本文提出的方法和其他两种方法得到的坐标真值的RMSE值均能达到亚像素。其中质心法、文献 [13] 和本文方法对4个点位RMSE值的平均值分别为0.044、0.022和0.015 (单位:pixel)。其中本文RMSE的均值低于其他两种方法,说明本文的方法能较为准确的定位圆形标志,其平均精度达到0.02像素。
得出三种方法的平均定位精度后,对三种方法的运行时间进行对比,如表2显示了这三种算法运行时间,可以清楚看到文献 [13] 方法和本文方法定位精度均高于质心法,但本文方法的运行时间小于文献 [13] 方法,其运行速度更快,与其相比效率提高了27.85%。
6. 结论
本文介绍了一种改进的Zernike矩圆形标志高精度定位方法,该方法通过一系列图像处理步骤实现了优化的定位结果。首先,对图像进行了二值化和形态学滤波的预处理,然后采用Canny算子进行像素级边缘检测,并引入了基于大津法的最佳灰度阶跃阈值选取方法,以提高亚像素边缘检测的精确度。边缘细化处理通过基于灰度梯度的优化方法进一步提高了像素级边缘的准确性和连续性。最后,采用最小二乘椭圆拟合实现了中心定位。实验证明,本文方法在圆形标志高精度定位方面表现出色,最大平均误差不超过0.02个像素,定位精度明显优于质心法和文献 [13] 的方法。此外,本文方法还取得了显著的运行效率提升,相较于文献 [13] ,提高了27.85%。这种高精度定位方法具有广泛的应用潜力,可用于工业自动化生产以提高产品的定位和识别、机器人导航以实现准确定位、视觉检测和测量领域(如三维重建、尺寸测量和目标跟踪等),以及虚拟现实和增强现实领域,为虚拟现实和增强现实应用提供更准确的定位支持。
当前的定位方法尚存在以下问题:对光照和噪声敏感,可能需要高计算资源和时间,对硬件要求高。现有改进方法主要适用于静态场景中的标志定位,对于动态或快速移动的目标需要进一步优化。未来的研究方向包括在提高精度的同时,增强算法的鲁棒性、适用性、计算效率,并通过实验证明和推广应用,使改进的Zernike矩圆形标志高精度定位方法能够在各种复杂场景下实现准确可靠的定位。
基金项目
辽宁省教育厅青年项目JYTQN2023058,辽宁省科技厅计划项目2022JH1/10800085,沈阳理工大学科研启动支持项目1010147001003。
NOTES
*通讯作者。