1. 引言
在三维点云处理邻域,法向量估计是一项基础且关键的任务,广泛应用于三维重建、计算机图形学、机器人感知及自动驾驶等前沿邻域。准确的法向量估计为后续分析提供了重要的几何信息,其精度直接影响相关应用的性能。
近年来,研究者们针对点云法向量估计提出了多种算法,主要分为基于Voronoi/Delaunay剖分的方法[1]-[3]、基于法向修正的方法[4]-[6]、基于深度学习的方法[7]-[10]、基于邻域拟合的方法[11]-[20]。
其中,基于Voronoi/Delaunay剖分的方法[1]-[3]通过构建点云的几何拓扑结构来推断法向量,但其在处理非均匀采样或含有噪声的点云时,往往难以保证法向估计的准确性。基于法向修正的方法[4]-[6]常作为后处理步骤,通过特定滤波或平滑手段对初始法向量进行校正和离群点剔除,但对于复杂的三维模型,可能会导致法向量出现过度平滑,不能准确地恢复模型的尖锐特征。基于深度学习的方法[7]-[10]采用多尺度特征学习机制,在点云法向估计任务上展现出强大的特征提取能力并能够从数据中自动学习复杂的几何模式,但对于在训练数据分布之外的点云模型上泛化能力不足,难以确保在各类场景下稳定、准确地估计法向量。
基于邻域拟合的方法是目前应用最为广泛的一类方法。该思想最早由Hoppe等人[11]提出,也称主成分分析法(Principal Component Analysis),简称PCA。该算法利用固定邻域内所有点对切平面进行拟合,并将所拟合平面的法向作为当前点的法向。然而,众多研究指出[15],当邻域横跨尖锐边缘或高曲率表面时,这种基于最小二乘的单一平面拟合策略无法准确表达其真实的几何形态,导致法向量估算产生较大偏差,最终使得细节特征变得模糊。后续Guennebaud等人[12]提出利用代数球面代替平面进行拟合,并将拟合曲面的梯度视为法向,这在一定程度上提升了对噪声的鲁棒性。但是,由于其由于该方法依然采用光滑曲面进行拟合,在处理不连续的特征时,跨特征的拟合仍会导致法向的过度平滑[16]。为更精确地描述局部几何,Pauly等人[13]进一步引入了距离高斯加权,依据邻域点与当前点的空间距离分配贡献权重,使得距离远的邻域点有较小的权重系数(后续简称disw)。尽管这减少了远处噪声点的影响,但仅靠距离权重无法区分空间上很近但分属不同平面的邻域点[14]。基于此,Mederos等人[14]提出了一个更鲁棒的迭代加权方案(IRPF),该方法融合了距离权重与残差权重,为与当前点空间位置更近、且到当前迭代拟合平面距离也更小的邻域点赋予更大权重,显著提升了法向估计精度。
然而,传统法向量估计算法中,使用的都是全局邻域尺度,对于固定尺度邻域的选择是一个关键且棘手的问题,因为它无法灵活适配点云局部几何特征的动态变化。如图1所示,固定邻域策略存在局限性:在尖锐特征区域(如棱边、角点)处,小尺度邻域(如k = 50)能够很好地约束在单一表面上,从而更准确地捕捉几何细节,更好地保留特征;然而大尺度邻域(如k = 250)会跨越多个不同朝向的表面,导致多曲面拟合,最终导致估计的法向量偏离真实方向,产生特征平滑现象。在含噪声的平坦区域情况则恰好相反。大尺度邻域由于包含了更多的采样点,能够有效平滑噪声,法向量误差更低,获得更稳定、更鲁棒的法向量估计结果。相比之下,小尺度邻域因采样点少,极易受到噪声点的干扰,导致法向量估计出现较大偏差。真实场景的点云往往是复杂几何特征与噪声的混合体。因此,任何单一的固定邻域尺度都无法同时满足特征保持与噪声抑制。
Figure 1. Effect of fixed neighborhood scale on normal vector estimation accuracy
图1. 固定邻域尺度对法向量估计精度的影响
为突破这一局限,有学者开始探索自适应参数的平面拟合思想。例如,Mitra等人[17]通过分析局部采样密度、噪声尺度以及曲率变化,提出了一种自适应选择邻域大小的算法。然而,后续的研究工作指出[19],该方法效果对噪声标准差和局部曲率等先验参数的准确估计要求较高,在实际应用中这些参数往往难以设定,导致其在噪声较大时的稳定性不足。Wang等人[18]提出一种迭代重加权平面拟合法,该方法通过融合距离、残差及法向差异三种权重,来构建一个带宽自适应的各向异性邻域。然而,综述[20]指出,此类迭代方法计算成本高昂,且其精度严重依赖于初始估计的质量。与上述调整邻域的思路不同,另一类自适应思想则转向了对邻域的结构分析。其代表性工作是Zhang等人[21]提出的低秩子空间聚类方法,该方法通过识别邻域内分属不同平面的点集,使得最终的拟合仅在与目标点共面的点集上执行,从而保证了特征处的鲁棒性。尽管该方法在特征保持上表现优异,但其核心的优化过程计算成本极高。
本文提出一种创新的自适应邻域的点云法向估计方法。该方法突破传统固定尺度邻域的局限性,通过融合局部点云的信息熵与初始法向差异,动态地评估邻域内的几何复杂度和法向一致性。相较于传统方法,该策略既能有效保留尖锐特征等几何细节,又能提升对噪声、离群点的鲁棒性,最终实现复杂场景下点云法向量的精准估计。
2. 算法
针对固定尺度邻域在法向量估计中面临的挑战,本文提出一种自适应邻域选择框架。该算法的输入是一个有噪声的三维点云
,其中N为点云总数,
为第i个点的三维坐标。对于任意点
,其k-近邻(k-NN)记为
。
本算法核心思想是构建面向邻域尺度选择的综合评价准则,对点云
中的每个点
,都能从预设的候选邻域尺度集
中筛选出最优邻域尺度
。以此为不同局部几何特征的点匹配最合适的邻域尺度,从而实现更鲁棒和精确的法向量估计。图2展示了该方法的具体执行流程:
第一步:多尺度特征提取。对于点
的每一个候选邻域尺度
,对每个尺度下的邻域点集分别执行主成分分析(PCA),该过程为每个邻域提取两个核心特征:其一为该邻域协方差矩阵最小特征值所对应的特征向量,将其作为该尺度下的初始法向量
;其二为该邻域协方差矩阵的三个特征值
,其相对大小可反映邻域的几何结构。
第二步:最优邻域筛选。基于第一步得到的特征值分布,计算每个候选邻域的信息熵
,以量化邻域几何复杂度;同时,利用第一步得到的初始法向通过高斯加权策略计算法向一致性
,评估邻域内法向量的离散程度,最终构建融合上述两个指标的综合评价函数
,并通过最小化该函数(
)来确定点
的最优邻域尺度
。
第三步:最终法向量估计。在确定最优邻域
后,将其应用于法向量估计算法,得到该点最终的法向量
。
Figure 2. Flowchart of the algorithm
图2. 算法流程图
2.1. 多尺度特征提取
对于点云
中任意一点
,给定邻域
构造对应的局部邻域协方差矩阵
,定义如下:
(1)
其中,
是局部邻域
的平均点坐标。将协方差矩阵
的特征值按降序排列为
。点
的初始法向
定义为该矩阵中最小特征值
对应的单位特征向量。
2.2. 筛选最优邻域
传统固定尺度法向量估计方法的局限性,根源于其无法在特征保持与噪声鲁棒性这两个相互冲突的目标之间取得平衡。具体而言:
1) 在包含棱边、角点等尖锐特征的区域,大尺度邻域会跨越多个曲面,导致局部平面拟合出现偏差并造成特征平滑,因此这类区域需要较小的邻域。
2) 在含有噪声的平坦区域,小尺度邻域因采样点不足而对噪声更为敏感,导致法向量估计结果不稳定,因此这类区域需要较大的邻域。
上述分析表明,单一固定邻域尺度无法适配点云的所有区域。因此,理想的算法应具备自适应邻域尺度选择能力,为点云中局部特性各异的点动态匹配最优邻域尺度。
要实现这种自适应选择,需先建立一套量化评估邻域质量的标准。本文认为,高质量的邻域需同时满足两个条件:一是具备清晰的局部几何结构,二是具有高度的法向一致性。基于此,本文设计了局部几何复杂度与法向一致性两个核心度量指标,用于量化邻域质量,进而为每个点动态选择最优邻域尺度。
2.2.1. 构建局部几何复杂度
为了有效量化邻域的局部几何复杂度,本文借鉴文献[22]中利用信息熵来度量邻域内点集分布不确定性的核心思想,以邻域协方差矩阵的特征值分布为基础,改进通过归一化信息熵来量化几何复杂度,具体过程如下:
对于一个给定的邻域,我们首先计算其协方差矩阵的三个特征值并按降序排列为
这三个特征值分别代表了点集在三个主成分方向上的离散程度,其相对大小具有明确的几何意义:
当
时,邻域呈线型分布(一维特征);
当
时,邻域呈平面分布(二维特征);
当
时,邻域呈三维散乱分布(无明确几何特征)。
为统一地度量这种结构的不确定性,我们将特征值转化为归一化贡献度
为
(2)
该值表示第i个特征值在总特征值中的贡献比例,满足
。可直观反映邻域的几何特征:
当邻域呈线性结构时,
占主导,导致
趋近于1。
当邻域呈平面结构时,
和
占主导,导致
和
较大,而
趋近于0。
当邻域呈散乱结构时(如角点或含噪区域),三个特征值大小相近,导致
、
、
均趋近于1/3。
基于此分布,构建如下的归一化信息熵以量化局部几何复杂度:
(3)
其中k为邻域尺度,
,为确保数值稳定性,约定当
时,
。标准信息熵取值范围不固定,本文引入归一化因子1/ln3,将熵值严格约束在
区间,实现不同尺度下的可比性。熵值越高,邻域几何结构越复杂(如角点、含噪区域);熵值越低,邻域几何结构越单一(如理想平面、线结构)。
为了进一步从理论层面验证自适应尺度选择的合理性,本文在纯平面叠加高斯噪声的理想假设下,仿真了信息熵H随邻域尺度k变化的演化曲线。为避免边缘效应干扰,选取平面的几何中心点作为分析对象,在该点上计算了H值随邻域尺度k的变化,结果如图3所示。
从图中可以看出,当邻域尺度k较小时,H值较高,表明邻域受噪声主导。随着k增大,H值迅速下降,并最终稳定收敛于无噪声纯平面的理论值。这一结果有力地证明了本文所提方法的理论正确性与实现有效性。
Figure 3. Variation trend of information entropy with neighborhood scale on an ideal noisy plane
图3. 信息熵随邻域尺度的变化趋势(理想噪声平面)
2.2.2. 构建法向一致性
在PCA计算的初始法向量
基础上,评估邻域内中心点法向量
与邻域内其他点法向量
的相似性。考虑到法向量的符号不确定性,使用高斯核函数来定义权重
:
(4)
其中
,
是自适应带宽参数,定义为邻域
内所有法向差异diff的均值,以增强对不同邻域特征的鲁棒性。为避免理想平坦区域(所有diff为0)导致
引发的数值不稳定问题,本文为其设定一个极小正下限
(如1e−6),即
。
最终,法向一致性
定义为
(5)
D值越小,表明邻域内法向量一致性越高,该邻域通常位于一个平滑连续曲面上。D值越大,法向量一致性越低,往往表明邻域跨越了特征边界或存在严重噪声干扰。
2.2.3. 构建综合评分函数
一个理想的邻域,应当同时具备清晰的几何结构(即低几何复杂度,对应低信息熵H)和高的内部一致性(即高法向一致性,对应低法向差异D)。为此本文设计了一个综合评分函数
:
(6)
在构建该评分函数时,我们对比了乘积与加权求和(即
)两种形式,最终选择了乘积形式,主要基于以下考虑:
若采用加权求和本质上是对两个指标做线性融合,需要人为设定权重
,这使得函数对参数敏感,且无法体现两者的约束关系。而本文采用的乘积形式
则天然具备协同约束的特性:只有当H与D同时趋于低值时,评分S才会取得极小值。若任意一项指标表现不佳(例如,法向一致性低导致D偏高),该指标便会放大整体评分,这种约束更贴合本文寻求在结构复杂度与拟合稳定性之间保持平衡的要求,且无需额外调参,更具客观性与鲁棒性。
因此通过最小化该评分函数,即可为每个点
在候选集
中确定其最优邻域尺度:
(7)
其中
为候选邻域尺度集合。
2.3. 最终法向确定
本文提出的自适应邻域选择算法是一个通用前端模块,为每个点
确定其最优邻域
后,可采用不同的法向估计算法得到最终法向量。为验证本框架的通用性和有效性,将其与以下三种经典的法向量估计算法相结合。
2.3.1. PCA_ad
首先介绍PCA_ad算法,它是将本文的自适应邻域选择框架与经典主成分分析(PCA)结合得到的方法。在为每个点
筛选出最优邻域
后,采用PCA对该邻域内的点集进行平面拟合。该过程等价于求解一个最小二乘问题,即寻找一个平面S,使得邻域内所有点到该平面的平方距离之和最小。其目标函数为:
(8)
式中
为平面S的法向量,
为S到原点的距离。
2.3.2. 距离加权(disw_ad)
接下来是引入距离加权策略的disw_ad算法,该策略(disw)思想由Pauly等人[13]在相关研究中提出。与PCA_ad类似,本算法首先利用自适应框架确定最优邻域
,随后通过最小化加权能量函数来估计法向量。该方法为邻域内的每个点
赋予一个基于其与中心点
空间距离的高斯权重
,使得近处的点在平面拟合中发挥更大的作用。其目标函数为:
(9)
其中,
表示邻域点到拟合平面的距离,
表示距离残差带宽,
为高斯权函数,对距离当前点
更近的邻域点赋予更大权重。
2.3.3. 距离及残差加权(IRPF_ad)
IRPF_ad算法融合距离与残差加权策略disw_ad虽通过距离加权抑制了远处噪声,但无法区分空间邻近但分属不同表面的点。为此,将自适应邻域框架与Mederos等人[14]提出的鲁棒迭代加权方案结合,构建IRPF_ad算法。该策略思想在距离权重基础上引入残差权重,为空间位置更近、且到当前拟合平面距离更小的邻域点赋予更大权重。本文将其应用于非迭代RANSAC框架,其目标函数如下:
(10)
其中,
为高斯权函数,对距离当前点更近的邻域点赋予更大权重;
是Welsch函数,
和
分别表示距离带宽和拟合残差带宽。
3. 实验结果及分析
3.1. 实验设置
为了评估自适应邻域算法的性能,本文将PCA与PCA_ad,disw与disw_ad以及IRPF与IRPF_ad分别进行比较。本文测试包含多种光滑曲面和尖锐特征的合成模型,对所有模型添加中心高斯噪声,标准差定义为点间平均距离的百分比,分别为30%,40%,50%,60%。
为确保算法能够在特征保持与噪声抑制之间进行充分的权衡,我们设定了一个覆盖范围较广的候选邻域尺度集
,该集合包含了从捕捉精细细节的小尺度到有效平滑噪声的大尺度。
3.2. 评价函数
本文使用带有阈值的均方根误差
来评价,定义如下:
(11)
(12)
其中
是法向
与
之间的夹角,
是点
的真实法向,
是点
的估计法向;本文设置阈值
,当
与
的值大于
时,认为该点的法向量估计结果为异常值(坏点),并将其误差惩罚为
,以避免异常值对整体误差的干扰。
3.3. 实验结果展示与分析
3.3.1. 自适应邻域选择机制特性分析
含噪点云处理中,固定邻域尺度难以适配局部几何变化,下图4通过邻域尺度分布热力图直观展示本算法的自适应效果,图中颜色映射反映了不同区域邻域尺度的动态变化规律。
Figure 4. Heatmap of the adaptive neighborhoods
图4. 自适应邻域热力图
3.3.2. 定量对比
在本实验中,为了系统评估本自适应邻域方法对不同噪声水平的鲁棒性与自适应性,针对不同噪声强度(30%, 40%, 50%, 60%)与各点云模型,先开展固定邻域最优尺度搜索:依次选取候选邻域尺度集合K中的邻域尺度k,计算对应法向量估计的
数值,记录使
最小的
,这代表了固定邻域方法所能达到的理论上限,以此作为该场景下固定邻域法的“最优基准”。
随后,在相同噪声场景与模型下测试本文自适应邻域方法,为每个点云局部分配邻域尺度并生成法向量估计结果,我们在多个模型和噪声水平下,将本文提出的三个自适应框架(后缀为_ad)与最优固定邻域方法(后缀为_Fixed)进行全面的定量比较。下图5展示了在三个代表性模型上的对比,详细数据汇总于表1。
Table 1. Comparison of the average RMS angular errors of different methods under varying noise levels
表1. 不同方法在各噪声水平下的平均RMS角度误差对比
方法类型 |
noise03均值 |
noise04均值 |
noise05均值 |
noise06均值 |
平均值 |
PCA_Fixed |
0.5307 |
0.5860 |
0.6002 |
0.6252 |
0.5855 |
PCA_ad |
0.5138 |
0.5354 |
0.5633 |
0.5899 |
0.5506 |
disw_Fixed |
0.5391 |
0.5755 |
0.6108 |
0.6463 |
0.5929 |
disw_ad |
0.4639 |
0.5277 |
0.5603 |
0.5907 |
0.5356 |
IRPF_Fixed |
0.4183 |
0.4666 |
0.5015 |
0.5394 |
0.4815 |
IRPF_ad |
0.3917 |
0.4542 |
0.4936 |
0.5334 |
0.4682 |
模型fandisk_77K
模型octahedron_50K
模型mechpart_92K
Figure 5. A line chart comparing the RMS angular errors of the PCA, disw, and IRPF methods under the fixed optimal scale and adaptive neighborhood on representative models
图5. 多模型应用PCA、disw、IRPF方法在固定最优尺度与自适应邻域尺度下的RMS角度误差对比折线图
从表1的全噪声尺度均值列可见,本文提出的自适应方法在所有测试场景下均显著优于最优固定邻域方法,验证了本框架在复杂噪声场景下的综合性能与鲁棒性。
进一步地,图5中的折线图结果揭示了本文方法的内在优势:在低至中等噪声水平(如noise03、noise04)下,自适应方法的性能增益尤为突出。这得益于本文的邻域尺度评分函数可在该噪声区间精准选择小尺度邻域,从而最大程度保留几何细节;随着噪声水平升高,最优固定邻域倾向于选择大尺度邻域进行全局平滑,因此两类方法的性能差异随之变小。即便如此,在多数高噪声场景下,本文方法仍保持性能优势或与固定邻域方法相当。
3.3.3. 定性对比
为直观地展示本文算法在特征保持方面的优势,在图6中展示了噪声水平下的定性可视化对比结果。
从图6的可视化结果可见:在anchor_40K模型的拐角尖锐特征区以及mechpart模型的孔洞边缘区域(橙色框),固定邻域方法(Fixed)法向分布紊乱,尖锐特征边界模糊;而本文自适应邻域方法(Ours)法向一致性显著提升,可精准保留尖锐特征。在octahedron模型的顶点细节处,固定邻域方法估计的法向发散,而本文自适应邻域方法估计的法向聚集性更佳,对顶点精细几何特征的捕捉能力更强。综上可见,本文自适应邻域方法在特征保持与噪声鲁棒性方面,显著优于固定尺度邻域方法。
注:本定性对比基于IRPF方法在噪声点云(noise04)下的结果;左侧为最优固定邻域方法(Fixed),右侧为本文自适应邻域方法(Ours);橙色框为局部细节放大区域,用于直观展示特征保持能力的差异。
Figure 6. Visualization of the proposed algorithm and fixed-scale algorithm under different models
图6. 本文算法与固定尺度算法在不同模型下的可视化
3.3.4. 自适应邻域选择的效率分析
为验证候选邻域尺度集K对自适应邻域选择算法效率与精度的影响,本文设计了三组候选邻域集去做对比实验:
1) 精简候选集:
(共6个尺度)
2) 原始候选集:
(共12个尺度,即本文所采用的候选集)
3) 密集候选集:
(共20个尺度)
实验环境配置如下:AMD Ryzen 55500U处理器(主频2.10 GHz),16 GB内存,64位Windows操作系统,MATLAB编程环境。测试对象为包含10,000个点的三维点云,随机选取500个核心点进行统计,评价指标包括总运行时间与平均最优评价得分(即500个点在各自候选集中搜索到的最小
的均值)。该得分越小,表明候选集越能精准捕捉到真实的局部结构,实验结果如下表2所示。
从实验结果可以看出:
1) 运行时间方面:算法运行时间与候选集大小
呈近似线性正相关。精简候选集效率最高,密集候选集效率最低,而本文的原始候选集运行时间处于中间水平,在可接受范围内。
Table 2. Trade-off analysis of algorithm efficiency and accuracy under different candidate set configurations
表2. 不同候选集配置下算法效率与精度的权衡分析
候选集配置 |
候选集大小∣K∣ |
运行时间(秒) |
平均最优评价得分 |
精简候选集 |
6 |
104.39 |
0.0226 |
原始候选集 |
12 |
219.52 |
0.0206 |
密集候选集 |
20 |
333.34 |
0.0208 |
2) 精度稳定性方面:精简集由于尺度跨度过大,极易错过真实的局部结构,导致平均最优得分显著偏高,难以实现精细的自适应贴合;相比之下,本文的原始候选集得益于小尺度密集、大尺度稀疏的非均匀采样策略,其平均最优得分较精简集出现了显著下降;而密集集虽然进一步穷举了更多尺度,其得分的下降幅度小,但却带来了极大的时间开销。
综上,本文设计的12个尺度候选集可以在精度与效率之间取得平衡,是兼顾效果与性能的合理选择。针对大规模点云场景下的效率优化需求,结合本文自适应邻域框架,提出轻量化加速策略:
第一步(粗筛):仅使用候选集中的3个关键尺度(10, 100, 300)快速计算评分,锁定最优尺度所在的区间。
第二步(细筛):仅在该区间内遍历剩余尺度进行精细筛选,而非遍历全部12个尺度。
该策略可将单点的计算量减少50%以上,且不损失最优尺度的筛选精度。
4. 结论
本文针对三维点云法向量估计中固定邻域难以兼顾特征保持与噪声抑制的核心挑战,提出一种基于局部几何信息熵与法向一致性融合的自适应邻域选择算法。该算法通过构建综合评分函数,为每个点动态确定最优邻域尺度。实验表明,该自适应框架在PCA、disw、IRPF等多种后端算法下均显著优于最优固定邻域基线,在强噪声下仍能有效保护尖锐几何特征,避免固定邻域的过度平滑问题。未来可探索鲁棒性更强的评价指标或多尺度融合策略,进一步提升极端噪声下的性能。综上,本文提出的自适应邻域框架为点云法向量估计提供了高效通用的解决方案,具备较高的实用价值。
NOTES
*通讯作者。