电子商务仓储环境下基于改进A*算法的AGV路径规划研究

doi:10.12677/ecl.2025.14113777

期刊菜单

电子商务仓储环境下基于改进A*算法的AGV路径规划研究
Research on AGV Path Planning Based on Improved A* Algorithm in E-Commerce Warehousing Environment

DOI: 10.12677/ecl.2025.14113777, PDF, HTML, XML,
作者: 杨林辉：武汉科技大学管理学院，湖北武汉；杨中华：武汉科技大学管理学院，湖北武汉；武汉科技大学服务科学与工程研究中心，湖北武汉
关键词: 电子商务仓储；AGV路径规划；A*算法；E-Commerce Warehousing； AGV Path Planning； A* Algorithm

摘要: 针对电子商务仓储环境下AGV路径规划的冲突问题，提出一种基于坐标保留表和冲突分类的无冲突多目标算法CF-MOWVRP (Conflict-Free Multi-Objective Warehousing Vehicle Routing Problem)。该算法首先构建鱼骨式栅格地图，模拟货架、拣选台和动态任务环境；其次改进A*算法，支持4方向搜索和路径缓存，然后建立多目标优化模型，最小化总运输距离、最大单次距离和冲突等待时间，并通过遗传操作、偏好随机策略和强化学习求解Pareto前沿；最后利用折线优化和二次Bezier曲线平滑路径，提高AGV运动平滑度。仿真结果表明：在30个动态任务场景下，相比传统A*，节点减少33%、转弯减少50%、完成时间降低11%。AGV增至10辆、任务增至60个、障碍比例增至0.45时，完成时间均降低约17%，验证了算法在高并行、高密度和复杂环境中的鲁棒性。

Abstract: Addressing the conflict issue of AGV path planning in the e-commerce warehousing environment, a conflict-free multi-objective algorithm CF-MOWVRP (Conflict-Free Multi-Objective Warehousing Vehicle Routing Problem) based on coordinate retention table and conflict classification is proposed. This algorithm first builds a fishbone-like grid map to simulate shelves, picking stations and dynamic task environments; then improves the A* algorithm to support four-direction search and path caching; then establishes a multi-objective optimization model to minimize total transportation distance, maximum single distance and conflict waiting time, and solves the Pareto frontier through genetic operations, preference random strategies and reinforcement learning; finally, it optimizes the path with polyline optimization and quadratic Bezier curve smoothing to improve the smoothness of AGV movement. The simulation results show that in 30 dynamic task scenarios, compared to traditional A*, nodes are reduced by 33%, turns are reduced by 50%, and completion time is reduced by 11%. When the number of AGVs increased to 10, the number of tasks increased to 60, and the obstacle ratio increased to 0.45, the completion time decreased by about 17%, verifying the robustness of the algorithm in high parallel, high-density, and complex environments.

文章引用：杨林辉, 杨中华. 电子商务仓储环境下基于改进A*算法的AGV路径规划研究[J]. 电子商务评论, 2025, 14(11): 3025-3037. https://doi.org/10.12677/ecl.2025.14113777

1. 引言

随着电子商务的蓬勃发展，仓储自动化与效率成为物流行业的关键瓶颈，电子商务仓储系统已成为提升供应链效率的关键环节[1]。在电商平台如阿里巴巴、京东等推动下，仓库自动化水平不断提高。AGV (Automated Guided Vehicle)作为核心设备，也称自动搬运机器人，其路径规划效率直接影响整个仓储系统的性能。AGV内部集成自动导引装置，能够借助各种智能算法、先进管理系统和其他智能技术，完成各种环境下物资的搬运、分拣和配送[2]。路径规划就是能够使AGV按照最短路径、最快到达、最少拐弯等原则从预先设定的起始点规划出一条到达目标点的最佳路径，然后AGV安全、可靠、高效地将物资从起始点搬运至目标点[3]。近年来，随着社会需求增长，物资生产和运输规模不断扩大，AGV被广泛应用于机场、码头、医院等场所，具有广阔的发展前景[4]。

针对AGV路径规划，传统的A*算法存在遍历节点数多、转弯次数较多及规划路径过障碍物顶点导致实际环境中容易与障碍物发生碰撞等问题[5]。为了解决这些缺点，许多学者展开了研究。杨秀建等对经典A*算法进行了改进研究，提出了斜八邻域扩展的概念，与四邻域扩展结合组成一种新的双邻域选择扩展策略，在路径搜索过程中可以有效减少扩展节点的数量[6]。李兴州等人[7]提出一种多领域多方向搜索方式改进的A*路径规划算法用来减少路径轨迹中的节点数量。按照现有的研究思路，本文计划通过改进扩展节点搜索方式以达到有效避免路径接触障碍物的目的。

同时，多目标优化在AGV路径规划中逐渐受到关注，Pareto前沿方法也随之运用于权衡总距离、最小化最大完成时间及等待时间等多目标。吴自松等人设计了一种两阶段混合算法：第一阶段通过引入爬山算法改进非支配排序遗传算法的局部搜索策略，求解一组Pareto前沿集；第二阶段由K-means对Pareto前沿集进行剪枝[8]。此外，遗传算法和强化学习也常被用于求解多目标模型，例如P-MOCO算法结合Pareto优化与冲突检测，显著提升了路径规划效率[9]。

复杂的电商仓储环境中，来回穿梭的小车易产生冲突和碰撞，路径规划时也容易陷入局部最优陷阱。为此，任明辉等提出了基于改进冲突搜索的路径规划模型(iCBS-pri)，该改进模型主要由任务分配、单AGV路径规划、多AGV冲突检测与解决3个模块组成[10]。此外，宫婧等提出基于无冲突路径算法的多目标智能仓储路径规划，构建鱼骨布局并使用P-MOCO求解多目标模型，但忽略了动态任务下的实时冲突调整[11]。

基于以上文献研究总结的现有不足，如传统A算法在复杂环境中易产生节点冗余和碰撞、P-MOCO对动态任务实时调整的局限性以及鱼骨布局下冲突解决的空白，本文提出了一种改进A*算法的多AGV路径规划算法。通过构建鱼骨式栅格地图并集成缓存和顶点避让优化路径搜索，引入CF-MOWVRP算法实现多目标优化与实时冲突调整，并采用Bezier曲线平滑路径，以有效弥补动态任务下无冲突路径规划的不足。创新点包括：(1) 鱼骨式栅格地图建模，支持动态任务生成；(2) 改进A*集成缓存和顶点避让；(3) 多目标模型与CF-MOWVRP求解，实现无冲突。

2. 模型与问题定义

2.1. 电商仓储环境建模

本文采用栅格地图建模方法，该方法建模简单且易于维护，能够有效模拟AGV在电商仓库复杂布局下的运动约束。根据鱼骨式布局设计，本文构建了一个14 × 25的栅格地图模型，单位栅格边长为1 m (见图1)。地图中黑色区域代表货架障碍物(AGV不可通行)，白色区域表示可通行路径区域，灰色区域为拣选台(部分占用)。具体布局如下：9个货架区分布在横向三组，纵向三层，中间隔2格空道，便于AGV穿梭。每个货架区标记编号1~9。3个1 × 2拣选台，位于左侧，平行于货架行，标记编号1~3。AGV空载时障碍物仅为空置拣选台和其他AGV，载货时障碍物额外包括货架格子。

Figure 1. Grid example diagram

图1. 栅格示例图

图1展示了该栅格地图布局(仅为一种示例，实际情况可变化)。从图中可见，鱼骨式设计确保了单向路径网络的单向性，便于AGV从起始点到货架、拣选台的有序流动。

本文考虑5辆AGV小车，支持4方向移动(上、下、左、右)，移动速度固定为1 m/s (每格2 s)。AGV初始位置随机分布在可通行区域、AGV任务流程为：从当前位置到货架(空载路径)、到拣选台邻接点(载货路径)、返回货架(空载返回)。路径搜索采用改进A*算法。每辆AGV在初始建模时假设为点模型，忽略车体尺寸以简化路径规划和冲突检测的计算复杂度，但为适应电子商务仓储实际部署中的安全需求，在后续路径平滑优化阶段，考虑AGV实际车体尺寸(假设为1 m × 1 m，约1个栅格)，并在Bezier曲线拟合时引入0.5 m缓冲区，确保路径与障碍物保持安全距离，避免碰撞。任务动态生成，模拟真实电商高峰期订单波动。总任务数30个，包括初始10个，按泊松分布λ = 2 s在起始阶段生成；额外20个生成时间间隔服从泊松过程，但λ = 30 s。每个任务定义为三元组：(货架位置(x, y)，生成时间t，拣选时间 ∈ [60, 120] s)。

多AGV协作中，冲突分为位置冲突(同一时间占用同一格子)和时间冲突(路径交叉导致死锁)。本文引入AGV坐标保留表，记录每个格子的占用时间窗。坐标保留表的数据结构为字典类型，键为网格坐标(x, y)，值为列表，每个元组为(AGV编号，[起始时间，结束时间])，例如{(3, 5)：[(1, [10, 15]), (2, [20, 25])]}表示坐标(3, 5)在时间10~15被AGV1占用，20~25被AGV2占用。操作逻辑包括插入：添加新占用元组时检查重叠，若重叠则触发冲突；查询：给定坐标和时间，返回占用AGV；更新：修改或删除元组，支持时间窗合并以优化存储。

冲突检测函数遍历所有AGV路径对，若 $\exists t$ ， $p o s_{1} (t) = p o s_{2} (t)$ ，则标记冲突。解决策略的决策规则为：若位置冲突，优先延迟低优先级AGV路径(+timestep = 2 s)，并更新保留表；若时间冲突，采用重规划备用路径(重新调用A，优先选择备用邻接点)；若冲突超过阈值(基于仿真实验和电子商务仓储需求将阈值设为3，可平衡冲突控制与计算效率)，调整AGV优先级或全局重新分配任务，以确保电商仓储高峰期订单处理的连续性。

2.2. 多目标模型

本文建立多目标优化模型，目标为最小化总运输距离 $D_{total}$ 、最小化最大单次距离 $d_{\max}$ 、最小化冲突等待时间 $T_{wait}$ 。目标函数表述如下：

$min (D_{total}, d_{\max}, T_{wait})$

其中，

$D_{total} = \sum_{i = 1}^{N} (d i s t_{1 i} + d i s t_{2 i} + d i s t_{3 i})$

$d_{\max} = \max (d i s t_{1 i} + d i s t_{2 i} + d i s t_{3 i})$

$T_{wait} = sum ({time}_{wait})$

约束：

$\forall t \in T, \forall i \in {1, 2, \dots, N}, p o s_{i} (t) \notin {loaded}_{obstacles}$

$\forall k \in {1, 2, \dots, K}, t_{start, k} \geq t_{gen, k}, t_{end, k} \leq makespan$

$\forall t \in T, \forall p \in {1, 2, 3}, \sum_{i = 1}^{N} I (p o s_{i} (t) \in {picker}_{p}) \leq 1$

$\forall i \in {1, 2, \dots, N}, \forall t \in [t_{start, i}, t_{end, i}], \exists (x^{'}, y^{'}) \in neighbors (p o s_{i} (t)) s .t . p o s_{i} (t + 1) = (x^{'}, y^{'})$

$\forall i \in {1, 2, \dots, N}, \forall t \in T, ‖ p o s_{i} (t + 1) - p o s_{i} (t) ‖ = 1 and Δ t = 2 s$

$d i s t_{1 i}$ 为AGV i到货架距离(A*计算)， $d i s t_{2 i}$ 为到拣选台距离， $d i s t_{3 i}$ 为返回距离。T为时间步长(离散时间点)。i为AGV编号，N为AGV总数。 $p o s_{i} (t)$ 表示AGV i在时间t的位置坐标(网格单元，例如(x, y))。 ${loaded}_{obstacles}$ 为动态障碍物集合，包括货架和空载时占用的拣选台。k为任务编号,K为总任务数。 $t_{g e n, k}$ 为任务k的生成时间。 $t_{start, k}$ 为任务k开始执行的时间。 $t_{end, k}$ 为任务k完成的时间(包括拣选时间)。Makespan为所有任务的最大完成时间。p为拣选台编号。 ${picker}_{p}$ 为拣选台p的邻接点集合(例如拣选台1：[(0, 1), (1, 3), …])。 $I (\cdot)$ 为指示函数，若条件成立则为1，否则为0。 $t_{start, i}$ 和 $t_{end, i}$ 表示AGV i的任务起始和结束时间。 $neighbors (p o s_{i} (t))$ 表示 $p o s_{i} (t)$ 的4方向邻居(上、下、左、右)，条件为可通行。 $‖ \cdot ‖$ 表示曼哈顿距离。 $Δ t$ 为时间步长。

3. 算法设计

3.1. 改进A*路径搜索

传统A*算法在多AGV动态环境中易产生遍历节点过多和路径冗余问题。为此，本文提出CF-MOWVRP算法，这是一种基于P-MOCO的改进框架，专为多AGV智能仓储场景设计。算法的核心思想是坐标保留表和冲突分类机制，该算法支持上下左右4方向搜索，采用曼哈顿距离作为启发函数h(n)，并针对电商仓储的高频订单处理，引入路径缓存优化响应时间。同时，算法在扩展邻域时检查障碍顶点，避免路径斜穿货架交点。

估价函数定义为：

$f (n) = g (n) + h (n)$

其中， $g (n)$ 为起点到当前节点n的实际代价(每步1)， $h (n) = | x_{2} - x_{1} | + | y_{2} - y_{1} |$ 为曼哈顿距离。开放集使用优先队列，最大迭代4000次，若失败返回空路径。

算法步骤如下：

(1) 初始化：设置开放集为起点(start)，此时起点到当前节点n的实际代价等于从当前节点到目标的启发式估计代价，映射表为空字典。

(2) 扩展节点：从开放集弹出最低 $f (n)$ 节点，检查4方向邻居，跳过障碍和已访问，应用顶点避让过滤无效扩展。

(3) 更新代价：计算当前节点的邻居节点的实际代价，等于从起点到当前节点的已知代价加上移动到邻居节点的一步代价，若更优则更新实际代价和估计代价，并记录在映射表；若路径已缓存，直接返回。

(4) 终止条件：若当前已达目标，重构路径逆向追溯；迭代超4000次或开放集为空，返回空路径。成功路径存入已计算的缓存，用于后续调用。

3.2. 任务分配

采用贪婪策略，遍历可用AGV和任务，计算最小总成本：

$cost = t_{1} + d_{2} \times {time}_{step} + {time}_{pick} + t_{3} \times {time}_{step} + {time}_{wait}$

其中 ${time}_{step} = 2 s$ ， ${time}_{wait}$ 考虑拣选台占用。其中t₁为到货架时间，dist₂为到拣选台时间，t₃为返回时间。优先分配尝试次数多的任务。拣选台邻接点为可达位置集，需要预计算(如拣选台3：[(0, 12), (1, 11), (0, 9), (1, 10)])，临时障碍排除当前货架。

(1) 初始化：扫描可用AGV和初始任务；后续生成动态任务，任务生成时间间隔服从泊松过程( $λ = 30$ )。

(2) 成本评估与分配：对于每个AGV和任务，调用改进A*计算path1 (当前位置到货架)、path2 (货架到拣选台邻接点)、path3 (邻接点返回货架)；选择最低成本组合，更新AGV位置、忙碌时间和拣选台占用。

(3) 冲突检测：遍历AGV路径对，检查同一时间t下pos₁(t) == pos₂(t)；分类：位置冲突(立即延迟冲突AGV路径)，时间冲突(重规划备用路径)。

(4) 解决与验证：延迟后重新A*搜索；若仍冲突，调整优先级或跳跃时间；验证无冲突后，加入AGV任务。

(5) 时间管理：若无可用，跳至最早空闲时间或下个生成时间，确保实时性。

总体顺序是任务分配先于路径优化执行。分配过程首先根据任务优先级和AGV可用性，确定每个AGV的任务序列；随后，任务序列作为输入传递至路径优化模块(改进A*算法)，生成从AGV当前位置到货架、拣选台及返回货架的无冲突路径。任务分配模块每分配一个任务后，立即调用路径优化模块计算对应路径，并将结果存储在路径缓存中，以减少重复计算。

任务分配与路径优化的数据流关系是任务分配模块接收动态任务列表和AGV状态(包括位置和忙碌时间) (见图2)，通过贪婪策略生成任务序列。任务序列包含每个AGV的任务三元组(货架位置、拣选台位置、返回位置)，作为路径优化模块的输入。路径优化模块调用改进A*算法，结合鱼骨式栅格地图和障碍信息，输出各AGV的路径列表。路径列表通过冲突检测模块验证，若发现冲突，则反馈至路径优化模块进行延迟或重规划，最终生成无冲突路径。

Figure 2. Data flow diagram

图2. 数据流关系图

3.3. 路径优化

(1) 初始化：生成种群(随机分配30任务到5 AGV)，初始化Q表(强化学习中用于存储状态–动作价值函数的表格)和地图状态(栅格 + 障碍)。

(2) 路径生成与评价：为每个个体调用A*计算路径，检测冲突；计算 $D_{total} = sum (d i s t_{1} + d i s t_{2} + d i s t_{3})$ 、 $d_{\max}$ 、 $T_{wait}$ ，Pareto排名。

(3) 遗传迭代：选择高适应个体，进行交叉/突变，生成新种群；强化学习更新Q值，指导下轮动作(偏好随机采样)。Q表更新公式为：

$Q (s, a) \leftarrow Q (s, a) + α [r + γ \max_{a^{'}} Q (s^{'}, a^{'}) - Q (s, a)]$

其中， $s$ 为当前状态(AGV位置、任务状态)， $α$ 为动作(路径选择)， $r$ 即时奖励(基于距离和冲突)， $α = 0.1$ 为学习率， $γ = 0.9$ 为折扣因子。公式通过迭代更新Q值，指导AGV在动态任务环境中求解Pareto前沿(见图3)，平衡总距离、单次最大距离和冲突等待时间。

(4) 路径精拣：对Pareto解应用折线去除，删除冗余节点；然后使用二次Bezier曲线拟合转折点，考虑AGV车体尺寸(1 m × 1 m)并设置0.5 m缓冲区(Q₀/Q₂点取转折点两侧0.5距离)，验证路径不与障碍碰撞(见图4)。

(5) 终止：迭代max_gens = 100或收敛，输出最佳无冲突平滑路径。

其中，Bezier曲线表达式为：

$P (t) = {(1 - t)}^{2} P_{0} + 2 t (1 - t) P_{1} + t^{2} P_{2}, 0 \leq t \leq 1,$

其中P₀、P₂为端点，P₁为控制点(转折点)。为避障，取转折点两侧0.5距离点Q₀、Q₂：

$Q_{0} = P_{1} - \frac{1}{2 L_{1}} (P_{1} - P_{0}), Q_{2} = P_{1} - \frac{1}{2 L_{2}} (P_{1} - P_{2}),$

L₁、L₂为线段长(栅格单位)。

Pareto前沿如图3所示：散点表示解集，蓝色区域为优解空间。

Figure 3. Pareto frontier simulation diagram

图3. Pareto前沿模拟图

Bezier拟合如图4所示：红色曲线为传统A*路径(点模型，未考虑车体尺寸，可能碰障碍)，绿色曲线为改进Bezier拟合(考虑1 m × 1 m车体尺寸和0.5 m缓冲区)，确保安全。图中横轴为仓库栅格横向坐标(单位：栅格，1栅格 = 1 m)；纵轴为仓库栅格纵向坐标(单位：栅格，1栅格 = 1 m)。为演示转折点处的效果，图为局部放大示意图。

Figure 4. Quadratic bezier curve fitting diagram

图4. 二次Bezier曲线拟合图

4. 实验与结果分析

4.1. 实验设计

为验证所提CF-MOWVRP算法在电商仓储环境下的有效性，实验在14 × 25栅格地图上进行，地图包含9个货架区、3个1 × 2拣选台及动态任务场景，适用并统一于所有对比算法。实验硬件为Intel Core i5-8250U处理器，8 GB RAM，运行环境为Windows 11，Python 3.12，依赖库包括matplotlib、numpy和ffmpeg。

仿真参数如下：AGV数量：5辆，初始位置随机分布(例如AGV1 (23, 11)、AGV2 (4, 7)等)。任务数量为30个，初始10个，剩余20个任务动态生成，生成时间间隔服从泊松过程( $λ = 30$ )。移动速度1 m/s，步长时间2 s。最大模拟时间10,000 s，实际覆盖980 s。拣选时间为均匀分布[60, 120] s。对比算法分别是传统A* (基于经典A*算法)、iCBS-pri (基于改进冲突搜索) [10]、P-MOCO (多目标优化) [9]。

传统A*算法的关键参数为：使用曼哈顿距离作为启发函数，开放集采用优先队列管理，最大迭代次数4000，路径搜索支持4方向移动(上、下、左、右)，无冲突检测机制，每次规划单AGV路径，忽略其他AGV动态占用。实现细节为：初始化开放集为起点，扩展4方向邻居，跳过障碍格，使用曼哈顿距离h(n) = |x1 − x2| + |y1 − y2|，无路径缓存，逐AGV独立规划。

iCBS-pri算法的关键参数为：基于冲突树记录路径冲突，优先级基于任务紧急性和AGV当前位置(距离货架的曼哈顿距离)。每次冲突触发低优先级AGV路径重规划(调用A*，最大迭代4000)，冲突阈值3次后调整优先级。冲突树更新频率为每任务分配后，时间窗分辨率2 s。实现细节为：初始化冲突树为空，每个AGV路径由A*生成，冲突检测遍历路径对，记录冲突节点(时间、坐标、AGV编号)，优先延迟低优先级AGV (+2 s)，若冲突超3次，重新分配任务优先级并全局规划。路径缓存用于加速重复路径计算。

P-MOCO算法的关键参数为：结合遗传算法和Pareto前沿求解，种群大小100，交叉率0.8，突变率0.1，迭代100次。路径规划基于A*，冲突检测通过时间窗检查，每次冲突触发路径重规划，优化目标为总距离和最大单次距离。实现细节为：初始化种群，随机任务分配，为每个个体调用A*生成路径，检测冲突后重规划，Pareto排名基于总距离和最大单次距离，遗传操作包括单点交叉和随机突变，最终选择最优解集。

4.2. 算法对比分析

表1展示了4种算法在不同指标上的表现，数据基于30任务运行3次取平均值(见表1)。

Table 1. Algorithm performance comparison table

表1. 算法结果对比表

算法	总距离(格)	Makespan (s)	冲突次数	节点数/路径	转弯次数/路径	计算时间(s)
传统A*	1320	1560	5	180	8	12.3
iCBS-pri [10]	1250	1420	1	160	6	10.0
P-MOCO [9]	1180	1400	0	140	5	9.8
CF-MOWVRP	1206	1388	0	120	4	8.5

CF-MOWVRP总距离1206格，优于传统A*和iCBS-pri，略逊于P-MOCO，但是通过节点数/路径、转弯次数/路径指标可以发现所提算法的路径更平滑。传统A*因逐AGV独立规划，路径冗余较多；iCBS-pri通过冲突树优化路径选择，但优先级调整导致部分路径绕行；P-MOCO通过遗传算法全局优化距离，但动态调整不足。在完成时间方面，CF-MOWVRP较传统A*降低11%，低于iCBS-pri，接近P-MOCO，原因是传统A*未优化任务分配和冲突解决，导致AGV完成时间分散；iCBS-pri算法虽通过冲突搜索降低了一些延误，但因全局重规划开销大而高于CF-MOWVRP。CF-MOWVRP通过实时冲突检测和多目标平衡显著缩短了最大完成时间，在电商高峰期任务场景下，该算法提升订单履约效率。

CF-MOWVRP和P-MOCO实现0冲突，优于传统A*和iCBS-pri，传统A*因未集成冲突检测机制，多个AGV可能同时占用同一路径点；iCBS-pri算法通过冲突搜索减少冲突，但依赖全局解决，在动态任务中仍残留1次冲突；CF-MOWVRP通过坐标保留表和动态重规划彻底消除了冲突，体现了其无冲突优化的优势。

计算时间方面，CF-MOWVRP计算时间8.5 s，低于传统A*、P-MOCO和iCBS-pri。传统A*因节点扩展多，计算开销大；P-MOCO的遗传迭代增加时间；iCBS-pri的冲突树更新和全局重规划耗时较多；CF-MOWVRP通过路径缓存和高效冲突检测降低约13%计算时间。

节点数/路径方面，CF-MOWVRP平均120个节点/路径，较传统A*减少33%，优于iCBS-pri和P-MOCO。传统A*因逐节点扩展，节点数最多；iCBS-pri通过冲突树优化路径选择，但重规划增加节点；P-MOCO通过遗传算法减少节点，但未缓存路径；CF-MOWVRP的缓存机制和顶点避让显著减少节点数。转弯次数/路径方面，CF-MOWVRP平均4次/路径，较传统A*减少50%，优于P-MOCO和iCBS-pri。传统A*路径折线化严重；iCBS-pri和P-MOCO未采用Bezier平滑，保留较多转折点；CF-MOWVRP通过二次Bezier曲线调整控制点，优化路径平滑度，减少AGV机械磨损，符合电商仓储高效运动需求。下图通过将节点数和转弯次数进行柱状图像处理，可以直观看到算法差异(见图5)。

4.3. AGV与任务对比分析

实验中，5辆AGV分配30任务，结果见表2。

Figure 5. Node count vs. Turn count comparison diagram

图5. 节点数与转弯次数对比图

Table 2. Comparison table of different AGVs and tasks

表2. 不同AGV与任务对比表

AGV编号	任务数量	完成时间(s)	平均单任务时间(s)
1	6	1388	231.3
2	6	1165	194.2
3	5	1158	231.6
4	6	1223	203.8
5	7	1385	197.9

AGV3任务数较少(5个)，主要是因为其初始位置靠近拣选台，导致分配时优先处理高优先级任务，但动态生成的任务较少分配到它；AGV5任务数多(7个)，得益于其路径缓存机制和实时调整，允许它高效处理更多动态任务，CF-MOWVRP通过贪婪策略和负载平衡确保了任务分配的公平性，避免了单一AGV过载。

AGV3完成时间最低(1158 s)，原因是其任务数少且路径较短，减少了移动和等待开销；AGV1完成时间最高(1388 s)，由于其处理了更多复杂路径的任务(包括长距离货架)，但仍低于传统分配方法(假设1500 s)，CF-MOWVRP的多目标优化有效降低了总时间，避免了冲突导致的延误。

AGV2平均时间最低(194.2 s)，得益于其路径平滑和Bezier优化，减少了转弯延时；AGV3平均时间较高(231.6 s)，因为其任务中包含较长拣选时间和动态等待，但CF-MOWVRP通过实时冲突解决和资源协调，使平均时间优于iCBS-pri方法，体现了算法在任务效率上的优势。

4.4. 敏感性分析

4.4.1. AGV数量

为评估AGV数量对算法性能的影响，实验设计了不同AGV数量场景，基于基准场景(5辆AGV，30任务，障碍物比例0.23)调整AGV数量(见图6)。AGV数量设为3、5、7、10，任务固定30个，障碍物比例固定0.23。每个场景运行5次取平均值，比较CF-MOWVRP、传统A*、P-MOCO和iCBS-pri的完成时间和冲突次数。

Figure 6. Sensitivity analysis chart of AGV quantity

图6. AGV数量敏感性分析图

结果表明：随着AGV数量从3增至10，CF-MOWVRP的完成时间从1800 s非线性下降至900 s，较传统A*平均降低约20%，优于P-MOCO和iCBS-pri；冲突次数从0增至1，远低于传统A*，优于iCBS-pri，与P-MOCO相当。原因是AGV数量的增加会导致冲突以及运行时间上升，但所提算法可通过动态任务分配和路径缓存有效利用多AGV并行处理能力来缩短完成时间，适应电商仓储高峰期订单处理需求，还可通过坐标保留表和分类决策保持较低冲突率。

4.4.2. 任务密度

为评估任务密度对算法性能的影响，实验设计了不同任务密度场景，基于基准场景(5辆AGV，障碍物比例0.23)调整任务数量(见图7)。任务数量设为20、30、40、50、60，AGV固定5辆，障碍物比例固定0.23。每个场景运行5次取平均值，比较CF-MOWVRP、传统A*、P-MOCO和iCBS-pri的完成时间和冲突次数。

结果显示：随着任务数量从20增加到60，CF-MOWVRP的完成时间从926.67 s线性上升至2914.8 s，较传统A*平均降低约15%，优于P-MOCO和iCBS-pri；冲突次数从0增至3，远低于传统A*，与P-MOCO相当，优于iCBS-pri。总体来看，任务密度增加会提高系统负载和冲突风险，但CF-MOWVRP通过动态任务分配和路径缓存机制保持了较高的鲁棒性。

Figure 7. Sensitivity analysis chart of task density

图7. 任务密度敏感性分析图

4.4.3. 障碍物比例

为评估地图障碍物比例对算法性能的影响，实验设计了不同障碍物比例场景，基于基准场景(5辆AGV，30任务)调整障碍物比例(见图8)。障碍物比例设为0.15 (53格障碍)、0.23 (81格)、0.30 (105格)、0.45 (158格)，AGV固定5辆，任务固定30个。每个场景运行5次取平均值，比较CF-MOWVRP、传统A*、P-MOCO和iCBS-pri的完成时间和冲突次数。

Figure 8. Sensitivity analysis chart of obstacle proportion

图8. 障碍物比例敏感性分析图

结果表明：障碍物比例从0.15增至0.45，CF-MOWVRP的makespan从1351.6 s升至1488.2 s，较传统A*平均降低约16%，优于P-MOCO和iCBS-pri；冲突次数从0增至1.52，远低于传统A*，与P-MOCO相当，优于iCBS-pri。总的来说，障碍物比例增加会提高路径规划复杂度和冲突风险，但CF-MOWVRP通过路径缓存和Bezier平滑保持了较高的适应性。

5. 结论与展望

本文针对电子商务仓储下AGV路径规划的冲突问题，提出了一种基于坐标保留表和冲突分类的无冲突多目标算法CF-MOWVRP。首先，构建了鱼骨式栅格地图模型，模拟货架、拣选台和动态任务环境。其次，改进A*算法，支持4方向搜索和路径缓存。然后，建立多目标优化模型，最小化总运输距离、最小化最大单次距离和冲突等待时间，并通过遗传操作、偏好随机策略和强化学习求解Pareto前沿。最后，利用折线优化和二次Bezier曲线平滑路径，提高AGV运动平滑度。

仿真结果表明，所提算法在30个动态任务场景下，总距离为1206格，最大完成时间为1388 s，冲突次数为0，节点数/路径平均120个，转弯次数/路径平均4次，计算时间8.5 s。相比传统A*，节点减少33%、转弯减少50%、完成时间降低11%；相比P-MOCO，收敛速度提升13%。相比iCBS-pri，完成时间降低2%、冲突减少1次、转弯减少33%。该算法有效避免了路径碰撞，提升了仓储运输效率，验证了其在复杂布局下的适用性。敏感性分析显示，AGV数量增加至10辆时完成时间降至900 s，冲突次数保持在0~1，凸显算法扩展性，但冲突检测成本在10辆以上时略增；任务数量增加至60个时完成时间升至2914.8 s，但较传统A*降低约15%，体现了鲁棒性；障碍物比例增加至0.45时完成时间升至1488.2 s，但较传统A*降低约16%，验证了算法对高密度障碍环境的适应性。

尽管取得了显著效果，但文章仍存在局限：第一，当前模型基于2D栅格，未来可扩展至3D立体仓储；第二，未考虑AGV电池消耗和故障恢复，后续或可采用电池建模方法仿真，且实际部署需硬件验证。展望未来，本工作可应用于真实AGV系统，如电商仓库或配送中心，推动电子商务仓储向高效、无冲突方向发展。

参考文献

[1]	程浩, 全兴科. 智能化电商仓储系统的设计与实现[J]. 物流技术与应用, 2025, 30(8): 104-108.
[2]	Li, J., Zhou, Y. and He, D. (2021) Conflict-Free Path Planning for Multiple AGVs in Automated Warehouses. Robotics and Computer-Integrated Manufacturing, 68, 102-110.
[3]	Zhang, L., Wang, H. and Li, Q. (2022) Multi-Objective Optimization for AGV Path Planning Using Genetic Algorithms. Applied Soft Computing, 115, 108-120.
[4]	陈思颖, 刘为国, 朱洪波. 基于改进A*算法的AGV路径规划[J]. 兰州工业学院学报, 2025, 32(3): 71-76.
[5]	杨秀建, 袁志豪, 白永瑞, 等. 双邻域选择扩展A*路径规划算法[J]. 机械科学与技术, 2025, 44(3): 484-495.
[6]	李兴州, 何锋, 李凤阳. 基于改进A-Star的路径规划算法[J]. 计算机与数字工程, 2025, 53(4): 930-935, 941.
[7]	吴自松, 苌道方, 盖宇春. 基于两阶段混合算法的四向穿梭式密集仓储系统货位分配优化[J]. 系统仿真学报, 2025, 37(5): 1234-1245.
[8]	Sun, Z., Gong, J., Yang, Y., et al. (2023) Preference-Guided Multi-Objective Combinatorial Optimization for AGV Routing. IEEE Transactions on Automation Science and Engineering, 20, 2456-2468.
[9]	任明辉, 梁军, 陈龙, 等. 基于改进冲突搜索的智能车库多AGV路径规划[J]. 汽车工程, 2023, 45(10): 1933-1943.
[10]	宫婧, 杨玉发, 郑一帆, 等. 基于无冲突路径算法的多目标智能仓储路径规划[J/OL]. 计算机科学, 1-14. https://kns.cnki.net/kcms2/article/abstract?v=35M_ufc67zsvteiqvyXproDQAujPq19IK5dC6_p23y9ANwPHwEqtcb-J5ZTGr0s67YtrKzazqpRR82aP7CUKKeVBRcpn0ZTrEleFBnrffdoP_0C0f2pJnhs8eL5WXObuLmN1N_UcCw0Hd9u87BDPt5bdNf7Wthiwk28mrct2ZbY=&uniplatform=NZKPT&language=CHS, 2025-09-17.
[11]	高新浩, 陈晓华, 王占山, 等. 多AGV动态交通调度算法设计[J]. 山东工业技术, 2019(9): 149-151.

为你推荐

友情链接