1. 引言
在线外卖服务的迅猛发展使其成为本地生活服务的核心,但高度依赖众包骑手的传统配送模式正面临严峻挑战:高峰时段运力紧张与城市交通拥堵导致效率瓶颈;人力成本刚性上涨推高运营成本;同时,平台在提升用户体验、控制成本与保障骑手福祉间难以权衡。无人机具备直线飞行、速度稳定、不受地面交通影响等优势,为突破上述困局提供了新的技术路径。然而,纯无人机配送模式本身受限于续航里程、有效载重、空域法规及恶劣天气适应性,难以独立承担复杂城市场景下的全部配送任务[1]。
因此,将无人机与骑手视为互补的异构资源进行协同调度,构建“人机协同”的混合弹性配送网络,成为更具现实可行性与商业潜力的前沿方向。在该模式下,无人机负责执行从集中配送站到区域中转点,或跨越复杂地形、交通拥堵区的干线快速运输任务;骑手则发挥其灵活机动、可完成“门到门”交付的优势,负责区域内的订单集散与末端柔性配送。二者的深度协作有望在系统层面实现“1 + 1 > 2”的协同效应,系统性达成降本、增效与体验提升的目标。然而,尽管已有研究在无人机路径规划和众包骑手调度方面取得了丰富成果,但现有工作多聚焦于“卡车–无人机”协同或纯人力网络优化,对“无人机–骑手”这一高度动态、随机且涉及多智能体(既有自主决策的人,也有受控的机器)协同的复杂场景关注不足。更重要的是,现有研究的优化目标往往单一(如最小化成本或时间),未能将电商平台在实际运营中必须综合权衡的效率、成本与用户体验三大核心维度纳入统一的决策框架。
基于此,本研究旨在填补这一研究空白,核心贡献在于:构建一个适用于外卖高动态场景的无人机-骑手协同配送多目标优化决策模型,创新性引入随机变量与鲁棒优化约束,量化骑手接单不确定性与交接环节时间波动,并设计高效的自适应求解算法。研究旨在精确量化回答以下关键问题:(1) 与纯骑手模式及简单协同规则相比,智能化的人机协同调度能在多大程度上同步提升配送效率、降低运营成本并改善用户体验?(2) 影响该协同模式经济效益的关键参数有哪些?其背后的管理启示是什么?本研究通过将用户体验量化并内生于优化模型,以及设计针对“人机协同”特性的高效元启发式算法,不仅为平台探索下一代即时物流解决方案提供了创新的理论框架与决策工具,也为其投资可行性分析与精细化运营策略制定提供了直接的数据支持[2]。
2. 文献综述
2.1. 无人机在物流配送中的应用与优化
无人机在物流领域的应用研究已从概念验证走向模型优化。早期奠基性工作如Murray与Chu提出的“带无人机的旅行商问题”(FSTSP),旨在优化无人机与一辆卡车协同的最小化服务完成时间。后续研究拓展至多无人机协同、考虑能耗约束与禁飞区的路径规划等更复杂场景。这些研究普遍揭示了无人机在拓展服务范围、规避地面交通瓶颈方面的显著潜力。然而,现有模型大多基于静态、确定性的环境假设,且协同对象多为路线固定或可控的车辆(如卡车),这与外卖场景中订单动态随机到达、配送节点(骑手)位置实时变化且行为具有一定自主性的复杂特性存在本质差异,限制了其直接应用[3]。
2.2. 众包骑手配送的动态调度与行为研究
众包配送的核心挑战在于应对订单需求与骑手供给的双重不确定性。学术界常将之建模为动态车辆路径问题(Dynamic Vehicle Routing Problem, DVRP),并采用随机规划、在线算法或强化学习等方法,以期在订单到达时实时做出最优或近似最优的指派与路径决策。近期研究趋势开始重视“人”的因素,将骑手视为受收入预期、个人偏好和疲劳度影响的自主决策者,研究如何通过定价、订单推送策略等激励手段来引导骑手行为,以优化系统整体绩效。这部分研究深刻揭示了众包物流系统的复杂性与人性维度,但尚未与自动化配送资源(如无人机)的调度问题进行有效融合与协同考量[4]。
2.3. 异构车队协同调度与多目标优化研究
在协同调度方面,“卡车–无人机”协同模型已从单卡车单无人机扩展到多车多机的异构车队场景,研究重点包括绿色路径优化、成本最小化等。少数前沿研究开始探索“骑手–无人机”协同,该模式在降低配送成本方面是有潜力的[5]。在方法论上,多目标优化算法(如基于帕累托前沿的进化算法、加权求和法)在解决物流调度中的冲突目标(如成本与时间)方面已有广泛应用[6]。然而,纵观现有协同配送研究,仍存在明显不足:首先,优化目标多集中于运营成本或时间效率等单一方面,未能将“用户体验”这一影响平台长期竞争力的关键因素作为核心决策变量进行量化建模与优化[7]。其次,对于效率、成本、体验这三个存在内在权衡关系的目标,缺乏将其纳入统一框架进行系统分析与管理的成熟研究范式[8]。
2.4. 研究评述与本文定位
综上所述,现有研究在场景适配性、模型综合性与目标全面性上均存在亟待填补的缺口。具体表现为:无人机配送研究(如专注于城市路径优化的研究[9])与众包骑手调度研究相对割裂;协同调度模型对高动态、多智能体环境的刻画不足;且普遍缺乏对“效率–成本–体验”三重目标冲突与权衡的系统性分析。因此,本文的研究定位是:面向外卖平台的现实需求,构建一个整合动态订单流、随机骑手接单行为、人机交接时间波动与无人机物理约束的“人机协同”配送调度模型;创新性地将非线性用户体验函数作为关键组成部分嵌入多目标优化框架;旨在通过提出的改进自适应大邻域搜索算法,为平台实现综合绩效最优的协同调度提供系统性的解决方案,从而填补现有研究的上述空白[10]。
3. 方法
3.1. 问题描述与模型构建
考虑一个外卖平台在典型城区网格内的一个运营时段。订单动态、随机地产生于散布的餐厅,并需配送至消费者地址。平台管理着一个由众包骑手车队与无人机机队组成的混合配送系统。骑手在城市路网上移动,可携带多个订单,并直接完成“到店取餐–送货上门”的全流程。无人机从分布式部署的驿站起飞与降落,沿直线空域飞行,速度恒定且不受路况影响,但其单次飞行的续航里程与载重能力(通常为单件)有严格限制。无人机无法直接入户,通常将订单投送至居民区附近的智能交付柜或指定安全降落点。平台中央调度系统需要在每个决策时刻,根据实时状态(订单池、骑手位置、无人机电量)解决以下核心决策问题:1) 订单分配:新到订单应分配给骑手直接配送,还是由无人机接力配送?2) 路径与调度:如何为每位骑手规划取送件路径?如何为每架无人机规划从驿站起飞、访问多个交付点并返回的飞行航线?3) 资源协同:如何安排无人机与骑手在交付点的时空交接,以实现无缝接力?决策的总体目标并非单一指标最优,而是寻求系统总运营成本、整体配送效率与聚合用户体验三者之间的最佳平衡[11]。
众包场景下存在两类核心随机性:
1. 骑手接单不确定性:平台向骑手指派订单后,骑手可能因订单价值、配送距离、自身疲劳度等因素拒绝接单,设骑手k接受订单i的概率为
(基于历史接单数据统计得出,取值范围[0, 1]),拒绝概率为
;
2. 人机交接时间波动:无人机与骑手在交付点的交接过程(如骑手等待无人机降落、无人机等待骑手取件)存在时间不确定性,设理论交接时间为
,实际交接时间为
,其中
为随机波动量,服从均值为0、方差为
的正态分布(
),
基于历史交接数据校准。
为精准刻画上述问题,本文构建一个含随机变量与鲁棒约束的混合整数规划模型。其核心创新在于目标函数综合了货币化成本与非货币化的体验损失,约束条件引入随机性参数以提升模型现实适配性:
式中符号说明:
:系统总加权损失。
:支付给骑手的总佣金成本,与完成订单数成正比。
:无人机运营总成本,与飞行距离成正比。
:订单二次指派的备份成本,当骑手拒绝接单时,平台需重新指派其他骑手或无人机,产生额外调度成本(如加急佣金、无人机二次起飞成本),
,其中
为订单i的二次指派单位成本,R为骑手集合。
:所有订单的集合。
:订单i的实际送达时间。
:订单i的承诺送达时间(基于历史数据与距离估算)。
:订单i的体验敏感度权重,可关联订单价值或用户级别。
:骑手k接受订单i的概率(随机变量)。
:人机交接时间波动量(随机变量)。
:平台可调节的战略权重系数,分别反映其对成本控制与用户体验维护的相对重视程度。
目标函数阐释:第一部分
直接衡量运营经济性新增
项以量化骑手接单不确定性带来的额外成本;第二部分
量化用户体验损失其中
已考虑交接时间波动的影响。采用延误时间的二次函数形式,旨在刻画用户体验随延误时间非线性加速恶化的现实特征(例如,延误5分钟用户可能勉强接受,延误15分钟则可能导致强烈不满甚至投诉)。权重
允许系统对高价值或高敏感度订单给予优先保障。
模型约束条件主要包括:
1. 订单覆盖约束:每个订单必须被且仅被一种配送资源服务一次。
2. 骑手流平衡与容量约束:确保每位骑手的路径是连续可行的,且载货量不超过其保温箱容量。
3. 无人机航程与载重约束:每架无人机的飞行总距离不得超过电池续航上限,且通常每次只能携带一个订单。
4. 时间窗与顺序约束:严格定义取餐、飞行/行驶、送达等动作的时间逻辑关系。
5. 协同衔接鲁棒约束:若采用无人机投递至交付点、再由骑手取件转送的模式,考虑交接时间波动,约束骑手到达交付点的时间
与无人机送达时间
满足:
,其中
为鲁棒性系数(平台可根据服务要求调整,如
表示覆盖95%以上的交接时间波动场景),确保在随机波动下仍能实现有效衔接。
6. 骑手接单鲁棒约束:为降低骑手拒单导致的订单延误风险,对每个订单i的初始指派骑手k,需满足
(
为平台设定的最低可接受接单概率阈值,如0.7);若无骑手满足该条件,则直接将订单分配给无人机配送,避免因多次拒单导致的严重延误。
该模型通过引入用户体验的量化损失函数、随机性成本项与鲁棒约束,将多目标决策与现实随机性纳入统一框架,使平台能够根据商业策略灵活调整优化方向与鲁棒性水平,提升模型在实际运营中的适用性。
3.2. 算法设计
所构建的模型是一个大规模、动态的NP-hard问题。为满足实时调度需求,本文设计了一个“在线即时响应”与“离线周期优化”相结合的混合框架。系统将时间轴划分为连续的短周期(如5分钟)。在每个周期内:
在线模块:负责处理周期内新到达的、对时效要求极高的“紧急订单”。它采用一组轻量级贪婪规则(如“最近空闲骑手优先”、“成本最小插入优先”)进行毫秒级决策,确保系统响应敏捷性。
离线模块:在该周期结束时启动,对当前所有已承诺但未完成的订单以及在线模块新接收的订单进行整合,调用后台强大的改进自适应大邻域搜索(ALNS)算法进行全局重新规划与优化,输出下一个周期的优化配送计划[12]。
自适应大邻域搜索算法因其在解决复杂路径问题上的强大性能而被选为离线优化的核心。尽管已有研究尝试应用如改进野狗优化算法等其他元启发式算法求解协同配送问题[13],本文针对“人机协同”场景动态、异构的资源特性,结合新增的随机性约束,设计了专用的破坏与修复算子以更好地进行全局搜索:
破坏算子:包括通用算子(随机移除、最差代价移除)及针对协同场景的协同关联移除(打破可能次优的无人机–骑手接力组合)和无人机航线清空移除(为重构航线提供空间)。
修复算子:包括通用算子(贪婪插入、Regret-k插入)及核心创新算子模式切换插入,该算子在修复订单时,会动态评估并选择“骑手直送”与“无人机接力”两种模式中更优的方案。
算法采用模拟退火准则接受新解,并根据算子历史表现自适应调整选择概率,以平衡搜索的广度与深度[14]。
4. 结果
4.1. 实验设计
实验基于一个模拟的5 km × 5 km正方形城区场景。利用仿真器生成了符合实际外卖订单时间分布(午晚双高峰)的6小时动态订单流,共计1200单。骑手平均地面速度为15 km/h,佣金为7元/单;无人机巡航速度为40 km/h,单位飞行成本为0.3元/km,最大航程10 km。目标函数权重设定为
,
通过归一化处理使得成本与体验损失量级相当。
实验参数设定(针对随机性约束):
骑手接单概率
:基于某外卖平台历史数据统计,设定骑手接单概率服从Beta分布Beta (
,
),取值范围[0.3, 0.98],平均接单概率0.71;最低可接受接单概率阈值
。
人机交接时间波动:理论交接时间
分钟,波动量
,其中
分钟;鲁棒性系数
。
订单二次指派单位成本
元/单(含加急佣金补贴、调度系统额外算力成本等)。
对比基准设定为:
PR (纯骑手模式):所有订单仅由80名骑手配送。
SCR (静态协同规则模式):简单规则协同,例如,直线距离 > 2 km且终点靠近交付点的订单固定派给无人机,考虑交接时间波动。
HMO (人机协同优化模式):本文提出的含随机变量与鲁棒约束的模型与算法。
PD (纯无人机理想模式):假设无人机可入户且无限制,作为理论性能上限参考。
4.2. 核心绩效对比
表1展示了四种模式在关键绩效指标上的对比结果。HMO模式在综合绩效上表现最佳:总成本最低(含备份成本),较PR模式下降12.9%;平均配送时间显著缩短(受交接波动影响但仍优于PR和SCR);订单准时率(定义为实际送达时间不晚于承诺时间10分钟)达到94.7%,接近PD模式的理论上限。值得注意的是,PR模式因骑手拒单导致的二次指派,额外产生了约480元的备份成本,且多次指派导致部分订单延误,准时率低于HMO模式;SCR模式虽优于PR,但其未充分考虑接单概率与交接波动的协同优化,优化潜力未被充分挖掘,凸显了智能动态调度与随机性约束结合的必要性。PD模式的高成本则验证了其在实际运营中的经济不可行性。
Table 1. Performance comparison of different delivery modes
表1. 不同配送模式综合绩效对比
绩效指标(Performance Indicator) |
纯骑手模式(PR) |
静态协同规则(SCR) |
人机协同优化(HMO) |
纯无人机模式(PD) |
总成本(元) (Total Cost, CNY) |
8400 |
7950 |
7320 |
9200 |
平均配送时长(分钟)
(Average Delivery Time, min) |
38.5 |
34.2 |
31.8 |
28.1 |
订单准时率(%)
(On-time Delivery Rate, %) |
89.1 |
91.5 |
94.7 |
96.5 |
注:订单准时率 = (准时送达订单数/总订单数) × 100%。(Note: On-time delivery rate = (Number of on-time orders/Total orders) × 100%).
4.3. 敏感性分析
为探究关键参数的影响,我们进行了深入的敏感性分析。
无人机单位成本的影响:分析表明,存在一个关键成本阈值(约0.35元/公里)。当无人机单位运营成本低于此阈值时,HMO模式相比PR模式具有显著且稳定的成本优势;高于此阈值后,优势迅速衰减。
订单密度与区域特征的影响:实验模拟了商业区(高订单密度)、混合区、居民区(低密度但末端通达性差)三种场景。HMO模式在高订单密度的商业区对提升系统吞吐量和降低平均时长效果最显著;在末端配送难的居民区,其对保障长尾订单准时率、降低特殊区域配送成本的价值更为突出。
敏感性分析(针对随机性参数):
骑手接单概率的影响:当平均接单概率从0.6提升至0.8时,HMO模式的备份成本从350元降至120元,平均配送时长缩短1.2分钟,准时率提升2.1%;反之,当平均接单概率降至0.5时,备份成本增至580元,准时率下降3.4%,但仍优于PR模式(准时率下降5.7%),说明模型对接单概率波动具有一定的鲁棒性。
交接时间波动的影响:当波动方差
从0.25增至1 (
从0.5增至1)时,HMO模式的平均配送时长延长1.8分钟,准时率下降1.7%,而SCR模式的准时率下降3.2%,表明HMO的鲁棒约束能有效缓冲波动影响[15]。
算法性能分析:为验证算法有效性,我们选取一个包含100订单的静态快照问题,将ALNS算法的求解结果与商用求解器Gurobi在2小时限制内求得的最优解进行对比。ALNS在平均180秒内获得了与最优解差距在2.1%以内的高质量解,且通过鲁棒性校验的可行解比例达到92%,证明了其在求解精度、计算效率与鲁棒性上的良好平衡,能够满足实际运营的调度频率要求。
5. 讨论
本研究通过建模与仿真,验证了考虑骑手接单不确定性与交接时间波动的无人机–骑手协同配送在效率、成本与用户体验三个维度上的综合优化潜力。与现有研究相比,本研究的核心贡献在于建立了一个将用户体验内生化、将现实随机性量化为约束条件的多目标决策框架,并提供了实现该框架的高效算法。研究结果具有明确的管理启示:(1) 投资决策精细化:在部署无人机系统前,需建立详细的财务模型,重点关注单位运营成本能否突破经济性阈值(~0.35元/公里);同时,需评估目标区域骑手接单概率水平(如低于0.6则需配套骑手激励策略),降低随机性带来的额外成本。初期应聚焦于“高潜力区域”(如核心商圈、偏远住宅区)进行试点,快速验证模式并优化投资策略[16]。(2) 调度系统智能化:必须超越简单的规则引擎,建设具备多目标动态优化与鲁棒性保障能力的智能调度系统。该系统应能内嵌用户体验考量与随机性约束,实时处理复杂的“人机协同”路径规划问题,动态调整订单指派策略以应对骑手拒单与交接波动。(3) 运营流程协同化:“人机协同”意味着运营流程的重塑。平台需同步规划无人机驿站网络与末端交付点基础设施,优化交接流程以降低时间波动(如设置专用交接通道、实时同步双方位置信息);同时,可通过骑手激励机制(如提高高优先级订单佣金)提升目标订单的接单概率,减少二次指派成本[17]。
6. 结论
本研究针对即时配送“最后一公里”的痛点,结合众包物流的现实随机性,系统地探讨了无人机–骑手协同配送模式的优化问题。主要结论为:智能化的 “人机协同”优化调度(含随机变量与鲁棒约束)能实现降本、增效、提质的三重目标;提出的多目标优化模型通过量化骑手接单不确定性与交接时间波动,提升了理论模型与实际运营的适配性,为平台量化权衡不同战略目标提供了可行工具;该模式的效益发挥依赖于无人机成本、订单密度、骑手接单概率等关键条件,需进行精细化运营。
本研究仍存在一定局限。未来工作可朝以下方向拓展:1) 引入博弈论模型,更真实地刻画骑手的自主决策行为(如接单概率与订单佣金的动态博弈);2) 融合实时交通与天气大数据,构建数字孪生系统以提升调度前瞻性与鲁棒性;3) 从社会可持续性视角,评估该模式对减少碳排放与城市拥堵的潜在价值;4) 考虑更多随机性因素(如无人机故障、突发交通管制),进一步提升模型的全面性[18]。