1. 引言
目前移动机器人正因其良好的灵活性与机动性,以及具有重量轻、负载大、机构简单、驱动方便、能耗低等优点逐步于物流中心、无人工厂、智能制造产业得到广泛应用[1] [2]。
两轮移动机器人受非完整约束影响,控制器设计复杂。传统方法如PID、反演与滑模控制在处理约束、抗扰和实时优化方面均不及模型预测控制(MPC)。具体而言,PID依赖经验调参且无法显式处理约束[3];反演法缺乏预测能力,转弯时易因曲率突变发散[4];滑模控制存在显著抖振,自适应滑模虽可缓解却实时性差[5]-[7]。此外,传统方法常忽略执行器约束,易引发饱和或损坏[8] [9]。
MPC带来的迭代优化,可以很好地处理模型约束,动态系统等问题,有利于实现平滑运动;尤其因显式处理时域约束的能力而备受关注[10]。但其线性与非线性变体性能差异显著:线性MPC求解快速但对扰动敏感,弯道误差较大[11] [12];非线性MPC (NMPC)虽精度更高[13],但存在计算复杂、参数整定困难的问题[14] [15]。传统NMPC的控制参数固定,当路径曲率大或轨迹突变时,难以保证跟踪精度与控制输入平稳性[16] [17]。虽有研究基于车速[18]或模糊规则[19]调整单一参数,但MPC需多参数协同,而现有自适应方法多集中于权重优化[20]-[22],缺乏对时域与权重参数的综合调节。
针对移动机器人系统中的外界干扰问题,研究者发展了结合扰动估计的鲁棒MPC (RMPC)。郭洋[23]采用非线性扰动观测器(DOB)进行扰动补偿,但其对模型误差敏感;Tang等[24]将广义二型模糊逻辑与MPC结合,增强了不确定性适应能力,但计算复杂、实时性差。相比之下,扩张状态观测器(ESO)通过扩张状态统一估计总扰动,无需精确模型即可实现前馈补偿,结构简单且计算高效[25];理论分析表明其估计误差有界且可收敛,为鲁棒设计提供支撑[11]。
基于以上讨论,本文针对同时受输入约束的受未知干扰WMR跟踪问题,设计了一种基于扰动补偿的RANMPC算法以获得期望的闭环性能,本文的主要工作如下:
1) 针对传统MPC参数固定的问题,提出一种基于误差高阶动态(加速度/加加速度)的识别方法。通过构建三维异常状态机,实时感知突变并生成全局异常等级,进而自适应调整ANMPC参数,增强了控制器对扰动与工况变化的适应能力。
2) 针对补偿嵌入预测模型带来的相位滞后的问题,构建前馈–反馈复合控制律,将ANMPC的优化输出与ESO的扰动估计结合,共同作用于被控对象,实现精确的轨迹跟踪。
2. 运动学建模
本文选取的移动机器人为两轮差速驱动移动机器人,该机器人左右轮各有一个电机进行独立驱动,移动机器人前端有一个辅助轮,其作用主要为支撑与转向时保持平衡,即从动轮,移动机器人的简化模型如图1所示。
Figure 1. Simplified model of two wheeled mobile robot
图1. 两轮移动机器人简化模型
移动机器人的简化模型如图1所示,在该模型中,假设移动机器人的质心坐标位于驱动轮之间连接的中心处,即Oxy,移动机器人在参考坐标系Oxy下的位姿被描述为
,其中
为前进方向与x坐标轴之间的夹角,v和
代表移动机器人的角速度与线速度,为建立轮式移动机器人模型,假设在不考虑各种干扰的理想情况下,两轮移动机器人在运动过程中车轮与地面不存在或不予考虑相对滑动,车轮只作滚动运动,则有以下约束条件:
                                   (1)
将约束式(1)变形为矩阵形式,得:
                               (2)
选择一个满秩矩阵s(q)为
零空间的一组基,即:
                                       (3)
将式(3)代入到式(2)中,并化简所列出的方程,得到运动学模型为:
                                  (4)
3. 鲁棒自适应NMPC算法
为解决存在未知外部干扰以及固定参数NMPC控制器无法适应工况变化的问题,提出一种基于突变检测的鲁棒自适应NMPC在线滚动优化算法,提升系统的鲁棒性与跟踪精度,具体控制框图如图2所示。该算法的核心在于:基于标称运动学模型进行预测优化,同时利用ESO对集总扰动的实时观测值进行前馈补偿,并结合突变检测机制自适应调整优化问题的控制参数,构成一个强大的“前馈–反馈”复合控制架构,实现移动机器人在未知扰动下的高精度轨迹跟踪。
Figure 2. Robust adaptive NMPC control block diagram
图2. 鲁棒自适应NMPC控制框图
鲁棒自适应NMPC的在线滚动优化算法流程如下:首先获取系统当前状态与参考轨迹,同时ESO并行运行,实时估计集总扰动。随后,突变检测模块根据跟踪误差计算异常等级,动态调整优化问题中的控制参数,以适应系统实时状态。接着,算法构建并求解基于理想运动学模型的优化问题,其目标函数用于最小化状态跟踪误差与控制增量。求解后获得最优控制序列,将首项最优反馈控制量与ESO的前馈补偿量结合,形成复合控制指令,实现精准跟踪与主动抗扰。
3.1. 扩张状态观测器设计
本节重点介绍扩张状态观测器的设计,其目的为估计未知干扰以及系统状态的值。
定义扩张状态为
,
。理想运动学模型式(4)可重构为:
                                   (5)
假设1:未知扰动
与其时间导数
有界,即:
、
,其中
、
为一个正常数。
由于未知变量
的存在,扩张状态在式(5)定义的系统下是不可观测的。因此,本文采用ESO观测移动机器人位姿与未知扰动,令
、
则扩张系统的ESO观测器设计为:
                            (6)
式中
、
分别为
、
的估计值,
、
为扩张状态观测器的增益矩阵,其所有分量均严格大于零。
为非线性函数,具体形式为:
                           (7)
将式(7)代入式(6),可得观测系统误差动力学方程为:
                               (8)
3.2. 基于突变检测的自适应非线性模型预测控制器设计
3.2.1. 基于高阶微分特征的突变检测机制
该机制的核心思想为从系统状态误差的时间序列中提取高阶微分特征,通过同步监测横向、纵向和航向角误差,提取其加速度和加加速度特征——加速度反映“力”的突变,加加速度捕捉“力”的变化速率。该机制作为前馈环节,为后续自适应模型预测控制器提供先验信息。
(一) 构建滑动时序窗口
为了解决轨迹跟踪过程中可能存在的由时变扰动引发的轨迹畸变问题,如式(9)所示,提出了一种基于误差加速度与加加速度的实时突变检测方法,创建一个长度为4的窗口,连续储存移动机器人位置及航向误差的历史序列。
                            (9)
基于窗口数据,采用式(10)、(11)对每一个自由度(
)独立计算中心差分微分算子,分别提取加速度项ai与加加速度项ji。
                             (10)
                          (11)
式中
为采样时间,通过分析误差的高阶微分特征实现扰动超前检测,采用上述递推公式,可以实现每个控制周期来固定次数的算术操作,保障系统的实时性。
(二) 三维异常状态机
基于实时计算的高阶微分特征,设计一种三维异常状态机。当某个自由度的误差高阶动态超过其阈值时,系统会通过式(12)计算当前的异常等级,为参数自适应提供理论依据,降低因测量误差造成的误报风险。
                               (12)
式中,
为异常指标,表征系统受到外界干扰的程度,其计算公式如式(13)所示:
                          (13)
3.2.2. 基于状态机的NMPC控制参数调整
该机制的核心思想为从系统状态误差的时间序列中提取高阶微分特征,通过同步监测横向、纵向和航向角误差,提取其加速度和加加速度特征——加速度反映“力”的突变,加加速度捕捉“力”的变化
基于突变检测预警,驱动控制参数进行自适应调整。该机制的核心在于通过建立异常等级到控制参数的映射,实现控制器参数的实时优化。
控制器参数被视为关于异常等级
的函数,其自适应调整策略由下列映射关系定义:
(1) 预测时域的自适应调整:
预测时域Np随着异常等级的提升而动态缩,以应对模型不确定性等扰动,并保障实时性:
                             (14)
(2) 权重参数的自适应调整:
状态误差权重矩阵Q与终端惩罚矩阵P随异常等级增大而强化,以提升控制器抗干扰能力:
、
         (15)
当
时,终端惩罚矩阵P渐近恢复到一个预设的控制参数,其更新过程如式(16)所示:
                                (16)
式中,
为第k个采样周期的终端惩罚矩阵;
为恢复速率因子,用于控制恢复过程的平滑度和速度,避免参数跳变对系统造成的冲击,保障控制过程的平滑性。
(3) 控制增量约束的自适应控制:
输入约束需兼顾动力学耦合与计算效率。矩形约束无法处理速度耦合,椭圆约束因二阶锥规划求解而实时性差。本文采用菱形约束实现平衡,其1-范数可近似表征耦合且计算更高效。进一步地,通过将异常等级注入缩放矩阵(式(17)、(18)),构建了异常等级驱动的自适应菱形约束机制。
                                    (17)
                                    (18)
式中
、
分别为标称约束参数(对应执行器物理限幅),
为异常等级,
、
为敏感参数。自适应机制通过指数函数建立菱形约束与异常等级之间的联系:当
时,约束保持标称值;当
时,随着
的增长,约束边界动态紧缩,抑制轨迹发散风险。
3.2.3. 自主恢复机制(异常等级恢复机制)
本章设计的自适应NMPC控制策略包含异常等级恢复机制。恢复机制的目标为:当外部扰动减弱后,通过跟踪误差动态调节恢复速度:误差小则加速退出异常状态,误差大则保守操作以稳为主,确保系统在扰动减弱后平稳恢复。其计算公式如式(19)~式(22)所示:
1) 恢复因子的计算:
恢复因子rf如式(19)所示,根据当前跟踪误差
动态调整:
                                 (19)
式中跟踪误差
为当前的加权范数误差。
2) 恢复因子的计算:
                                   (20)
式中n为恢复计数器,上标(k)表示第k个控制周期。
3) 衰减步长计算(自适应调整)
衰减步长
如式(21)所示,根据当前误差动态计算:
                         (21)
4) 异常等级衰减
当满足恢复条件
时,触发如式(23)所示的恢复机制:
                           (22)
注1:系统的全局异常等级
为时间上的连续函数,其变化率受限,即满足:
                              (23)
式中,
为最大单步衰减步长。
证明:
由恢复机制可知,全局异常等级的更新仅通过衰减机制式(23)进行,由于衰减步长
和恢复因子
均为有界量。故异常等级
在任意相邻采样时间的变化量
满足:
,式中
。
3.3. 控制器优化问题的表述
在每一采样时刻k,控制器基于当前状态
,求解如式(24)所示的基于运动学理想模型式(2-1)的有限时域开环优化问题,以获得最优控制序列:
          (24)
式中:
为待优化的控制增量序列。
为预测状态与参考轨迹之间的误差。
、
分别为预测时域与控制时域。
、R、
为权重与终端惩罚矩阵,其参数值由异常等级
动态调节。
、
为由异常等级
动态调节的菱形约束参数。
求解上述优化问题后,得到的最优控制序列首项为
。结合ESO实时提供的扰动估计值,最终施加于被控对象的复合控制律如式(25)所示:
                            (25)
为清晰表述整个算法的在线滚动优化过程,现将算法的核心步骤总结如表1所示:
Table 1. Robust NMPC rolling optimization algorithm process
表1. 鲁棒NMPC滚动优化算法流程
 
  
    步骤  | 
    操作内容  | 
    备注  | 
  
  
    1  | 
    初始化 设置采样周期T,初始化控制参数。  | 
    离线执行。为算法运行提供初始参数配置  | 
  
  
    2  | 
    在线循环启动 在每个采样时刻,启动新一轮优化。  | 
    固定采样频率循环执行  | 
  
  
    3  | 
    状态获取与扰动估计 a) 获取系统当前状态。 b) 从ESO读取当前扰动估计值。  | 
    由上一采样时刻 状态计算所得  | 
  
  
    4  | 
    参数自适应调整 根据当前时刻跟踪误差计算异常等级,自适应调整参数  | 
    通过突变检测模块 实现参数自适应  | 
  
  
    5  | 
    求解优化问题 以当前状态为初始条件,通过求解问题1,得到最优控制序列。  | 
    优化问题通常转化为数值优化问题进行求解。只需执行序列中的第一个元素  | 
  
  
    6  | 
    计算并施加复合控制律 结合ESO提供的实时扰动估计值与标称ANMPC计算出的最优控制律。  | 
    前馈–反馈复合控制:ESO提供的估计扰动用于前馈补偿,是提升鲁棒性的关键。  | 
  
  
    7  | 
    滚动更新 等待下一个采样时刻  | 
    算法循环执行,实现基于最新信息的闭环反馈控制。  | 
  
 4. 系统理论特性
在本章中,我们将给出扩张状态观测器的稳定性证明、模型预测控制优化问题的递归可行性和闭环稳定性等主要理论性质,并给出保证模型预测控制优化问题递归可行的充分条件。
4.1. 扩张状态观测器稳定性证明
定理4.1:考虑假设1的扩张状态系统(26)与扩张状态观测器(27),当增益矩阵
、
满足条件:
时,观测误差
一致最终有界,且收敛半径为:
。
引理4.1:Young不等式:对于
,有
向量a、b满足:
。
证明:
构造李雅普诺夫函数为:
,对其求时间导数得:
                         (26)
代入观测系统误差方程得:
             (27)
根据假设1:
,由引理4.1:
                         (28)
将式(28)代入式(27),整理得:
                     (29)
式中
,并利用非线性函 nlf的Lipschitz性质(确保耦合项可被吸收),选择
、
满足
,则:
                                   (30)
且观测误差满足:
                                (31)
4.2 模型预测优化问题的递归可行性证明
定理4.2:对于存在外界扰动及输入约束的两轮移动机器人轨迹跟踪系统,采用基于异常等级的自适应非线性模型预测控制器时,若满足:
1) k时刻优化问题Pk存在可行解;
2) 异常等级
满足连续性条件
;
3) 终端控制器
满足菱形约束
;
则k+1时刻优化问题
必定存在可行解,且候选解满足k+1时刻所有约束条件,其中:
引理4.2a:(异常等级连续性条件)
,其连续性由注1保证:
引理4.2b:(约束参数Lipschitz连续)
引理4.2c:(终端控制器可行性) 对
,存在终端控制器
满足:
证明:
(1) 构造候选解:
取k时刻最优解的后
项,补终端控制项,即:
式中
为终端控制器增量满足(
)。
(2) 扰动补偿下状态误差的偏差分析:
实际闭环系统如式(32)所示受扰动影响:
                            (32)
式中
由定理4.1可知,ESO估计误差有界,即:
                                (33)
而由引理4.2a,异常等级变化不会造成控制参数的突变,因此,实际状态与理想预测状态的偏差为:
                             (34)
(3) 约束可行性验证:
状态约束:由引理4.2c因状态偏差有界,因此状态约束的可行性依赖于终端域的紧缩设计,由于终端域充分紧缩,终端状态
仍位于紧缩后的终端域
;
输入约束:候选解需满足动态调整后的菱形约束:
                          (35)
代入引理4.2b与引理4.2c得:
                     (36)
式中
为异常等级的连续利普希茨常数。
通过预设约束紧缩满足:
代入式(34),得:
                        (37)
当选取紧缩参数
满足
时式(3-10)成立。
4.3. 闭环稳定性证明
定理4.3:在采用基于扩张状态观测器(ESO)的扰动补偿控制律:
,其中、
为扩张状态观测器估计出的扰动值,及终端控制器
的条件下,若满足:
引理4.3a:扩张状态观测器满足定理4.1,即扰动估计误差有界
,式中
;
引理4.3b:终端约束矩阵P和终端控制器增益K满足矩阵不等式:
则控制系统满足:
1) 全局指数收敛性:位姿误差e指数收敛至有界闭球:
2) 扰动不破坏稳定性:ESO补偿作为前馈通道,不改变标称NMPC预测系统稳定性。
证明:
(1) 定义李雅普诺夫函数:
取标称NMPC的代价函数为李雅普诺夫函数,即:
(2) 证明
:
                  (38)
由引理4.3b,得:
                         (39)
将式(39)代入式(38),化简得:
                            (40)
由式(34)及引理4.3a得,实际状态与理想预测状态的偏差有界,因
连续,则实际代价函数满足:
                                (41)
综上所述,由式(40)驱动理想运动状态收敛至平衡点,而实际状态与理想预测状态的偏差有界,
迫使实际状态进入终端域
,终端域内由引理4.3b保证渐近稳定性。
5. 仿真与实验结果
为评估本文提出的RANMPC控制策略的性能,本章将进行两组仿真工况,分别为理想工况与扰动工况,其中理想工况主要跟踪两条参考轨迹,分别为复合轨迹与圆轨迹;扰动工况在复合轨迹的基础上依次加入了位置型扰动与速度型扰动。采用固定参数的非线性模型预测控制策略与本文提出的控制策略进行对比,如表2所示,非线性模型预测控制策略的控制参数与本文提出的自适应非线性模型预测控制策略中正常模式下的控制参数一致。
Table 2. Fixed parameter NMPC control parameters
表2. 固定参数NMPC控制参数
 
  
    参数  | 
    数值  | 
  
  
    预测时域
  | 
    25  | 
  
  
    控制时域
  | 
    3  | 
  
  
    控制周期T(s)  | 
    0.05  | 
  
  
    纵向加速度约束(m/s2)  | 
    −1~1  | 
  
  
    航向角加速度约束(m/s2)  | 
    −1.4~1.4  | 
  
  
    状态量权重矩阵Q  | 
    
  | 
  
  
    控制量权重矩阵R  | 
    
  | 
  
 5.1. 理想工况
5.1.1. 复合轨迹
为全面评估控制器在复合运动下的跟踪性能与鲁棒性,本文设计了一条如式(42)所示的复合轨迹。该轨迹能模拟移动机器人在实际应用中常见的直行、转弯等连续运动,其轨迹切换点可以检验控制器的动态响应与平滑过渡能力。
                               (42)
式中
分别表示参考位置的x坐标、y坐标和航向角。
分段轨迹数学模型如式(43)~(45)所示:
                            (43)
该阶段移动机器人保持恒定高度,沿x轴以1m/s的速度匀速运动。
                       (44)
该阶段移动机器人跟踪的轨迹为以(10,12)为圆心,10为半径的1/4圆弧曲线,式中
,航向角随角度变化,确保与轨迹切线方向一致。
                             (45)
该阶段移动机器人沿y以1 m/s的速度匀速运动,横向位置与航向角保持固定。
为验证所提ANMPC控制器的收敛性及动态性能,仿真实验设置了初始误差。图3、图4分别展示了两种初始误差工况下移动机器人的跟踪效果和跟踪误差。
a) 
               b) 
Figure 3. Comparison of complex trajectory tracking effects
图3. 复杂轨迹跟踪效果对比
(a) 
                           (b) 
Figure 4. Comparison of complex trajectory tracking errors
图4. 复杂轨迹跟踪误差对比
实验结果揭示了两种控制器截然不同的动态响应特性:
1) 自适应NMPC展现出主动、快速的调节能力:在初始横向误差1 m的极端工况下,通过参数调整机制,使误差在5 s内收敛至0.02 m以内,收敛速度较固定参数方案提速了39%,其X方向0.147 m超调与航向角26.6˚峰值是控制器为优先抑制横向失稳风险(当Y误差 > 0.5 m时)而主动付出的可控代价,确保了轨迹紧密贴合参考路径。
2) 固定参数NMPC表现为保守与迟缓:由于恒定增益与刚性约束,其在相同初始误差下调节时间达8.2 s,且因参数固定,在轨迹末端产生了0.28 m的累积误差,动态性能不足。
5.1.2. 圆轨迹
为量化控制器在稳态周期运动下的性能,本文采用标准圆形轨迹这一典型场景进行评估。验将参考轨迹的圆心设定于(10, 10),半径设置8 m,并为机器人施加1 m/s的恒定线速度指令。图5、图6分别展示了移动机器人在圆轨迹下的跟踪效果和跟踪误差对比。
Figure 5. Comparison of circular trajectory tracking effects
图5. 圆轨迹跟踪效果对比
Figure 6. Comparison of circular trajectory tracking errors
图6. 圆轨迹跟踪误差对比
基于圆轨迹跟踪实验数据,自适应NMPC较固定参数NMPC展现出了显著优势:横向控制精度全面提升,均方根误差降低10.96%,最大误差锐减57.67%,平均误差优化4.67%,弧线区域自适应NMPC更贴合参考轨迹,虽然x、
方向存在小幅波动,但自适应机制通过在线调整有效补偿了系统非线性,体现了更强的鲁棒性和控制稳定性。
在理想轨迹跟踪场景下,自适应NMPC展现出显著优势:复合机动轨迹中,面对初始Y方向1 m误差时,通过突变检测机制动态调整参数,5秒内收敛至0.03 m以内,较固定参数NMPC提速39%;虽允许X方向0.147 m瞬时超调作为稳定性代价,但全程无失稳现象;验证了其“感知–决策–执行”闭环的鲁棒性。
5.2. 扰动工况
5.2.1. 位置突变工况
为了进一步验证本文所提自适应NMPC控制器在应对突发外部干扰时的鲁棒性能与动态响应能力,我们在上述理想工况第一种参考轨迹跟踪实验的基础上,引入了如式(46)所述高斯扰动测试。用以模拟移动机器人可能面临的突发状况,如突如其来的侧向风力、路面不平造成的颠簸等。
                                (46)
式中
为扰动幅值,
控制扰动宽度。扰动后的横坐标x为:
。图7、图8分别展示了移动机器人面临位置扰动的情况下的跟踪效果和跟踪误差。
在位置突变扰动工况中,自适应NMPC展现出显著的鲁棒性优势。如图8所示,扰动时段(35~40 s)自适应方案(红色曲线)的Y方向误差峰值仅0.2376 m,而固定参数方案(绿色曲线)飙升至9.1546 m,轨迹完全失控。性能方面,位置突变扰动下X/Y方向RMSE分别降低51.3%和97.0%,虽然航向误差积分(IAE)因瞬时尖峰被放大,但通过后续控制快速收敛,自适应NMPC的扰动后恢复时间为5.5 s,确保全程平均航向偏差仅4.2˚。
Figure 7. Comparison of tracking effects under positional mutation
图7. 位置突变下跟踪效果对比
Figure 8. Comparison of tracking errors under positional mutation
图8. 位置突变下跟踪误差对比
5.2.2. 时变打滑干扰
为了进一步验证本文提出的自适应NMPC控制策略在应对瞬态、时变运动学扰动方面的能力,在轨迹突变的工况下,于4~8 s的时段内引入了一个如式(47)所示的模拟轮胎打滑扰动。该扰动模型通过函数
其值域设计在
的范围内,从而更真实地模拟了打滑扰动从轻微到剧烈的连续动态过程。图9、图10分别展示了移动机器人面临位置扰动和打滑干扰的情况下的跟踪效果和跟踪误差,图10展示了扰动期间实际扰动值与ESO估计的扰动误差示意图。
                               (47)
式中,K为打滑强度,
为与速度有关的函数。
Figure 9. Comparison of tracking effects under slip interference
图9. 打滑干扰下跟踪效果对比
Figure 10. Comparison of tracking errors under slip interference
图10. 打滑干扰下跟踪误差对比
由图9可以得出,即使10期间x方向的扰动达到了0.38 m/s的较大扰动值,但在本文提出的基于扩张状态观测器的扰动补偿机制下,如图所示的两种控制器都能较好的贴合参考轨迹,x方向误差均被成功抑制在0.15 m的范围内,且未出现发散或失稳现象。在此基础上,图10的放大图进一步揭示了两种控制器的性能差异。在扰动期间,自适应NMPC、的误差波动幅度和稳态误差均显著小于固定参数NMPC。
6. 结论
本文提出一种基于突变检测的鲁棒自适应NMPC策略,用于解决两轮移动机器人在非完整约束、未知干扰和执行器饱和下的轨迹跟踪问题。通过建立运动学模型,结合ESO进行扰动前馈补偿,并利用突变检测机制自适应调整控制参数,构建前馈–反馈复合控制律。仿真结果表明,该策略在初始大误差下收敛速度提升39%,在轨迹突变后5.5 s内恢复跟踪,且未出现失稳。未来将探索突变检测与强化学习的结合以增强扰动泛化检测能力,并引入预瞄算法提前感知曲率变化,进一步抑制惯性超调。