1. 引言
随着环保法规的日益严格及国家出台对新能源汽车的利好政策,汽车行业对四轮独立驱动电动车辆的需求在持续增长。四轮独立驱动电动车的动力系统布局主要可以分为集中式和分布式两类[1]。传统的集中式驱动通常由单台电机控制整个车辆的运动;而分布式驱动结构往往是通过轮毂电机驱动,将电机集成于轮毂内部,直接驱动车轮。这种设计能够实现对每个车轮扭矩的独立控制,能够显著提高系统的响应精度与响应速度[2]。然而,轮毂电机的引入大大增加了车辆的簧下质量。这不仅会导致车辆在不平整的路面行驶时产生颠簸,影响乘坐舒适性,还可能会降低轮胎的附着性能,从而降低车辆的操控稳定性[3]。然而,由于分布式驱动轮毂电机电动车具有四轮转矩独立可控这一特性,可以通过对轮毂电机的输出扭矩进行合理控制,产生附加横摆力矩以实现对车辆的稳定性控制。因此,开发高效的横摆稳定性控制策略是当前的研究热点。
目前,直接横摆力矩控制(Direct Yaw Moment Control, DYC)是分布式驱动电动汽车主动稳定性控制的主流方法[4]。通常采用分层控制的架构:上层控制器通过跟踪车辆期望的运动状态参数,计算出合适的附加横摆力矩与驱动力矩;下层控制器负责基于上层得到的力矩,从各种约束中计算出各轮毂电机最佳的输出转矩。
在控制算法方面,分布式驱动电动汽车稳定性控制的算法有很多,且各有优劣。包括比例积分微分(Proportional Integral Derivative, PID)控制[5] [6]、线性二次型调节器(Linear Quadratic Regulator, LQR) [7] [8]、模糊控制[9] [10]、滑模控制(Sliding Mode Control, SMC) [11] [12]及模型预测控制(Model Predictive Control, MPC) [13]。然而,上述方法各具局限性:PID控制器参数简单但鲁棒性较弱,难以适应复杂的工况;滑模控制鲁棒性强但是存在“抖振”现象且模型复杂;模糊控制不需要精确的控制对象模型,但其建立依赖经验,缺乏系统性的设计方法;MPC控制器善于处理多变量问题,但其在模型精度不足时预测偏差较大且计算负荷高。相比之下,LQR控制凭借其鲁棒性强[14]、稳态误差小及易于工程实现等优势,更契合分布式驱动电动车的稳定性控制需求。因此,本文选用LQR算法来设计直接横摆力矩控制的分层策略。
尽管LQR在车辆控制领域应用广泛,但其性能高度依赖于权重矩阵(Q和R)的选取,而这一过程往往依赖经验。为解决这一问题,Ahmed等人采用了改进灰狼优化算法对LQR的加权矩阵进行计算,基于原始的灰狼优化器构建了基于维度学习的狩猎策略(Dimension Learning-Based Hunting, DLH),增强了算法的探索和利用能力[15];Zhao等提出了一种基于混合粒子群–遗传算法的LQR控制器,显著降低了外部干扰,保证了系统性能[16];Chacko等人提出了一种利用牛顿–拉普森法确定性方法寻找LQR控制器加权矩阵的方法,这种方法允许设计者根据需求自由选择时域参数,表现出良好的稳定性[17];Wang等人采用试错迭代方法来选择LQR控制器的Q和R矩阵取值,但目前还未在直升机模型外的控制模型上进行验证[18];Mohammadi等人提出了一种PID控制器和LQR控制器的结合的控制方案。采用模糊逻辑开关在两个控制器之间切换执行,控制器能够精确地维持系统的稳定性[19];苗凯等人提出一种逻辑优化算法对LQR-PID控制器参数进行确定[20]。
尽管上述研究对LQR参数优化进行了探索,但在PSO算法易达到局部最优和收敛效率低的问题上并未得到改善。因此,本文提出一种粒子群(Particle Swarm Optimization, PSO)与模拟退火算法(Simulated Annealing, SA)的融合改进的混合算法。该算法基于热力学自适应惯性权重,建立PSO惯性权重w与SA系统温度T的物理映射关系,而非单纯随时间线性递减,同时动态更新个体和群体学习因子;将SA的概率接受准则引入PSO的位置更新逻辑;根据种群状态控制SA算法的随机扰动程度。提升了LQR控制器参数整定的全局寻优能力与鲁棒性,同时极大提升了算法跳出局部最优的能力。
2. 车辆模型
本文的研究对象为4 × 4分布式轮毂电机驱动车辆,车辆模型的主要参数如表1所示:
Table 1. Main parameters of vehicle model
表1. 车辆模型主要参数
参数 |
符号 |
数值 |
整车质量 |
m |
1412 |
质心到前轴长度 |
a |
1.015 |
质心到后轴长度 |
b |
1.895 |
前/后轮总侧偏刚度 |
,
|
−86,418 |
绕Z轴的转动惯量 |
|
1536.7 |
2.1. 车辆二自由度模型
在车辆的动力学研究中,车辆的侧向速度、纵向速度、横摆角速度这三个状态量往往直接影响着车辆的动力学特性。前两者相互耦合,共同决定着车辆的质心侧偏角。当质心侧偏角过大,车辆通过转角控制对车辆状态的修正能力将大大下降,严重影响着行车安全;横摆角速度则反映了车辆过弯时的偏差程度和转向特性。车辆的二自由度模型能有效表征上述变量间的动态关联,适用于转向特性分析与控制策略设计。车辆的二自由度模型如图1所示。
车辆的二自由度模型可以通过以下状态方程来描述:
(1)
其中,
(2)
(3)
Figure 1. Vehicle 2DOF model
图1. 车辆二自由度模型
直接横摆力矩控制通过控制四轮转矩差为车辆提供额外横摆力矩
来调整车辆转向时的状态参数,使车辆趋于稳定状态。对车辆施加直接横摆力控制后的状态描述如下:
(4)
式中,
,
是车辆的质心侧偏角;
是车辆的横摆角速度;
是车辆纵向速度,
为车辆质量;
和
分别为质心到前、后轴的距离;
、
分别是前、后轮侧偏刚度;
为车辆绕Z轴的转动惯量。
通过式(4)减去式(1),可得:
(5)
上式描述了车辆的附加横摆力矩与状态误差之间的动力学关系。这为使用LQR方法来解算车辆的附加横摆力矩提供了模型依据[21]。
2.2. 状态参考值计算
通过二自由度线性模型可以计算分布式驱动电动车在稳态下的横摆角速度和质心侧偏角,稳态下状态量
、
、
均为0,代入式(1)可得:
(6)
(7)
其中,
,为稳定性因数,表征车辆的转向特性。同时需要满足车辆质心处的加速度要低于路面附着极限:
(8)
式中,
、
、
分别为纵向、侧向加速度和路面峰值附着系数,
为重力加速度。相比纵向速度,侧向速度很小可以忽略,因此可得横摆角速度约束:
(9)
其中,
为安全系数,一般取0.9。质心侧偏角是车辆侧滑程度的直接度量,为了减少侧滑和失控的风险,此处将质心侧偏角的期望值设为零,因此质心侧偏角和横摆角速度的参考值可由式(10)来描述。
(10)
3. 直接横摆力矩控制器设计
分层控制是提升车辆横摆稳定性最有效的策略之一,其核心在于将复杂的控制系统分解为多个层级,从而同步优化计算效率、系统鲁棒性与环境适应性。直接横摆力矩的分层控制框架如图2所示,本章主要对纵向速度控制器、上层力矩决策控制器进行设计。
Figure 2. Layered control system framework
图2. 分层控制架构图
3.1. 纵向速度控制器设计
纵向速度控制器的目标是通过当前车速跟踪期望的纵向速度,从而决策出所需的总纵向驱动力。纵向速度控制器由PID控制器实现,如方程(11)所示。通过计算车辆实际速度
与期望速度
的差值来决策总驱动力
。
(11)
式中
、
、
分别是PID控制器的比例系数、积分系数和微分系数。
3.2. 上层控制器
3.2.1. LQR控制器设计
分布式驱动电动车的横摆稳定性控制系统采用分层控制架构,其中上层控制器负责生成维持车辆稳定行驶所需的额外附加横摆力矩。线性二次调节器(LQR)作为一种经典的最优控制器,具有响应迅速、控制精度高的特点,能在较大动态范围内实现准确的调节。
因此,本研究选取表征车辆横摆稳定性的关键状态量质心侧偏角
与横摆角速度
作为被控变量,基于LQR理论设计附加横摆力矩反馈控制器。该控制器以横摆角速度与质心侧偏角的实际值与参考值之间的偏差作为状态误差e,通过实时反馈补偿,使车辆实际状态向理想参考状态收敛,从而计算出适用于当前工况的直接横摆力矩控制量。
(12)
依据公式(5)得到了质心侧偏角和横摆角速度与参考值之间的误差状态方程,可以建立如(13)式的代价函数:
(13)
(14)
Q是状态误差的加权矩阵,是一个半正定实对称矩阵,表示对控制目标的重视程度;R是控制量的权重矩阵,是一个正定实对称矩阵;q1以及q2分别是侧偏角和角速度的实际值和参考值的误差权重系数;r是对附加横摆力矩的权重系数。
LQR的理论证明,最优控制律是状态反馈形式:
(15)
这里,状态
。对于连续时间的系统:
(16)
其中,P是代数Riccati方程(ARE)的解:
(17)
最终得到控制律为:
(18)
LQR算法的理论推导与控制律指出:控制器的最终性能依赖于权重矩阵Q和R的取值。然而,目前尚无通用的解析公式能直接计算出这两个参数的最优解,使用者必须根据具体的控制任务和优化指标进行设计。简而言之,鉴于不同工况对系统性能的侧重各不相同,如何针对特定应用场景制定科学的参数整定策略,成为了LQR工程实现中的关键难题。
3.2.2. 基于SA-PSO优化的LQR控制器
SA-PSO算法是模拟退火算法(Simulated Annealing, SA)与粒子群优化算法(Particle Swarm Optimization, PSO)的深度融合。粒子群算法是一种基于群体协作的随机搜索算法,通过模拟鸟群的捕食行为,利用个体经验和群体信息的交互引导粒子快速向最优解逼近,具有收敛速度快的优势;模拟退火算法源于固体退火的热力学原理,通过引入随机扰动和Metropolis接受准则,允许算法在搜索过程中以一定概率接受劣解,从而具备极强的跳出局部最优的能力。
本文提出的SA-PSO算法并非二者的简单叠加,而是整合了SA的热力学机制与PSO的进化策略:将SA的温度参数引入PSO的惯性权重调节中,利用种群多样性动态触发SA的随机扰动,并利用Metropolis准则对PSO的位置更新进行二次筛选。通过深度耦合,该算法有效克服了传统PSO易早熟收敛和SA搜索效率低的缺陷,实现了全局寻优与局部探索的动态平衡。
算法首先在LQR控制器的参数空间内随机生成初始粒子群,并初始化其位置与速度。同时,初始化模拟退火系统的关键参数,包括初始温度
、终止温度
以及冷却速率
。每个粒子每次所在一个位置,就代表了一组Q和R的参数值,而评价这组参数的指标,通过建立适应度函数F来反映。适应度函数基于质心侧偏角和横摆角速度的积分时间乘以绝对误差(ITAE)来设计:
(19)
式中,t表示运行时间。粒子根据下列公式更新自己的速度和位置:
(20)
式中,
、
、
分别是个体学习因子、种群学习因子和惯性权重。
和
代表第i个粒子在第k次迭代的速度和位置,
代表个体最优解,
是当前的全局最优解。
和
是随机函数,其值随机于[0, 1]内选取。
针对粒子群算法容易出现的局部最优的情况,有部分研究提出了线性递减惯性权重的方法[22],如公式(21)所示:
(21)
式中,
和
代表初始权重和迭代终止时的权重。由公式可知,权重
会随着迭代次数的增加,沿着一条笔直的斜线匀速下降,属于一种开环控制,完全不关心当前的搜索状态,只与迭代次数有关。尽管这种传统的线性递减策略能够实现从全局探索到局部开发的转换,但其线性的下降速率无法适应LQR参数优化这种复杂的非凸问题。
因此,本文对提出了一种联合退火算法的基于热力学的惯性权重更新策略。惯性权重的更新公式如下所示:
(22)
式中,
和
同样代表初始权重和迭代终止时的权重,分别取值为0.9和0.4。
随迭代次数按冷却系数
衰减:
(23)
在优化初期,
较高,使得权重
较大,粒子可以保持高动能执行全局搜索;随着迭代次数上升,温度降低,粒子动能减小,锁定最优解。这种非线性关系可以在探索和利用之间提供不同的权衡曲线。
同时,为了更好处理PSO算法易陷入局部最优的困境,将模拟退火算法的概率接受准则(Metropolis)引入PSO位置更新:
设第i个粒子在t时刻由PSO迭代公式得出的新位置为
,原位置为
,定义适应度差
计算公式为:
(24)
则第t + 1代粒子实际位置
的更新概率为:
(25)
由上式可知,当适应度差
时,即粒子新位置所得ITAE指标优于旧位置时,该粒子一定会更新到更优解的位置上,算法表现为贪婪搜索;当适应度差
时,意味粒子在新位置上得到的ITAE不如原位置的,此时,粒子依照上式概率进行运动,表现为在原位置保持,或接受这次更差的移动。即当粒子找到较差解时,算法也有概率接受该次粒子移动。
最后,引入了种群多样性指标
作为反馈信号:
利用粒子群在解空间分布的离散程度来表征种群多样性。定义第t代种群的空间多样性为
,N为粒子群的种群规模,代表每次迭代中并行搜索的个体数量;D为待优化的参数的维度(本文中D = 3,分别对应LQR控制器的权重系数
、
、R),第j维参数的搜索边界为
。
的计算表达为:
(26)
其中,
是第t次迭代中所有粒子在第j维上的位置标准差:
(27)
基于多样性
,定义执行SA随机扰动的概率阈值
:
(28)
此处设置
;
;
。当结果为
时判定粒子状态为早熟收敛情况;结果是
则被判定为正常收敛。这两个概率值决定了每个粒子进行SA模式的可能性。算法检测到种群多样性低于阈值,系统有70%的概率禁止粒子继续进行粒子群迭代,转去执行SA算法的随机扰动,即以当前位置为中心,根据当前的温度T进行一次随机跳跃,防止算法陷入在一个错误的局部极值点上。反之指标显示正常收敛时,大部分的粒子仍旧维持原先的PSO优化迭代,只有少部分的粒子转去执行随机扰动,保证了算法在大部分时间里的收敛速度和精度。SA-PSO优化算法的算法流程图如图3所示。
Figure 3. SA-PSO optimized LQR algorithm flowchart
图3. SA-PSO优化的LQR算法流程图
3.3. 下层转矩分配器
考虑到本文对转矩分配算法没有做出较大的创新改进,不是本文的重点内容,因此在此只简单概述。
仿真实验部分设计了以四个车轮的纵向轮胎力为控制变量的基于优化的转矩分配策略。直接调用了MATLAB/Simulink中的quadprog求解器进行在线求解。该求解器利用有效集法[23] (Active Set Method)高效处理约束边界,能够在毫秒级时间内计算出满足所有动力学约束的最优四轮转矩指令,求解得到的四个车轮最优转矩
将作为最终指令发送至车辆动力学模型,实现对上层LQR决策力矩的精确执行。
4. 仿真分析
在Simulink中搭建仿真模型进行算法验证,分别在高附着路面、低附着路面分别进行双移线工况下的算法的有效性验证对比分析。为了有效地进行比较,选择了包括本文提出的改进SA-PSO-LQR、标准LQR和线性权重PSO-LQR三种控制方法的仿真结果进行比较。对于LQR控制器的参数,取最佳经验值:Q = diag[104, 104],R = 10−5。同时设计参数不确定性仿真实验:采用SA-PSO-LQR方法得出的最优控制参数,分别改变车辆模型的整车质量与轮胎侧偏刚度后观察控制效果,以此验证算法的鲁棒性。
4.1. 高附着路面仿真
设置纵向车速期望值为60 km/h,在双移线工况下行驶,路面附着系数为0.85,仿真结果如图4所示。
(a) 纵向车速 (b) 电机输出转矩
(c) 横摆角速度对比 (d) 质心侧偏角对比
Figure 4. High adhesion road double lane change condition
图4. 高附着路面双移线工况
由图4(a)可知,纵向速度的偏差很小,偏差被限制在1%以内,在高路面附着系数下,所设计的算法可以很好地对期望纵向车速进行跟踪。
从图4(c)、图4(d)可以看出,在高附着路面条件下,所设计的改进SA-PSO-LQR算法和转矩分配算法可以很好地跟踪横摆角速度的期望值,跟踪误差也保持在最大值0.0041 rad/s以内;质心侧偏角的跟踪误差则保持在0.0103 rad以内,两组数据与期望值的偏差都是三种算法中最小的。而惯性权重PSO-LQR方法在横摆角速度的追踪效果上略差于优化SA-PSO-LQR方法,但质心侧偏角的变化波动明显大于优化SA-PSO-LQR方法。经典LQR方法在横摆角速度和质心侧偏角的追踪上偏差最大。仿真结果的对比数据记录在表2中。
Table 2. Simulation data of stability under double lane change condition on high-adhesion road surface
表2. 高附着路面双移线工况下的稳定性仿真数据
算法 |
横摆角速度(rad/s) |
质心侧偏角(rad) |
峰值 |
均方根误差 |
最大跟踪误差 |
峰值 |
均方根误差 |
最大跟踪误差 |
LQR |
0.3408 |
0.1206 |
0.2528 |
0.0224 |
0.0077 |
0.0224 |
线性权重PSO-LQR |
0.2166 |
0.05902 |
0.0536 |
0.0220 |
0.0076 |
0.0220 |
改进SA-PSO-LQR |
0.2248 |
0.0163 |
0.0041 |
0.0103 |
0.0036 |
0.0103 |
期望值 |
0.2248 |
- |
- |
0 |
- |
- |
从表2可知,本文提出的控制器可以显著降低车辆质心侧偏角,同时使横摆角速度更好地跟踪期望值。本文中SA-PSO-LQR的横摆角速度最大值的绝对值相比普通LQR、惯性权重PSO-LQR分别下降了34%和4.7%;同时,改进的SA-PSO-LQR方法得出的质心侧偏角在最大值的绝对值方面相比普通LQR方法、线性权重PSO-LQR方法分别减少了54.0%和54.40%。
4.2. 低附着路面仿真
低附着路面匀速双移线工况的情况下,期望车速同样设置为60 km/h,设置路面附着系数为0.4。得到的仿真结果如下图5所示:
(a) 纵向车速 (b) 电机输出转矩
(c) 横摆角速度对比 (d) 质心侧偏角对比
Figure 5. Low adhesion road double lane change condition
图5. 低附着路面双移线工况
从图5可以看出,在低附着路面条件下(
),所设计的改进SA-PSO-LQR算法和转矩分配算法依旧可以在保证纵向速度误差在1%的同时,保证车辆的质心侧偏角和横摆角速度的跟踪效果。仿真结果的对比数据记录在表3中。
Table 3. Simulation data of stability under double lane change condition on low-adhesion road surface
表3. 低附着路面双移线工况下的稳定性仿真数据
算法 |
横摆角速度(rad/s) |
质心侧偏角(rad) |
峰值 |
均方根误差 |
最大跟踪误差 |
峰值 |
均方根误差 |
最大跟踪误差 |
LQR |
0.21849 |
0.07517 |
0.39002 |
0.026934 |
0.0080509 |
0.026934 |
线性权重PSO-LQR |
0.2451 |
0.06042 |
0.37896 |
0.018787 |
0.0065198 |
0.018787 |
改进SA-PSO-LQR |
0.21986 |
0.03856 |
0.13214 |
0.0075089 |
0.0021517 |
0.0075089 |
期望值 |
0.21857 |
- |
- |
0 |
- |
- |
从表3可知,低附着路面条件下,在5 s和10 s左右,路面所能提供的附着力已经达到了饱和,但是本文的SA-PSO-LQR横摆稳定性控制与转矩分配方法在质心侧偏角的跟踪效果仍优于其他控制算法。横摆角速度均方根误差相比普通LQR、惯性权重PSO-LQR分别下降了49%和37%;同时,改进的SA-PSO-LQR方法得出的质心侧偏角在均方根误差上相比普通LQR方法、线性权重PSO-LQR方法分别减少了70.0%和67.40%。
4.3. 参数不确定性分析
首先,改变车辆模型的轮胎侧偏刚度:
、
,从−86,418 N/rad变为−120,000 N/rad,保持其余参数不变,得到仿真结果如下所示:
(a) 横摆角速度对比 (b) 质心侧偏角对比
Figure 6. Simulation results after changing the tire cornering stiffness
图6. 改变轮胎侧偏刚度后的仿真结果
改变整车质量。从1412 kg变为1800 kg,保持其余参数不变,得到仿真结果如下所示:
(a) 横摆角速度对比 (b) 质心侧偏角对比
Figure 7. Simulation results after changing the curb weigh
图7. 改变整车质量后的仿真结果
从图6和图7可以观察到,在改变整车质量和轮胎侧偏刚度后,SA-PSO-LQR方法得出的控制效果与图4的原本车辆参数的仿真结果相比,控制精度有所下降。这是因为在LQR方法中,反馈增益K依赖于黎卡提方程的解,见式(17)。而黎卡提方程中涉及由二自由度模型推导出的状态方程的状态矩阵和输入矩阵,这两个矩阵直接包含了车辆的物理参数,如速度、质量、侧偏刚度等。因此当车辆参数改变后,其对应的最优控制率K理论上也会改变。因此按照原本参数计算出的K施加到新的参数系统中,往往会导致控制精度下降。在这些车辆参数中,速度的影响是最大的。改变车速后的系统使用原本的增益可能会导致系统的失稳。而相较于PID等传统控制算法,LQR本身具有良好的相位裕度和增益裕度,因此当整车质量、侧偏刚度等参数在一定范围内变化时,LQR系统仍能保持渐进稳定,这也就说明了图6与图7控制效果有所下降,但系统仍然较为稳定的原因。因此,当整车质量、轮胎侧偏刚度、转动惯量等参数在一定范围内变化时,本文的SA-PSO-LQR方法仍然具有较好的控制效果;当参数变化较大时,系统仍然会失稳。
另一方面,改进后的SA-PSO算法在寻优的收敛速度上有很好的表现。分别采用经典PSO、惯性权重PSO和改进SA-PSO方法求解,寻优过程中的适应度函数随迭代次数的变化曲线如图8所示:
Figure 8. Optimal fitness variation graph
图8. 最优适应度变化图
从图8中可以看出,在迭代初期,标准PSO算法下降迅速,但在迭代后期陷入停滞,表现出了典型的早熟收敛特征,最终收敛到0.5左右。线性权重PSO方法通过权重的动态调整改善了搜索能力,收敛曲线较为平滑,但收敛直到末期才找到最优解。因此在面对高维多极值的LQR参数空间时,可能存在无法摆脱局部极值的束缚的情况。本文提出的SA-PSO算法在迭代初期表现出较强的探索能力,曲线呈现出显著的阶梯式下降。最终,改进的SA-PSO算法收敛到了最低的适应度值,证明了其在全局寻优上的显著优势。
5. 结论
本文提出了一种改进SA-PSO优化的LQR直接横摆力矩控制方法。仿真实验结果表明,所提议的SA-PSO-LQR控制器在确保纵向速度稳定的同时,在转向稳定性方面展现出优越的性能,在寻优速度和最优值的选取上均优于传统LQR方法和惯性权重的PSO-LQR方法。双移线工况下,不论是高路面附着系数还是低路面附着系数的条件下,横摆角速度和质心侧偏角的跟踪误差都保持在0.02以下,相比于传统PSO算法,横摆角速度和质心侧偏角的误差均减少了30%以上,在质心侧偏角的抑制上更是优于惯性权重PSO-LQR方法50%以上。在不同的驾驶场景可以通过参数调整来适应各种工况。同时,这种离线优化的方法大大降低了计算负担,结合种种优势使得其能够高效地应对各种驾驶场景。