基于自适应动态规划的柔性机械臂跨尺度运动控制研究
Research on Cross-Scale Motion Control of Flexible Robotic Manipulator Based on Adaptive Dynamic Programming
DOI: 10.12677/dsc.2025.142013, PDF, HTML, XML,    科研立项经费支持
作者: 徐建亮, 毕少平:衢州职业技术学院机电工程学院,浙江 衢州;毛海军:浙江管卫建设有限公司,浙江 衢州;徐友洪:衢州职业技术学院信息工程学院,浙江 衢州
关键词: 自适应动态控制液压驱动机械臂最优控制奇异摄动理论Adaptive Dynamic Control Hydraulic Drive Robotic Manipulator Optimal Control Singular Perturbation Theory
摘要: 本文研究了液压驱动柔性机器人操控臂系统(HDFRMS)的跨尺度运动控制问题,提出了一种基于自适应动态规划(ADP)的控制方法。本文首先推导了一个完整的三阶动力学模型,涵盖三连杆刚柔耦合操控臂、非对称四通阀控制的液压缸和液压执行器。然后,提出了一种新颖的奇异摄动解耦方法,将系统分解为三个时间尺度上的子系统:慢子系统(SSS)、第二快子系统(SFS)和第一快子系统(FFS),分别描述操控臂的大范围运动、柔性振动和液压伺服控制。通过设计自适应动态规划轨迹跟踪控制(ADP)、鲁棒最优振动控制(ROC)和自适应滑模伺服控制(ASMC)等复合控制器,并利用李雅普诺夫稳定性理论证明了系统的稳定性。仿真结果表明,所提出的控制方法能够在无不确定性和存在不确定性的情况下,实现精确的轨迹跟踪和有效的振动抑制,且在变负载条件下展现出良好的鲁棒性和适应性。
Abstract: This paper investigates the cross-scale motion control problem of a Hydraulic-Driven Flexible Robotic Manipulator System (HDFRMS) and proposes a control methodology based on Adaptive Dynamic Programming (ADP). Initially, a comprehensive third-order dynamic model is derived, encompassing a three-link rigid-flexible coupled manipulator, asymmetric four-way valve-controlled hydraulic cylinders, and hydraulic actuators. Subsequently, a novel decoupling method based on Singular Perturbation Theory (SPT) is introduced to decompose the system into three subsystems operating on distinct timescales: the Slow Subsystem (SSS), the Second Fast Subsystem (SFS), and the First Fast Subsystem (FFS), which respectively characterize the large-scale motion of the manipulator, the flexible vibrations, and the hydraulic servo control. The stability of the system is demonstrated by designing composite controllers, including ADP-based trajectory tracking control, Robust Optimal Vibration Control (ROC), and Adaptive Sliding Mode Servo Control (ASMC), and employing Lyapunov stability theory. Simulation results indicate that the proposed control method can achieve precise trajectory tracking and effective vibration suppression under both deterministic and uncertain conditions while also exhibiting robustness and adaptability under variable payload scenarios.
文章引用:徐建亮, 毛海军, 徐友洪, 毕少平. 基于自适应动态规划的柔性机械臂跨尺度运动控制研究[J]. 动力系统与控制, 2025, 14(2): 116-129. https://doi.org/10.12677/dsc.2025.142013

1. 引言

液压驱动柔性机器人操控臂系统(Hydraulic-Driven Flexible Robot Manipulator, HDFRMS)在众多工程领域展现出巨大的应用潜力,尤其是在一些人类难以直接操作的复杂场景中,例如森林开发、重载运动控制、建筑施工、移动设备应用以及其他工业领域[1]-[3]。与传统的刚性操控臂相比,液压驱动柔性操控臂具有显著优势:其能量消耗更低,重量更轻,且操作速度更快。然而,与刚性操控臂不同,柔性操控臂的动力学特性更为复杂,属于非线性的刚柔耦合无限阶模型。为了有效控制柔性多体动力学系统,尤其是柔性连杆操控臂和柔性关节操控臂,研究者们已经提出了多种控制方法,如PID控制、智能控制、自适应控制、滑模控制等。这些控制算法各具优缺点,如何巧妙利用其优点并规避缺点,以提升系统控制性能,成为学者们的研究焦点。PID控制因其结构简洁、易于实现等优势,被广泛应用于多电机机器人控制领域。然而,PID控制的参数难以精确确定,且难以确保被控系统具备良好的动静态品质,因此学者们常将其与模糊控制、神经网络等智能控制算法相结合,以提升多电机的同步控制性能。自适应控制能有效应对系统参数变化的干扰,但该算法对数学模型的精度要求较高,限制了其适用范围。Sun [4]采用自适应算法实现了多轴系统的位置控制,确保了同步误差的收敛。滑模控制算法对参数变化及扰动具有强鲁棒性,且结构简单、响应迅速,因此在多电机同步控制领域备受关注。丁威等[5]提出了一种无速度传感器的多电机均值耦合非奇异全局快速Terminal滑模速度同步控制方法,通过均值耦合策略对多电机转速进行耦合控制,实现系统误差的全局补偿,确保多电机速度误差同步收敛。张润梅等[6]为解决多关节机械臂在外部干扰等条件下的位置及速度轨迹跟踪问题,提出了基于干扰观测器的自适应滑模控制方法,该方法有效实现了多关节机械臂的位置及速度轨迹跟踪。贺志浩等[7]提出了一种基于自抗扰与观测器的环形耦合多电机协调滑模控制方法,以实现多电机的转速同步控制。周挺等[8]则提出了一种基于自适应分数阶的滑模控制方法,用于实现球形机器人的转速控制。此外,文献还提出了在慢子系统中应用自适应神经反步控制,作为不确定性非线性补偿器。为了提高系统的鲁棒性,研究者们还探索了模糊控制、鲁棒模糊滑模控制和自适应高增益卡尔曼滤波器等方法。与电驱动操控臂相比,液压驱动操控臂具有更高的功率,能够处理超过数百公斤的重载,同时具有较低的刚度和更快的响应时间。然而,液压驱动操控臂的动态方程阶数更高,从二阶提升到三阶,这主要是由于电液耦合和固有的弹性振动。这些特性使得控制液压驱动操控臂变得更加复杂。为此,研究者们提出了多种控制策略[9]-[11],例如包含前馈控制和反馈控制的混合控制器,以及基于模型的自适应能量整形控制器。此外,为了处理系统中的不确定性和振动,还设计了多种观测器,如自适应观测器和变量结构干扰观测器。虽然上述面向机械臂关节的相关研究已经取得了一定的进展,但对于柔性机械臂的高精准位置跟踪以及控制性能仍有待进一步提高。尽管如此,现有的动力学描述仍存在不足,尤其是在过去的控制器设计中,往往忽视了柔性振动或液压驱动的特性。因此,迫切需要提出一种新的控制方法,能够精确跟踪期望轨迹,并有效抑制基于完整电液耦合模型的柔性振动。因此,本文针对液压柔性机械臂的控制问题,提出了一种新型的控制策略,该策略主要贡献有如下3个方面:1) 设计一种完整的三阶动力学模型,包括三连杆刚柔耦合操控臂、非对称四通阀控制的液压缸以及液压执行器。与现有的实际工程系统相比,该模型更具优势和完整性,因为它同时考虑了柔性振动和液压驱动的特性。2) 提出一种新颖的奇异摄动解耦方法,专门用于电液伺服柔性多体动力学系统。与传统方法仅使用一个摄动参数和两个时间尺度不同,本文引入了两个奇异摄动参数,从而建立了三个时间尺度。这一方法能够更精细地处理多时间尺度问题,提高系统的控制性能。3) 提出一种最优控制方法,该方法简化了自适应动态规划(Adaptive and Dynamic Planning, ADP)控制器的结构,省略了传统ADP中的模型网络和控制网络部分。该控制器能够显著提高控制精度并优化能量消耗。

2. HDFRMS的动力学建模

本文考虑的机械结构包括第一根刚性连杆(旋转关节)、第二根刚性连杆(铰接关节)和最后一根柔性连杆(铰接关节) (见图1)。

Figure 1. Model of flexible robotic manipulator

1. 柔性机械臂模型

2.1. 机械子系统模型

HDFRMS的前两根连杆为刚性,而第三根连杆类似于细长梁,具有柔性。由于末端执行器携带重负载以及操控臂系统的大幅度运动,第三根连杆会发生振动。本文仅考虑横向振动,忽略轴向变形和剪切变形,因此欧拉·伯努利梁理论足以描述第三根连杆的柔性变形和振动。

具体而言,利用假设模态法(Assumed Mode Method, AMM)和拉格朗日方程推导出机械子系统的动力学模型。基于实际情况,本文提出以下假设:

假设1:负载被末端执行器牢固抓取,接触为静止状态。

假设2:执行器的质量集中在操控臂的关节处。

表1列出了机械子系统中常用的符号及其定义。

Table 1. Frequently used symbols of mechanical subsystem

1. 机械子系统常用符号

符号

定义

符号

定义

L i

i根连杆的长度

r 1

第1根连杆的上表面半径

θ i

i个关节的角度

r 2

第1根连杆的下表面半径

m i

第1根连杆的下表面半径

M

负载的质量

ρ i

i根连杆的单位长度质量密度

EI

弹性模量

L 11 L 21

第一个液压缸的安装位置

ω( r,t )

第三根柔性连杆的弹性变形

L 22 L 31

第二个液压缸的安装位置

Φ j ( r )

柔性连杆3的第j模态形状函数

g

重力加速度

q j ( t )

柔性连杆3的第j个模态位移

g

重力加速度

q j ( t )

柔性连杆3的第j个模态位移

XOY 为惯性笛卡尔坐标系, X i O Y i 为固定在机器人操控臂上的移动坐标系。HDFRMS的四个主要坐标系的示意图如图2所示。

Figure 2. Schematic diagram of the four main coordinate systems of HDFRMS

2. HDFRMS的四个主要坐标系的示意图

考虑AMM,第三根连杆的弹性位移可表示为:

ω( r,t )= j=1 n Φ j ( r ) q j ( t ) (1)

在实际工程应用中,通常只考虑前几阶模态,因为它们对系统性能的影响更大。当将第三根柔性连杆视为悬臂梁模型时,一端为简支,另一端为自由端。因此,可以得到弹性位移:

ω( r,t )= Φ 1 ( r ) q 1 ( t )+ Φ 2 ( r ) q 2 ( t ) (2)

Φ j ( r )=sh β j r+ ζ j sin β j r (3)

其中, ζ j = sh β j L 3 / sin β j L 3 β j = ( j+0.25 )π/ L 3 j=1,2 r为第三根连杆上任意点的位置,且 0r L 3

考虑坐标系和三根刚柔耦合连杆的运动学,机械子系统的动能可以表示为:

T=( 1 6 ρ 2 L 2 3 + 1 2 m 3 L 2 2 + 1 2 ρ 3 L 3 L 2 2 + 1 2 M L 2 2 )( θ ˙ 2 2 + s 2 2 θ ˙ 1 2 )+[ 1 6 ρ 1 ( r 2 3 r 1 3 )+ 1 2 m 2 r 1 2 ] θ ˙ 1 2 + ρ 3 L 2 0 L 3 ω ˙ dr θ ˙ 2 c 3 + 1 2 M L 3 2 [ ( θ ˙ 2 + θ ˙ 3 ) 2 + θ ˙ 1 2 s 23 2 ]+ 1 2 ρ 3 0 L 3 ω ˙ 2 dr +( 1 2 ρ 3 L 2 L 3 2 +M L 2 L 3 )[ c 3 θ ˙ 2 ( θ ˙ 2 + θ ˙ 3 )+ s 2 s 23 θ ˙ 1 2 ]+( 1 2 ρ 3 0 L 3 ω 2 dr + 1 2 M ω L 3 2 )[ ( θ ˙ 2 + θ ˙ 3 ) 2 + c 23 2 θ ˙ 1 2 ] + L 2 ( ρ 3 0 L 3 ωdr +M ω L 3 )[ s 2 c 23 θ ˙ 1 2 s 3 θ ˙ 2 ( θ ˙ 2 + θ ˙ 3 ) ]+( ρ 3 0 L 3 ω ˙ rdr +M L 3 ω ˙ L 3 )( θ ˙ 2 + θ ˙ 3 ) + 1 2 M ω ˙ L 3 2 +( ρ 3 0 L 3 ωrdr +M L 3 ω L 3 ) s 23 c 23 θ ˙ 1 2 +M L 2 ω ˙ L 3 θ ˙ 2 c 3 + 1 6 ρ 3 L 3 3 [ ( θ ˙ 2 + θ ˙ 3 ) 2 + θ ˙ 1 2 s 23 2 ] (4)

机械子系统的势能可以推导出为:

V=( 1 2 ρ 1 L 1 + ρ 2 L 2 + ρ 3 L 3 + m 2 + m 3 +M )g L 1 +( 1 2 ρ 2 L 2 + ρ 3 L 3 + m 3 +M )g L 2 c 2 + 1 2 EI 0 L 3 { 2 ω r 2 } 2 dr +( Mg L 3 + 1 2 ρ 3 g L 3 2 ρ 3 g 0 L 3 ωdr ) c 23 Mg ω L 3 s 23 (5)

其中, c 1 =cos θ 1 c 2 =cos θ 2 c 3 =cos θ 3 s 1 =sin θ 1 c 23 =cos( θ 2 + θ 3 ) s 3 =sin θ 3 s 2 =sin θ 2 s 23 =sin( θ 2 + θ 3 ) ω=ω( r,t ) ω ˙ = Φ 1 ( r ) q ˙ 1 ( t )+ Φ 2 ( r ) q ˙ 2 ( t ) ω ˙ L 3 = Φ 1 ( L 3 ) q ˙ 1 ( t )+ Φ 2 ( L 3 ) q ˙ 2 ( t ) 2 ω r 2 = Φ ¨ 1 ( r ) q 1 ( t )+ Φ ¨ 2 ( r ) q 2 ( t )

定义拉格朗日函数L,它由系统的总势能V和总动能T组成,得到 L=TV

根据拉格朗日方程:

d dt ( L p ˙ i ) L p i = τ i (6)

刚柔耦合操控臂在没有粘性阻尼和外部干扰的情况下的动力学模型可以表示为:

M( θ,q )[ θ ¨ q ¨ ]+K[ θ q ]+G( θ, θ ˙ ,q, q ˙ )=[ τ 0 ] (7)

其中, M( θ,q ) 为正定及对称的随时间变化的广义惯性矩阵, K=diag( k 1 , k 2 ) 为柔性连杆3的刚度矩阵, G( θ, θ ˙ ,q, q ˙ )= [ g 1 g 2 g 3 g 4 g 5 ] T 由科里奥利力、离心力和重力组成, θ= [ θ 1 θ 2 θ 3 ] T 为关节角度, q= [ q 1 q 2 ] T 为模态坐标, τ= [ τ 1 τ 2 τ 3 ] T 为控制转矩。

利用拉格朗日方程,p包含关节角度θ和弹性位移ω。当 i=1,2,3 的情况下,考虑关节角度θ和控制转矩τ。否则:

d dt ( L ω ˙ ) L ω =0 (8)

2.2. 液压子系统模型

关节1是旋转关节,由旋转液压马达驱动。关节2和3是转动关节,由线性非对称液压缸驱动。实际中,操控臂需要沿着预定轨迹移动负载。

液压驱动子系统由液压缸和液压马达组成。液压子系统的符号定义如表2所示。非对称四通阀控制的液压缸是一种液压执行器,它将液压能转化为线性运动的机械能,如图3所示。

Table 2. Definition of symbols for hydraulic subsystems

2. 液压子系统的符号定义

符号

单位

符号

单位

L1

1.8

m

ρ1

20

kg/m3

L2

2.5

m

ρ2

40

kg/m3

L3

6

m

ρ3

40

kg/m3

L11

1

m

A1

0.015

m2

L21

0.2

m

A2

0.02

m2

L22

1

m

EI

107

Nm2

L31

0.2

m

V1

0.002

m3

r1

0.2

m

Kc

6 × 1013

m3/Pa·s

r2

0.4

m

Kc

4 × 1013

m3/Pa·s

m2

5

kg

Kk

10

cm/A

m3

8

kg

Kk

8

cm/A

实际上,机械系统的时间常数远大于液压伺服阀的时间常数,因此可以忽略伺服阀的动态,认为伺服阀的柱塞位移与控制输入成比例。通过忽略伺服阀的动态,可以得到:

x v = K i i (9)

其中, K i 为比例阀增益,u为放大器增益。

根据余弦定律,液压缸的安装位置关系如下:

y 2 = L 21 2 + L 11 2 2 L 11 L 21 cos( 180 θ 2 ) y 3 = L 22 2 + L 31 2 2 L 22 L 31 cos( 180 θ 3 ) y ˙ =J θ ˙ (10)

J=diag( J 1 , J 2 ) 为执行器线性位移与连杆角位移联系的矩阵。

Figure 3. Schematic diagram of asymmetric hydraulic cylinder

3. 非对称液压缸的示意图

下面将描述这个矩阵J

J 2 = y 2 θ 2 = L 21 L 11 sin θ 2 L 21 2 + L 11 2 +2 L 11 L 21 cos θ 2 J 3 = y 3 θ 3 = L 22 L 31 sin θ 3 L 22 2 + L 31 2 +2 L 22 L 31 cos θ 3 (11)

根据力平衡关系与液压系统的基本理论得出:

{ Q L = K q x v K c P L Q L = C tm P L + V t 4 β e P ˙ L + A p y ˙ x v = K i I τ= A p J P L A p ={ A 1 x v 0 A 2 x v <0 (12)

应用(9)和(11),我们可以推导:

τ ˙ +[ 4 β e V t ( K c + C tm ) J ˙ J ]τ+ 4 β e A p 2 V t J 2 θ ˙ = 4 β e A p K q K i V t JI (13)

其中, V t = 2L A p 4 / ( A 1 3 + A 2 3 )

同样,阀门控制的液压马达的动力学也可以推导出为:

{ x v = K i I τ= P L D Q L = K q x v K c P L Q L =D θ ˙ + C tm P L + V t 4 β e P ˙ L (14)

其中, K q = C d w ( P s P L )/ρ

通过(13)的简单计算,可以得到电流与转矩之间的关系:

τ ˙ + 4 β e V t ( C tm + K c )τ+ 4 β e D 2 V t θ ˙ = 4 β e D K q K i V t I (15)

从(12)和(14)可知,液压子系统模型为:

τ ˙ +Aτ+B θ ˙ =CI (16)

从前述推导可知:方程(7)和(10)共同构成了HDFRMS的动力学模型。

{ M( θ,q )[ θ ¨ q ¨ ]+K[ θ q ]+G( θ, θ ˙ ,q, q ˙ )=[ τ 0 ] τ ˙ +Aτ+B θ ˙ =CI (17)

3. 操控臂系统的跨尺度解耦

液压驱动柔性机器人操控臂系统(HDFRMS)的动力学模型本质上是一个强耦合的三阶时变非线性微分方程。这种复杂性使得直接设计系统的控制律变得非常困难。此外,当系统存在不确定性和干扰时,系统的控制性能难以保证。因此,本文采用奇异摄动理论(Singular Perturbation Theory, SPT) [12]对系统进行解耦,将其分解为多个时间尺度上的子系统,以便分别设计控制律。

3.1. 第一次奇异摄动解耦

目标:将完整的动力学模型分解为慢子系统(Slow Subsystem, SS)和快子系统(Fast Subsystem, FS)。

解耦过程

定义奇异摄动参数

引入第一个奇异摄动参数 ϵ 1 ,表示系统中快变量与慢变量的时间尺度差异,且满足 ϵ 1 1 。这表示快变量的变化速度远快于慢变量。

动力学模型改写:

将完整的动力学模型改写为包含奇异摄动参数的形式:

M( θ,q ) θ ¨ +K( q )q+C( θ, θ ˙ ,q ) θ ˙ =τ+ ε 1 f( θ, θ ˙ ,q, q ˙ ) (18)

其中, M( θ,q ) :广义惯性矩阵,与关节角度θ和模态坐标q有关。 C( θ, θ ˙ ,q ) :科里奥利力、离心力和重力矩阵。 K( q ) :柔性连杆的刚度矩阵。τ:控制输入力矩。 f( θ, θ ˙ ,q, q ˙ ) :与快变量相关的高阶项。τ1:第一快时间尺度, τ 1 =t/ ϵ 1

变量分解:

根据多时间尺度理论,将变量分解为慢变量和快变量:

θ= θ s + ε 1 θ f q= q s + ε 1 q f (19)

其中, θ s q s 是慢时间尺度下的变量, θ f q f 是快时间尺度下的变量。

慢子系统(Slow Subsystem, SSS):

ϵ 1 =0 时,忽略高阶无穷小项 ϵ 1 f ,得到慢子系统:

M( θ s , q s ) θ ¨ s +K( q s ) q s +C( θ s , θ ˙ s , q s ) θ ˙ s = τ s (20)

慢子系统描述了系统的刚性运动部分,忽略了柔性振动和液压驱动的快速动态。

快子系统(Fast Subsystem, FFS):

在边界层中引入快时间尺度 τ 1 =t/ ϵ 1 ,得到快子系统:

M( θ s , q s ) q ¨ f +K( q s ) q f +C( θ s , θ ˙ s , q s ) q ˙ f =f( θ s , θ ˙ s , q s , q ˙ f ) (21)

快子系统描述了系统的快速动态部分,主要是柔性振动和液压驱动的动态。

3.2. 第二次奇异摄动解耦

目标:进一步将慢子系统(SSS)分解为描述大范围运动的第二慢子系统(SSS)和描述柔性振动的第二快子系统(Second Fast Subsystem, SFS)。

解耦过程

定义奇异摄动参数

ϵ 2 :第二个奇异摄动参数,表示系统中柔性振动与大范围运动的时间尺度差异, ϵ 2 ϵ 1

定义逆矩阵:

定义广义惯性矩阵的逆矩阵 M 1 ( θ s , q s ) ,用于进一步简化动力学方程。

动力学模型改写:

将慢子系统进一步改写为:

M 1 ( θ s , q s )C( θ s , θ ˙ s , q s ) θ ˙ s + M 1 ( θ s , q s )K( q s ) q s =C( θ, θ ˙ ,q ) θ ˙ = M 1 ( θ s , q s ) τ s + ε 2 g( θ s , θ ˙ s , q s , q ˙ s ) (22)

其中, M 1 ( θ s , q s ) :广义惯性矩阵的逆矩阵。 g( θ s , θ ˙ s , q s , q ˙ s ) :与第二级快变量相关(柔性震动)的高阶项。τ2:第二快时间尺度, τ 2 =t/ ϵ 2

第二慢子系统(SSS):

ϵ 2 =0 时,忽略高阶无穷小项 ϵ 2 g ,得到第二慢子系统:

θ ¨ s + M 1 ( θ s , q s )C( θ s , θ ˙ s , q s ) θ ˙ s = M 1 ( θ s , q s ) τ s

第二慢子系统描述了操控臂的大范围运动,忽略了柔性振动的动态。

第二快子系统(SFS):

在边界层中引入第二快时间尺度 τ 2 =t/ ϵ 2 ,得到第二快子系统:

q ¨ s + M 1 ( θ s , q s )K( q s ) q s =g( θ s , θ ˙ s , q s , q ˙ s ) (23)

第二快子系统描述了第三根柔性连杆的柔性振动动态。

4. 控制设计

4.1. 自适应动态规划轨迹跟踪控制

自适应动态规划(ADP) [13]是一种新兴的最优控制方法,已在多个领域取得良好效果,例如高炉煤气系统、可重复使用运载火箭、操控臂、道路交叉口路径规划等。ADP通过Critic网络(Critic Network)实现最优控制,简化了传统ADP控制器的结构,省略了模型网络和控制网络部分,从而提高了轨迹跟踪精度。

在SSS中,设计了基于ADP的轨迹跟踪控制器,其最优反馈控制仅依赖于Critic网络输出的最优代价函数梯度。考虑系统不确定性和干扰,SSS的动力学模型可以表示为:

θ ¨ s + M 1 ( θ s , q s )C( θ s , θ ˙ s , q s ) θ ˙ s = M 1 ( θ s , q s ) τ s +d( t ) (24)

其中, d( t ) 是系统的不确定性和干扰。

定义轨迹跟踪误差为:

e( t )= θ s ( t ) θ d ( t ) (25)

其中, θ d ( t ) 是期望轨迹。

选择性能指标为:

J= 0 ( e T ( t )Qe( t )+ τ T ( t )Rτ( t ) )dt (26)

其中,QR是正定矩阵。

根据ADP理论,最优控制律可以表示为:

τ ( t )= R 1 M( θ s , q s ) V θ s (27)

其中,V是最优代价函数。

通过神经网络逼近最优代价函数,可以得到Critic网络的输出及其梯度。利用梯度下降法更新网络权重,从而实现最优控制律的迭代更新。

定理1:在假设1和假设2的条件下,如果基于神经网络的最优控制律存在,则在SSS中,轨迹跟踪误差和神经网络权重逼近误差最终一致有界。

证明:根据李雅普诺夫稳定性理论,定义正定能量函数V(t),并证明其导数为负半定,从而证明系统的稳定性。具体证明过程略。

4.2. 鲁棒最优振动控制

针对SFS,设计了鲁棒最优振动控制律,以抑制第三根柔性连杆的弹性振动。选择二次型性能指标函数,并求解代数黎卡提方程,得到最优反馈控制律。

定理2:对于SFS,如果不确定性满足一定条件,则闭环系统的渐近稳定性可以保证。

证明:根据李雅普诺夫稳定性理论[14],定义正定能量函数V(t),并证明其导数为负半定,从而证明系统的稳定性。具体证明过程略。

4.3. 自适应滑模伺服控制

针对FFS,设计了自适应滑模伺服控制律,以应对液压伺服控制系统中的不确定因素,如液压油弹性模量的扰动、液压油泄漏和运动部件的摩擦。

Figure 4. Block diagram of HDFRMS with controllers

4. 带有控制器的HDFRMS的方框图

定理3:对于FFS,自适应滑模伺服控制律可以保证闭环系统的最终一致稳定性。

证明:根据李雅普诺夫稳定性理论,定义正定能量函数V(t),并证明其导数为负半定,从而证明系统的稳定性。具体证明过程略。

4.4. 复合控制

根据上述理论分析,HDFRMS的控制律可以表示为SSS、SFS和FFS的控制律的组合,操控臂控制闭环系统的整体框图如图4所示。期望角度和角速度经过轨迹规划后作为操控臂系统的输入,同时通过传感器测量的信息计算出三个控制输出。这些控制输出经过时间尺度变换后相加,最终实现闭环HDFRMS的控制。

定理4:在奇异摄动理论的基础上,SSS、SFS和FFS的稳定性分别由自适应动态规划轨迹跟踪控制律、鲁棒最优振动控制律和自适应滑模伺服控制律保证。因此,整个操控臂系统的闭环稳定性可以由复合控制器保证。

5. 仿真结果

(a) BP神经网络模型的结构

(b) BP神经网络系统的机制示意图

Figure 5. BP neural network phylogram

5. BP神经网络系统图

在本节中,通过MATLAB仿真验证了奇异摄动解耦方法和复合控制律的有效性和鲁棒性。所有测试均在HDFRMS上进行,结构参数见表3。在ADP轨迹跟踪控制中,选择BP神经网络(图5)作为Critic网络,激活函数为sigmoid函数,学习率为0.01,初始权重值为随机值。在鲁

棒最优振动控制和自适应滑模伺服控制中,参数设置为 ϵ 1 =0.01 ϵ 2 =0.001 K = 10。操控臂关节的初始位置为 θ 1 ( 0 )=0 θ 2 ( 0 )=0 θ 3 ( 0 )=0 ,期望轨迹为 θ d ( t )= [ 0.5sin( t ),0.3cos( t ),0.2sin( 2t ) ] T ,采样时间为0.1 ms,总时间为10 s。

Table 3. HDFRMS structural parameters

3. HDFRMS结构参数

(a)

符号

单位

符号

单位

符号

单位

L1

1.8

m

ρ1

20

kg·m−1

Cdi

0.85

-

L2

2.5

m

ρ2

40

kg·m−1

Cd

0.8

-

L3

6

m

ρ3

40

kg·m−1

Ctm1

7 × 10−13

m5/N·s

L11

1

m

A1

0.015

m2

Ctmi

5 × 10−13

m5/N·s

L21

0.2

m

A2

0.02

m2

Ps

7 × 106

Pa

L22

1

m

EI

107

Nm2

wi

0.08

m

L31

0.2

m

Vt

0.002

m3

w

0.04

m

r1

0.2

m

Kci

6 × 10−13

m3/Pa·s

βe

7 × 108

Nm−2

r2

0.4

m

Kc

4 × 10−13

m3/Pa·s

D

0.2

m2

m2

5

kg

Kii

10

cm/A

L

1.2

m

m3

8

kg

Ki

8

cm/A

ρ

870

kg·m−3

(b)

符号

单位

符号

单位

Ca0

0.85

-

Cml

7 × 1013

m5/N·s

Cd

0.8

-

Cmi

5 × 1013

m5/N·s

Pe

7 × 106

Pa

w1

0.08

m

w

0.04

m

βe

7 × 108

Nm⁻2

D

0.2

m2

L

1.2

m

ρ

870

kg/m3

5.1. 无不确定性时的轨迹跟踪性能

在无不确定性条件下,对液压驱动柔性机器人操控臂系统(HDFRMS)的轨迹跟踪性能和振动抑制效果进行了仿真测试。结果表明,所有关节角度均能在3秒内快速跟踪至期望轨迹,其中第一个关节的响应速度最快,这归因于旋转关节对振动的低敏感性。此外,第三根柔性连杆的振动抑制效果显著,即使在满载条件下,振动也能在3秒内得到有效控制。同时,Critic网络的权重在仿真过程中收敛至稳定值,表明所设计的自适应动态规划(ADP)控制器在无不确定性情况下具备良好的稳定性和适应性。

5.2. 有不确定性时的轨迹跟踪性能

为验证液压驱动柔性机器人操控臂系统(HDFRMS)闭环控制系统的鲁棒性,本实验在系统中引入不确定性,分别对慢子系统(SSS)和第一快子系统(FFS)施加不同的不确定性扰动。在SSS中,总不确定性被设定为系统动态的一部分,而在FFS中,不确定性则体现在液压伺服驱动的快速动态中。通过这种设置,能够模拟实际工况下系统可能遭遇的各类不确定性因素,如液压系统参数波动、柔性连杆的非线性振动特性变化等[15] [16]。仿真结果显示,在不确定性存在的条件下,操控臂系统的轨迹跟踪性能依旧表现良好。具体而言,关节角度2的响应时间最长,约为3.5秒。这表明在面对不确定性时,系统仍能保持较为稳定的跟踪精度,但不同关节由于其动态特性及所受不确定性影响程度的差异,其响应时间存在一定的差异。此外,通过采用饱和函数替代传统的符号函数,有效减弱了控制电流的抖动现象。这一改进措施在实际应用中具有重要意义,因为控制电流的抖动可能会导致液压系统中的压力波动,进而影响操控臂的运动精度和稳定性。饱和函数的引入能够平滑控制信号,降低系统在快速切换或大范围调整时的动态冲击,从而提升系统的整体性能。

5.3. 变负载和不确定性条件下的轨迹跟踪性能

为进一步测试复合控制器在复杂工况下的适应性,本实验模拟了四种典型的变负载工作条件。第一种条件为负载质量从600 kg逐渐减少到0 kg,整个过程持续6秒,这种工况模拟了操控臂在连续作业过程中负载逐渐减轻的情况,如在物料搬运或装配过程中,随着物料的消耗或转移,负载质量发生变化;第二种条件为负载质量在6秒时突然从600 kg减少到200 kg,这种突变工况考验了系统在负载急剧变化时的动态响应能力,类似于在抓取或释放重物瞬间系统所面临的挑战;第三种、第四种条件为负载质量在4秒时突然从600 kg减少到200 kg,以及负载质量在2秒时突然从600 kg减少到200 kg,通过缩短负载变化的时间间隔,进一步加剧系统的动态冲击,更进一步验证复合控制器在不同时间点负载突变下的适应性和鲁棒性。

在上述变负载条件下,同时引入系统不确定性,对操控臂系统的轨迹跟踪性能和振动抑制效果进行了全面测试。结果表明,复合控制器能够有效应对负载变化和不确定性带来的双重挑战。系统在不同工况下均展现出良好的轨迹跟踪精度和振动抑制能力,证明了复合控制器的鲁棒性和适应性。具体性能指标对比见表4

Table 4. Controller performance comparison

4. 控制器性能对比

关节

无负载

半负载

满负载

渐变负载

突变负载(2 s)

突变负载(4 s)

突变负载(6 s)

误差指标

Joint 1

1.29

1.16

0.97

1.03

1.12

1.12

1.12

RMSE (103)

Joint 2

1.76

1.63

1.34

1.39

1.61

1.59

1.59

Joint 3

2.24

2.07

1.79

1.92

2.03

2.00

2.01

Joint 1

5.43

5.18

4.91

4.99

5.05

5.05

5.05

ISE (104)

Joint 2

5.88

5.50

5.37

5.43

5.50

5.05

5.50

Joint 3

6.96

6.74

6.44

6.62

6.69

6.69

6.67

Joint 1

3.15

2.85

2.74

2.59

2.77

2.26

2.77

IAE (103)

Joint 2

3.87

3.16

3.39

3.24

3.52

3.52

3.51

Joint 3

4.02

3.66

3.93

3.69

3.80

3.80

3.70

仿真结果表明,复合控制器在七种不同条件下均能有效实现操控臂的轨迹跟踪性能,且在存在不确定性的情况下具有良好的鲁棒性。与自适应滑模控制(ASMC)相比,ADP的过渡响应更快,稳态误差更小。

6. 结论

本文研究了液压驱动柔性机器人操控臂系统(HDFRMS)的动力学建模和轨迹跟踪控制。基于奇异摄动理论(SPT),将操控臂系统的动力学模型分解为描述刚性运动、柔性振动和液压伺服控制的三个子系统。通过自适应动态规划(ADP)、鲁棒最优振动控制和自适应滑模伺服控制,设计了各子系统的控制律,并利用李雅普诺夫稳定性理论证明了系统的稳定性。最后,通过数值仿真验证了复合控制器的有效性和鲁棒性。尽管本文的重点不在于此,但跨尺度解耦方法可以扩展到刚柔耦合、宏观–微观和电液复杂多体动力学系统。未来进一步研究摄动参数的选择及其对系统的影响,以及在液压缸摩擦存在的实际操控臂伺服系统中,如何基于ADP提高系统的鲁棒性。

基金项目

2024年度衢州市级科技攻关项目(2023K263, 2024K182)资助。

参考文献

[1] Cibicik, A. and Egeland, O. (2021) Kinematics and Dynamics of Flexible Robotic Manipulators Using Dual Screws. IEEE Transactions on Robotics, 37, 206-224.
https://doi.org/10.1109/tro.2020.3014519
[2] Sun, Y., Zhang, Q. and Chen, X. (2020) Design and Analysis of a Flexible Robotic Hand with Soft Fingers and a Changeable Palm. Advanced Robotics, 34, 1041-1054.
https://doi.org/10.1080/01691864.2020.1777197
[3] Tipary, B., Kovács, A. and Erdős, F.G. (2021) Planning and Optimization of Robotic Pick-and-Place Operations in Highly Constrained Industrial Environments. Assembly Automation, 41, 626-639.
https://doi.org/10.1108/aa-07-2020-0099
[4] Sun, D. (2003) Position Synchronization of Multiple Motion Axes with Adaptive Coupling Control. Automatica, 39, 997-1005.
https://doi.org/10.1016/s0005-1098(03)00037-2
[5] 丁威, 杜钦君, 宋传明, 等. 均值耦合多电机滑模速度同步控制[J]. 西安交通大学学报, 2022, 56(2): 159-170.
[6] 张润梅, 罗谷安, 袁彬, 等.多关节机械臂干扰观测器的自适应滑模控制[J]. 机械科学与技术, 2021, 40(10): 1595-1602.
[7] 贺志浩, 于海生. 基于自抗扰与观测器的环形耦合多电机协调滑模控制[J]. 微电机, 2021, 54(4): 48-55.
[8] 周挺, 徐宇工, 吴斌. 球形机器人的自适应分数阶PIλDμ滑模速度控制方法[J]. 吉林大学学报: 工学版, 2021, 51(2): 728-737.
[9] 冯嘉庆, 张蕾, 田冬雨. 基于模糊自适应RBF的机械臂积分滑模控制方法[J]. 西北工业大学学报, 2024, 42(6): 1099-1110.
[10] 浦玉学, 古妍, 张崇峰, 等. 柔性机械臂干扰力观测与无模型振动控制[J]. 振动工程学报, 2024, 37(10): 1783-1791.
[11] 李小彭, 付嘉兴, 刘海龙, 等. 柔性空间机械臂RBF神经网络补偿滑模控制策略[J]. 东北大学学报(自然科学版), 2024, 45(9): 1258-1267.
[12] 苟鑫攀, 杨浩, 宋海鹰, 等. 一种基于奇异摄动理论的鲁棒自适应非仿射非线性控制方法[J]. 系统科学与数学, 2023, 43(11): 2820-2835.
[13] 张茜, 王平. 激光传感自适应的装配式建筑机器人轨迹规划[J]. 光学技术, 2024, 50(5): 598-605.
[14] 欧宝铭. 基于李雅普诺夫稳定性理论的pH非线性过程控制方法研究[D]: [硕士学位论文]. 北京: 北京化工大学, 2023.
[15] 庞伟杰. 液压机械臂模型的非线性振动特性研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工程大学, 2023.
[16] 林君哲. 航空发动机液压管路-卡箍系统的非线性振动特性研究[D]: [博士学位论文]. 沈阳: 东北大学, 2018.