1. 引言
人机交互的应用越来越广泛,例如在工业、演示和医疗康复领域[1] [2]。人机交互要求机器人能够对人的力做出响应[3]。因此,机器人需要更加人性化。为了实现人性化的交互,已经使用了各种可变阻抗控制方法来提高顺应性。在人机交互中,为了使机器人具有柔顺性,机器人的机械臂在交互过程中需要屈服于外部环境。在此基础上,有学者提出了基于速度的变阻抗自适应交互控制方法,根据力的误差来调整阻尼参数[4] [5]。Li团队[6] [7]根据机器人与人、环境之间的相互作用力和速度在线调整阻尼参数,保证系统的稳定性,使机器人与人、环境之间的交互更加柔顺。然而,上述变阻抗控制方法仅改变阻尼系数而保持惯性参数恒定,系统极点会产生右向偏移现象,导致瞬态响应过程的振荡衰减速率显著降低。
在人机交互中,保证机械臂末端位置跟踪的准确性至关重要。Gong等人[8]提出了一种结合基于能动性控制和阻抗控制的鲁棒控制方案,将挖掘机的耦合非线性动力学转化为开环港哈密顿模型,设计了改进的鲁棒扰动观测器,增强了液压挖掘机轨迹跟踪控制的鲁棒性。Foroutannia等人[9]提出了一种自适应模糊阻抗控制器和卷积神经网络结合的方法,实现机器人的期望轨迹跟踪。Kong的团队[10]、Sun的团队[11]与Jiang的团队[12]采用自适应阻抗控制来应对不确定性和外部干扰,但未考虑人机交互中的柔顺性问题。高鼎峰等人[13]设计了一种固定时间稳定的阻抗控制器,以实现障碍环境下空间机器人的柔顺控制。所设计的固定时间阻抗控制器可以实现机械臂良好的位置跟踪。然而,文献[8]-[13]不仅无法确保速度在可接受的范围内,同时不能确保人机交互环境中的顺应性[14]。
为了实现人机交互的柔顺性,力信号的采集至关重要。Huang等人[15]提出了一种刚度系数随机器人末端执行器位置变化的自适应阻抗控制方法,该方法将机器人的操作空间限制在一定的范围内,对操作者的顺应性较好。Huang等人[16]基于Q学习算法的自适应阻抗控制器,实现了阻抗自适应,保证了在人体肢体动力学完全未知的情况下,阻抗参数收敛于最优值。Xu等人[17]设计了一种利用参考轨迹学习的自适应阻抗控制,以实现位置误差和相互作用力的收敛。然而,参考文献[15]-[17]的所有系统需要力传感器,并假设力传感器是没有噪声的理想组件,这增加了系统的复杂性[18]。朱敬花等人[19]基于牛顿–欧拉法构建了机械臂由外向内的递归参数辨识方法,并运用位置阻抗控制原理对期望轨迹予以修正,进而设计出适用于参数不确定条件的非奇异终端滑模控制策略。虽然采用了无传感器技术,但是当遭遇更为复杂的动态环境,或是面临更高的控制精度需求时,需对其控制策略进行进一步的优化与完善,以提升其适应性。
为解决人机交互中轨迹跟踪精度与操作柔顺性的矛盾关系,本研究建立了免传感器的阻抗参数动态调节机制。本文的主要贡献如下:1) 结合交互力与速度,在线调整阻抗,以确保机器人能有效顺应人类的操作行为。2) 设计了一种补偿力替代变阻抗控制中的力传感器。
2. 无传感器技术的变阻抗控制的设计
2.1. 变阻抗控制的设计
在本节中,为了控制同一框架内的力和位置,设计了可变阻抗控制。然后根据力的变化调整阻抗参数,以保证机器人的顺应性和安全性。
机器人末端执行器的阻抗模型[20]为:
(1)
其中,
和
分别为质量、阻尼和刚度。
和
分别是位置、速度和加速度。
和
分别是期望的位置、速度和加速度。
是人机交互力,通过第2.1节中设计的补偿模型进行重构替代,突破传统力传感器测量局限。
由于机器人在所有方向上解耦,等式(1)可以用小写符号重写为:
(2)
其中,
和
分别为单方向质量和阻尼,
为单方向上人机交互力。则(2)的拉普拉斯变化为:
(3)
其中,
和
分别为
和
的拉普拉斯变换。
是拉普拉斯变量。式(3)可视为一阶系统,以驱动力为输入,速度为输出,其传递函数可表示为:
(4)
其中,
是传递函数。由(4)可知,质量
影响状态的稳定性,质量和阻尼之比
影响系统的极点。当机器人与人交互时,阻抗参数(质量和阻尼)较大,机器人将更适合精确运动,因此需要更大的力来控制机器人。反之,阻抗参数越小,机器人越适合快速运动,因此,移动机器人所需的力越小。
根据以上分析,需要调整阻抗参数来控制机器人在不同的运动条件下,使机器人能够顺应人类的操作。为此,变阻抗是一种有效的方法。当人想要进行精确的运动时,阻抗参数需要调整得更高。相反,当人体想要进行加速运动时,则需要将阻抗参数调低。因此,阻抗参数是由人的意图来调整的。一般来说,人的意图可以分为三种模式,即加速、停止或逆转方向。由于反方向可以看作是停止后反方向的加速度,所以我们只需要关注加速度和停止。如果要进行加速运动,力的方向和速度应该是相同的;同时,阻抗参数要低。相反,如果要停止,力和速度的方向应该相反;同时,阻抗参数要高。
阻抗参数的变化取决于人的意图,即人需要加速时,阻尼减小。反之,人需要减速时,阻尼增加。因此,阻尼参数的调整策略如下:
(5)
其中,
为默认阻尼,
和
为可调正常数。
为人机交互力的补偿力,将在第二节中详细设计。
由传递函数(4)可知,单一调节阻尼系数将引起极点右移,导致瞬态过程延长。为此建立质量–阻尼协同调节机制,保持
比值恒定,以稳定极点位置。具体实施策略为:加速阶段同步降低质量与阻尼参数,减速阶段则按比例提升二者数值。因此,质量调整如下:
(6)
为质量的默认值。由于在式(5)和式(6)中得到了质量
和阻尼
的调整方法。因此,将
和
代入式(2)中,得到期望位置和期望速度,这将在第二节中被使用。
2.2. 集成控制器的设计
接下来,将设计一个速度控制器来保证速度的稳定性,并设计一个补偿力来代替第一节(5)中的相互作用力来调节阻抗并补偿相互作用力。然后,设计了基于速度控制器和补偿力的集成控制器。
机器人的动力学为[21]:
(7)
其中,
、
和
分别为惯性矩阵、科里奥利项和离心项以及重力力矩。
为控制力矩,
为人机交互力矩。
、
和
分别对应关节空间的位置、速度和加速度参数。
式(7)在笛卡尔空间可改写为:
(8)
其中,
、
和
分别是末端执行器的空间位置、速度和加速度。
为笛卡尔空间中的矩阵,
是笛卡尔空间中的科里奥利项,
是重力。
为雅克比矩阵,
和
分别是雅可比矩阵的伪逆和雅可比矩阵专职的伪逆。
为控制力,
为人机接触力。
人–机器人相互作用力动力学模型[22]为:
(9)
其中,
为正常数,
为人的前馈力,
是人手的阻尼,
为人手的刚度。
和
分别为位置误差和速度误差。参考速度
定义为:
(10)
其中,
为一个常数因子,参考速度
由第一节期望速度
和位置误差
来设计的。则得到末端执行器速度
与参考速度
之间的误差为:
(11)
为保证速度的稳定性,速度控制器可以设计为:
(12)
其中,
和
均是正常数,
为指数收敛因子,
、
和
分别为机器人的参考位置、速度和加速度。速度控制器(12)由两部分组成。第一部分
表示机器人的动力学特性,第二部分
用于补偿参考速度误差。
注意到人与机器人之间存在一种相互作用力。因此,如果仅考虑速度控制而不补偿相互作用力,系统会是不稳定的或无法达到理想控制效果。补偿力设计为:
(13)
式中,
为人机交互力的补偿力,
、
和
分别为
、
和
的估计值。
在人机交互中,力信号的获取是必不可少的。然而,力传感器通常会产生测量噪声,引起控制效果。考虑倒力传感器的不完全性,利用轨迹的力来补偿相互作用力,使机器人末端执行器的速度更加稳定。
结合式(8)、(12)和(13),可以得到:
(14)
其中,
,
和
分别表示操作者前馈力、刚度及阻尼的估计误差。
基于式(13)的补偿模型,构建参数自适应更新律为:
15)
其中,
、
和
为正定矩阵,
,
为正常数,
为正常数。
在
、
和
的自适应律(15)中
,当速度误差
变大时,
变小,反之亦然。
使
对速度误差变化敏感,加快响应速度误差改变,
避免
变化过于剧烈,保障系统稳定。因此,本文中
能更好地稳定补偿力。
结合速度控制器(12)和补偿力控制器(13),设计了基于速度控制器和补偿力的集成控制器:
(16)
与文献[23]相比本文主要关注于通过变阻抗控制来实现机器人的柔顺性。此外,在速度控制器(12)中
加入速度补偿项
,基于速度误差动态变化的非线性调节因子,使控制器对较大速度误差具
有更强的响应,对较小的速度误差更平滑。
3. 稳定性分析
如果机器人(8)由速度控制器(12)和补偿力控制器(13)组成的具有自适应律(15)的集成控制器(16)控制,则可以保证系统的稳定性和速度误差的有界性。
证明:为确保闭环系统的全局稳定性,需构造一个Lyapunov函数,其应同时包含速度跟踪误差和补偿力估计误差。为此,定义Lyapunov函数为:
(17)
其中有:
(18)
表征速度误差的能量项,反映机械臂末端速度跟踪的动态特性。
(19)
其中
代表矩阵的迹,
与补偿力误差的能量项有关,目的是分析补偿力误差是否能够收敛,保证补偿力的稳定性。
的组合形式能够同时约束动力学误差与参数估计误差,符合能量耗散原理,是典型的一类Lyapunov候选函数。式(18)的微分为:
(20)
将(15)代入(20),根据机器人动力学特性
的斜对称性,可得
[24]。再结合式(14)的闭环动力学方程,进一步展开可以得到:
(21)
式(19)的微分为:
(22)
其中,
为时间常数,
、
和
分别为延迟
秒的
、
和
的值。
现定义
,则可以得到:
(23)
将自适应律(15)代入式(23):
(24)
同样,对于式(22)中第二项,即:,可以得到:
(25)
对于式(22)中第三项,可得到:
(26)
接下来,定义
,
,
。其中,
为
的估计,
为延迟
秒的
的值。其中,
代表列向量运算符,假设
,则
。
由式(22)~(26)可得到:
(27)
其中,
,
代表单位矩阵,
代表对角矩阵。假设
,
,则
。
将式(21)代入式(27):
(28)
时,充分条件如下:
(29)
由于
、
和
均为正常数,根据式(29),
和
的界为:
(30)
其中,
,
和
。
从上述分析中可以看出,则
在以下趋于:
(31)
由式(30)可知,速度误差
收敛,有界为
。补偿力误差
有界为
。由于
,保证了系统的总能量不断减少,从而确保误差不会增大。同时,式(15)自适应律中的
随着速度误差变化进行自适应调节,这保证了补偿力误差不会持续增大,而是被调节到一个稳定的范围。
4. 仿真实验分析
本节中给出仿真实验,以验证所提出方法的有效性。考虑如图1所示的两连杆刚性机器。
Figure 1. Two-link robot manipulator
图1. 双连杆机器人机械臂
其机器人的动力学如下:
,
,
,
,
其中,
和
分别为关节1与关节2的关节角度,
和
分别为关节1和关节2的长度。
,
和
。期望轨迹
(单位为
)设置为:
和
分别是
方向和
方向上的交互力,
,默认阻尼为
,默认质量为
。其他相关参数设置见表1所示。
Table 1. Relative parameters
表1. 相关参数
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
图2为阻抗控制下的交互力与轨迹跟踪效果,图3为本文方法下的补偿力与位置跟踪。图2中的交互力为传统阻抗控制下机械臂末端的交互力,图3中的补偿力为本文方法下的机械臂末端的补偿力。从中可知,在X方向上和Y方向上,本文方法的补偿力与交互力的变化趋势保持一致性。验证了无传感器方案的可行性。因此,实施时需确保补偿力矢量方向与实际交互力吻合,幅值允许存在适度偏差。
图2 (传统阻抗控制)和图3 (本文方法)分别示出了x方向和y方向上的期望位置和实际位置。通过人的意图获得期望的位置。由图2和图3可知,机器人可以在x方向上跟踪期望的位置。只有在交互力发生突变的瞬间,才会出现位置误差。由图3可知,在交互力突变时刻(
),机器人末端实际轨迹可以在突然变化后快速跟踪所需位置。在x方向和y方向上的轨迹跟踪误差在图4和图5中示出。
Figure 2. Interaction force and position tracking under impedance control
图2. 阻抗控制下交互力与位置跟踪
Figure 3. Compensation force and position tracking under the proposed method
图3. 本文方法下的补偿力与位置跟踪
如图4与图5分别展示了X与Y方向上的轨迹跟踪误差动态响应。通过对比可得到以下结论:
在X方向上,传统阻抗控制中,在突加交互力阶段(
),期望轨迹与实际轨迹误差峰值达到0.3359 m,且稳态阶段(
)误差持续波动。这表明单一阻尼调节导致系统极点右移,引发振荡衰减速率降低。本文方法轨迹误差峰值显著降低至0.08 m。误差曲线的平滑性提升(见图5所示)验证了式(12)的速度补偿机制,通过动态调整参考速度误差,有效抑制了交互力引起的超调。
在Y方向上,传统阻抗控制方法的动态跟踪过程中,误差峰值为0.3 m (
),误差波动显著。本文所提方法的稳态误差稳定在0.02 m。误差的快速收敛(见图5所示)表明力补偿机制(式(13))通过模型估计替代直接测量,有效抵消了低频环境扰动。
Figure 4. Trajectory tracking error in the X and Y directions under impedance control
图4. 阻抗控制下X与Y方向上的轨迹跟踪误差
Figure 5. Trajectory tracking error in the X and Y directions under the proposed method
图5. 本文方法下X与Y方向上的轨迹跟踪误差
图6 (传统阻抗控制)与图7 (本文方法)展示了X与Y方向上的力矩跟踪性能,进一步验证了无传感器方案的有效性:
X方向上力矩(图6传统阻抗控制方法的
与图7本文方法的
):传统阻抗控制方法的力矩响应呈现显著波动(峰值22.5 N∙m)。在突加交互力阶段(
),力矩维持震荡,表明单一阻尼调节导致能量过冲与极点不稳定。本文方法中的力矩动态响应更加平滑(见图7)。这一优化归因于质量–阻尼保持
比值恒定,从而稳定系统极点位置,避免振荡发散。
Y方向上力矩:传统阻抗控制方法的力矩稳态误差为2.1 N∙m,本文方法中力矩稳态误差为1.1 N∙m。补偿力机制通过自适应更新律(见式15所示)在线估计交互力,避免了传感器噪声的直接引入。
Figure 6. Torque in the X and Y directions under impedance control
图6. 阻抗控制下X与Y方向上的力矩
Figure 7. Torque in the X and Y directions under the proposed method
图7. 本文方法下X与Y方向上的力矩
实验数据揭示了误差与力矩的动态耦合关系:
瞬态阶段的协同抑制:在突加交互力阶段(
),传统方法中力矩的剧烈波动(见图6)与误差峰值(见图4)直接相关,表明能量过冲导致跟踪失稳。而本文方法通过速度补偿的动态调整,在误差增大的瞬间同步降低力矩幅值(见图7),实现了误差与力矩的协同抑制。例如,X方向误差峰值0.08 m对应力矩为20 N∙m,较传统方法的误差0.335 m对应的力矩22.5 N∙m有明显抑制。
稳态阶段的优化:本文方法下力矩信号的幅值与波动均显著降低(见图7),与误差的稳态收敛(见图5)形成闭环验证。
根据实验数据可知,增加速度补偿与力补偿之后,X方向上与Y方向上的轨迹跟踪精度均有明显的提升。因此本文所提出的基于无传感器技术的人机交互变阻抗控制方法能够有效提升机械臂末端的轨迹跟踪精度,采用补偿力对力传感器进行替代是可行的。
5. 结语
在人机交互场景下,本研究致力于提升轨迹跟踪性能与拓展无传感器技术在阻抗控制中的应用。研究结果显示,速度补偿机制的引入显著提升了机械臂末端期望轨迹的跟踪效果,使机械臂在期间能更精确地契合期望轨迹,有效抑制了轨迹跟踪中的最大位置误差。与此同时,本研究还探讨了力补偿在无传感器阻抗控制的可行性。传统阻抗控制方法通常依赖力传感器获取外部力信息,但力传感器的使用存在成本高、安装复杂等问题。通过理论分析与实验验证,证实了力补偿可有效模拟力传感器的功能,实现对外部力的估计与补偿。
基金项目
国家重点研发计划资助项目(2020YFC2007502)。