基于GMM与JA的轨迹学习与泛化方法研究

doi:10.12677/mos.2024.135503

期刊菜单

基于GMM与JA的轨迹学习与泛化方法研究
Learning and Generalization of Trajectories Based on GMM and JA

DOI: 10.12677/mos.2024.135503, PDF, HTML, XML,
作者: 杜闯：上海理工大学机械工程学院，上海
关键词: 机器人拆解；轨迹学习；轨迹泛化；高斯混合模型；Jerk Accuracy模型；Robot Disassembly； Trajectory Learning； Trajectory Generalization； Gaussian Mixture Model (GMM)； Jerk Accuracy (JA) Model

摘要: 本文针对机器人拆解任务中路径起点或终点发生变化时重定位时间成本高、编程效率低的问题，提出一种基于高斯混合模型(GMM)与Jerk Accuracy模型(JA)的轨迹学习与泛化方法。首先，通过高斯混合模型和高斯混合回归获得最优示教轨迹，然后引入JA模型，从优化角度生成具有泛化能力的复现轨迹，实现任务位置约束下起点或终点轨迹的泛化。最后，设计仿真实验对所提出方法进行验证。结果表明：该方法有效解决了上述问题，相较于传统的GMM-DMP方法，实验结果显示泛化轨迹与示教轨迹的相似性有了明显提高，验证了所提方法的有效性。

Abstract: To address the issues of high relocation time costs and low programming efficiency in scenarios where the start or end points of paths change in robotic disassembly tasks, this study proposes a trajectory learning and generalization method based on Gaussian Mixture Model (GMM) and Jerk Accuracy (JA) model. Firstly, the optimal demonstration trajectory is obtained through the Gaussian Mixture Model and Gaussian Mixture Regression. The JA model is then introduced to optimize and generate reproduction trajectories with generalization capabilities, allowing for trajectory generalization under task position constraints at the start or end points. Finally, a simulation is designed to validate the proposed method. The results demonstrate that this method effectively solves the aforementioned issues, significantly improving the similarity between the experiment trajectories and the demonstration trajectories compared to traditional GMM-DMP trajectories, thus verifying the method’s effectiveness.

文章引用：杜闯. 基于GMM与JA的轨迹学习与泛化方法研究[J]. 建模与仿真, 2024, 13(5): 5558-5565. https://doi.org/10.12677/mos.2024.135503

1. 引言

随着科学技术的不断发展，尤其是机器人技术的飞速进步，传统编程方式(如示教器编程、离线编程) [1]已无法满足效率和通用性要求。研究机器人如何减少编程时间和自主适应环境变化的问题变得十分必要。

机器人编程大致可分为传统编程[2]和示教学习[3]两类。传统编程能够预设动作，指令机器人完成任务，但对操作人员的专业知识要求较高，且不易更改。而示教学习不仅能完成预定动作，还能动态适应不同工作环境或场景。示教学习通常从单个或少量示教轨迹中提取运动特征，并在新场景下复现这些特征[4]。冯等[5]人开发了基于GMM/GMR模仿学习方法，用于装配任务的学习，GMM/GMR能够对多个人类示教轨迹进行编码，并通过回归获得广义的运动轨迹。然而，回归路径存在多个冗余转弯，且不能泛化到新的目标点位置。为了应对任务起点或终点的显著变化，Ti等[6]人开发了一种结合DMP和GMM/GMR的方法，使回归路径平滑并泛化到新目标。Li等[7]人采用GMM进行数据分类和拆解技能表征，通过GMR进行数据回归拟合，再使用DMP泛化到新目标，从而实现不同终点的机器人拆解路径学习。然而，这些方法在复现过程中仍存在示教轨迹形状特征遭到破坏、与原始示教轨迹相似性不高的问题。

为了解决上述问题，提出一种基于GMM和JA的轨迹学习与泛化方法。首先通过高斯混合模型以及高斯混合回归获得最优的示教轨迹，引入JA模型[8]从优化角度学习生成具有一定泛化能力的复现轨迹，实现任务位置约束下的起点或终点的轨迹泛化，最后，设计仿真实验对所提方法进行验证。结果表明，该方法有效解决了上述问题，相较于传统的GMM-DMP方法，泛化轨迹与示教轨迹的相似性显著提高，验证了所提方法的有效性。

2. 方法

2.1. 高斯混合回归模型

高斯混合模型(GMM)是多个高斯分布乘以对应权重线性组合而成的模型。

其概率密度函数如下：

$P_{GMM} (x) = \sum_{i = 1}^{K} ω_{i} N_{i} (x_{j} / μ_{i}, Σ_{i})$ (1)

其中，单个高斯分布的概率密度函数为：

$\begin{matrix} N_{i} (x_{j} / μ_{i}, Σ_{i}) = \frac{1}{{(2 π)}^{\frac{D}{2}} {| Σ_{i} |}^{\frac{1}{2}}} {exp}^{(- \frac{1}{2} {(x - μ_{i})}^{T} Σ_{i}^{- 1} (x - μ_{i}))} \end{matrix}$ (2)

其中 $x = [x_{1}, x_{2}, \dots, x_{m}]$ 为输入示教数据点集合，K为高斯簇个数， $ω_{i}$ 为第i个高斯分布的权重系数， $μ_{i}$ 为第i个高斯分布的均值向量， $Σ_{i}$ 为第i个高斯分布的协方差矩阵，D为数据点的维度，根据数据初始化高斯混合模型参数 $(ω_{i}, μ_{i}, Σ_{i})$ ，通过E步和M步的迭代。

E-步：计算每个样本属于每个高斯分布的后验概率：

$\begin{matrix} γ_{j i} : γ_{j i} = ω_{i} \cdot N_{i} (x_{j} / μ_{i}, Σ_{i}) \sum_{k = 1}^{K} ω_{k} \cdot N_{k} (x_{j} / μ_{i}, Σ_{k}) \end{matrix}$ (3)

M-步：根据E-步计算得到的后验概率更新模型参数：

$\begin{array}{l} 根据 E 一步计算 (ω_{i}, μ_{i}, Σ_{i}) : \\ ω_{i} = \frac{1}{m} \sum_{j = 1}^{m} γ_{j i} \\ μ_{i} = \frac{\sum_{j = 1}^{m} γ_{j i} x_{j}}{\sum_{j = 1}^{m} γ_{j i}} \\ Σ_{i} = \frac{\sum_{j = 1}^{m} γ_{j i} (x_{j} - μ_{i}) \cdot {(x_{j} - μ_{i})}^{T}}{\sum_{j = 1}^{m} γ_{j i}} \end{array}$

重复进行E-步和M-步，直到模型参数收敛或达到预定的迭代次数。

高斯混合回归(GMR)在处理高维数据上表现出更好的稳健性。GMR通过构建GMM，并推导出每个高斯分布的条件概率密度和回归函数，从而建立回归模型，实现对复杂数据的回归拟合，其联合概率密度函数：

$P (t, x) = \sum_{i = 1}^{K} ω_{i} N_{i} (x / t_{}; μ_{i} (t), c o v_{i}) N_{i} (t / μ_{i t}, Σ_{i t})$ (4)

其中：

$\begin{array}{l} m_{i} (t) = μ_{i}^{[x]} + Σ_{i t}^{t x} {(Σ_{i t}^{x x})}^{- 1} (t - μ_{i t}), \\ c o v_{i} = Σ_{i t}^{x x} - Σ_{i t}^{t x} {(Σ_{i t}^{x x})}^{- 1} Σ_{i t}^{x t} \end{array}$

条件概率密度和回归函数为：

$\begin{matrix} P ({x / t}_{}) = \sum_{i = 1}^{K} α_{i} (t) \cdot N_{i} ({x / t}_{}; m_{i} (t), c o v_{i}) \end{matrix}$ (5)

$\begin{matrix} α_{i} (t) = \frac{ω_{i} \cdot N_{i} (t / μ_{i t}, Σ_{i t})}{\sum_{k = 1}^{K} ω_{k} \cdot N_{k} (t_{} / μ_{k t}, Σ_{k t})} \end{matrix}$ (6)

最终高斯混合回归的表达式为：

$\begin{matrix} f (x) = E [P (x / t)] = \sum_{i = 1}^{K} α_{i} (t) \cdot m_{i} (t) \end{matrix}$ (7)

2.2. 平滑度与准确性模型(Jerk Accuracy Model，JA模型)

针对高斯混合模型在处理不同终点或变化轨迹时泛化能力不足的问题，JA模型通过优化生成的轨迹，提高了其平滑度和几何不变性，从而增强了泛化能力，使生成的轨迹能更好地适应不同的终点位置，提供有效的轨迹预测和生成。JA模型的优化目标是找到一个再现轨迹 $X_{r} (t)$ ，使其在平滑性和准确性之间达到平衡。优化目标函数的形式如下：

$\begin{matrix} min_{X_{r} (t)} I (x, T, λ) = \int_{0}^{T} {‖ \frac{d^{3} x_{r} (t)}{d t^{3}} ‖}^{2} d t + λ \int_{0}^{T} {| x_{r} (t) - x (t) |}^{2} d t \end{matrix}$ (8)

其中 $x_{r} (t)$ 为再现轨迹，表示在时间t处的轨迹值， $x (t)$ 为示范轨迹，表示在时间t处的轨迹值， $\frac{d^{3} x_{r} (t)}{d t^{3}}$

为生成轨迹 $x_{r}$ 的三阶导数，即加加速度(jerk)，表示轨迹的平滑程度。 ${| x_{r} (t) - x (t) |}^{2}$ 为再现轨迹与示范轨迹之间的误差， $λ$ 为平滑度与准确性之间的权重参数，T为时间步长度。

约束条件：

起点条件：生成轨迹 $x_{r}$ 在 $t = 0$ 处的值、速度和加速度必须与参考轨迹x在起点处的一致。

$x_{r} (0) = x (0)$

$\frac{d x_{r}}{d t} (0) = \frac{d x}{d t} (0)$

$\begin{array}{r} \frac{d^{2} x_{r}}{d t^{2}} (0) = \frac{d^{2} x}{d t^{2}} (0) \end{array}$

终点条件：生成轨迹 $x_{r}$ 在 $t = T$ 处的值、速度和加速度必须与参考轨迹x在终点处的一致，

$x_{r} (T) = x_{end} (T)$

$\frac{d x_{r}}{d t} (T) = \frac{d x}{d t} (T)$

$\frac{d^{2} x_{r}}{d t^{2}} (T) = \frac{d^{2} x}{d t^{2}} (T)$

$x_{end}$ 表示目标点，可以设置不同的目标点来泛化到不同的位置，JA模型的优化问题可以视为一个边值问题(Boundary Value Problem, BVP)，来解这个边值问题，从而得到最优轨迹 $x_{r}$ 。

3. 实验验证

本文通过手写体字母轨迹复现泛化对比实验以及在仿真环境中进行拆解减速器上螺丝的泛化实验来验证所提方法的有效性。

3.1. 验证评价指标

为了直观地量化实验结果，验证轨迹学习与泛化实验中所生成的学习轨迹与示教轨迹的相似性，提出使用均方根误差(Mean Squared Error, MSE)和动态时间规整DTW [9]来作为验证效果的评价指标，均方误差的公式如下：

$\begin{matrix} MSE = \frac{1}{n} \sum_{i = 1}^{n} {(x_{i} - {\hat{x}}_{i})}^{2} \end{matrix}$ (9)

其中：n是样本的数量， $x_{i}$ 是第i个样本的真实值， ${\hat{x}}_{i}$ 是第i个样本的预测值。均方误差计算的是所有样本中预测值与真实值之间的平方差的平均值。均方误差越小，表示模型的预测值与真实值之间的差距越小，模型的性能越好。

动态时间规整(DTW)公式如下：

$\begin{matrix} DTW (X, Y) = C (n, m) \end{matrix}$ (10)

$\begin{matrix} d (i, j) = {(x_{i} - y_{j})}^{2} \end{matrix}$ (11)

$\begin{matrix} C (i, j) = d (i, j) + \min (C (i - 1, j), C (i, j - 1), C (i - 1, j - 1)) \end{matrix}$ (12)

其中，两时间序列为 $X = (x_{1}, x_{2}, \dots, x_{n})$ 和 $Y = (y_{1}, y_{2}, \dots, y_{m})$ ， $d (i, j)$ 表示 $x_{i}$ 和 $y_{j}$ 之间的距离， $C (i, j)$ 表示从 $(1, 1)$ 到 $(i, j)$ 的最小累积距离，通过动态规划计算两个序列之间的最小累积对齐距离 $DTW (X, Y)$ ，数值越接近0，则轨迹相似性越高。

3.2. 手写字母轨迹学习实验

为了验证基于GMM和JA的轨迹学习与泛化方法有效性，本节使用公共数据集[10]中字母G的5条轨迹进行轨迹学习和泛化实验。实验结果如图1所示，使用GMM和GMR对演示(灰色曲线)进行建模，然后设置泛化的目标点从(0, 0)到(0, 2)，使用JA进行泛化，再现的轨迹准确地泛化到了(0, 2)，并保留了演示的特性。与GMM-DMP方法相比，GMM-DMP方法结果如图2所示。使用RMSE (均方根误差)、DTW (动态时间规整)来估计泛化精度，值GMM-JA计算为1.535 mm、2.401 mm，值GMM-DMP计算为5.132 mm、6.302 mm，结果表明GMM-JA方法在与示教轨迹的相似度方面显著优于GMM-DMP方法。

Figure 1. G-trajectory learning and generalization based on GMM-JA

图1. 基于GMM-JA的G轨迹学习与泛化

Figure 2. G-trajectory learning and generalization based on GMM-DMP

图2. 基于GMM-DMP的G轨迹学习与泛化

3.3. 螺丝拆解实验

为验证该算法在实际应用中的可靠性，进行仿真场景机器人拆解减速器上的螺丝实验。本文使用的机器人操作平台主要由UR5协作机器人、控制器、型材工作台、螺丝拆解电批以及外部PC操作终端等部分组成，如图3所示，首先拆解减速器上端盖的螺丝是第一步，减速器上端盖有四个螺丝，根据拆解点位1的黑色示教轨迹，需要泛化到拆解点位2、3、4，这样无需重新拖动机器人获取新的示教路径，重新定位。

Figure 3. Robotic arm disassembly screw workstation

图3. 机械臂拆解螺丝工作平台

首先拖动虚拟UR5机械臂末端进行引导示教，获取的3维坐标数据作为散点形式的示教数据，再对其进行预处理优化，得到原始的示教轨迹数据。然后对采集的6条末端轨迹并进行GMM聚类，GMR回归，得到最优的示教轨迹，效果如图4所示。

Figure 4. Disassembly screw trajectory learning based on GMM-GMR

图4. GMM-GMR拆解螺丝轨迹学习

为了验证基于GMM-JA的轨迹学习与泛化方法比传统GMM-DMP的方法与示教轨迹的相似性更高，设计了从拆解轨迹点位1到拆解点位2、3、4的泛化轨迹实验，实验效果如图5、6所示，两种实验方法均实现了泛化到达目标终点，而图5基于GMM-JA算法所得的轨迹更为接近示教轨迹形状。

Figure 5. Disassembly screw generalization based on GMM-JA

图5. 基于GMM-JA拆解螺丝泛化轨迹

Figure 6. Disassembly screw generalization based on GMM-DMP

图6. 基于GMM-DMP拆解螺丝泛化轨迹

为验证两种方法所生成轨迹与示教轨迹的相似性，本文使用RMSE和DTW评价指标进行评估，如表1所示。

Table 1. Evaluation of disassembly screw trajectory similarity

表1. 拆解螺丝轨迹相似度评估

	GMM-JA			GMM-DMP
	拆解位2	拆解位3	拆解位4	拆解位2	拆解位3	拆解位4
RMSE	1591.18	697.39	2278.05	3316.03	1931.04	4213.55
DTW	980.73	653.76	986.58	5865.17	3238.62	5522.25

结合表1中数据能够更为直观地看出，基于GMM-JA的算法所得到的泛化轨迹与示教轨迹的相似性更高。

4. 结论

本文提出的基于GMM和JA的轨迹学习与泛化方法，在手写字母轨迹和机器人螺丝拆解仿真实验中表现出色。与传统的GMM-DMP方法相比，该方法显著提高了泛化轨迹与示教轨迹的相似性，并增强了轨迹的泛化能力，有效解决了机器人任务位置变化时的重定位和编程效率低问题，验证了所提方法的有效性。

参考文献

[1]	李国静, 林连宗. 工业机器人轨迹工作站离线编程[J]. 信息与电脑(理论版), 2024, 36(9): 22-24.
[2]	赵罡, 魏德民, 肖文磊. 面向机器人离线示教编程的并联测量平台[J]. 机械设计与制造, 2020(10): 248-252.
[3]	曲威名, 刘天林, 林惟凯, 等. 机器人学习方法综述[J]. 北京大学学报(自然科学版), 2023, 59(6): 1069-1086.
[4]	赵月. 基于GMM的协作机器人动力学参数辨识和示教学习研究[D]: [硕士学位论文]. 哈尔滨: 东北林业大学, 2023.
[5]	冯浩宇, 万小金. 机器人双轴孔装配策略建立与分析[J]. 武汉理工大学学报, 2024, 46(3): 148-155.
[6]	Ti, B., Gao, Y., Li, Q. and Zhao, J. (2019) Dynamic Movement Primitives for Movement Generation Using GMM-GMR Analytical Method. 2019 IEEE 2nd International Conference on Information and Computer Technologies, Kahului, 14-17 March 2019, 250-254. [Google Scholar] [CrossRef]
[7]	Li, F., Bai, Y., Zhao, M., Fu, T., Men, Y. and Song, R. (2023) Research on Robot Screwing Skill Method Based on Demonstration Learning. Sensors, 24, Article 21. [Google Scholar] [CrossRef] [PubMed]
[8]	Meirovitch, Y., Bennequin, D. and Flash, T. (2016) Geometrical Invariance and Smoothness Maximization for Task-Space Movement Generation. IEEE Transactions on Robotics, 32, 837-853. [Google Scholar] [CrossRef]
[9]	郭岩, 罗珞珈, 汪洋, 等. 一种基于DTW改进的轨迹相似度算法[J]. 国外电子测量技术, 2016, 35(9): 66-71.
[10]	Pignat, E. and Calinon, S. (2017) Learning Adaptive Dressing Assistance from Human Demonstration. Robotics and Autonomous Systems, 93, 61-75. [Google Scholar] [CrossRef]

为你推荐

友情链接