1. 引言
空间在轨服务(On-Orbit Servicing, OOS)与空间碎片清理(Space Debris Removal, SDR)是未来航天领域的重要任务,其中目标捕获与动力学预测是保障任务顺利执行的关键环节。电磁吸附作为一种非接触式捕获方式,凭借其无需推进剂消耗、对目标表面无损伤以及可重复使用等优势,逐渐成为研究热点。然而,电磁吸附过程涉及多物理场耦合,包括电磁场作用与刚体动力学的相互影响,其结果不仅依赖于目标的质量、速度、电流强度,还受到初始位置偏移和姿态等因素的显著影响。因此,如何在多变量条件下快速、准确地预测刚体的动力学行为,是电磁吸附研究中的核心问题[1]。
现有研究主要依赖多物理场仿真工具(如Ansys Motion与Maxwell联合仿真)来建模电磁吸附过程。这类方法能够提供高精度的力学与电磁数据,但其计算代价极高,难以在大规模参数扫描或实时决策中推广。为此,近年来学者们尝试引入机器学习模型[2] (如多层感知机MLP、长短期记忆网络LSTM等)对仿真数据进行替代建模[3]。尽管这些纯数据驱动方法在已知条件下能够快速拟合轨迹,但由于缺乏物理约束,其在未见参数组合下的预测性能显著下降,容易出现轨迹偏差或物理不一致的问题。
物理信息神经网络(Physics-Informed Neural Network, PINN)通过在神经网络训练中引入物理方程残差,将数据驱动学习与物理建模有机结合,近年来已在流体力学、结构力学、轨迹优化等领域取得良好应用。与传统方法相比,PINN既能利用已有仿真数据提高预测精度,又能通过动力学方程约束增强模型的物理一致性和跨条件泛化能力[4]。因此,将PINN应用于空间电磁吸附动力学预测,有望同时解决“仿真代价高昂”和“数据驱动模型泛化不足”的问题[5]。
为此,本文提出一种基于PINN的空间电磁吸附刚体动力学预测方法。
具体而言:
1) 通过Ansys Motion与Maxwell联合仿真,构建了覆盖质量、速度、电流和位置偏移四类变量的1200组动力学数据集。
2) 在PINN框架中引入刚体动力学方程与电磁力矩模型,作为物理约束提升模型的一致性与稳定性。
3) 在实验中对比了PINN与MLP、LSTM等传统数据驱动方法,结果表明PINN在位置、速度、角速度等关键指标上的预测精度更高,并在未见过的参数组合下保持良好泛化能力。本文的研究为空间电磁吸附建模与预测提供了一种高效、可靠的新思路,可为在轨服务与碎片清理任务的决策与控制提供支持。
2. 背景与理论基础
2.1. 刚体动力学方程及电磁吸附的力学建模
在电磁吸附过程中,目标物体可视为自由漂浮的刚体,其动力学行为可由牛顿–欧拉方程描述。平动部分为
(1)
其中,x表示物体质心位置,v为速度,m为质量,Fext为外力。在本研究中,外力主要为电磁吸引力。转动部分由刚体转动方程组描述。刚体姿态随时间的演化遵循四元数运动学方程,其次,角速度的变化遵循欧拉动力学方程:
(2)
其中,
为角速度,J为惯性张量,
为外力矩,q为描述姿态的四元数,
为由角速度构造的反对称矩阵。对于长方体目标,其惯性张量可由质量和几何尺寸计算得到。这些动力学方程为PINN提供了物理约束,用于指导网络在数据稀疏或外推场景下保持预测合理性。
电磁吸附产生的力和力矩主要依赖于电流强度、磁路结构、目标与电磁铁之间的距离及相对姿态。利用Ansys Maxwell可以获得不同参数下的电磁场分布与相应的力学作用。
一般而言,电磁力
可近似表示为电流I和距离d的函数:
(3)
而电磁力矩
则与物体相对于电磁场的不对称性密切相关:
(4)
在本研究中,Maxwell仿真为PINN提供了训练以及测试数据,同时电磁力与力矩的物理特性(随电流单调增加、随距离衰减)也可作为物理先验嵌入网络。
2.2. 物理信息神经网络(PINN)原理
物理信息神经网络(Physics-Informed Neural Network, PINN)的核心思想是利用深度神经网络对物理系统的状态进行近似,并通过自动微分获得时间或空间导数,从而在训练过程中将控制该系统的物理方程作为残差项引入损失函数,与数据监督项共同优化。这样,网络不仅能够拟合已有的数据,还能在数据稀疏或未见参数条件下保持预测的物理合理性[4] [6]。
在本文研究的电磁吸附刚体动力学问题中,神经网络Nθ(t, p)以时间t及参数条件p (如质量、电流、初始偏移量等)为输入输出刚体的状态变量,包括位置x(t)、速度v(t)、姿态q(t)与角速度
。通过自动微分可进一步得到加速度与角加速度。
为了保证预测结果与物理规律一致,PINN在训练中同时最小化以下几类误差:1) 数据误差,保证预测状态与仿真序列的一致性;2) 物理残差误差,由牛顿–欧拉方程构成,用于约束预测的加速度与外力、电磁力矩之间的关系;3) 初始条件误差,确保网络在
时满足已知初值;4) 正则化误差,如保持四元数的单位长度或限制电磁力的物理合理性。综合起来,总损失可表示为:
(5)
其中,
分别为各项的权重。
与纯粹依赖数据驱动的模型相比,PINN通过在损失函数中嵌入物理方程,不仅能提升预测精度,还能在跨质量、电流和偏移等未见条件下保持较强的泛化能力。这一特性使得PINN特别适合用于空间电磁吸附动力学的预测任务。
3. 基于PINN的数据序列预测
3.1. 数据集构建与实验设置
本实验中利用仿真软件Ansys Motion设置被吸附物体动力学部分的质量、初始速度等数据与Maxwell软件实现电磁数据的联合仿真。具体通过在Ansys Motion软件中初始化被吸附物体的质量和相向机械臂末端电磁运动的初始速度以及Maxwell软件中调整电流大小从而产生不同强度的磁力吸附物体。本数据集一共构建了以被吸附物体质量和初始速度以及线圈电流大小为自变量,被吸附物体随时间变化运动的速度、加速度、角速度等因变量1200组仿真数据。如图1所示,图中右边蓝色部分为被吸附物体,左边机械臂末端含带电流的线圈。
Figure 1. Simulation model diagram
图1. 仿真模型图
3.2. 损失函数设计
损失函数的每一部分设计如下所示:
1) 数据一致性项
。
该部分用于约束网络预测结果与仿真数据在位置、速度、加速度、角速度和角加速度等观测量上的一致性:
(6)
其中,由自动微分得到。
2) 物理残差项
。
该部分用于确保预测结果满足牛顿–欧拉方程:
(7)
其中
与
分别为电磁力和电磁力矩。
3) 物理残差项
。
为保证网络预测与实际初始状态一致,在每条轨迹的初始时刻施加约束:
(8)
4) 正则化项
。
该部分主要用于保证姿态四元数的单位化约束,并对电磁力与电流、距离之间的物理单调性施加软约束,防止模型学习到不符合物理规律的结果:
(9)
其中Lmono为单调性正则项。
综上所述,PINN的损失函数不仅确保了网络对仿真数据的精确拟合,同时通过物理残差和正则化约束提升了模型在未见参数条件下的泛化能力和物理一致性。
3.3. 网络架构与训练参数设置
为了公平评估不同模型在空间电磁捕获动力学预测中的表现,本文详细规定了PINN、MLP与LSTM的具体网络架构与超参数设置。
3.3.1. PINN网络架构
PINN模型采用全连接深度神经网络结构。输入层输入维度为5,包含时间变量t以及描述工况的参数向量p,包含质量m、初始速度
、电流I和位置偏移
。隐藏层设置了4个隐藏层,每层包含50个神经元。为了保证网络输出关于时间和空间坐标的二阶导数连续(即满足牛顿–欧拉方程的微分要求),除输出层外,所有隐藏层均采用双曲正切函数(tanh)作为激活函数。输出层输出维度为13,对应刚体的状态变量,位置
、线速度
、姿态四元数
以及角速度
。
3.3.2. 对比模型架构(MLP & LSTM)
MLP模型采用与PINN相同的层数与神经元规模4层,每层50单元,但激活函数选用ReLU,且训练损失函数仅包含数据误差项
,不包含物理残差约。
LSTM模型旨在捕捉时间序列特征。网络由2层LSTM单元组成,隐藏状态维度设置为64,后接一个全连接层用于映射最终输出状态。输入序列长度设置为10个时间步。
3.3.3. 训练策略所有模型均基于PyTorch框架实现
优化器采用Adam优化器进行参数更新,利用其自适应矩估计特性加速收敛。学习率在初始学习率设定为1e−3,并采用指数衰减策略,每经过1000个Epoch衰减率为0.9,以确保训练后期的稳定性。权重分配:在PINN的总损失函数中,各部分权重设定为
,以平衡数据拟合与物理约束的贡献。模型在单块NVIDIA RTX 4080 GPU上训练了10,000个Epoch,直至损失函数收敛。
4. 实验与结果分析
实验部分主要涉及基于PINN (物理信息神经网络)的刚体动力学预测,并与传统的MLP和LSTM方法进行了对比。通过Ansys Motion与Maxwell联合仿真,构建了一个包含1200组数据的多变量轨迹数据集,涵盖了不同的质量、电流、速度和偏移量。
4.1. 不同模型对比
PINN模型训练在网络训练中引入了刚体动力学方程和电磁力学模型作为物理约束,以增强网络的物理一致性和泛化能力。对比模型使用了MLP和LSTM作为基准模型,进行相同的数据训练,以验证PINN的优越性。评估模型对刚体六自由度运动的预测能力,表1详细列出了各模型在位置、线速度、姿态(四元数)及角速度上的平均绝对误差(MAE)与均方根误差(RMSE)。
Table 1. Comparison data of different model experiments
表1. 不同模型实验对比数据
模型 |
位置RMSE (mm) |
速度RMSE (mm/s) |
姿态MAE |
角速度RMSE (rad/s) |
PINN |
0.032 |
0.025 |
0.004 |
0.018 |
MLP |
0.098 |
0.104 |
0.028 |
0.072 |
LSTM |
0.076 |
0.086 |
0.012 |
0.045 |
4.2. 速度场回归与轨迹跟踪性能分析
为了验证PINN模型对空间刚体在电磁场中非线性运动的捕捉能力,我们将测试集中的真实速度数据与PINN模型的预测输出进行了回归对比。图X展示了在典型工况下,刚体三轴速度分量Vx,Vy,Vz的拟合曲线。从图中可以看出,刚体在电磁吸附过程中表现出显著的“脉冲式”速度突变特征。这是由于随着距离减小,电磁力呈非线性急剧增大,导致刚体产生极大的瞬时加速度。PINN模型生成的预测曲线(绿色实线)与Ansys Motion仿真生成的真实值(蓝色实线)高度重合,不仅在平稳运动阶段保持一致,更重要的是能够精准复现速度的峰值和拐点。
5. 结论
本文针对空间电磁捕获任务中刚体动力学预测面临的计算成本高与泛化能力弱这一矛盾,提出了一种基于物理信息神经网络(PINN)的建模与预测方法。通过将刚体牛顿–欧拉方程及电磁力学模型作为物理约束嵌入神经网络,实现了数据驱动与物理机理的深度融合。基于1200组Ansys Motion与Maxwell联合仿真数据的验证与分析,本文得出的主要结论如下:
1) 高精度的动力学预测能力,与传统数据驱动方法相比,PINN在关键动力学指标上表现出显著优势。实验数据显示,PINN的位置均方根误差(RMSE)仅为0.032 mm,显著优于MLP的0.098 mm和LSTM的0.076 mm。这表明引入物理约束能有效修正纯数据拟合带来的偏差。
2) 对非线性突变特征的有效捕捉,在电磁吸附末端,物体受到的电磁力随距离减小呈非线性急剧增大,导致速度发生脉冲式突变。PINN模型成功复现了这一高频动态特征(如图2~4所示),其预测的速度曲线峰值与拐点与真实物理仿真高度重合,证明了该方法在处理强非线性物理过程时的鲁棒性。
Figure 2. X-axis velocity prediction curve
图2. X轴速度预测曲线
Figure 3. Y-axis velocity prediction curve
图3. Y轴速度预测曲线
Figure 4. Z-axis velocity prediction curve
图4. Z轴速度预测曲线
3) 优异的泛化性能与物理一致性,在跨质量、电流强度及初始偏移量等未见参数组合的测试中,PINN依然保持了较低的预测误差。物理正则化项的引入不仅约束了四元数的单位化特性,还确保了电磁力预测符合物理单调性规律,避免了传统深度学习模型在数据稀疏区域容易出现的物理违背现象。
基金项目
上海航天科技创新基金,项目编号SAST2023-084。
NOTES
*通讯作者。