1. 引言
航天器电源系统是航天器的“心脏”,为航天器在轨运行提供持续、稳定的电能,其性能的可靠性与稳定性直接关系到航天任务的成败。随着航天技术的飞速发展,航天器任务周期不断延长,功能日益复杂,对电源系统的性能、寿命和可靠性提出了更高的要求[1] [2]。然而,航天器电源系统在极端空间环境(如温度变化、辐射效应、微重力等)下长期运行,其内部组件会发生老化、衰退,导致性能逐渐下降,甚至出现故障[3]。因此,对航天器电源系统进行精确建模,实时监测其健康状态,并预测其性能演变趋势,对于保障航天器安全可靠运行、延长在轨寿命具有极其重要的理论意义和工程应用价值。
传统的航天器电源系统建模方法主要基于物理机理模型,通过建立电池、太阳能电池阵列等组件的电化学或物理方程来描述其工作特性。这类方法虽然具有较高的可解释性,但其建模过程复杂,需要精确的物理参数,且难以准确捕捉系统在复杂工况和长期运行下的非线性、时变以及退化特性[4] [5]。此外,物理模型往往难以适应航天器在轨运行过程中出现的未知扰动和突发故障,导致模型精度和鲁棒性不足[6]。
近年来,随着人工智能和大数据技术的快速发展,数据驱动的建模方法在复杂系统状态监测与故障诊断领域展现出巨大潜力。其中,深度学习,特别是长短期记忆网络(LSTM),因其在处理时间序列数据方面的优势,被广泛应用于设备健康管理[7] [8]、故障预测[9] [10]等领域。LSTM网络能够有效学习时间序列数据中的长期依赖关系,对于航天器电源系统这种具有明显时序特性的数据建模具有天然优势。然而,传统的离线训练LSTM模型在面对航天器电源系统在轨运行过程中不断变化的工作模式和退化特性时,其模型的适应性和泛化能力会受到限制,难以实现对系统状态的实时、精准跟踪。
为了解决模型适应性问题,即时学习(Just-In-Time Learning, JITL)策略[11]应运而生。JITL是一种在线学习范式,它在需要进行预测或决策时,从历史数据中动态选择与当前工况最相似的数据样本,构建或更新局部模型。这种方法能够使模型更好地适应当前的工作状态,提高预测精度。JITL在工业过程控制、故障诊断等领域已取得一定应用[12] [13]。然而,现有的JITL方法在相似度度量、局部模型构建以及模型更新机制方面仍存在改进空间[14],尤其是在处理航天器电源系统这种高维度、强非线性、多源异构数据时,如何有效地结合JITL的在线适应性与LSTM的序列建模能力,并进一步优化其性能,是当前研究面临的挑战。
本研究旨在结合JITL和LSTM的优势,提出一种改进的JITL-LSTM模型,用于航天器电源系统的精确建模与状态预测。通过引入加权相似度度量和自适应更新机制,提升模型在复杂多变工况下的学习效率和预测精度,为航天器电源系统的健康管理提供新的技术途径。
2. 基于加权相似度的改进即时学习策略
传统即时学习(Just-In-Time Learning, JITL)核心思想为“相似输入产生相似输出”[15] [16]。具体而言,JITL首先在庞大的历史数据库中搜索与当前输入数据最相似的样本集,这些样本通常来自相同或类似的运行环境,能够更好地反映当前工况下的系统行为。然后,基于该样本集构建局部模型,用于进行短期预测或实时决策支持。由于该模型仅依赖于当前工况下最相关的数据,因此它能够更加准确地捕捉系统的动态特性,避免了全局模型可能存在的过拟合或欠拟合问题。
本文针对即时学习建模中相似样本的度量原则和局部模型的确定进行研究。在选择局部模型时,不仅要满足过程的动态性能要求,而且要考虑即时建模时的算法运行效率。由于不同的相似性度量方法是从历史样本与当前样本的不同角度来评估相似性,因此会对局部模型的预测性能产生不同的影响。
对于
个样本集
,每个样本
具有
维特征。对于一个新的样本
,当采用即时学习策略选取相似样本集时,首先需要确定相似度的计算方式。假如相似性度量准则为一阶相似度,则相似度
计算公式如下所示:
(1)
式中,
表示相似度权重,
表示夹角,
表示欧式距离。
通常情况下,JILT需要选取若干个相似样本构成相似样本集,用于后续的局部建模或预测任务。
向量近邻(k-vector Nerest Neighbor, k-vNN)搜索是一种常用的相似样本选择方法[17],其基本思想是根据计算的相似度对历史样本进行排序,选取与
最相似的
个样本来训练局部模型,即:
(2)
式中,
与样本
之间的相似度
满足:
(3)
针对航天器电源系统的运行数据特性,本文分析传统JITL的缺陷,并对
进行改进,具体如下:
(1) 动态时间规整(Dynamic Time Warping, DTW)
在处理时间序列数据时,计算两个序列的相似性通常面临一个问题:当时间序列长度不一致时,像欧氏距离等传统方法将无法有效计算相似度。而动态时间规整算法通过时间序列上的局部调整,优化了序列间的相似度匹配过程,从而能够更加精确地衡量时间序列的形态相似性[18]。此外,DTW算法还具备处理因数据缺失导致的序列长度不一致问题的能力,使得它在时间序列数据分析中得到了广泛应用。相比于欧氏距离,DTW距离能够更好地捕捉序列之间的相似性和特征点之间的关系。
欧氏距离和DTW距离的对齐模式如图1所示。
(a) 欧式距离对齐
(b) DTW距离对齐
Figure 1. The alignment mode of Euclidean distance and DTW distance
图1. 欧氏距离和DTW距离的对齐模式
电源系统在时间长度
内采集的时间序列数据表示为
,时间长度
内采集的历史时间序列数据为
。
定义1:
的距离矩阵
,其中,数据点
和
之间相似性的度量用欧氏距离表示为
,当两个点之间的相似性越高,则
越接近于0。
(4)
定义2:在
中,任意一条弯曲路径
,其中,
表示路径长度,路径上的每一个元素表示在
中的坐标位置,约束条件如下:
a) 有界性:
;
b) 边界性:
,
,即路径起止点是确定的;
c) 连续性和单调性:对于
,有
,即在进行时间序列数据的对齐操作时,
应当严格按照时间顺序,逐一匹配各时间节点的数据点。
定义3:在
中有多条可能的弯曲路径,最短的那条路径被称为动态时间弯曲路径,其路径长度计算公式如下:
(5)
定义4:代价矩阵采用动态规划方法进行构造,矩阵中的各元素表示相应的代价值,其计算公式如下:
(6)
式中,
为累计距离。
从序列的起点出发,逐步进行匹配操作,每次匹配计算出的距离会被累积到总距离中。当整个匹配过程完成,即到达序列的终点时,最终的累计距离即代表了
和
之间的最小距离。
接下来,通过一个简单的案例来说明上述DTW准则。
案例1:假设不等长序列
、
,则根据式(4),距离矩阵为:
(7)
根据式(6)求得该矩阵的代价矩阵为:
(8)
因此,
和
之间的最小弯曲距离
,最短弯曲路径
,两条序列的最优弯曲路径和相似性匹配如图2所示。
Figure 2. Optimal bending path and sequence similarity
图2. 最优弯曲路径及序列相似性
(2) 加权相似度距离
在航天器电源系统中,各个影响因子对系统状态的影响程度往往存在显著差异。如果不对这些影响因子进行差异化处理,相似度计算可能会被某个影响因子主导,而忽略了其他同样重要的因素。为了克服这一局限性,需要通过合理的权重分配来平衡各个影响因子的作用[19]。由于影响电源系统功率、电压等的因子之间并不符合线性特征提取条件。因此,在本文中,采取核主成分分析(Kernel Principal Component Analysis, KPCA)这一技术,来提取数据中的非线性主元,从而在保留尽可能多原始有效信息的同时,并控制特征个数。
本文选取高斯径向基核函数作为KPCA的核函数,计算公式如下所示:
(9)
式中,
为Gaussian核参数。
主成分的个数通常通过累计方差贡献率来确定,第
个主元的贡献率
、累计贡献率
计算公式如下:
(10)
(11 )
式中,l即为根据设定的阈值所求的主元个数。
由于电源系统采集的遥测数据可以按照周期边界加以分割,每个周期可以视为一段时间序列,记具有m个影响因子的预测周期特征向量为
,第i个历史周期特征向量
,利用DTW方法,分别度量预测周期与第i个历史周期的第j个主元序列的相似距离
,组合起来得到距离矩阵A。
为了反映各个影响因素在相似周期选择中的权重差异,本文采用加权相似度距离来衡量总体相似度,计算公式如下所示:
(12)
(3) 累计相似度因子
在上一小节中,提出了样本间新的相似度度量方法——多要素加权相似度距离。然而,如何确定局部建模时历史相似样本的数量,仍是影响JITL模型精度的一个关键因素。
若选择的相似样本数据过多,可能引入不必要的噪声,导致信息的冗余,增加计算复杂度,降低模型的有效性;而选择的数据相似样本过少,可能会导致关键信息的缺失,构建的模型无法充分捕捉系统的动态特性,同样不利于模型精度的提高。针对该问题,依据经验进行选取往往具有盲目性,因此,引用刘毅等[20]提出的累计相似度因子概念,通过近邻搜索自适应地动态调整相似样本集的规模。
累计相似度因子计算公式如下:
(13)
式中,
表示相似度总个数,
表示按降序排列后的相似度值,即
。
可以根据需要取0~1之间的任意数,按照时间顺序将前
个相似序列进行合并,形成最终的历史工况数据集。
3. 自适应更新机制的局部LSTM模型构建
3.1. LSTM模型构建
在上一小节中,研究了基于改进即时学习策略的学习集的选取。在选定与当前预测工况相似的历史工况数据集后,选取何种局部模型建模方法来建立针对该训练集的预测模型,对于所构建模型的精确性和实时性具有直接影响。LSTM专门用于处理和预测长时间序列,通过一种特殊的设计来控制信息流,使得网络能够在学习过程中更好地保留长期依赖信息。鉴于航天器电源系统数据普遍具有周期性和时序性特点[21],本文采用LSTM作为即时学习模型,寻找与预测点较高相似度的数据集,构建局部函数,挖掘数据中的时序特征。
Figure 3. LSTM structural unit
图3. LSTM结构单元
LSTM主要结构如图3所示,基本算法如下:
在LSTM网络中,当前时间步的输入由三部分构成:当前时刻的输入数据
、前一个时间步的隐藏状态信息
以及细胞状态信息
,更新后的隐藏状态
与细胞状态
会被保存下来,并作为下一个时间步的输入信息。
遗忘门决定上一时刻的记忆状态中有多少信息需要被丢弃,公式表示如下:
(14)
式中,
表示sigmoid函数,将值映射到区间
,
表示两个元素组成的向量,
表示遗忘门的权重矩阵,
表示遗忘门的偏置。
输入门决定当前时刻的输入信息有多少需要被存储到记忆单元中,通过一个sigmoid函数和一个
共同作用,前者决定哪些信息需要更新,后者生成候选的记忆状态,公式表示如下:
(15)
(16)
式中,
表示输入门的权重矩阵,
表示输入门的偏置,
是激活函数。
细胞状态的更新公式表示如下:
⊙
⊙
(17)
式中,符号⊙表示Hadamard积,
⊙
用于确定
时刻的细胞原始状态是否需要保留,
⊙
用于评估是否需要对
时刻的细胞状态进行更新。
输出门决定当前时刻的记忆单元中有多少信息需要输出,同样通过一个sigmoid函数和一个
共同作用,前者决定输出的比例,后者将记忆单元的状态转换为最终的输出,公式表示如下:
(18)
⊙
(19)
式中,
表示输出门的权重矩阵,
表示输出门的偏置。
局部LSTM模型构建流程如图4所示。
首先,确定系统的影响因子和表征指标,对数据进行预处理;其次,通过KPCA算法进行降维,选择具有代表性的非线性主元作为特征;随后,通过对比预测周期与历史周期的特征序列,以加权相似度作为衡量标准进行相似性分析;最后,根据累计相似度因子确定相似周期数量,构建样本集用于训练LSTM模型。
Figure 4. Flowchart of local model construction
图4. 局部模型构建流程图
3.2. 自适应阈值更新策略
为减少模型更新频率以降低计算成本,本文引入自适应阈值更新策略,具体步骤如下:
a) 初始化相似度阈值
=
,设
为一个较小的正数,该阈值用于判断是否需要更新模型;
b) 对于时间周期
内的在线数据序列
,首先,根据加权相似度距离和预先确定的累计相似度因子值,在历史数据库中搜索的相似样本集表示为
,其中,每一个样本
都表示一个周期内的数据,
与
之间的加权相似度距离表示为
;其次,比较
与
:若
,则认为当前工况变化不大,不更新
,继续使用机理模型进行预测;若
,则利用2.1基于加权相似度的改进即时学习策略合并生成训练集
,在此基础上构建LSTM模型,与机理模型进行融合,同时,更新阈值
;
c) 使用融合后的模型对时间周期
内的输出进行预测;
d) 对于下一时间周期
内的在线数据序列
,则是通过计算其与上一时间周期
之间的加权相似度距离
,若
,则认为当前工况变化较小,不更新
,继续使用
周期的模型进行预测,若
,则仍然利用2.1基于加权相似度的改进即时学习策略合并生成训练集
,在此基础上构建一个新的LSTM模型,并参照模型融合方法,将新的LSTM与机理模型进行融合,同时,更新阈值
;
e) 使用融合后的模型对时间段内
的输出进行预测;
f) 重复步骤d~e。
4. 实验验证与分析
本文以太阳电池阵为例,以某航天器2023年至2024年的历史数据集为主要验证数据,依据机理模型自适应更新流程,对机理模型的更新方法进行验证,并对相关参数及预测结果进行分析与检验。
基于KPCA方法对历史数据进行分析,计算各个环境参数关于输出电流的单个和累计贡献率,如表1所示,根据表1绘制的累计方差贡献率如图5所示。
Table 1. The contribution rates of the principal components of each environmental feature and the cumulative contribution rates
表1. 各环境特征主成分贡献率以及累计贡献率
编号 |
主成分信息 |
单个贡献率/% |
累计贡献率/% |
1 |
温度 |
46.33% |
46.33% |
2 |
光照 |
32.03% |
78.36% |
3 |
入射角 |
15.67% |
94.03% |
4 |
日地距离因子 |
5.29% |
99.32% |
5 |
损失因子 |
0.68% |
100.00% |
Figure 5. Cumulative contribution rate of environmental characteristics
图5. 环境特征累计贡献率
综合图5和表1可以看出,温度因素的贡献率比其余4个因素的贡献率高,被视为关键影响因素。当选择前3个环境特征量,累计贡献率已高于90%,可以代替原始的5维输入。本文以单个贡献率最大的温度为例,选取周期数为90作为目标预测周期,分别以DTW和欧氏距离作为相似判据,从历史周期中提取出相似周期温度序列。为了更加直观地比较两种方法的效果,将提取出的最相似温度序列与实际温度序列进行对比,如图6所示。
Figure 6. Predict the environmental curves of the cycle and similar cycles
图6. 预测周期与相似周期环境曲线
由图6可知,相较于欧氏距离,采用DTW方法得到的相似周期温度时间序列不仅在数值上趋于一致,而且在幅值变化和整体趋势上也展现出更高的匹配度。通过计算两条曲线的欧氏距离和DTW距离发现,两者的欧氏距离差异较小,但DTW方法提取的序列具有更短的弯曲路径。这表明,DTW能够更全面地考虑数据的整体趋势和时间序列的时序特征,具有更高的适配性和鲁棒性。
不同的累计相似度因子
会影响相似样本的数量,从而影响模型的整体性能。当
趋近于1时,相似样本数量会最大化,尽管可能提升模型的精度,但同时也会大幅度增加训练时长和计算资源的消耗,进而导致计算效率的降低。当相似度因子接近于0时,相似样本数量会大幅减少,尽管计算效率提升,但可能对模型的精度和鲁棒性造成不利影响。因此,需要在相似度因子设置上平衡计算效率与模型精度,以实现最优性能。
本文采用皮尔逊相关系数r与调整后的决定系数
作为指标,用以评价模型预测值与实际标签数据之间的相关性。当上述指标越接近1时,表示模型的预测结果与标签数据越相关,当上述指标越接近0时,表示预测结果与标签数据之间的关联较弱,误差较大。为了选择出最佳的
,以平衡局部模型的精度与计算成本,下表分别给出了不同
值对应r、
和训练时间的大小。
Table 2. Comparison of prediction accuracy evaluation indicators with training time
表2. 预测精度评估指标与训练时间对比
值 |
预测结果评估指标 |
训练时间/s |
|
|
0.50 |
0.80211 |
0.68802 |
591 |
0.55 |
0.83454 |
0.74011 |
695 |
0.60 |
0.88003 |
0.81005 |
765 |
续表
0.65 |
0.90057 |
0.83998 |
810 |
0.70 |
0.9311 |
0.87593 |
850 |
0.75 |
0.94311 |
0.89478 |
881 |
0.80 |
0.95800 |
0.92002 |
961 |
0.85 |
0.96901 |
0.93810 |
1051 |
0.90 |
0.97100 |
0.94300 |
1110 |
0.95 |
0.97212 |
0.94611 |
1157 |
从上表数据发现,当
增大时,预测精度也不断提高,因此,r与
都呈现出逐渐上升的趋势。但是,较高的
意味着更多的数据被纳入LSTM模型的训练过程,导致计算复杂度和处理时间增
加。为此应结合表2在时间成本与精度上进行平衡。本文定义累计相似度因子区间
对应的时间增量为
、皮尔逊相关系数增量为
、可决定系数增量为
,则相应的增长率
和
计算公式如下:
(20)
(21)
根据上述对
的定义,图7分别给出了不同
值对应
的大小以及
。
Figure 7. The influence of different values
on the evaluation index of prediction accuracy
图7. 不同
值对预测精度评估指标
的影响
由上图可知,随着
值的增大,
也在增大。然而,当
> 0.75时,
增幅开始放缓,
则出现波动下降的趋势,且
≤ 0.80时
。综合考虑后,建议选择
取值的区间为[0.8~1.0),因此,本文最终选定
= 0.90。
为了验证本文提出的基于多要素加权相似样本的LSTM模型在太阳电池阵电流预测中的合理性与有效性,分别对比了LSTM、DTW_LSTM和KPCA_DTW_LSTM三种模型预测效果,结果如图8所示。
(a) 各模型预测结果 (b) LSTM模型预测误差
(c) DTW_LSTM模型预测误差 (d) KPCA_DTW_LSTM模型预测误差
Figure 8. The prediction results and errors of each method
图8. 各方法预测结果和误差
综合预测结果和误差分析可知,LSTM模型由于将所有历史数据作为相似样本集,导致数据量庞大,训练时间较长,同时因包含大量冗余信息,模型精度相对较低,且误差波动范围较大,仅在少数数据点上表现出较小的误差。相比之下,DTW_LSTM模型通过选取相似度较高的历史数据构建相似样本集,过滤了原始数据集中的冗余信息,与LSTM模型相比,预测精度有所提高,误差整体范围减小,逐步贴近实际电流曲线。而KPCA_DTW_LSTM模型在优选相似样本集时,进一步考虑了不同因素对电流的影响权重,并通过KPCA方法确定不同影响因素的权重值,有效减少了样本数据中的干扰信息,确保选取的相似样本更具代表性,提高了与预测周期数据的匹配度,同时使得相似周期和预测周期的环境信息更加匹配。尽管在部分采样点处预测值略高,但相较于其他两个模型,KPCA_DTW_LSTM模型在整体预测性能上展现出更贴近实际值的优势,有着更高的准确性和鲁棒性。
为了评估本文提出的KPCA_DTW_LSTM模型在预测精度方面的表现,对模型预测值和实际值之间的线性拟合优度进行了统计分析,结果如表3所示。根据表格数据可以发现,KPCA_DTW_LSTM模型预测值在多个关键指标上优于标准LSTM模型和DTW_LSTM模型,具有更高的拟合优度,进一步说明了本文提出的基于加权相似度的改进即时学习策略的有效性。
Table 3. Statistical indicators of linear goodness-of-fit of the predicted values and measured values of each model
表3. 各模型预测值和实测值线性拟合优度统计指标
模型 |
截距
|
斜率
|
统计 |
值 |
标准误差 |
值 |
标准误差 |
|
|
|
LSTM |
2.7215 |
3.6454 |
0.9278 |
0.1355 |
0.7235 |
0.5234 |
0.5126 |
DTW_LSTM |
−0.1491 |
2.0716 |
1.0128 |
0.0758 |
0.8956 |
0.8021 |
0.7976 |
KPCA_DTW_LSTM |
−1.1080 |
0.7351 |
1.0417 |
0.0269 |
0.9856 |
0.9751 |
0.9708 |
5. 总结
本文提出了一种基于改进即时学习策略的自适应数据驱动与机理模型相融合的模型在线更新方法。对传统的即时学习方法进行了改进,结合DTW和KPCA定义了加权相似度距离,同时引用累计相似度因子,通过自适应近邻搜索机制构建高质量的相似样本集;然后基于LSTM建立局部数据驱动模型,实现模型的有效融合与实时更新。最后以航天器电池子系统为实验对象,与传统LSTM与DTW_LSTM等方法进行了对比验证,验证了所提出机理模型更新方法的有效性。实验结果表明,该方法能够提升模型的预测精度和适应性,为电源系统高保真建模与精准预测提供了一种高效、可行的解决方案。