基于动态变量相关性消减的多目标多任务进化算法
Multi-Objective Multitasking Evolutionary Algorithm with Dynamic Correlation Reduction
摘要: 多目标多任务优化(MTO)是进化计算领域的重要分支。变量相关性对遗传操作的挑战一直影响着多目标多任务优化的效率,但这一问题尚未得到认真考虑。为此,本文提出了一种基于动态变量相关性消减的多目标多任务进化算法(MTO-DCR),通过结合学习到的变量协方差矩阵进行坐标变换以减少变量相关性。具体而言,MTO-DCR首先通过坐标变换动态减少变量相关性以生成后代。为学习变量相关性,针对每个任务分别维护了独立的协方差自适应搜索。此外,提出了一种基于缩放变换的领域迁移策略,用于将源任务中表现优异的个体迁移到目标任务中。为验证所提MTO-DCR的有效性和效率,构建了一组具有可控非可分性和难度的可扩展MOMTOP测试实例进行实验研究。结果分析及与最新算法(MO-SBO、MO-MaTDE和MO-EMaTO-MKT)的对比表明,所提MTO-DCR能够有效处理具有相关变量的MTO问题。
Abstract: Multi-objective multi-task optimization (MTO) is an important branch of evolutionary computation. The challenge of variable dependency in genetic operations has consistently impacted the efficiency of multi-objective multi-task optimization, yet this issue has not been thoroughly addressed. To this end, this paper proposes a multi-objective multi-task evolutionary algorithm based on dynamic variable dependency reduction (MTO-DCR), which reduces variable dependency through coordinate transformation using a learned covariance matrix. Specifically, MTO-DCR dynamically reduces variable dependency via coordinate transformation to generate offspring. To learn variable dependencies, independent covariance adaptive searches are maintained for each task. Additionally, a domain transfer strategy based on scaling transformation is proposed to migrate well-performing individuals from source tasks to target tasks. To validate the effectiveness and efficiency of the proposed MTO-DCR, a set of scalable MOMTOP test instances with controllable non-separability and difficulty levels is constructed for experimental studies. Results analysis and comparisons with state-of-the-art algorithms (MO-SBO, MO-MaTDE, and MO-EMaTO-MKT) demonstrate that the proposed MTO-DCR effectively handles MTO problems with correlated variables.
文章引用:程健燊, 陈磊. 基于动态变量相关性消减的多目标多任务进化算法[J]. 计算机科学与应用, 2025, 15(2): 179-189. https://doi.org/10.12677/csa.2025.152045

1. 引言

变量相关性是多目标进化算法(MOEA)中经常面临的问题。随着变量维度的提高,变量相关性使得目标之间的关系更加复杂,从而增加了问题的整体复杂度,给搜索空间寻找Pareto前沿提出了重大挑战。此外,变量相关性还会导致Pareto前沿解在决策空间中表现出多样性。在高维多目标优化中,变量之间的复杂关系经常被忽视,MOEA在此类问题中的探索能力仍然有限。MOEA通常会注重目标空间中所得解的多样性,并将所有决策变量作为一个整体进行优化。影响优化问题复杂性和难度的主要因素是决策变量的数量[1],由于MOP的复杂性和难度,简化问题结构对于MOP中的变量相关性具有重要意义。受合作协同进化[2]-[5]和关联学习方法[6] [7]的启发,把高维变量MOP的目标函数分解为低维的子函数是一个有效的方式,这样就把问题转化为求解子函数,以此使得不同子函数之间的相互依赖性最小化。然而,上述“分而治之”策略需要算法设计者对给定问题的隐藏结构有足够的了解才适用,这通常包含了对决策变量之间相互作用的掌握程度。另外,引入协方差矩阵也是降低变量相关性影响的一种有效方式,协方差矩阵能够记录与分析变量之间的信息,并拟合变量间的关系。其主要方式是通过与差分进化算法(DE) [8] [9]或遗传进化[10]相结合,把协方差矩阵运用到进化过程的交叉算子。

协方差矩阵与DE结合存在着没有充分利用协方差矩阵的特征值、缺乏协同效应等局限。而把协方差矩阵与遗传进化相结合的做法也有很多,但大多数做法都不能达到令人满意的效果。另一方面,只依赖协方差矩阵会带来一个新的问题,随着决策变量维度的提高,向量通过正交矩阵(由协方差矩阵正交分解产生)直接旋转会导致子代向量发生大幅度的偏转,进而偏离了最优点的方向。如何在异构任务中实现个体的迁移。以往的方法并未能充分利用种群的分布信息,直接的基因交流无法有效地处理具有不同目标的优化任务;此外,由于协方差矩阵携带的变量相关性信息仅针对于当前任务,对从其他任务迁移的个体能否适用,也是一个需要考虑的问题。综上所述,这些挑战无疑需要一种更先进的策略去解决。

为了有效处理决策变量之间的相关性,本文提出了一种多目标多任务进化优化算法,该算法结合了基于协方差矩阵的变量相关动态缩减方法和领域迁移学习策略(MTO-DCR)。在MTO-DCR中,采用协方差矩阵学习作为方向引导的变量相关性动态减弱的方法。该方法动态地把协方差矩阵的信息迁移到交叉过程上,从而动态降低变量依赖程度。在交叉过程中引入了调节因子,动态地控制这个旋转幅度,从而达到动态控制变量相关性的效果。紧接着,MTO-DCR提出了基于种群分布信息正交变换和伸缩变换的域迁移策略,帮助个体实现任务领域间的自适应迁移。在实验环节中,我们选用了一组测试问题作为Test Suite来检验MTO-DCR算法的性能,并进行了对比实验和消融实验。考虑到实际问题会比Test Suite的背景更复杂多样,对DTLZ和ZDT的构造函数设计了一组具有可控不可分离性和难度的可扩展MTOP测试实例,利用正交矩阵对一般决策变量空间进行旋转,并用设定了条件数的对角矩阵来控制主体的分布,以此建立决策变量之间的依赖关系。在对比实验和消融实验中,MTO-DCR都取得了不错的成效。更具体地说,我们完成了以下工作:一、提出了一种基于协方差矩阵的变量相关性动态减弱方法,旨在动态地减弱变量之间的相关性。这种方法从向量线性表达定理从讨论它的可行性,该方法使得算法在求解问题的同时,把协方差矩阵有用的信息转移到交叉过程的交叉因子上。同时,引入了调节因子λ,根据当前收敛的效果,通过λ动态地调整这个转移的程度。二、提出了基于种群分布信息正交变换和伸缩变换的域迁移策略。这种迁移策略在个体进行迁移前,通过对应的协方差矩阵对任务之间的映射关系进行正交变换;然后,再对当前领域中的个体进行伸缩平移,将个体自适应地转移到另一个领域中,使得交叉过程在处理异构任务时更容易地实现个体与信息的迁移。

2. 相关工作

2.1. CMA-ES

协方差矩阵自适应进化策略(CMA-ES) [11] [12]作为ES算法的分支,它有着高效的分布自适应特性,且能够适应各种任意变换的正态分布。在复杂性提高的情况下,协方差矩阵在自适应和不自适应的环境下都能展现出进化策略的全局搜索特性。通过从多元高斯分布中抽取几个连续向量,评估其目标函数值,然后通过抽取的向量信息(均值向量、协方差矩阵、步长)来推进算法的优化。需要注意的是,在本篇文章,CMA-ES主要用于更新协方差矩阵,并传递经协方差矩阵正交分解得到的正交矩阵。

2.2. 迁移学习

在实际问题中,目标数据可能非常有限或者收集的成本昂贵,导致难以获得足够多的训练样本。因此,通过迁移学习,预训练模型保留了任务、特征、权重和功能的基础知识,使其能够更快地适应新任务。同时能以更小的数据集和更少的资源来获得更好的结果。如何构建任务之间的映射关系,是进化多任务在知识迁移上的关键问题。其中,就涉及了任务之间的迁移学习。迁移学习是一种近年来流行的机器学习方法。常用的基于特征的迁移策略,是指通过特征变换的方式互相迁移,来缩小源领域和目标领域之间的差距。

3. 方法论

本节将详细展开描述所提算法MTO-DCR的相关细节。首先,本文围绕“变量相关性减弱”这一话题,分别介绍了降低变量相关性的应用原理以及DCR-λ-SBX在MOMTO问题中的应用;接着,接下来,本文会提出本模型的另一个重要部分:域迁移学习策略,并介绍它的过程;最后,提出本文的主要模型框架MTO-DCR,并详细介绍其细节。

3.1. 变量相关性理论及应用

在完成变量分离的工作后,本文将聚焦于利用协方差矩阵来实现改变变量相关性的目的,其中,协方差矩阵 C cov =BD B T B 是正交矩阵,它用于变量的旋转;D是对角矩阵,它用于变量的缩放。引入协方差矩阵处理变量相关性是一种巧妙的方式。然而,学习到的协方差矩阵本质上是一种近似。如果只针对个体直接进行协方差矩阵的旋转变换,在高维问题上容易导致变量出现较大偏差,导致变量容易偏离最优方向。因此,针对变量相关性这一工作,需要解决两个问题。一方面,如何确保在每一次迭代中,变量空间中的每个向量能够落在该向量与旋转向量(经协方差矩阵正交旋转)之间的范围内。对于这一现象,我们知道:对于向量 Z 1 , Z 2 , Z 3 ,其中 Z 2 = δ 1 Z 2 + δ 3 Z 3 ,如果 δ 1 >0, δ 3 >0 ,那么 Z 2 Z 1 Z 3 所构成的平面内移动。另一方面,如何保证当变量沿着协方差矩阵的方向偏转时,变量相关性也会随之消减。针对这一问题,本文提出了以下定理:对于变量空间中的任意给定变量 Z ,对于原始向量 Z 和旋转向量 ZB 的线性组合 λZ+( 1λ )ZB,( 0<λ<1 ) 其变量相关性低于原始向量 Z 。关于它的证明,根据 C cov =BD B T ,我们有:

C ij =λ( 1λ ) B ji +λ( 1λ ) B ij ++ ( 1λ ) 2 ( B i1 × B j1 + B i2 × B j2 ++ B in × B jn ) =λ( 1λ )( B ji + B ij )+ ( 1λ ) 2 C ij =( 1λ )[ λ( B ji + B ij )+( 1λ ) C ij ]<( 1λ ) C ij < C ij ( ij )

当向量开始沿着协方差矩阵的方向发生偏转的时候,变量之间的相关性也会随之改变。由于变量相关性消减的方向与协方差矩阵的方向一致,因此,如果变量向量沿着协方差矩阵的方向移动,就可以达到变量相关性消减的目的,生成一个具有可控变量相关性的相似变量。上述启发我们,在由原始向量Z和旋转向量ZB所张成的平面内存在的任意向量,都对应着不同的变量相关性消减程度。该策略通过线性变换模拟旋转变换,并通过某个因子动态控制变换程度。

基于上述描述,提出了一种动态相关性消减方法,通过CMA-ES优化器来提供变量迭代的协方差矩阵 C cov =BD B T ,采用了一种针对给定父代 X Y 的交叉形式。具体方式为:

{ C 1 =( 1 2 λ )[ ( 1+k )X+( 1k )Y ]+λ[ ( 1+k )X+( 1k )Y ]B C 2 =( 1 2 λ )[ ( 1k )X+( 1+k )Y ]+λ[ ( 1k )X+( 1+k )Y ]B (1)

其中, λ 是一个旋转缩放因子,表示坐标系旋转的程度,对应于变量相关性的处理; k 是一个与模拟二进制交叉相关的系数。 λ 表达式为:

λ( T )={ ξ,( T T ξ ) ξ γ T t rotate ×( ΔQ( T t rotate ,T1 ) t rotate 1 ΔQ( T1,T ) ),( T> T ξ ) 0,( ΔQ( T t rotate ,T1 )<δorT=0 ) (2)

其中, ξ 是初始截取强度; T ξ 是拦截强度达到最大值的迭代次数; Q 是评价函数; γ 是折扣率,用于将 Q 的每次变化转化为对 λ 的调整; ΔQ( T t rotate ,T1 ) 表示从第 T t rotate 代到第 T1 代之间 Q 的变化总和; T 与设定的旋转间隔常数 t rotate ( t rotate >1 ) 相关,其定义为:

T( t )={ t,whenmod( t, t rotate )=0 0,otherwise (3)

从直观上理解,这个过程可以看作对向量头部截取一定长度,使正交矩阵作用于截取后的向量进行旋转,然后将该旋转后的截取向量与原始向量通过加法形成新的向量,从而实现一种新的偏移方式。

3.2. 域迁移学习策略

为了应对异构任务和正交无效性的情况,本文采用了基于领域学习和正交变换的迁移策略,通过平移和调整种群的分布范围和对应任务正交变换的方式,将相似度较高的任务的种群映射到它所对应的任务上。通过一个分布函数来描述当前任务的种群分布,在寻找其他任务种群的分布特征时,学习相似度高的任务的种群特征,利用迁移分布参数的方式对当前任务的种群进行平移和调整。此外,由于不同任务的协方差矩阵携带的信息不适用于当前任务领域,因此需要在迁移之前把源任务的迁移个体进行正交变换。

在高斯分布模型中, μ σ 是描述一个种群的分布特征最重要的两个参数,因此它们为域迁移学习提供了调整的空间,在信息传递中起着主要作用。根据线性变换矩阵的表达,我们可以得到迁移个体 x ˜ 的数学表达式:

x ˜ ={ σ s σ t ( x μ s ) B s + μ t B t ,mod( t, t rotate )=0 σ s σ t ( x μ s )+ μ t ,otherwise (4)

通过上述的变换,就组成了新的迁移解。需要注意的是,该迁移策略没有应用到MTO-DCR中,我们依旧沿用原来的迁移策略。

3.3. MTO-DCR

基于以上描述,本文提出了基于动态变量相关性消减的多目标多任务进化算法(MTO-DCR)。首先对每个任务的种群进行初始化和评估;然后计算每个任务种群的均值和方差,为后面的迁移奠定基础。在主循环中,我们利用最大平均距离(MMD)算法来观察与当前任务相似性较高的任务,具体做法是用它来计算任务间的相似性距离度量;接下来利用CMAES来优化和更新MTO-DCR算法所需要的参数,需要注意的是,CMA-ES的优化过程与我们寻找更高质量的子代的过程是同时进行的,现有的交叉和变异算子没有考虑变量之间的相关性,不能有效地解决具有相关性特征的问题,而MTO-DCR需要用到CMA-ES传出的每个任务的正交矩阵来为后面产生的子代进行旋转。

在产生后代的环节中,则分为两个部分:一、当还没进入需要进行旋转操作的迭代环节时,域迁移学习策略通过一系列伸缩平移,将相似任务的部分个体映射到当前任务上。然后,如果产生的随机数高于随机交配概率,当前任务随机选择的个体将会与映射后的个体进行交叉产生新的子代。否则,只对当前任务的种群内部进行交叉。二、当进入需要旋转的环节时,子代的产生首先依旧是根据随机交配概率来选择与域迁移学习策略映射的个体或当前任务的个体进行交叉。不同的是,如果高于随机交配概率(即选择与域迁移学习策略映射的个体交叉的情况),则按照DCR- λ -SBX的方式产生新的子代。而对于DCR- λ -SBX产生的个体,在完成交叉后需要进行恢复操作。以个体 C 1 为例子,设 a=[ ( 1+k )X+( 1k )Y ] b=[ ( 1+k ) X +( 1k ) Y ] ;其中, X =X× B i Y =Y× B i B i 为对应任务的正交矩阵。于是有:

C 1 =( a b )×( 1 2 λ λ )=( 1 2 λ )a+λb (5)

然后,运用 B i ' 进行恢复:

C 1 =( ( 1 2 λ )a λb )×( 1 B i )=( 1 2 λ )a+λb B i =( 1 2 λ )a+λa= 1 2 a (6)

C 1 ' 是实际参与下一代交叉的父代个体。而对于其它个体,也是沿用同样的方法进行恢复。

4. 实验与结果

在本节中,本文通过测试集评估了MTO-DCR的性能。具体而言,将MTO-DCR与五种算法进行比较,包括MO-SBO、MO-MaTDE和MO-EMaTO-MKT [13]。随后,本文将进行三组消融实验,以进一步验证MTO-DCR各组成部分以及BMTO-DCR的作用和优势。第一组实验将评估两种学习策略在移除或组合条件下性能的变化。主要包括四种情况:1) 不执行域迁移学习策略且不执行基于协方差矩阵学习的交叉策略的基础进化算法(记为 Base);2) 不执行域迁移学习策略但执行协方差矩阵学习交叉策略的进化算法(记为Base + CMA);3) 不执行交叉策略但执行域迁移学习策略的进化算法(记为Base + TL);4) 同时执行两种学习策略的进化算法(Base + TL + CMA,即MTO-DCR)。第二组实验将评估基于迁移的执行全旋转的进化算法(记为TL-FL-CMA)与MTO-DCR的性能差异,其他外部条件均保持一致。实验结果表明,MTO-DCR优于其他算法;在前两组消融实验场景,两个部件组合发挥的作用也优于单个部件;而在迁移策略的差异上,BMTO-DCR的性能略优于MTO-DCR。

4.1. 测试问题

本文以IEEE世界计算智能大会(WCCI) 2020竞赛中的进化多目标多任务优化问题作为测试套件。在该测试套件中,包含了10个多目标超多任务基准测试问题,这些问题由3个DTLZ函数[14]和7个ZDT函数[15]组成,而这些函数进一步由常用的Sphere、Rosenbrock、Griewank、Weierstrass、Ackley和Rastrigin函数组成。每个测试问题包含50个优化任务。

4.2. 参数设置

此测试套件的参数设置适用于对比实验和消融实验:

种群规模:对于10个测试问题,每个优化任务的种群规模N为100,总计5000个个体。在消融实验中,同样设置相同的种群规模。

最大迭代次数:算法的最大迭代次数设置为500。

模拟二进制交叉的参数设置分别为: η c =20, η m =20

随机配对概率(RMP)为0.7。

本文通过倒置代际距离(IGD)来衡量算法的有效性, d( p,P ) 表示算法生成的非支配解与帕累托最优前沿上的参考点之间的最小欧氏距离。通常,IGD的值越小,算法性能越优。IGD定义为:

IGD( P, P )= p P d( p,P ) | P | (7)

4.3. 对比实验结果与分析

在进行对比实验前,我们需要对选用的三个算法的工作原理进行详细分析:MO-SBO是把代理优化模型推广到多目标的领域上,通过多目标优化方法得到一组帕累托前沿解,然后再进行决策,而非预先做出决策;MO-MaTDE针对多任务优化问题,提出了一种自适应选择机制,通过考虑任务间的相似性和进化过程中知识迁移的累积回报,为给定的任务选择合适的“辅助”任务。并结合了交叉知识迁移模式进行任务间的信息交换,以提高搜索效率,并集成了多个文档,以便于度量任务间的相似性,以及不同阶段的知识迁移;MO-EMaTOMKT是一个多源知识迁移的算法,融合了自适应匹配概率、基于最大均值差异的任务选择和局部分布估计的知识迁移策略。这些关键组成部分在降低负迁移影响、调节知识传递频率以及在多样性和收敛性之间取得平衡等多方面发挥着重要作用。

Table 1. The average IGD value of the three algorithms on Problem 1

1. 三个算法在Problem 1的平均IGD值

Task

MO-SBO

MO-MaTDE

MO-EMaTO-MKT

MTO-DCR

T1

1.04E+00

1.57E−02

4.96E−03

1.07E03

T2

3.78E−01

1.15E−02

5.34E−03

2.46E04

T3

6.11E−01

1.56E−02

5.00E−03

2.57E04

T4

9.32E−01

1.26E−02

4.88E−03

3.82E04

T5

5.30E−01

8.62E−03

4.95E−03

1.91E03

T6

4.41E−01

1.17E−02

4.69E−03

1.93E04

T7

8.14E−01

1.29E−02

5.32E−03

4.10E04

T8

1.04E+00

1.45E−02

5.21E−03

4.46E03

T9

5.93E−01

2.71E−02

5.11E−03

9.04E04

T10

5.43E−01

2.79E−02

5.31E−03

2.82E04

T11

8.20E−01

3.42E−02

5.15E−03

3.28E04

T12

7.00E−01

1.33E−02

9.64E−03

5.05E03

T13

6.29E−01

1.65E−02

6.59E−03

5.34E03

T14

3.74E−01

1.20E−01

4.84E−03

3.12E04

T15

1.35E+00

8.42E−03

5.03E−03

2.22E04

T16

7.86E−01

6.98E−02

5.38E−03

1.04E03

T17

1.28E+00

2.04E−02

4.96E−03

4.08E04

T18

6.59E−01

3.81E−02

4.94E−03

2.06E04

T19

4.50E−01

1.27E−02

5.30E−03

3.54E04

T20

7.19E−01

8.34E−03

5.31E−03

2.59E04

T21

1.19E+00

1.28E−02

4.84E−03

5.65E04

T22

7.44E−01

1.38E−02

5.14E−03

6.67E04

T23

7.39E−01

1.14E−02

5.12E−03

2.23E04

T24

6.51E−01

6.87E−02

5.63E−03

1.89E04

T25

8.48E−01

1.76E−02

5.16E−03

2.32E04

T26

3.84E−01

1.29E−02

5.01E−03

2.05E04

T27

8.17E−01

2.34E−02

5.23E−03

2.04E03

T28

7.58E−01

1.90E−02

5.13E−03

2.97E04

T29

5.94E−01

3.82E−02

5.18E−03

2.46E03

T30

9.64E−01

2.02E−02

4.96E−03

3.75E04

T31

7.70E−01

7.90E−03

5.01E−03

3.34E04

T32

6.50E−01

1.16E−01

4.74E−03

3.05E04

T33

9.02E−01

2.03E−02

5.32E−03

2.62E04

T34

4.99E−01

1.09E−02

5.29E−03

1.92E−04

T35

7.35E−01

1.29E−02

5.10E−03

2.34E−04

T36

5.55E−01

1.21E−02

4.98E−03

4.61E−04

T37

8.38E−01

1.70E−02

5.04E−03

3.55E−04

T38

7.26E−01

6.65E−02

5.24E−03

4.64E−04

T39

6.68E−01

1.64E−01

5.46E−03

3.07E−04

T40

8.59E−01

1.05E−02

4.75E−03

2.70E−04

T41

6.01E−01

1.93E−02

5.29E−03

1.99E−04

T42

7.32E−01

1.32E−02

4.85E−03

7.20E−04

T43

6.23E−01

1.28E−02

5.07E−03

2.07E−04

T44

6.30E−01

2.02E−02

5.74E−03

7.71E−04

T45

6.00E−01

1.39E−02

5.45E−03

4.16E−04

T46

4.72E−01

1.88E−02

4.95E−03

2.16E−04

T47

4.56E−01

8.26E−03

5.00E−03

1.92E−04

T48

6.75E−01

3.73E−02

5.26E−03

2.01E−04

T49

7.03E−01

2.53E−02

5.81E−03

2.54E−04

T50

9.79E−01

3.26E−02

4.89E−03

5.93E−04

+/−/=

0/50/0

0/50/0

0/50/0

在分析了三种对比算法的运行原理和特性后,表1 (详细数据选取第一个问题)展示了对比实验的结果。实验结果表明,MO-SBO算法的效果依赖于测试问题的场景以及初始点的选择。MO-MaTDE的表现优于前述三种算法,但其精确度不如MO-EMaTO-MKT。MO-EMaTO-MKT由于其独特的机制,在与其他算法的对比中表现出不可忽视的优势。而最后一列为本文提出的MTO-DCR算法,其通过变量分离系统、DCR- λ -SBX交叉机制以及域迁移策略,在实验中展现出较强的竞争优势,并在大多数优化任务中达到比MO-EMaTO-MKT更高的精确度。结合以上结果分析,MTO-DCR是一种可行且高效的多目标多任务进化算法。

4.4. 消融实验结果与分析

为了进一步验证MTO-DCR中各组件的优势,本文进行了消融实验,以评估算法内部各组件所起的作用。表2展示了两种策略在测试套件中不同场景下的结果(详细数据从第一个问题展示)。其中,Base表示基础进化算法,TL表示用于执行域迁移的学习策略,CMA表示基于协方差矩阵学习的交叉策略。

Table 2. The average IGD value of the two components on Problem 1

2. 两个组件在Problem 1的平均IGD值

Task

Base

Base + TL

Base + CMA

MTO-DCR

T1

4.97E+01

7.67E+00

5.21E−04

3.54E04

T2

4.82E+01

8.75E+00

3.70E−04

3.20E04

T3

5.25E+01

6.83E+00

2.72E−04

2.54E04

T4

5.98E+01

8.35E+00

5.15E−03

2.24E−04

T5

5.51E+01

8.03E+00

1.98E−03

1.95E−04

T6

3.65E+01

7.44E+00

1.80E−03

3.73E−04

T7

4.91E+01

7.51E+00

6.37E−04

3.65E−04

T8

4.46E+01

8.13E+00

4.76E−04

3.99E−04

T9

4.47E+01

7.09E+00

2.59E−03

3.83E−04

T10

6.01E+01

7.74E+00

3.23E−04

2.92E−04

T11

3.78E+01

8.02E+00

3.52E−03

1.87E−04

T12

5.68E+01

7.03E+00

1.84E−03

8.92E−04

T13

4.13E+01

7.96E+00

7.21E−04

2.29E−04

T14

4.04E+01

6.22E+00

6.77E−04

5.02E−04

T15

5.23E+01

5.91E+00

4.26E−03

2.06E−04

T16

4.50E+01

8.23E+00

4.44E−04

1.90E−04

T17

4.37E+01

5.92E+00

2.31E−04

1.89E−04

T18

3.35E+01

7.22E+00

7.19E−04

2.21E−04

T19

4.84E+01

7.44E+00

2.34E−03

2.06E−04

T20

4.81E+01

6.89E+00

2.57E−04

2.24E−04

T21

5.02E+01

8.81E+00

4.89E−04

3.33E−04

T22

3.79E+01

7.84E+00

3.86E−04

1.87E−04

T23

4.23E+01

6.71E+00

6.98E−04

5.18E−04

T24

3.48E+01

8.41E+00

1.33E−02

1.47E−03

T25

3.43E+01

7.27E+00

3.20E−04

2.32E−04

T26

3.75E+01

9.05E+00

8.30E−04

5.11E−04

T27

3.85E+01

7.80E+00

4.16E−04

1.42E−03

T28

4.85E+01

7.06E+00

6.12E−04

4.63E−03

T29

4.56E+01

7.22E+00

3.81E−04

2.29E−04

T30

4.59E+01

7.65E+00

1.71E−01

5.59E−04

T31

4.26E+01

6.85E+00

3.81E−04

2.50E−04

T32

5.69E+01

7.99E+00

7.63E−04

5.40E−04

T33

4.54E+01

7.26E+00

4.50E−04

1.07E−03

T34

3.88E+01

6.44E+00

4.46E−04

4.03E−04

T35

3.55E+01

8.28E+00

8.36E−04

2.66E−04

T36

4.22E+01

6.74E+00

2.78E−04

2.53E−04

T37

3.29E+01

6.90E+00

8.92E−04

2.87E−04

T38

3.70E+01

6.07E+00

3.49E−04

1.61E−03

T39

4.60E+01

9.23E+00

1.21E−03

1.01E−03

T40

3.47E+01

6.67E+00

8.78E−04

2.29E−04

T41

4.64E+01

8.09E+00

4.08E−03

5.27E−04

T42

4.03E+01

7.45E+00

2.29E−04

1.15E−03

T43

4.43E+01

7.83E+00

4.31E−04

2.65E−04

T44

3.71E+01

8.09E+00

9.77E−04

8.52E−03

T45

5.38E+01

7.28E+00

9.66E−04

2.09E−04

T46

5.24E+01

8.13E+00

4.81E−03

1.69E−02

T47

3.64E+01

7.85E+00

9.31E−04

2.67E−04

T48

4.99E+01

7.67E+00

4.97E−04

3.26E−04

T49

3.56E+01

6.37E+00

3.13E−03

1.86E−03

T50

4.98E+01

7.04E+00

2.08E−03

2.10E−04

+/−/=

0/50/0

0/50/0

7/43/0

通过实验结果可以看出,随着算法组件的更改,IGD值在不同程度上降低。因此可以明确地看出,MTO-DCR的两个组件起到了重要作用。当测试问题的决策空间被修改时,变量的相关性进一步增强,优化难度加大,基础算法的性能远低于两个组件组合后的性能。由于采用了不同的交叉策略,协方差矩阵始终引导决策变量向帕累托最优方向偏移,这大大降低了算法在探索最优点时的难度,提高了计算结果的准确性。而对于域迁移学习策略,它能够有效减少任务之间的差异,对相似任务实现更高质量的迁移,并加速搜索过程。因此,实验数据表明,两种策略的有机结合是一种有效且更理想的方式。

5. 结论

本文提出了一种结合基于协方差矩阵的动态变量相关性消减方法和领域迁移学习策略的多目标多任务进化策略(MTO-DCR)。首先,在处理多目标多任务优化问题(MOMTOP)时,引入了一种基于协方差矩阵的动态变量相关性消减方法,该方法将协方差矩阵中有用的信息转移到交叉操作的交叉因子中,并通过引入调整因子λ来控制向量的旋转程度,从而动态减少变量之间的相关性。此外,该算法结合了一种基于种群分布信息的正交和伸缩变换的领域迁移策略,通过协方差矩阵正交化任务之间的映射关系,实现异质任务之间个体的迁移。为了验证MTO-DCR在高变量相关性问题上的优势,本文构建了一组具有不同复杂度的可扩展MOMTOP测试实例,用于评估算法性能,并通过消融实验进一步比较动态变量相关性消减方法与迁移策略的性能。在测试套件中,我们选择了几种较为流行的进化算法进行对比,所有实验结果均表明MTO-DCR的有效性和潜力。

然而,关于MTO-DCR的研究仍有许多值得改进的地方。例如,如何提高变量相关性分离系统的准确性,如何减少λ操作符对初始值的依赖,并实现更优的自适应调整。未来的工作将集中在变量分离方法的改进、λ的调控以及更高效的迁移策略上,并尝试将MTO-DCR推广到更复杂的真实场景中。

参考文献

[1] Binh, H.T.T., Tuan, N.Q. and Long, D.C.T. (2019) A Multi-Objective Multi-Factorial Evolutionary Algorithm with Reference-Point-Based Approach. 2019 IEEE Congress on Evolutionary Computation (CEC). Wellington, 10-13 June 2019, 2824-2831.
https://doi.org/10.1109/CEC.2019.8790034
[2] Chacon, J. and Segura, C. (2018) Analysis and Enhancement of Simulated Binary Crossover. 2018 IEEE Congress on Evolutionary Computation (CEC), Rio de Janeiro, 8-13 July 2018, 1-8.
https://doi.org/10.1109/cec.2018.8477746
[3] Chen, Y., Zhong, J., Feng, L. and Zhang, J. (2020) An Adaptive Archive-Based Evolutionary Framework for Many-Task Optimization. IEEE Transactions on Emerging Topics in Computational Intelligence, 4, 369-384.
https://doi.org/10.1109/tetci.2019.2916051
[4] Couckuyt, I., Deschrijver, D. and Dhaene, T. (2012) Towards Efficient Multiobjective Optimization: Multiobjective Statistical Criterions. 2012 IEEE Congress on Evolutionary Computation, Brisbane, 10-15 June 2012, 1-8.
https://doi.org/10.1109/cec.2012.6256586
[5] Deb, K. and Agrawal, R.B. (1995) Simulated Binary Crossover for Continuous Search Space. Complex Systems, 9, 115-148.
[6] Deb, K., Agrawal, S., Pratap, A. and Meyarivan, T. (2000) A Fast Elitist Non-Dominated Sorting Genetic Algorithm for Multi-Objective Optimization: NSGA-II. Parallel Problem Solving from Nature-PPSN VI, Paris, 18-20 September 2000, 849-858.
https://doi.org/10.1007/3-540-45356-3_83
[7] Deb, K. and Jain, H. (2014) An Evolutionary Many-Objective Optimization Algorithm Using Reference-Point-Based Nondominated Sorting Approach, Part I: Solving Problems with Box Constraints. IEEE Transactions on Evolutionary Computation, 18, 577-601.
https://doi.org/10.1109/tevc.2013.2281535
[8] Arabas, J. and Jagodzinski, D. (2020) Toward a Matrix-Free Covariance Matrix Adaptation Evolution Strategy. IEEE Transactions on Evolutionary Computation, 24, 84-98.
https://doi.org/10.1109/tevc.2019.2907266
[9] Auger, A. and Hansen, N. (2005) A Restart CMA Evolution Strategy with Increasing Population Size. 2005 IEEE Congress on Evolutionary Computation, Edinburgh, 2-5 September 2005, 1769-1776.
https://doi.org/10.1109/cec.2005.1554902
[10] Wang, Y., Li, H., Huang, T. and Li, L. (2014) Differential Evolution Based on Covariance Matrix Learning and Bimodal Distribution Parameter Setting. Applied Soft Computing, 18, 232-247.
https://doi.org/10.1016/j.asoc.2014.01.038
[11] Hansen, N., Müller, S.D. and Koumoutsakos, P. (2003) Reducing the Time Complexity of the Derandomized Evolution Strategy with Covariance Matrix Adaptation (CMA-ES). Evolutionary Computation, 11, 1-18.
https://doi.org/10.1162/106365603321828970
[12] Igel, C., Hansen, N. and Roth, S. (2007) Covariance Matrix Adaptation for Multi-Objective Optimization. Evolutionary Computation, 15, 1-28.
https://doi.org/10.1162/evco.2007.15.1.1
[13] Liang, Z., Xu, X., Liu, L., Tu, Y. and Zhu, Z. (2022) Evolutionary Many-Task Optimization Based on Multisource Knowledge Transfer. IEEE Transactions on Evolutionary Computation, 26, 319-333.
https://doi.org/10.1109/tevc.2021.3101697
[14] Deb, K., Thiele, L., Laumanns, M. and Zitzler, E. (2002) Scalable Multi-Objective Optimization Test Problems. Proceedings of the 2002 Congress on Evolutionary Computation, Honolulu, 12-17 May 2002, 825-830.
https://doi.org/10.1109/cec.2002.1007032
[15] Zitzler, E., Deb, K. and Thiele, L. (2000) Comparison of Multiobjective Evolutionary Algorithms: Empirical Results. Evolutionary Computation, 8, 173-195.
https://doi.org/10.1162/106365600568202