1. 引言
深度学习被广泛运用到图像视觉、自然语言处理和语音识别等各个领域,研究成果丰富。训练出一个泛化能力足够强的深度学习模型需要大量带标注的数据。在实际应用中,标注数据却是十分稀缺且获取难度较大的。特别是在大数据时代,海量数据不仅结构各异,分布也不同,难以确保收集的训练数据和测试数据满足机器学习模型训练中独立同分布的假设。因此,深度学习的发展面临着标注数据和训练数据稀缺的问题。
迁移学习有助于解决深度学习中标注数据稀缺的问题。它不但放松了数据独立同分布这一限制假设的要求,而且能够借助辅助领域知识来研究新领域,节约模型建立成本。同时,深度学习特有的分层结构带来的多层次特征学习,能够显示出不同领域数据的共享特征,即不能用来区分领域的特征,为迁移学习的实现提供了多种实现结构。一方面深度学习提供多视角,研究人员可以根据不同层的输入进行适当的处理,找到不同领域间的共享特征;另一方面深度学习的对抗结构能够自动找到不同领域间的共享特征,用特征提取器来提取领域特征,让判别器根据特征区分不同的领域,双方在博弈的过程中达到平衡时,领域间重叠部分即共享特征即可被筛选出。简而言之,深度学习天然适合迁移学习,其对抗网络结构可能成为迁移学习的范式。因此,基于对抗网络的深度迁移算法是迁移学习的研究热点之一。
对抗式域适配是深度对抗迁移学习算法的子领域,本文对当前对抗式域适配研究的梳理,主要贡献如下:
1) 本文对对抗式域适配进行定义,按照源领域与目标领域的标签类别空间异同分为同构域自适配和异构对抗域自适配两类;
2) 详细介绍了同构对抗式域适配和异构对抗式域适配研究的主要思路及重要研究。
2. 对抗域自适配
首先给出文中所用的相关符号,具体说明如表1所示。
对抗域自适配属于迁移学习领域,常用到迁移学习定义中“领域”和“任务”两个重要概念,目前广泛使用的定义是Pan等人 [1] 在2010年关于迁移学习的综述中所提出的,具体描述如下:
领域D定义为由
维特征空间
和边缘概率分布
组成,即
,其中样本
。给定领域
,任务
定义为由标签类别空间
和预测模型
,即
,按统计学的观点,预测模型
可以解释为条件概率分布
,即
,其中
。故迁移学习的定义如下:
定义2.1 (迁移学习) [1]:给定标注的源领域
和学习任务
,无标注目标领域
和学习任务
,迁移学习的目标是当
或者
时,降低目标领域预测模型
的泛化误差。
迁移学习研究思路主要是确定源领域和目标领域的相似性,减小领域间的差异,对抗网络结构进行功能实现。对抗网络的生成器可以作为特征提取器,提取领域间的共享特征即领域间的“相似性”;判别器可以作为领域判别器,区分源领域和目标领域特征,与特征提取器进行博弈,双方在博弈的过程中达到平衡时,领域间重叠部分即共享特征即可被筛选出,其差异也被减小,因此研究者将对抗网络与迁移学习结合在一起,形成一个新的研究领域——对抗式域自适配。对抗域自适配网络一般由特征提取器F,标签分类器G和领域判别器D三部分组成,其定义如下:
定义2.2 (对抗式域自适配):给定一个迁移学习任务
,
是由对抗网络组成的非线性的函数。
3. 对抗域自适配的类型
根据源领域和目标领域标签类别空间异同,对抗域自适配包括同构对抗式域自适配和异构对抗式域自适配两种子类型。同构对抗式域自适配根据对边缘分布和条件分布的侧重可以分为边缘分布同构对抗域自适配、条件分布对抗域自适配、联合分布对抗域自适配和动态分布对抗域自适配四种子类型;异构对抗式域适配根据源领域和目标领域标签类空间交集情况可以分为开放集对抗式域自适配、局部对抗式域自适配和通用对抗式域适配三种。
本节将逐一介绍上述对抗式域自适配算法。
3.1. 同构对抗式域适配迁移学习
在同构域自适配中,常给定源领域
,有
个带标签样本,目标领域
,有
个无标签样本,假设源领域和目标领域的标签类别空间是相同的,即
。源领域数据的概率分布为p,目标领域的概率分布为q,且
。现需要函数
使得p和q的差异减小,且目标领域的分类误差有界,即
有界。
这里的数据分布主要是指领域的边缘分布
、条件概率分布
和联合分布
,根据源领域数据分布和目标领域不同的数据分布情况,在研究中需要对领域间的概率分布适配有所侧重,如图1所示(改编自文献 [2] ),源领域和不同分布的目标领域,其中不同的形状代表不同标签类的数据,线表示标签类之间的边界。这三种概率分布由对抗式域自适配算法中不同的结构负责输出。
对抗式域自适配算法结构一般由特征提取器F,标签分类器G和领域判别器D三部分组成。特征提取器F的输入是源领域数据
和目标领域数据
,输出是数据特征f;标签分类器G的输入是f,输出是样本估计标签
;领域判别器的输入是f,输出是样本估计领域标签
。
后文将介绍边缘分布同构对抗域自适配、条件分布对抗域自适配、联合分布对抗域自适配和动态分布对抗域自适配四种同构对抗式域自适配。

Figure 1. Source domain and target domain with different distribution
图1. 源领域和不同分布情况的目标领域图示
3.1.1. 边缘分布同构对抗式域自适配
当源领域是对目标领域1进行适配时,两个领域的整体分布相似度低,即
,具体到每个标签类中数据分布差异较小即
时,对抗域自适配的主要任务是减小源领域和目标领域间边缘分布的差异,其目标函数可以简写为:
(1)
例如,经典的对抗域自适配算法Domain-Adversarial Neural Network (DANN) [3] 由特征提取器F,标签分类器G和领域判别器D三部分组成,其中D是对整个源领域和目标领域进行特征适配即边缘分布适配;Adversarial Discriminative Domain Adaptation (ADDA) [4] 网络结构在DANN基础上将特征提取器分为源领域特征提取器和目标领域特征提取器两部分,且源领域的特征提取器提前由源领域数据预训练,在对抗域训练过程中,源领域特征提取器参数固定不变,目标领域特征提取器采用源领域特征提取器的参数作为初始化参数,随着目标领域数据特征进行调整,确保目标领域特征提取器既可以学习目标领域独有特征,也又可以学到领域间的共享特征来迷惑领域判别器,使得领域判别器难以区分源领域和目标领域特征分布,实现领域间的边缘分布适配;文献 [5] 则引入胶囊网络和残差机制作为ADDA中特征提取器,更好的拟合源域和目标域内有限的样本特征边缘分布 [5]。Adversarial Domain Adaptation with Domain Mixup (DM-ADA) [6] 网络结构与ADDA相同,增加源领域和目标领域输入数据混肴和训练过程中领域特征混肴这两部分,以此迷惑和加强训练判别器,使得领域整体的边缘分布更好的适配;Domain Symmetric Networks (SymNets) [7] 则通过源领域标签分类器和目标领域标签分类器共享神经元组成一个领域判别器进行领域整体特征混肴,拟合边缘分布。
3.1.2. 条件分布同构对抗式域自适配
当源领域是对目标领域2进行适配时,两个领域的整体分布相似度高即
,具体到每个标签类中数据分布差异较大时,对抗域自适配的主要任务是减小源领域和目标领域间条件分布的差异,其目标函数可以简写为
(2)
例如,TANG等人 [8] 在对运动脑电波图进行无监督学习时,将标签分类器输出
与样本特征f进行交叉乘,即借助条件分布进行特征适配;Adversarial-Learned Loss for Domain Adaptation (ALDA) [9] 根据领域判别器D的输出
生成混淆矩阵,据此对目标领域无标签数据的分类估计
进行修正,从而拟合源领域和目标领域的条件分布;Adversarial Branch Architecture Search (ABAS) [10] 旨在为DANN和ALDA这类对抗式域自适配寻找最优领域判别器,改进它们的网络结构,进行分布适配。
3.1.3. 联合分布同构对抗式域自适配
联合分布同构对抗式域自适配其目标是减小源领域和目标领域的联合概率分布
距离,完成迁移学习。由于目标领域的标注类别空间是未知,其联合概率分布则无法获知,源领域和目标领域的联合概率分布差异无法直接进行度量。因此,源领域和目标领域之间联合概率分布距离可以用边缘分布距离和条件分布距离之和近似估计,或者用边缘分布和条件分布的乘积估计源领域和目标领域的联合概率,再进行距离度量,即
(3)
或
(4)
例如,Multi-Adversarial Domain Adaptation (MADA) [11] 中领域判别器分为
个分类网络
,
,
的输入对应每个标签类的样本特征f和标签分类器G输出的预测值
的乘积,根据条件概率对特征进行赋权,即对每个样本点加权特征进行边缘分布自适应后实现领域整体边缘分布自适应,避免每个标签类下的样本特征适配错分,造成负迁移,学习到标签类级特征,同时减小领域间的联合概率分布差异;Conditional Adversarial Domain Adaptation (CDANs) [12] 则对样本特征f和标签分类器G输出标签预测
,采取线性组合的方式进行条件分布式配;Joint Adversarial Domain Adaptation (JADA) [13] 的分类器由源领域标签分类器
和目标领域标签分类器
两部分组成,它们对目标领域的条件概率估计分别是
、
,按照
正则项计算方式计算
和
之间的差异,作为JADA算法目标函数的正则项,实现条件概率适配。
3.1.4. 动态分布对抗式域自适配
前面三种情况均对源领域和目标领域的数据分布差异作出假设,且默认边缘分布和条件分布自适配是同等重要的。若目标领域的数据分布是未知的,源领域和目标领域边缘分布和条件分布的差异是无从获知的,则对抗域自适配中边缘分布适配和条件分布适配的重要性是难以评估的,如图1中源领域对未知目标领域进行对抗域自适配。因此,WANG等人 [2] [14] 提出了动态分布自适配(Dynamic Distribution Adaptation, DDA)的方法,一方面能够根据特定的数据领域动态衡量分布适配过程中的边缘分布和条件分布的重要性,另一方面自动调整这两种分布的重要性,取得良好的分布适配效果。调整方式是通过计算动态平衡因子
实现,
,则对抗域自适配的目标函数可以简写为
(5)
Dynamic Adversarial Adaptation Network (DAAN) [15] 是率先将动态分布适配和对抗域自适配结合在一起的方法。DANN由一个特征提取器
,分类器
,全局领域判别器
,局部子领域判别器
,
。这里
用来度量源领域和目标领域的领域整体数据分布差异
,即领域的边缘分布差异,
用来度量源领域目标领域每个标签类k中数据分布差异
,即条件分布差异,动态平衡因子
由
和
的交叉熵估计得出,即
(6)
3.2. 异构对抗式域适配迁移学习
如图2所示,实线圈代表源领域标签类别空间,虚线圈代表目标领域标签类别空间,图2(a)表示闭集域自适配场景即源领域和目标领域的标签类别空间一致,
,3.1节中同构对抗式域自适配算法均适用于此应用场景;图2(b)、图2(c)和图2(d)依次为开放集、局部和通用域自适配场景,源领域和目标领域标签类别空间是有差异的,即
,下文将依次给出这三种场景的详细介绍。

Figure 2. From totally closed set to universal domain adaptation setting
图2. 从全封闭集到通用域自适配标签类别空间示意图
3.2.1. 开放集对抗式域自适配
开放集域自适配(Open Set Domain Adaptation, OSDA) [16],给定源领域
有
个带标签的样本,分为
个类别,目标领域
有
个无标签样本,分为
个类别,且
,
。两个领域的概率分布不一致。现在需要寻找一个可转移的特征映射函数
和分类器
,使得模型分类误差期望
达到最小。
Saito等人 [17] 在OSDA上提出了一种更具挑战性的开放集情形,即
已知,
未知,
,源领域标注类别空间相当于时目标领域标注类别空间的子集,这意味着源领域中没有数据帮助模型将目标领域中独有的标注类别数据标注出来,并且他们率先采用对抗网络应用到此场景中解决问题;Separate to Adapt (STA) [18] 分两步解决OSDA中的问题,第一步训练
个二分类器,计算目标领域样本与每个标签类源领域数据的相似性
,根据
对源领域的数据进行聚类,分为高、中和低相似三类,取相似度高的标签类的
均值作为选出
阈值,取相似度低的标签类的
均值作为选出不属于
标签类的阈值,第二步运用对抗网络结构对筛选出来的属于
的样本进行分类。
3.2.2. 局部对抗式域自适配
局部域自适配(Partial Domain adaptation, PDA) [19],给定源领域
有
个带标签的样本,分为
个类别,目标领域
有
个无标签样本,分为
个类别,且
,即
,
。两个领域的概率分布不一致。现在需要寻找一个可转移的特征映射函数
和分类器
,使得模型分类误差期望
达到最小。
此场景由清华大学龙明盛教授团队提出,可以看作开集的一种特殊情况。他们在深度对抗网络的基础上提出Selective Adversarial Network (SAN) [20] 和Partial Adversarial Domain Adaptation (PADA) [19] 两种适用于局部迁移背景的深度迁移算法。SAN和PADA是利用对抗网络中的领域判别器来对样本赋权,减少非目标领域类别数据带来的负迁移,但并没有避免这些数据对源领域分类器的影响。因此,龙明盛团队又对这两种算法作出进一步的改进,提出Example Transfer Network (ETN) [21],能够在判别器和源领域分类器上同时减弱源领域中非目标领域标注类别数据造成的负迁移。
3.2.3. 通用对抗式域自适配
通用领域适配(Universal Domain Adaptation, UniDA) [22] 中,给定源领域
有
个带标签的样本,分为
个类别,目标领域
有
个无标签样本,分为
个类别。源领域数据的概率分布为p,目标领域的概率分布为q。
,是源领域和目标领域共享的标签类别空间。
和
分别是独属于源领域和目标领域的标签类别集。
和
分别是源领域中属于
和
数据的概率分布,
和
分别是源领域中属于
和
数据的概率分布。利用杰卡德距离定义领域间的相似性,即
(7)
闭集领域自适应问题可以看作是UniDA的一种特殊情况,
。
越小,说明领域间可迁移的知识越少,领域自适应的难于越大。在UniDA情况中,
是未知的,领域自适应模型需要在不同
值下取得较好的结果。同时,模型必须要能够对目标领域中来自
和C的数据进行分类,即得到一个模型f,使得模型分类误差期望
最小。
Universal Adaptation Network (UAN) [22] 适用于UniDA,它在常用的对抗式域自适配网络结构中引入一个非对抗领域判别器D’,即UAN由特征提取器F,标签分类器G和领域判别器D和非对抗领域判别器D’四部分组成。D'用来计算领域相似性和权重
、
,辅助源领域和目标领域在
内进行域自适配;Calibrated Multiple Uncertainties (CMU) [23] 在常用对抗式域自适配网络结构的基础上,将标签分类器分为多个分类器并根据它们的输出计算神经网络预测结果的熵、一致性和置信度,避免单一分类器带来的不确定性问题,造成分类错误。此外,研究者也根据算法在域自适配方法对
、
和
的分类准确率,提出迁移能力评价指标H-score。
4. 总结
本文对对抗式域自适配研究进行了总结和分析。对抗式域自适配按照源领域和目标领域标签类别空间的异同可分为同构对抗式域自适配和异构对抗式域自适配两种子类。同构对抗式域自适配属于闭集域自适配,运用对抗方式实现源领域和目标领域的概率分布适配,包含边缘概率分布适配、条件概率分布适配、联合分布适配和动态分布适配四种;异构对抗式域自适配根据源领域和目标领域标签类别空间的关系,可以分为开放集对抗式域自适配、局部集对抗式域自适配和通用对抗式域自适配三种,当前这方面的研究具有巨大潜力。
NOTES
*通讯作者。