Note:[ wechat:Y466551 | 可加勿骚扰,付费咨询 ]
论文信息
论文标题:Transferable Adversarial Training: A General Approach to Adapting Deep Classifiers
论文作者:Hong Liu, Mingsheng Long, Jianmin Wang, Michael I. Jordan
论文来源:ICML 2019
论文地址:download
论文代码:download
1 Introduction
出发点:当使用对抗性训练的时候,因为抑制领域特定的变化时,会扭曲原始的特征分布;
事实:
Figure2(b):
-
- 对比对抗性训练(DANN、MCD)和监督训练(EestNet50)在源域和目标域上的测试误差;
- 结论:使用对抗性训练,减少特定领域的变化打破了原始表示的判别结构;
Figure2(c):
-
- 计算特征表示层模型权重的奇异值分布;
- 结论:使用对抗性训练的奇异值分布更加重尾,表示产生了扭曲的特征表示;
2 方法
2.1 模型框架
2.2 Adversarial Generation of Transferable Examples
域鉴别器 D
ℓd(θD,f)=−1nsns∑i=1log[D(f(i)s)]−1ntnt∑i=1log[1−D(f(i)t)](1)
分类器 C 训练目标:
ℓc(θC,f)=1ns∑nsi=1ℓce(C(f(i)s),y(i)s)(2)
本文通过一种新的对抗性训练范式生成的可转移样本来填补源域和目标域之间的差距,从而减少分布变化。
生成的可转移样本需要满足两个条件:
-
- 首先,可转移的样本应该有效地混淆域鉴别器 D,从而填补域间隙,桥接源域和目标域;
- 其次,可转移的样本应该能够欺骗类别分类器 C,这样它们就可以推动决策边界远离数据点;
因此,可转移的样本是通过 ℓc 和 ℓd 的联合损失而反向生成的:
ftk+1←ftk+β∇ftkℓd(θD,ftk)−γ∇ftkℓ2(ftk,ft0)(3)
fsk+1←fsk+β∇fsℓd(θD,fsk)−γ∇fsℓ2(fsk,fs0)+β∇fskℓc(θC,fsk)(4)
其中,ft0=ft,fs0=fs,ft∗=ftK,fs∗=fsK。
即:
-
- 域分类损失最大化;
- 距离最小化;
- 分类损失最大化;
注意:为避免生成的样本的发散,控制生成的样本与原始样本之间的 ℓ2distance;
2.3 Adversarial Training with Transferable Examples
分类器 C 的对抗性训练的损失函数如下:
ℓc,adv(θC,f∗)=1nsns∑i=1ℓce(C(f(i)s∗),y(i)s∗)+1ntnt∑i=1|C((f(i)t∗))−C((f(i)t))|(5)
作用:可转移的样本训练分类器提高了分类器对 对抗性扰动 和 域变化 的鲁棒性;
域鉴别器 D 的对抗性训练的损失函数如下:
ℓd,adv(θD,f∗)=−1nsns∑i=1log[D(f(i)s∗)]−1ntnt∑i=1log[1−D(f(i)t∗)](6)
作用:稳定对抗性训练,并弥合领域上的差异;
最小化 Eq.1 和 Eq.6 来训练 D,最小化 Eq.2 和 Eq.5 来训练 C,训练目标:
minθD,θCℓd(θD,f)+ℓc(θC,f)+ℓd,adv(θD,f∗)+ℓc,adv(θC,f∗)(7)
3 实验