作者:Jie An, Siyu Huang等
会议:CVPR 2021
单位:罗切斯特大学、百度研究院、腾讯AI实验室、腾讯数据平台
Content Leak
现象,并分析证实其3大主要原因。PFN
,并可以用其分析UST算法中Transfer模块自身会不会有偏,从而导致Content Leak。ArtFlow(PFN+Transfer)
,不会内容泄露的同时,结果可与SOTA比肩。现象(Phenomena):Universal style transfer(AdaIN、WCT、Avatar-Net等)风格化时分解、重建图像内容的能力有限,在多风格迁移后不能保留图像内容。称此现象为内容泄露(Content Leak)。
证据(Evidence):做多轮实验,将前一轮的输出作为下一轮的内容图输入,实验结果如下图1。
分析(Analysis):UST方法(Encoder-Transfer-Decoder )
原因(Causes)
Reconstruction error
:UST的解码器对内容图的重建有损失。
Biased decoder training
:以AdaIN为例,其使用content loss和style loss作为损失函数。因为style loss的存在,解码器需要权衡内容损失和风格损失,自然不能完美地重建图像。
Biased style transfer module
:以Avatar-Net中的Style Decorator为例
总结如图5。
Which style transfer module should ArtFlow use to achieve the unbiased style transfer?
- AdaIN、WCT
UST方法机制可以认为是bilinear model
(Tenenbaum and Freeman,2000)的进化版。
UST方法同样是假定了内容信息和风格信息在深度特征空间中是可以或明显或隐晦地分解开的
。
Definition 1 Suppose we have a bilinear style transfer module fcs = C(fc)S(fs), where C, S denote the content factor and the style factor in the bilinear model, respectively. fcs is an unbiased style transfer module if C(fcs) = C(fc) and S(fcs) = S(fs).
Theorem 1 The adaptive instance normalization in AdaIN is an unbiased style transfer module.
Theorem 2 The whitening and coloring transform in WCT is an unbiased style transfer module.
控制变量法:使用PFN替换UST的编码解码器,排除解码器带来的原因1、图像重建错误;2、有偏的图像复原。
内容图:MS-COCO
风格图:WikiArt
WCT、OptimalWCT:艺术效果;
LinearWCT、AdaIN、ArtFlow:保留更多内容细节;ArtFlow的细节内容更多,且没有内容泄露。
Avatar-Net:保留更精致的纹理信息。
Avatar-Net 和ArtFlow+Avatar-Net相比得,ArtFlow可以缓解内容泄露。
4.3章的理论分析表明过,图像的特征空间可以分离出内容因子和风格因子。图11通过逆转该内容因子,将其可视化成图像。
ArtFlow逆转图中带有很少的风格效果(如色彩),且保留更锋利的图像结构。这表明其可以无偏地分离内容和风格。