研究如何把生成图片当中的内容拆分开
为了把各种风格分开先得把控制信息分开输入,于是作者就分开输入了,在PGGAN的基础上分开输入,取得了好的效果。
这里更像是作画的时候从一个大的轮廓到小细节的不断作画的过程
这里的(a)traditional说的是PGGAN
(b)里的左侧是分布变化网路
(b)里面的A是经过映射网络得到的一个长度为(2*channel)的向量
(b)里面的AdaIN是style迁移模块
(b)里面的B是一个噪声,他的大小是(dim×dim×channel),也就是和当前层网络内传递的内容是一样一样的。
这里主要是把Z分布变成一个W分布,Z分布是高斯分布也就是正态分布,就是我们随机取一个值,之后经过这个网络把他变成W,这个W是实际上控制图像风格的东西。
这里主要是决定不同层的Synthesis network到底改变什么,也就是让网络更加适应这个输入。(实际上就是对w做了一个仿射变化变为A)
风格迁移模块,实际上就是分布迁移模块,实际上就是通过改变分布最终改变风格:
另外我们需要注意一下这里的i是卷积的通道的角标,就是每个通道做的是不同的风格迁移,而不是所有整个feature map做相同的风格迁移,是按照通道进行的风格迁移。
这里的噪声注意是每个像素单独准备一个噪声,噪声的大小和原有的Synthesis network当中传递的内容是大小完全不同的,不同像素不同,不同通道之间也不同。
这里是用SourceB来干扰SourceA,先干扰浅层,再干扰奢深层
这里一开始的时候分辨率低,所以一影响,影响的比较大,所以更能决定性别、脸的朝向这些大的特征,之后越往后分辨率越高,影响的就会更加细粒度的内容,如:头发等,整体的大方向不变了。(这里更像是作画的时候从一个大的轮廓到小细节的不断作画的过程)
a)都有噪声
b)都没噪声
c)深层有噪声
d)浅层有噪声
我觉得这里还是因为一开始的分辨率低,一个噪声在未来的结果当中会影响一大块,所以一个噪声影响一个大细节