GAN含义:生成对抗网络(Generative Adversarial Networks),主要做目标判别,应用在图像分类、语义分割、目标检测。
GAN简述:GAN包括生成器Generator(G)、判别模型Discriminator(D)。
首先给G输入向量,G会生成一张图片,数据尽可能符合训练数据的分布。将生成的图像和数据集一起送给D,由D判断是真数据还是生成的假数据,打分区间在【0-1】。
有一个形象的例子,例子来源:生成对抗网络GAN:从入门到精通(一):初识GAN
Generator(生成器):输入向量—>输出图片/文本,是一种映射。
生成器的简单结构,就是一个神经网络,输入是数值在(0,1)范围内的n维向量,输出是一张图片。
Discriminator(判别器):来自于数据集真实的图像标注为1,假的图像标注为0。
GAN的过程就生成器不断的生成假的类似于数据集的图像/文本,最终以假乱真。判别器不断提高自己的判别能力,者能力在这个过程中不断提升。
GAN网络训练分为两部分:第一部分训练判别器,第二部分训练生成器。训练某一部分时,必须固定另一部分。
训练判别器
判别器其实就是一个二分类任务,需要判别图片的真/假。通过交叉熵损失函数判断与真实值的差距,然后反向传递参数。
这个公式的意义在于:生成器希望损失函数越小越好,希望判别器判别不出来真假;判别器希望损失函数越大越好,尽可能的判别出来真假。这里取log的原因是对于差异进行放大,便于后续优化。
对于真实的样本来说,判别出来的值越高越好;对于假的样本来说,判别出来的值越小越好。
详细的实战案例:DCGAN的结构实现——代码实践:DCGAN的结构实现
参考链接🔗: