ZFNet是一种基于AlexNet的模型,由Matthew D. Zeiler和Rob Fergus在2013年提出。相对于AlexNet,ZFNet结构与AlexNet网络结构基本一致,进行了一些改进,包括卷积核。
如果第一层的卷积核很大,那么第一层提取的就是粗粒度的信息,之后的层也将会丢掉细粒度的信息。相比AlexNet第一层卷积核大小为 11×11,ZFNet将第一个卷积层的卷积核大小改为7 × 7,卷积核减小,这样做的目的是为了增加感受野(receptive field),即更大范围内的像素对输出的影响。
ZFNet可以更好地捕捉图像中的局部特征,可以观察更细粒度的东西。并且具有更好的细节分辨能力。
相比AlexNet第一层的卷积步长4,ZFNet将第一层的卷积步长设置为2,为了不让原始图像的分辨率不会降低过快,不会使得图像分辨率降低过快导致信息损失的太快。
在AlexNet中,第三个卷积层有384个卷积核,而第四个卷积层有256个卷积核。
在ZFNet中,第三个卷积层的卷积核个数增加到了512个,而第四个卷积层的卷积核个数增加到了1024个。
ZFNet在第三个和第四个卷积层中增加了卷积核的个数。这样做的目的是增加网络的表达能力,以便更好地捕捉图像中的细节和特征。通过增加卷积核的个数,ZFNet可以更好地学习图像的细节和抽象特征,从而提高模型的性能和准确度。这些改进使得ZFNet在图像分类和计算机视觉任务中取得了较好的结果。