参考:
人群密度估计 - CVPR2018最新论文CSRNet原理、配套代码解析_lucky li的博客-CSDN博客
该模型不使用任何全连接层,因此输入图像的大小是可变的。
模型体系结构使得输入图像为(x,y,3),输出是尺寸(x / 8,y / 8,1)的desnity图。
输出图像的大小为原始输入图像的1/8。如果我们继续堆叠更多的卷积层和池化层(VGG-16中的基本组件),则输出大小将越来越小,并且很难生成高质量的密度图。于是我们尝试将膨胀的卷积层部署为后端,以提取更深的显着性信息并保持输出分辨率。
每张图片裁剪成9个patch,每个patch是原始图片的1/4,前4个patch分别为一张图片的4个角,剩下的5个patch随机裁剪。#(Data augmentation)
由于CSRNet中,网络回归的密度图为原图的1/8,因此作者对密度图进行了降采样,并点乘64以保证密度图之和依然约等于总人数。该操作会带来一个问题:会影响PSNR和SSIM的值。因此我们不建议使用该操作。在我们实现其他网络过程中,也会出现网络输出为1/4,1/8等尺寸,为避免该问题,在网络内部增加上采样层实现与原图大小的密度图。
基于卷积神经网络的密集人群估计/人群计数算法【内含教程和踩坑】_Regan_zhx的博客-CSDN博客
人群计数[CAN](Context-Aware Crowd Counting) 代码解读_长安study的博客-CSDN博客_can人群计数
[CAN] [CVPR2019]:Context-Aware Crowd Counting论文+代码解读-pudn.com