• DeepLab-LargeFOV--学习笔记


    1. 所谓DeepLab-LargeFOV就是DeepLab v1
    2. 提出背景:在DCNN进行分割任务时,有两个瓶颈:
      1. 下采样所导致的信息丢失,通过带孔卷积的方法解决;(此处说的带孔卷积指的是膨胀卷积,可参考膨胀卷积学习笔记_Wsyoneself的博客-CSDN博客_膨胀卷积作用
      2. 空间不变性所导致的边缘不够准确,通过全连接的CRF解决。(CRF是可以通过底层特征进行分割的一个方法)
      3. 分类任务具有空间不变性,图像的仿射变换不会影响最后的分类结果,而且恰恰通过仿射变换等操作(数据增广)可以增加数据量,提高模型的精度;但是像分割和检测这类问题,不具有空间不变性。应该需要的是空间等变性。
    3. 创新点:
      1. 将深度神经网络DCNN与全连接CRF结合起来,提高图像分割的分割精度。
        1. 提出全连接的CRFs算法,来后处理分割结果,以得到更加精细的边缘细节.这里CRFs的提升比较明显.但这样会使得模型比较冗赘,不能够end-2-end地训练和推理,在deeplabv3之后就取消了CRFs,并且效果还更好(所以暂时先不学习这个CRFs了).
        2. 一般利用条件随机场(CRFs)来处理分割中不光滑问题,它只考虑到目标像素点的附近点,是一个短距离的CRFs。
      2. 提出空洞卷积的思想。更加稠密的feature maps,意味着更多的计算量,使用空洞卷积核,一方面可以使小卷积核获得大卷积核的大感受野,另一方面,小卷积核计算更高效。
      3. 应用尝试了多尺度、多层次的信息融合。当下有多数先进方法是在多尺度卷积特征的整合上进一步处理的,所以此模型也是采用多尺度卷积特征整合方法
    4. 网络搭建:DeepLab v1 模型是在VGG的基础上改造而成。
      1. 把全连接层(fc6、fc7、fc8)改成卷积层。
      2. 把最后两个池化层(pool4、pool5)的步长2改成1(下采样32倍变为8倍,保证feature的分辨率)
      3. 把最后三个卷积层(conv5_1、conv5_2、conv5_3)的dilate rate设置为2,且第一个全连接层的dilate rate设置为4(保持感受野)
      4. 把最后一个全连接层fc8的通道数从1000改为21(Pascal VOC数据集分类数为21)
  • 相关阅读:
    【编程100%】22-12 基本算法之 大整数截取
    SCAUoj实验11 链表操作
    Oracel中视图相关概念和操作(一)
    DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior
    C. Qpwoeirut And The City Codeforces Round #809 (Div. 2)
    C++ 之 backtrace
    图论的小技巧以及扩展
    ubuntu云服务器怎么做好初始安全设置
    《论文阅读》同情对话生成的知识桥梁 AAAI 2021
    .Net服务器性能监控,应用耗时统一监控平台
  • 原文地址:https://blog.csdn.net/weixin_45647721/article/details/126854867