• Deformable Convolutional Networks


     创新点:提出了两个新的模块 deformable convolution 和 deformable RoI  pooling,通过学习的方式学习 offset 从而更高效地提取特征点用于卷积操作。

    Deformable Convolution

     如上图所示,整个流程

    1. 通过一个 conv 层得到一个与原始 feature map 同等大小的 offset field
    2. offset field 的 channel num 为卷积核数量的两倍,分别对应一个卷积核的 x 和 y 的偏移
    3. 由于 xy offset 通常为分数,在具体卷积时使用双线性插值来得到具体 offset 位置上的特征。并由于基于双线性插值,实现对 offset 的梯度反传,对 offset 进行学习。

    Deformable RoI Pooling

    RoI Pooling

     如上图所示,整个流程

    1. 通过传统方式得到 pooled feature maps 
    2. 之后经过一层 fc 得到归一化的 offset
    3. 基于检测框的宽和高,并乘以一个缩放系数 gamma,得到最终的 offset
    4. 基于得到的 offset 使用相同的双线性插值,然后基于新的特征重新得到 pooled feature maps

    Position-Sensitive (PS) RoI Pooling

     

    1.  原始流程(下分支):通过一个全卷积层,得到同尺度的 k*k*(C+1) 的 score maps,k 是 RoI bin 的数目,C 是检测目标的类别
    2. 上分支:对于每个类别,每个 RoI,得到对应 xy 的归一化 offset
    3. 同样乘上 RoI 的长宽和参数,得到最终的 offset

    其他相似的工作

    1. Spatial Transform Networks (STN):M. Jaderberg, K. Simonyan, A. Zisserman, and K. Kavukcuoglu. Spatial transformer networks. In NIPS, 2015.
    2. Active Convolution:Y. Jeon and J. Kim. Active convolution: Learning the shape of convolution for image classification. In CVPR, 2017.
    3. Effective Receptive Field:W. Luo, Y. Li, R. Urtasun, and R. Zemel. Understanding the effective receptive field in deep convolutional neural networks. arXiv preprint arXiv:1701.04128, 2017.
    4. Atrous convolution:M. Holschneider, R. Kronland-Martinet, J. Morlet, and P. Tchamitchian. A real-time algorithm for signal analysis with the help of the wavelet transform. Wavelets: Time-Frequency Methods and Phase Space, page 289297, 1989.
    5. Deformable Part Models (DPM):P. F. Felzenszwalb, R. B. Girshick, D. McAllester, and D. Ramanan. Object detection with discriminatively trained part-based models. TPAMI, 2010
    6. DeepID-Net:W. Ouyang, X. Wang, X. Zeng, S. Qiu, P. Luo, Y. Tian, H. Li, S. Yang, Z. Wang, C.-C. Loy, and X. Tang. Deepid-net: Deformable deep convolutional neural networks for object detection. In CVPR, 2015
    7. Spatial manipulation in RoI pooling:S. Lazebnik, C. Schmid, and J. Ponce. Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories. In CVPR, 2006.
    8. Transformation invariant features and their learning
    9. Dynamic Filter:B. D. Brabandere, X. Jia, T. Tuytelaars, and L. V. Gool. Dynamic filter networks. In NIPS, 2016.
    10. Combination of low level filters:J. J. Koenderink and A. J. van Doom. Representation of lo-
      cal geometry in the visual system. Biological Cybernetics, 55(6):367–375, Mar. 1987.

    Deformable Convolution/RoI Pooling Backpropagation

     Deformable Convolution

     

     Deformable RoI Pooling

  • 相关阅读:
    nginx负载均衡配置及常见负载均衡策略
    8:00面试,8:06就出来了,问的问题有点变态。。。
    给你的模糊测试开开窍——定向灰盒模糊测试(Directed Greybox Fuzzing)综述
    男子遗失30万天价VERTU唐卡手机,警察2小时“光速”寻回
    基于WOA算法的SVDD参数寻优matlab仿真
    数据在内存中的存储
    musl Reference Manual
    【Java面试】怎么防止缓存击穿的问题?
    CityJSON
    Linux | 性能问题排查
  • 原文地址:https://blog.csdn.net/a40850273/article/details/125559017