码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • CVPR小目标检测:上下文和注意力机制提升小目标检测(附论文下载)


    41d0161d92c0bf3edeb6ad6faf92c96d.png

    79f8737ebddac8c14433eb8f53a75b0d.gif

    计算机视觉研究院专栏

    作者:Edison_G

    CVPR21文章我们也分享了很多最佳的框架,在现实场景中,目标检测依然是最基础最热门的研究课题,尤其目前针对小目标的检测,更加吸引了更多的研究员和企业去研究,今天我们“计算机视觉研究院”给大家分享一个小目标检测精度提升较大的新框架!

    ed01dc87dc70f922e7e8dd25c8ae472d.png

    公众号ID|ComputerVisionGzq

    学习群|扫码在主页获取加入方式

    ef6ef3cada3ccea9c8282a317519fd36.png

    论文:

    https://arxiv.org/pdf/1912.06319.pdf

    1

     简要

    在各种环境中应用目标检测算法有很多局限性。特别是检测小目标仍然具有挑战性,因为它们分辨率低,信息有限。

    917dfcfc295a1d374e1f4adf80c7c667.png

    有研究员提出了一种利用上下文的目标检测方法来提高检测小目标的精度。该方法通过连接多尺度特征,使用了来自不同层的附加特征作为上下文。研究员还提出了具有注意机制的目标检测,它可以关注图像中的目标,并可以包括来自目标层的上下文信息。实验结果表明,该方法在检测小目标方面的精度高于传统的SSD框架。

    2

     背景

    下图显示了SSD框架无法检测到小目标时的案例情况。对小目标的检测还有很大的改进空间。

    ccfe10ead1490ebe82c54f3622b11ca0.png

    由于低分辨率低,像素有限,小目标检测很困难。例如,通过只看下图上的目标,人类甚至很难识别这些物体。然而,通过考虑到它位于天空中的背景,这个物体可以被识别为鸟类。因此,我们认为,解决这个问题的关键取决于我们如何将上下文作为额外信息来帮助检测小目标。

    b8baea534e19c31925bcc57aa2b86153.png

    3

     新框架分析

    新框架将从基线SSD开始讨论,然后是研究者提出的提高小目标检测精度的组件。首先,SSD与特征融合,以获取上下文信息,名为F-SSD;第二,带有保留模块的SSD,使网络能够关注重要部件,名为A-SSD;第三,研究者结合了特征融合和注意力模块,名为FA-SSD。

    447ee1fe8cd1432b8f27b4eba56dbdf5.png

    F-SSD: SSD with context by feature fusion

    为了为给定的特征图(目标特征图)在我们想要检测目标的位置提供上下文,研究者将其与目标特征层更高层次的特征图(上下文特征)融合。例如,在SSD中,给定我们来自conv4_3的目标特性,我们的上下文特征来自两层,它们是conv7和conv8_2。

    f3408658d16a5c079381857e66906fc3.png

    虽然新框架的特征融合可以推广到任何目标特征和任何更高的特征。然而,这些特征图具有不同的空间大小,因此研究者提出了如上图所示的融合方法。在通过连接特征进行融合之前,对上下文特征执行反卷积,使它们具有与目标特征相同的空间大小。将上下文特征通道设置为目标特征的一半,因此上下文信息的数量就不会超过目标特征本身。仅仅对于F-SSD,研究者还在目标特征上增加了一个额外的卷积层,它不会改变空间大小和通道数的卷积层。

    此外,在连接特征之前,标准化步骤是非常重要的,因为不同层中的每个特征值都有不同的尺度。因此,在每一层之后进行批处理归一化和ReLU。最后通过叠加特征来连接目标特征和上下文特征。

    A-SSD: SSD with attention module

    dcc00002b3718e8966350cf2c6f1c4b9.png

    如上图,它由一个trunk分支和一个mask分支组成。trunk分支有两个残差块,每个块有3个卷积层,如上图d所示;mask分支通过使用残差连接执行下采样和上采样来输出注意图(图b为第一阶段和图c为第二阶段),然后完成sigmoid激活。残差连接使保持下采样阶段的特征。然后,来自mask分支的注意映射与trunk分支的输出相乘,产生已参与的特征。最后,参与的特征之后是另一个残差块,L2标准化,和ReLU。

    FA-SSD: Combining feature fusion and atten- tion in SSD

    研究者提出了以上的两个特征的方法,它可以考虑来自目标层和不同层的上下文信息。与F-SSD相比,研究者没有在目标特征上执行一个卷积层,而是放置了one stage的注意模块,如下图所示。

    98dc0c6c73feb7bbdf46c4075c6a7a0e.png

    4

     实验

    2c945af29a86bcfd076f164a32bdde2c.png

    edd08b7e863a862d72599f75ab67c64b.png

    ResNet SSD with feature fusion + attention module (FA- SSD)

    5ddfda64206e0679a820d6119e6a79ee.png

    7fe1a24cf9d0c71f9221692ab8a3e0aa.png

    红色框是GT,绿色框是预测的

    48b9ef75bcfe00eb2ac99272fd427faf.png

    注意力模块的可视化。有些通道关注目标,有些通道关注上下文。conv4_3上的注意模块具有更高的分辨率,因此与conv7上的注意相比,可以关注更小的细节。

    © THE END 

    转载请联系本公众号获得授权

    f5155ed3268ac2c10eeedfa378776017.gif

    计算机视觉研究院学习群等你加入!

    计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

    35c9fd5374c7780258d9c2e9dbf6ffdc.png

    扫码关注

    计算机视觉研究院

    公众号ID|ComputerVisionGzq

    学习群|扫码在主页获取加入方式

     往期推荐 

    🔗

    • CVPR21最佳检测:不再是方方正正的目标检测输出(附源码)

    • Sparse R-CNN:稀疏框架,端到端的目标检测(附源码)

    • 利用TRansformer进行端到端的目标检测及跟踪(附源代码)

    • 细粒度特征提取和定位用于目标检测(附论文下载)

    • 特别小的目标检测识别(附论文下载)

    • 目标检测 | 基于统计自适应线性回归的目标尺寸预测

    • 目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载)

    • SSD7-FFAM | 对嵌入式友好的目标检测网络,为幼儿园儿童的安全保驾护航

    • 目标检测新方式 | class-agnostic检测器用于目标检测(附论文下载链接)

    • 干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测(致敬袁老)

    • CVPR 2021 | 不需要标注了?看自监督学习框架如何助力目标检测

  • 相关阅读:
    从Linux Bridge引发的网桥、交换机与路由器区别探究
    谷粒商城 高级篇 (十一) --------- Spring Cache
    初识多线程编程
    【OpenVI】AIGC纪元,兔年AI绘画实践
    【无标题】
    sql server数据库连接不上
    效果最大化广告系列的优势所在!
    从单车智能到车路协同,均胜电子正在加快智能驾驶商业化进程
    在Spring Boot中如何实现异常处理?
    通用串行总线USB接口——基础总结(USB版本演进、接口类型、电气特性、拓扑结构、USB硬件接口实现)
  • 原文地址:https://blog.csdn.net/gzq0723/article/details/125454184
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号