码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • FastestDet:比yolov5更快!更强!全新设计的超实时Anchor-free目标检测算法(附源代码下载)...


    关注并星标

    从此不迷路

    计算机视觉研究院

    40bbb31e5e83d03033600b86a5e2aef2.gif

    0d29b8687849cabd737ae06010dcb96c.gif

    e6a160edf1a96a7a2839f6fa900f6602.png

    公众号ID|ComputerVisionGzq

    学习群|扫码在主页获取加入方式

    计算机视觉研究院专栏

    作者:Edison_G

    本篇文章转自于知乎——qiuqiuqiu,主要设计了一个新颖的轻量级网络!

    代码地址:https://github.com/dog-qiuqiu/FastestDet

    01

    概述

    FastestDet是设计用来接替yolo-fastest系列算法,相比于业界已有的轻量级目标检测算法如yolov5n, yolox-nano, nanoDet, pp-yolo-tiny, FastestDet和这些算法压根儿不是一个量级,FastestDet无论在速度还是参数量上,都是要小好几个数量级的(不要在拿int8的模型和我fp32的模型比体积了,不公平),但是精度自然而然也比不过。FastestDet是针对计算资源紧缺的ARM平台设计的,突出单核效能,因为在实际业务场景中,不会把所有CPU资源都给推理框架做模型推理的,假如说你想在例如树莓派, RK3399, RK3568去跑实时目标检测,那么FastestDet是比较好的选择,或者移动端上不想占用太多cpu资源,也可以去用单核并设置cpu sleep去推理FastestDet,在低功耗的条件下运行算法。

    117c7dc49c8c99c7dab740b6b9cdeab2.png

    02

    新框架算法

    先说下FastestDet的几个重要特性: 

    • 单轻量化检测头

    • anchor-free

    • 跨网格多候选目标

    • 动态正负样本分配

    • 简单的数据增强

    下面我就一个个去详细讲下吧:

    单轻量化检测头

    这个是对网络结构上对算法模型进行优化,主要是提升算法运行速度,简化后处理步骤,大家可以先看下这块的网络结构:

    f51cd57bbf46d7e840e198d48673139a.png

    其实多检测头设计的是为了适应检测不同尺度物体目标,高分辨率的检测头负责检测小物体,低分辨的检测头负责检测大物体,一种分而治之的思想。

    我个人觉得根因在于感知野,不同尺度的物体所需要的感知野是不同的,而模型每层的感知野都是不一样的,包括FPN也是对不同感知野特征的汇总融合。这块单检测头我也是参考的YOLOF的思想,在网络结构中,采用类似inception的5x5分组卷积并行网络结构,期待能融合不同感知野的特征,让单个检测头也能适应检测不同尺度的物体。

    Anchor-Free

    原先的anchor-base算法在训练模型都需要对数据集进行anchor-bias的运算,anchor-bias可以理解为对数据集中标注物体的宽高进行聚类,得到一组先验宽高,网络在这组先验宽高的基础上去优化预测框的宽高。FastestDet采用的是anchor-free算法,模型是直接回归gt于特征图宽高的scale值的,是没有先验宽高。这种方法可以简化模型后处理。而且对于anchor-base算法每个特征图的特征点是对应N个anchor候选框的,而这种anchor-free每个特征图的特征点只对应一个候选框,所以在推理速度上也是有优势的。

    跨网格多候选目标

    这块还是借鉴了yolov5,不单单只把gt中心点所在的网格当成候选目标,还把附近的三个也算进行去,增加正样本候选框的数量,如下图所示:

    906f71763f52962eaf2aef5fc7160ea8.png

    动态正负样本分配

    所谓的动态正负样本分配其实就是在模型训练过程去动态分配正负样本,这是有别于以前yolo-fastest的,原先yolo-fastest的anchor-bias设置好以后, 通过计算anchor-bias与gt宽高的scale,对scale卡固定阈值分配正负样本(参考yolov5的做法),而anchor-bias和gt在训练过程中都是不变的,所以正负样本分配在训练过程中也是不变的。

    而在FastestDet的正负样本分配参考的ATSS,通过设置预测框与GT计算的SIOU的均值作为分配正负样本的阈值,假如当前预测框与GT的SIOU阈值大于均值,那么为正样本,反之异然。(为什么没有参考simota?那是因为在构建cost矩阵时,不同loss的权重还得调超参,懒的调了)

    简单的数据增强

    对于轻量级的模型数据增强要慎重,本来学习能力差,脑子不怎么好使,上来给难题做可不拉跨,所以采用简单的数据增强如随机平移和随机缩放,并没有采用moscia和Mixup。

    03

    实验结果

    c4bb583b3bc47d46080168dfed9d6bd7.png

    57571c087f827f19cf4d7ffb6eb07692.png

    6d4671273d44354bee75b0e81d867296.png

    89abfe9604b4cde0e1ef39d6e7db3549.png

    © THE END 

    转载请联系本公众号获得授权

    48124683fa744b6beeb6e9914c57467a.gif

    计算机视觉研究院学习群等你加入!

    ABOUT

    计算机视觉研究院

    计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

    VX:2311123606

    8ee200ff6442f9be25819f141ed1ed25.png

    往期推荐 

    🔗

    • AI助力社会安全,最新视频异常行为检测方法框架

    • 目前精度最高效率最快存储最小的目标检测模型(附源码下载)

    • CVPR小目标检测:上下文和注意力机制提升小目标检测(附论文下载)

    • Double-Head:检测头上再创新,提升精度(附原论文下载)

    • 海康研究院出品:具有场景自适应概念学习的无监督目标检测(附论文下载)

    • 新技术:高效的自监督视觉预训练,局部遮挡再也不用担心!

    • VS Code支持配置远程同步了

    • 改进的阴影抑制用于光照鲁棒的人脸识别

    • 基于文本驱动用于创建和编辑图像(附源代码)

    • 基于分层自监督学习将视觉Transformer扩展到千兆像素图像

    • 霸榜第一框架:工业检测,基于差异和共性的半监督方法用于图像表面缺陷检测

    • CLCNet:用分类置信网络重新思考集成建模(附源代码下载)

    • YOLOS:通过目标检测重新思考Transformer(附源代码)

  • 相关阅读:
    vuex模块化,以及如何借助mapActions,mapMutations生成对应的方法
    netty系列之:在netty中使用native传输协议
    2021-arXiv-The Power of Scale for Parameter-Efficient Prompt Tuning
    vue中通过JavaScript实现web端鼠标横向滑动&触控板滑动效果-demo
    win11改成win7界面的设置方法
    如何将OAK集成到你的系统中?
    ps神经网络滤镜安装包,ai神经网络滤镜安装包
    mysql数据库增量备份方案、备份计划(InsCode AI 创作助手)
    Python 基础问题
    url请求头信息
  • 原文地址:https://blog.csdn.net/gzq0723/article/details/133222891
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号