码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • YOLO系列解读(上)-----YOLOv1到YOLOv3梳理


    YOLO系列解读(上)

    • 1. 背景介绍
    • 2. 正文:Yolov1~Yolov3
      • 2.1 Yolov1
        • 2.1.1 Yolov1介绍
        • 2.1.2 Yolov1 小结
      • 2.2 Yolov2
        • 2.2.1 Yolov2介绍
        • 2.2.2 Yolov2小结
      • 2.3 Yolov3
        • 2.3.1 Yolov3介绍
        • 2.3.1 Yolov3小结
    • 3. 总结

    1. 背景介绍

    在这里插入图片描述

      写这篇文章的契机是6月底和7月初,Yolo v6和Yolo v7版本相继发布。其中Yolo v7还得到了darknet官方的背书。
      Yolo系列从2015年提出的Yolo(You Only Look Once),到如今已经经历了7年。它的历程可以用下图进行展示。本篇博客仅仅是对Yolo犀利中,Yolov1, Yolov2和Yolov3的梳理。

    在这里插入图片描述

    2. 正文:Yolov1~Yolov3

    2.1 Yolov1

    2.1.1 Yolov1介绍

      Yolo提出于2015年6月,在此之前的RCNN系列还是借用分类器来解决目标检测任务。而Yolo则通过一个网络直接以回归的方式来建模。具体的过程可以参看下图。这样做的好处在于训练简单并且推理迅速。
    在这里插入图片描述
      Yolo采用了如下图所示的方法
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2.1.2 Yolov1 小结

    1. Yolo并不是让已有的检测pipeline(rnn系列)更快,而是提出了一个全新的pipeline。
    2. Yolo在实时检测算法中,性能最高,可以达到double mAp的水平。一般来讲,每秒30帧以上的算法称之为实时检测算法。
    3. Yolo虽然很快,但性能并非sota。以vgg16作为backbone,距离faster rcnn的mAp还差6.8个点。主要体现在yolo的定位准确度不高。

    2.2 Yolov2

    2.2.1 Yolov2介绍

    在这里插入图片描述
    在这里插入图片描述
      在介绍一下这里面的Dimension Clusters和Location prediction方法。
    在这里插入图片描述
      最终Yolov2的性能在VOC数据集上达到了sota。(注意这里强调的是VOC数据集这个条件)。
    在这里插入图片描述

    2.2.2 Yolov2小结

    1. 在voc数据集上达到了sota。
    2. multi-scale train至今仍旧是一个比较有效的trick。
    3. 但大部分改进drawn from prior work。
    4. 论文题目为YOLO9000,想体现的分类、检测联合训练(似乎)影响力有限。
    5. 在新的benchmark(coco@0.5:0.95)上竞争力有限。
      在这里插入图片描述

    2.3 Yolov3

    2.3.1 Yolov3介绍

    在这里插入图片描述
      yolov3所使用的方法也都是基本来自于prior work。具体可以总结为如下3条:

    1. 使用Multilabel classification代替Multiclass classification。
    2. FPN(feature pyramid networks)。
    3. 新的backbone:darknet53(借鉴resnet网络的shortcut)。
      在这里插入图片描述

    2.3.1 Yolov3小结

      Yolov3适用于对速度要求快,但对IOU阈值要求相对不高的场景。这可能也是Yolo系列论文在工业界流行的原因所在。作者对新的IOU@0.5:0.95的评判标准也提出了自己的一定质疑,并引用了”Best of both worlds: human-machine collaboration for object annotation.“中的一段话:”Training humans to visually inspect a bounding box with IOU of 0.3 and distinguish it from one with IOU 0.5 is surprisingly difficult”。0.3和0.5可能有点夸张了,但0.5和0.7的区分性确实不大。
    在这里插入图片描述

    3. 总结

    在这里插入图片描述

  • 相关阅读:
    解决 MyBatis-Plus 中 ID 自增问题
    《改善对话读书笔记1:4R法》
    PCL点云处理之特征计算、特征点对匹配、配准矩阵计算,结果保存的全流程 (二百二十)
    机器人材料整理中的套-假-大-空话
    Salesforce ServiceCloud考证学习(4)
    PowerDesigner反向导入表+PowerDesigner的ER图设计+PowerDesigner连接外键的线(版本16.5)
    UE5 ChaosVehicles载具研究
    py0_二十一天计划书
    SAP ABAP内部单位外部单位转换问题
    大开眼界,Jenkins 结合 SpringCloud+K8S,打通微服一条龙技术讲解
  • 原文地址:https://blog.csdn.net/u011345885/article/details/126590968
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号