• YOLOv4 论文总结


    贡献:

    1.有效且强大的模型,常规GPU(1080ti or 2080ti)可得到实时、高质量的检测结果。

    2.在训练中,验证 Bag-of-Freebies 和 Bag-of-Specials 方法

    3.提出了两种数据增强手段,马赛克和自对抗训练(SAT)

    4.修改了最先进的方法,更有效且适合单GPU训练。

    views:

    1.简单说就是一个拼接怪,把大家提出的模块和提高检测的手段用到了一起,进行了丰富的实验

    2.值得一提的是对整个目标检测常用的手段和发展进行了总结,本文的亮点恰恰是在Related Work,而Method只提了下采用什么模块。

    ideas:

    可以在后续的检测算法用采用其中的一部分功能。

    摘要:一些通用功能可以提高网络的性能的,认为包括:Weighted-Residual-connection(WRC) 加权残差连接、Cross-Stage-Partial-connections (CSP) 跨阶段部分连接, Cross mini-Batch Normalization (CmBN) 跨小批量标准化, Self-adversarial-training (SAT) 自对抗训练  and  Mish-activation Mish激活。我们使用以上新功能和 Mosaic data augmentation 马赛克数据增强、DropBlock 正则化 、CIOU Loss 来实现最新结果。

    1.Introduction

          指出目标检测算法应有较好的实时性,并且可以在单个常规GPU上进行训练和推理。

          目的是设计快速的生成系统和优化并行计算。常规GPU可得到实时、高质量的检测结果。

    2.Related Work(本文亮点)

    2.1 Object detection models

          现代检测器通常包括两部分,一个是在ImageNet上预训练的 backbone,另一个是用来预测对象类别和边界框的 head 。还有一些在backbone和head之间插入的层,称为neck。

    2.2 Bag of freebies

    通常检测算法是线下训练,针对训练采用的技巧和策略,在推理是无代价,称为“免费赠品”。主要包括:数据增强,处理语义分布不平衡、边界框回归。

    2.3 Bag of specials

    一些插入的模型或post-processing,称为“特价品”,可以花费少量代价提高网络的性能。

    3.Method

    介绍了yolov4采用了上面的哪些结构,提出了创新的马赛克增强和自对抗训练,篇幅一页的样子。

    4.conclusion

    SOTA性能,验证了许多tricks,可为后续工作作为参考。

  • 相关阅读:
    玩转数据-大数据-Flink SQL 中的时间属性
    通关GO语言02 数据类型:你必须掌握的数据类型有哪些?
    python-opencv车牌检测和定位
    含文档+PPT+源码等]精品基于SSM的农产品交易平台[包运行成功]Java毕业设计SSM项目源码论文
    详解自定义类型:结构体,位段,枚举,联合
    cdn实战-七牛云
    使用反射拼接SQL语句 和 使用 反射 + 注解 拼接SQL语句
    开发工具介绍
    机器学习赋予用户“超人”的能力来打开和控制虚拟现实中的工具
    Flink 读取MySQL数据入Iceberg
  • 原文地址:https://blog.csdn.net/qq_37424778/article/details/133808489