欢迎关注我的公众号 [极智视界],获取我的更多笔记分享
大家好,我是极智视界,本文解读一下 单级特征检测网络 YOLOF。
本文回顾了 one-stage 检测器的特征金字塔网络 (FPN),指出 FPN 的成功在于对目标检测中的优化问题采取了divide-and-conquer 的解决方案,而不是多尺度特征融合。从优化的角度出发,作者引入了一种替代方法来解决这个问题,即 只利用单级特征进行检测,而不是采用复杂的特征金字塔。基于简单高效的解决方案,提出了YOLOF (You Only Look One-level Feature)。在作者的方法中,提出了两个关键组件:膨胀编码器和均匀匹配,并带来了相当大的改进。在 COCO 基准上进行了大量实验,证明了该模型的有效性。YOLOF 与它的特征金字塔对应的 RetinaNet 取得了相当的结果,同时速度快2.5倍。在没有 transformer 层的情况下,YOLOF 可以以单级特征形式少 7 倍训练周期 而与DETR性能相当。在输入图片 608x608 大小的情况下,YOLOF 在 2080Ti 上达到 60fps 的速度,并能达到 44.3 mAP,比 YOLOv4 快 13%。