码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【YOLO模型】(4)--YOLO V3超超超超详解!!!


    文章目录

    • YOLO V3
      • 一、改进
      • 二、三种scale
      • 三、残差连接
      • 四、核心网络结构
        • 1. 结构
        • 2. 输出与先验框关系
      • 五、softmax层替代
    • 总结

    YOLO V3

    YOLO V3是由Joseph Redmon等人在2018年推出的一款目标检测算法。作为YOLO系列的第三代版本,它在实时性和准确性上取得了显著的提升。YOLO V3的核心思想是将目标检测问题转化为一个回归问题,通过一个统一的神经网络同时预测物体的类别和位置。

    相较于其他的网络模型,YOLO V3有着显著的优越性以及高效性:

    在这里插入图片描述

    一、改进

    1. YOLO V3最大的改进就是网络架构,使其更适合小物体检测。
    2. 特征做的更细致,融入多持续特征图信息来预测不同规格物体。
    3. 先验框更丰富,共9个,分为小、中、大三种scale,每种有三个规格。
    4. softmax改进,预测多标签任务。

    二、三种scale

    为了检测不同大小的物体:

    在这里插入图片描述

    • scale变换经典方法:

    不太理想的两种方法:

    金字塔:每层特征图卷积预测结果。

    单一:将多层特征图融合在一起,这样就和普通的卷积神经网络一样了,没什么意义。

    在这里插入图片描述

    上述两种方法有一个缺点:不利于yolo的检测速度。

    理想方法:

    从大的融合向小的,接着小的返回影响大的特征图输出:

    在这里插入图片描述

    三、残差连接

    残差网络最大特点:可以搭建更大、更深层次的网络。

    引入resnet的思想,堆叠更多的层来进行提取:

    在这里插入图片描述

    四、核心网络结构

    YOLO V3采用了Darknet-53作为骨干网络。Darknet-53是一个基于ResNet残差网络思想的深度学习模型,包含53个卷积层,每个卷积层后跟随批量归一化层和Leaky ReLU激活函数。这种结构使得网络在提取特征时更加高效,同时避免了过拟合的问题。

    特点:没有池化层和全连接层,只有卷积层。

    1. 结构

    在这里插入图片描述

    2. 输出与先验框关系

    从上方可以发现,网络结构共有三个输出:

    YOLO3延续了K-means聚类得到先验框的尺寸方法,为每种下采样尺度设定3种先验框,总共聚类出9种尺寸的先验框。

    在这里插入图片描述

    五、softmax层替代

    在之前的判断类别中,我们使用的是logistic函数。

    指的是未经过softmax函数处理的网络输出,也就是各个类别的得分(score)或概率(probability)值,因此沿用了logit这个术语。在逻辑回归(logistic regression)模型中,logits表示某个事件发生的概率与不发生的概率之比的对数值。

    而softmax层适用于多分类的任务中:

    在这里插入图片描述

    总结

    本篇介绍了:

    1. YOLO V3的网络架构只有卷积层,且有三个输出。
    2. YOLO V3先验框共有9个,分为小、中、大三种scale,每种有三个规格。
    3. 引入残差网络思想,搭建更深层次的网络。
    4. 使用softmax函数替代logistic函数,适用于多分类的任务。
  • 相关阅读:
    计算机系统的基本概念
    pixhawk飞控和自习开发的stm32芯片通讯问题
    软件设计原则-里氏替换原则讲解以及代码示例
    为什么要做CRM?
    WotoKOL卧兔网络五周年深耕海外红人营销,WotoHub网红营销SAAS工具新推海外分销功能
    IO读写的基本规则
    Springboot 订餐管理系统idea开发mysql数据库web结构java编程计算机网页源码maven项目
    消息队列这么多,用哪个哟?
    MT4和MT5的共同点,anzo capital昂首资本说一个,没人有意见吧
    【Linux】冯诺依曼体系结构&&初识操作系统
  • 原文地址:https://blog.csdn.net/m0_74896766/article/details/143315302
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号