【YOLO模型】（4）--YOLO V3超超超超详解！！!

YOLO V3

YOLO V3是由Joseph Redmon等人在2018年推出的一款目标检测算法。作为YOLO系列的第三代版本，它在实时性和准确性上取得了显著的提升。YOLO V3的核心思想是将目标检测问题转化为一个回归问题，通过一个统一的神经网络同时预测物体的类别和位置。

相较于其他的网络模型，YOLO V3有着显著的优越性以及高效性：

在这里插入图片描述

为了检测不同大小的物体：

在这里插入图片描述

不太理想的两种方法：

金字塔：每层特征图卷积预测结果。

单一：将多层特征图融合在一起，这样就和普通的卷积神经网络一样了，没什么意义。

在这里插入图片描述

上述两种方法有一个缺点：不利于yolo的检测速度。

理想方法：

从大的融合向小的，接着小的返回影响大的特征图输出：

在这里插入图片描述

残差网络最大特点：可以搭建更大、更深层次的网络。

引入resnet的思想，堆叠更多的层来进行提取：

在这里插入图片描述

YOLO V3采用了Darknet-53作为骨干网络。Darknet-53是一个基于ResNet残差网络思想的深度学习模型，包含53个卷积层，每个卷积层后跟随批量归一化层和Leaky ReLU激活函数。这种结构使得网络在提取特征时更加高效，同时避免了过拟合的问题。

特点：没有池化层和全连接层，只有卷积层。

在这里插入图片描述

从上方可以发现，网络结构共有三个输出：

YOLO3延续了K-means聚类得到先验框的尺寸方法，为每种下采样尺度设定3种先验框，总共聚类出9种尺寸的先验框。

在这里插入图片描述

在之前的判断类别中，我们使用的是logistic函数。

指的是未经过softmax函数处理的网络输出，也就是各个类别的得分（score）或概率（probability）值，因此沿用了logit这个术语。在逻辑回归（logistic regression）模型中，logits表示某个事件发生的概率与不发生的概率之比的对数值。

而softmax层适用于多分类的任务中：

在这里插入图片描述

本篇介绍了：

相关阅读:
分类任务系列学习——总述
每日leetcode[最后一个单词的长度】
【网络驱动】GMAC 系统框架
vue3代码检查以及格式化配置
Telent
不规则形状的图例制作
python篇----进程+线程
基于yolov5+streamlit目标检测演示系统设计
两个多项式相加（顺序表&&链表）
java计算机毕业设计springboot+vue南天在线求助系统

原文地址：https://blog.csdn.net/m0_74896766/article/details/143315302