• 【yolov3】yolov3原理详解


    yolov4,yolov5都是在yolov3的基础上做的更改。

    一.yolov3骨干网络

    52个卷积层,一个全连接层,并且里面加了残差连接。

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    每一层的输入输出大小图

    在这里插入图片描述

    二.输入输出

    如上图所示

    输入 416x416x3
    输出 三个 feature map
    13x13x255
    26x26x255
    52x52x255
    
    • 1
    • 2
    • 3
    • 4
    • 5

    输出的255是怎么来的?

    每个gred cell生成三个锚框,每一个锚框对应一个预测框,每一个预测框有 5(x,y,w,h,置信度) + 80(80个类别的条件概率) 
    3x85=255
    
    • 1
    • 2

    多尺度输出的作用

    一共9个锚框,一个尺度分配三个
    grid cell为13x13,对应输入图像的感受野是32x32
    grid cell为26x26,对应输入图像的感受野是16x16
    grid cell为52x52,对应输入图像的感受野是8x8
    
    • 1
    • 2
    • 3
    • 4
    13x13负责预测大物体,分配大的锚框。
    26x26负责预测中等大小的物体,分配中等大小的锚框。
    52x52负责预测小物体,分配小的锚框。
    
    • 1
    • 2
    • 3

    三.正样本负样本

    在这里插入图片描述
    假如蓝框是真实框,那么与蓝框IOU最大的是正样本。
    与蓝框IOU超过一个阈值,但IOU不是最大,则不参与
    与蓝框IOU低于一个阈值,则为负样本

    四.yolov3损失函数

    在这里插入图片描述

    正样本对中心点坐标进行回归
    正样本的置信度和类别损失:正样本置信度标签为1
    负样本置信损失:负样本置信度标签为0
    
    • 1
    • 2
    • 3

    五.训练过程

    在这里插入图片描述

    六.测试过程

    在这里插入图片描述

    去掉置信度小于某个阈值的框
    再用NMS将同一个物体重复预测的框去掉
    
    • 1
    • 2
    NMS原理:按照置信度排序,取最大的置信度的框,让它与其它框做IOU,当IOU与置信度最大的框超过某个阈值,就视为与置信度最大的框重复预测,就把它去掉。然后再找出除上一个最大的置信度框之外最大的置信度框,重复上述过程
    
    • 1

    优点

    在这里插入图片描述

    即发挥了深层网络抽象的特征。
    也充分利用了浅层网络细粒度,像素级的信息。

    可以对不同尺度的物体进行预测。

    补充

    下采样

    在卷积神经网络中,下采样通常是指对输入数据进行降采样,以减少数据的维度和计算复杂度。下采样倍数表示采样后的数据相对于原数据的减少比例。
    
    如果下采样倍数为3,那么采样后的数据量将是原数据量的1/3。下采样可以通过池化(pooling)或丢弃(discarding)数据等方式实现。
    
    例如,对于一个输入数据为100x100的图像,如果进行3x3的下采样操作,那么采样后的图像大小将为33x33。这样可以减少网络的输入大小,从而减少计算量和过拟合的风险,同时保留重要特征,提高模型的泛化能力。
    
    需要注意的是,下采样倍数并不是任意设定的,它通常根据具体任务和数据集来确定,同时也需要考虑采样的效果和计算资源之间的平衡。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    参考链接

    https://www.bilibili.com/video/BV1Vg411V7bJ/?spm_id_from=333.788.recommend_more_video.0&vd_source=ebc47f36e62b223817b8e0edff181613

  • 相关阅读:
    深入理解操作系统中进程与线程的区别及切换机制(下)
    Xubuntu22.04之绘制正弦波(一百七十八)
    WakaTime一个用于跟踪和分析编程时间的工具
    常用Docker项目合集
    创建SpringBoot项目
    第44期:无主键分区表该不该使用
    AMD-Xilinx技术日 信息汇总(1)
    高考志愿填报:选择好专业还是好学校?
    C语言题解——倒置字符串(剑指Offer 第58题)
    JAVASE 第二十三天
  • 原文地址:https://blog.csdn.net/qq_42864343/article/details/133342396