码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 9月1日目标检测学习笔记——通用物体检测


    文章目录

    • 前言
    • 一、YOLO v1
    • 二、YOLO v2
    • 三、YOLO v3
    • 四、物体检测实战
      • 1、COCO 数据集
      • 2、YOLO v3 环境搭建
        • (1)、配置文件
        • (2)、训练


    前言

    本文为9月1日目标检测学习笔记——通用物体检测,分为四个章节:

    • YOLO v1;
    • YOLO v2;
    • YOLO v3;
    • 物体检测实战。

    一、YOLO v1

    • 图像被分成 s×s 个格子;
    • 包含 GT 物体中心的格子负责检测相应的物体;
    • 每个格子预测 B 个检测框及其置信度,以及 C 个类别概率;
    • bbox 信息 (x, y, w, h) 为物体的中心位置相对格子位置的偏移、宽度和高度,均被归一化;
    • 置信度反映是否包含物体以及包含物体情况下的准确度。

    1

    • 网络结构:

      • 小卷积:1×1 和 3×3;
      • FC 输出为:S×S×(B×5+C).
    • 损失函数:

      • Loss 函数:均方和误差;
      • 坐标误差、IoU 误差和分类误差。

    二、YOLO v2

    2

    • 改进:

    • 引入 Anchor box:

      • 预测 bbox 的偏移;
      • 输入尺度:416;
      • max pooling 下采样。
    • 输出层:卷积层代替全连接层;

    • 联合使用 coco 和 imagenet 物体分类标注数据;

    • 取消了 dropout,均使用 Batch Normalization;

    • 高分辨率分类器;

    • Anchor boxes;

    • 细粒度特征:

      • 添加 pass through layer,把浅层特征图连接到深层特征图。
    • Multi-scale Training:

      • 每隔几次迭代后,微调网络的输入尺寸。
    • 主干网络: Darknet-19:

      • 卷积:3×3;
      • global average pooling。

    三、YOLO v3

    • 改进:
      • 多尺度预测(类 FPN);
      • 更好的分类器:binary cross-entropy loss;

    四、物体检测实战

    • 场景:

    3

    1、COCO 数据集

    • annotation数据格式:

    4
    5

    2、YOLO v3 环境搭建

    6

    • DarkNet 特性:
      • C语言实现;
      • 支持 CPU 与 GPU(CUDA/cuDNN);
      • 轻量、灵活,适合用来研究底层;
      • 与 Caffe 的实现存在相似的地方。

    (1)、配置文件

    • Makefile.cfg:
    GPU=1
    CUDNN=1
    OPENCV=1
    OPENMP=0
    DEBUG=0
    
    • 1
    • 2
    • 3
    • 4
    • 5

    (2)、训练

    • yolov3.cfg:
    batch=64
    subdivisions=16
    width=608
    height=608
    channels=3
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • coco.data:
    classes= 80
    train  = /home/pjreddie/data/coco/trainvalno5k.txt
    valid  = coco_testdev
    #valid = data/coco_val_5k.list
    names = data/coco.names
    backup = /home/pjreddie/backup/
    eval=coco
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

  • 相关阅读:
    外包干了5天,技术退步明显。。。。。
    小程序商城免费搭建之java商城 电子商务Spring Cloud+Spring Boot+二次开发+mybatis+MQ+VR全景+b2b2c
    FileInputStream文件字节输入流
    【神印王座】龙皓晨竟然上了头版头条!内容违背,新闻真实性原则
    ora2pg使用记录
    java毕业生设计医护监视系统计算机源码+系统+mysql+调试部署+lw
    C# Onnx Yolov8 Detect 指纹检测
    ik分词器是什么,有那些配置? ik_smart和ik_max_word的两个分词算法有何区别?
    用于微小目标检测的上下文扩展和特征细化网络
    pandas库--DataFrame常用操作
  • 原文地址:https://blog.csdn.net/Ashen_0nee/article/details/126636976
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号