码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 8月31日目标检测学习笔记——Faster RCNN


    文章目录

    • 前言
    • 一、Faster-RCNN
      • 1、原理
      • 2、步骤
      • 3、RoI Pooling
      • 4、网络结构
    • 二、SPPNet(Spatial Pyramid Pooling)
    • 三、Fast-RCNN
    • 四、HyperNet
    • 五、RFCN
    • 六、Light-Head RCNN
    • 七、Cascade RCNN


    前言

    本文为8月31日目标检测学习笔记,分为七个章节:

    • Faster-RCNN;
    • SPPNet(Spatial Pyramid Pooling);
    • Fast-RCNN;
    • HyperNet;
    • RFCN;
    • Light-Head RCNN;
    • Cascade RCNN。

    一、Faster-RCNN

    1、原理

    1

    2、步骤

    1. 训练分类网络(AlexNet);

    2. Fine-tuning:

      • 类别 1000 改为 20;
      • 去掉 FC 层。
    3. 特征提取:

      • 提取候选框;
    4. 训练 SVM 分类器,每个类别对应一个 SVM;

    5. 回归器精修候选框位置,利用线性回归模型判定框的准确度。

    3、RoI Pooling

    将 proposal 抠出来,然后 resize 到统一的大小:

    1. 根据输入的 image,将 RoI 映射到 featrue map 对应的位置;
    2. 将映射后的区域划分为相同大小的 sections;
    3. 对每个 section 进行 max pooling。

    4、网络结构

    2

    • 主干网络:13con + 13relu + 4pooling;
    • RPN:3×3 + 背景前景区分 + 初步定位;
    • RoI Pooling;
    • 分类+位置精确定位。

    二、SPPNet(Spatial Pyramid Pooling)

    3

    • 空间金字塔池化:
      • CNN 不同尺度输入;
      • 仅对原图提取一次卷积特征。

    三、Fast-RCNN

    结合 SSPNet 改进 RCNN:

    • RoI Pooling:单层 SSPNet。

    多任务网络同时解决分类和位置回归:

    • 共享卷积特征。

    3


    四、HyperNet

    Faster-RCNN 变种。

    4


    五、RFCN

    5

    • VGG16 ⇒ ResNet;
    • 通过 position sensitive score map 把目标的位置信息融合进 RoI pooling;
    • 耗时的卷积尽量移到前面共享的 subnetwork 上。

    六、Light-Head RCNN

    6

    • Thinner feature map:score map 维度 ⇒ 10×p×p = 490;
    • 将 k×k 的卷积 转化为 1×k 和 k×1;
    • 最后通过两个 fc 层实现分类和回归。

    七、Cascade RCNN

    7
    只有 proposal 自身的阈值和训练器所用的阈值较为接近的时候,训练器的性能最好。


  • 相关阅读:
    Shell脚本速查手册
    基于elasticsearch-8.8.2 kibana-8.8.2 搭建一个文搜图系统demo
    linux防火墙设置
    Python 逗号的巧用
    再见,CSDN
    现实与虚幻:人工智能的迷惑瞬间
    我开源了团队内部基于SpringBoot Web快速开发的API脚手架v1.6.0更新
    vue2中,vue-easytable组件的使用(三)——实现表格的虚拟滚动功能
    魔百和CM311-1A_YST、(YM)_安卓9_S905L3A_默认开启ADB_纯净精简语音_完美线刷包
    YOLOv5 backbone
  • 原文地址:https://blog.csdn.net/Ashen_0nee/article/details/126616234
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号