码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 通用场景图像分割


    目录

    • 通用场景图像分割
      • 1 Pascal VOC数据集
      • 2 语义分割
        • 2.1 什么是语义分割
        • 2.2 语义分割的用处
        • 2.3 算法研究阶段
        • 2.4 全卷积网络
      • 3 FCN-卷积化
        • 3.1 FCN-卷积化的降维问题
        • 3.2 FCN-反卷积
        • 3.3 FCN-卷积/转置卷积的参数关系
        • 3.4 上采样的三种实现
      • 4 反池化
        • 4.1 反池化操作
        • 4.2 反卷积与反池化
      • 5 FCN-跳层结构
        • 5.1 FCN构架图例
        • 5.2 使用AlexNet构建FCN
        • 5.3 FCN训练
        • 5.4 FCN的基础网络性能

    通用场景图像分割

    图像分割
    所谓图像分割指的是根据灰度、颜色、纹理和形状等特征把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,“而在不同区域间呈现出明显的差异性。

    1 Pascal VOC数据集

    视觉识别类竞赛的鼻祖,是包含了物体分类、目标检测、图像分割等任务。后续的ImageNet 竞赛的任务设置就基本沿用了它的设定。给定自然图片, 从中识别出特定物体,待识别的物体有20类∶
    person,bird, cat, cow, dog, horse, sheep,aeroplane, bicycle, boat, bus, car, motorbike, train,bottle, chair, dining table, potted plant, sofa, tv/monitor

    2 语义分割

    2.1 什么是语义分割

    目标:从像素水平上,理解、识别图片的内容;根据语义信息分割。
    输入:图片
    输出:同尺寸的分割标记(像素水平);每个像素会被识别为一个类别。
    在这里插入图片描述

    2.2 语义分割的用处

    机器人视觉和场景理解;
    辅助、自动驾驶;
    医学X光
    在这里插入图片描述

    2.3 算法研究阶段

    2015之前∶手工特征+图模型(CRF)
    2015开始∶深度神经网模型
    思路∶改进CNN,并使用预训练CNN层的参数
    传统CNN的问题:后半段网络无空间信息;输入图片尺寸固定
    全卷积网络(Fully Convolutional Networks):所有层都是卷积层;解决降采样后的低分辨率问题

    2.4 全卷积网络

    全卷积化:将所有全连接层转换成卷积层;适应任意尺寸输入,输出低分辨率分割图片
    反卷积:将低分辨率图片进行上采样,输出同分辨率分割图片
    跳层结构:精化分割图片
    在这里插入图片描述

    3 FCN-卷积化

    基础CNN网络:AlexNet,VGG16,GooLeNet
    卷积化后的核尺寸(通道数,宽,高):
    FC6—>(1x1,4096)
    FC7—>(1x1,4096)
    FC8—>(1x1,类别N)
    分辨率降低32倍:5个卷积层;每层降2倍

    3.1 FCN-卷积化的降维问题

    在这里插入图片描述

    3.2 FCN-反卷积

    卷积的逆操作:小数步长1/f;卷积核尺寸不变。
    前向和后向传播:对应于卷积操作的后向和前向传播,优化上做颠倒;反卷积核是卷积核的转置,学习率为0。
    也叫转置卷积。
    可以拟合出双线性插值
    在这里插入图片描述

    3.3 FCN-卷积/转置卷积的参数关系

    步长:1;padding;0
    在这里插入图片描述
    在这里插入图片描述

    步长>1;padding>0;a=i+2p-k整除s
    在这里插入图片描述
    在这里插入图片描述

    3.4 上采样的三种实现

    双线性插值∶特点是不需要进行学习,运行速度快,操作简单。反卷积∶是为了还原原有特征图,类似消除原有卷积的某种效果,所以叫反卷积
    反池化∶在池化过程中,记录下池化后元素在对应kernel中的坐标,作为反池化的索引。
    在这里插入图片描述

    4 反池化

    4.1 反池化操作

    记录池化时的位置
    形成“池化索引”
    将输入特征按记录位置摆放回去
    在这里插入图片描述

    4.2 反卷积与反池化

    反卷积与反池化之间最大的区别在于反卷积过程是有参数要进行学习的。理论上反卷积可以实现反池化,只要卷积核的参数设置的合理。
    在这里插入图片描述

    5 FCN-跳层结构

    原因:直接使用32倍反卷积得到的分割结果粗糙。
    使用前2个卷积层的输出做融合
    跳层:Pool4和Pool3后会增加一个1x1卷积层做预测
    较浅网络的结果精细,较深网络的结果鲁棒
    在这里插入图片描述

    5.1 FCN构架图例

    在这里插入图片描述

    5.2 使用AlexNet构建FCN

    第一步:
    使用AlexNet作为初始网络,保留参数
    舍弃全连接层
    在这里插入图片描述

    第二步:
    替换为两个同深度的卷积层(4096,1,1)
    追加一个预测卷积层(21,1,1)
    追加一个步长为32的双线性插值反卷积层
    在这里插入图片描述

    第三步:
    对最终层Conv7结果2倍上采样
    提趣Pool4输出,追加预测卷积层(21,1,1)、
    相加融合
    追加一个步长为16的双线性插值反卷积层
    在这里插入图片描述

    第四步:
    对上次融合结果2倍上采样
    提取Pool3输出,追加预测卷积层(21,1,1)
    相加融合
    追加一个步长为8的双线性插值反卷积层
    在这里插入图片描述

    5.3 FCN训练

    卷积层:前5个卷积层使用初始CNN网络的参数;剩余第6和第7卷积层初始化为0
    反卷积层:最后一层反卷积层固定为双线性插值,不做学习;剩余反卷积层初始化为双线性插值,做学习

    5.4 FCN的基础网络性能

    在这里插入图片描述

  • 相关阅读:
    ONNX YOLOv6目标检测、GitHub搜索引擎、AI前沿论文 | ShowMeAI资讯日报 #2022.07.03
    9个li+CSS实现七夕表白爱心动画&&1个h1+CSS实现跑马灯动画表白文字
    【测试人生】UE4大世界游戏寻路效果自动化测试
    vulnhub靶机Thoth-Tech
    安卓逆向之双剑合璧实现内存扫描
    学习笔记——Java入门第一季
    如何解决基因行业海量数据传输难题?镭速传输给出答案
    【BurpSuite】插件开发学习之J2EEScan(下)-主动扫描(31-40)
    VUE快速入门-5
    CC1310F128RSMR Sub-1GHz射频微控制器 - MCU 433MHz 868MHz 915MHz ULP Wireless MCU
  • 原文地址:https://blog.csdn.net/weixin_45649258/article/details/124830356
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号