码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 卷积神经网络(CNN)【第三章】


    文章目录

    • Convolutional Neural Network (CNN)
      • Image Classification
      • Convolutional Layer
      • Pooling — Max Pooling
    • Spatial Transformer Layer

    Convolutional Neural Network (CNN)

    Image Classification

    这类问题需要将图像的输入大小一致化

    在这里插入图片描述

    Tensor:超过二维的矩阵

    在这里插入图片描述

    将图片打平然后作为网络的输入

    在这里插入图片描述

    由于输出较多,如果使用 Fully connected Network 很容易出现 Overfitting。

    那如何避免 Overfitting ?

    在这里插入图片描述

    通过观察我们可以发现把图片的某些部分作为输入就够了。

    将 3 ∗ 3 ∗ 3 3*3*3 3∗3∗3 的一块区域 作为一个 Receptive Field,每个 Neuron 只需要考虑自己的 Receptive Field 中的东西,再将其拉直,然后作为一个 Neuron 的输入。

    在这里插入图片描述

    Receptive Field 大小等可以自己定义。

    在这里插入图片描述

    Receptive Field 典型的设置:

    一般来说 Channel 都会被考虑,所以我们只需要考虑 高和宽了,也就是 Kernel Size,一般使用 3 ∗ 3 3 * 3 3∗3 的 Kernel Size。

    移动的范围:Stride(步长)。

    超出范围(overlap)的解决办法:padding 扩充图片。

    在这里插入图片描述
    在这里插入图片描述

    对有的 Receptive Field 共享参数,因为输入不一样,输出不一样,而如果输入一样的话,其输出就一样。

    在这里插入图片描述

    两个 Receptive Field 都具有多个 Neuron,如果他们的第一个 Neuron 共享参数,这组参数就叫做 filter 1。

    在这里插入图片描述
    由于一张图片不需要看全部而只需要看一小部分,所以出现了 Receptive Field 的概念,所以这个 Neuron 的弹性变小了,加入参数共享之后,有的 Neuron 的参数就会一模一样。

    Fully Connected 的 Network 它可以自己决定 Neuron 看一张图片的全部还是一部分。

    在这里插入图片描述

    Convolutional Layer

    有一排 filter,一个 filter 的大小: 3 ∗ 3 ∗ c h a n n e l 3 * 3 * channel 3∗3∗channel,filter 用于在图片里面抓取 Pattern。

    python实现的卷积神经网络CNN,无框架
    rar 4星 超过75%的资源 1.58MB
    下载

    在这里插入图片描述

    假如 channel 大小是 1,filter 是一个 3 ∗ 3 3 * 3 3∗3 的 Tensor,而 Tensor 中的数值就是 model 里面的 参数,假设这些参数已知。

    在这里插入图片描述

    这些 filter 如何在图片上侦测 pattern?

    在这里插入图片描述
    在这里插入图片描述

    新产生的 Tensor 叫做:Feture Map

    在这里插入图片描述

    第二层的 filter 的 channel 大小是 64

    在这里插入图片描述

    network 叠的越深,他所能看到的范围越就会来越大。

    在这里插入图片描述

    Neuron 对应的参数就是 filter 中的数值。

    在这里插入图片描述
    将一个 filter 扫过一张图片叫做 Convolution。而一张 filter 扫过一张图片,就相当于 Neuron 共享同一组参数。

    在这里插入图片描述

    在这里插入图片描述

    Pooling — Max Pooling

    卷积神经网络相关文献整理
    zip 0星 超过10%的资源 50.66MB
    下载

    可以发现一张图片缩小(subsampling)后看,还是可以看出图片的本质。

    在这里插入图片描述

    通过 Pooling 可以到达缩小图片的效果。
    目的:减少数据和运算量。

    在这里插入图片描述

    max pooling: x ∗ y x * y x∗y 的大小进行分组并选最大的。

    在这里插入图片描述

    在这里插入图片描述

    一般的 CNN 结构。

    在这里插入图片描述

    Spatial Transformer Layer

    CNN is not invariant to scaling and rotation

    在这里插入图片描述

    Fully connected Network 可以实现对图片进行旋转,平移,缩放(可以通过参数值来实现)。

    在这里插入图片描述
    在这里插入图片描述
    缩放/扩大
    在这里插入图片描述

    旋转

    在这里插入图片描述

  • 相关阅读:
    kafka中AR、ISR、OSR以及HW、LEO的区别
    数据库(mysql)之事务和存储引擎
    Python处理时空数据常用库案例及练习
    ASP.NET Mvc+FFmpeg+Video实现视频转码
    python数据可视化-matplotlib入门(4)-条形图和直方图
    Shopee店铺没有流量?3步教你如何诊断店铺
    修复mongodb未授权访问漏洞(漏洞编号:009711D8)
    实现一个简单的 ctrl+ f 搜索
    【STC8A8K64D4开发板】第2-8讲:片内存储器
    计算机中CPU、内存、缓存的关系
  • 原文地址:https://blog.csdn.net/qq_46456049/article/details/126291581
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号