• 卷积神经网络入门


    卷积神经网络

    基本框架

    在这里插入图片描述
    上图为LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.中提出的-LeNet-5的框架,后续的卷积神经网络基本都是在此基础上进行改动和扩展的。
    在这里插入图片描述
    输入图像会经过卷积层、池化层和全连接层,最终得到输出结果。我们可以对其进行这样简单的理解:卷积层用于提取特征、池化层为了减少参数量进行下采样,全连接层将之前提取的特征展成一维,通过一些很难理解的玄学操作得到最终的结果。
    在这里插入图片描述
    最终的结果可以是对图像进行判定。
    在这里插入图片描述
    比如判定这张图片是不是猫。
    在这里插入图片描述
    也可以是对其进行分类,计算出其是各种动物的概率,输出可能性最大的结果。
    下面是每一层步骤的详细过程。

    卷积层

    在这里插入图片描述
    卷积层是通过卷积核对图像进行遍历,输出遍历到的对应位置与卷积核的对应位置的相乘后的和,生成feature map。
    在这里插入图片描述
    上图为步长为1进行卷积的过程。
    在这里插入图片描述
    每次与卷积核进行卷积的图像部分被称为感受野。
    在这里插入图片描述
    如上图所示,一张5x5的图像通过2x2的卷积核卷积以后,生成的feature map的大小为4x4。
    在进行卷积的时候,边缘的像素块只进行了一次运算,而内部像素却进行了多次运算。边缘的像素块的地位与内部像素是一样的,运算次数却不同,这不利于更好的提取特征。
    在这里插入图片描述
    因此,一般通过对外圈补0后再进行卷积。这样生成的feature map和原图像大小相同。
    在这里插入图片描述
    对于彩色图像,也会有针对对每一层卷积的卷积核进行卷积,并将每一次卷积出的结果赋予不同的权值生成最终的feature map。
    在这里插入图片描述
    以下图举例,使用下面的卷积核可以将图像中的三角形特征提取出来。
    在这里插入图片描述
    使用提取眼镜、鼻子、耳朵、嘴唇等作为卷积核可以提取出人脸的这一部分特征。
    在这里插入图片描述
    利用如下所示卷积核可以将图像的边缘特征提取出来。
    在这里插入图片描述
    可以看到,通过不同的卷积核,可以对图像不同的特征进行提取。

    池化层

    为了减少参数量,避免过拟合,同时实现平移不变性,在卷积层之后要进入池化层。
    在这里插入图片描述
    上图的最大池化就是选取区域内的最大值。经过池化后的feature map会变小。
    在这里插入图片描述
    如上图,即使第三行特征经过平移,使用相同的卷积核卷积后再进行池化,仍然可以得到的同样的结果。这就是平移不变性。

    全连接层

    与卷积的每次只针对当前的感受野不同,全连接层会将数据展成一维,且每一个数据都与下一层所有数据相连。
    在这里插入图片描述
    以一个人的图像为例。将眼镜、鼻子、耳朵和嘴巴的特征提取通过卷积出来以后,进入池化层下采样,然后通过全连接层进行最后的判断。
    在这里插入图片描述

  • 相关阅读:
    使用React Hooks实现表格搜索功能
    matlab洗碗机节水模型的优化设计-这是个课题名称,不是买洗碗机,审核的人仔细看下,谢谢
    快速安装docker-compose
    (09_22)【有奖体验】轻点鼠标,让古籍数字化“重生_
    ros2_control【B站WMGIII教学学习记录】1
    Node.js在携程的落地和最佳实践
    2022最新版-李宏毅机器学习深度学习课程-P34 自注意力机制类别总结
    iqoo的“牛皮”还能吹多大?
    小程序页面导航和页面事件
    【Vue3】--setup两个属性+computed+watch【练习代码已上传至Gitee】
  • 原文地址:https://blog.csdn.net/qq_44672855/article/details/127855278