码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习之 11 残差网络的实现


    本文是接着上一篇

    目录

    残差网络

    1 堆叠多层卷积

     2 残差网络结构:用来解决深层网络训练难度过大的问题

     ◼  残差网络的实现

      ◼  残差模型实验结果

     ◼  残差模型与同等深度卷积的对比


    残差网络

    1 堆叠多层卷积

    理论上 ,深层的网络效果不会比浅层网络差, 因为深层网络的前几层理论可以学习到一个 输
    入等于输出的映射 ,然后后几层 等于浅层网络 , 则效果至少相同。
    层数越深,性能反而越差。 反向传播路径太长, 训练难度 增加。
    右侧的实验结果表明实际上 深层的网络效果反而更差 ,且训练集的效果也很差, 说明不是过拟合。 

     

     2 残差网络结构:用来解决深层网络训练难度过大的问题

    加入残差之后,我们只需要将第二次卷积的结果和原始的输入两者加起来,然后带入一个激活函数,这样的话,我们的残差网络结构就可以实现了。

     ◼  残差网络的实现

    • 若卷积后的结果与输入X的shape不同, 则不能直接相加;
    • 当步长不为1,图片大小发生变化 (padding不随步长改变的情况);
    • 当通道数与输入通道不同,图片通道数发生变化;
    • 使用一个1x1的卷积核来改变X的shape形状,使得能与卷积后的结果shape相匹配;

      ◼  残差模型实验结果

    • 在训练集上Loss持续下降,准确率持续上升,说明模型有一定的学习能力;
    • 在测试集上的效果较差,且波动明显,可能是lr过大,或者模型泛化能力差;
    • 由于当前卷积只有三层,只是残差操作的一个演示,所以效果并不理想,实际上在浅层网络上一般也不直接使用残差网络;

    在设计网络进行实验的过程中,如果发现网络比较深,那么可以考虑加入残差网络试试效果会不会好一点。

    • 模型在训练集上持续训练损失最终降到接近0,准确率也达到了100%,说明模型的容量是足够的;
    • 在测试集上,Loss在第50轮附近持续上升,而此时训练集的Loss还在持续下降,说明发生了过拟合现象;
    • 最终在此参数下ResNet-18在测试集上能达到的平均准确率为86.85%;

     

     ◼  残差模型与同等深度卷积的对比

    • 卷积为红色与绿色曲线,残差为黄色和蓝色曲线
    • 可以看到在深层模型下,无论是Loss还是准确率,普通卷积的曲线(红色)比残差的曲
    线(黄色)在训练后期的波动更大,说明残差网络的加入确实可以帮助模型更好的训练

     

  • 相关阅读:
    windows10 python pip安装django并创建demo
    oracle实验四(视图、索引和完整性)
    MoSE论文中Sequential Synthetic Dataset生成代码(时间序列多任务学习数据集)
    外包干了3个月,技术退步明显。。。。。
    2022年物联网的5大趋势
    一、mysql 5.7和8.0安装
    Mybatis缓存机制
    【ARM 安全系列介绍 3.7 -- SM4 对称加密算】
    神经网络的训练与测试,神经网络显著性检测
    Xinlinx zynq7045国产替代 FMQL45T900全国产化 ARM开发板
  • 原文地址:https://blog.csdn.net/qq_45956730/article/details/126166735
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号