码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习中的模型设计


    文章目录

    • 1. 如何学会深度学习模型设计与优化
      • 1.1 深度学习之模型设计
        • 1.1.1 模型深度——性能提升的关键
        • 1.1.2 通道维度变换——基础设计单元
        • 1.1.3 模型宽度——模型表达能力与压缩关键
        • 1.1.4 残差网络——深层模型训练关键技术
        • 1.1.5 分组网络——模型压缩核心技术
        • 1.1.6 多尺度与非正常卷积——复杂任务模型性能提升的核心技术
        • 1.1.7 动态推理与注意力机制网络——模型优化核心技术
        • 1.1.8 生成对抗网络——新一代深度学习基础技术
    • 2. 深度学习之模型优化
      • 2.1 工业级网络的要求
      • 2.2 模型精简与优化的技术要点
        • 2.2.1 卷积核的使用
        • 2.2.2 卷积拓扑结构设计
        • 2.2.3 迁移学习
        • 2.2.4 自动化搜索
    • 3. 如何设计性能更强的CNN结构
      • 3.1 网络深度的设计
        • 3.1.1 为什么加深可以提升性能
        • 3.1.2 从什么样的深度开始
        • 3.1.3 网络加深容易出现的问题
      • 3.2 网络宽度的设计
        • 3.2.1 为什么需要足够的宽度——更多的宽度可以学习到更加丰富的特征
        • 3.2.2 网络宽度的特点
        • 3.2.3 宽度设计原则
      • 3.3 Dropout和BN层设计
        • 3.3.1 Dropout的好处
        • 3.3.2 使用Dropout的问题
        • 3.3.3 BN为什么好
        • 3.3.4 BN使用注意事项
      • 3.4 卷积核大小、步长、池化的设计
        • 3.4.1 步长和池化如何影响性能
        • 3.4.2 如何选择池化方案
        • 3.4.3 如何设计步长
        • 3.4.4 卷积核大小如何影响模型性能
        • 3.4.5 如何设计卷积核大小
      • 3.5 残差结构的理解和设计
        • 3.5.1 残差结构为什么有效
        • 3.5.2 如何设计残差网络
      • 3.6 多尺度与信息融合
        • 3.6.1 如何设计多尺度网络
      • 3.7 其他
        • 3.7.1 Attention
        • 3.7.2 感受野控制
        • 3.7.3 AutoML
      • 3.8 GAN网络
    • 4.如何获得更加高效的CNN模型结构
      • 4.1 什么是更加高效的CNN网络
      • 4.2 通道补偿与通道重用
      • 4.3 分组卷积
      • 4.4 剪枝
      • 4.5 量化
      • 4.6 知识蒸馏
      • 4.7 动态推理

    注:
    记录 视频课程中的一些知识。

    1. 如何学会深度学习模型设计与优化

    1.1 深度学习之模型设计

    1.1.1 模型深度——性能提升的关键

    在这里插入图片描述

    1.1.2 通道维度变换——基础设计单元

    在这里插入图片描述

    1.1.3 模型宽度——模型表达能力与压缩关键

    增加模型宽度:
    (1)增加通道数
    (2)增加分支,如:由一路变成多路
    在这里插入图片描述

    1.1.4 残差网络——深层模型训练关键技术

    在这里插入图片描述

    1.1.5 分组网络——模型压缩核心技术

    在这里插入图片描述

    1.1.6 多尺度与非正常卷积——复杂任务模型性能提升的核心技术

    在这里插入图片描述

    1.1.7 动态推理与注意力机制网络——模型优化核心技术

    在这里插入图片描述

    1.1.8 生成对抗网络——新一代深度学习基础技术

    在这里插入图片描述

    2. 深度学习之模型优化

    2.1 工业级网络的要求

    在这里插入图片描述

    2.2 模型精简与优化的技术要点

    在这里插入图片描述

    2.2.1 卷积核的使用

    (1)全连接与全局池化
    (2)小卷积替换大卷积
    (3)维度变换
    在这里插入图片描述

    2.2.2 卷积拓扑结构设计

    在这里插入图片描述

    2.2.3 迁移学习

    在这里插入图片描述

    2.2.4 自动化搜索

    在这里插入图片描述

    3. 如何设计性能更强的CNN结构

    3.1 网络深度的设计

    3.1.1 为什么加深可以提升性能

    在这里插入图片描述

    3.1.2 从什么样的深度开始

    (1)超过30层的网络很少见
    (2)通常选择深度可以从5~8层开始
    在这里插入图片描述

    3.1.3 网络加深容易出现的问题

    在这里插入图片描述

    3.2 网络宽度的设计

    3.2.1 为什么需要足够的宽度——更多的宽度可以学习到更加丰富的特征

    在这里插入图片描述
    图中左边部分表示AlexNet第一个卷积层96个通道的可视化,可见:
    有的通道的是提取的图片的形状特征,有的则是颜色信息。

    所以如果没有足够的通道,则提取不了那么多特征。

    3.2.2 网络宽度的特点

    在这里插入图片描述
    (1)模型宽度的增加,其计算量也会指数增加。
    (2)提高网络宽度可以提高模型性能,但在达到一定临界点后会饱和。

    3.2.3 宽度设计原则

    在这里插入图片描述

    3.3 Dropout和BN层设计

    3.3.1 Dropout的好处

    (1)增加泛化能力
    (2)缓解ReLU的dead issue
    (3)减少了神经元之间的complex co-adaption
    在这里插入图片描述
    图中a表示有dropout,其神经元表现更加丰富,图b表示没有dropout,其神经元表示则非常少。

    3.3.2 使用Dropout的问题

    dropout相当于增加了噪声,造成了梯度损失,所以需要使用更大的学习率和动量项,训练更久才能收敛。

    3.3.3 BN为什么好

    在这里插入图片描述

    3.3.4 BN使用注意事项

    在这里插入图片描述

    3.4 卷积核大小、步长、池化的设计

    3.4.1 步长和池化如何影响性能

    (1)一般第一个卷积层不超过2
    在这里插入图片描述

    3.4.2 如何选择池化方案

    在这里插入图片描述

    3.4.3 如何设计步长

    在这里插入图片描述

    3.4.4 卷积核大小如何影响模型性能

    在这里插入图片描述在这里插入图片描述

    3.4.5 如何设计卷积核大小

    在这里插入图片描述

    3.5 残差结构的理解和设计

    3.5.1 残差结构为什么有效

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3.5.2 如何设计残差网络

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3.6 多尺度与信息融合

    3.6.1 如何设计多尺度网络

    在这里插入图片描述

    3.7 其他

    3.7.1 Attention

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3.7.2 感受野控制

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3.7.3 AutoML

    在这里插入图片描述

    3.8 GAN网络

    4.如何获得更加高效的CNN模型结构

    4.1 什么是更加高效的CNN网络

    在这里插入图片描述

    4.2 通道补偿与通道重用

    在这里插入图片描述
    在这里插入图片描述

    4.3 分组卷积

    分组卷积可以大幅降低计算量。
    在这里插入图片描述
    分组卷积的类型有:
    (1)
    在这里插入图片描述
    (2)
    在这里插入图片描述
    (3)
    在这里插入图片描述
    (4)
    在这里插入图片描述
    (5)
    在这里插入图片描述

    4.4 剪枝

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    4.5 量化

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    4.6 知识蒸馏

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    4.7 动态推理

  • 相关阅读:
    R语言从入门到精通Day1之【R语言介绍】
    SpringBoot项目中的测试类,无法注入类,注入类为空
    MySQL学习系列(3)-每天学习10个知识
    vue3监听input保留两位小数点
    踩准AI时代风口,NFPrompt让人人都能成为赚取利润的创作者
    【PyQt5】教你如何使用designer制作可上下移动的界面
    ELK日志实时分析
    LT6211 双通道、可编程电源电流、轨至轨输出、电流反馈放大器
    近期面试128题汇总(有超详细答案)
    FTP服务器操作手册
  • 原文地址:https://blog.csdn.net/qq_41915623/article/details/126228559
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号