码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【期中复习】深度学习


    文章目录

      • 机器(深度)学习的四大核心要素
      • 为什么深度学习,不增加网络宽度
      • 黑盒模型的问题
      • 计算图
      • 线性神经网络
      • 梯度下降
      • 学习率
      • 优化方法
      • softmax函数用于多分类
      • 交叉熵
      • 线性回归与softmax回归的对比
      • 为什么需要非线性激活函数
      • 感知机
      • 线性回归、softmax回归、感知机和支持向量机的比较
      • sigmoid激活函数
      • 双曲正切(tanh)激活函数
      • 线性(ReLU)修正函数
      • MLP
      • K折交叉验证
      • 估计模型的复杂度
      • 数据复杂度
      • 欠拟合和过拟合
      • 欠拟合和过拟合的原因
      • 正则化
      • Dropout
      • 梯度爆炸和梯度消失
      • 权重初始化
      • 参数初始化

    机器(深度)学习的四大核心要素

    数据、模型、性能度量(目标函数)、优化方法

    为什么深度学习,不增加网络宽度

    • 增加深度使得学习高层次、抽象特征成为可能
    • 相比于增加宽度,增加深度的学习效率更高。比如对于一些要学习的多项式函数,浅层网络需要指数增长的神经元个数,其拟合效果才能匹配上多项式增长的深层网络
      宽度的优点:增加宽度会增加模型的记忆能力

    黑盒模型的问题

    数据安全隐患、输出不可信、模型改进局限、模型应用局限

    计算图

    在这里插入图片描述

    线性神经网络

    • 模型
      在这里插入图片描述

    • 性能度量
      在这里插入图片描述

    • 优化方法
      在这里插入图片描述

    梯度下降

    在这里插入图片描述

    学习率

    在这里插入图片描述

    优化方法

    在这里插入图片描述

    softmax函数用于多分类

    在这里插入图片描述

    • 可用:量化样本间的相对大小(等比例缩放不变)
    • 概率:每个样本取值范围[0,1],总和等于1
    • 可训练:可微分

    交叉熵

    在这里插入图片描述

    线性回归与softmax回归的对比

    在这里插入图片描述

    为什么需要非线性激活函数

    在这里插入图片描述
    因为是线性的,神经网络虽然引入了隐藏层,却依然等价于一个单层神经网络

    感知机

    在这里插入图片描述
    在这里插入图片描述

    线性回归、softmax回归、感知机和支持向量机的比较

    在这里插入图片描述

    sigmoid激活函数

    在这里插入图片描述

    • 优点
      (0-1),平滑、多标签分类
    • 缺点
      梯度消失、更新效率低

    双曲正切(tanh)激活函数

    在这里插入图片描述

    • 优点
      (-1,1),平滑,更新效率高
    • 缺点
      梯度消失

    线性(ReLU)修正函数

    在这里插入图片描述
    在这里插入图片描述

    MLP

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    K折交叉验证

    在这里插入图片描述
    在这里插入图片描述

    估计模型的复杂度

    在这里插入图片描述

    数据复杂度

    在这里插入图片描述

    欠拟合和过拟合

    在这里插入图片描述

    欠拟合和过拟合的原因

    在这里插入图片描述

    正则化

    在这里插入图片描述

    Dropout

    在这里插入图片描述

    梯度爆炸和梯度消失

    在这里插入图片描述

    在这里插入图片描述

    权重初始化

    在这里插入图片描述

    参数初始化

    在这里插入图片描述

    在这里插入图片描述

  • 相关阅读:
    kafka满五替换
    玩转代码| Vue 中 JSX 的特性,这一篇讲的明明白白
    软考 系统架构设计师系列知识点之软件架构风格(6)
    【开学季】再见大一,你好大二 | 完成自己的未完成
    linux7上powerpath卸载
    vue组件间数据传递(vue组件传参),父传子,子传父,非父子组件传值
    图文教程:教你快速生成实体店电子优惠券
    ch552g下载时遇到的可能问题
    使用scipy库将离散点连续化
    LLM(四)| Chinese-LLaMA-Alpaca:包含中文 LLaMA 模型和经过指令微调的 Alpaca 大型模型
  • 原文地址:https://blog.csdn.net/verse_armour/article/details/134029115
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号