码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 李宏毅《机器学习》丨5. Tips for neural network design(神经网络设计技巧)


    Author:AXYZdong
    李宏毅《机器学习》系列
    参考视频地址:https://www.bilibili.com/video/BV1Ht411g7Ef
    参考文档:DataWhale文档

    文章目录

      • 一、局部最小值与鞍点
      • 二、批次与动量
      • 三、自动调整学习速率
      • 四、损失函数的影响
      • 五、批次标准化
      • 五、总结

    一、局部最小值与鞍点

    Optimization Fails because …

    • local minima(局部最小值)
    • saddle point(鞍点)

    在这里插入图片描述

    ▲ 优化失败原因

    二、批次与动量

    • Optimization with Batch

    在这里插入图片描述

    ▲ 批次优化
    • Gradient Descent + Momentum
      在这里插入图片描述
    ▲ 带动量的梯度下降

    三、自动调整学习速率

    RMSProp(root mean square prop,均方根)
    学习原理∶在自适应梯度基础上引入了衰减因子,在梯度累积的时候,会对“过去”与“现在”做一个平衡,通过超参数进行调节衰减量。
    适合处理非平稳目标(也就是与时间有关的),对于RNN效果很好。

    在这里插入图片描述

    ▲ RMSProp

    Adam(Adaptive momentum optimization,自适应动量优化)
    是目前深度学习中最流行的优化方法,它结合了自适应梯度善于处理稀疏梯度和均方根善于处理非平稳目标的优点,适用于大数据集和高维空间。
    在这里插入图片描述

    ▲ Adam

    四、损失函数的影响

    主要是对分类任务的影响。

    在这里插入图片描述

    ▲ Loss of Classification

    五、批次标准化

    批次标准化(Batch Normalization),改变不同特征的范围(changing landscape
    )。

    在这里插入图片描述

    ▲ Changing Landscape

    在这里插入图片描述

    ▲ Feature Normalization

    五、总结

    Datawhale组队学习,李宏毅《机器学习》Task5. Tips for neural network design(神经网络设计技巧)。包括局部最小值与鞍点、批次与动量、自动调整学习速率、损失函数的影响和批次标准化。李老师课程中对数学的原理讲得很清楚,不过对于侧重应用可以不求甚解,知道设计的技巧即可。

    —— END ——

    如果以上内容有任何错误或者不准确的地方,欢迎在下面 👇 留言。或者你有更好的想法,欢迎一起交流学习~~~

    更多精彩内容请前往 AXYZdong的博客

  • 相关阅读:
    【云原生】-Docker容器迁移Oracle到MySQL
    如何合理估算 Java 线程池大小
    第六章 配置命名空间(一)
    Nacos 配置中心
    企商在线亮相2024中国生成式AI大会,展出多元异构算力服务
    Nsight Compute(NCU) Scheduler Statistics 数据解读
    用Bing绘制「V我50」漫画;GPT-5业内交流笔记;LLM大佬的跳槽建议;Stable Diffusion生态全盘点第一课 | ShowMeAI日报
    C/C++内存管理相关知识点
    uniapp小程序文件下载保存
    Apache Doris 巨大飞跃:存算分离新架构
  • 原文地址:https://blog.csdn.net/qq_43328313/article/details/125418355
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号