码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习-全连接神经网络-训练过程-模型正则与超参数调优- [北邮鲁鹏]


    目录标题

    • 神经网络中的超参数
      • 学习率
      • 超参数优化方法
        • 网格搜索法
        • 随机搜索法
      • 超参数搜索策略
        • 粗搜索
        • 精搜索
      • 超参数的标尺空间

    神经网络中的超参数

    超参数

    • 网络结构:隐层神经元个数,网络层数,非线性单元选择等
    • 优化相关:学习率、dorpout比率、正则项强度等

    学习率

    在这里插入图片描述
    学习率过大,训练过程无法收敛
    在这里插入图片描述
    学习率偏大,在最小值附近震荡,达不到最优
    在这里插入图片描述
    学习率太小,收敛时间较长
    在这里插入图片描述
    学习率适中,收敛快、结果好
    在这里插入图片描述

    超参数优化方法

    网格搜索法

    1. 每个超参数分别取几个值,组合这些超参数值,形成多组超参数;
    2. 在验证集上评估每组超参数的模型性能;
    3. 选择性能最优的模型所采用的那组值作为最终的超参数的值。

    在这里插入图片描述
    缺点:横轴3个测试值*纵轴3个测试值=9组实验,将注意力放在了不重要的参数δ

    随机搜索法

    1. 参数空间内随机取点,每个点对应一组超参数;
    2. 在验证集上评估每组超参数的模型性能;
    3. 选择性能最优的模型所采用的那组值作为最终的超参数的值。
      在这里插入图片描述
      优点:横轴9个测试值&纵轴9个测试值=9组实验

    超参数搜索策略

    粗搜索

    利用随机法在较大范围里采样超参数,训练一个周期,依据验证集正确率缩小超参数范围

    在这里插入图片描述

    精搜索

    利用随机法在前述缩小的范围内采样超参数,运行模型五到十个周期,选择验证集上精度最高的那组超参数

    在这里插入图片描述

    超参数的标尺空间

    例:假设最优值在0.0001到1之间,如果在0-1之间采样,90%会在0.1-1之间。
    在这里插入图片描述
    最优的值在[0.0001,1]之间,我们该如何采样?
    建议:对于学习率、正则项强度这类超参数,在对数空间上进行随机采样更合适!
    在这里插入图片描述在1~0的量级范围内,差别不大,不敏感,所以一般在log对数空间上进行随机采样。

    在log空间上,0.0001-0.001-0.01-0.1-1之间的间隔是等距的

  • 相关阅读:
    阿里云和AWS对比研究三——存储产品对比
    学习笔记:机器学习之支持向量机(二)
    js的同步异步
    成都优优聚美团代运营具备专业团队!
    计算机网络第七章知识点回顾(自顶向下)
    MySQL——(三大日志)(MVCC)(间隙锁与其他各种锁)
    长沙周边最美露营基地:安化云台山风景区星空露营公园
    人机交互复习总结5
    RK3568开发笔记(五):在虚拟机上使用SDK编译制作uboot、kernel和ubuntu镜像
    18、SqueezeNeRF
  • 原文地址:https://blog.csdn.net/m0_49683806/article/details/132888637
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号