码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 正则化提高神经网络的泛化能力


    目录

    使用正则化提高神经网络的泛化能力方法:

    早停法

     暂退法

    权重衰减

    L1和L2正则化

    数据增强


    正则化不单指某一个方法,而是所有损害网络优化的方法都是正则化。

    损害网络优化是为了防止过拟合。


    使用正则化提高神经网络的泛化能力方法:

    干扰优化过程:

    • 早停法(Early-Stop)
    • 暂退发(Dropout)
    • 权重衰减
    • SGD

    增加约束:

    • L1和L2正则化
    • 数据增强

    早停法

    我们使用一个验证集( Validation Dataset)来测试每一次迭代的参数在验证集上是否最优。如果在验证集上的错误率不再下降,就停止迭代。

     


    暂退法

    当神经元足够多时容易产生协同效应,即有些神经元具有相似的行为,为解决这一问题,可以引入一个掩码函数mask,随机丢弃部分神经元,掩码函数对x进行随机掩码,对x的每一维随机乘以0或1,0和1是通过一个概率为p的伯努利分布随机生成的。

    对于一个神经层𝑦 = 𝑓(𝑊𝑥+𝑏)y = f(Wx+b),引入一个丢弃函数𝑑(·)使得𝑦 = 𝑓(𝑊𝑑(𝑥)+𝑏)。

    其中𝑚 ∈ {0,1}𝑑 是丢弃掩码(dropout mask),通过以概率为p的贝努力分布随机生成。

     

    Dropout的意义:

    每做一次丢弃,相当于从原始的网络中采样得到一个子网络。如果一个神经网络有n个神经元,那么总共可以采样出2n个子网络。


    权重衰减

    通过限制权重的取值范围来干扰优化过程,降低模型能力。

    在每次参数更新的是时候,引入一个衰减系数。

    在标准的随机梯度下降中,权重衰减正则化和l2正则化的效果相同。

    在较为复杂的优化方法(比如Adam)中,权重衰减和L2正则化并不等价。

     


    L1和L2正则化

    优化问题可以写为

    上式中,Lp为范数函数,p的取值通常为{1,2}代表L1和L2范数,λ为正则化系数。

     

     


    数据增强

    图像数据的增强主要是通过算法对图像进行转变,引入噪声等方法来增加数据的多样性。

    图像数据的增强方法:

    • 旋转(Rotation):将图像按顺时针或逆时针方向随机旋转一定角度;
    • 翻转(Flip):将图像沿水平或垂直方法随机翻转一定角度;
    • 缩放(Zoom In/Out):将图像放大或缩小一定比例;
    • 平移(Shift):将图像沿水平或垂直方法平移一定步长;
    • 加噪声(Noise):加入随机噪声。

  • 相关阅读:
    德事以灵活的解决方案,应对疫情常态化时期的企业办公选址
    GIS小技术分享(一):python中json数据转geojson或者shp
    木板ISO 5660-1 热量释放速率摸底测试
    FreeRTOS学习 -- 任务
    qsort 函数的使用及其模拟实现
    ROS2——分布式通信(十二)
    企业电子招标采购系统源码Spring Boot + Mybatis + Redis + Layui + 前后端分离 构建企业电子招采平台之立项流程图
    测试软件要求规范 (SRS)
    计算机组成原理 — PCI-E on Linux
    SpringBoot在静态方法或工具类中注入Bean及配置参数
  • 原文地址:https://blog.csdn.net/weixin_45848575/article/details/126352215
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号