码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • <深度学习基础> Batch Normalization


    Batch Normalization批归一化

    BN优点

    1. 减少了人为选择参数。在某些情况下可以取消dropout和L2正则项参数,或者采取更小的L2正则项约束参数;
    2. 减少了对学习率的要求。现在我们可以使用初始很大的学习率或者选择了较小的学习率,算法也能够快速训练收敛;
    3. 破坏原来的数据分布,一定程度上缓解过拟合;
    4. 减少梯度消失,加快收敛速度,提高训练精度。

    步骤

    下面给出BN 算法在训练时的过程
    输入:上一层输出结果 X = x 1 , x 2 , . . . , x m X={x_1,x_2,...,x_m} X=x1​,x2​,...,xm​,学习参数 γ , β \gamma,\beta γ,β;
    算法流程:
    (1)计算上一层输出数据的均值
    μ β = 1 m ∑ i = 1 m x i \mu_{\beta}=\frac{1}{m} \sum_{i=1}^m x_i μβ​=m1​i=1∑m​xi​
    其中, m m m 是此次训练样本batch的大小。
    (2)计算上一层输出数据的标准差
    σ β 2 = 1 m ∑ i = 1 m ( x i − μ β ) 2 \sigma_{\beta}^2=\frac{1}{m} \sum_{i=1}^m (x_i-\mu_{\beta})^2 σβ2​=m1​i=1∑m​(xi​−μβ​)2
    (3)归一化处理,得到
    x ˆ i = x i + μ β σ β 2 + ϵ \^x_i=\frac{x_i+\mu_{\beta}}{\sqrt{\sigma_{\beta}^2}+\epsilon} xˆi​=σβ2​ ​+ϵxi​+μβ​​
    其中 ϵ \epsilon ϵ是为了避免分母为0 而加进去的接近于0 的很小值;
    (4)重构,对经过上面归一化处理得到的数据进行重构,得到
    y i = γ x ˆ i + β y_i=\gamma \^x_i + \beta yi​=γxˆi​+β
    其中, γ , β \gamma,\beta γ,β为可学习参数。

    注:上述是BN训练时的过程,但是当在推理时,往往只是输入一个样本,没有所谓的均值 μ β \mu_{\beta} μβ​和标准差 σ β 2 \sigma_{\beta}^2 σβ2​。此时,均值 μ β \mu_{\beta} μβ​是计算所有batch的 μ β \mu_{\beta} μβ​值的平均值得到,标准差 σ β 2 \sigma_{\beta}^2 σβ2​采用每个batch的 σ β 2 \sigma_{\beta}^2 σβ2​的无偏估计得到。

  • 相关阅读:
    BMS电池电荷均衡(被动电荷均衡与主动均衡)
    linux用sqlcipher加解密
    通过java agent监控程序执行
    【发烧期间随笔】第一次游戏开发经历的总结与反思
    每日一博 - Code如何被发布到生产环境
    vue实例的$on和$emit的使用?
    WPF控件3
    m基于matlab的光通信误码率仿真,分别对比了OFDM+BPSK和OFDM+4QAM的误码率和星座图
    代码随想录算法训练营第三十六天| 435. 无重叠区间 763.划分字母区间 56. 合并区间
    R语言时间序列数据算术运算:使用diff函数计算时间序列数据的逐次差分、使用时间序列之间的除法计算相对变化率(乘以100获得百分比)
  • 原文地址:https://blog.csdn.net/thisiszdy/article/details/132655619
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号