码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 在模型推理时合并BN和Conv层


    我们在这里简单讲解一下,在模型推理时合并BN和Conv层,能够简化网络架构,起到加速模型推理的作用。在模型中,BN层一般置于Conv层之后。

    Conv:

    卷积层的计算简单,公式为:

    y = w *x+b

    BN:

    再来回忆一下BN操作的公式

    合并conv和bn:

    合并的过程可以用以下式子来表示:

    \hat{f}_{i,j} = W_{BN}.(W_{conv}.f_{i,j}+b_{conv}) + b_{BN}

    合并的结果我们可以用一个卷积操作来表示。

    权重:W=W_{BN} .W_{conv}

    偏置:b = W_{BN}.b_{conv} + b_{BN}

    由BN层的最后两个公式可得:

    y_i = \gamma * \frac{x_i- \mu}{\sqrt{\sigma^2+\epsilon}} + \beta

    由于Conv层的输出y,就是BN层的输入​ ,然后代入得:

    y_i = \gamma* \frac{w*x+b-u}{\sqrt{\sigma^2+\epsilon}} + \beta =(\frac{w}{\sqrt{\sigma^2+\epsilon}}*\gamma)*x + (\frac{b-u}{\sqrt{\sigma^2+\epsilon}}*\gamma + \beta)

    式子中:均值 \mu​ ; 方差 ​\sigma^2 ; 较小的数 \epsilon​ (防止分母为0); 缩放因子 \gamma​ ; 偏置 \beta​ ;

    因此,Conv和BN层合并后仅用一个卷积操作表示即可

    其权值为:

    \frac{w}{\sqrt{\sigma^2+\epsilon}}*\gamma

    偏置为:

    \frac{b-u}{\sqrt{\sigma^2+\epsilon}}*\gamma + \beta

    代码:

    1. def fuse_conv_and_bn(conv, bn):
    2. #
    3. # init
    4. fusedconv = torch.nn.Conv2d(
    5. conv.in_channels,
    6. conv.out_channels,
    7. kernel_size=conv.kernel_size,
    8. stride=conv.stride,
    9. padding=conv.padding,
    10. bias=True
    11. )
    12. #
    13. # prepare filters
    14. w_conv = conv.weight.clone().view(conv.out_channels, -1)
    15. w_bn = torch.diag(bn.weight.div(torch.sqrt(bn.eps+bn.running_var)))
    16. fusedconv.weight.copy_( torch.mm(w_bn, w_conv).view(fusedconv.weight.size()) )
    17. #
    18. # prepare spatial bias
    19. if conv.bias is not None:
    20. b_conv = conv.bias
    21. else:
    22. b_conv = torch.zeros( conv.weight.size(0) )
    23. b_bn = bn.bias - bn.weight.mul(bn.running_mean).div(torch.sqrt(bn.running_var + bn.eps))
    24. fusedconv.bias.copy_( torch.matmul(w_bn, b_conv) + b_bn )
    25. #
    26. # we're done
    27. return fusedconv

    1. import torch
    2. import torchvision
    3. torch.set_grad_enabled(False)
    4. x = torch.randn(16, 3, 256, 256)
    5. rn18 = torchvision.models.resnet18(pretrained=True)
    6. rn18.eval()
    7. net = torch.nn.Sequential(
    8. rn18.conv1,
    9. rn18.bn1
    10. )
    11. y1 = net.forward(x)
    12. fusedconv = fuse_conv_and_bn(net[0], net[1])
    13. y2 = fusedconv.forward(x)
    14. d = (y1 - y2).norm().div(y1.norm()).item()
    15. print("error: %.8f" % d)

    参考:

    https://nenadmarkus.com/p/fusing-batchnorm-and-conv/

    模型部署之Convolution与BatchNorm合并_jefferyqian的博客-CSDN博客

  • 相关阅读:
    卓望数码--2023.10.16
    Dubbo 实战 - Mock 调用
    Python 自动化: eip、cen监控数据对接到 grafana
    对Excel表中归类的文件夹进行自动分类
    Nexus数据备份&恢复
    360董事长周鸿祎:元宇宙代表着人类的没落
    学内核之五:问题二,原子操作与锁
    java毕业设计网上化妆品商城设计源码+lw文档+mybatis+系统+mysql数据库+调试
    17.Composition API(三)高级语法补充
    Matlab之DICOM(数字图像和通信医学)格式图像数据读取函数dicomread
  • 原文地址:https://blog.csdn.net/u012505617/article/details/125635288
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号