码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【Pytorch】torch.nn.init.xavier_uniform_()


    目录

    • 简介
    • torch.nn.init.xavier_uniform_()
      • 语法
      • 作用
      • 举例
      • 参考
    • 结语

    在这里插入图片描述

    简介

    Hello!
    非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
     
    ଘ(੭ˊᵕˋ)੭
    昵称:海轰
    标签:程序猿|C++选手|学生
    简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研
    学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
     
    唯有努力💪
     
    本文仅记录自己感兴趣的内容

    torch.nn.init.xavier_uniform_()

    语法

    torch.nn.init.xavier_uniform_(tensor, gain=1.0)

    作用

    根据了解训练深度前馈神经网络的难度 - Glorot, X. & Bengio, Y. (2010) 中描述的方法

    使用均匀分布 用值填充输入张量

    结果张量将具有从 U ( − a , a ) \mathcal{U}(-a, a) U(−a,a) 采样的值,其中

    在这里插入图片描述
    也称为Glorot初始化

    在这里插入图片描述

    举例

    w = torch.empty(3, 5)
    print('w : \n', w)
    
    nn.init.xavier_uniform_(w, gain=nn.init.calculate_gain('relu'))
    print('w : \n', w)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    在这里插入图片描述


    w = torch.Tensor([[1.0,2,3],[2.0,3,4]])
    print('w : \n', w)
    
    nn.init.xavier_uniform_(w, gain=nn.init.calculate_gain('relu'))
    print('w : \n', w)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    在这里插入图片描述

    注:w不能为1维


    为什么需要Xavier 初始化?

    在这里插入图片描述

    所以论文提出,在每一层网络保证输入和输出的方差相同

    参考:https://blog.csdn.net/dss_dssssd/article/details/83959474

    个人感觉使用Xavier的作用就是预防一些参数过大或过小的情况,再保证方差一样的情况下进行缩放,便于计算

    参考

    • https://pytorch.org/docs/stable/nn.init.html
    • https://blog.csdn.net/dss_dssssd/article/details/83959474

    结语

    文章仅作为个人学习笔记记录,记录从0到1的一个过程

    希望对您有一点点帮助,如有错误欢迎小伙伴指正

    在这里插入图片描述

  • 相关阅读:
    21.8 Python 使用BeautifulSoup库
    Yii2 关联查询结果AR对象 如何取到表以外的字段
    独立站运营中如何提升客户留存率?客户细分很重要!
    java8流处理器list转map的对比
    常用gdb调试命令
    EasyRecovery易恢复2023最新版数据恢复软件功能特色介绍
    NB15 牛群编号的回文顺序II
    关于城市旅游的HTML网页设计 HTML+CSS上海博物馆网站 dreamweaver作业静态HTML网页设计 html网页制作期末大作业
    基于React实现:弹窗组件与Promise的有机结合
    iOS hitTest 机制用处之二-----使用pointInside方法
  • 原文地址:https://blog.csdn.net/weixin_44225182/article/details/126655294
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号