码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 深度学习第三章


    变量左上角的圆括号表示第几个样本,方括号代表变量所在的层级。

    上图的每一层对应两个运算,即计算z和计算a。

     

    隐藏层表示在训练集中看不到它们的数值。

    输入层不计算层数,为第0层。除了输入层其他层都带有参数w和b。

     

    当有一个隐层数为1的网络时,需要进行下图的左侧四个运算。 

    下图中Z矩阵横向指标对应了不同的训练样本, 竖向指标对应了神经网络中的不同节点。

    sigmod就是激活函数,但是还多很多其他的激活函数。如tanh函数总比sigmod函数的效果更好。不同层的激活函数可以不一样。激活函数右上角方括号表示所在层数。

    修正线性单元reLU:

    线性代数第三章的答案
    application/msword 0星 超过10%的资源 70KB
    下载

     选择激活函数的一些经验:
    1.如果输出值是0和1,即二值分类,那么sigmod函数很适合作为输出层的激活函数,然后所有单元都用reLU。如果不确定激活函数的选择,reLU是很好的选择。

    激活函数的利弊:

    1.sigmod函数除非用在二元分类的输出层,不然绝对不要用。tanh几乎在所有场景都优于sigmod函数。

    2.reLU是不确定时最优选择的函数,有时也可以尝试leaky reLU。

    各个激活函数的求导:

     

     

     

     前向和后向传播的过程

    W参数需要随机化,b不需要。

     

     

  • 相关阅读:
    烧录场景下的源代码防泄密方案分享
    RGB灯带蓝牙芯片智能化方案
    【调制解调】QPSK信号的调制解调附matlab代码
    石油化工行业能源管理平台,让能源管理更简单,更高效
    8年软件测试老鸟,写给3-5年测试员的几点建议,满满硬货指导
    HQL,SQL刷题,尚硅谷(中级)
    Django基础五之Ajax
    【毕业设计】基于深度学习实现语义分割算法系统 - 机器视觉
    Android判断应用是否在前台运行
    线性筛素数(欧拉筛)
  • 原文地址:https://blog.csdn.net/skykone1/article/details/126087659
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号