码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Tensorflow笔记(二)


    为什么要用激活函数?

    在实际应用中某些数据是线性可分的,即可以用一条直线将数据分开:
    在这里插入图片描述
    而有些数据则无法通过线性进行分割,
    在这里插入图片描述
    此时可以通过线性变换的方式进行分割:x² y²的方式

    在这里插入图片描述

    总而言之,激活函数可以引入非线性因素,解决线性模型所不能解决的问题。

    神经网络复杂度:

    在这里插入图片描述

    一、空间复杂度:
    		① 层数=隐藏层数+输出层    ② 总复杂度=总W + 总b
    		上图的层数:隐藏层+输出层 = 2
    		上图的复杂度:3*4+4 + 4*2+2 = 26
    二、时间复杂度
    		乘加运算次数
    		3*4 + 4*2 = 20
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    学习率:

    ① W(t+1) = W(t) - L(r)* Зloss / ЗW(t)
    ② 指数衰减学习率 = 初始学习率 * 学习率衰减率 ** (当前轮数 / 多少轮衰减一次)
    
    • 1
    • 2

    激活函数:

    激活函数的标准

    1、非线性:非线性可使多层神经网络可逼近所有函数
    2、可微性:大多蚕蛹梯度下降的方式更新参数
    3、单调性:当激活函数单调,可以保障单层网络的损失函数是凸函数
    4、近似恒等性:f(x) ≈ x,当参数初始化随机最小值,神经网络更稳定
    
    • 1
    • 2
    • 3
    • 4

    一、sigmoid 【tf.nn.sigmoid】

    在这里插入图片描述

    	函数:f(x) = 1 / (1 + e**-x)
        缺点:
    		① 易造成梯度损失
    		② 输出非0均值,训练慢
    		③ 幂运算复杂,训练时间长
    
    • 1
    • 2
    • 3
    • 4
    • 5

    二、Tanh 【tf.math.tanh(x)】

    在这里插入图片描述

    	函数:f(x) = (1-e**-2x)/(1+e**-2x)
    	缺点:
    		① 输出是 0 均值
    		② 易造成梯度消失
    		③ 幂运算复杂,训练时间长
    
    • 1
    • 2
    • 3
    • 4
    • 5

    三、Relu 【tf.nn.relu(x)】

    在这里插入图片描述

    	函数:                 |- 0  x<0
    		f(x) = max(x,0) = |
    		                  |- x  x>=0
    	优点:                                        缺点:
    		① 解决梯度消失(正区间)                         ① 输出非0均值,收敛慢
    		② 计算快(输入>0)                              ② Dead Relu问题
    		③ 收敛快于sigmoid和Tanh
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
  • 相关阅读:
    海尔智家:“超预期”成为“新常态”
    【目标检测算法】YOLO-V5训练结果的分析与评价
    一个被清华大学辞退的50岁副教授
    常用redis-lua脚本
    C语言 原码、反码、补码
    不可谓不“细”阿里内部价值百万“微服务架构精髓”限时开源
    VScode调试复杂C/C++项目
    在用户同意隐私政策前,您的应用获取了用户的ANDROID ID,不符合华为应用市场审核标准。
    使用Python输出斐波那契数列
    催化能力提高 3.5 倍!中科院团队基于扩散模型,开发 P450 酶从头设计方法 P450Diffusion...
  • 原文地址:https://blog.csdn.net/qq_38705144/article/details/126773982
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号