码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记


    Recurrent Neural Network(RNN)

    Example Application

    Slot Filling
    智慧订票系统:
    在这里插入图片描述
    在这里插入图片描述
    How to represent each word as a vector?
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    但是光这样,feedforward Network是无法solve这一问题的,因为他无法区别是leave Taipei还是arrive Taipei。
    那我们就希望这个neuron network是有记忆的,即看到过arrive/leave这个词。
    在这里插入图片描述
    这种有记忆的network就叫做 recurrent neural network(rnn)
    在这里插入图片描述

    举例:

    我们假设所有的w=1,没有bias;所有的激活函数都是线性的;
    要给memory(每一个时间点都会被洗掉)一个初始值,我们假设给0
    在这里插入图片描述
    在这里插入图片描述
    接下来2被存到memory中
    在这里插入图片描述
    在这里插入图片描述
    rnn会考虑input sequence的order
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    of course it can be deep…

    在这里插入图片描述

    Elman Network & Jordan Network

    在这里插入图片描述

    Bidirectional RNN

    同时train 一个正向的rnn和逆向的rnn
    在这里插入图片描述
    在这里插入图片描述

    Long Short-term Memory(LSTM)

    Input/Output/Forget Gate何时打开/关闭 是需要网络自己学的
    LSTM有三个操控信号,一个输入信号
    在这里插入图片描述
    “-”为什么放在short-term之间,而不是long short之间?
    因为他只是比较长的short term。是否遗忘取决于forget gate,关闭时代表遗忘。
    在这里插入图片描述
    假设在四个z输入之前,cell中存了一个“c”
    在这里插入图片描述
    在这里插入图片描述
    如果选择不遗忘c(由f(zf)决定),则需要再加起来即c‘
    在这里插入图片描述
    在这里插入图片描述

    LSTM-Example

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    original network
    在这里插入图片描述
    LSTM 直接将neurons替换成LSTM的cell即可
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    GRU是LSTM的simple版本,他只有两个gate,参数较少,所以比较不容易overfitting。simpleRNN指最原始的RNN,下图是目前标准的RNN。
    在这里插入图片描述

    Learning Target

    在这里插入图片描述
    RNN 用 Gradient Descent是可以train的
    Backpropagation through time(BPTT) 基于时间的反向传播算法。
    在这里插入图片描述
    在这里插入图片描述
    Why?
    在这里插入图片描述
    在这里插入图片描述
    如何解决?
    Clipping.
    裁剪,当梯度过大时候进行裁剪。
    在这里插入图片描述
    为什么rnn会有这种奇特的特性呢?
    sigmoid function? no
    在这里插入图片描述
    在这里插入图片描述
    有什么样的技巧可以帮助我们解决这个问题呢?
    在这里插入图片描述
    可以让你的error surface不要那么崎岖, 在做LSTM时,你可以放心的把learning rate设置的特别小。

    为什么我们要把RNN换成LSTM? LSTM可以handle gradient vanishing的问题。

    为什么可以handle gradient vanishing的问题?
    一旦你的weight,可以对memory的值发生影响时,这个影响会一直存在,除非forget gate关闭。不像rnn,其在每一个时间的会被forget掉。
    在这里插入图片描述
    在这里插入图片描述

    Application

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    如何解决?
    CTC
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    句法解析
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    Attention-based Model

    可以想成RNN的进阶版本
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    Deep&Structured

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    【数字电路】Y图 | 逻辑操作符 | 布尔函数 | Combinational systems
    (附源码)springboot音乐播放小程序 毕业设计 031306
    高德地图JSAPI 2.0使用Java代码代替Nginx进行反向代理产生CORS跨域
    使用python-pptx复制幻灯片:如何快速复制一个已存在的幻灯片
    引入Bootstrap的CSS样式后,<h>标签、<p>标签等HTML自带的标签被覆写没有?答:覆写了。
    【python爬虫】15.Scrapy框架实战(热门职位爬取)
    微信公众号怎么变更认证主体?
    linux 用指定版本jdk 启动项目
    机器学习(20)---神经网络详解
    03.前后端分离中台框架 zhontai 项目代码生成器的使用
  • 原文地址:https://blog.csdn.net/overload_/article/details/128125179
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号