NLP 04(GRU)

一、GRU

GRU (Gated Recurrent Unit)也称门控循环单元结构,它也是传统RNN的变体,同LSTM一样能够有效捕捉长序列之间的语义关联， 缓解梯度消失或爆炸现象，同时它的结构和计算要比LSTM更简单,它的核心结构可以分为两个部分去解析:

更新门、重置门

GRU的内部结构图和计算公式:

Bi-GRU与Bi-LSTM的逻辑相同,都是不改变其内部结构,而是将模型应用两次且方向不同,再将两次得到的LSTM结果进行拼接作为最终输出

GRU和LSTM作用相同,在捕捉长序列语义关联时,能有效抑制梯度消失或爆炸,效果都优于传统RNN且计算复杂度相比LSTM要小。

GRU仍然不能完全解决梯度消失问题,同时其作用RNN的变体,有着RNN结构本身的一大弊端,即不可并行计算,这在数据量和模型体量逐步增大的未来,是RNN发展的关键瓶颈。

相关阅读:
unity教程
动态规划学习3：116 · 跳跃游戏
ubuntu 安装 opencv 【亲测有效】
销量预测设计
消失的它：网络层分片包中的第一个分片包去哪了？
sed续与awk(粗糙版)
pyqt5 学习笔记四（布局：QBoxLayout）
面试突击79：Bean 作用域是啥？它有几种类型？
pdf只要其中一页 pdf只要第一页怎么办 pdf只要前几页怎么弄
【006】基于vue.js+ springboot+mysql 的学生管理系统（含源码、数据库、数据库文档）

原文地址：https://blog.csdn.net/peng_258/article/details/133439521