码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Recurrent vs. Recursive Neural Networks | 递归神经网络和循环神经网络的RNN之争


    写这个文章的原因是我又遇到了Recurrent和Recursive。我读了一个论文,开始的时候我心里默认是RNNs(Recurrent),但是读到文章最后发现作者写的是RNN(Recursive)。所以翻译一下这段文字顺便写一下二者的区别。

    文章目录

    • RNN-Based Models 部分翻译
    • Recurrent vs. Recursive Neural Networks

    RNN-Based Models 部分翻译

    下边的内容出自这篇文章。我将对RNN那一段进行翻译。
    在这里插入图片描述

    基于RNN的模型将文本视为一系列单词, 用于为文本分类任务捕获单词依赖和文本结构关系。但是普通的RNN性能并不好,性能甚至比不上前馈神经网络。在众多RNN变体中,LSTM是最受欢迎的构架,因为LSTM可以更好地捕获长期依赖关系……

    Tai等人[33]开发了一个Tree-LSTM模型,将LSTM推广到树状结构的网络类型,以学习丰富的语义表示。作者认为,对于NLP任务,Tree-LSTM是一个比链式结构LSTM更好的模型……Zhu等人[34]也将链结构的LSTM扩展到树结构……
    在这里插入图片描述

    为了模拟机器阅读的长跨度单词关系,Cheng 等人[35]用记忆网络代替单个记忆单元来增强 LSTM 架构……Multi-Timescale LSTM神经网络[36]还旨在通过捕获具有不同时间尺度的有价值信息来对长文本(例如句子和文档)进行建模……

    RNN属于DNN(深度神经网络),称为递归神经网络(Recursive Neural Network) 。递归神经网络递归地将同一组权值应用于一个结构化输入,以产生一个结构化预测,或对可变大小的输入产生一个向量表示。虽然RNNs是具有线性链结构输入的递归神经网络,但也有递归神经网络对层次结构进行操作,如自然语言句子的解析树[43],将子表示组合成父表示……

    问题就出在这,看了半天我脑子里都是循环神经网络,到最后作者告诉我是递归神经网络。

    Recurrent vs. Recursive Neural Networks

    • 循环神经网络(recurrent neural network ,Rumelhart et al., 1986c)通常被称为RNN,是一类用于处理序列数据的链式神经网络。
    • 递归神经网络(recursive neural network,Pollack,1990)是具有树状阶层结构且网络节点按其连接顺序对输入信息进行处理的人工神经网络。

    递归神经网络被视为循环神经网络的推广,换句话说递归神经网络被视为循环神经网络更一般的形式。 因为当递归神经网络的每个父节点都仅与一个子节点连接时,其结构等价于全连接的循环神经网络。

    其他材料:

    1. 斯坦福cs224d课程:
      在这里插入图片描述

    2. 《深度学习》 第十章 序列建模

    3. Recurrent vs. Recursive Neural Networks in Natural Language Processing

    4. 如何有效的区分和理解RNN循环神经网络与递归神经网络?

  • 相关阅读:
    .NET HttpWebRequest、WebClient、HttpClient
    [题]Trie字符串统计 #字典树
    C++9 --- 友元
    Java学习笔记(十四)
    J2EE——自定义MVC框架的CRUD操作
    显示杂谈(二)winscope的使用
    AI创作与大语言模型:2023亚马逊云科技中国峰会引领企业应用新潮流
    在docker下安装suiteCRM
    抗疫逆行者网页作业 感动人物HTML网页代码成品 网页作业带JS下拉菜单 最美逆行者网页模板 致敬疫情感动人物网页设计制作
    Qt之进程通信-QProcess(含源码+注释)
  • 原文地址:https://blog.csdn.net/qq_36667170/article/details/125547110
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号