码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 论文:Bottom-Up Constituency Parsing+document error analysis


    目录

      • Bottom-Up Constituency Parsing and Nested Named Entity Recognition with Pointer Networks
        • 表示结构
        • 模型
          • pointer 机制
          • encoder
          • decoder
          • Pointing score
          • Label score
          • 训练目标
        • 总结
    • Automatic Error Analysis for Document-level Information Extraction
        • 结果

    Bottom-Up Constituency Parsing and Nested Named Entity Recognition with Pointer Networks

    类比于语义解析数,也许就好理解了,是从底部向上构建解析结构,然后,每个span之间,是由一侧边界重叠,整个pointing represention是一个回环。
    适用于nest和flat实体。三种nest实体:nested NER: ACE2004, ACE2005, and GENIA.

    表示结构

    在这里插入图片描述
    在这里插入图片描述
    自下而上的遍历

    模型

    pointer 机制

    • c:光标索引。
    • A:所有可访问边界索引的集合。在每一步,光标都会指向其中的一个项目以生成一个跨度。
    • p:“缓冲区”索引。它用于确保不生成重复的跨度。它可以被推回 A。
    • S:生成的跨度集

    c < a:生成一个新的最底部跨度。 • a < c:几个连续的跨度合并成一个更大的跨度。

    encoder

    Bert。
    之后是3层的Bi-LSTM ,得到c=[f,b],f表示forward,b表示backward。
    在表示边界时,采用的是栏柱表示法(fencepost representation),边界表示为bi=[fi;gi+1]
    span 表示:hi,j=MLP(bj-bi)

    decoder

    无方向单层LSTM,作为decoder。
    在这里插入图片描述

    Pointing score

    计算pointing的boundary分值。

    在这里插入图片描述

    Label score

    在这里插入图片描述

    训练目标

    在这里插入图片描述
    在这里插入图片描述

    总结

    说实话,我不咋喜欢这种方式,觉得有点繁琐了,虽然也是对nest的一种方式,但cursor和point都需要MLP做计算。
    最后,还有一个label需要计算。
    整个解码似乎不大友好呀。

    Automatic Error Analysis for Document-level Information Extraction

    在这项工作中,我们首先介绍了一个用于文档级事件和关系提取的自动化错误分析的框架,将两者都转换为一般角色填充或模板填充任务的实例(Juraf sky 和 ​​Martin,2021 年)。我们的方法通过一系列模板级转换(图 2)将预测的系统输出转换为其黄金标准对应物,然后将转换组合映射到基于 IE 的错误类型集合

    在这里插入图片描述
    转化规则:文中设计了一系诶。
    对于给定的文档,首先应用所有单例 Alter Span 和 Alter Role 转换,以及一组 Alter Span + Alter Role 转换。其他转换按检测到的顺序应用,这取决于优化匹配中预测和黄金模板对的顺序以及模板中槽/角色的顺序。

    结果

    最终,作者提出了传统的IE和深度学习下的IE的错误类别分析图。

    1. 与现代模型相比,早期模型的缺失模板和缺失角色填充错误更少
    2. 与现代模型相比,早期模型的不正确角色错误更少。
    3. 早期和现代模型的主要错误来源是由于缺少模板和缺少角色填充而缺少召回

    在这里插入图片描述

  • 相关阅读:
    Windows——sentry接入C/C++程序
    mac安装zookeeper
    DDE图像增强
    SpringBoot电商项目实战Day6 堆排序
    X64汇编 shellcode
    在Java中使用XxlCrawler时防止被反爬的几种方式
    RBAC-基于角色的访问控制
    MacOS - brew 和 brew cask 有什么区别?
    《Cloud Native Data Center Networking》(云原生数据中心网络设计)读书笔记 -- 02 Clos拓扑
    【剑指Offer】34.二叉树中和为某一值的路径(二)
  • 原文地址:https://blog.csdn.net/Hekena/article/details/126504047
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号