• 论文:Bottom-Up Constituency Parsing+document error analysis


    Bottom-Up Constituency Parsing and Nested Named Entity Recognition with Pointer Networks

    类比于语义解析数,也许就好理解了,是从底部向上构建解析结构,然后,每个span之间,是由一侧边界重叠,整个pointing represention是一个回环。
    适用于nest和flat实体。三种nest实体:nested NER: ACE2004, ACE2005, and GENIA.

    表示结构

    在这里插入图片描述
    在这里插入图片描述
    自下而上的遍历

    模型

    pointer 机制

    • c:光标索引。
    • A:所有可访问边界索引的集合。在每一步,光标都会指向其中的一个项目以生成一个跨度。
    • p:“缓冲区”索引。它用于确保不生成重复的跨度。它可以被推回 A。
    • S:生成的跨度集

    c < a:生成一个新的最底部跨度。 • a < c:几个连续的跨度合并成一个更大的跨度。

    encoder

    Bert。
    之后是3层的Bi-LSTM ,得到c=[f,b],f表示forward,b表示backward。
    在表示边界时,采用的是栏柱表示法(fencepost representation),边界表示为bi=[fi;gi+1]
    span 表示:hi,j=MLP(bj-bi)

    decoder

    无方向单层LSTM,作为decoder。
    在这里插入图片描述

    Pointing score

    计算pointing的boundary分值。

    在这里插入图片描述

    Label score

    在这里插入图片描述

    训练目标

    在这里插入图片描述
    在这里插入图片描述

    总结

    说实话,我不咋喜欢这种方式,觉得有点繁琐了,虽然也是对nest的一种方式,但cursor和point都需要MLP做计算。
    最后,还有一个label需要计算。
    整个解码似乎不大友好呀。

    Automatic Error Analysis for Document-level Information Extraction

    在这项工作中,我们首先介绍了一个用于文档级事件和关系提取的自动化错误分析的框架,将两者都转换为一般角色填充或模板填充任务的实例(Juraf sky 和 ​​Martin,2021 年)。我们的方法通过一系列模板级转换(图 2)将预测的系统输出转换为其黄金标准对应物,然后将转换组合映射到基于 IE 的错误类型集合

    在这里插入图片描述
    转化规则:文中设计了一系诶。
    对于给定的文档,首先应用所有单例 Alter Span 和 Alter Role 转换,以及一组 Alter Span + Alter Role 转换。其他转换按检测到的顺序应用,这取决于优化匹配中预测和黄金模板对的顺序以及模板中槽/角色的顺序。

    结果

    最终,作者提出了传统的IE和深度学习下的IE的错误类别分析图。

    1. 与现代模型相比,早期模型的缺失模板和缺失角色填充错误更少
    2. 与现代模型相比,早期模型的不正确角色错误更少。
    3. 早期和现代模型的主要错误来源是由于缺少模板和缺少角色填充而缺少召回

    在这里插入图片描述

  • 相关阅读:
    [datawhale202211]跨模态神经搜索实践:环境配置
    小白免费编程学习网站
    什么时候用Goroutine?什么时候用Channel?
    Python爬虫爬图片测试1
    代码界的奥斯卡:SpringBoot测试的艺术与科学
    门控时钟介绍
    「游戏引擎 浅入浅出」4.1 Unity Shader和OpenGL Shader
    【python】python进阶技巧
    使用 JavaScript Reflect API
    HTML5网页前端设计-作业一
  • 原文地址:https://blog.csdn.net/Hekena/article/details/126504047