今天带来论文A COMPARE-AGGREGATE MODEL FOR MATCHING TEXT SEQUENCES的阅读笔记。
很多NLP任务,包括阅读理解、文本蕴含和问答任务,都需要在序列之间进行比较。匹配序列间重要的单位是这些解决这些任务的关键。本篇工作提出了一个通用的比较聚合(compare-aggragate)框架执行单词级匹配,然后使用CNN进行聚合。
比较聚合网络并不是作者首先提出来的,但作者认为前人的工作有一些不足:
而本篇工作作者使用了六种不同的比较函数,实验结果证明作者提出的模型在不同任务的四份数据集(问答和蕴含任务)上达到了当时的SOTA结果。作者也着重强调了element-wise(逐元素级)函数作为交互效果明显。
本篇工作的贡献有:
孪生神经网络(Siamense network)
注意力网络(Attentive network)