希望通过了解,找到目标应用场景的方法具体属于哪一个分支,并初步实现
通过阅读文献,找到了另一个研究方向,所以这个就先这样吧hh
参考
[1]冯钧,李艳,杭婷婷.问答系统中复杂问题分解方法研究综述[J].计算机工程与应用,2022,58(17):23-33.
[2]陈跃鹤, 贾永辉, 谈川源, 陈文亮, 张民. 基于知识图谱全局和局部特征的复杂问答方法. 软件学报. http://www.jos.
org.cn/1000-9825/6799.htm
问答系统是nlp的研究方向之一,允许用户以自然语言问句的形式表达复杂的信息需求,并针对用户提出的问题直接返回精准的答案。
现有的问答系统根据答案获取途径可以分为:
根据问题的类型以及答案特点,问答又分为:
1、事实型问答。询问的某一客观事实,答案是唯一确定的,通常是实体或短语,例如以Who、Where、When等疑问词为首的问句。
2、非事实型问答。询问观点、方法等,答案不具有确定性,可能是段落或句子,注重回答是否合理,例如How、Why、解释类问题,以及闲聊类问题。
问答系统一般分为三个模块:问题理解、信息检索和答案抽取。
知识图谱(knowledge graph, KG)用于存储真实世界中的实体(如人名,地名等)及实体间关系(如出生地,国籍等)。现有的大规模知识图谱包括Freebase, DBPedia和 NELL3等。
知识库问答(knowledge base questionanswering,KBQA)作为知识图谱的应用,给定一个自然语言问句,知识库问答的目的在于自动从上述知识库中找到问题的答案。
在非完全图谱上的复杂问句推理主要存在两类问题:
(1)最佳或正确的推理路径可能在具体图谱中并不存在;
(2)问句复杂的语义构成在推理过程中难以捕捉。
比如在多跳类型的问句中,由于非完全图谱中有效路径的缺失,可能使模型倾向产生过长的推理路径,而长路径的出现增加了表示和推理的难度.
在含约束类型的问句中,约束信息在稀疏的图中难以将语义信息映射到推理过程.
对于这两个问题,由于上述基于语义解析的方法在很大程度上依赖路径进行推理,因此图谱的非完全性极大影响了其表现.
而基于信息检索的方法虽然较少受图谱固有的非完全性影响,但如何充分地对问句中复杂的语义成分建模,仍为亟待解决的问题。
方法概述
评分器模型
根据答案类型,DuReader将问题分为:Entity(实体)、Description(描述)和YesNo(是非)。
对于实体类问题,其答案一般是单一确定的回答,比如:iPhone是哪天发布?
对于描述类问题,其答案一般较长,是多个句子的总结,典型的how/why类型的问题,比如:消防车为什么是红的?
对于是非类问题,其答案往往较简单,是或者否,比如:39.5度算高烧吗?
同时,无论将问题分类以上哪种类型都可以进一步细分为是事实(Fact)类还是观点(Opinion)类。如图3展示了这两大类维度的划分方式。
根据给定的一篇文章来回答项目解决的问题、项目带来的变化和项目创造的价值,属于知识图谱的"信息提取"和"知识推理"分支。
信息提取:这个分支涉及从给定的文章或文本中提取有用的信息。在这种情况下,系统需要从文章中识别出关于项目解决的问题、项目带来的变化以及项目创造的价值的相关信息,然后将其回答或汇总。
知识推理:这个分支涉及根据提取的信息进行推理和理解。系统可能需要将从文章中提取的各种片段和信息整合在一起,进行推理,以回答问题,例如项目是如何解决问题的,它引起了哪些变化以及创造了什么价值。
知识图谱是一个更广泛的领域,其中涉及到的分支和技术较多。在回答这三个问题的场景中,主要涉及到信息提取和知识推理这两个分支,使系统能够从给定的文章中获取相关信息并做出推理回答。