知识(Knowledge):合理性(Justified)、真实性(True)、被相信(Believed)
知识是人类通过观察、学习和思考有关客观世界的各种现象而获得并总结出的所有事实(Fact)、概念(Concept)、规则(Rule)或原则(Principle)的集合,分为陈述性知识和过程性知识,又可分为概念知识、事实知识、规则知识。
知识图谱是一种语义网络(Semantic Network)的知识库,可以构建庞大的知识网络,包含世间万物构成的实体以及它们之间的关系,图文并茂地展现知识方方面面的属性,让人们更便捷地获取信息、找到所求
图:一种有效表示数据之间结构的表达形式
知识图谱:旨在以结构化的形式、描述现实世界中存在的概念、实体及其间关系的语义网络
(体系化、关系化、知识可视化)
本体论:来自形而上学(研究第一原则或事物本质的学科)的一个哲学分支,研究存在Being的哲学问题,对世界上任何领域内的真实存在所做出的客观描述
信息领域的本体:形式化、对于共享概念体系的明确且详细的说明
本体反映的知识是一种明确定义的共识,本体是同一领域内不同主体之间进行交流、连通的语义基础,其在知识图谱中的地位相当于知识库的模具,其最大的特点是共享的,位于模式层,用于描述概念层次体系。是知识库中知识的概念模板
各种常见实体间关系:
属性图(Property Graph):可以表示实体和关系的属性
资源描述框架(Resource Description Network):另一种表示知识图谱的方式,由很多三元组(Triples)来组成,不支持属性
知识图谱的基本单位:“实体1-关系-实体2”、“实体、属性、属性值”构成的三元组
本体的特征:概念化、明确化、形式化、共享性
知识图谱的构成:
知识图谱的存储:两种方式
知识图谱示例:
按照数据的结构化程度来分,原始的数据可以分为:
根据数据的不同的结构化形式,采用不同的方法,将数据转换为三元组的形式
然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新知识,可以依据一定的推理规则,产生隐含的知识,所有形成的知识经过一定的质量评估,最终进入知识图谱
依据知识图谱这个数据平台,可以实现语义搜索,智能问答,推荐系统等一些应用
知识图谱构建:
实体抽取示例:
⇓
\LARGE{\Downarrow}
⇓
国外知识图谱项目:
国内知识图谱项目:
最新的知识图谱搜索引擎Magi