• 【人工智能】知识图谱


    一、知识图谱的概况

    知识(Knowledge):合理性(Justified)、真实性(True)、被相信(Believed)

    知识是人类通过观察、学习和思考有关客观世界的各种现象而获得并总结出的所有事实(Fact)、概念(Concept)、规则(Rule)或原则(Principle)的集合,分为陈述性知识过程性知识,又可分为概念知识事实知识规则知识

    知识图谱是一种语义网络(Semantic Network)的知识库,可以构建庞大的知识网络,包含世间万物构成的实体以及它们之间的关系,图文并茂地展现知识方方面面的属性,让人们更便捷地获取信息、找到所求

    二、知识图谱的基本概念

    图:一种有效表示数据之间结构的表达形式

    知识图谱:旨在以结构化的形式、描述现实世界中存在的概念、实体及其间关系的语义网络
    (体系化、关系化、知识可视化)

    本体论:来自形而上学(研究第一原则或事物本质的学科)的一个哲学分支,研究存在Being的哲学问题,对世界上任何领域内的真实存在所做出的客观描述

    信息领域的本体:形式化、对于共享概念体系的明确且详细的说明

    本体反映的知识是一种明确定义的共识,本体是同一领域内不同主体之间进行交流、连通的语义基础,其在知识图谱中的地位相当于知识库的模具,其最大的特点是共享的,位于模式层,用于描述概念层次体系。是知识库中知识的概念模板

    • 实体(entity):现实世界中的具有可区别性且独立存在的某种具体事物,是知识图谱中的最基本元素
    • 类(class)或概念(concepts):相同性质的客观事物集合(类别、对象类型、事物的种类)
    • 关系(relations):某个领域中概念或实体之间的外在相互联系
    • 属性(attribute, property):某个实体或概念的固有内在特性
    • 公理(axiom):描述领域内总时成立(为真)的陈述

    各种常见实体间关系:

    • part-of(部分与整体之间的关系)
    • kind-of(继承,例如父类和子类;给出两个概念 C C C D D D,记 S C = { x ∣ x 是 C 的实例 } S_C=\{x|x\text{是}C\text{的实例}\} SC={xxC的实例} S D = { x ∣ x 是 D 的实例 } S_D=\{x|x\text{是}D\text{的实例}\} SD={xxD的实例},若 S D ⊆ S C S_D\subseteq S_C SDSC,则称 C C C D D D的父概念, D D D C C C的子概念)
    • instance-of(概念的实例与概念之间的关系)
    • attribute-of(属性,e.g. 概念“颜色”是概念“玫瑰花”的一个属性)

    属性图(Property Graph):可以表示实体和关系的属性

    资源描述框架(Resource Description Network):另一种表示知识图谱的方式,由很多三元组(Triples)来组成,不支持属性

    知识图谱的基本单位:“实体1-关系-实体2”“实体、属性、属性值”构成的三元组

    知识图谱示例1
    知识图谱示例2

    本体的特征:概念化、明确化、形式化、共享性

    知识图谱的构成:

    • 知识图谱:包含多种类型的节点(概念、实体)、多种类型的边(概念或实体的属性、概念 或实体间的关系)的多关系图
    • 图:由节点和无向边组成,通常只包含一种类型的节点和边
    • 多关系图:包含多种类型的节点和多种类型的边

    知识图谱的存储:两种方式

    • 基于RDF的存储(三元组,不包含属性信息)
    • 基于图数据库的存储(更容易表达现实的业务场景)

    知识图谱示例:

    知识图谱示例3
    知识图谱示例4

    三、知识图谱构建技术

    按照数据的结构化程度来分,原始的数据可以分为:

    • 结构化数据
    • 半结构化数据
    • 非结构化数据

    根据数据的不同的结构化形式,采用不同的方法,将数据转换为三元组的形式

    然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新知识,可以依据一定的推理规则,产生隐含的知识,所有形成的知识经过一定的质量评估,最终进入知识图谱

    依据知识图谱这个数据平台,可以实现语义搜索,智能问答,推荐系统等一些应用

    知识图谱构建:

    • 原始数据
    • 信息提取
    • 知识融合
    • 知识加工
    • 知识更新

    知识图谱构建

    知识图谱架构
    逻辑结构
    技术架构
    模式层(本体库)
    数据层(客观事实,三元组)
    信息提取
    知识表示
    知识融合
    知识加工
    知识更新
    实体抽取
    关系抽取
    属性抽取
    传统表示方法:三元组SPO
    深度学习为代表的技术:稠密地位实值向量
    实体链接
    知识合并
    本体构建
    知识推理
    质量评估
    全面更新:以更新后的全部数据为输入
    增量更新:以当前新增数据为输入

    实体抽取示例:
    实体抽取1
    ⇓ \LARGE{\Downarrow}
    实体抽取2

    四、知识图谱主要应用

    • 语义搜索/智能搜索
    • 人物关系图
    • 智能问答
    • 领域概念关系、风险分析
    • 可视化决策支持(反欺诈)
    • 个性化服务、辅助决策

    国外知识图谱项目:

    • 常识知识库:Cyc、WorldNet、ConceptNet
    • 互联网知识图谱:FreeBase、DBpedia、Schema、Wikidata、BableNet、Microsoft ConceptGraph,医疗领域Linked Life Data等

    国内知识图谱项目:

    • OpenKG、CN-DBpedia、中医药知识图谱、阿里电商知识图谱、美团知识图谱、XLore(清华大学)、Belief-Eigen(中科院)、PKUPie(北京大学)等

    最新的知识图谱搜索引擎Magi

  • 相关阅读:
    Linux有关权限的经验分享
    验证用户是否登录 (认证用户)
    【4.1 统计学基本概念】(描述性统计分析)——CDA
    Vue3中v-if与v-for、多事件处理器即案件修饰符、$attrs、$root和$parent
    【刷题记录12】Java工程师丨面试必会进程线程问答
    Qt学习_13_可执行文件.exe添加图标/logo
    js-算术三元组的数目
    Python离线断网情况下安装numpy、cv2和matplotlib等常用第三方包
    【开发日记】ElementUI表单使用原生@submit提交表单数据
    Vuex安装以及简单封装
  • 原文地址:https://blog.csdn.net/qaqwqaqwq/article/details/128128206