在上一篇读书笔记中讲到知识图谱存储主要有基于开源的Jena方式和基于图数据库(Neo4j)方式,本次主要对Jena的基础操作和如何应用进行了实践总结,同时结合了D2R,将结构化数据转换成Jena可以加载的格式(即RDF,后缀是.nt),Apache Jena作为一种开源的Java语义网框架,主要功能有RDF数据管理、RDFS和OWL本体管理、SPARQL查询处理;推理主要有基于规则的推理引擎,可执行RDFS和OWL本体推理任务。
利用Apache Jena存储数据目前主要采用TDB方式,性能最好, 支持几十亿条记录,同时利用Apache Jena Fuseki存储和管理三元组,支持通过SPARQL进行图谱查询。
sparql -version
利用D2RQ根据mysql数据模式自动生成默认的mapping,用于sql-->rdf的映射,一般情况下需要手动修改,比如将person_name改为personName等,进入D2RQ根目录
运行:generate-mapping -u root -p root123 -o kg_demo_movie_mapping.ttl jdbc:mysql:///kg_demo_movie?useSSL=false
运行:d2r-server kg_demo_movie_mapping.ttl,浏览器访问http: