图的分类
图数据库从存储结构上来说,只有两种结构:一种是属性图;另一种是RDF图,又称作三元组图。
RDF基础知识
RDF定义
RDF(Resource-Description-Framework),即资源描述框架,是采用XML编写的一种网络资源描述模型,其最初目的是为便于计算机理解并读取(不包括展示),所以其展示效果并不好。2004年2月,RDF成为了W3C标准,从此开启了辉煌之路。
RDF规则
RDF使用Web标识符来标识事物,并通过属性和属性值来描述资源。关于资源、属性和属性值的定义如下:
资源是可拥有 URI 的任何事物,比如 “http://www.w3school.com.cn/rdf”
属性是拥有名称的资源,比如 “author” 或 “homepage”
属性值是某个属性的值,比如 “David” 或 “http://www.w3school.com.cn”
简单的RDF示例
David
http://www.w3school.com.cn
RDF描述
资源、属性和属性值可组合成一个陈述句(这三个名词就是我们汉语语法中的”主语”、”谓语”和”宾语”),在上面的例子中主谓宾可以表示成下面的方式:
主语:网址(http://www.w3school.com.cn/rdf)
谓语:作者(author)、主页(homepage)
宾语:作者名字(David)、主页地址(http://www.w3school.com.cn)
RDF图内容
RDF图
RDF图是由RDF三元组组成的集合,其形式上是SPO三元组 ,可以用一个URI表示这个图,如下所示。
RDF序列化
上面我们有了RDF图,那么我们应该采用哪种方式序列化(存储)RDF图呢?目前RDF图主要有RDF/XML, N-Triples, Turtle, JSON-LD几种方式。
RDF/XML
使用XML的方式表示RDF数据
优点:技术成熟,方式简单,目前的图数据库几乎都支持该方式
缺点:格式冗长,不便于阅读
N-Triples
用多个三元组表示RDF数据集
优点:表示方式简单,每一行数据表示一个三元组,便于解析和处理
缺点:
代表图库: DBpedia
Turtle
目前使用最广的方式
优点:比RDF/XML紧凑,可读性比N-Triples好
JSON-LD
键值对形式存储RDF数据
RDF图数据库
Apache jena
目前最受欢迎的RDF数据库,所属Apache旗下。
RDF4J
Eclipase旗下
RDF图查询
SparkQL
Original: https://blog.csdn.net/weixin_30096321/article/details/114204068
Author: 首夏
Title: java rdf_知识图谱之认识RDF图
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/556155/
转载文章受原作者版权保护。转载请注明原作者出处!