符号说明
符号说明备注
E \mathcal{E}E
所有实体的集合
L \mathcal{L}L
所有literal值的集合三元组(姚明,身高,2.26m)中的2.26m就是literal,它不算实体。
P \mathcal{P}P
所有关系的集合关系既可以是连接两个实体的关系,如国籍,也可以连接实体和literal之间的关系,如上一行所示。
t t t t ∈ E × P × ( E ∪ L ) t\in \mathcal{E}\times\mathcal{P}\times(\mathcal{E}\cup\mathcal{L})t ∈E ×P ×(E ∪L )t t t
代表一个
事实三元组
,三元组指的就是(实体,关系,实体(或者是literal))
K \mathcal{K}K
所有三元组的集合
K \mathcal{K}K
就是
知识图谱q q q
自然语言表达的句子也就是用户的query
A \mathcal{A}A
所有答案的集合答案指的就是q对应的答案,
包含三部分:(1)所有的实体、加上所有的literal;(2)所有聚集函数的计算结果;(3){True,False}
。聚集函数的计算结果指的是形如:”成龙主演了多少部电影” 这句话,答案应该是
sum
成龙主演的所有电影(注:每一个电影在KG中是一个实体)。
F \mathcal{F}F
所有的formal queries的集合formal query指的是形如SPARQL这种可以查询、操控知识图谱的语言。
KGQA的做法就是将q解析成对应的formal query,进而从KG中找出答案a ∈ A , f ∈ F a\in \mathcal{A},f\in \mathcal{F}a ∈A ,f ∈F
单个答案、单个formal query举例:q=”What is the birthplace of Westworld’s writer?”,那么对应的SPARQL语句
f f f
=”SELECT ?uri WHERE {?x ex:writer ex:Westworld.?x ex:bornIn ?uri}”,对应的答案
a a a
=”Chicaga”。
语义解析(Semantic parser)
KGQA就是一个语义解析任务,将用户问题q解析成对应的formal query。
Full supervised vs weak supervised
Full supervised
完全监督形式的KGQA。完全监督指的是数据集中每一个样本包含三部分:(q、f f f、a a a),形如:
; Weak supervised
弱监督形式下每一个q没有对应的f f f
流程
如下图所示,测试集中的一个问题:”我是李小龙是哪一年出版的?”。
测试过程是对问题进行语义解析,找出实体I Am Bruce Lee和关系release year。然后到KG中找出三元组(I Am Bruce Lee,release_year, 2012),返回答案。
Original: https://blog.csdn.net/m0_45478865/article/details/121104817
Author: xhsun1997
Title: KGQA概览
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/542979/
转载文章受原作者版权保护。转载请注明原作者出处!