KGQA概览

符号说明

符号说明备注
E \mathcal{E}E

所有实体的集合
L \mathcal{L}L

所有literal值的集合三元组(姚明,身高,2.26m)中的2.26m就是literal,它不算实体。
P \mathcal{P}P

所有关系的集合关系既可以是连接两个实体的关系,如国籍,也可以连接实体和literal之间的关系,如上一行所示。
t t t t ∈ E × P × ( E ∪ L ) t\in \mathcal{E}\times\mathcal{P}\times(\mathcal{E}\cup\mathcal{L})t ∈E ×P ×(E ∪L )t t t

代表一个
事实三元组

,三元组指的就是(实体,关系,实体(或者是literal))
K \mathcal{K}K

所有三元组的集合
K \mathcal{K}K

就是
知识图谱q q q

自然语言表达的句子也就是用户的query
A \mathcal{A}A

所有答案的集合答案指的就是q对应的答案,
包含三部分:(1)所有的实体、加上所有的literal;(2)所有聚集函数的计算结果;(3){True,False}

。聚集函数的计算结果指的是形如:”成龙主演了多少部电影” 这句话,答案应该是
sum

成龙主演的所有电影(注:每一个电影在KG中是一个实体)。
F \mathcal{F}F

所有的formal queries的集合formal query指的是形如SPARQL这种可以查询、操控知识图谱的语言。
KGQA的做法就是将q解析成对应的formal query,进而从KG中找出答案a ∈ A , f ∈ F a\in \mathcal{A},f\in \mathcal{F}a ∈A ,f ∈F

单个答案、单个formal query举例:q=”What is the birthplace of Westworld’s writer?”,那么对应的SPARQL语句
f f f

=”SELECT ?uri WHERE {?x ex:writer ex:Westworld.?x ex:bornIn ?uri}”,对应的答案
a a a

=”Chicaga”。

语义解析(Semantic parser)

KGQA就是一个语义解析任务,将用户问题q解析成对应的formal query。

Full supervised vs weak supervised

Full supervised

完全监督形式的KGQA。完全监督指的是数据集中每一个样本包含三部分:(q、f f f、a a a),形如:

KGQA概览

; Weak supervised

弱监督形式下每一个q没有对应的f f f

流程

如下图所示,测试集中的一个问题:”我是李小龙是哪一年出版的?”。

KGQA概览
测试过程是对问题进行语义解析,找出实体I Am Bruce Lee和关系release year。然后到KG中找出三元组(I Am Bruce Lee,release_year, 2012),返回答案。

Original: https://blog.csdn.net/m0_45478865/article/details/121104817
Author: xhsun1997
Title: KGQA概览

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/542979/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球