CS224W摘要11.Reasoning over Knowledge Graphs

2023年6月1日上午9:43 • 人工智能 • 阅读 136

文章目录

Reasoning over Knowledge Graphs
*
Predictive Queries on KG
从One-hop query到path queries（完整KG）
为什么不先做KG Completion
Answering Predictive Queries on Knowledge Graphs
*
Task: Predictive Queries
Conjunctive Queries（完全图）
Query2box: Reasoning over KGs Using Box Embeddings
*
Box Embedding
Projection 和Intersection
–
- 实体到Box的距离表达
AND-OR queries
*
Example for 3 queries with union operation
Example for 4 queries with union operation
解决之道
Training
Query generation from templates
可视化实例

CS224W: Machine Learning with Graphs

公式输入请参考：
在线Latex公式

本节课将介绍知识图谱上的推理任务（就是QA任务）。

主要思路如下：

1.基本概念

2.单跳查询（问答）

3.多跳查询

4.在不完整的KG上进行路径查询（借鉴TransE）

5.联合查询

6.在不完整的KG上进行联合查询（使用Query2Box）

7.Query2Box推广到更一般的形式

本节课用到的一个医学知识图谱。

; Reasoning over Knowledge Graphs

Predictive Queries on KG

给出几个例子：

Query TypesExamplesOne-hop QueriesWhat adverse event is caused by Fulvestrant?

(e:Fulvestrant, (r:Causes))

PathQueriesWhat protein is associated with the adverse event caused by Fulvestrant?

(e:Fulvestrant, (r:Causes, r:Assoc))

Conjunctive QueriesWhat is the drug that treats breast cancer and caused headache?

((e:BreastCancer, (r:TreatedBy)), (e:Migraine, (r:CausedBy))

从One-hop query到path queries（完整KG）

对于单跳查询，可以说非常简单，因为在KG里面已经有( h , r , t ) (h,r,t)(h ,r ,t )的三元组了，这个时候的单跳查询相当于：问题( h , ( r ) ) (h,(r))(h ,(r ))的答案是t t t吗。
For example: What side effects are caused by drug Fulvestrant?

例如：张三的爸爸是谁？
然后可以把单跳查询扩展到多跳查询，就是加多个关系进行计算，多个关系就会形成路径（path）
q = ( v a , ( r 1 , ⋯ , r n ) ) q=(v_a,(r_1,\cdots,r_n))q =(v a ,(r 1 ,⋯,r n ))
其中v a v_a v a 是开始实体（anchor entity）,后面那些就是路径。
答案可以记为：[ [ q ] ] G [[q]]_G [[q ]]G
图形化后：

例子：燕小六的七舅姥爷的三外孙女
“What proteins are associated with adverse events caused by Fulvestrant?”
v a v_a v a is e:Fulvestrant
𝑟 1 , 𝑟 2 𝑟_1, 𝑟_2 r 1 ,r 2 is (r:Causes, r:Assoc)
Query:(e:Fulvestrant, (r:Causes, r:Assoc))

做这个查询就是用图的遍历即可，先遍历第一步r 1 r_1 r 1 ：

遍历第二步r 2 r_2 r 2 ：

但是实际上没有这么简单，因为KG是不完整的。
例如：如果Fulvestrant和Short of Breath之间少了一个关系，那么会导致最后结果少了一个。
CS224W摘要11.Reasoning over Knowledge Graphs

; 为什么不先做KG Completion

根据上节学习到的知识，我们知道可以做知识图谱补全任务，是不是补全了之后再来做推理就完美了？
答案：不是的
因为在知识图谱补全任务中，得到的补全的结果是一个非常稠密的图，补全任务中得到的关系是一个概率，所以大多数节点都会有一定概率出现关系（边）。
Time complexity of traversing a dense KG is exponential as a function of the path length 𝐿：O ( d m a x L ) O(d^L_{max})O (d m a x L )

可以看到遍历操作是指数级别的复杂度，玩不起。下面看解决方案。

Answering Predictive Queries on Knowledge Graphs

Task: Predictive Queries

要在缺失信息（边）的情况下作出回答，相当于：Generalization of the link
prediction task
核心思路：
根据TransE的socore函数：
f r ( h , t ) = − ∣ ∣ h + r − t ∣ ∣ f_r(h,t)=-||h+r-t||f r (h ,t )=−∣∣h +r −t ∣∣
可以把查询的表征理解为：q = h + r q=h+r q =h +r
那么Predictive Queries的目标就是要使得查询的表征与答案的表征越近越好。
f q ( t ) = − ∣ ∣ q − t ∣ ∣ f_q(t)=-||q-t||f q (t )=−∣∣q −t ∣∣
同样套路，先看单跳查询：

如果是多跳查询：q = ( v a , ( r 1 , ⋯ , r n ) ) q=(v_a,(r_1,\cdots,r_n))q =(v a ,(r 1 ,⋯,r n ))
CS224W摘要11.Reasoning over Knowledge Graphs

这样做的好处：
The embedding process only involves vector addition, （向量的加法）independent of # entities \color{red}\text{independent of # entities}independent of # entities in the KG!

看例子：”What proteins are associated with adverse events caused by Fulvestrant?”
查询表示为： (e:Fulvestrant, (r:Causes , r:Assoc))

步骤Query PlanEmbedding Process1

这里要补充1点：由于几个KG补全模型中，只有TransE能处理composition
relations，TransR / DistMult / ComplEx则不行。

; Conjunctive Queries（完全图）

对于更加复杂的Conjunctive Queries，上面的模型就不好用了，看例子：
“What are drugs that cause Short of Breath and treat diseases associated with protein ESR2?”
查询：((e:ESR2, (r:Assoc, r:TreatedBy)), (e:Short of Breath, (r:CausedBy))
Query plan:

按KG traversal的思路，把这个Conjunctive Queries分解为两个Path Queries，然后求公共区域（不是求交）：

这也是在完全图的视角下完成的，如果缺少某个边，那么还是不行：

Query2box: Reasoning over KGs Using Box Embeddings

再回过头来看这个图，实际上这里面的灰色三个点实际上可能包含多个实体，解决这个表达就要用框。

; Box Embedding

Embed queries with hyper-rectangles (boxes)
𝐪 = ( 𝐶 𝑒 𝑛 𝑡 𝑒 𝑟 ( 𝑞 ) , 𝑂 𝑓 𝑓 𝑠 𝑒 𝑡 ( 𝑞 ) ) 𝐪 = (𝐶𝑒𝑛𝑡𝑒𝑟(𝑞) , 𝑂𝑓𝑓𝑠𝑒𝑡(𝑞))q =(C e n t e r (q ),O f f s e t (q ))
如果玩过数据库的QR Tree索引就会比较好理解，就是用一个矩形框来表征几个实体，例如：we can embed the adverse events of Fulvestrant with a box that enclose all the answer entities.

对于一些特殊的表示：
1.单个实体可以看做offset为0的矩形框，就是一个点。
2.每个关系会产生一个新的矩形框
3.多个矩形框可以做交集操作，得到的仍然是一个框（可以是空）
看上面的例子：
“What are drugs that cause Short of Breath and treat diseases
associated with protein ESR2?”
查询：((e:ESR2, (r:Assoc, r:TreatedBy)), (e:Short of Breath, (r:CausedBy))
再次看：

Query PlanEmbedding Space1

Projection 和Intersection

这里补充一下从点（或者矩形框）通过关系得到新box的操作：Projection Operator P \mathcal{P}P
Box × Relation → Box
𝐶 𝑒 𝑛 ( 𝑞 ′ ) = 𝐶 𝑒 𝑛 ( 𝑞 ) + 𝐶 𝑒 𝑛 ( 𝑟 ) 𝑂 𝑓 𝑓 ( 𝑞 ′ ) = 𝑂 𝑓 𝑓 ( 𝑞 ) + 𝑂 𝑓 𝑓 ( 𝑟 ) 𝐶𝑒𝑛 (𝑞’) = 𝐶𝑒𝑛 (𝑞) + 𝐶𝑒𝑛 (𝑟)\ 𝑂𝑓𝑓 (𝑞’) = 𝑂𝑓𝑓 (𝑞) + 𝑂𝑓𝑓(𝑟)C e n (q ′)=C e n (q )+C e n (r )O f f (q ′)=O f f (q )+O f f (r )

然后还有求相交操作Geometric Intersection Operator J \mathcal{J}J
Take multiple boxes as input and produce the intersection box.

求相交后的结果小于等于原来Box的面积，相交结果的中心应尽量接近求交的矩形中心。
这个求相交操作也是分别求相交后的结果的面积和中心两个部分。
对于中心：以输入矩形的中心做加权求和后作为新矩形中心。看下图的红色部分。
对于面积：是三个投影相交的公共部分。看下图的阴影部分。

求中心的数学表达：

w i ∈ R d w_i\in\R^d w i ∈R d is calculated by a neural network f c e n f_{cen}f c e n (with trainable weights)
这里老师还给出了w i w_i w i 的另一种解释，相当于自注意力机制权重，从上面的图可以看到，面积大的那么新中心离其越近。实际上上面的w i w_i w i 就是走的softmax公式，就是算权重。
求Offset（相交阴影）的表达如下：
O f f ( q i n t e r ) = min ⁡ ( o f f ( q 1 ) , ⋯ , o f f ( q n ) ) ⊙ σ ( f o f f ( o f f ( q 1 ) , ⋯ , o f f ( q n ) ) ) Off(q_{inter})=\min\left(off(q_1),\cdots,off(q_n)\right)\odot\sigma(f_{off}(off(q_1),\cdots,off(q_n)))O f f (q i n t e r )=min (o f f (q 1 ),⋯,o f f (q n ))⊙σ(f o f f (o f f (q 1 ),⋯,o f f (q n )))
前面一项是找出所有输入矩形框中最小的那个。
f o f f f_{off}f o f f is a neural network (with trainable parameters) that extracts the representation of the input boxes to increase expressiveness.

这里用到了sigmoid函数（值域是(0,1)），保证求相交后的面积变小。

; 实体到Box的距离表达

这里的Entity-to-Box 距离用f q ( v ) f_q(v)f q (v )表示。该距离是一个负数
Given a query box 𝐪 and entity embedding (box) 𝐯,
d b o x ( q , v ) = d o u t ( q , v ) + α ⋅ d i n ( q , v ) , 0 < α < 1 d_{box}(q,v)=d_{out}(q,v)+\alpha\cdot d_{in}(q,v), 0

f q ( v ) = − d b o x ( q , v ) f_q(v)=-d_{box}(q,v)f q (v )=−d b o x (q ,v )
这里不是直线距离，看图：

有了这个距离表达，就可以将最终的查询进行量化。
上面讲的求交集的操作，下面扩展一下，看求并集的操作。
Conjunctive queries + disjunction is called Existential Positive First-order (EPFO) queries. We’ll refer to them as AND-OR queries.

AND-OR queries

先说结论：可以做，但是不能直接做
先来看为什么不能直接做（需要高维向量才能表示结果，这和我们用DL的目标相悖）。

Example for 3 queries with union operation

Given 3 queries 𝑞 1 , 𝑞 2 , 𝑞 3 ) 𝑞_1, 𝑞_2, 𝑞_3)q 1 ,q 2 ,q 3 ), with answer sets:
[ [ 𝑞 1 ] ] = { 𝑣 1 } , [ [ 𝑞 2 ] ] = { 𝑣 2 } , [ [ 𝑞 3 ] ] = { 𝑣 3 } [[𝑞_1]]= {𝑣_1}, [[𝑞_2 ]]= {𝑣_2}, [[𝑞_3 ]]= {𝑣_3}[[q 1 ]]={v 1 },[[q 2 ]]={v 2 },[[q 3 ]]={v 3 }
We want red dots (answers) to be in the box while the blue dots (negative answers) to be outside the box.

先看如果只考虑一个查询的情况：

没有问题，再看两个查询的情况：

也没有问题，说明三个查询在二维情况下都木有问题。

; Example for 4 queries with union operation

Given 4 queries 𝑞 1 , 𝑞 2 , 𝑞 3 , q 4 ) 𝑞_1, 𝑞_2, 𝑞_3, q_4)q 1 ,q 2 ,q 3 ,q 4 ), with answer sets:
[ [ 𝑞 1 ] ] = { 𝑣 1 } , [ [ 𝑞 2 ] ] = { 𝑣 2 } , [ [ 𝑞 3 ] ] = { 𝑣 3 } , [ [ 𝑞 4 ] ] = { 𝑣 4 } [[𝑞_1]]= {𝑣_1}, [[𝑞_2 ]]= {𝑣_2}, [[𝑞_3 ]]= {𝑣_3}, [[𝑞_4 ]]= {𝑣_4}[[q 1 ]]={v 1 },[[q 2 ]]={v 2 },[[q 3 ]]={v 3 },[[q 4 ]]={v 4 }

这下出问题了，在二维空间中没有办法单独框出v 2 , v 4 v_2,v_4 v 2 ,v 4
除非在三维空间才可以。
因此推出结论：对于AND-OR queries 无法在低维空间进行表征。

Given any 𝑀 conjunctive queries 𝑞 1 , … , 𝑞 M 𝑞_1,…, 𝑞_M q 1 ,…,q M with non-overlapping answers, we need dimensionality of Θ ( 𝑀 ) Θ(𝑀)Θ(M ) to handle all OR queries.

这还是任意一个OR查询而已。。。

解决之道

take all unions out and only do unionat the last step!

这样做的好处就无论多么复杂的查询，都把Union操作放到最后，写成一般形式：
Any AND-OR query can be transformed into equivalent DNF(disjunctive normal form) , i.e., disjunction of conjunctive queries.

q = q 1 ∨ q 2 ∨ ⋯ ∨ q m q=q_1\vee q_2\vee \cdots\vee q_m q =q 1 ∨q 2 ∨⋯∨q m
where 𝑞 i 𝑞_i q i is a conjunctive query.

对于实体和上面的一般表达式的距离可以表示为：
d b o x ( q , v ) = min ⁡ ( d b o x ( q 1 , v ) , ⋯ , d b o x ( q m , v ) ) d_{box}(q,v)=\min(d_{box}(q_1,v),\cdots,d_{box}(q_m,v))d b o x (q ,v )=min (d b o x (q 1 ,v ),⋯,d b o x (q m ,v ))
理解这个公式很重要，就是破解低维空间表达向量的关键。
𝑞 i 𝑞_i q i 是q q q的子集，如果v v v是𝑞 i 𝑞_i q i 的某个答案，那么也是q q q的答案；
同理，在向量空间中，如果v v v与𝑞 i 𝑞_i q i 很接近，那么也和q q q很接近。

The process of embedding any AND-OR query 𝒒

Transform 𝑞 to equivalent DNF q 1 ∨ q 2 ∨ ⋯ ∨ q m q_1\vee q_2\vee \cdots\vee q_m q 1 ∨q 2 ∨⋯∨q m
Embed 𝑞 1 𝑞_1 q 1 to 𝑞 m 𝑞_m q m
Calculate the (box) distance 𝑑 b o x ( q i , v ) 𝑑_{box}(q_i, v)d b o x (q i ,v )
Take the minimum of all distance
The final score 𝑓 q ( 𝑣 ) = − 𝑑 b o x ( q , v ) 𝑓_q(𝑣) = −𝑑_{box}(q, v)f q (v )=−d b o x (q ,v )

; Training

主要思想还是constrative loss，最大化正样本的分数，最小化负样本的分数。
涉及到的参数有：
Entity embeddings with 𝑑 ∣ 𝑉 ∣ 𝑑 |𝑉|d ∣V ∣ # params
Relation embeddings with 2 𝑑 ∣ 𝑅 ∣ 2𝑑 |𝑅|2 d ∣R ∣ # params
Intersection operator
步骤：

Randomly sample a query 𝑞 𝑞q from the training graph 𝐺 t r a i n 𝐺_{train}G t r a i n , answer v ∈ [ [ 𝑞 ] ] 𝐺 t r a i n v\in[[𝑞]]{𝐺{train}}v ∈[[q ]]G t r a i n , and a negative sample v ′ ∉ [ [ 𝑞 ] ] 𝐺 t r a i n v’\notin[[𝑞]]{𝐺{train}}v ′∈/[[q ]]G t r a i n .

Negative sample: Entity of same type as 𝑣 𝑣v but not answer.

Embed the query q q q.
Calculate the score f q ( v ) f_q(v)f q (v ) and f q ( v ′ ) f_q(v’)f q (v ′).
Optimize the loss l \mathcal{l}l to maximize f q ( v ) f_q(v)f q (v ) while minimize f q ( v ′ ) f_q(v’)f q (v ′):
ℓ = − log ⁡ σ ( f q ( v ) ) − log ⁡ ( 1 − σ ( f q ( v ′ ) ) ) ℓ = −\log \sigma\left(f_q(v)\right)−\log(1 − \sigma(f_q(v’)) )ℓ=−lo g σ(f q (v ))−lo g (1 −σ(f q (v ′)))

Query generation from templates

query抽象后就是query template.

Start from instantiating the answer node of the query template and then iteratively instantiate the other edges and nodes until we ground all the anchor nodes.

思想就是反过来，从答案往anchor方向回溯。
下面看从KG抽象query的过程：

1.先初始化一个root node，这里选Fulvestrant
跟Fulvestrant有关的的有黄线和绿线
2.随机选一个，例如选中了绿色的TreatedBy，然后根据TreatedBy得到实体：Breast Cancer

3.然后再根据实体Breast Cancer的Assoc边找到Anchor：ESR2

4.然后再按同样的思路从Fulvestrant走黄线CausedBy得到另外一个Anchor：Short of Breath

5.最后得到查询q q q
CS224W摘要11.Reasoning over Knowledge Graphs

查询的表达：
𝒒: ((e:ESR2, (r:Assoc, r:TreatedBy)), (e:Short of Breath, (r:CausedBy))
注意要点：
1.The query 𝑞 must have answers on the KG and one of the answers is the instantiated answer node: Fulvestrant.

2.We may obtain the full set of answers [ [ 𝑞 ] ] 𝐺 [[𝑞]]{𝐺{}}[[q ]]G by KG traversal.

3.We can sample negative answers v ′ ∉ [ [ 𝑞 ] ] 𝐺 v’\notin [[𝑞]]{𝐺{}}v ′∈/[[q ]]G

; 可视化实例

Example: “List male instrumentalists who play string instruments”
用tsne降维后显示结果。

先找锚点

然后这里做projection操作后，可以看到准确率100%

再一次projection：

另外一个锚点Male：

projection

最后做intersection

Original: https://blog.csdn.net/oldmao_2001/article/details/120509854
Author: oldmao_2000
Title: CS224W摘要11.Reasoning over Knowledge Graphs

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556107/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于InceptionV3深度学习实现岩石图像智能识别与分类

基于InceptionV3深度学习实现岩石图像智能识别与分类文章目录基于InceptionV3深度学习实现岩石图像智能识别与分类 * 总体流程数据预处理构建Inceptio…

人工智能 2023年7月2日
0075
代码随想录day52｜子序列系列｜300.最长递增子序列｜674. 最长连续递增序列｜718. 最长重复子数组｜Golang

代码随想录day52 加油，时间不多了 300.最长递增子序列思路最长上升子序列是动规的经典题目，这里dp[i]是可以根据dp[j] （j < i）推导出来的，那么依然用…

人工智能 2023年6月28日
0066
yolov5调用ip摄像头时出现的问题

今天尝试使用yolov5-5.0做实时目标检测，但是当输入指令： python detect.py –source http://192.168.xx.xx:xx/video -…

人工智能 2023年6月18日
0064
基于微分方程的图像去噪处理(改进型P-M法)附MATLAB代码

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月18日
0068
Python迭代器基本方法iter()及其魔法方法__iter__()原理详解

Python迭代器的基本方法:iter()、next() 迭代器：迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束。迭代器…

人工智能 2023年7月6日
0059
7-2 自注意力机制原理

文章目录 7-2 自注意力机制原理 * 1. 简介 2. NLP中自注意力 3. 图像中的自注意力+代码 4. 问题 7-2 自注意力机制原理上一章已经讲过什么是注意力，注意…

人工智能 2023年6月17日
0071
ERNIE，ERNIE2.0，Transformer-XL，XLNET

文章目录 ERNIE * 实体级别的Mask 其他细节 Dialog embedding 与bert对比 ERNIE 1.0 做了什么 ERNIE 2.0 * 整体框架连续多任务…

人工智能 2023年6月10日
0072
联邦学习（FL）+差分隐私（DP）

联邦学习（FL）+差分隐私（DP）文章首发在我的博客！在这里在这里在这里在这里在这里！！！！！！防止梯度信息被泄露的方法有很多，目前主要有两种： 1.基于安全多方计算的这个里…

人工智能 2023年6月13日
0073
如何用Pandas读取一个csv文件

一，csv文件 csv文件是什么？csv文件是一个文件类型。这种文件不像excel,word,ppt……这些文件一样，它们的区别就在于，如果你用MacOs(…

人工智能 2023年7月6日
0078
【图像分割】基于直觉模糊C均值聚类实现图像分割IFCMmatlab代码

1 简介模糊C均值聚类(FCM)图像分割法是一种典型且常用的模糊聚类图像分割算法，该方法原理简单，迭代过程能够自适应，但是该方法也存在一些明显的缺陷：对噪声敏感且对重叠部分图像…

人工智能 2023年6月2日
0058
低版本Docker升级高版本Docker【详细教程、成功避坑】

🎈 作者：互联网-小啊宇 🎈 简介： CSDN 运维领域创作者、阿里云专家博主。目前从事 Kubernetes运维相关工作，擅长Linux系统运维、开源监控软件维护、Kubern…

人工智能 2023年6月19日
0064
用树莓派做一个语音机器人

早就想写一篇语音机器人的文章，凑巧这两天受委托做个树莓派语音机器人，又复习一下流程熟悉了过程才准备写一篇文章，这是基于图灵机器人和百度api的语音助手。目录准备 * 硬件准备 …

人工智能 2023年5月25日
0067
NIPS2022上的图神经网络相关论文总结

探究模型表达能力 How Powerful are K-hop Message Passing Graph Neural Networks Ordered Subgraph Agg…

人工智能 2023年7月28日
0065
使用“Opencv“时遇到terminate called after throwing an instance of ‘cv::Exception‘问题的解决方案

使用”Opencv”时遇到terminate called after throwing an instance of ‘cv::Excepti…

人工智能 2023年7月26日
00122
详细配置Anaconda3 CUDA11.3 Pytorch1.10 TensorFlow2.7 Jupyter 环境（最新更新 22年4月23日）

目录 1、前言 1.1 2021年09月29日更新第一版配置 1.2 2021年12月26日更新第二版配置 1.3 2022年03月05日更新第三版配置 1.4 2022年0…

人工智能 2023年5月25日
0056
初识基于深度学习的目标检测（无人驾驶感知）

一、深度学习是什么？百度百科的解释是这样子：深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构。说起人工神经网络，首先要特别感谢1981 年…

人工智能 2023年7月9日
0046

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30