论文笔记：ICLR 2019 RotatE Knowledge Graph Embedding by Relational Rotation in Complex Space

2023年6月1日下午8:17 • 人工智能 • 阅读 75

1. 前言

论文链接：https://openreview.net/forum?id=HkgEQnRqYQ
github：https://github.com/DeepGraphLearning/KnowledgeGraphEmbedding

本文研究在知识图谱中学习实体和关系表示的问题，以预测缺少的链接。此类任务的成功在很大程度上取决于建模和推断关系（或关系之间）模式的能力。在本文中，提出了一种新的知识图谱嵌入方法
称为 RotatE，它能够建模和推断各种关系模式，包括：对称/反对称，反演和组成。具体来说，RotatE模型将每个关系定义为在复矢量空间中从源实体到目标实体的旋转。此外提出了一种新颖的自我对抗式负采样技术，可以有效地训练RotatE模型。在多个Baseline 知识图谱数据集上的实验结果表明，所提出的RotatE模型不仅具有可伸缩性，而且还能够推断和建模各种关系模式，并且明显优于现有的用于链路预测的最新模型。

知识图谱是的表示形式三元组的集合，其中每个三元组 ( h , r , t ) (h,r,t)(h ,r ,t ) 表示 head实体 h h h 和 tail实体 t t t 之间的关系 r r r。知识图谱应用范围很广，包括智能问答、信息检索、推荐系统和自然语言处理等，是当前的研究热点。

然而，通常，现实中的知识图谱通常是不完整的，因此知识图谱的一个首要问题就是预测缺少的链接。最近，已经进行了广泛的研究，以学习实体和关系的低维表示形式以进行缺失链接预测（又称为知识图谱嵌入）。大多是根据观察到的知识事实对知识图中的连接模式进行建模从而进行推断的。举个例子，

有些关系是对称的 symmetric（如：婚姻）
有些关系是反对称的 antisymmetric（如：孝顺）
有些关系与其他关系相反 inversion（例如，上位词和下位词）
有些关系可能是由其他人建立 composition（例如，我母亲的丈夫是我父亲）。

总之，都是从观察到的事实中找到建模和推断这些模式（即symmetry / anti-symmetry, inversion, 和 composition）的方法作链路预测。

现有的知识图谱嵌入模型大致有以下几类：

TransE模型将 relaltion 表示为 translation，旨在对 inversion 和 composition 这两种模式进行建模；
DisMult模型用三种方法对头实体–关系–尾实体建模，旨在对 symmetry模式建模；

但是，现有模型都无法建模和推断所有上述模式。因此，该文章力图寻找一种能够建模和推断所有三种类型的关系模式的方法。

因此文章提出了 RotateE 模型作知识图谱嵌入。该模型的启发来源于欧拉分解： e i θ = c o s θ + i s i n θ e^{i \theta} = cos\theta +isin\theta e i θ=c o s θ+i s i n θ ，该式说明任何一个复数都可以看作复平面上的一个旋转向量（rotation）。具体来说，RotatE模型将实体和关系映射到复数向量空间，并将每个关系定义为从 head 实体到 tail 实体间的旋转。对于一个三元关系 ( h , r , t ) (h,r,t)(h ,r ,t )，我们期望 t = h ∘ r t = h \circ r t =h ∘r ，h , r , t ∈ C k h,r,t \in C^k h ,r ,t ∈C k ,模长 ∣ r i ∣ = 1 |r_i| = 1 ∣r i ∣=1 ,而 ∘ \circ ∘ 表示 Hadamard积（元素乘积）。具体而言，对于复杂空间中的每个维度，我们都期望：

论文笔记：ICLR 2019 RotatE Knowledge Graph Embedding by Relational Rotation in Complex Space

事实证明，该简单方法可以有效地对（上述三种）所有关系进行建模，即, symmetric/antisymmetric, inversion, 和 composition. 即，

r r r 是对称关系时，当且仅当r r r 的每一个分量r i r_i r i 满足 :r i = e 0 / i π = ± 1 r_i = e^{0/i\pi} = \pm1 r i =e 0 /i π=±1 ;
两个关系r 1 r_1 r 1 和r 2 r_2 r 2 是逆关系时，当且仅当他们的嵌入是共轭向量：r 2 = r 1 ‾ r_2 = \overline{r_1}r 2 =r 1 ;
某个关系r 3 = e i θ 3 r_3 = e^{i\theta_3}r 3 =e i θ3 是其他两个关系r 1 = e i θ 1 r_1 = e^{i\theta_1}r 1 =e i θ1 和r 2 = e i θ 2 r_2 = e^{i\theta_2}r 2 =e i θ2 的组合时，当且仅当r 3 = r 1 ∘ r 2 r_3 = r_1 \circ r_2 r 3 =r 1 ∘r 2 (即，θ 3 = θ 1 + θ 2 \theta_3 = \theta_1 +\theta_2 θ3 =θ1 +θ2 ).

此外，由于RotatE模型在时间和内存上都保持线性，因此可扩展到大型知识图谱。

RotatE的优化采用了一种新的自对抗负采样（self-adversarial negative sampling）技术，通过当前实体和关系嵌入生成负采样。这个技术通用性好，可用到许多现有的知识图谱嵌入模型上。

; 2. 相关工作

通常，知识图谱嵌入（knowledge graph embedding, KGE）是通过为实体-关系三元组定义一个得分函数 f r ( h , t ) f_r(h,t)f r (h ,t ) , 测量一个候选三元组 ( h , r , t ) (h,r,t)(h ,r ,t ) 的显著性。表1总结了最新方法以及本文提出模型中的不同得分函数。

且模型通常仅捕获关系模式的一部分。例如，TransE 将每个关系表示为源实体和目标实体之间的双射，因此能够隐式地对关系的 inversion 和 composition 进行建模，但不能对对称关系进行建模； ComplEx 通过引入复杂的嵌入来扩展 DistMult，以便更好地对不对称关系进行建模，但是它不能推断合成模式。这篇文章提出的 RotatE 模型利用了两者的优势。

另外，2018年还提出了一个TorusE 模型，可以看作 RotatE 的特例，其嵌入的维度设定为固定值。相比之下，RotatE 是在整个复杂空间上定义的，它具有更大的表示能力。此外，TorusE 专注于 TransE 中的正则化问题，而 RotateE 专注于建模和推断多种类型的关系模式。

3. RotatE : Relational Rotation in Complex Vector Space

3.1 Modeling and Inferring Relation Patterns

作者首先给出了本文的 RotatE 和 TransE 的区别

其中图c代表了上面所讨论的知识图谱中关系的对称条件下 RotatE 的建模方式。
基于上面所给到的三种关系模式：对称\反对称、相反、组成。在这里给出了它们的正式定义

对称关系意味着 A->B，B->A，反对称关系意味着 A->B，不能得到 B->A
相反关系意味着在关系1 的条件下可以得到 A->B。同时换一种条件关系2，可以得到 B->A
组成关系意味着两种不同的关系条件下的一种传递组成关系

根据以上三种关系模式的定义，对现有模型在推断和建模这些模式方面的能力进行了分析。

; 3.2 Modeling Relations as Rotations In Complex Vector Space

该模型能够对所有三种关系模式进行建模和推断。受欧拉公式的启发，模型将头实体 h h h 和尾实体 t t t 映射到复杂的嵌入，即 h ， t ∈ C k h，t \in \mathbb{C}^k h ，t ∈C k；然后将由每个关系 r r r 引发的功能映射定义为从头实体 h h h 到尾实体 t t t 的元素旋转。换句话说，给定三元组 ( h ， r ， t ) (h，r，t)(h ，r ，t )，期望：

其中 ∘ \circ ∘ 代表哈达玛内积。具体来说，对于嵌入中的每个元素，有 t i = h i r i t_i = h_i r_i t i =h i r i 。在这里，将 r ∈ C k r \in \mathbb{C}^k r ∈C k 的每个元素的模数（即 r i ∈ C r_i \in \mathbb{C}r i ∈C）约束为 ∣ r i ∣ = 1 | r_i |=1 ∣r i ∣=1。这样做，r i r_i r i 的形式为 e i θ r , i e^{i\theta_r,i}e i θr ,i，它对应于绕复平面的原点逆时针旋转 θ r , i \theta_{r,i}θr ,i 弧度，并且仅影响复数中实体嵌入的相位向量空间。由于其旋转性质,，模型称为RotatE。根据以上定义，对于每个三元组( h ， r ， t ) (h，r，t)(h ，r ，t )，将 RotatE 的距离函数定义为：

通过将每个关系定义为复数向量空间中的旋转，RotatE 可以对上面介绍的所有三种类型的关系模式进行建模和推断。

3.3 Connection to TransE

从表2中，我们可以看到 TransE 能够推断和建模除对称模式以外的所有其他关系模式。原因是在TransE中，任何对称关系都将由0平移向量表示。结果，这将推动具有对称关系的实体在嵌入空间中彼此靠近。 RotatE 解决了这个问题，并且能够建模和推断对称模式。可以使用满足 r i = ± 1 r_i =\pm1 r i =±1的任意矢量 r r r 来表示RotatE中的对称关系，因此可以区分具有对称关系的实体。不同的对称关系也可以用不同的嵌入向量表示。图1提供了仅具有一维嵌入的 TransE 和 RotatE 的图示，并显示了 RotatE 如何建模对称关系。

3.4 Optimization

负采样已被证明对于学习知识图嵌入和词嵌入都非常有效。在这里，使用类似于负采样损失的损失函数有效地优化基于距离的模型：

其中 γ \gamma γ 是固定余量，σ \sigma σ 是 s i g m o i d sigmoid s i g m o i d 函数，( h i ′ , r , t i ′ ) (h_i^{‘},r,t_i^{‘})(h i ′,r ,t i ′) 是第 i i i 个负三元组。

模型还提出了一种用于提取负样本的新方法。负采样损耗以均匀的方式对负三元组进行采样。这种均匀的负采样方法存在效率低下的问题，因为随着训练的进行，许多采样显然是错误的，这没有提供任何有意义的信息。因此，本文提出一种称为自我对抗性负采样的方法，该方法根据当前的嵌入模型对负三元组进行采样。具体来说从以下分布中采样负三元组：

其中，α \alpha α 是采样概率。而且，由于采样过程可能很昂贵，因此我们将上述概率作为负样本的权重。因此，经过自我对抗训练的最终负采样损失采用以下形式：

; 4. 实验

Original: https://blog.csdn.net/qq_44015059/article/details/109412787
Author: 饮冰l
Title: 论文笔记：ICLR 2019 RotatE Knowledge Graph Embedding by Relational Rotation in Complex Space

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/558375/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

缺陷检测（图像处理部分）

论文一：工件表面微小缺陷的检测与识别方法提出”基于像元搜索算法的微小缺陷检测方法”。首先采用直方图均衡化提升背景与缺陷目标的对比度，利用中值和均值滤波对…

人工智能 2023年6月17日
0043
机器学习深度神经网络——实验报告

机器学习实验报告〇、实验报告pdf可在该网址下载一、实验目的与要求二、实验内容与方法 * 2.1 深度神经网络的知识回顾 – 2.1.1 神经元模型 2.1.2 …

人工智能 2023年6月23日
0064
CE修改器学习历程之普通变量的保存

同学们有时肯定会在想，如果我们每次重新打开进程都需要使用CE修改器重新找每个变量的地址，那我岂不是要累死？别着急，这节课将为大家介绍普通变量的保存和加载，让大家找一次变量地址即可达…

人工智能 2023年6月27日
00304
【计算机视觉基础】最大核聚类，采用Canny等边缘滤波方法对图像边缘提取，提取图像的Harris角点特征并进行沃罗诺伊与德劳内网格划分，显示沃罗诺伊划分的最大核聚类，详细的最大核聚类计算算法

问题描述如下：分别采用Sobel、Prewitt、Canny边缘滤波方法对一张彩色进行边缘特征提取，并分别显示对应的边缘图像，获取要求1中彩色图像上的Harris角点特征，基于…

人工智能 2023年6月2日
0082
cmw500 lte非信令测试_移动5G SA语音EPS FB测试时延总结

1、背景介绍移劢8月份进行5G SA网络集团测试，打通了 SA的数据业务， 5G的语音业务也是5G的标杆业务， 5G SA语音打通，是5G SA网络建设的里程碑。EPS FB…

人工智能 2023年5月27日
0062
分类问题的评价指标：多标签分类【基于标签度量（同多分类一样）：准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F1】【基于样本度量：Hamming Loss…】

多标签分类的分类评价指标分为两大类：基于标签上的度量：同多分类一样，在每一个标签上计算 Accuray、P、R、F…… 基于样本上的度量：又分为基于分类的…

人工智能 2023年7月1日
0092
目标检测模型——One stage（YOLO v5的模型解析及应用）

简介目标检测分为Two stage和One stage,只使用一个网络同时产生候选区域并预测出物体的类别和位置，所以它们通常被叫做单阶段检测算法（One stage）。本篇文章只…

人工智能 2023年5月28日
0090
Python实现秒杀抢购某宝商品，不再害怕双十一抢不到了

前言马上就要双十一咯，给你们展示一下我在618干的大事，直接用Python抢购商品今天就来分享给你们吧这又快要到付尾款的日子咯，有些哥们需要送礼物给对象的，赶紧买这些预售的商…

人工智能 2023年7月6日
0079
Tensorflow 2.x(keras)源码详解之第十三章：keras中的评估指标及自定义评估指标

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多…

人工智能 2023年5月24日
0063
python 数据分割_python 数据提取及拆分

K线数据提取依据原有数据集格式，按要求生成新表: 1、每分钟的close数据的第一条、最后一条、最大值及最小值， 2、每分钟vol数据的增长量(每分钟vol的最后一条数据减第一条…

人工智能 2023年7月7日
0065
OpenCV [c++]（图像处理基础示例程序汇总）

目录一、图像读取与显示二、图像预处理[高斯滤波、canny边缘检测、膨胀腐蚀] Canny边缘检测三、图像裁剪四、绘制形状和添加文本五、透视投影变换矫正六、颜色检测七…

人工智能 2023年6月18日
0070
I. 知识图谱应用案例 — 美团

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0066
李宏毅《深度学习》- Self-attention 自注意力机制

Transformer & BERT PPT: https://speech.ee.ntu.edu.tw/~hylee/ml/ml2021-course-data/self…

人工智能 2023年6月17日
0067
web网页设计期末课程大作业：美食餐饮文化主题网站设计——美食汇5页HTML+CSS+JavaScript

🎀 精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月28日
0080
df.drop_duplicates() 详解+用法

drop_duplicates() 1、不定义任何参数，完全删除重复的行数据 2、去除重复的几列行数据一、代码示例：二、运行结果：三、详解： import pandas as…

人工智能 2023年7月6日
0066
70年：自然语言处理的重大变革[ChatGPT的视角]

过去的70年里，自然语言处理领域发生了翻天覆地的变化。从有限状态自动机到深度学习，从语法分析到语义理解，自然语言处理技术已经取得了惊人的进步。在本文中，我将为您提供一个简要的历史回…

人工智能 2023年7月31日
0057

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30