论文浅尝 | PairRE: 通过成对的关系向量实现知识图谱嵌入

2023年6月1日上午8:38 • 人工智能 • 阅读 66

笔记整理：黎洲波，浙江大学硕士，研究方向为自然语言处理、知识图谱。

研究背景

知识图谱因其在问答、语义解析和命名实体消歧等任务取得了良好的效果而受到广泛关注，而大部分知识图谱都存在不全和缺失实体链接的问题，所以需要进行链接预测(Link Prediction)和知识图谱补全(Knowledge Graph Completion)。知识图谱嵌入(Knowledge Graph Embedding)方法被提出来解决该问题。知识图谱嵌入是将知识图谱中所有的实体和关系嵌入到低维空间的方法，从基于距离的方法TransE到目前的效果最好的RotatE，在知识图谱补全任务上效果持续提升。

在知识图谱嵌入中，有两个主要问题受到广泛关注：

1.如何解决1对N，N对1和N对N的复杂关系表示问题。比如1对N的关系：基于距离的方法中，三元组(StevenSpielberg, DirectorOf, ?)的补全要求在经过关系变换DirectorOf后，Jaws和JurassicPark等实体能够距离StevenSpielberg更接近，但是使所有这类实体具有不同的表示是很困难的。2.如何通过已有的三元组学习和推断关系模式。关系模式例如对称(Symmetry)关系IsSimilarT，非对称(Antisymmetry)关系FatherOf，逆向(Inverse)关系PeopleBornHere和PlaceOfBirth以及组合(Composition)关系mother’s father is grandpa等等。

研究动机

之前的TransH、TransD和TransR等方法致力于解决复杂关系表示问题，却只能编码对称/非对称关系，最新的RotatE在编码对称/非对称关系，逆向关系和组合关系上取得了优异的效果，但是复杂关系的预测依然具有挑战性。由此，论文提出了一种新的知识图谱嵌入方法PairRE，它能够同时编码复杂的关系和多种关系模式。

研究方法

模型中使用的两个用于关系表示的向量将头尾实体分别投影到欧式空间，再最小化投影向量的距离。其形式化描述如下：

PairRE和前面提到的几种方法的比较如下，可以看出相比于RotatE，论文提出的PairRE方法在复杂关系表示上表现更优，同时在关系模式的编码上能够编码子(Sub)关系。

直观来说，PairRE中所有的实体表示都在一个超球上。

相比于其他方法，PairRE允许一个实体在不同的关系中有分布式表示，并且成对的关系向量能够对损失函数中的边际进行自适应调整，从而缓解复杂关系的表示问题。例如在1对N的关系补全(h, r, ?)中，由正确的尾实体集合S = {t_1,t_2,…,t_N}，论文基于固定边际参数γ的设计了t_i的取值范围：

在TransE和RotatE中也有类似的固定边际参数来控制复杂关系表示，当|S|足够大时，PairRE能够通过减小|r^T|来拟合t_i，而前两种方法效果不佳。

对于各种关系模式，证明PairRE编码的形式化描述如下：

对称/非对称关系模式

逆向关系模式

组合关系模式

对于子关系编码，PairRE满足了以下条件：

子关系模式

PairRE的模型优化中使用了自对抗(Self-adversarial)的负采样损失函数：

其中，γ是固定边界参数，σ是sigmoid函数，(h_i^’,r,t_i^’)是第i个负样本，补充定义如下

实验验证

实验中用于做链接预测任务的数据集信息如下图

PairRE和其他方法的结果比较如下

上图是本文的主实验结果，可以看到Pair相比于RotatE在各个设定下都取得了更好的效果，如果嵌入向量的维度能够升高到500，效果可能会进一步提升。

文中提到，由于PairRE和RotatE共享超参数和实现方法，所以客观来说与RotatE比较更公平。

论文还针对子关系模式做了补充实验，将PairRE同ComplEx-NNE-AER和SimplE^+进行对比，这两种方法通过设计子关系规则进行语义匹配。论文同时借鉴了ComplEx-NNE-AER中的规则，对本来的损失函数进行改变如下：

对数据集Sports添加以下规则并获得结果

将子关系模式中的两个关系看作同等之后，在数据集DB100k上获得的结果如下

模型分析

对于复杂关系的表示问题，论文对关系的种类进行分别实验，结果表明PairE在N对1和N对N的关系表示在数据集FB15k和ogbl-wikikg2上表现明显超过了其他模型，但是在1对1和1对N的关系表示上结果不佳。论文为了证明成对的关系向量有优越性，单独将成对关系向量机制加在RotatE上，在ogbl-wikikg2数据集上取得了良好的效果。

对于关系模式问题，论文在嵌入向量维度为500下取DB100k中的对称关系r_1:spouse和非对称关系r_2:tv_station/owner，对称关系编码满足r^(H^2 )=r^(T^2 )，编码效果如下：

验证逆向关系r_2和r_3: tv_station_owner/tv_stations，编码满足r_3^H∘r_2^H=r_3^T∘r_2^T，编码效果如下：

验证组合关系r_4: /location/administrative_division/capital/location/administrative_division_capital_relationship/capital，r_5: /location/hud_county_place/place和r_6: base/areas/schema/administrative_area/capital.，编码满足r_4^H∘r_5^H∘r_6^T-r_4^H∘r_5^T∘r_6^H，效果如下：

总结

论文提出的PairRE方法用成对的向量表示每个关系，使损失函数中的余量能够自适应调整，以适应不同的复杂关系，在复杂度略有增加的情况下有效地解决了知识图谱嵌入中的问题。除了对称/不对称、逆向和组合关系之外，PairRE还可以通过对关系表示的简单约束编码子关系。在大规模数据集ogbl-wikikg2上，PairRE取得了最优效果。

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击 阅读原文，进入 OpenKG 网站。

Original: https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/122150679
Author: 开放知识图谱
Title: 论文浅尝 | PairRE: 通过成对的关系向量实现知识图谱嵌入

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/555836/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Machine Learning – week1

文章目录 1. 什么是机器学习？ 2. 监督学习 3. 无监督学习 4. 线性回归模型 5. 代价函数（平方误差函数） * （1）单参图像直观展示（2）双参图像直观展示 6. 梯…

人工智能 2023年6月17日
0060
经典网络结构 (七)：FPN, DetNet

目录多尺度问题特征金字塔: FPN (Feature Pyramid Network, 特征金字塔) 为检测而生: DetNet References 本文主要介绍两个用于物体…

人工智能 2023年7月12日
0058
Anaconda虚拟环境AutoKeras安装

AutoKeras支持的自动化任务： 1.安装要求 Python 3：按照 TensorFlow 安装步骤安装 Python 3。 Pip：按照 TensorFlow 安装步骤进行…

人工智能 2023年5月24日
00120
Livox Avia 雷达测试使用 —– 测试使用（Ubuntu18.04 + ROS Melodic）

Ubuntu18.04测试使用Livox Avia 雷达 * – 1. 新建ROS工程目录文件夹 – 2. 下载相关的源码和相关SDK依赖包 –…

人工智能 2023年6月1日
0089
图像处理作窗口运算时边界的几种扩展方法(详解OpenCV中的参数borderType)

上一篇博文在讲述”窗口、核算子、模板、结构、卷积核、高斯核、锚点”的概念时，涉及到了边界扩展的概念，详情见链接 https://www.hhai.cc/th…

人工智能 2023年6月20日
00188
Pandas+Pyecharts | 40000+条考研信息数据可视化（学校、专业分数分布）

文章目录 1. 导入模块 2. Pandas数据处理 * 2.1 读取数据 2.2 查看索引、数据类型和内存信息 2.3 去掉空行 2.4 筛选2020年考研信息 2.5 查看某些…

人工智能 2023年6月11日
0050
Scikit-learn库中，回归性能评估所用的score函数含义详解

一.LinearRegression().score方法关于LinearRegression().score(self, X, y, sample_weight=None)方法，…

人工智能 2023年6月16日
0050
【操作系统】启动篇

摘要：对于编程路上各个阶段的人来说，操作系统无疑都是神秘而富有吸引力的。我们所看到的操作系统就像一座冰山，冰山之下的秘密令人向往而畏惧。不知你是否曾经也幻想过写一个操作系统，却苦于…

人工智能 2023年6月28日
00117
在Python中使用微信扫码功能（OpenCV WeChatQRCode）

原文链接：http://www.juzicode.com/opencv-note-wechat-qrcode-detect-decode 微信开发团队在今年年初的时候将其二维码扫描…

人工智能 2023年5月28日
0070
用Python来表白，把情书写进她的照片里

前言这不已经十一月了，22年马上就过完了，各位兄弟有对象了吗，现在就是缺钱还缺对象退一步来说，有心仪的人吗啊，如果有的话，看看这篇程序员的表白小妙招吧 ; 实现步骤想要实现…

人工智能 2023年6月20日
0092
指纹图谱相似度评价软件_内容相似度计算-自动构建知识图谱（实例）

一、知识图谱相关概念 Google公司于2012年提出知识图谱（Knowledge Graph）概念，其目的是，在关键词搜索基础上，根据知识之间的关系构建知识图谱，自动搜索相关知识…

人工智能 2023年6月1日
0078
变量之间的相关性：协方差、相关系数

协方差方差和标准差衡量的是一个变量（一组数据）的离散程度，也就是变量和均值之间的偏离程度。协方差衡量的是两个变量之间的相关性，如：正相关：两个变量具有相同的变化趋势（也称同方…

人工智能 2023年6月18日
0078
UNIRE：A Unified Label Space for Entity Relation Extraction

Abstract Many joint entity relation extraction models setup two separated label spaces for…

人工智能 2023年6月1日
00105
“Open3d:ImportError: DLL load failed: 找不到指定的模块”解决思路和方法

（1）问题分析：在python3.9的pip中下载open3d和open3d-python，版本为0.15.1和0.3.0.然后导入open3d包，import open3d a…

人工智能 2023年7月29日
0048
Python中找出dataframe中的重复的行 DataFrame.duplicated()方法

● 选择题以下关于DataFrame.duplicated()函数说法错误的是： A 该函数用于标记dataframe中内容重复的行 B 该函数返回值是一个序列，True表示重复…

人工智能 2023年7月7日
0066
Windows安装Anaconda，创建pytorch环境，pycharm配置环境

目录 1、简介 2、安装Anaconda 3、创建一个独立的环境 4、安装依赖的库 5、安装pytorch 6、pycharm中使用conda环境 7、到这里安装就结束了，希望对您…

人工智能 2023年7月22日
0052

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30