论文浅尝 | BoxE：一种基于Box的知识图谱表示学习模型

2023年6月1日下午4:51 • 人工智能 • 阅读 71

笔记整理 | 耿玉霞，浙江大学直博生。研究方向：知识图谱，零样本学习等。

论文链接: https://arxiv.org/pdf/2007.06267.pdf

本文是发表在NeurIPS 2020上的一篇基于Box的知识图谱表示学习模型的文章。在以往知识图谱表示学习（KG Embedding）的相关工作中，通常将知识图谱中的实体和关系均映射为n维向量空间中的一个点，而这篇文章提出将图谱中的关系表示为n维空间中的一个区域，即一个Box，基于Box的关系表示，使得表示学习模型的表达能力更强、能更好地捕获隐含在图谱中推理规则，同时可以兼容外来的推理规则。更重要的是，模型支持对图谱中多元关系（>2）的表达，对于更复杂的知识库有较强的学习能力。

背景：知识图谱与知识库

通常，知识库由一组facts组成，每个fact表示为，即m个实体及其关联关系。其中关系r依据其关联实体个数的不同，称为m元关系。而知识图谱作为一种特殊的知识库，其中的关系均为二元关系，即图谱中的fact为三元组。

一般的表示学习工作主要围绕图谱的表示学习展开，而对于带有多元关系的知识库的表示学习工作则较少。

模型设计

2.1 实体及关系表示

本文提出的BoxE模型将实体表示为n维向量空间中的一个点，而关系则表示为n维向量空间中的区域，即对于m元关系，它的表示为n维空间中的m个区域（即m个Boxes），如二元关系parentOf，其表示为n维空间中的两个Boxes。

具体地，每个实体的表示由两个向量组成：一个是基向量（base position vector）；一个是转移向量（translational bump vector），用于将当前实体的信息转移到位于同一个fact中的其他实体的表示上；换言之，对于每一个实体，其最终的表示为融合了该实体的基向量与位于同一个fact中的其他实体的转移向量的向量表示，如对于fact 中的第个实体，其最终表示为：

其中，为实体的基向量，为其转移向量。

1.2 损失函数

基于上述假设，作者设计了一个距离函数，用于约束向量空间中的实体位置及其对应的Box的位置：

此距离函数的设计，使得实体位于其所在的Box时，函数的值较小，而实体在Box外时，函数值较大，从而产生较大的梯度。

模型最终训练的损失函数定义为：

模型能力

3.1 对于图谱中推理规则的捕捉

推理规则的释义及现有表示学习模型对于其捕捉能力的说明见下图所示。

其中，泛化的推理规则是指表示学习模型可以同时捕捉相同类型的推理规则的多个实例；除此之外，BoxE还可以同时捕捉不同类型的规则实例，这是以往的表示学习模型无法实现的。

3.2 对于外部引入的推理规则的融合

一般地，对于一些已知的、先验的推理规则，以往的模型利用推理机等符号推理的方式，将这些规则应用到知识图谱的三元组实例数据上，从而推理出更多的图谱实例。现有的表示学习模型由于其向量化的表示方式，难以将这些先验规则引入模型。而BoxE中基于Box的关系表示方式，使得模型可以利用Box之间的操作将推理规则融入模型。

3.3 对于多元关系的表示和学习

实验结果

作者首先在标准的知识图谱补全（KGC）的数据集如FB15k-237、WN18RR及YAGO3-10等上进行了实验，实验结果如下图所示。

BoxE相比于TransE、RotatE等模型，达到了SOTA或comparable的结果。

随后，作者在包含多元关系的JF17K、FB-AUTO等数据集上进行了知识库补全（KBC）的实验，实验结果如下图所示：

最后，为验证模型对于外来推理规则的融合能力，作者在NELL数据集的子集Sports NELL上验证了模型的性能，实验结果如下所示：

相比于BoxE模型，加入了融合模块（BoxE+RI）的模型，具有非常好的预测结果。

5．总结

（1）本文提出了一个基于Box的表示学习模型，在提升图谱补全能力的同时，对于图谱中推理规则进行了有效的捕捉，以及对于外部推理规则进行了有效的融合，同时还可泛化至包含多元关系的知识库的表示和推理。

（2）对于知识图谱表示学习等模型来说，对于先验推理规则的应用是非常重要的，其对于模型推理能力的提升可提供有效的帮助，尤其是在图谱样本稀缺、低资源的情况下；

（3）而在深度学习的背景下，BoxE这类基于区域的表示学习模型，对于图谱中实体及关系的表示提供了丰富的表达能力，这些表达更丰富的实体及关系对于其相关符号化知识（推理规则等）的引入提供了方便。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击 阅读原文，进入 OpenKG 网站。

Original: https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/116246220
Author: 开放知识图谱
Title: 论文浅尝 | BoxE：一种基于Box的知识图谱表示学习模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557755/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【POJ No. 3635】加满油箱 Full Tank?

【POJ No. 3635】加满油箱 Full Tank? POJ题目地址【题意】城市之间的油价是不一样的，编写程序，寻找最便宜的城市间旅行方式。在旅行途中可以加满油箱。假…

人工智能 2023年6月27日
0071
【YOLO3D】:端到端3D点云输入的实时检测

YOLO3D:端到端3D点云输入的实时检测前言算法分析 * 模型输入网络结构回归损失 – 3D box 回归偏航角回归边界框损失函数数据集处理 &#821…

人工智能 2023年5月28日
0065
面向法律领域的罪名预测、问题分类与FAQ问答模型设计与实现【NLP】

一、面向法律领域的罪名预测、问题分类与FAQ问答模型设计与实现【NLP】目前NLP技术在各个行业中应用逐步打开，尤其在金融，医疗，法律，旅游方面，NLP技术助力法律智能，能够在一…

人工智能 2023年5月28日
0064
优化算法+神经网络：神经网络自动参数优化

当智能群优化算法遇上神经网络 * – 优化算法进行神经网络的参数寻优，解放深度调参 – + 1.已经实现的Genetic Algorithm优化Neural…

人工智能 2023年7月13日
0076
Transformer用于目标检测- End-to-End Object Detection with Transformers

目前为止看到的讲解transformer最清晰的文章文章目录传统方法存在的问题该方法的创新点网络结构与具体操作实验结果分析 Facebook AI 的研究者推出了 Tra…

人工智能 2023年7月11日
0082
【 YOLO系列v1-v5 原理+代码解读+项目实践】

【 YOLO系列v1-v5 原理+代码解读+项目实践】文前白话 * 深度学习目标检测基础知识原理解析 – YOLO-V1 YOLO-V2 YOLO-V2增加的细节 …

人工智能 2023年7月11日
0056
python+OpenCv笔记（九）：均值滤波

均值滤波原理：采用均值滤波模板对图像噪声进行滤除。令表示中心在(x,y)点，尺寸为m*n的矩形子图像窗口的坐标组，均值滤波器可表示为：即用卷积框覆盖区域内所有像素的平均值…

人工智能 2023年6月19日
0067
yolov5之可视化特征图和检测结果

（1）对6404803的狗图进行检测和特征可视化这个模型使用的是6.1版本的yolov5s.pt，狗图我放在百度云盘了，链接为：链接：https://pan.baidu.com…

人工智能 2023年7月22日
00100
vision transformer的位置编码总结

绝对位置编码 Vit采用绝对位置编码的形式，也就是使用一个值来表征每个patch的绝对位置，并且基于可学习的方式，一般的定义方式为： absolute_pos_embed = nn…

人工智能 2023年7月26日
0062
手把手教利用Bert实现知识库问答（详细注释）

1、数据分析数据格式如下：这个题目的意思就是判断Question和Sentence是否匹配，如果匹配label就是1 统一导入工具包 import csv import tran…

人工智能 2023年5月28日
0084
pandas常用功能_2：数据合并merge

python有多种数据合并的方法，在不同的场合我们可以使用不用的方法 merge可能是我们最熟悉，也最常用的一个方法，因为它的用法与mysql的连接（join）非常类似。函数介绍…

人工智能 2023年7月8日
0073
从零到一保姆级Ubuntu深度学习服务器环境配置教程

文章目录前言一、Ubuntu安装教程 * 1.1 下载Ubuntu镜像 1.2 软碟通刻录U盘 1.3 进入Bios，修改相关选项 1.4 Ubuntu18.04安装流程二、…

人工智能 2023年6月16日
0052
Pandas 选取、过滤、新增、对某一列进行操作

本节主要总结数据处理过程中最常使用的操作，选取、过滤。首先构造一个测试数据 df = pd.DataFrame({‘商品&#x5…

人工智能 2023年7月6日
0048
YOLOv7训练自己的数据集(超详细）

介绍 2022年7月，YOLOv7来临，论文链接：https://arxiv.org/abs/2207.02696 代码链接： GitHub – WongKinYiu…

人工智能 2023年7月25日
0090
浅谈JVM

内存结构： ; 程序计数器（寄存器）作用：记住下一条jvm指令的执行地址特点：是线程私有的不会出现内存溢出虚拟机栈虚拟机栈：是描述java方法执行的内存模型，每个方法在…

人工智能 2023年6月29日
0070
实战1 – 空气质量数据的校准

1 题目简介题目来源于2019 高教社杯全国大学生数学建模竞赛D题——空气质量数据的校准。空气污染对生态环境和人类健康危害巨大，通过对”两尘四气”（PM2…

人工智能 2023年6月19日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

论文浅尝 | BoxE：一种基于Box的知识图谱表示学习模型

大家都在看