Robust Knowledge Graph Completion with Stacked Convolutions and a Student Re-Ranking Network

2023年6月10日上午5:57 • 人工智能 • 阅读 90

研究问题

创建了稀疏连接的知识图谱数据集，并研究如何在稀疏连接的知识图谱上完成链路预测任务

背景动机

目前常用的知识图谱补全数据集都是基于稠密连接的假设创建的，比如FB15K数据集创建时就只包含至少有一百条边关联的实体，但这与实际情况不符，限制了模型在实际中的应用
现有模型的复杂程度不够，论文对如何堆叠卷积进行了研究
现有模型都是直接给出候选实体的分数排名，论文使用Student网络对其进行了Re-rank（知识图谱的稀疏性带来了一些标签噪声，而知识蒸馏有助于提升模型在噪声下的表现）

数据集构造

论文构造了两个数据集，一个是在SNOMED CT的基础上重新构造数据集SNOMED CT Core，不实施去除稀疏实体的操作；另一个是对FB15k-237进行降采样，随机删除一些边，获得FB15k-237-Sparse，论文使用的几个数据集如下，除了FB15k-237是常规的密集数据集，其他几个都是稀疏数据集

Robust Knowledge Graph Completion with Stacked Convolutions and a Student Re-Ranking Network

; 模型方法

总体框架

首先使用BERT预先计算出实体嵌入，然后将其与自学习的关系嵌入拼接，经过多层的卷积和池化后得到一个查询向量，利用查询向量对候选实体进行排序。接下来利用知识蒸馏获得一个学生模型，对排序结果进行重排。

BERT预先计算实体嵌入

这一部分比较简单，论文直接使用了现有的BERT模型去输出嵌入。在后续训练过程中，这一部分嵌入会固定下来。

深度卷积操作

对实体分数进行重排

对候选实体的得分进行排序，筛选出top-k个实体（论文中k设为10），分别将关系标记作为头实体名和尾实体名的前缀，得到新的序列表示作为学术模型的输入

这里首先介绍一下知识蒸馏，知识蒸馏的动机是，在分类问题下，简单地使用one-hot编码作为label并不能很好地捕捉到诸如类间距离和类内方差这种细微的信息，如果label中每个类别都有一个分数，比较近的label分数也接近，比较远的label分数相差也比较大，就可以获得更好的效果。因此可以先训练一个Teacher模型，对其输出结果用软化的softmax进行处理，拉小分数间的差距。

查了一下资料感觉作者在这里把公式写错了，把1-λ写成了λ-1，另外作者直接用学生网络的hard target和教师网络的soft target以及hard label去计算loss，一般的设定是用学生网络的soft target和教师网络的soft target计算，用学生网络的hard target和hard label去计算，如下图所示。

最终，候选三元组的分数是教师模型和学生模型得到分数的加权平均

实验部分

链路预测对比实验

在FB15k-237这个数据集上表现一般，没有CompGCN好，可能只适用于稀疏模型

分析Re-rank对不同度数节点的提升作用

可以看到节点的度数越小，提升越大，证明了这一策略在稀疏数据集上的有效性

; 评价

论文的创新点主要是提出了一种新的场景，即稀疏情况下的知识图谱链路预测任务，使用的深层卷积和知识蒸馏对效果提升作用较大，可以参考一下。

Original: https://blog.csdn.net/jining11/article/details/120309902
Author: 羊城迷鹿
Title: Robust Knowledge Graph Completion with Stacked Convolutions and a Student Re-Ranking Network

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/595506/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【论文阅读】3D点云 — VoteNet：Deep Hough Voting for 3D Object Detection in Point Clouds

前言该篇论文是对3D室内点云进行目标检测的方法的研究。我们对该篇论文需要掌握的是了解霍夫投票，知道votenet中如何应用了霍夫投票的思想，投票带来的改善网络结构中的模…

人工智能 2023年7月10日
0068
机器学习：线性回归以及非线性回归

回归分析Regression：回归Regression：回归一词最早由英国科学家弗朗西斯·高尔顿（Francis Galton）提出，他还是著名的生物学家、进化论奠基人查尔斯·达…

人工智能 2023年6月17日
0083
Pandas Query 方法深度总结

大多数 Pandas 用户都熟悉 iloc[] 和 loc[] 索引器方法，用于从 Pandas DataFrame 中检索行和列。但是随着检索数据的规则变得越来越复杂，这些方法也…

人工智能 2023年7月6日
0090
【模型复现】GAN的优秀变种—包含卷积与反卷积层的DCGAN复现

【模型复现】GAN的优秀变种—包含卷积与反卷积层的DCGAN复现极链AI云注册链接关注极链AI云公众号，学习更多知识！文章目录【模型复现】GAN的优秀变种—包含卷积与反卷积…

人工智能 2023年5月26日
00115
vue项目中实际封装DateRangePicker组件使用

vue项目中实际封装DateRangePicker组件使用前言一、封装el-date-picker 二、父组件中进行引用总结前言日期选择器在实际使用中，可能会要求默认固定…

人工智能 2023年6月28日
0071
基于预训练模型的文本回归任务解决方案

赛题背景阅读是取得学术成功的一项基本技能。当学生联系阅读挑战性的文章时，他们自然就会培养阅读能力。当前教育课本使用传统的可读性方法与读者进行匹配。但是它们缺乏构造和理论有效性。…

人工智能 2023年6月18日
0089
CUDA ERROR: device-side assert triggered at问题的解决

最近在用深度学习模型跑自己的数据集时遇到了如标题所示的错误，然后在网上搜索了很多方法，发现是计算dice_loss时出错了，于是检查输入输出以及label标签用 torch.is…

人工智能 2023年7月22日
00126
贝叶斯推理三种方法：MCMC 、HMC和SBI

对许多人来说，贝叶斯统计仍然有些陌生。因为贝叶斯统计中会有一些主观的先验，在没有测试数据的支持下了解他的理论还是有一些困难的。本文整理的是作者最近在普林斯顿的一个研讨会上做的演讲幻…

人工智能 2023年6月29日
0083
【PyTorch深度学习项目实战100例】—— 基于Pyramid Vision Transformer（PVT-v2）实现奥特曼识别 | 第58例

; 前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集…

人工智能 2023年6月16日
00153
【python】遇上COS美图怎么办？当然是大胆冲呀~

前言嗨喽~大家好呀，这里是魔王呐 ! 在这炎热得夏天~ 我不由得想要东西来放松一下~ 于是，我采集起了小姐姐COS图~ ; 开发环境: Python 3.8 Pycharm 模块…

人工智能 2023年5月30日
0078
AI眼中的世界 ——人工智能绘画入门

目录什么是Disco Diffusion？如何使用Disco Diffusion？正文准备工作入门教程开始行动默认跑一个默认的描述A beautiful painti…

人工智能 2023年7月25日
0061
torch.nn.Embedding()详解

一、语法格式 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, …

人工智能 2023年7月21日
0063
Bert不完全手册4. 绕开BERT的MASK策略？XLNET & ELECTRA

基于随机token MASK是Bert能实现双向上下文信息编码的核心。但是MASK策略本身存在一些问题 MASK的不一致性：MASK只在预训练任务中存在，在微调中不存在，Bert只…

人工智能 2023年6月4日
00106
stata面板数据gmm回归_GMM估计的Stata操作流程

原标题：GMM估计的Stata操作流程一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验：使用工具变量法的前提是存在内生解释变量。Hausman…

人工智能 2023年6月18日
0093
Pyecharts简单实战——文章词云（Pyecharts库+jieba库）

题主最近要做一个政策可视化的小项目参加学校的比赛。想做一个简介凝练可以传达文章主题的图表，于是自然地想到了词云图。词云图需要原料，就是词语和词频。为了解决这个原料需求，简单利用…

人工智能 2023年5月28日
0085
pytorch对MNIST分类

基础知识和各种网络结构实战 … pytorch实现 import torch from torch.utils.data import DataLoader impor…

人工智能 2023年7月3日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31