ConvE：Convolutional 2D Knowledge Graph Embeddings

2023年6月1日上午4:32 • 人工智能 • 阅读 81

论文：Convolutional 2D Knowledge Graph Embeddings

1 介绍

1.1 提出原因

之前提出的模型如disMult，Trans系列模型，成为浅层模型，虽然比较简单，参数较少、训练模型速度较快，但是这些模型相比于深的模型，更少能够抓到复杂的信息。因此，提出模型ConvE模型，利用卷积的方式进行知识图谱补全，能够适用于更加复杂的图。

在浅层模型中增加特征数量的唯一方法，就是增加embedding的维度，但是随之而来存在一个问题，不能扩展到更大的知识图谱，因为嵌入参数的总数与图中实体和关系的数量成正比。此外，以往的多层知识图嵌入体系结构都是全连接的，容易出现过拟合问题。

1.2ConvE优势

ConvE采取卷积的形式，由于高度优化的GPU实现，它的参数效率和计算速度快。由于其的普遍使用，在训练多层卷积网络时，已经建立了鲁棒方法来控制过拟合。在本文中，我们引入了ConvE模型，该模型使用二维卷积在嵌入上预测知识图中的缺失环节。ConvE是用于链接预测的最简单的多层卷积体系结构:它由单个卷积层、嵌入维数的投影层和内积层定义。相比于GCN框架仅限于无向图，而知识图自然是有向的，并且可能受到限制的内存需求的影响。

1.3 贡献

介绍了一个简单的，有竞争力的2D卷积链路预测模型，ConvE。
开发一个1-N的评分程序，加速三倍的训练和300倍的评估。
系统地研究了在常用的链接预测数据集中报告的逆关系测试集泄漏，在必要时引入数据集的鲁棒版本，使其无法用简单的基于规则的模型来解决。

2 模型

2.1 1D vs 2D Convolutions

1D Convolutions
([a a a] ; [b b b]) = [a a a b b b]
若采用filter，其 size k = 3，结果为维度1 × 4 1\times4 1 ×4

2D Convolutions
( [ a a a a a a ] ; [ b b b b b b ] ) = [ a a a a a a b b b b b b ] \begin{pmatrix} \begin{bmatrix} a & a & a \ a& a & a\ \end{bmatrix}; \begin{bmatrix} b&b&b\ b&b&b\ \end{bmatrix} \end{pmatrix}= \begin{bmatrix} a&a&a\ a&a&a\ b&b&b\ b&b&b\ \end{bmatrix}([a a a a a a ];[b b b b b b ])=⎣⎢⎢⎡a a b b a a b b a a b b ⎦⎥⎥⎤
若采用filter，其 size k = 3 × 3 \times3 ×3，结果为维度2 × 1 2\times1 2 ×1
二维卷积运算能够模拟a和b之间更多的交互作用(与m, n, k成比例的动作)。因此，与一维卷积相比，二维卷积能够提取两个嵌入之间更多的特征交互作用

2.2 模型图

ConvE：Convolutional 2D Knowledge Graph Embeddings

模型讲解：

头实体和关系的one-hot编码进行embedding，维度为k
将头实体和关系的embeding 进行reshape,并拼接
进行卷积操作
全连接操作，映射维度为k
将全连接的结果乘以所有embedding结果，即实现1-N的评分方法，也就是说结果乘所有实体。

; 2.3 评分函数

其中r r ∈ R k , e ‾ s , r ‾ r 分别代表 e s , r r , 2 D 进行 r e s h a p e 结果。 e s , r r ∈ R k , e ‾ s , r ‾ r ∈ R k w × k h , 其中 k = k w × k h \mathbf r_{r}\in \mathbb R {k}, \overline \mathit e{s},\overline \mathit r_{r}分别代表e_{s}, r_{r},2D进行reshape结果。e_{s}, r_{r}\in\mathbb R_{k},\overline \mathit e_{s},\overline \mathit r_{r}\in \mathbb R^{k_{w}\times k_{h}},其中k=k_{w}\times k_{h}r r ∈R k ,e s ,r r 分别代表e s ,r r ,2 D 进行r e s h a p e 结果。e s ,r r ∈R k ,e s ,r r ∈R k w ×k h ,其中k =k w ×k h

2.4 损失函数

; 2.5 正则化

我们通过在几个阶段使用drop out来规范我们的模型，防止过拟合。特别地，我们在嵌入、卷积后的feature map以及全连通层后的hidden units上使用了dropout。此外，我们BatchNorm进行归一化，在卷积输入之前，卷积输入之后，
feature map之后进行BatchNorm归一化。

3 代码

论文原作代码使用一个框架难以理解，找到替代的一个代码。
参考代码：点我
模型代码

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.nn import  Parameter
class ConvE(nn.Module):
    def __init__(self, config):
        super(ConvE, self).__init__()
        self.config = config
        self.ent_embs = nn.Embedding(self.config.ent_num, self.config.dim)
        self.rel_embs = nn.Embedding(self.config.rel_num, self.config.dim)
        self.input_drop = nn.Dropout(config.inputDrop)
        self.hide_drop = nn.Dropout(config.hideDrop)
        self.feature_drop = nn.Dropout2d(config.featureDrop)
        self.conv = nn.Conv2d(1, 32, (3, 3), bias=True)
        self.bn0 = nn.BatchNorm2d(1)
        self.bn1 = nn.BatchNorm2d(32)
        self.bn2 = nn.BatchNorm1d(config.dim)
        self.fc = nn.Linear(config.hide_size, config.dim)
        self.dim = config.dim
        self.dim1 = config.dim1
        self.dim2 = self.dim // self.dim1
        self.loss = nn.BCELoss()
        self.register_parameter('b',Parameter(torch.zeros(config.ent_num)))
        self.init()

    def init(self):
        nn.init.xavier_normal_(self.ent_embs.weight.data)
        nn.init.xavier_normal_(self.rel_embs.weight.data)
    def forward(self, e1, rel):
        e1_emb = self.ent_embs(e1).view(-1, 1, self.dim1, self.dim2)
        rel_emb = self.rel_embs(rel).view(-1, 1 ,self.dim1, self.dim2)

        conv_input = torch.cat([e1_emb, rel_emb], dim = 2)
        conv_input = self.bn0(conv_input)
        x = self.input_drop(conv_input)
        x = self.conv(conv_input)
        x = self.bn1(x)
        x = F.relu(x)
        x = self.feature_drop(x)
        x = x.view(x.shape[0], -1)
        x = self.fc(x)
        x = self.hide_drop(x)
        x = self.bn2(x)
        x = F.relu(x)

        x = torch.mm(x, self.ent_embs.weight.transpose(1, 0))
        x += self.b.expand_as(x)
        pred = torch.sigmoid(x)
        return pred

Original: https://blog.csdn.net/REfusing/article/details/123743745
Author: Re:fused
Title: ConvE：Convolutional 2D Knowledge Graph Embeddings

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/554787/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

猿创征文｜10个Web开发人员必备的最佳开发工具推荐

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月26日
0094
多媒体数字展示技术解决方案

数字媒体是科技与文化相融合而产生的新兴产业，其精髓是”文化为体，科技为媒”。现代计算机技术、网络技术和数字通信技术的高速发展为数字媒体技术的发展带来广阔的空…

人工智能 2023年6月26日
0062
使用Python，OpenCV进行基本的图像处理——提取红色圆圈轮廓并绘制

使用Python，OpenCV进行基本的图像处理——提取红色圆圈轮廓并绘制 * – 1. 效果图 – + 1.1 形态学图像处理效果图 + 1.2 转换HS…

人工智能 2023年6月20日
00106
假设检验：如何理解单侧、双侧检验的拒绝域

简单说就是：拒绝域与备择假设方向相同。假设检验就是一个证伪的过程，原假设和备择假设是一对”相反的结论”。”拒绝域”，顾名思义，就是拒…

人工智能 2023年7月15日
001.4K
一文读懂np.size、np.itemsize、np.size * np.itemsize

np.size:Numpy数组中元素个数例： import numpy as np Z = np.zeros([10,10]) print(‘Z.size = {}’.forma…

人工智能 2023年6月16日
00109
MagicData-RAMC数据集测评 | 西北工业大学冠军队分享

作为2021年第十六届全国人机语音通讯学术会议 (NCMMSC 2021) 特殊议题，由Magic Data (北京爱数智慧科技有限公司) 和江苏师范大学主办，MagicHub开…

人工智能 2023年5月23日
0088
2022电工杯AB题思路分析

将在本文更新电工杯AB题思路 A题：高比例风电电力系统储能运行及配置分析A题是一个风力系统储能问题，需要相关的专业知识，本题考量的是风力发电接入容量、供电成本，储能容量等；需要考虑…

人工智能 2023年6月19日
0097
Pandas处理日期数据

Pandas处理日期数据 * – 依据前缀查询 – 获取月周季度（针对index）* 获取年月日* to_period() 函数* date_range()…

人工智能 2023年7月8日
0054
OpenCV-Python身份证信息识别

OpenCV-Python身份证信息识别本篇文章使用OpenCV-Python和CnOcr来实现身份证信息识别的案例。想要识别身份证中的文本信息，总共分为三大步骤：一、通过预处理…

人工智能 2023年5月26日
0080
回归预测 | MATLAB实现MLP多层感知机模型多输入多输出回归预测

回归预测 | MATLAB实现MLP多层感知机模型多输入多输出回归预测目录 * – 回归预测 | MATLAB实现MLP多层感知机模型多输入多输出回归预测 &#821…

人工智能 2023年6月16日
00106
Ultra-Fast-Lane车道线检测算法复现

0 . 前景车道线检测算法可分为基于segment , heatmap , point.本文由于设备影响,要求速度较快,采用的是基于点回归的方式,最终输出的是点, 使用方程拟合车…

人工智能 2023年7月24日
0080
深度学习基础及实现的必备步骤

为什么要以均方误差作为损失函数？(将模型在每个训练样本上的预测误差加和，来衡量整体样本的准确性) 解：利用均方误差画出来的图像有如下特点曲线的最低点是可导的。越接近最低点，曲线…

人工智能 2023年6月25日
0087
让学前端不再害怕英语单词（四）

前三章直通车↓↓↓让学前端不再害怕英语单词（一）让学前端不再害怕英语单词（二）让学前端不再害怕英语单词（三）在第一章和第二章，我们大致讲了下前端三剑客和利用接口处理后端返回数据的一…

人工智能 2023年7月29日
00101
Cart回归决策树

1. 回归决策树构建原理 CART 回归树和 CART 分类树的不同之处在于: CART 回归树构建: Loss⁡(y,f(x))=(f(x)−y)2 例子：假设：数据集只有 1…

人工智能 2023年6月17日
0067
NLP-学习笔记（二）

常规序列标注一般的序列标注算法的格式有BOI，IOBES，BMES等，其中，B表示这个词处于一个实体的开始(Begin), I 表示内部(inside), O 表示外部(outs…

人工智能 2023年6月1日
0073
【Pytorch神经网络理论篇】 25 基于谱域图神经网络GNN：基础知识+GNN功能+矩阵基础+图卷积神经网络+拉普拉斯矩阵

同学你好！本文章于2021年末编写，获得广泛的好评！故在2022年末对本系列进行填充与更新，欢迎大家订阅最新的专栏，获取基于Pytorch1.10版本的理论代码(2023版)实现…

人工智能 2023年7月13日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31