【自然语言处理】【知识图谱】MTransE：用于交叉知识对齐的多语言知识图谱嵌入

2023年5月28日上午10:08 • 人工智能 • 阅读 56

论文地址：https://arxiv.org/pdf/1611.03954.pdf

一、简介

Wikipeida \text{Wikipeida}Wikipeida、WordNet \text{WordNet}WordNet和Concept-Net \text{Concept-Net}Concept-Net等多语言知识库正在成为AI应用的重要知识来源；
单语言知识图谱存在覆盖率的问题，将多语言知识图谱进行对齐可以改善覆盖率；
知识图谱嵌入技术已经证明了有效性，论文提出了一种基于图谱嵌入的实体对齐技术MTransE \text{MTransE}MTransE，从而实现自动化实体对齐。
MTransE \text{MTransE}MTransE会将不同语言的实体和关系嵌入至不同的向量空间，然后再将不同向量空间转换至同一向量空间；
MTransE \text{MTransE}MTransE提出了三种不同的转换技术，分别为：axis calibration、translation vector和linear transformation；

二、多语言知识图谱嵌入

在知识图谱KB \text{KB}KB中，使用L \mathcal{L}L表示语言的集合，L 2 \mathcal{L}^2 L 2表示L \mathcal{L}L中语言的两两组合；
对于任一语言L ∈ L L\in\mathcal{L}L ∈L，G L G_L G L 表示语言L L L的知识图谱，E L E_L E L 和R L R_L R L 表示图谱中的实体和关系集合。T = ( h , r , t ) T=(h,r,t)T =(h ,r ,t )表示G L G_L G L 中的一个三元组，h , t ∈ E L h,t\in E_L h ,t ∈E L 且r ∈ R L r\in R_L r ∈R L ；
黑体h,r,t \textbf{h,r,t}h,r,t分别表示头实体h h h、关系r r r和尾实体t t t的嵌入向量；
对于一对语言( L 1 , L 2 ) ∈ L 2 (L_1,L_2)\in\mathcal{L}^2 (L 1 ,L 2 )∈L 2，δ ( L 1 , L 2 ) \delta(L_1,L_2)δ(L 1 ,L 2 )表示包含对齐三元组数据的集合，这个集合通常不大；
下面使用语言对( L i , L j ) ∈ L 2 (L_i,L_j)\in\mathcal{L}^2 (L i ,L j )∈L 2为例子，介绍各个组件；

三、知识模型

对于每个语言L ∈ L L\in\mathcal{L}L ∈L，其中的实体E L E_L E L 和关系R L R_L R L 都会被嵌入至k k k维向量空间R L k \mathbb{R}L^k R L k 。具体来说，这里使用图谱嵌入模型TransE \text{TransE}TransE，损失函数如下：
S K = ∑ L ∈ { L i , L j } ∑ ( h , r , t ) ∈ G L ∥ h+r-t ∥ S_K=\sum{L\in{L_i,L_j}}\sum_{(h,r,t)\in G_L} \parallel \textbf{h+r-t} \parallel S K =L ∈{L i ,L j }∑(h ,r ,t )∈G L ∑∥h+r-t ∥
该损失函数能够衡量所有给定三元组的合理性。通过最小化损失函数，知识模型保留了实体间的单语言关系，并且能够作为对齐模型的正则化项。此外，知识模型将知识库划分为不相交的子集，用于并行训练。

四、对齐模型

对齐模型的目标：构建一个向量空间L i L_i L i 至L j L_j L j 的映射变换。损失函数如下：
S A = ∑ ( T , T ′ ) ∈ δ ( L i , L j ) S a ( T , T ′ ) S_A=\sum_{(T,T’)\in\delta(L_i,L_j)}S_a(T,T’)S A =(T ,T ′)∈δ(L i ,L j )∑S a (T ,T ′)
其中，对齐评分函数S a ( T , T ′ ) S_a(T,T’)S a (T ,T ′)会对所有对齐的三元组进行迭代。论文提出了三种不同的对齐评分函数，分别是distance-based axis calibration、translation vectors、linear transformations。

该方法对不同语言中的相同实体(关系)进行约束。第一种形式
S a 1 = ∥ h − h ′ ∥ + ∥ t − t ′ ∥ S_{a_1}=\parallel \textbf{h}-\textbf{h}’\parallel + \parallel \textbf{t}-\textbf{t}’\parallel S a 1 =∥h −h ′∥+∥t −t ′∥
S a 1 S_{a_1}S a 1 的目标是拉近多语言中相同实体间的距离。
S a 2 = ∥ h − h ′ ∥ + ∥ r − r ′ ∥ + ∥ t − t ′ ∥ S_{a_2}=\parallel \textbf{h}-\textbf{h}’\parallel + \parallel \textbf{r}-\textbf{r}’\parallel +\parallel \textbf{t}-\textbf{t}’\parallel S a 2 =∥h −h ′∥+∥r −r ′∥+∥t −t ′∥
S a 2 S_{a_2}S a 2 在S a 1 S_{a_1}S a 1 的基础上新增了对关系的约束。

该方法将不同语言间的转换建模至向量中，即将语言间的转换看作是翻译操作(类似TransE \text{TransE}TransE)
S a 3 = ∥ h + v i j e − h ′ ∥ + ∥ r + v i j r − r ′ ∥ + ∥ t + v i j e − t ′ ∥ S_{a_3}=\parallel \textbf{h}+\textbf{v}{ij}^e-\textbf{h}’\parallel + \parallel \textbf{r}+\textbf{v}{ij}^r-\textbf{r}’\parallel + \parallel \textbf{t}+\textbf{v}{ij}^e-\textbf{t}’\parallel S a 3 =∥h +v i j e −h ′∥+∥r +v i j r −r ′∥+∥t +v i j e −t ′∥
其中，v i j e \textbf{v}{ij}^e v i j e 和v i j r \textbf{v}_{ij}^r v i j r 分别是实体和关系在语言L i L_i L i 至L j L_j L j 上的翻译向量。

此外，可以发现v i j e = − v j i e \textbf{v}{ij}^e=-\textbf{v}{ji}^e v i j e =−v j i e 和v i j r = − v j i r \textbf{v}{ij}^r=-\textbf{v}{ji}^r v i j r =−v j i r 。因此，在获得L i L_i L i 至L j L_j L j 的翻译向量时，也同时获得了反方向的翻译向量。

该方法使用线性变换来实现向量空间的转换。具体来说，S a 4 S_{a_4}S a 4 会学习一个k × k k\times k k ×k的矩阵M i j e \textbf{M}{ij}^e M i j e 来完成L i L_i L i 至L j L_j L j 的向量线性变换
S a 4 = ∥ M i j e h − h ′ ∥ + ∥ M i j e t − t ′ ∥ S{a_4}=\parallel\textbf{M}{ij}^e\textbf{h}-\textbf{h}’\parallel + \parallel\textbf{M}{ij}^e\textbf{t}-\textbf{t}’\parallel S a 4 =∥M i j e h −h ′∥+∥M i j e t −t ′∥
S a 5 S_{a_5}S a 5 通过第二个线性变换矩阵M i j r \textbf{M}{ij}^r M i j r 实现了对关系的约束，
S a 5 = ∥ M i j e h − h ′ ∥ + ∥ M i j r r − r ′ ∥ + ∥ M i j e t − t ′ ∥ S{a_5}=\parallel\textbf{M}{ij}^e\textbf{h}-\textbf{h}’\parallel + \parallel\textbf{M}{ij}^r\textbf{r}-\textbf{r}’\parallel +\parallel\textbf{M}_{ij}^e\textbf{t}-\textbf{t}’\parallel S a 5 =∥M i j e h −h ′∥+∥M i j r r −r ′∥+∥M i j e t −t ′∥
不同于axis calibration，linear transformation方法将语言间的变换看作是嵌入空间上的拓扑变换。

五、训练

MTransE \text{MTransE}MTransE的损失函数是两个模型损失函数的组合，即J = S k + α S A J=S_k+\alpha S_A J =S k +αS A ，其中α \alpha α是权重超参数。
使用随机梯度下降进行优化，θ ← θ − λ ∇ θ J \theta\leftarrow\theta-\lambda\nabla_\theta J θ←θ−λ∇θJ来更新参数θ \theta θ，其中λ \lambda λ是学习率。
实现时，不直接更新J J J，而是交替优化S K S_K S K 和α S A \alpha S_A αS A ，即在每个epoch中，交替θ ← θ − λ ∇ θ S K \theta\leftarrow\theta-\lambda\nabla_\theta S_K θ←θ−λ∇θS K 和θ ← θ − λ ∇ θ α S A \theta\leftarrow\theta-\lambda\nabla_\theta\alpha S_A θ←θ−λ∇θαS A ；
强制约束实体嵌入向量的l 2 l_2 l 2 范数为1。该约束有两个优势：(1) 避免训练过程中，出现通过缩小范数来减低loss的情况；(2) 对于linear transformation方法，能够实现可逆性；

Original: https://blog.csdn.net/bqw18744018044/article/details/123750829
Author: BQW_
Title: 【自然语言处理】【知识图谱】MTransE：用于交叉知识对齐的多语言知识图谱嵌入

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/530909/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SpringBoot 整合 Neo4j

知识图谱技术三要素在知识图谱中，通过三元组集合的形式来描述事物之间的关系：实体：又叫作本体，指客观存在并可相互区别的事物，可以是具体的人、事、物，也可以是抽象的概念或联系，…

人工智能 2023年6月1日
0073
深度学习实战——基于pytorch写的一个猫狗分类的模型——学习总结

写在前面本学习总结主要目的 1.怕以后忘记，到时候翻来看看，2.梳理一下项目过程，便于工业化生产（哈哈）3.敲一遍代码加深记忆4.帮助他人，方便入门同学能够容易入门本过程主要设…

人工智能 2023年7月2日
0071
【一起入门NLP】中科院自然语言处理第16课-简明扼要：红到发紫的prompt是什么？【上】

前几天自然语言处理课学到了”预训练语言模型”这一章，在最后老师介绍了今年刚刚提出来的Prompt，并强调：这东西现在很火🔥，想发论文的赶紧行动。由于和我的…

人工智能 2023年5月30日
0080
Neo4j安装部署+CSV批量数据导入教程

1、下载安装： Neo4j官网下载：Neo4j Download Center – Neo4j Graph Database Platform 下载适合自己的版本，社区…

人工智能 2023年6月1日
0087
Qt+openCV学习笔记（十四）Qt6.3.0+openCV4.5.5+android_arm64-v8a测试拉取本地摄像头的流

前言在openCV4.5.2之前，自身的库无法在android下，拉取本地摄像头的流，现在的版本可以拉取了，笔者本次做下记录在开始前需要读者参考以下文档，编译库 Qt+ope…

人工智能 2023年7月19日
0067
目标跟踪：KCF跟踪并使用yolov4进行重检测

一、运行环境 windows下VS2019opencv4.5.5+contrib4.5.5 （使用cmake VC16编译安装）官方下载的yolov4模型和预训练参数二、算法思想…

人工智能 2023年7月19日
0096
pycharm删除；修改jupyter的默认文件夹、第三方库； python3.6版本安装TensorFlow

来源如下：如何在pycharm删除多余的空行_yangyusir的博客-CSDN博客_pycharm删除行使用快捷键Ctrl + r，在查找替换窗口的右边勾选”Re…

人工智能 2023年5月25日
00123
百度BML&飞桨训练营（三）CV之汽车识别分类

百度BML、飞桨训练营（三）CV之汽车识别分类文章相关内容资料已经取得百度BML允许，仅用与交流学习，请不要用于商业传播。这一次直接来上手简单的CV项目–汽车识别。下载数据集…

人工智能 2023年7月2日
0054
各种神经网络的应用领域,神经网络还有哪些应用

神经网络原理及应用神经网络原理及应用1.什么是神经网络？神经网络是一种模拟动物神经网络行为特征，进行分布式并行信息处理的算法。这种网络依靠系统的复杂程度，通过调整内部大量节点之…

人工智能 2023年6月25日
0096
python 绘制3D图

python 绘制3D图 1.散点图 * 代码输入的数据格式 2.三维表面 surface * 代码输入的数据格式 scatter + surface图形展示 3. 三维瀑布图…

人工智能 2023年7月4日
0066
基于隐马科夫模型，HMM用于中文分词

HMM用于中文分词一、在分词、分句前用规则处理句子 # 在分词前用规则处理句子def preprocess (oriSentence):# 删除后缀_oriSentence = …

人工智能 2023年7月17日
0040
使用matplotlib、opencv和PIL读取图片

文章目录 * – 1.用matplotlib读取图片 – 2.用opencv读取图片 – 3.用PIL读取图片 – 4.总结 1.用…

人工智能 2023年7月19日
0046
mmdetection2.11.0 模型测试评估及计算各个类别的map

1. 计算各个类别的map 1.1 方法1: 直接计算, 仅支持voc 数据集与 custom 数据集使用如下命令直接计算各个分类的map , 使用的图片为 config 配置中…

人工智能 2023年6月17日
00122
机器学习分类器——案例（opencv sklearn svm ann）

机器学习分类器——案例（opencv sklearn svm ann python） ps：最近师姐给我们留了一个任务，记录一下从一开始的什么都不懂到现在把任务做出来，并从中学习到…

人工智能 2023年7月18日
0051
【Kotlin】by lazy关键字的实现原理

kotlin的by lazy关键字是很常用的，它表示延时初始化变量，只在第一次使用时才给它初始化。那么它是如何实现这种功能的呢？这篇文章从字节码和Java语言的角度揭密它的实现原理…

人工智能 2023年6月26日
0084
盘点8个数据分析相关的Python库（实例+代码）

导读：Python中常会用到一些专门的库，如NumPy、SciPy、Pandas和Matplotlib。数据处理常用到NumPy、SciPy和Pandas，数据分析常用到Panda…

人工智能 2023年7月16日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31