Iterative Entity Alignment via Knowledge Embeddings

2023年6月10日上午7:53 • 人工智能 • 阅读 91

概述：

本文主要解决的问题是不同KG间的实体对齐问题。之前解决这个问题主要依靠一些额外的信息来完成，比如维基百科。但在本文中，我们依靠aligned entities也就是已经对齐的实体作为信息，在KRL（知识嵌入）的基础上，将不同实体合并到同一语义空间中，并且采用迭代的方法提高对齐的效果。

具体模型：

模型主要分为三个部分：Knowledeg Embeddings-我们通过KRL方法将不同KG的实体分别生成对应的嵌入矩阵。Joint Embedding-我们依靠aligned entities 将不同KG中的知识嵌入合并到同一语义空间。Iterative Alignment：我们生成新的aligned entities后，将其合并到对齐序列中，对合并后的语义空间进行更新，从而使更多的实体得到对齐。

同时，我们在最后判断时采用soft alignment strategy（软对齐策略），这样可以使我们在迭代过程中重新考虑现有的软对齐。

下面我们具体的来说一下各个部分：

Knowledge Embedding：

TransE：

他的原理是将关系也当做一个向量，与头向量尾向量满足一定的语义关系，在已知关系r的情况下，我们可以定义一个energy function：

Iterative Entity Alignment via Knowledge Embeddings

可以定义为实体间的关系程度。

在经过负样本生成后，在此基础上构建损失函数，从而实现知识嵌入。

PtransE：

PtransE便是在TransE的基础上考虑到了多步路径的问题，在原先的score function后面加了一个路径的关系的正则项

这个公式还是比较好理解的，这里就不多说了，具体的可以去看论文。

Joint Embedding：

关于基于对齐实体序列的实体对齐，这里提出了三个model，分别为：

Translation-based Model：

类似的，提出下一个模型：

Linear Transformation Model：

对于上面两个模型来说，是同一类型的，在energy function的基础上，定义一个score function：

我们可以训练aligned entities 从而使得J最小化（这个地方其实我还是有点存疑的，因为在我理解，这个地方是单纯的训练M 和r ，但是这样用一个r 或M 匹配所有的对齐实体，感觉不太靠谱，可是我也没有更好的解释方法）

Parameter Sharing Model：

这个方法更加简单粗暴，即将强制两个向量相等，可以两个向量相加取平均值。

Iterative Alignment：

我们现在已经将现有的对齐实体映射到同一向量空间中，我们基于之前的Joint Embedding，可以对现有的未对齐的实体进行处理。对两个实体来说，我们需要计算他们的语义距离，无论是Translation-based Model还是Linear Transformation Model，都有对应的energy function，而对于Parameter Sharing Model来说，我们可以定义E（e1，e2）欧氏距离作为语义距离。

因此，在定义语义距离的基础上，可以找到语义距离最小的实体，他便是对应的实体。很明显，我们可以通过newly aligned entities 对现有的joint embedding进行更新，从而得到更多的对齐实体，这也就是文章中提到的迭代，而迭代的方法，文章中提出了两个：

Hard Alignment：

对于Parameter SharigModel来说，直接将新的对齐实体加入到Joint Embedding中，然后进行更新

Soft Alignment：

Hard Alignment：可能会出很多问题，Soft Alignment会对每个新对齐的实体对进行打分，将新的实体对放到M中，打分的公式为：

从这个公式可以看出，score主要基于语义距离，距离越小，分数越高。

最后我们定义一个M的score function：

这个function还是比较好理解的，两种距离的计算，乘以一个置信度R，可以说是一个比较综合的打分，目标是分数越来越高，并迭代的加入新的实体，从而保证整体的实体对齐程度。

Original: https://blog.csdn.net/qq_39778575/article/details/108950699
Author: 耀天君
Title: Iterative Entity Alignment via Knowledge Embeddings

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/595924/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自然语言处理基础技术工具篇之TextBlob

安装：pip install textblob In [2]: !pip install textblob Requirement already satisfied: textb…

人工智能 2023年5月28日
0082
【Python数据分析】pandas常用基础数据分析代码

目录一、获取老番茄数据二、python数据分析 1、读取数据源 2、查看数据概况 3、查看异常值 4.1、查看最大值（max函数） 4.2、查看最小值（min函数） 5.1、查…

人工智能 2023年7月7日
0082
OpenCV-滤波矩阵（java版）

滤波矩阵 multiply() 用下图做演示 ; multiply() 顾名思义，乘法函数。使用该函数可以将像素的每个通道值乘以这个参数。方法说明multiply(Mat src…

人工智能 2023年6月19日
0069
如何把一个python列表(有很多个元素)变成一个excel表格的第一列？

点击上方” Python爬虫与数据挖掘“，进行关注回复” 书籍“即可获赠Python从入门到进阶共10本电子书今日鸡汤等…

人工智能 2023年7月8日
00117
通用轻量级机器人设备 — 研究和设计要点

目录一、研究策略说明二、研究目标 2.1 框架设计 2.2 可移植性 2.3 便利性三、设计策略 3.1 通信策略 3.2 语言策略 3.3 系统抽象 3.4 编码风格和工具…

人工智能 2023年6月30日
0062
【数学建模常用模型】分类专题

这次介绍一下数模国赛常用的分类方法，以下这方法也是现在应用比较广泛的分类方法：K-近邻算法（k-Nearest Neighbors，KNN）和支持向量机（Support Vecto…

人工智能 2023年7月15日
0050
电池认证最新CTL协议-DSH 2182（第二次充电过程充电截止电流）！

2022年8月29日，IECEE官网发布关于电池CTL决议DSH 2182，涉及标准IEC 62133-2:2017，IEC 62133-2:2017/AMD1:2021. 内容如…

人工智能 2023年6月4日
0079
[ASTGCN之1个特征]解读(torch)之参数读取和数据读入(一)

相关资料：原文原文解析：混合注意力时空图卷积-ASTGCN mxnet版本的数据分析 mxnet版本的代码解读文章目录 – 一、目录二、configparser…

人工智能 2023年7月23日
0089
Yolov5(v6.1)数据增强方式解析

🌟想了解更多YOLO系列算法更多进阶教程欢迎订阅我的专栏🌟 基础不好的同学可以试试看一下我的《目标检测蓝皮书》🚀 ，里面包含超多目标检测实用知识，想速通目标检测，看这本就对了！ …

人工智能 2023年6月16日
00108
聚类数k的确定(间隔统计量,轮廓系数,Canopy算法)及Kmeans++聚类，高斯混合聚类，密度聚类，层次聚类的原理及python实现(文末附有相关代码)

聚类数k的确定及聚类方法的python实现[文末] 1.引入 2.聚类的数目c l u s t e r s = k clusters = k c l u s t e r s =k …

人工智能 2023年5月31日
0087
向量自回归

VAR向量自回归模型一、外生变量和内生变量内生变量内生变量是具有某种概率分布的随机变量，它的参数是联立方程系统估计的元素，是由模型系统决定的，同时也对模型系统产生影响。内生…

人工智能 2023年7月18日
0068
self-attention中的QKV机制

之前有写过attention和transformer的理解，但是对于self attention中的qkv一直理解的不够透彻，直到今天看了李宏毅的视频才理解，所以记录一下。所谓QK…

人工智能 2023年6月15日
00106
tensorflow数据格式tfrecord的原理及用法

目录一、TFRecord简介 * 1.1 TFRecord格式简介 1.2 为什么用TFRecord 二、TFRecord文件操作 * 2.1 制作TFRecord文件 2.2 …

人工智能 2023年5月23日
0083
9个强化学习现实生活中的应用

自动驾驶汽车开放上下文环境中的车辆驾驶应该得到机器学习模型的支持，该模型使用现实世界中所有可能的场景和场景进行训练。然而- 这些不同场景的集合是一个需要解决的复杂问题。我们如何…

人工智能 2023年7月28日
0073
手把手教你用python实现机器学习预测疾病

电子存储的医疗成像数据非常丰富，机器学习算法可以使用这种类型的数据集来检测和发现模式和异常。在本文中，我将向您介绍五个医疗保健领域的机器学习项目。机器和算法可以解读成像数据，就像受…

人工智能 2023年6月15日
00133
如何评价自己的研究工作是否有价值

本文是看了沐神分享的一个视频的笔记，地址：https://www.zhihu.com/zvideo/1475716940051869696 视频中分享了沐神自己如何判断工作的研究价…

人工智能 2023年6月28日
00110

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Iterative Entity Alignment via Knowledge Embeddings

概述：

具体模型：

Knowledge Embedding：

Joint Embedding：

Iterative Alignment：

大家都在看