知识图谱嵌入(KGE)：方法和应用的综述（持续更新）

2023年6月1日下午6:29 • 人工智能 • 阅读 73

知识图谱嵌入(KGE)：方法和应用的综述

1. 知识图谱(KG)

由实体(节点)和关系(不同类型的边)组成的多关系图。
每条边都表示为形式(头实体、关系、尾实体)的三个部分，也称为事实

1.1 问题

这类三元组的底层符号特性通常使KGs很难操作

1.2 解决：

提出了一种新的研究方向——知识图谱嵌入。

1.3 关键思想

嵌入KG的组件，包括将实体和关系转化为连续的向量空间，从而简化操作，同时保留KG的原有的结构。

2. 融合事实信息

2.1 平移距离模型

平移距离模型利用了基于距离的评分函数，通过两个实体之间的距离对事实的合理性进行度量。

; 2.1.1 TransE模型

平移不变现象

TransE模型：将知识库中的关系看作实体间的某种平移向量。
对于每个事实三元组(h,r,t)，TransE模型将实体和关系表示为同一空间中，把关系向量r看作为头实体向量h和尾实体向量t之间的平移即 h + r ≈ t h+r≈t h +r ≈t。
可以将r,看作从h到t的翻译
知识库中的实体关系类型可分为一对一、一对多、多对一、多对多4 种类型，而复杂关系主要指的是一对多、多对一、多对多的 3 种关系类型。优点
TransE模型的参数较少，计算的复杂度显著降低，并且在大规模稀疏知识库上也同样具有较好的性能与可扩展性。缺点
TransE模型不能用在处理复杂关系上。

2.1.2 TransH模型

为了解决TransE模型在处理一对多、多对一、多对多复杂关系时的局限性。
TransH模型提出让一个实体在不同的关系下拥有不同的表示。
对于关系r，TransH模型同时使用平移向量r和超平面的法向量w_r来表示它。对于一个三元组(h, r, t) , TransH首先将头实体向量h和尾实体向量r，沿法线wr，影到关系r对应的超平面上，用h⊥和t⊥表示如下：

TransH 使不同的实体在不同的关系下拥有了不同的表示形式，但由于实体向量被投影到了关系的语义空间中，故它们具有相同的维度; 缺点：
虽然TransH模型使每个实体在不同关系下拥有了不同的表示，它仍然假设实体和关系处于相同的语义空间中，这一定程度上限制了TransH的表示能力。

2.1.3 TransR模型

TransR模型认为，一个实体是多种属性的综合体，不同关系关注实体的不同属性。
不同的关系拥有不同的语义空间。
对于每一个关系r，TransR定义投影矩阵Mr，将实体向量从实体空间投影到关系r的子空间，用h⊥和t⊥表示如下：

然后使 h ⊥ + r ≈ t ⊥ h⊥+r≈t⊥h ⊥+r ≈t ⊥; 缺点：
在同一个关系下：头、尾实体共享相同的投影矩阵。然而，一个关系的头、尾实体的类型或属性可能差异巨大。例如，对于三元组(美国，总统，奥巴马)，美国和奥巴马的类型完全不同，一个是国家，一个是人物。
从实体空间到关系空间的投影是实体和关系之间的交互过程，因此TransR让投影矩阵仅与关系有关是不合理的。
与TransE和TransH相比，TransR由于引入了空间投影，使得TransR模型参数急剧增加，计算复杂度大大提高。

2.1.4 TransD模型

给定三元组(h, r, t) , TransD模型设置了2个分别将头实体和尾实体投影到关系空间的投影矩阵Mr1和Mr2。具体定义如下:

尾实体用h⊥和t⊥表示如下：

; 2.1.5 TranSparse模型

TranSparse是通过在投影矩阵上强化稀疏性来简化TransR的工作。它有两个版本：TranSparse (共享)和TranSparse (单独)。
TranSparse (共享)对每个关系r使用相同的稀疏投影矩阵M r ( t h e t a r ) M_r(theta_r)M r (t h e t a r ) 即：

TranSparse (单独)对于头实体和尾实体分别使用2个不同的投影矩阵M r 1 ( t h e t a r 1 M_r1(theta_r1 M r 1 (t h e t a r 1)和M r 2 ( t h e t a r 2 ) M_r2(theta_r2)M r 2 (t h e t a r 2 )。

这里的t h e t a r theta_r t h e t a r 、t h e t a r 1 theta_r1 t h e t a r 1和t h e t a r 2 theta_r2 t h e t a r 2表示这些投影矩阵的稀疏度。优点：
TransSparse模型通过引入稀疏投影矩阵，TransSparse模型减少了参数个数。

2.1.6 TransM模型

除了允许实体在涉及不同关系时具有不同的嵌入之外，提高TransE模型性能可以从降低h+r≈t的要求研究开始。TransM模型将为每个事实（h,r,t）分配特定的关系权重theta_r。
通过对一对多、多对一和多对多分配较小的权重，TransM模型使得t在上述的复杂关系中离h+r更远。

2.1.7 ManifoldE模型

ManifoldE模型对于每个事实三元组（ h , r , t ）（h,r,t）（h ,r ,t ）将h + r ≈ t h+r≈t h +r ≈t转换为(h+r-t)的L2范式约等于theta_r的平方。
ManifoldE把t近似地位于流形体上，即一个以h+r为中心半径为theta_r的超球体，而不是接近h+r的精确点。

2.1.8 TransF模型

TransF只需要t与h+r位于同一个方向，同时h与t-r也位于同一个方向。

2.1.9 TransA模型

TransA模型为每个关系r引入一个对称的非负矩阵Mr，并使用自适应马氏距离定义评分函数。
通过学习距离度量Mr, TransA在处理复杂关系时更加灵活。问题：
评分函数只采用L1或L2距离，灵活性不够。
评分函数过于简单，实体和关系向量的每一维等同考虑。解决
提出TransA模型，将评分函数中的距离度量改用马氏距离，并为每一维学习不同的权重。示例
如下图所示，( h 1 , r 1 , t 1 ) ( h_1, r_1, t_1)(h 1 ,r 1 ,t 1 )和( h 2 , r 2 , t 2 ) (h_2,r_2,t_2)(h 2 ,r 2 ,t 2 )两个合法的事实三元组，t3是错误的尾实体。如果使用欧氏距离，如图(a)所示，错误的实体t3会被预测出来。而如图(b)所示，TransA模型通过对向量不同维度进行加权，正确的实体由于在x轴或者y轴上距离较近，从而能够被正确预测。

; 2.2 高斯嵌入模型

3 语义匹配模型

使用基于相似度的评分函数

博客参考：https://mp.weixin.qq.com/s/6RP3OguFqK8PxfBUz6gu2Q

Original: https://blog.csdn.net/qq_39827677/article/details/109092168
Author: 没有胡子的猫
Title: 知识图谱嵌入(KGE)：方法和应用的综述（持续更新）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/558034/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Python·OpenCV】如何实现 HSV 与灰度图的相互转换？

文章目录 * – 一、引言 – 二、为什么需要 HSV ？ – 三、HSV 三个分量表示什么？ – 四、绘图误区 – 五…

人工智能 2023年7月20日
0049
基于Matlab构建适用于无人机或四轴飞行器的IMU+GPS融合算法（附源码）

此示例演示如何构建适用于无人机（UAV）或四轴飞行器的 IMU + GPS 融合算法。此示例使用加速度计、陀螺仪、磁力计和 GPS 来确定无人机的方向和位置。一、模拟设置设…

人工智能 2023年6月30日
0077
基于YOLO目标检测及OpenCV实现的游戏代玩人工智能体(Auto Gaming Agent) [4]

大型生存类游戏自动代玩人工智能[4] — 自动控制一、键鼠自动操作 * – 1. 操作游戏角色 2. 瞄准目标二、自动采集 * – 1. O…

人工智能 2023年7月18日
0053
电信用户流失预测案例（1）

【Kaggle】Telco Customer Churn 电信用户流失预测案例前言：案例学习说明与案例建模流程在学习了经典机器学习算法和Scikit-Learn的调参策略之后，…

人工智能 2023年7月16日
0078
面试官：断网了，还能 ping 通 127.0.0.1 吗？

你女神爱不爱你，你问她，她可能不会告诉你。 ‍ 但网通不通，你 ping 一下就知道了。可能看到标题，你就知道答案了，但是你了解背后的原因吗？那如果把 127.0.0.1 …

人工智能 2023年7月30日
0058
【推荐收藏】深度好文：带你全面了解《知识图谱》

一文带你了解《知识图谱》新技术自然语言处理 * 自然语言处理发展历程（1）自然语言处理发展历程（2）自然语言处理发展历程（3）知识图谱典型的知识图谱 * WordNet …

人工智能 2023年6月1日
0075
（Linux）使用conda配置兼容TensorFlow和PyTorch的env环境

目录 1、新建虚拟环境： 2、进入环境，检查python版本 3、使用conda安装TensorFlow2.2.0，先安装tf ! 4、安装torch1.10版本（确保tf已经没有…

人工智能 2023年5月25日
00109
数据样本过大数据维度过大：用户名做一个聚类2.可以将时间分段，达到降维的效果

CTR的核心问题主要是点击率广告排序– ECPM=CTRBid– 排序时Bid已知，但CTR未知扣费– CPCi = (CTRi+1CPCi+1)/CTRi– 当前广告的扣费依赖当…

人工智能 2023年5月31日
00116
基于深度学习方法的点云算法3——PointNet++（点云分类分割）

基于深度学习方法的点云算法3——PointNet++（点云分类分割）请点点赞，会持续更新！！！基于深度学习方法的点云算法1——PointNetLK（点云配准）基于深度学习方法的点…

人工智能 2023年7月28日
0068
商务智能-第三章联机分析处理OLAP

联机分析处理 OLAP 联机分析处理(OLAP) 1.1. 从联机事务处理(OLTP)到联机分析处理(OLAP) 关系数据库模型出现：60年代末E.F. Codd提出的关系数据库…

人工智能 2023年7月18日
0061
【20211005】Praat 基本用法

人工智能 2023年5月23日
0077
cesium之相机的位置和姿态获取

之前文章发表过一篇关于cesium接口的思维导图的文章，可以在此翻阅，http://mp.weixin.qq.com/s?__biz=MzkwMzMwNTg2NQ==&mi…

人工智能 2023年5月28日
0089
密度聚类（ DBSCAN ）

密度聚类（ DBSCAN ）密度聚类的思想是不同于K-Means的，但是更符合我们人类的思维，基本的思想是通过是否紧密相连来判断样本点是否属于一个簇。代表性的算法就是DBSCAN…

人工智能 2023年5月31日
0098
【pandas groupby()函数使用及参数详解】

1.1 定义 pandas中的 groupby函数是先将df按照某个字段进行拆分，将相同属性分为一组；然后对拆分后的各组执行相应的转换操作；最后输出汇总转换后的各组结果 DataF…

人工智能 2023年7月14日
0073
神经网络之损失函数

指导教程: https://github.com/lyhue1991/eat_tensorflow2_in_30_days 学习书籍: 的数学基础的核心组件是层（layer），它…

人工智能 2023年6月26日
0080
声音分类及其实战（一）

目录前言音频简介 * WAV是什么？采样率、位深声音处理以及可视化 ; 前言玩过CV的都知道猫狗识别，通过输入一张猫狗图片之后经过神经网络就能知道这张图片属于猫还是狗，图…

人工智能 2023年5月25日
00156

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31