【HOLE】论文浅读：Holographic Embeddings of Knowledge Graphs

2023年6月4日下午3:38 • 人工智能 • 阅读 79

; HOLE

Holographic Embeddings of Knowledge Graphs
基于向量的循环相关

任务

提出全息嵌入(holographic embeddings，HOLE)来学习整个知识图的组成向量空间表示。
在组合向量空间模型的框架内研究从知识图谱学习的问题。

方法（模型）

compositional vector space models

组合向量空间模型

P r ( ϕ p ( s , o ) = 1 ∣ Θ ) = σ ( η s p o ) = σ ( r p T ( e s ◦ e o ) ) Pr(\phi_p(s,o)=1|\Theta)=\sigma(\eta_{spo})=\sigma(\mathbf{r}_p^T(\mathbf{e}_s◦\mathbf{e}_o))P r (ϕp (s ,o )=1 ∣Θ)=σ(ηs p o )=σ(r p T (e s ◦e o ))

ϕ p ( s , o ) \phi_p(s,o)ϕp (s ,o )：特征函数
◦ ：复合算子，从嵌入e s \mathbf{e}_s e s ，e o \mathbf{e}_o e o 创建（ s ， o ）（s，o）（s ，o ）的复合向量表示。

通过最大限度地减少（正则化）logistic损失来实现最好地解释数据集的实体和关系的表示。

min ⁡ ∑ i = 1 m l o g ( 1 + e x p ( − y i η i ) ) + λ ∣ ∣ Θ ∣ ∣ 2 2 \min\sum_{i=1}^mlog(1+exp(-y_i\eta_i))+\lambda||\Theta||_2^2 min i =1 ∑m l o g (1 +e x p (−y i ηi ))+λ∣∣Θ∣∣2 2

对于关系数据，最小化 logistic 损失具有额外的优势，它可以帮助为复杂的关系模式找到低维的嵌入。

KGs只存储正确三元组，这种情况下可以使用 pairwise ranking loss。

min ⁡ Θ ∑ i ∈ D + ∑ j ∈ D − max ⁡ ( 0 , γ + σ ( η j ) − σ ( η i ) ) \min_\Theta\sum_{i\in{D_+}}\sum_{j\in{D_-}}\max(0,\gamma+\sigma(\eta_j)-\sigma(\eta_i))Θmin i ∈D +∑j ∈D −∑max (0 ,γ+σ(ηj )−σ(ηi ))

例如将现有三元组的概率排序为高于不存在三元组的概率。
d+，d−：表示存在和不存在的三元组的集合。
η j > 0 \eta_j>0 ηj >0：指定边距的宽度。

Holographic Embeddings(HOLE)

为了将张量积的表达能力与TransE的效率和简单性结合起来，使用向量的循环相关来表示实体对。
在HOLE中，不只是存储关联，而是学习能最好地解释所观察到数据的嵌入。

1. &#x590D;&#x5408;&#x7B97;&#x5B50;

a ◦ b = a ∗ b a◦b=a\ast b a ◦b =a ∗b

∗ \mathbf{*}∗：表示循环相关

三元组的概率模型

P r ( ϕ p ( s , o ) = 1 ∣ Θ ) = σ ( r p T ( e s ∗ e o ) ) Pr(\phi_p(s,o)=1|\Theta)=\sigma(\mathbf{r}_p^T(\mathbf{e}_s\ast \mathbf{e}_o))P r (ϕp (s ,o )=1 ∣Θ)=σ(r p T (e s ∗e o ))

使用复合算子相对于卷积的优点

Non-commutative：对建模有向图的非对称性很有必要。
Similiarity Component：对实体相似性的关系建模有帮助。
SGD

使用随机梯度下降

e o t + 1 ← e o t − μ ∂ L ∂ f ∂ f ∂ η ( r p t ∗ e s t ) \mathbf{e}_o^{t+1}\leftarrow\mathbf{e}_o^{t}-\mu\frac{\partial L}{\partial f}\frac{\partial f}{\partial \eta}(\mathbf{r}_p^t\ast e_s^t)e o t +1 ←e o t −μ∂f ∂L ∂η∂f (r p t ∗e s t )

μ \mu μ：学习率

方法
把实体和关系都表示为向量。给定一个事实( h , r , t ) (h,r,t)(h ,r ,t )，首先使用循环相关操作将实体表示形式组成h ∗ t ∈ R h*t∈R h ∗t ∈R。
然后将组合向量与关系表示形式匹配，以对事实进行评分。

数据集

WN18
FB15K

性能水平

公平起见，评价时使用相同的损失和优化方法对参与比较的模型重新训练。

Filter：由于对于给定的 predicate-object，测试集中可以存在多个正确的三元组，因此从R p （ s ′ , o ) = 1 R_p（s^{‘},o)=1 R p （s ′,o )=1 and $ s\neq s{‘}$的排序中删除所有实例，只考虑测试实例在所有错误实例中的排序。同理从$R_p（s,o{‘})=1$ and $ o\neq o^{‘}$的排序中删除所有实例。

在WN18数据集的测试中，HOLE的表现都最为出色。
在FB15k数据集表现也优于其他模型，但是效果不是很显著。

与Rescal相比，HOLE的参数减少很多。尽管embedding的维数d比rescal的大，但由于其存储复杂度仅线性地依赖于d，所以总体参数数目显著减少。

l o c a t e d I n ( c , r ) locatedIn(c,r)l o c a t e d I n (c ,r )：c：countries(国家)，r：regions(地区)。
l o c a t e d I n ( c , s ) locatedIn(c,s)l o c a t e d I n (c ,s )：s：subregions(次区域)。

任务S1 设置：对于test/valid中，只将l o c a t e d I n ( c , r ) locatedIn(c,r)l o c a t e d I n (c ,r )的countries设置为missing。性能：丢失的三元组几乎可以完美预测。
任务S2 设置：将l o c a t e d I n ( c , s ) locatedIn(c,s)l o c a t e d I n (c ,s )中countries和subregions设置为missing。性能：相对于其他数据集表现最好。
任务S3 设置：将l o c a t e d I n ( n , r ) locatedIn(n,r)l o c a t e d I n (n ,r )中countriesn的neighbors，regions设置为missing。性能：预测难度最大，但相对于其他数据集表现较好。

RESCAL和ER-MLP较差的结果很可能是过拟合导致。

; 结论

HOLE 它利用向量的循环相关性来创建二元关系数据的组合表示。通过使用相关性作为组合算子，可以捕获丰富的交互，同时保持高效的计算，易于训练，并可扩展到非常大的数据集。
循环相关对成对的相互作用进行压缩。因此，HolE对每个关系只需要O ( d ) O(d)O (d )参数，并且循环相关是不符合交换律的，即h ∗ t ht h ∗t不等于t ∗ h th t ∗h。所以HolE能够 对不对称关系进行建模。

思考

循环相关的优势：

与张量积相比，循环相关具有不增加复合表示的维数的重要优点。
空间复杂度在实体表示的维度d中是线性的，运行时复杂度在d中是对数线性的。对总体参数的数量和运行效率都有显著影响。
组合表示与其构成的表示具有相同的维数。

Original: https://blog.csdn.net/qq_39827677/article/details/109491663
Author: 没有胡子的猫
Title: 【HOLE】论文浅读：Holographic Embeddings of Knowledge Graphs

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/568817/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【20220331】自动回复微信机器人——基于pyautogui，取消OCR功能，调用中文预训练模型API

自动回复微信消息 1. pyautogui 2. 文本识别 3. 改进版文本识别 4. 自动回复 5. 全部代码 6. 实验结果可视化 7. 未来方向参考还有笑话+成语+名词解…

人工智能 2023年5月27日
0085
使用spss做各种相关性分析的方法和步骤

目录数据类型相关性分析的方法用spss操作卡方检测 Eta检测皮尔逊(Pesrson)检测 Spearman(斯皮尔曼) 数据类型先说明spss里的三种数据类型, 可以…

人工智能 2023年7月18日
0087
【Python】《 python基础编程与数据分析》基础知识部分（完结）

python基础编程与数据分析本篇仅供参考，单纯为石榴姐妹定制期末复习提纲目录参考南京大学出版的python书籍，内容由《python从入门到实践》这本书内容总结而成 …

人工智能 2023年6月11日
0083
数字验证码识别

1 程序整体功能及模块介绍本设计为基于 MATLAB 的数字验证码识别，通过一个 GUI 界面来进行实时交互。可以识别带有噪声的数字验证码。流程为：打开图像文件，显示图片，用颜色…

人工智能 2023年7月12日
00106
基于Arduino的智能环境监测与反馈系统

基于Arduino的智能环境监测与反馈系统一、项目背景二、效果展示三、材料清单 * 1.Arduino开发板——YwRduino uno 2.Arduino盾板——IO Se…

人工智能 2023年5月27日
00180
fine-tuning（微调）的理解

fine-tuning 介绍 * 什么情况下使用微调微调指导事项不同数据集下使用微调涉及到的其他知识 * 学习率（learning-rate）卷积神经网络的核心迁移学习与…

人工智能 2023年7月26日
0062
LSTM api的介绍及使用示例（pytorch）

1.LSTMapi介绍 LSTM和GRU都是由torch.nn提供 torch.nn.LSTM(input_size, hidden_size, num_layers, batch…

人工智能 2023年5月31日
0064
如何在云服务器上跑深度学习的代码？(ResNet50为例)

✅ 个人简介：南京邮电大学，计算机科学与技术，在读本科兴趣领域：数据结构、C/C++ 文章目录一、选择一款云服务器二、上传代码和数据三、解压”代码和数据的压缩包&…

人工智能 2023年6月16日
00158
007-变量的作用域和LED点阵

局部变量：函数内申明的变量，只在函数内有效。全局变量：函数外部申明的变量。一个源程序文件有一个或者多个函数，全局变量对他们都起作用。备注：全局变量有副作用，降低了函数的独立性，降…

人工智能 2023年6月6日
0083
【CVPR2022】论文列表与下载——PartFour

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0062
tensorflow学习2 –回归主要是看数据的各种展示方法怎么用代码实现

本文教程来源教程以汽车燃油效率的模型为例，气缸数，排量，马力以及重量为变量我之前学的线性回归数学理论获取数据 dataset_path = keras.utils.get_…

人工智能 2023年6月17日
0078
3.深度强化学习——PPO(Proximal Policy Optimization)算法资料+原理整理

文章地址：PPO: Proximal Policy Optimization Algorithms 一. PPO资料 PPO原理讲解BLOG①：这篇blog详细讲了PPO算法的产生…

人工智能 2023年5月23日
0093
人生重开模拟器（Python实现）

文章目录人生重开模拟器介绍代码实现 * 打印初始界面设置初始属性设置角色性别设置角色出生点针对每一岁，生成人生经历人生重开模拟器介绍人生重开模拟器是由VickSca…

人工智能 2023年6月26日
0079
【已证实】训练神经网络时，GPU利用率低而显存占用率高的思考

已经证实了我的猜想”从batch_size角度考虑”的正确性。详细解释在后面更新。 GPU利用率低而显存占用率高的思考问题描述：在深度学习training…

人工智能 2023年7月12日
0055
【回归预测】基于TPA-LSTM(时间注意力注意力机制长短期记忆神经网络)实现数据多输入单输出回归预测附matlab代码

1 内容介绍随着当今时代科技不断地飞速发展,科技信息也在急剧增加,收集并挖掘分析这些来源多样化的科技信息,有助于推动科技的发展。而预测作为一种重要的数据研究方法,在各个行业各个领…

人工智能 2023年7月13日
00135
表格图像提取-基于传统交点方法和Tesseract-OCR

本文应用传统交点方法来提取框线表格，主要是针对存在合并单元格的表格，并用tesseract-ocr来做了文字识别，主要难点是前者的提取部分，现将部分方法分享给大家。建议各位可以…

人工智能 2023年6月20日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31