DistMult 论文笔记

2023年5月27日下午8:40 • 人工智能 • 阅读 111

EMBEDDING ENTITIES AND RELATIONS FOR LEARNING AND INFERENCE IN KNOWLEDGE BASES

– Abstract
– Background
– Algorithm
– Experiment
– Conclusion

Bishan Yang, Wen-tau Yih, Xiaodong He, Jianfeng Gao, Li Deng The
International Conference on Learning Representations（ICLR）

Abstract

学习关系嵌入用于挖掘逻辑规则。研究发现，双线性目标学习能够很好地捕捉关系的语义，矩阵乘法可以表示关系的组成。

[En]

Learning relation embedding is used to mine logic rules. It is found that bilinear goal learning is good at capturing the semantics of relations, and matrix multiplication can represent the composition of relations.

先将模型分类成线性和双线性、两者组合的模型和模型间实体关系的运算。其次讨论双线性模型，将双线性模型中的矩阵限制为对角矩阵则和TransE一样的参数。其次再对比其和TransE的好坏。

Background
TransE、NTN、RESCAL的模型框架只有轻微的不同在于关系与实体之间的表示，不仔细比较，不清楚不同的设计又什么不同的影响。
链接预测实验只能间接表面了低维嵌入的意义，难以解释嵌入过程中捕捉了哪些关系属性，以及捕捉程度。

因此本文：

提出整合现有模式的总体框架

[En]

propose a general framework to integrate existing models*
链接预测的实验评估更好
[En]
better experimental evaluation of link prediction*
挖掘逻辑规则。
Algorithm

实体表示：

x为one-hot高纬矢量，W为参数方程，f()为线性或非线性函数。

关系表示：

关系的表示通常反映在得分函数中，该函数通常被定义为线性、双线性或两个转换函数的组合：

[En]

The representation of the relationship is usually reflected in the scoring function, which is usually defined as a linear, bilinear, or combination of the two conversion functions:

几种模型的关系表示和评分函数：

[En]

The relational representation and scoring function of several models:

本文仅考虑最基本的双线性评分函数：

[En]

This paper only considers the most basic bilinear scoring function:

本文提出了将关系矩阵 𝑀𝑟 限制为对角矩阵(DistMult)，这样可以将双线性模型的参数量减少到与 TransE 相同。

损失函数：

; – Experiment

link prediction：
评价标准：https://www.cnblogs.com/shenxiaolin/p/9309749.html

Mean Reciprocal Rank (MRR)

an average of the reciprocal rank of an answered entity over all test triplets .

Mean Average Precision (MAP)

as used in (Chang et al., 2014)) as the evaluation metrics.

NTN最复杂的模型，在实验中表现的最差，表明过拟合；
本文实现的TransE的实验结果比其原文的实验结果好，差异在于对梯度下降算法的选择，表明AdaGrad会更好；
DistMult是双线性对角矩阵，是对双线性法的简化，但实验结果更好。

DIstADD -> TransE -> 加法操作
DistMULT -> Bilinear-diag -> 乘法操作

此外，还测试了不同初始化方法的效果。

[En]

In addition, the effects of different initialization methods were tested.

使用非线性的投影函数 tanh，并使用预训练词向量进行实体表示的初始化。在预测实体时，利用实体类型信息进行结果过滤。

嵌入模型很大程度上得益于外部文本的预训练。

[En]

The embedded model greatly benefits from the pre-training of external text.

Rule Extration：

规则提取是本文的一项重要工作。逻辑规则具有重要意义：

[En]

Rule extraction is an important work of this paper. Logical rules are of great significance:

可用于推断新事实进行 KB 补全；
优化数据存储，只存储逻辑规则比存储事实节省空间；
支持复杂推理；
为推断结果提供解释。

双线性模型比较复杂，在提取长路径关系方面有较好的优势。

[En]

The bilinear model is more complex, so it is better at extracting long-path relationships.

; – Conclusion

本文提出了 neural-embedding 的通用框架，并把 NTN、TransE 等模型套在框架里进行对比；提出了将关系矩阵限制为对角矩阵的 DistMult；并用 embedding-based 方法挖掘逻辑规则。

Original: https://blog.csdn.net/Jay98/article/details/123398757
Author: 懒狗的救赎
Title: DistMult 论文笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527639/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用Python进行GEO数据挖掘（学习笔记三）：利用rpy2库调用R的limma包进行差异表达分析

加载需要的python库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import…

人工智能 2023年7月15日
0057
python大数据分析笔记_python数据分析与建模实现-第一次笔记

编辑推荐: 本文来自csdn ，文章主要介绍了python做数据分析时，数据的的读取和处理，以及静态结构分析等相关内容。首先我们做数据分析，想要得出最科学，最真实的结论，必须要有…

人工智能 2023年7月8日
0043
手把手教你安装torch_geometric库（pyg）

正常步骤： 1.在安装前要检查电脑的上的torch和cuda版本 import torch; print(torch.version)检查torch版本； import torch…

人工智能 2023年6月15日
00119
Docker数据卷&&自定义Docker镜像

目录宿主机与容器之间的文件拷贝引言：利用MySQL镜像安装MySQL服务从容器中拷贝文件到宿主机从宿主机拷贝文件到容器数据卷数据卷容器 Dockerfile自定义镜像 …

人工智能 2023年7月31日
0054
做一个简单网页(做一个简单网页多少钱)

怎样做一个简易的网页？做一个简单网页多少钱做一个简易的普通网页比较容易。当然，制作的方法有好几种，有的是直接写代码、有的是用绘图软件绘制页面再导出网页、常用的是使用网页制作软件做…

人工智能 2023年7月29日
0057
使用opencv读取rtsp流的图片帧进行目标检测，并将处理好的图像推到rtsp服务器上

业务场景解决方案一：使用opencv+Gstreamer-rtsp-server完成（推荐）环境配置解决方案二：使用ffmpeg+rtsp服务器完成参考链接如下：业务场景…

人工智能 2023年7月20日
0081
Mx-yolov3+Maixpy+ K210进行本地模型训练和目标检测

我接触K210同样也是因为一次比赛，需要进行目标检测并对垃圾进行分类，在接触到K210之前我一直使用各种YOLO版本检测，并部署到树莓派和nano上，一次偶然的机会，我发现了K21…

人工智能 2023年6月17日
0086
用Azure认知服务开发一个语音翻译机，学英文很爽快

最近CSDN开展了《0元试用微软 Azure人工智能认知服务，精美礼品大放送》，当前目前活动还在继续，热心的我已经第一时间报名参与，只不过今天才有时间实际的试用。目前，博客帖子需…

人工智能 2023年5月27日
0079
Evolutionary algorithm （遗传算法）介绍

Evolutionary algorithm （遗传算法）介绍 Evolutionary algorithm 遗传算法，实际上也是机器学习里面一个很重要的分支。为什么呢，因为他在…

人工智能 2023年7月17日
0061
【1】使用分类学习APP – Classification Learner App 训练分类模型

什么是有监督学习？你可以使用分类学习器训练模型来对数据进行分类。使用这个APP时，你可以通过使用各种分类模型来探索监督机器学习。你可以浏览数据、选择特征、指定验证方案、训练模型和…

人工智能 2023年7月3日
0089
Istio微服务治理网格的全方面可视化监控（微服务架构展示、资源监控、流量监控、链路监控）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月30日
0056
《机器学习》西瓜书课后习题3.3——python实现对率回归

《机器学习》西瓜书课后习题3.3——python实现对率回归（梯度下降法）《机器学习》西瓜书P69： 3.3 编程实现对率回归，并给出西瓜数据集3.0a上的结果首先我们回归一下…

人工智能 2023年6月15日
0093
Python数据分析实战（4）——探索1960 – 2014 美国犯罪数据

个人复习总结（jupyter） 1 导入必要的库和创建数据 import numpy as np import pandas as pd 数&#x63…

人工智能 2023年7月8日
0089
vos3000的IVR 语音业务的接入号码如何设置

在VOS系统－>语音管理－>语音业务中添加新建一条语音业务，在业务名称中填写相应的名字，点击应用举例：新建一条名为 “callback” 的业…

人工智能 2023年5月27日
0078
PyQt5下+OpenCV启动摄像头

PyQt5下+OpenCV启动摄像头第一步：用PyQt5下的QtDesigner设计界面，如下：其中：1、摄像头为QLabel，大小设置为640X480，这也是笔记本上普通摄像…

人工智能 2023年6月18日
0070
人工智能基础 | Python实现洗衣机模糊推理系统

运行环境 Pycharm + Anaconda3 已知一组污泥和油脂两个参数的 模糊集合，以…

人工智能 2023年7月28日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DistMult 论文笔记

EMBEDDING ENTITIES AND RELATIONS FOR LEARNING AND INFERENCE IN KNOWLEDGE BASES

大家都在看