《knowledge graph embedding：a survey of approaches and applications》论文阅读

2023年6月1日下午3:20 • 人工智能 • 阅读 101

发表于TKDE 2017。

knowledge graph embedding：a survey of approaches and applications

abstract
1. introduction
2. notations
3. KG embedding with facts alone
*
3.1 translational distance models
–
3.2 semantic matching models
–
- 3.2.1 RESCAL and its extensions
- 3.2.2 matching with neural networks
3.3 model training
–
- 3.3.1 training under open world assumption
- 3.3.2 training under closed world assumption
3.4 model comparison
4. incorporating additional information
*
4.1 entity types
4.2 relation paths
4.3 textual descriptions
4.4 logical rules
4.5 other information
5. applications in downstream tasks
*
5.1 In-KG applications
–
5.2 out-of-KG applications

abstract

knowledge graph (KG) embedding是对KG中的实体和关系进行嵌入到连续空间中，在保持KG内部结构的情况下简化操作的计算。本文中的review 基于在embedding任务中用到的信息的种类。

introduction

KG是节点和关系构成的多关系图。每个边都具有三元组的形式：( h e a d e n t i t y , r e l a t i o n , t a i l e n t i t y ) (head entity, relation, tail entity)(h e a d e n t i t y ,r e l a t i o n ,t a i l e n t i t y )，也被称为是一个f a c t fact f a c t。虽然这种三元组的表达形式能够有效表示结构数据，但是也造成了操作的困难性。于是KG embedding被提出，并获得了很大的关注度，可以被应用于：KG补充，关系挖掘、实体分类、实体解析等。

现在最多的KG embedding方法都只是单单基于observed facts。给定一个KG，将实体和关系变换到连续向量空间，定义一个scoring函数来在每个facts上评价它的合理性。实体和关系embeddings就可以通过观察到的facts的最大合理性来得到。但是这种基于individual fact的方式，可能对于下游任务不够准确，于是越来越多的方法通过使用其他种类的信息来进行研究以获得更加准确的embeddings，e.g. :实体种类，关系路径，文本描述，甚至逻辑规则等。

notations

不作介绍

KG embedding with facts alone

KG被保存于一些三元组的集合中D + = { ( h , r , t ) } . \mathbb{D}^+ = {(h,r,t)}.D +={(h ,r ,t )}.一个典型的KG embedding technique包括三步：(1)表示实体和关系 (2)定义一个scoring function (3)学习实体和关系表征。第一步往往定义了实体和关系在连续向量空间中的形式。实体通常被定义为一个向量，如：向量空间中的确定点，最近也有工作考虑了实体的不确定性，通过多维高斯模型进行建模。关系通常被当作向量空间中的操作，也可以被表示为向量、矩阵、张量、多维高斯分布，甚至混合高斯等。之后，一个scoring function f r ( h , t ) f_r(h,t)f r (h ,t ) 被定义在每一个facts ( h , r , t ) (h,r,t)(h ,r ,t )上来对合理性进行度量。步骤三则解决了最大化observed facts（facts包含在D + \mathbb{D}^+D +上的）上的总合理性优化任务。这些embedding techniques可以被大体分为两类：translational distance models、semantic matching models。前者使用了基于距离的scoring函数，后者则使用了基于相似度的。

3.1 translational distance models

3.1.1 TransE and Its Extensions

TransE是最具代表性的translational distance model。

《knowledge graph embedding：a survey of approaches and applications》论文阅读

; 3.1.2 gaussian embeddings

3.1.3 other distance models

3.2 semantic matching models

3.2.1 RESCAL and its extensions

; 3.2.2 matching with neural networks

ps：从下面这张图的SME开始，前面两种方法是上一小节的。

3.3 model training

包括两种广泛使用的假设：the open world assumption，closed world assumption。

3.3.1 training under open world assumption

the open world assumption (OWA)是指KGs只包括true facts，未观察到的facts可能是错的或者只是missing。在这种情况下,D + \mathbb{D}^+D +只包括了positive examples。negative examples可以通过启发式方法生成，例如：the local closed world assumption。根据positive set D + \mathbb{D}^+D +以及相应生成的negative set D − \mathbb{D}^-D −,我们可以通过最小化logistic loss（更适用于semantic matching models），pairwise ranking loss（更适用于translational distance models）来学习实体和关系的表征Θ \Theta Θ。

生成负训练样本：通过随机替换true facts中的h or t来实现。但是这种方法可能会导致引入false-negative training examples，于是可以通过以不同的概率来替换h or t缓解这一情况。有实验表明：生成更多的negative examples可以得到更好的实验结果，每个positive example搭配50个negative examples可以获得最好的性价比（因为训练时间也会相应增加）。

3.3.2 training under closed world assumption

the closed world assumption (CWA)是指凡是未在D + \mathbb{D}^+D +中的facts都是错误的。可以通过最小化如squared loss的损失函数来学习实体和关系的representation，使得observed facts具有接近1的分数，non-observed scores接近于0。
这种CWA的world assumption具有很多的缺点：会把缺失的facts强行视作是false，现实中的大多数KG都是incomplete的，CWA-based models常常比OWA-based models表现差；CWA 假设将会引入大量的负样本，可能会在训练过程中导致可扩展性的问题。

3.4 model comparison

根据以上模型的比较，我们有以下结论：1⃣️利用向量来表示实体和关系的模型往往更加efficient。2⃣️将关系建模为矩阵或张量的方法往往具有更高的时空复杂度。3⃣️基于神经网络的模型具有更高的时间复杂度。

; 4. incorporating additional information

可以综合的信息包括：entity types，relation paths，textual descriptions，logical rules等。

4.1 entity types

4.2 relation paths

4.3 textual descriptions

这个部分讨论了对于实体的描述性信息的加入。
这种加入文本信息描述的方法追溯回NTN模型，文本信息被用来初始化实体表征(descriptions的平均word vectirs)。但是这种方法使得文本信息和KG facts分离，因此fail to 利用它们之间的交互信息。

之后joint model出现，在embedding的过程中更好地利用文本信息。key idea是将KG与附加的文本语料进行对齐，之后同时产生KG embedding和word embedding。这样，实体/关系和words都被表示于相同的向量空间，于是它们之间做的操作（如：内积）就变得meaningful了。joint model具有三个成分：knowledge model，text model，alignment model。knowledge model被用来对KG中的实体和关系进行嵌入。text model被用来对text corpus中的单词进行嵌入。最后，alignment model保证了实体/关系嵌入以及单词嵌入位于同一空间之中。具有不同的alignment mechanisms：通过实体名称、通过实体描述等。jointly embedding同时使用了结构化KGs和无结构的text的信息。

4.4 logical rules

4.5 other information

包括实体属性、时序信息、图结构、从其他关系学习方法中得到的evidence等的。

applications in downstream tasks

KG embedding的应用可以被分类为：in-KG applications，out-of-KG applications。

5.1 In-KG applications

In-KG applications是指conducted within the scope of the KG where entity and relation embeddings are learned。我们介绍了四种这样的应用：link prediction，triple classification，entity classification，entity resolution。所有的应用都可以被称为是一种对输入KG的改善（e.g. complication or 重复数据删除等）。

5.5.1 link prediction

预测( ? , r , t ) , ( h , r , ? ) , ( h , ? , t ) . (?,r,t),(h,r,?),(h,?,t).(?,r ,t ),(h ,r ,?),(h ,?,t ).由于实体和关系表征之前被学习过了，link prediction可以被简单的认为是一个ranking procedure。常用的评测指标，包括：mean rank（预测的rank的平均值），mean reciprocal rank（相关rank的平均值），Hits@n（不大于n的rank的占比），AUC-PR（precision-recall curve下的area的面积）。

5.1.2 triple classification

判断一个unseen triple fact ( h , r , t ) (h,r,t)(h ,r ,t )是true or false。评价指标可以用：micro- or macro-averaged accuracy，mean average precision。

5.1.3 entity classification

目标是将实体分类入不同的语义类之中，可以将这种任务视为是一种特殊的link prediction任务（x is a ?）。

5.1.4 entity resolution

用于判断两个实体是否指代同一个object。entity resolution实际上是nodes的去重任务。可以计算两个entity的representation的相似度来判断两者是否是同一个object。AUC-PR是这种任务下最常用的评测指标。

5.2 out-of-KG applications

out-of-KG applications是指打破了输入KG的边界以及扩展到更宽广的domains时。我们介绍了三种应用：relation extraction（目标是从plain text中挖掘relational facts where entities have already been detected），question answering（给定用自然语言表达的问题，目标是返回正确的answer，被KG中的triples所反馈的），recommender systems（提供给user建议购买的items）。

Original: https://blog.csdn.net/ptxx_p/article/details/120776892
Author: ptxx_p
Title: 《knowledge graph embedding：a survey of approaches and applications》论文阅读

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557551/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习（二）：基于XGBoost的分类与预测

XGBoost介绍 xgboost的安装、参数说明 XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型，而是…

人工智能 2023年7月2日
0098
读书笔记：Markov链的状态分类之周期性

（状态 i i i 的周期）⨀ \bigodot ⨀ 设 i i i 为 M a r k o v Markov M a r k o v 链的一个状态，使 P i i ( n ) &…

人工智能 2023年7月1日
0077
AI音乐创作，让每一个人都成为音乐家

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月28日
0091
【AAAI2021】NLP所有方向论文列表（情感分析、句法、NER、对话/问答、关系抽取、KD等）…

点击上方，选择星标或置顶，每天给你送干货！最近整理了下AAAI2021 NLP论文各个细方向的接收列表！应该还有几篇漏网之鱼，之后发现了补上~ AAAI2021接收论文PDF…

人工智能 2023年6月1日
0084
3. Matplotlib基础学习库

1 什么是Matplotlib 是专门用于开发2D图表(包括3D图表) 以渐进、交互式方式实现数据可视化 2 为什么要学习Matplotlib 可视化是在整个数据挖掘的关键辅助工具…

人工智能 2023年7月17日
0072
“如何获取一篇论文的代码以及运行”相关教程

内容简介本书从只有二十行的引导扇区代码_出发，一步一步地向读者呈现一个操作系统框架的完成过程。书中不仅关注 _代码_本身，同时关注完成这些 _代码_的思路和过程。本书不同于其他…

人工智能 2023年7月27日
0070
Scanpy(六)空间转录组数据的分析与可视化

目录 Reading data QC and preprocessing Manifold embedding and clustering based on transcript…

人工智能 2023年6月15日
00108
【语音识别框架】语音识别框架之wenet

环境配置 https://github.com/wenet-e2e/wenet git clone https://github.com/wenet-e2e/wenet.git A…

人工智能 2023年5月23日
00131
Python gensim库使用word2vec 加载和保存模型

import os import jieba 读取训练数&#x…

人工智能 2023年5月27日
0076
车载以太网物理层SerDes

1 基本概念1.1 基本概念SerDes：sir-deez，加串 + 解串；SerDes的lock是指CDR时钟的锁定。The 10b SerDes (PMA) is design…

人工智能 2023年6月28日
0069
Windows端CUDA11.3+CUDNN+pytorch环境搭建

1、显卡驱动的安装最近，在学习pytorch深度学习，遇到很多的坑，环境配置也出现过问题，忍不住和大家进行分享，现在把环境搭建过程分享给大家。 1.1、查看自己的显卡。具体操作…

人工智能 2023年6月23日
00103
模型部署入门教程（一）：模型部署简介

前言 OpenMMLab 的算法如何部署？是很多社区用户的困惑。而模型部署工具箱 MMDeploy 的开源，强势打通了从算法模型到应用程序这 “最后一公里”…

人工智能 2023年7月22日
0058
iOS之Block分类和使用注意事项

Block的分类 Block有三种类型：全局Block：__NSGlobalBlock，堆区Block：__NSMallocBlock，栈区Block：__NSStackBl…

人工智能 2023年7月1日
00102
Global Tracking Transformers 详细解读

文章目录介绍 Preliminarie Global tracking transformers * 4.1 Tracking transformers 4.2 训练 4.3 O…

人工智能 2023年7月13日
0066
协方差与协方差矩阵

一、协方差协方差用于衡量两个随机变量的联合变化程度。方差为协方差的一种特殊情况，即该变量与其自身之协方差。若变量X的较大值主要与另一个变量Y的较大值相对应，而两者的较小值也相…

人工智能 2023年7月15日
0044
星环科技TDH8.0使用必读2: 10种数据模型全支持未来属于多模型大数据平台

引言星环科技于2021年3月发布了星环极速大数据平台TDH的8.0版本。相信很多用户都对这款产品非常感兴趣。本系列文章向您逐一介绍TDH8.0全新功能和技术创新。帮助企业级数据…

人工智能 2023年6月1日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31