【论文笔记】知识图谱综述2021

2023年6月1日下午6:58 • 人工智能 • 阅读 81

; KRL – Knowledge Representation Learning

在知识表示学习里，我们希望把实体和关系映射到低维空间上，这样便于我们提取实体与关系的特征表示。这时我们的思路可以是：

which representation space to choose
本文描述了4种表示空间： Point-Wise Space、Complex Vector Space、Gaussian Distribution、Manifold and Group。 并且以能优化什么问题来展开在每种空间的模型代表。如在Point-Wise Space上，经典的TransE嵌入模型是开山鼻祖，后续有各种变体模型不断优化一对多关系；ComplEx是第一个在Complex Vector Space上使用。
how to measure the plausibility of triplets in a specific space
scoring function用来衡量事实的合理性。会有两种形式的评分函数：基于距离的和基于相似度，分别模型代表是TransE和DistMult。
which encoding model to use for modeling relational interactions
本文主要介绍了一些模型架构（包括线性/双线性模型、因子分解模型、神经网络），对实体与关系的交互进行编码。
whether to utilize auxiliary information
多模态的嵌入（包含外部信息例如文本描述、类型约束、关系路径和可视化信息）有助于知识的表示。

最后在附录上有完整的KRL的模型总结。

KA – Knowledge Acquisition

通过非结构化文本以及其他结构化或半结构化的资源来构建知识图。在这篇综述里主要讲KA里三个任务： KGC（Knowledge Graph Completion）、entity discovery、relation extraction

KGC
KGC是在知识图谱上增加新的三元组，典型的子任务： link prediction, entity prediction, and relation prediction。
本文在这里讲到：初步研究主要是Embedding-based Models，但这种模型不好捕获多跳的关系，因此最近的工作转向relation path inference、 rule-based reasoning。
在Embedding-based Models上，上述的KRL方法（TransE、TransH、TransR、HoIE、R-GCN和一些利用文本信息联合学习DKRL可以用在KGC任务上）。当然后面还有很多改进的变体模型如SENN可以明确区分三个KGC子任务。
在Relation Path Reasoning上，利用了图结构上的路径信息。例如，路径排序算法 (PRA) 在以下组合下选择关系路径约束并进行最大似然分类。
在Rule-based Reasoning上，为了更好地利用知识的符号性质，KGC的另一个研究方向是逻辑规则学习。逻辑规则可以通过像AMIE这样的规则挖掘工具提取。更多的研究关注于将逻辑规则注入嵌入以改进推理，联合学习或迭代训练应用于合并一阶逻辑规则。逻辑规则作为辅助信息，结合先验知识，实现可解释的多挑推理。但这里有个问题是逻辑规则本身只能覆盖知识图中有限数量的相关事实，并有巨大的搜索空间效率问题。神经和符号计算的结合具有互补优势，利用有效的数据驱动学习和可微优化，并利用先验逻辑知识进行精确和可解释的推理。合并基于规则的知识表示学习原则上是为表示添加正则化或约束，如Neural Theorem Provers (NTP) 和NeuralLP等模型代表。

本文还提到了Meta Relational Learning。知识图谱存在长尾现象，同时现实世界中的知识场景是动态的，通常会获得看不见的三元组。因此新的场景：meta relational learning or few-shot relational learning，仅利用少样本来预测新的关系。模型代表有：GMatching、Meta-KGR、MetaR等。

entity discovery
知识发现又会分为几个子任务：entity recognition, entity disambiguation, entity typing, and entity alignment。
Entity Recognition: 又叫实体识别或者命名实体识别（NER），是一项在文本中标记实体的任务
Entity Disambiguation： 实体分类，实体类型包括粗粒度类型和细粒度类型，而细粒度类型使用树结构类型类别，通常被视为多类和多标签分类。这里会有标签噪声问题和日益增长的标签类型，典型的模型如PLE、JOIE、ConnectE会不断优化。
Entity Disambiguation： 实体消歧或实体链接是一项统一任务，将实体引用链接到知识图中相应的实体。如DSRM、EDKate等模型。
Entity Alignment： 如前所述，这些任务涉及从文本或单个知识图中发现实体，而实体对齐（EA）旨在融合各种知识图中的知识。基于Embedding的实体对齐是计算一对实体的Embedding之间的相似度，模型有：MTransE、IPTransE、BootEA等。处理实体发现的模型例子如图：
relation extraction

; Temporal Knowledge Graph

前面研究的是静态图，但然而时间信息是非常重要的，所以同时学习时间嵌入和关系嵌入的研究开始展开并且有进展。

Temporal Information Embedding
会有以下这些方法：
将三元组扩充至四元组。如将( h , r , t ) (h, r, t)(h ,r ,t ) 扩充至( h , r , t , τ ) (h, r, t, \tau)(h ,r ,t ,τ) 。如TTransE：f τ ( h , r , t ) = − ∥ h + r + τ − t ∥ L 1 / 2 f_{\tau}(h, r, t)=-\|\mathbf{h}+\mathbf{r}+\tau-\mathbf{t}\|{L{1 / 2}}f τ(h ,r ,t )=−∥h +r +τ−t ∥L 1/2 。
或者是增加时间戳[ τ s , τ e ] \left[\tau_{s}, \tau_{e}\right][τs ,τe ] 。HyTE将时间戳视为超平面W τ W_{\tau}W τ , 实体和关系表示为：P τ ( h ) = h − ( w τ ⊤ h ) w τ P_{\tau}(\mathbf{h})=\mathbf{h}-\left(\mathbf{w}{\tau}^{\top} \mathbf{h}\right) \mathbf{w}{\tau}P τ(h )=h −(w τ⊤h )w τ ，P τ ( r ) = h − ( w τ ⊤ r ) w τ P_{\tau}(\mathbf{r})=\mathbf{h}-\left(\mathbf{w}{\tau}^{\top} \mathbf{r}\right) \mathbf{w}{\tau}P τ(r )=h −(w τ⊤r )w τ，P τ ( t ) = h − ( w τ ⊤ t ) w τ P_{\tau}(\mathbf{t})=\mathbf{h}-\left(\mathbf{w}{\tau}^{\top} \mathbf{t}\right) \mathbf{w}{\tau}P τ(t )=h −(w τ⊤t )w τ ，评分函数：f τ ( h , r , t ) = ∥ P τ ( h ) + P τ ( r ) − P τ ( t ) ∥ L 1 / L 2 f_{\tau}(h, r, t)=\left\|P_{\tau}(\mathbf{h})+P_{\tau}(\mathbf{r})-P_{\tau}(\mathbf{t})\right\|{L{1} / L_{2}}f τ(h ,r ,t )=∥P τ(h )+P τ(r )−P τ(t )∥L 1 /L 2 。
Entity Dynamics
在真实世界中，实体的状态会发生变化，从而影响实体相关的关系。时间的变化视为状态的变化检测，利用上下文学习状态的变化，如利用RNNs模型捕获时间实体交互。
Temporal Relational Dependency
关系也是会存在时间的顺序性的，如wasBornIn→graduateFrom→workAt→diedIn。可以通过关系对来进行研究
Temporal Logical Reasoning
逻辑规则也用于时间推理。

Knowledge-Aware Applications

Language Representation Learning
传统的语言建模没有利用文本语料库中频繁观察到的实体的事实知识。如何将知识整合到语言表达中越来越受到关注。
Question Answering
KGQA是一个很常见的应用，基于神经网络的方法表示分布式语义空间中的问题和答案，有些还进行符号知识注入以进行常识推理。
Single-fact QA
将知识图谱作为外部知识源，简单的事实 QA 或单事实 QA 是为了回答涉及单个知识图谱事实的简单问题。如利用LSTM、GRU。
Multi-hop Reasoning
要处理复杂的多跳关系，需要一个更专门的设计，能够进行多跳常识推理。VRN利用推理图嵌入；KagNet从ConceptNet构建模式，通过GCN、LSTM学习路径的关系表示。CogQA结合隐式提取和显式提取，提出了一种基于BERT和GNN的多跳QA认知图模型。
Recommender Systems
将知识图谱集成为外部信息，使推荐系统具备常识推理能力，具有解决稀疏问题和冷启动问题的潜力。 DKN通过知识感知 CNN 模型将知识图谱与多通道词实体对齐的文本输入相结合。 MKR 通过共享潜在特征和建模高阶项目实体交互，将多任务知识图表示和推荐联系起来。 KPRN 将用户和项目之间的交互视为知识图中的实体关系路径，并使用 LSTM 对路径进行偏好推断以捕获顺序依赖关系。 PGPR 在基于知识图的用户-项目交互上执行强化策略引导的路径推理。 KGAT在实体关系图和用户项目图的协作知识图上应用图注意力网络，通过嵌入传播和基于注意力的聚合对高阶连接进行编码。

Future Directions

Complex Reasoning
基于Embedding的方法在复杂逻辑推理有局限性，在关系路径、符号逻辑的方向还值得探索。

Unified Framework
对知识表示和推理的统一理解较少探索。

Interpretability
可解释性可以说服人们相信预测。因此，应进一步研究可解释性，提高预测知识的可靠性。

Scalability
扩展性。如何扩展到大规模知识图上。

Knowledge Aggregation
知识聚合

Automatic Construction and Dynamics
目前的知识图谱高度依赖人工构建，劳动强度大，成本高。知识图谱在不同认知智能领域的广泛应用需要从大规模非结构化内容中自动构建知识图谱。最近的研究主要是在现有知识图谱的监督下进行半自动构建。面对多模态、异构性和大规模应用，自动构建仍然面临巨大挑战。主流研究集中在静态知识图谱上，在预测时间范围有效性和学习时间信息和实体动态方面有几项工作。许多事实只在特定时期内成立。动态知识图谱与捕捉动态的学习算法一起，可以通过考虑时间性质来解决传统知识表示和推理的局限性。

Original: https://blog.csdn.net/sorryla/article/details/126822666
Author: sorryla
Title: 【论文笔记】知识图谱综述2021

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/558126/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

3. 5种常见卷积论文、解读、使用方法、实现代码整理（conv）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月26日
0051
[九]深度学习Pytorch-transforms图像增强(剪裁、翻转、旋转)

往期内容 [一]深度学习Pytorch-张量定义与张量创建 [二]深度学习Pytorch-张量的操作：拼接、切分、索引和变换 [三]深度学习Pytorch-张量数学运算 [四]深度…

人工智能 2023年6月23日
0073
物联网省/国赛AIOT智能家居全流程演示

文章目录前言一、虚拟仿真部署部分 * 打开虚拟终端，配置与Home Assistant连接 – 添加 MQTT 连接重启 HA服务 Home Assistant平…

人工智能 2023年7月30日
0047
思考总结：领域知识图谱平台构建与业务应用

思考总结：领域知识图谱平台构建与业务应用不得不说，由于懒，再夹杂着其他事情，已经很久没有更新了，现在带着这段时间的应用、思考和总结来了，后面会尽可能常更新、常输出，感谢大家未取关…

人工智能 2023年6月1日
0067
(一) RecognitionComponent模块分析

1、初始化模块Init (1) 参数初始化：主传感器名称、是否在世界坐标系跟踪、车辆尺寸和相对尺寸（速度） (2) 算法初始化： 1) lidar::LidarObstacleTr…

人工智能 2023年6月22日
0037
【图神经网络】图分类学习研究综述[1]：图分类问题定义与基于图相似度的图分类

基于GNN的图分类学习研究综述[1]：图分类问题定义与基于图相似度的图分类论文阅读：基于GNN的图分类学习研究综述 1. 图分类问题定义及挑战 * 1.1 图分类问题与符号定义 …

人工智能 2023年7月2日
0069
机器学习系列(1)_数据分析之Kaggle泰坦尼克之灾

本篇博客通过分析泰坦尼克号事故中乘客的信息，从而得出一些相关关系的判断，并且使用 Python可视化的手段更加具体的展现。注：本篇博客参考资料：1、kaggle入门–泰坦尼克号…

人工智能 2023年6月11日
0075
“Why Should I Trust you ?”Explaining the Predictions of Any Classififier.-对分类预测进行解释

作者：18届 cyl 日期：2021-08-08 论文：《”Why Should I Trust You?” Explaining the Predicti…

人工智能 2023年7月2日
0085
YOLOX安装部署使用训练教程以及报错

YOLOX安装使用教程简介安装 * step1 step2 step3 验证 * 图片视频训练 * 准备数据集转化为coco数据集配置文件开始训练批量测试并保存训…

人工智能 2023年6月16日
0068
跟着Cell学单细胞转录组分析(十二):转录因子分析

转录因子分析可以了解细胞异质性背后的基因调控网络的异质性。转录因子分析也是单细胞转录组常见的分析内容，R语言分析一般采用的是SCENIC包，具体原理可参考两篇文章。1、《SCENI…

人工智能 2023年6月19日
0074
无监督学习-机器学习

无监督学习基本概念监督学习与无监督学习 * 聚类 k-均值聚类 * k-均值算法关于聚类的k值选择关于聚类的初始划分关于聚类的距离计算关于聚类的终止条件举例 k-均值…

人工智能 2023年6月2日
0082
r语言逻辑回归_R语言机器学习 | 3 逻辑回归

1 基础知识逻辑回归(logistic regression)是线性回归的推广，属于广义线性模型(generalized linear model)的一种。所谓广义线性回归，…

人工智能 2023年6月18日
0099
python 绘制3D图

python 绘制3D图 1.散点图 * 代码输入的数据格式 2.三维表面 surface * 代码输入的数据格式 scatter + surface图形展示 3. 三维瀑布图…

人工智能 2023年6月15日
00130
stata domin

相对重要性分析各个系数大小是不能被用来直接比较的。逐步回归法：回归中逐步引入解释变量以及显著性测试。重要性分析 (Dominance Analysis) ：确定线性回归中，不同解…

人工智能 2023年6月18日
0067
深入浅出地理解傅里叶变换、语谱图(spectrogram)

深入浅出地理解傅里叶变换类比：就像光的色散一样，sound相当于白光，FT相当于棱镜，散射出来的各色的光谱就是频域信息直观理解：傅里叶变换将复杂的时域声音信号转换成了频域部分 …

人工智能 2023年5月25日
0061
问题解决 AttributeError: module ‘google.protobuf.internal.containers‘ has no attribute ‘MutableMapping‘

在运行的主函数中，导入自己设定的.py文件（设置的一个类），或者导入tensorflow包时，会出现问题：AttributeError: module ‘google….

人工智能 2023年5月24日
0078

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30