TransRHS: A Representation Learning Method for Knowledge Graphs with Relation Hierarchical Structure

2023年6月1日上午9:44 • 人工智能 • 阅读 106

研究问题

在学习知识图谱上的嵌入时对关系的层次结构（RHS）进行建模，训练一个向量和一个球（sphere），用向量差和球的相对位置关系表示关系的层级结构。

背景动机

之前基于聚类的方法由于固定了层数，不能充分反映知识图谱上关系的复杂性
之前考虑关系层次的方法会改变关系嵌入，对于trans模型也会改变实体的嵌入，这会改变原始模型并降低效果。

问题定义

TransRHS: A Representation Learning Method for Knowledge Graphs with Relation Hierarchical Structure

由于关系 athLedTeam_是 _athPlaysForTeam_的子关系，因此在观察到最下面的三元组之后，就可以推断存在上面的三元组，记作 (athLedTeam, subRelationOf, athPlaysForTeam)_

多个相关联的子关系构成的树状层次结构如下，其中根节点为r r r，r j ( i ) r_{j}^{(i)}r j (i )为第i i i层的第j j j个子关系，n i n_i n i 是第i i i层的子关系的个数。如果使用r ( k ) r^{(k)}r (k )表示第k k k层的子关系，从根节点到该节点的路径表示为P r k = { r , r ( 1 ) , r ( 2 ) , … , r ( k ) } P_{r}^{k}=\left{r, r^{(1)}, r^{(2)}, \ldots, r^{(k)}\right}P r k ={r ,r (1 ),r (2 ),…,r (k )}。

将 subRelationOf_简写为 _sro，则知识图谱的关系集合可以定义为R = { s r o } ∪ R l R={s r o} \cup R_{l}R ={s r o }∪R l ，三元组集合T T T可分为T r = { ( r , s r o , p ) ∣ r , p ∈ R l } T_{r}={(r, s r o, p) \mid r, p \in R_{l}}T r ={(r ,s r o ,p )∣r ,p ∈R l }及T e = { ( h , r , t ) ∣ h , t ∈ E ∧ r ∈ R } T_{e}={(h, r, t) \mid h, t \in E \wedge r \in R}T e ={(h ,r ,t )∣h ,t ∈E ∧r ∈R }。假设正三元组的集合为Δ \Delta Δ，则有( h , r , t ) ∈ T e ∧ ( r (h, r, t) \in T_{e} \wedge(r (h ,r ,t )∈T e ∧(r, sro, p ) ∈ T r → ( h , p , t ) ∈ Δ p) \in T_{r} \rightarrow(h, p, t) \in \Delta p )∈T r →(h ,p ,t )∈Δ及( r , s r o , p ) ∈ T r ∧ ( p , s r o , p p ) ∈ T r → ( r , s r o , p p ) ∈ Δ (r, s r o, p) \in T_{r} \wedge(p, s r o, p p) \in T_{r} \rightarrow(r, s r o, p p) \in \Delta (r ,s r o ,p )∈T r ∧(p ,s r o ,p p )∈T r →(r ,s r o ,p p )∈Δ

; 模型方法

给定三元组( h , r , t ) ∈ T e (h, r, t) \in T_{e}(h ,r ,t )∈T e 以及( r , s r o , p ) ∈ T r (r, s r o, p) \in T_{r}(r ,s r o ,p )∈T r ，TransRHS为实体和关系学习嵌入h , t , r , p ∈ R d \mathbf{h}, \mathbf{t}, \mathbf{r}, \mathbf{p} \in \mathbb{R}^{d}h ,t ,r ,p ∈R d，并为p p p学习一个以m 1 m_{1}m 1 为半径的球s 1 s_{1}s 1 ，为r r r学习一个以m 2 m_{2}m 2 为半径的球s 2 s_{2}s 2 。定义距离d 1 = ∥ h + p − t ∥ 2 d_{1}=\|\mathbf{h}+\mathbf{p}-\mathbf{t}\|{2}d 1 =∥h +p −t ∥2 及d 2 = ∥ h + r − t ∥ 2 d{2}=\|\mathbf{h}+\mathbf{r}-\mathbf{t}\|{2}d 2 =∥h +r −t ∥2 。
理想情况下，满足如下条件：

不满足假设的可能情况有如下几种：

针对几种情况来定义损失函数以校正

将上述两层的RHS进行推广，假设存在两个子关系三元组( r , s r o , p ) (r, s r o, p)(r ,s r o ,p ) 和 ( p , s r o , p p ) (p, s r o, p p)(p ,s r o ,p p )，s 1 , s 2 s{1}, s_{2}s 1 ,s 2 和 s 3 s_{3}s 3 分别是p p , p p p, p p p ,p和r r r对应的球，理想情况下，满足以下条件，所谓的层次结构指的就是越靠近根节点，球的半径越小，范围越精确，关系的误差距离要处于本层球和上层球之间，这里的球半径实质上是一种误差容忍范围。

存在的一个问题是，当关系的层次过深时，球的半径会过大，可能不满足TransE模型的基本假设即h + r ≈ t \mathbf{h}+\mathbf{r} \approx \mathbf{t}h +r ≈t。为解决这一问题，论文提出了球半径差异成比例下降的策略：m ( i ) − m ( i − 1 ) : m ( i + 1 ) − m ( i ) = η : ( 1 − η ) m_{(i)}-m_{(i-1)}: m_{(i+1)}-m_{(i)}=\eta:(1-\eta)m (i )−m (i −1 ):m (i +1 )−m (i )=η:(1 −η)，其中η ∈ ( 0.5 , 1 ) \eta \in(0.5,1)η∈(0 .5 ,1 )，其实就是让不同层半径之间的差异呈等比数列减小。

最终损失函数定义为L = L O R I + L R H S L=L_{O R I}+L_{R H S}L =L O R I +L R H S ，其中
L O R I = ∑ ( h , r , t ) ∈ Δ ∑ ( h ′ , r , t ′ ) ∈ Δ ′ [ γ + f r ( h , t ) − f r ( h ′ , t ′ ) ] + L_{O R I}=\sum_{(h, r, t) \in \Delta} \sum_{\left(h^{\prime}, r, t^{\prime}\right) \in \Delta^{\prime}}\left[\gamma+f_{r}(h, t)-f_{r}\left(h^{\prime}, t^{\prime}\right)\right]{+}L O R I =(h ,r ,t )∈Δ∑(h ′,r ,t ′)∈Δ′∑[γ+f r (h ,t )−f r (h ′,t ′)]+
L R H S = ∑ ( r , s r o , p ) ∈ T r ∑ ( h , r , t ) ∈ T e f R H S ( h , r , t , p ) L{R H S}=\sum_{(r, s r o, p) \in T_{r}} \sum_{(h, r, t) \in T_{e}} f_{R H S}(h, r, t, p)L R H S =(r ,s r o ,p )∈T r ∑(h ,r ,t )∈T e ∑f R H S (h ,r ,t ,p )

实验

在两个很简单的数据集上做了实验，直接给出了关系层次结构

由于训练过程中需要生成负样本，论文采取了两种生成负样本的方式。第一种是 bern，即随机破坏三元组，给定三元组( h , r , t ) (h, r, t)(h ,r ,t )，从实体集中随机采样得到( h ′ , r , t ′ ) \left(h^{\prime}, r, t^{\prime}\right)(h ′,r ,t ′) 或 ( h , r , t ′ ) \left(h, r, t^{\prime}\right)(h ,r ,t ′)；第二种是 unif，根据关系的映射性质如1-to-N, N-to-1, N-to-N分配头实体和尾实体的采样概率。

; 评价

想法比较新颖，但数据集实在是太小了，不知道如果关系多一点的时候怎么预先获得关系层次结构，以及如果层数很深时效果还会不会这么好。

Original: https://blog.csdn.net/jining11/article/details/122251710
Author: 羊城迷鹿
Title: TransRHS: A Representation Learning Method for Knowledge Graphs with Relation Hierarchical Structure

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/556111/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas 选择数据与条件筛选iloc/loc/filt

列选择选择一列 df[‘lable_title’] 选择多列 df[[‘lable1′,’lable2’]] *[ 重要事项 ]:注意选择多个列时，多个label要用 [] 框起…

人工智能 2023年7月6日
0066
数据分析：穿越致富的正确姿势

编辑：彭文华来源：大数据架构师彭友们好，我是老彭啊。今天太热了，都没心思干啥了。午饭后躺在床上突然刷到一个帖子，差点没把我噎死。这是一个穿越小说，主人翁不知道咋地，手持巨…

人工智能 2023年7月15日
0071
粒子群算法求解0-1背包问题

目录一、粒子群算法的概念二、粒子群算法分析三、粒子群算法种类 1.基本粒子群算法 2.标准粒子群算法 3.压缩粒子群算法 4.离散粒子群算法四、粒子群算法流程五、例题一…

人工智能 2023年6月23日
0080
图片分类的入门：二分类

作为深度学习的入门，先来讲一下简单的猫狗分类。深度学习：训练数据集，让计算机精准识别这个是猫还是狗。猫狗识别： 1、数据预处理：准备训练集和测试集 2、卷积神经网络模型：构建网…

人工智能 2023年7月2日
0081
目标检测数据集之离线数据增强

目录 1.数据增强概述 2.目标检测离线数据增强步骤（一定要先看，便于理解过程） 3.数据增强代码 4.代码运行 5.完整代码 6.结果展示 1.数据增强概述海量数据是目标检测的…

人工智能 2023年6月24日
0075
ParserError: NULL byte detected. This byte cannot be processed in Python‘s native csv library

ParserError: NULL byte detected. This byte cannot be processed in Python’s native cs…

人工智能 2023年5月30日
0057
使用BERT+BiGRU对京东手机评论进行情感分析

1. 设置参数，使模型结果具有可重现性（非必须）确定性操作通常比非确定性操作慢，因此您的模型的单次运行性能可能会降低。但是，确定性可以通过促进实验、调试和回归测试来节省开发时间。…

人工智能 2023年7月22日
0076
记录：：c++ Opencv+Libtorch调用torch模型-图像分割

前面用了keras的c++之后，将deeplabv3训练后用opencv readNetFromTensorflow导入模型报错：layer.add() 不能识别，想不明白为什么，…

人工智能 2023年7月20日
0073
有序回归（Ordinal Regression）

序数回归建模的是有序输出，离散但是有顺序的类别。当一个连续的变量在观测的时候被设限时就会产生序数输出的结果。例如：当征求个人意见，但是结果却限制为离散的类别如 “不同意…

人工智能 2023年6月17日
00139
如何在PyTorch中定义并计算损失函数

如何在PyTorch中定义并计算损失函数在深度学习中，损失函数用于衡量模型的输出与真实标签之间的差异。PyTorch是一个广泛使用的深度学习框架，它提供了许多内置的损失函数供用户…

人工智能 2024年1月3日
0056
目标检测—基于Yolov5的目标检测项目（学习笔记）

今天学习了炮哥带你学的yolov5入门教程，并成功的训练出了模型，原博客地址：目标检测—教你利用yolov5训练自己的目标检测模型本文主要讲述了在 Windows10环境下复现此…

人工智能 2023年7月5日
0089
Spring Cloud:微服务基础知识

✨ Spring Cloud:微服务基础知识一、系统架构演变 * 1. 单体应用架构 2. 垂直应用架构 3. 分布式架构 4. SOA架构 – 4.1 SOA概念 …

人工智能 2023年7月31日
0059
常识——tensorflow安装cpu版本

文章目录 * – 检测当前python版本 – 去tensorflow官网查看支持此python版本的tensorflow版本并下载 – 安装 …

人工智能 2023年5月25日
0087
协方差矩阵（Covariance Matrix）

群体均值和协方差矩阵定义（Population Mean and Covariance Matrix） 1、学术定义2、常规定义协方差矩阵中每个元素的求法用中文来描述，就是：协…

人工智能 2023年6月15日
00117
【游戏开发教程】BehaviorDesigner插件制作AI行为树（Unity | 保姆级教程 | 动态图演示 | Unity2021最新版）

文章目录 * – + 一、前言 + 二、插件下载 + * 1、AssetStore下载 * 2、GitCode下载 + 三、官方教程 + * 1、在线文档 * 2、离线…

人工智能 2023年6月23日
0079
【Python模块】- Numpy在AI中的应用

Numpy在AI中的应用 * – 1. 随机数(数组)操作 – 2. 线性代数 – 3. Numpy IO – 4. 计算激活函数 …

人工智能 2023年6月21日
00112

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31