GCN学习笔记

2023年6月1日下午4:33 • 人工智能 • 阅读 76

Modeling Relational Data with Graph Convolutional Networks论文学习笔记2

5.实验评估
*
5.1 实体分类实验
5.2 链路预测实验
6. 展望

内容过长，论文的前半部分内容请查看Modeling Relational Data with Graph Convolutional Networks论文学习笔记1

5.实验评估

5.1 实体分类实验

未了推测（e.g.实体类别），一个成功的模型需要能解释这个实体与其他相关实体的关系。

数据集 Resource Description Framework (RDF) format (Ristoski, de Vries, and Paulheim 2016): AIFB, MUTAG, BGS, and AM. 数据集中的关系不必一定编码为有向的subject-object关系，也可以编码为实体的某一特点存在与否。目的：节点的特性分类。各数据集统计描述如下表：

文章移除了用来产生节点标签的关系： employs and affiliation for AIFB, isMutagenic for MUTAG, hasLithogenesis for BGS, and objectCategory and material for AM。

Baselines基线作为实验的基准，以最近的艺术级的分类结果进行比较： RDF2Vec embeddings (Ristoski and Paulheim 2016), Weisfeiler-Lehman kernels (WL) (Shervashidze et al. 2011; de Vries and de Rooij 2015), and hand-designed feature extractors (Feat) Paulheim and Fumkranz 2012)。Feat集合了从每个有标签节点的入度和出度获取特征向量。RDF2Vec提取了有标签图的游走然后使用Skipgram模型产生实体嵌入（用做随后的分类）。所有的实体分类实验在CPU和64GB存储运行。

结果

本实验进一步拨出了20％的训练集作为超参数调整的验证集。对于R-GCN，表格展示的是16个hidden units（10 for AM）的2层模型，基函数分解（公式2），以及使用学习率0.01的Adam训练50个epochs。归一化常数c i , r {i,r}i ,r =∣ N i r ∣ \lvert {N_i^r} \rvert ∣N i r ∣。
在AIFB与AM数据集上我们的方法表现良好，但另外两个数据集较差，原因可能是使用了固定的归一化常数，后期可采用注意力机制（数据依赖的注意力权重a i j , r a{ij,r}a i j ,r ，∑ j , r a i j , r = 1 ∑{j,r}a{ij,r}=1 ∑j ,r a i j ,r =1）进行改进。

; 5.2 链路预测实验

R-GCN是关系型数据的有效编码器，结合评分函数（即图3b中的解码器）为知识库中的三元组进行链路预测。

数据集 链路预测算法在FB15k（关系型数据库Freebase的亚集）、WN18（包含单词间词汇关系的WordNet的亚集）数据集上进行评估。原数据集存在相反三元组对t = ( e 1 , r , e 2 ) t=(e_1,r,e_2)t =(e 1 ,r ,e 2 )和t ′ = ( e 2 , r − 1 , e 1 ) t’=(e_2,r^{-1},e_1)t ′=(e 2 ,r −1 ,e 1 )，t t t在训练集，t ′ t’t ′在测试集。这会减少一大部分受影响三元组对记忆的预测任务。所以本文选择移除了这些三元组对的FB15k-237数据集。

Baselines基线 这两个实验的共同基准是 直接优化DistMult，这个因数分解策略在标准数据集上表现良好，此外，对应于我们模型的版本，该版本具有固定实体嵌入，代替了第4节中所述的R-GCN编码器。作为第二个基准，我们增加了简单的基于邻域的 LinkFeat算法（ proposed in Toutanova and Chen (2015)）。

我们进一步比较了FB15k和WN18的两个最新链路预测模型ComplEx（Trouillon等人2016）和HolE（Nickel，Rosasco和Poggio 2015）。ComplEx通过将DistMult泛化为复杂域来进行非对称关系的建模，而HolE用循环相关替换向量矩阵乘积。最后，包括与两种经典算法-CP（Hitchcock 1927）和TransE（Bordes等人2013）的比较。

结果
两个常用的评估度量：

MRR: mean reciprocal rank
Hits@n

两种评估度量都可以在原始设置和过滤设置中计算。本文同时报告了原始和过滤MRR(过滤MRR被认为更可靠),及过滤Hits at 1，3，10。

我们评估各个验证拆分上的超参数选择并发现定义为c i , r {i,r}i ,r =c i _i i =∑ r ∑{r}∑r ∣ N i r ∣ \lvert {N_i^r} \rvert ∣N i r ∣的归一化常数效果最好。
对于FB15k和WN18：运用基函数分解（公式2）with两个基函数，和一个200维嵌入的编码层。
对于FB15k-237：块分解（公式3）表现最好，使用2层5×5的块维度和500维的嵌入。归一化之前通过边丢失进行规则化，self-loop的丢失率为0.2，其他边的丢失率为0.4。Apply l l l 2 regularization to the decoder with a penalty of 0.01。

使用学习率为0.01的Ddam优化程序（Kingma and Ba 2014）。对于基线和其他因式分解，我们从Trouillon等人的论文中找到了最佳的参数（2016）——除了FB15k-237的维度，为使系统具有可比性，我们保持相同数量的负样本（w w w=1）。不论是基线还是我们的模型，我们都使用了full-batch优化。

我们期望，R-GCN+在局部和远距离信息都能提供强烈solutions的数据库（FB15k和WN18）中将比单独的两个模型表现得好，但是在局部关系并不突出的数据集（FB15-237）中不会出现这种优势。为了验证以上期望，在FB15k数据集上评估了结合后的模型（R-GCN+）：f ( s , r , t ) R − G C N + = α f ( s , r , t ) R − G C N + ( 1 − α ) f ( s , r , t ) D i s t M u l t f(s,r,t){R-GCN+}=αf(s,r,t){R-GCN}+(1-α)f(s,r,t)_{DistMult}f (s ,r ,t )R −G C N +=αf (s ,r ,t )R −G C N +(1 −α)f (s ,r ,t )D i s t M u l t ，α αα=0.4。
GCN学习笔记

表5是数据集FB15k-237的结果，R-GCN优于DistMult基线——强调了单独编码模型的重要性。正如之前期望，R-GCN与R-GCN+在此数据集上表现相当。尽管依赖于DistMult解码器，但在不使用编码器的情况下，其性能相对较弱，因此R-GCN模型与其他因数分解方法相比更具有优势。
GCN学习笔记

展望
图片自编码模型可以结合其他因式分解模型，e.g.ComplEx (Trouillon et al. 2016)，更好地适应于非对称关系建模；
为解决本文方法的可扩展性，有必要探索亚采样技术，e.g.Hamilton, Ying, and Leskovec (2017)；
用依赖数据的注意力机制来替换当前在相邻节点和关系类型上求和的形式。
除了建模知识库之外，R-GCN还可推广到其他关系分解模型已被证明是有效的应用中（例如关系提取）。

Original: https://blog.csdn.net/ClaireYYY/article/details/111470794
Author: ClaireYYY
Title: GCN学习笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/557711/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

kalibr源码专题-投影模型

kalibr源码专题-投影模型之小孔成像前言一、小孔成像模型前言代码在aslam_cameras中的cameras里，主要是PinholeProjection.hpp、Om…

人工智能 2023年6月11日
0070
（七）DKN:用于新闻推荐的深度知识感知网络

摘要：背景：新闻语言是高度浓缩的，充满了知识实体和常识。然而，现有的方法并没有意识到一些外在的知识，也不能充分发现新闻之间潜在的知识层面的联系。因此，推荐给用户的结果仅限于…

人工智能 2023年6月1日
0072
【机器学习-吴恩达】Week3 分类问题——逻辑回归&正则化

文章目录 Terminology Logistic Regression * Classification and Representation – Classific…

人工智能 2023年7月1日
0060
mmsegmentation教程1:自定义数据集、config文件修改、训练教程

简介 mmsegmentation作为OpenLab重要的开源分割训练框架，统一了之前大家各写个的训练网络，导致很多工作无法复现。并且每次大家下载开源项目一打开项目，要面对各种千奇…

人工智能 2023年7月5日
0068
Ubuntu20.04LTS下安装Intel Realsense D435i驱动与ROS包

文章目录 * – 目标 – 一、D435i简介 – 二、环境配置 – 三、RealSense的SDK2.0安装 – 四、…

人工智能 2023年6月15日
0090
【深度学习进阶-自然语言处理】第一章：神经网络的复习

本章复习了神经网络的基础知识，”从零开始搭建”一个神经网络模型对一个简单数据集进行神经网络的学习。 1.数据集先看一下数据集：该数据一共300行，x是输入…

人工智能 2023年7月13日
0056
MATLAB 图像滤波器

*实验目的 – 继续熟悉仿真工具MATLAB – 巩固图像读取与显示的方法 – 掌握给图像添加噪声的方法 – 掌握图像空间域的滤波方法 – 掌握图像频率域的滤波方法 *实验原理空…

人工智能 2023年6月22日
0054
池化层是什么？它的作用是什么

什么是池化层？池化层（Pooling Layer）是卷积神经网络（Convolutional Neural Network，CNN）中的一种重要层，用于对输入数据进行降采样操作。…

人工智能 2024年1月1日
0053
知识图谱表示与建模

前言 知识图谱的表示&am…

人工智能 2023年6月1日
0074
ROS 机器人操作系统：概述

ROS 是 Robot Operating System 的缩写，通常称为”机器人操作系统”。但它并不是一个真正的操作系统，而是一个面向机器人的开源的元操作…

人工智能 2023年6月1日
00151
数据结构与算法——Java实现栈、逆波兰计算器（整数加减乘除）

目录一、栈 1.1 基本介绍 1.2 栈的思路分析 1.3 栈的代码实现二、栈实现综合计算器 2.1 思路分析 2.2 代码实现（中缀表达式实现）三、栈的前缀（波兰）、中缀、…

人工智能 2023年7月30日
0050
头歌平台（EduCoder）—— 数据挖掘算法原理与实践：k-近邻

第1关：knn算法概述任务描述本关任务：使用 python实现方法，找出目标样本最近的 k个样本。编程要求根据提示，在右侧编辑器 Begin-End处补充代码，实现 top…

人工智能 2023年6月19日
00105
解决Pycharm 多线程时出现错误Process finished with exit code -1073741819 (0xC0000005)

港真，这个问题整的我快抑郁了，排雷花了三四天时间，网上说啥的都有。先说结论吧，最终的解决方案是把代码里用到的pandas库降低了版本，用的1.1.5版本，才没再次报该错误。教训就是…

人工智能 2023年7月8日
0066
学习盲图像超分辨率的退化分布

学习盲图像超分辨率的退化分布文章目录 * – 学习盲图像超分辨率的退化分布 – + 摘要 + 前言 + 2、相关工作 + * – 基于预定义的…

人工智能 2023年5月28日
00106
Win10下安装Detectron2，超详细教程！

Win10下安装Detectron2超详细教程目录 * 1. 环境版本 2. 安装CUDA 3.安装Pytorch 4. 安装其他库：cocoapi、fvcore等 5. 安装D…

人工智能 2023年6月17日
0092
学习pytorch—-torch、torchvision库的安装

pytorch学习第一课：装torch、torchvision库常规操作：pip install torch、pip install torchvision torchvisio…

人工智能 2023年7月22日
00192

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

GCN学习笔记

Modeling Relational Data with Graph Convolutional Networks论文学习笔记2

5.1 实体分类实验

; 5.2 链路预测实验

大家都在看