Graph Attention Networks(图自注意力网络)

2023年6月17日上午12:03 • 人工智能 • 阅读 132

1 Introduction

2 GAT Architecture

2.1 Graph Attentional Layer

2.2 Comparisons To Related Work

3 Conclusions

1 Introduction

Graph Attention Networks又称为GATs，一种基于注意力的体系结构来执行图结构数据节点分类的网络。其思想是 计算图中每个节点的隐藏表示，通过关注它的邻居，遵循一个自我注意策略。注意架构有几个有趣的特性：

(1)操作是有效的，因为它可以在节点对之间并行；

(2)可以通过指定邻居的任意权值应用于具有不同程度的图节点;

(3)模型直接适用于归纳学习问题，包括模型必须推广到完全看不见的图的任务。

在四个具有挑战性的基准上验证了提出的方法：Cora、Citeseer和Pubmed引文网络以及诱导蛋白质相互作用数据集，实现或匹配了最先进的结果，突出了在处理任意结构图时基于注意的模型的潜力。

2 GAT Architecture

2.1 Graph Attentional Layer

构建一个单一的图注意力层，其输入是一组节点特征h={

}，

，其中N是节点数,F是每个结点的特征数。该层产生一组新的节点特征(潜在的不同基数

{

}，

，作为输出。

为了获得足够的表达能力，将输入的特征转换为更高级的特征，至少需要一个可学习的线性变换。为此，作为一个初始步骤，对每个节点应用一个由权重矩阵

参数化的共享线性变换。然后，在节点上执行自注意力——一个共享的注意力机制

计算注意力系数

，表明了节点 j 的特征对节点 i 的重要性。

通过实行掩码注意力将图结构注入到该机制中，只计算节点

的

，其中

是图中节点 i 的某个邻域（原论文中都是指节点 i (包括 i )的一阶邻居）。即节点 j 都是节点 i 的邻居。为了使注意力系数易于在不同节点之间进行比较，使用softmax函数对 j 的所有选择进行归一化：

。

注意机制 a 是一个单层前馈神经网络，由权向量

参数化，并应用LeakyReLU非线性函数，展开即

，其中

表示拼接(concat)操作。

利用归一化注意系数计算其对应的特征的线性组合，作为每个节点的最终输出特征，再作用一个非线性函数

得到目标节点隐藏状态更新

。

为了稳定自我注意力机制的学习过程，将注意机制扩展到使用多头注意。具体来说，K个独立的注意机制执行方程

的变换，然后将它们的特征拼接(concat)起来，得到以下输出特征表示：

，其中

表示拼接操作，

为由第k个注意机制(

)计算的归一化注意力系数，

为相应的输入线性变换的权重矩阵。请注意，在此设置中，最终返回的输出

将由每个节点的

特性(而不是

)组成。

然而，执行多头注意网络的最终（预测）层，采用拼接(concat)方法不再是明智的选择，可以采用平均(avg)操作，并且延迟应用最终非线性函数，即

。

1、 计算高效的：自注意层的操作可以在所有边缘上并行化，且输出特征的计算也可以在所有节点上并行化，不需要特征分解或类似昂贵的矩阵操作。单一的GAT注意力头计算输出特征的复杂度为

，这种复杂性与图卷积网络(GCNs)等基线方法相当。

2、 模型可将不同的重要性分配给同一邻域的节点，实现模型容量的飞跃。此外，分析学习到的注意权重可能会带来可解释性方面的好处。

3、注意机制以共享的方式应用于图中的所有边， 不依赖于对全局图结构或所有节点(特征）的预先访问（这是许多先前技术的限制）。

图不需要是无向的(如果边j→i不存在，可以简单地不计算

)

适用于归纳学习——包括在训练过程中完全看不见的图上进行评估的任务

3 Conclusions

图注意力网络(GATs)，一种新型卷积风格的神经网络，它操作在图形结构的数据上，利用了掩码的自我注意层。图注意层的利用在这些网络计算效率高（不需要昂贵的矩阵操作，可并行在图中的所有节点）；在处理不同大小的区域允许分配不同节点不同的重要性；不依赖于了解整个图结构从而解决许多理论问题与以前的基于光谱的方法。利用注意力的模型已经成功地在四个成熟的节点分类基准上实现或匹配了最先进的性能，包括转换和归纳（特别是用于测试完全不可见的图）。

图注意力网络有几个潜在的改进和扩展，可以作为未来的工作来解决，如一个特别有趣的研究方向是利用注意机制对模型的可解释性进行彻底的分析。此外，从应用程序的角度来看，将该方法扩展到执行图分类而不是节点分类也将是相关的。最后，将模型扩展到合并边缘特征（能够表明节点之间的关系）将能够解决更多种类的问题。

Original: https://blog.csdn.net/weixin_53148422/article/details/125818851
Author: 猪猪的菜牙
Title: Graph Attention Networks(图自注意力网络)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627475/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习实战二：波士顿房价预测 Boston Housing

波士顿房价预测 Boston housing 这是一个波士顿房价预测的一个实战，上一次的Titantic是生存预测，其实本质上是一个分类问题，就是根据数据分为1或为0，这次的波士顿…

人工智能 2023年6月23日
00283
pandas将df赋值到另一个df_Pandas常用功能总结

1.读取.csv文件 df2 = pd.read_csv(‘beijingsale.csv’, encoding=’gb2312′,…

人工智能 2023年7月6日
0052
基于51单片机的智能鞋柜消毒柜

资料编号：141 下面是相关功能视频演示： 141-基于51单片机智能鞋柜消毒柜（源程序+原理图+PCB+全套毕设资料）本设计以51单片机为控制核心，设计并制作智能鞋柜，可实现杀…

人工智能 2023年6月29日
0069
Python pandas使用map, apply和applymap实现对DataFrame进行单列/行，多列/行，以及所有元素的操作

最近在查看网上关于pandas DataFrame使用map, apply和applymap的说明时，发现许多博文未能写清楚关键点。这里整理一下每个函数的使用范围和适用情况。首先…

人工智能 2023年7月6日
0059
ROS从入门到精通9-1：项目实战之智能跟随机器人原理与实现

目录 0 专栏介绍 1 智能跟随机器人的应用 2 构造机器人对象 3 机器人初始化 4 实现跟随 5 效果展示 ; 0 专栏介绍本专栏旨在通过对ROS的系统学习，掌握ROS底层基…

人工智能 2023年6月13日
0080
pandas基础语法

一.数据结构series创建二、数据表信息查看三、数据表清洗四、数据预处理五、数据提取六、数据筛选七、数据汇总八、数据统计九、数据输出 pd.Series(data…

人工智能 2023年7月6日
0058
TensorFlow GPU最完整的安装方法

自己这几天更换电脑，再加上前次旧电脑学习，安装了好几次TensorFlow，每次都遇到了一些问题，经常缺一些文件，在网上下载文件还很慢，走了不少弯路，特将完整的安装方法记录如下，以…

人工智能 2023年6月24日
0082
如何在Tensor对象上执行逻辑运算（如and、or等）

介绍本问题是关于如何在Tensor对象上执行逻辑运算（如and、or等）的解决方法。我们将使用Python编程语言和TensorFlow库来展示具体的操作步骤和代码示例。算法原…

人工智能 2024年1月1日
0043
Opencv+Python学习记录10：位平面分解+图像加密和解密（内附详细代码）

一，前置知识在本部分，我们将学习用按位与运算（cv2.bitwise_and）观察灰度图像的各个位平面，以及通过图像按位异或（cv2.bitwise_xor）实现加密和解密过…

人工智能 2023年6月20日
00133
Pytorch中nn.Transformer的使用详解与Transformer的黑盒讲解

文章目录本文内容将Transformer看成黑盒 Transformer的推理过程 Transformer的训练过程 Pytorch中的nn.Transformer * nn….

人工智能 2023年7月24日
00278
ICLR2022 GNN 图神经网络论文阅读 (二) 泛读 (7-8)

欢迎关注WX公众号，每周发布论文解析：PaperShare, 点我关注论文列表目前找了录用的一些有关于Graph或者GNN的文章，先过一遍各个文章的摘要，然后再花时间对觉得比…

人工智能 2023年7月14日
0079
语音识别 ——总结知识点（1）

语音识别，通常称为自动语音识别，英文是Automatic Speech Recognition，缩写为ASR，主要是将人类语音中的词汇内容转换为计算机可读的输入，一般都是可以理解的…

人工智能 2023年5月27日
00129
深度学习之目标检测小目标增强（SAHI）

小目标增强方法1：对具有小目标的图像进行过采样，并通过复制多个小目标对其进行扩充。然而，这种增强需要分割注释，因此，它与目标检测数据集不兼容。有方法可以从原始图像中截取放大区域，…

人工智能 2023年7月28日
0078
300+篇文献！一文详解基于Transformer的多模态学习最新进展

©PaperWeekly 原创 · 作者 | Jason 研究方向 |计算机视觉论文标题： Multimodal Learning with Transformers: A Su…

人工智能 2023年7月28日
0067
R语言分类变量独立性检验（Tests of independence）、使用Fisher精确检验fisher.test函数检验分类变量的独立性（ test of independence）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月2日
0092
图像处理40-goodFeaturesToTrack角点检测

一提到角点检测，最常用的方法莫过于Harris角点检测，opencv中也提供了Harris角点检测的接口，即cv::cornerHarris()，但是Harris角点检测存在很多缺…

人工智能 2023年6月20日
00103

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Graph Attention Networks(图自注意力网络)

2.1 Graph Attentional Layer

大家都在看